Python標(biāo)準(zhǔn)庫(kù)中collections對(duì)集合類(lèi)型的數(shù)據(jù)結(jié)構(gòu)進(jìn)行了很多拓展操作,這些操作在我們使用集合的時(shí)候會(huì)帶來(lái)很多的便利,多看看很有好處。
defaultdict是其中一個(gè)方法,就是給字典value元素添加默認(rèn)類(lèi)型,之前看到過(guò)但是沒(méi)注意怎么使用,今天特地瞅了瞅。
首先是各大文章介紹的第一個(gè)例子:
代碼如下:
import collections as coll
def default_factory():
return 'default value'
d = coll.defaultdict(default_factory, foo='bar')
print 'd:',d
print 'foo=>', d['foo']
print 'foo=>', d['bar'] #key為'bar'的元素不存在,會(huì)有一個(gè)默認(rèn)值
輸出結(jié)果是這樣的:
代碼如下:
d: defaultdict(, {'foo': 'bar'})
foo=> bar
foo=> default value
結(jié)論:這里可以看到,當(dāng)我們?nèi)∽值渲幸粋€(gè)沒(méi)有的key的時(shí)候就會(huì)自動(dòng)根據(jù) default_factory生成一個(gè)value,類(lèi)似于 d.get('bar','default value')
一個(gè)對(duì)比的例子:
如果一個(gè)字典中有個(gè)map的value是一個(gè)set,往這個(gè)set連續(xù)添加兩個(gè)元素,使用原始的dict是這樣的
代碼如下:
dict_set1 = {}
#如果不知道這個(gè)字段中key有沒(méi)有,需要先判斷
if 'key' not in dict_set1:
dict_set1['key'] = set()
dict_set1['key'].add('111')
dict_set1['key'].add('000')
print dict_set1
如果使用defaultdict就是這樣的
代碼如下:
dict_set = coll.defaultdict(set)
dict_set['key'].add('000')
dict_set['key'].add('111')
print dict_set
好處就是不需要做set的初始化這個(gè)判斷了。
兩個(gè)使用的小案例
代碼如下:
ss = '1111222233334444'
dict_int = coll.defaultdict(int)
for s in ss:
dict_int[s] += 1
print dict_int
'''''
官方文檔的這個(gè)例子就能看到這種寫(xiě)法的簡(jiǎn)潔了
>>> s = [('yellow', 1), ('blue', 2), ('yellow', 3), ('blue', 4), ('red', 1)]
>>> d = defaultdict(list)
>>> for k, v in s:
... d[k].append(v)
...
>>> d.items()
[('blue', [2, 4]), ('red', [1]), ('yellow', [1, 3])]
'''
當(dāng)我們做這種帶有統(tǒng)計(jì)性質(zhì)的數(shù)據(jù)操作時(shí)候,這個(gè)對(duì)象很好用。
更多信息請(qǐng)查看IT技術(shù)專(zhuān)欄