Python标准库中collections对集合类型的数据结构进行了很多拓展操作,这些操作在我们使用集合的时候会带来很多的便利,多看看很有好处。
defaultdict是其中一个方法,就是给字典value元素添加默认类型,之前看到过但是没注意怎么使用,今天特地瞅了瞅。
首先是各大文章介绍的第一个例子:
<br />import collections as coll <br /> <br />def default_factory(): <br /> return 'default value' <br /> <br />d = coll.defaultdict(default_factory, foo='bar') <br />print 'd:',d <br />print 'foo=>', d['foo'] <br />print 'foo=>', d['bar'] #key为'bar'的元素不存在,会有一个默认值 <br />
输出结果是这样的:
<br />d: defaultdict(, {'foo': 'bar'}) <br />foo=> bar <br />foo=> default value <br />
结论:这里可以看到,当我们取字典中一个没有的key的时候就会自动根据 default_factory生成一个value,类似于 d.get(‘bar’,’default value’)
一个对比的例子:
如果一个字典中有个map的value是一个set,往这个set连续添加两个元素,使用原始的dict是这样的
<br />dict_set1 = {} <br />#如果不知道这个字段中key有没有,需要先判断 <br />if 'key' not in dict_set1: <br /> dict_set1['key'] = set() <br />dict_set1['key'].add('111') <br />dict_set1['key'].add('000') <br />print dict_set1 <br />
如果使用defaultdict就是这样的
<br />dict_set = coll.defaultdict(set) <br />dict_set['key'].add('000') <br />dict_set['key'].add('111') <br />print dict_set<br />
好处就是不需要做set的初始化这个判断了。
两个使用的小案例
<br />ss = '1111222233334444' <br />dict_int = coll.defaultdict(int) <br />for s in ss: <br /> dict_int[s] += 1 <br />print dict_int <br /> <br />''''' <br />官方文档的这个例子就能看到这种写法的简洁了 <br />https://docs.python.org/2/library/collections.html#collections.defaultdict <br />>>> s = [('yellow', 1), ('blue', 2), ('yellow', 3), ('blue', 4), ('red', 1)] <br />>>> d = defaultdict(list) <br />>>> for k, v in s: <br />... d[k].append(v) <br />..<i style="color:transparent">本文来源gaodai$ma#com搞$代*码*网(</i>. <br />>>> d.items() <br />[('blue', [2, 4]), ('red', [1]), ('yellow', [1, 3])] <br />''' <br />
当我们做这种带有统计性质的数据操作时候,这个对象很好用。