目录结构:
contents structure [-]
在开始文章之前,先贴上一张Iterable、Iterator与Generator之间的关系图:
1. Iterator VS Iterable
迭代器(Iterator)
迭代器是实现了迭代器协议的类对象,迭代器协议规定了迭代器类必需定义__next()__方法。当对迭代器对象调用next()方法时,对象会去调用__next()__计算迭代器的返回值。
可迭代对象(Iterable)
可迭代对象可以是任何对象,不一定是能返回迭代器的数据结构。一个可迭代对象会直接或间接性的调用这两个方法__iter()__和__next()__;其中__iter()__方法只能返回迭代器对象,__next()__则供给迭代器进行调用。
通常情况下,可迭代类都会实现__iter()__和__next()__,并且__iter()__返回它自己,换句话说,该类即是迭代器又是可迭代类。
下面的代码展示了迭代器和可迭代器对象之间的差别:
a_set = {1, 2, 3}#定义set数据类型,set是可迭代类型 b_iterator = iter(a_set)#得到set的迭代器 #Output: 1 <div>本文来源gaodai.ma#com搞#代!码网_</div>print(next(b_iterator)) #Output: <class 'set'> print(type(a_set)) #Output: <class 'set_iterator'> print(type(b_iterator))
从结果可以看出a_set是一个可迭代类型(set类型),b_iterator是一个迭代器(set_iterator),它们两个是完全不一同的类型。
下面的自定义了一个迭代器:
class Series(object): def __init__(self, low, high): self.current = low self.high = high def __iter__(self): return self def __next__(self): if self.current > self.high: raise StopIteration else: self.current += 1 return self.current - 1 n_list = Series(1,10) print(list(n_list))
从上面的代码可以看出,__iter__返回了迭代器本身。__next__返回迭代器的下一个值,如果没有下一个返回值那么会抛出StopIteration异常。如果没有在合适的位置抛出StopIteration异常结束迭代,那么在某些循环语句中(例如:for loop),将会形成死循环,所以在__next__中必需要在合适位置添加退出语句(抛出StopIterator异常)。
2.Itertools 模块
Itertools是Python的内置模块,其中包含了能够创建迭代器的函数。简而言之,它提供了许多能够与迭代器交互的方法。
下面是我们使用Itertools模块中count函数的案例:
from itertools import count sequence = count(start=0, step=1) while(next(sequence) <= 10): print(next(sequence),end=" ")
输出:
Itertools中的cycle函数可以创建无限迭代器,例如:
from itertools import cycle dessert = cycle(['Icecream','Cake']) count = 0 while(count != 4): print('Q. What do we have for dessert? A: ' + next(dessert)) count+=1