iter函数如前所述,在 Python 中迭代对象 x 时会调用 iter(x)。
可是,iter 函数还有一个鲜为人知的用法:传入两个参数,使用常规的函数或任何可调用的对象创建迭代器。这样使用时,第一个参数必须是可调用的对象,用于不断调用(没有参数),产出各个值;第二个值是哨符,这是个标记值,当可调用的对象返回这个值时,触发迭代器抛出 StopIteration 异常,而不产出哨符。
下述示例展示如何使用 iter 函数掷骰子,直到掷出 1 点为止:14
14需要在这个示例的最前面添加一句:from random import randint。——编者注
>>> def d6(): ... return randint(1, 6) ... >>> d6_iter = iter(d6, 1) >>> d6_iter <callable_iterator object at 0x00000000029BE6A0> >>> for roll in d6_iter: ... print(roll) ... 4 3 6 3
注意,这里的 iter 函数返回一个 callable_iterator 对象。示例中的 for 循环可能运行特别长的时间,不过肯定不会打印 1,因为 1 是哨符。与常规的迭代器一样,这个示例中的 d6_iter 对象一旦耗尽就没用了。如果想重新开始,必须再次调用 iter(...),重新构建迭代器。
内置函数 iter 的文档(https://docs.python.org/3/library/functions.html#iter)中有个实用的例子。这段代码逐行读取文件,直到遇到空行或者到达文件末尾为止:
with open('mydata.txt') as fp:
for line in iter(fp.readline, '\n'):
process_line(line)
结束本章之前,我要举个实用的例子,说明如何使用生成器高效处理大量数据。