如前所述,在 Python 中迭代对象 x 时会调用 iter(x)

可是,iter 函数还有一个鲜为人知的用法:传入两个参数,使用常规的函数或任何可调用的对象创建迭代器。这样使用时,第一个参数必须是可调用的对象,用于不断调用(没有参数),产出各个值;第二个值是哨符,这是个标记值,当可调用的对象返回这个值时,触发迭代器抛出 StopIteration 异常,而不产出哨符。

下述示例展示如何使用 iter 函数掷骰子,直到掷出 1 点为止:14

14需要在这个示例的最前面添加一句:from random import randint。——编者注

>>> def d6():
...     return randint(1, 6)
...
>>> d6_iter = iter(d6, 1)
>>> d6_iter
<callable_iterator object at 0x00000000029BE6A0>
>>> for roll in d6_iter:
...     print(roll)
...
4
3
6
3

注意,这里的 iter 函数返回一个 callable_iterator 对象。示例中的 for 循环可能运行特别长的时间,不过肯定不会打印 1,因为 1 是哨符。与常规的迭代器一样,这个示例中的 d6_iter 对象一旦耗尽就没用了。如果想重新开始,必须再次调用 iter(...),重新构建迭代器。

内置函数 iter 的文档(https://docs.python.org/3/library/functions.html#iter)中有个实用的例子。这段代码逐行读取文件,直到遇到空行或者到达文件末尾为止:

with open('mydata.txt') as fp:
    for line in iter(fp.readline, '\n'):
        process_line(line)

结束本章之前,我要举个实用的例子,说明如何使用生成器高效处理大量数据。