python特性(二):迭代器与for语句

2/13/2017来源:经验技巧人气:2024

网上许多文章说Python的for语句中,in关键字后面的对象是一个集合。例如

for i in [1,2,3]
    PRint i
上面代码中in关键字后面的对象[1,2,3]是一个list,也是一个集合。

但in关键字后面的对象其实不必是一个集合。后面接一个序列对象也是合法的。 例如

myrange = MyRange(0, 10)
for i in myrange:
    print i
上面代码中的myrange对象是一个序列对象,但不是集合。参见上一篇博文。

事实上,for语句中in关键字后面的对象也不必是序列对象,它只需要是一个可迭代对象(Iterable)即可。

一个可迭代的对象需要满足下面两个条件之一:

它实现了__iter__方法。该方法会返回一个迭代器对象。或者它是一个序列对象。

注意:如果一个类型实现了__iter__方法,那么在该方法中显式地给出了与该类型相关的迭代器如何构造。可是,对于序列类型来说,它有一个很天然的迭代器。因此,无需通过实现__iter__方法来显式定义。下一篇博文将介绍如何通过序列对象构造天然的迭代器。这里先介绍迭代器对象的严格定义。

一个迭代器,本质上也是一个序列。它需要实现下面两个方法。

next方法(老版本的Python叫__next__方法)。当第11次调用next方法时,会返回序列的第1个元素;当第2次调用next方法时,会返回序列的第2个元素;当序列中的元素耗尽,抛出StopIteration异常。__iter__方法。前面说过__iter__方法通常返回迭代器对象。因此,对于一个迭代器来说,它的__iter__方法只需返回其本身即可。

通过上面的定义,我们知道,一个迭代器对象,也必是可迭代的。

下面的代码定义了一个迭代器。

class MyIterator:
    def __init__(self, start, end):
        self.start = start
        self.end = end

    def next(self):
        if self.start >= self.end:
            raise StopIteration
        self.start = self.start + 1
        return self.start - 1

    def __iter__(self):
        return self
测试代码

myiter = MyIterator(0, 2)
print myiter.next()
print myiter.next()
print myiter.next()
输出结果如下

0
1
Traceback (most recent call last):
  File "test.py", line 27, in <module>
    print myiter.next()
  File "test.py", line 16, in next
    raise StopIteration
StopIteration

下面的代码测试在for语句中使用迭代器

myiter = MyIterator(0, 10)
for i in myiter:
    print i
输出结果

0
1
2
3
4
5
6
7
8
9

在下一篇博文中,将继续介绍for语句的工作原理。