2022年 11月 9日

Python中的迭代

在Python中迭代序列(或者其他可迭代对象)时,有一些函数非常好用。有些函数位于itertools模块中,还有一些Python的内建函数也十分方便。

1. 并行迭代

程序可以同时迭代两个序列。比如有下面两个列表:

names = ['anne', 'beth', 'george', 'damon']
ages = [12, 45, 32, 102]
  • 1
  • 2

如果想要打印名字和对应的年龄,可以像下面这样做:

'''
遇到问题没人解答?小编创建了一个Python学习交流QQ群:579817333 
寻找有志同道合的小伙伴,互帮互助,群里还有不错的视频学习教程和PDF电子书!
'''
In [7]: for i in range(len(names)):
   ...:     print(names[i], 'is', ages[i], 'years old')
   ...:     
anne is 12 years old
beth is 45 years old
george is 32 years old
damon is 102 years old
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11

这里 i 是循环索引的标准变量名。

而内建的zip函数就可以用来进行并行迭代,可以把两个序列 “压缩” 在一起,然后返回一个元组的列表:

>>> zip(names, ages)
[('anne', 12), ('beth', 45), ('george', 32), ('damon', 102)]
  • 1
  • 2

现在我可以在循环中解包元组:

'''
遇到问题没人解答?小编创建了一个Python学习交流QQ群:579817333 
寻找有志同道合的小伙伴,互帮互助,群里还有不错的视频学习教程和PDF电子书!
'''
In [9]: for name, age in zip(names, ages):
   ...:     print(name, 'is', age, 'years old')
   ...:     
anne is 12 years old
beth is 45 years old
george is 32 years old
damon is 102 years old
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11

zip 函数也可以作用于任意多的序列。关于它很重要的一点是zip可以处理不等长的序列,当最短的序列 “用完” 的时候就会停止:

>>> zip(range(5), xrange(1000000000))
[(0, 0), (1, 1), (2, 2), (3, 3), (4, 4)] 
  • 1
  • 2

在上面的代码中,不推荐用range替换xrange——尽管只需要要前5个数字,但range会计算所有的数字,这里要花费很长的时间。而使用xrange就没有这个问题,它只计算前5个数字。

2. 按索引迭代

有些时间想要迭代访问序列中的对象,同时还有获取当前对象的索引。例如,在一个字符串列表中替换所有包含’xxx’的子字符串。实现的方法肯定有很多,假设你想象下面这样做:

for string in strings:
    if 'xxx' in string:
        index = strings.index(string)  # Search for the string in the list of strings
        strings[index] = '[censored]'
  • 1
  • 2
  • 3
  • 4

没问题,但是在替换前要搜索给定的字符串似乎没必要。如果不替换的话,搜索还会返回错误的索引(前面出现的同一个词的索引)。一个比较好的版本如下:

'''
遇到问题没人解答?小编创建了一个Python学习交流QQ群:579817333 
寻找有志同道合的小伙伴,互帮互助,群里还有不错的视频学习教程和PDF电子书!
'''
index = 0
for string in strings:
    if 'xxx' in string:
        strings[index] = '[censored]'
    index += 1
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9

方法有些笨,不过还可以接受。另一种方法是使用内建的enumerate函数:

for index, string in enumerate(strings):
    if 'xxx' in string:
        strings[index] = '[censored]'
  • 1
  • 2
  • 3

这个函数可以在提供索引的地方迭代索引-值对

3. 翻转和排序迭代

让我们看看另外两个有用的函数:reversed和sorted。它们同列表的reverse和sort(sorted和sort使用同样的参数)方法类似,但作用于任何序列或可迭代对象上,不是原地修改对象,而是返回翻转或排序后的版本:

>>> sorted([4, 3, 6, 8, 3])
[3, 3, 4, 6, 8]
>>> sorted('Hello, world!')
[' ', '!', ',', 'H', 'd', 'e', 'l', 'l', 'l', 'o', 'o', 'r', 'w']
>>> list(reversed('Hello, world!'))
['!', 'd', 'l', 'r', 'o', 'w', ' ', ',', 'o', 'l', 'l', 'e', 'H']
>>> ''.join(reversed('Hello, world!'))
'!dlrow ,olleH'
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8

注意,虽然sorted方法返回列表,reversed方法却返回一个更加不可思议的可迭代对象。它们具体的含义不用过多关注,大可在for循环以及join方法中使用,而不会有任何问题。不过却不能直接对它使用索引、分片以及调用list方法,如果希望进行上述处理,那么可以使用list类型转换返回的对象,上面的例子中已经给出具体的做法。

4. 迭代器规则

迭代的意思是重复做一些事很多次,就像在循环中做的那样。到现在为止只在for循环中对序列和字典进行过迭代,但实际上也能对其他对象进行迭代:只要改对象实现了__ iter __ 方法。

__ iter __ 方法会返回一个迭代器(iterator),所谓的迭代器就是具有next方法(这个方法在调用时不需要任何参数)的对象。在调用next方法时,迭代器会返回它的下一个值。如果next方法被调用,但迭代器没有值可以返回,就会引发一个StopIteration异常。

注意:迭代器规则在Python 3.0中有一些变化。在新的规则中,迭代器对象应该实现 __ next __
方法,而不是next。而新的内建函数next可以用于访问这个方法。换句话说,next(it)等同于3.0之前版本中的it.next()。

迭代规则的关键是什么?为什么不使用列表?因为列表的杀伤力太大。如果一个函数,可以一个接一个地计算值,那么在使用时可能是计算一个值时获取一个值——而不是通过列表一次性获取所有值。如果有很多值,列表就会占用太多的内存。但还有其他的理由:使用迭代器更通用、更简单、更优雅。让我们看看一个不使用列表的例子,因为要用的话,列表的长度必须无限。

这里的“列表”是一个斐波那契数列。使用的迭代器如下:

'''
遇到问题没人解答?小编创建了一个Python学习交流QQ群:579817333 
寻找有志同道合的小伙伴,互帮互助,群里还有不错的视频学习教程和PDF电子书!
'''
In [1]: class Fibs:
   ...:     def __init__(self):
   ...:         self.a = 0
   ...:         self.b = 1
   ...:     def next(self):
   ...:         self.a, self.b = self.b, self.a + self.b
   ...:         return self.a
   ...:     def __iter__(self):
   ...:         return self
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13

注意,迭代器实现了__ iter__ 方法,这个方法实际上返回迭代器本身。在很多情况下,__ iter__ 会放到其他的会在for循环中使用的对象中。这样一来,程序就能返回所需的迭代器。此外,推荐使用迭代器实现它自己的 __ iter__ 方法,然后就能直接在for循环中使用迭代器本身了。

注意:正式的说法是,一个实现了__iter__方法的对象是可迭代的,一个实现了next方法的对象则是迭代器。

首先,产生一个Fibs对象:

In [2]: fibs = Fibs()
  • 1

可在for循环中使用该对象——比如去查找在斐波那契数列中比1000大的数中的最小的数:

In [3]: for f in fibs:
   ...:     if f > 1000:
   ...:         print f
   ...:         break
  • 1
  • 2
  • 3
  • 4

因为设置了break,所以循环在这里停止了,否则循环会一直继续下去。

提示 内建函数iter可以从可迭代的对象中获得迭代器。

>>> it = iter([1, 2, 3])
>>> it.next()
1
>>> it.next()
2 
  • 1
  • 2
  • 3
  • 4
  • 5

除此之外,它也可以从函数或者其他可调用对象中获取可迭代对象。

5. 从迭代器得到序列

除了在迭代器和可迭代对象上进行迭代外,还能把它们转换为序列。在大部分能使用序列的情况下(除了或者分片等操作中),都能使用迭代器(或者可迭代对象)替换。关于这个的一个很有用的例子是使用list构造方法显示地将迭代器转化为列表。

'''
遇到问题没人解答?小编创建了一个Python学习交流QQ群:579817333 
寻找有志同道合的小伙伴,互帮互助,群里还有不错的视频学习教程和PDF电子书!
'''
>>> class TestIterator:
...     value = 0
...     def next(self):
...             self.value += 1
...             if self.value > 10: 
...                 raise StopIteration
...             return self.value
...     def __iter__(self):
...             return self
... 
>>> ti = TestIterator()
>>> list(ti)
[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17