一文搞懂Python迭代器和生成器-深圳市維司達科技有限公司

很多童鞋搞不懂python迭代器和生成器到底是什么？它们之间又有什么样的关系？

这篇文章就是要用最简单的方式让你理解Python迭代器和生成器！

迭代器和迭代过程

维基百科解释道：

在Python中，迭代器是遵循迭代协议的对象。使用iter()从任何序列对象中得到迭代器（如list, tuple, dictionary, set等）。另一种形式的输入迭代器是generator（生成器）。

很多容器诸如列表、字符串可以用for循环遍历对象。

for语句会调用容器对象中的iter()函数，该函数返回一个定义了__next__()方法的迭代器对象，该方法将逐一访问容器中的元素。

所以说：

python中，任意对象，只要定义了__next__方法，它就是一个迭代器。

因此，python中的容器如列表、元组、字典、集合、字符串都可以被称作迭代器。

讲完迭代器后，迭代就比较好理解了，迭代就是从迭代器中取元素的过程。

比如我们用for循环从列表[1,2,3]中取元素，这种遍历过程就被称作迭代。

# 列表是迭代器for element in [1, 2, 3]:print(element)# 元组是迭代器for element in (1, 2, 3):print(element)# 字典是迭代器for key in {'one':1, 'two':2}:print(key)# 字符串是迭代器for char in "123":print(char)# 打开的text同样是迭代器for line in open("myfile.txt"):print(line, end='')

如果你不想用for循环迭代呢？

这时你可以：

先调用容器（以字符串为例）的iter()函数
再使用next()内置函数来调用__next__()方法
当元素用尽时，__next__()将引发 StopIteration 异常

>>> s = 'abc'>>> it = iter(s)>>> it<iterator object at 0x00A1DB50>>>> next(it)'a'>>> next(it)'b'>>> next(it)'c'>>> next(it)Traceback (most recent call last):File "<stdin>", line 1, in <module>next(it)StopIteration

生成器 Generator

看看廖雪峰大神的解释：

通过列表生成式，我们可以直接创建一个列表。

但是，受到内存限制，列表容量肯定是有限的。

而且，创建一个包含100万个元素的列表，不仅占用很大的存储空间，如果我们仅仅需要访问前面几个元素，那后面绝大多数元素占用的空间都白白浪费了。

所以，如果列表元素可以按照某种算法推算出来，那我们是否可以在循环的过程中不断推算出后续的元素呢？

这样就不必创建完整的list，从而节省大量的空间。在Python中，这种一边循环一边计算的机制，称为生成器（Generator）。

生成器也是一种迭代器，但是你只能对其迭代一次。

这是因为它们并没有把所有的值存在内存中，而是在运行时生成值。

你通过遍历来使用它们，要么用一个for循环，要么将它们传递给任意可以进行迭代的函数和结构。

大多数时候生成器是以函数来实现的。然而，它们并不返回一个值，而是yield(暂且译作“生出”)一个值。

每次对生成器调用next()时，它会从上次离开位置恢复执行（它会记住上次执行语句时的所有数据值）。显示如何非常容易地创建生成器的示例如下:

def reverse(data):for index in range(len(data)-1, -1, -1):yield data[index]

>>> for char in reverse('golf'):... print(char)...flog

可以用生成器来完成的操作同样可以用前一节所描述的基于类的迭代器来完成。但生成器的写法更为紧凑，因为它会自动建__iter__()和__next__()方法。

生成器表达式

生成器不一定要用复杂的函数表示，python提供了简洁的生成器表达式。

从形式上来看，生成器表达式和列表推导式很像，仅仅是将列表推导式中的[]替换为()，但是两者差别挺大，生成器表达式可以说组合了迭代功能和列表解析功能。

生成器表达式可以认为是一种特殊的生成器函数，类似于lambda表达式和普通函数。但是和生成器一样，生成器表达式也是返回生成器generator对象，一次只返回一个值。

>>> sum(i*i for i in range(10)) # sum of squares285
>>> xvec = [10, 20, 30]>>> yvec = [7, 5, 3]>>> sum(x*y for x,y in zip(xvec, yvec)) # dot product260
>>> from math import pi, sin>>> sine_table = {x: sin(x*pi/180) for x in range(0, 91)}
>>> unique_words = set(word for line in page for word in line.split())
>>> valedictorian = max((student.gpa, student.name) for student in graduates)
>>> data = 'golf'>>> list(data[i] for i in range(len(data)-1, -1, -1))['f', 'l', 'o', 'g']

【30天从零学Python】重要补充二：自定义排序

30天从零学Python 通信工程专业科班生，用了几十年MATLAB，为了过大厂机考，不得不自学Python。文章目录30天从零学Python重要补充二：自定义排序0. 为什么要自定义排序？1. 基础回顾：sort () 方法的核心特性2…

李华

Prompt Engine：大型语言模型提示工程终极指南

Prompt Engine：大型语言模型提示工程终极指南【免费下载链接】prompt-engine A library for helping developers craft prompts for Large Language Models 项目地址: https://gitcode.com/gh_mirrors/pr/prompt-engine 在人工智能快速发展的今天&#xff0…

李华

SubFinder 强力字幕搜索工具：一键解决所有字幕难题

SubFinder 强力字幕搜索工具：一键解决所有字幕难题【免费下载链接】subfinder 字幕查找器项目地址: https://gitcode.com/gh_mirrors/subfi/subfinder 还在为找不到合适的字幕而烦恼吗？SubFinder 字幕查找器就是你的终极解决方案！这…

李华

训练时，位置编码、Q、K 是怎么被优化成具有空间信息的？

下面我会给你一个完全贴近真实代码、从反向传播梯度角度、把训练如何“优化出空间结构”讲得最清楚的版本。这是很多人搞不明白的位置： ViT 的可学习位置编码、Q/K 的方向、Multi-Head 空间关系，到底是怎么在训练中“自动学到”的？ 我们一步…

李华

3大分布式策略深度评测：如何为你的大模型选择最佳并行方案

3大分布式策略深度评测：如何为你的大模型选择最佳并行方案【免费下载链接】torchtitan A native PyTorch Library for large model training 项目地址: https://gitcode.com/GitHub_Trending/to/torchtitan 当模型参数突破百亿级别，单张GPU已无法…

李华

【30天从零学Python】重要补充二：自定义排序

Prompt Engine：大型语言模型提示工程终极指南

天梯赛训练赛题解（C++代码和Python代码）

SubFinder 强力字幕搜索工具：一键解决所有字幕难题

训练时，位置编码、Q、K 是怎么被优化成具有空间信息的？

3大分布式策略深度评测：如何为你的大模型选择最佳并行方案