Python生成器(Generator)详解


Posted in Python onApril 13, 2015

通过列表生成式,我们可以直接创建一个列表。但是,受到内存限制,列表容量肯定是有限的。而且,创建一个包含100万个元素的列表,不仅占用很大的存储空间,如果我们仅仅需要访问前面几个元素,那后面绝大多数元素占用的空间都白白浪费了。

所以,如果列表元素可以按照某种算法推算出来,那我们是否可以在循环的过程中不断推算出后续的元素呢?这样就不必创建完整的list,从而节省大量的空间。在Python中,这种一边循环一边计算的机制,称为生成器(Generator)。

简单生成器

要创建一个generator,有很多种方法。第一种方法很简单,只要把一个列表生成式的[]改成(),就创建了一个generator:

>>> L = [x * x for x in range(10)]

>>> L

[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]

>>> g = (x * x for x in range(10))

>>> g

<generator object <genexpr> at 0x104feab40>

创建L和g的区别仅在于最外层的[]和(),L是一个list,而g是一个generator。
我们可以直接打印出list的每一个元素,但我们怎么打印出generator的每一个元素呢?

如果要一个一个打印出来,可以通过generator的next()方法:

>>> g.next()

0

>>> g.next()

1

>>> g.next()

4

>>> g.next()

9

>>> g.next()

16

>>> g.next()

25

>>> g.next()

36

>>> g.next()

49

>>> g.next()

64

>>> g.next()

81

>>> g.next()

Traceback (most recent call last):

  File "<stdin>", line 1, in <module>

StopIteration

我们讲过,generator保存的是算法,每次调用next(),就计算出下一个元素的值,直到计算到最后一个元素,没有更多的元素时,抛出StopIteration的错误。

当然,上面这种不断调用next()方法实在是太变态了,正确的方法是使用for循环,因为generator也是可迭代对象:

>>> g = (x * x for x in range(10))

>>> for n in g:

...     print n

...

0

1

4

9

16

25

36

49

64

81

所以,我们创建了一个generator后,基本上永远不会调用next()方法,而是通过for循环来迭代它。

带yield 语句的生成器

仔细观察,可以看出,fib函数实际上是定义了斐波拉契数列的推算规则,可以从第一个元素开始,推算出后续任意的元素,这种逻辑其实非常类似generator。

也就是说,上面的函数和generator仅一步之遥。要把fib函数变成generator,只需要把print b改为yield b就可以了:

def fib(max):

    n, a, b = 0, 0, 1

    while n < max:

        yield b

        a, b = b, a + b

        n = n + 1

这就是定义generator的另一种方法。如果一个函数定义中包含yield关键字,那么这个函数就不再是一个普通函数,而是一个generator:
>>> fib(6)

<generator object fib at 0x104feaaa0>

这里,最难理解的就是generator和函数的执行流程不一样。函数是顺序执行,遇到return语句或者最后一行函数语句就返回。而变成generator的函数,在每次调用next()的时候执行,遇到yield语句返回,再次执行时从上次返回的yield语句处继续执行。

举个简单的例子,定义一个generator,依次返回数字1,3,5:

>>> def odd():

...     print 'step 1'

...     yield 1

...     print 'step 2'

...     yield 3

...     print 'step 3'

...     yield 5

...

>>> o = odd()

>>> o.next()

step 1

1

>>> o.next()

step 2

3

>>> o.next()

step 3

5

>>> o.next()

Traceback (most recent call last):

  File "<stdin>", line 1, in <module>

StopIteration

可以看到,odd不是普通函数,而是generator,在执行过程中,遇到yield就中断,下次又继续执行。执行3次yield后,已经没有yield可以执行了,所以,第4次调用next()就报错。

回到fib的例子,我们在循环过程中不断调用yield,就会不断中断。当然要给循环设置一个条件来退出循环,不然就会产生一个无限数列出来。

同样的,把函数改成generator后,我们基本上从来不会用next()来调用它,而是直接使用for循环来迭代:

>>> for n in fib(6):

...     print n

...

1

1

2

3

5

8

加强的生成器

在 python2.5 中,一些加强特性加入到生成器中,所以除了 next()来获得下个生成的值,用户可以将值回送给生成器[send()],在生成器中抛出异常,以及要求生成器退出[close()]

def gen(x):

    count = x

    while True:

        val = (yield count) 

        if val is not None:

            count = val

        else:

            count += 1
f = gen(5)

print f.next()

print f.next()

print f.next()

print '===================='

print f.send(9)#发送数字9给生成器

print f.next()

print f.next()

输出
5

6

7

====================

9

10

11
Python 相关文章推荐
在树莓派2或树莓派B+上安装Python和OpenCV的教程
Mar 30 Python
Python实现更改图片尺寸大小的方法(基于Pillow包)
Sep 19 Python
Python GUI Tkinter简单实现个性签名设计
Jun 19 Python
对python创建及引用动态变量名的示例讲解
Nov 10 Python
python如何保证输入键入数字的方法
Aug 23 Python
python openvc 裁剪、剪切图片 提取图片的行和列
Sep 19 Python
Python socket模块ftp传输文件过程解析
Nov 05 Python
Python动态导入模块:__import__、importlib、动态导入的使用场景实例分析
Mar 30 Python
记一次Django响应超慢的解决过程
Sep 17 Python
Python获取指定网段正在使用的IP
Dec 14 Python
详解Django关于StreamingHttpResponse与FileResponse文件下载的最优方法
Jan 07 Python
python利用文件时间批量重命名照片和视频
Feb 09 Python
Python中函数的多种格式和使用实例及小技巧
Apr 13 #Python
在Python中使用SimpleParse模块进行解析的教程
Apr 11 #Python
Python的动态重新封装的教程
Apr 11 #Python
简单的Python的curses库使用教程
Apr 11 #Python
详解Python中的文本处理
Apr 11 #Python
状态机的概念和在Python下使用状态机的教程
Apr 11 #Python
在Python下使用Txt2Html实现网页过滤代理的教程
Apr 11 #Python
You might like
PHP的autoload自动加载机制使用说明
2010/12/28 PHP
如何使用php实现评委评分器
2015/07/31 PHP
PHP中JSON的应用技巧
2015/10/10 PHP
php微信开发之谷歌测距
2018/06/14 PHP
基于JQuery实现CheckBox全选全不选
2011/06/27 Javascript
PHP守护进程实例
2015/03/06 Javascript
JSON与XML优缺点对比分析
2015/07/17 Javascript
AngularJS中实现显示或隐藏动画效果的方式总结
2015/12/31 Javascript
快速掌握Node.js之Window下配置NodeJs环境
2016/03/21 NodeJs
onclick和onblur冲突问题的快速解决方法
2016/04/28 Javascript
浅析JavaScript 箭头函数 generator Date JSON
2016/05/23 Javascript
json的使用小结
2016/06/08 Javascript
js基本算法:冒泡排序,二分查找的简单实例
2016/10/08 Javascript
JavaScript 继承详解(六)
2016/10/11 Javascript
Bootstrap幻灯片轮播图支持触屏左右手势滑动的实现方法
2016/10/13 Javascript
JavaScript 栈的详解及实例代码
2017/01/22 Javascript
vue子组件使用自定义事件向父组件传递数据
2017/05/27 Javascript
详解js几个绕不开的事件兼容写法
2017/08/30 Javascript
使用mint-ui实现省市区三级联动效果的示例代码
2018/02/09 Javascript
webpack 单独打包指定JS文件的方法
2018/02/22 Javascript
关于vue状态过渡transition不起作用的原因解决
2019/04/09 Javascript
Vue中axios拦截器如何单独配置token
2019/12/27 Javascript
通过Kettle自定义jar包供javascript使用
2020/01/29 Javascript
利用 JavaScript 实现并发控制的示例代码
2020/12/31 Javascript
python实现移位加密和解密
2019/03/22 Python
Python实现一个带权无回置随机抽选函数的方法
2019/07/24 Python
超实用的 30 段 Python 案例
2019/10/10 Python
Python GUI编程学习笔记之tkinter界面布局显示详解
2020/03/30 Python
python 自定义异常和主动抛出异常(raise)的操作
2020/12/11 Python
国外平面设计素材网站:The Hungry JPEG
2017/03/28 全球购物
实习教师个人的自我评价
2013/11/08 职场文书
美工的岗位职责
2013/11/14 职场文书
高校辅导员推荐信范文
2013/12/25 职场文书
优秀团队申报材料
2014/12/26 职场文书
婚姻出轨保证书
2015/05/08 职场文书
浅谈pytorch中stack和cat的及to_tensor的坑
2021/05/20 Python