举例详解Python中yield生成器的用法


Posted in Python onAugust 05, 2015

yield是生成的意思,但是在python中则是作为生成器理解,生成器的用处主要可以迭代,这样简化了很多运算模型(还不是很了解是如何简化的)。
yield是一个表达式,是有返回值的.
当一个函数中含有yield时,它不再是一个普通的函数,而是一个生成器.当该函数被调用时不会自动执行,而是暂停,见第一个例子:
例1:

>>> def mygenerator():
...  print 'start...'
...  yield 5
... 
>>> mygenerator()   //在此处调用,并没有打印出start...说明存在yield的函数没有被运行,即暂停
<generator object mygenerator at 0xb762502c>
>>> mygenerator().next()  //调用next()即可让函数运行.
start...
5
>>>

如一个函数中出现多个yield则next()会停止在下一个yield前,见例2:
例2:

>>> def mygenerator():
...  print 'start...'
...  yield 5
... 
>>> mygenerator()   //在此处调用,并没有打印出start...说明存在yield的函数没有被运行,即暂停
<generator object mygenerator at 0xb762502c>
>>> mygenerator().next()  //调用next()即可让函数运行.
start...
5
>>>

为什么yield 5会输出5,yield 23会输出23?
我们猜测可能是因为yield是表达式,存在返回值.
那么这是否可以认为yield 5的返回值一定是5吗?实际上并不是这样,这个与send函数存在一定的关系,这个函数实质上与next()是相似的,区别是send是传递yield表达式的值进去,而next不能传递特定的值,只能传递None进去,因此可以认为g.next()和g.send(None)是相同的。见例3:
例3:

>>> def fun():
...  print 'start...'
...  m = yield 5
...  print m
...  print 'middle...'
...  d = yield 12
...  print d
...  print 'end...'
... 
>>> m = fun()    //创建一个对象
>>> m.next()    //会使函数执行到下一个yield前
start...
5
>>> m.send('message')  //利用send()传递值
message     //send()传递进来的 
middle...
12
>>> m.next()
None      //可见next()返回值为空
end...
Traceback (most recent call last):
 File "<stdin>", line 1, in <module>
StopIteration

在multiprocess中的使用

python在处理数据的时候,memory-heavy 的数据往往会导致程序没办反运行或者运行期间服务器其他程序效率受到影响。这种情况往往会把数据集合变为通过genertor来遍历。

但同时如我们所知,generoter看似只能被单进程消费,这样效率很低。
generator 可以被pool.map消费。

看一下pool.py的源码。

for i, task in enumerate(taskseq):
  ...
  try:
   put(task)
  except IOError:
   debug('could not put task on queue')
   break

实际是先将generator全部消费掉放到queue中。然后通过map来并行。这样是解决了使用map来并行。

但是依然没有解决占用内存的问题。这里有两步占用内存。

  1.     第一步是全部消费掉的generator。
  2.     第二步并行运算全部data。

解决第一个问题,通过部分消费generator来达到。
解决第二个问题,可以通过imap来达到.

示例代码如下:

import multiprocessing as mp
import itertools
import time


def g():
 for el in xrange(50):
  print el
  yield el

import os

def f(x):
 time.sleep(1)
 print str(os.getpid()) +" "+ str(x)
 return x * x

if __name__ == '__main__':
 pool = mp.Pool(processes=4)    # start 4 worker processes
 go = g()
 result = []
 N = 11
 while True:
  g2 = pool.imap(f, itertools.islice(go, N))
  if g2:
   for i in g2:
    result.append(i)
    time.sleep(1)
  else:
   break
 print(result)

ps: 使用注意事项。在produce数据的时候,尽量少做操作,应为即使是map也是单线程的来消费数据。所以尽量把操作放到map中作。这样才能更好的利用多进程提高效率。

Python 相关文章推荐
Python使用正则匹配实现抓图代码分享
Apr 02 Python
在Python的Django框架中使用通用视图的方法
Jul 21 Python
使用PyInstaller将Python程序文件转换为可执行程序文件
Jul 08 Python
Pandas 数据框增、删、改、查、去重、抽样基本操作方法
Apr 12 Python
Python实现模拟浏览器请求及会话保持操作示例
Jul 30 Python
python实现自动登录
Sep 17 Python
python爬虫基础教程:requests库(二)代码实例
Apr 09 Python
python实现飞机大战游戏
Oct 26 Python
Python 实现交换矩阵的行示例
Jun 26 Python
Django对数据库进行添加与更新的例子
Jul 12 Python
Python 实现网课实时监控自动签到、打卡功能
Mar 12 Python
Python可视化学习之seaborn绘制矩阵图详解
Feb 24 Python
Python中return语句用法实例分析
Aug 04 #Python
python函数形参用法实例分析
Aug 04 #Python
Python简明入门教程
Aug 04 #Python
将Python代码打包为jar软件的简单方法
Aug 04 #Python
python函数局部变量用法实例分析
Aug 04 #Python
python删除列表内容
Aug 04 #Python
解决Python传递中文参数的问题
Aug 04 #Python
You might like
php操作redis中的hash和zset类型数据的方法和代码例子
2014/07/05 PHP
smarty中英文多编码字符截取乱码问题解决方法
2014/10/28 PHP
php从字符串创建函数的方法
2015/03/16 PHP
PHP实现清除wordpress里恶意代码
2015/10/21 PHP
mac系统下安装多个php并自由切换的方法详解
2017/04/21 PHP
php curl批处理实现可控并发异步操作示例
2018/05/09 PHP
PHP函数用法详解【初始化、嵌套、内置函数等】
2020/06/02 PHP
javascript 动态修改样式和层叠样式表代码
2010/04/27 Javascript
Js实现滚动变色的文字效果
2014/06/16 Javascript
Javascript中arguments对象详解
2014/10/22 Javascript
JavaScript中利用jQuery绑定事件的几种方式小结
2016/03/06 Javascript
AngularJS入门之动画
2016/07/27 Javascript
jQuery Ajax传值到Servlet出现乱码问题的解决方法
2016/10/09 Javascript
react.js使用webpack搭配环境的入门教程
2017/08/14 Javascript
微信小程序手机号码验证功能的实例代码
2018/08/28 Javascript
VUE2.0+ElementUI2.0表格el-table循环动态列渲染的写法详解
2018/11/30 Javascript
JS 实现发送短信验证码的“59秒后重新发送验证短信”功能
2019/08/23 Javascript
浅析VUE防抖与节流
2020/11/24 Vue.js
Vue实现随机验证码功能
2020/12/29 Vue.js
JavaScript实现切换多张图片
2021/01/27 Javascript
[04:52]DOTA2亚洲邀请赛附加赛 TOP10精彩集锦
2015/01/29 DOTA
python在命令行下使用google翻译(带语音)
2014/01/16 Python
浅析Python中的多进程与多线程的使用
2015/04/07 Python
python3下实现搜狗AI API的代码示例
2018/04/10 Python
Python基础之条件控制操作示例【if语句】
2019/03/23 Python
Python Datetime模块和Calendar模块用法实例分析
2019/04/15 Python
在Pandas中处理NaN值的方法
2019/06/25 Python
python科学计算之numpy——ufunc函数用法
2019/11/25 Python
无畏的旅行:Intrepid Travel
2017/12/20 全球购物
Pretty Green美国:英式摇滚服饰风格代表品牌之一
2019/01/23 全球购物
CAT鞋加拿大官网:CAT Footwear加拿大
2020/08/05 全球购物
秋季红领巾广播稿
2014/01/27 职场文书
鼓舞士气的口号
2014/06/16 职场文书
兼职安全员岗位职责
2015/02/15 职场文书
获奖感言范文
2015/07/31 职场文书
分析设计模式之模板方法Java实现
2021/06/23 Java/Android