Python中的并发处理之asyncio包使用的详解


Posted in Python onApril 03, 2018

导语:本文章记录了本人在学习Python基础之控制流程篇的重点知识及个人心得,打算入门Python的朋友们可以来一起学习并交流。

本文重点:

1、了解asyncio包的功能和使用方法;
2、了解如何避免阻塞型调用;
3、学会使用协程避免回调地狱。

一、使用asyncio包做并发编程

1、并发与并行

并发:一次处理多件事。
并行:一次做多件事。
并发用于制定方案,用来解决可能(但未必)并行的问题。并发更好。

2、asyncio概述

了解asyncio的4个特点:

  1. asyncio包使用事件循环驱动的协程实现并发。
  2. 适合asyncio API的协程在定义体中必须使用yield from,而不能使用yield。
  3. 使用asyncio处理的协程,需在定义体上使用@asyncio.coroutine装饰。装饰的功能在于凸显协程,同时当协程不产出值,协程会被垃圾回收。
  4. Python3.4起,asyncio包只直接支持TCP和UDP协议。如果想使用asyncio实现HTTP客户端和服务器时,常使用aiohttp包。

在协程中使用yield from需要注意两点:

  1. 使用yield froml链接的多个协程最终必须由不是协程的调用方驱动,调用方显式或隐式在最外层委派生成器上调用next()函数或 .send()方法。
  2. 链条中最内层的子生成器必须是简单的生成器(只使用yield)或可迭代的对象。

但在asyncio包的API中使用yield from还需注意两个细节:

  1. asyncio包中编写的协程链条始终通过把最外层委派生成器传给asyncio包API中的某个函数驱动,例如loop.run_until_complete()。即不通过调用next()函数或 .send()方法驱动协程。
  2. 编写的协程链条最终通过yield from把职责委托给asyncio包中的某个协程函数或协程方法。即最内层的子生成器是库中真正执行I/O操作的函数,而不是我们自己编写的函数。

实例——通过asyncio包和协程以动画形式显示文本式旋转指针:

import asyncio
import itertools
import sys

@asyncio.coroutine # 交给 asyncio 处理的协程要使用 @asyncio.coroutine 装饰
def spin(msg):
  for char in itertools.cycle('|/-\\'):
    status = char + ' ' + msg
    print(status)
    try:
      yield from asyncio.sleep(.1) # 使用 yield from asyncio.sleep(.1) 代替 time.sleep(.1),这样的休眠不会阻塞事件循环。
    except asyncio.CancelledError: # 如果 spin 函数苏醒后抛出 asyncio.CancelledError 异常,其原因是发出了取消请求,因此退出循环。
      break

@asyncio.coroutine
def slow_function(): # slow_function 函数是协程,在用休眠假装进行 I/O 操作时,使用 yield from 继续执行事件循环。
  # 假装等待I/O一段时间
  yield from asyncio.sleep(3) # yield from asyncio.sleep(3) 表达式把控制权交给主循环,在休眠结束后恢复这个协程。
  return 42

@asyncio.coroutine
def supervisor(): # supervisor 函数也是协程
  spinner = asyncio.async(spin('thinking!')) # asyncio.async(...) 函数排定 spin 协程的运行时间,使用一个 Task 对象包装spin 协程,并立即返回。
  print('spinner object:', spinner)
  result = yield from slow_function() # 驱动 slow_function() 函数。结束后,获取返回值。
# 同时,事件循环继续运行,因为slow_function 函数最后使用 yield from asyncio.sleep(3) 表达式把控制权交回给了主循环。
  spinner.cancel() # Task 对象可以取消;取消后会在协程当前暂停的 yield 处抛出 asyncio.CancelledError 异常。协程可以捕获这个异常,也可以延迟取消,甚至拒绝取消。
  return result

if __name__ == '__main__':
  loop = asyncio.get_event_loop() # 获取事件循环的引用
  result = loop.run_until_complete(supervisor()) # 驱动 supervisor 协程,让它运行完毕;这个协程的返回值是这次调用的返回值。
  loop.close()
  print('Answer:', result)

3、线程与协程对比

线程:调度程序在任何时候都能中断线程。必须记住保留锁。去保护程序中的重要部分,防止多步操作在执行的过程中中断,防止数据处于无效状态。

协程:默认会做好全方位保护,以防止中断。对协程来说无需保留锁,在多个线程之间同步操作,协程自身就会同步,因为在任意时刻只有一个协程运行。

4、从期物、任务和协程中产出

在asyncio包中,期物和协程关系紧密,因为可以使用yield from从asyncio.Future对象中产出结果。这意味着,如果foo是协程函数,抑或是返回Future或Task实例的普通函数,那么可以这样写:res=yield from foo()。这是asyncio包中很多地方可以互换协程与期物的原因之一。

二、避免阻塞型调用

1、有两种方法能避免阻塞型调用中止整个应用程序的进程:

  1. 在单独的线程中运行各个阻塞型操作。
  2. 把每个阻塞型操作转换成非阻塞的异步调用。

使用多线程处理大量连接时将耗费过多的内存,故此通常使用回调来实现异步调用。

2、使用Executor对象防止阻塞事件循环:

使用loop.run_in_executor把阻塞的作业(例如保存文件)委托给线程池做。

@asyncio.coroutine
def download_one(cc, base_url, semaphore, verbose):
  try:
    with (yield from semaphore):
      image = yield from get_flag(base_url, cc)
  except web.HTTPNotFound:
    status = HTTPStatus.not_found
    msg = 'not found'
  except Exception as exc:
    raise FetchError(cc) from exc
  else:
    loop = asyncio.get_event_loop() # 获取事件循环对象的引用
    loop.run_in_executor(None, # None 使用默认的 TrreadPoolExecutor 实例
        save_flag, image, cc.lower() + '.gif') # 传入可调用对象
    status = HTTPStatus.ok
    msg = 'OK'

  if verbose and msg:
    print(cc, msg)

  return Result(status, cc)

asyncio 的事件循环背后维护一个 ThreadPoolExecutor 对象,我们可以调用 run_in_executor 方法, 把可调用的对象发给它执行。

三、从回调到期物和协程

回调地狱:如果一个操作需要依赖之前操作的结果,那就得嵌套回调。

Python 中的回调地狱:

def stage1(response1):
  request2 = step1(response1)
  api_call2(request2, stage2)

def stage2(response2):
  request3 = step2(response2)
  api_call3(request3, stage3)

def stage3(response3):
  step3(response3)

api_call1(request1, step1)

使用 协程 和 yield from 结构做异步编程,无需用回调:

@asyncio.coroutine
def three_stages(request1):
  response1 = yield from api_call1()
  request2 = step1(response1)
  response2 = yield from api_call2(request2)
  request3 = step2(response2)
  response3 = yield from api_call3(request3)
  step3(response3)

loop.create_task(three_stages(request1))
# 协程不能直接调用,必须用事件循环显示指定协程的执行时间,或者在其他排定了执行时间的协程中使用 yield from 表达式把它激活

四、使用asyncio包编写服务器

  1. 使用asyncio包能实现TCP和HTTP服务器
  2. Web服务将成为asyncio包的重要使用场景。

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python脚本实现统计日志文件中的ip访问次数代码分享
Aug 06 Python
Python设计模式编程中Adapter适配器模式的使用实例
Mar 02 Python
Python selenium 三种等待方式详解(必会)
Sep 15 Python
python使用matplotlib绘制折线图教程
Feb 08 Python
python 递归遍历文件夹,并打印满足条件的文件路径实例
Aug 30 Python
python实现批量修改图片格式和尺寸
Jun 07 Python
python3解析库lxml的安装与基本使用
Jun 27 Python
PyCharm搭建Spark开发环境的实现步骤
Sep 05 Python
用Python写一个自动木马程序
Sep 17 Python
python3:excel操作之读取数据并返回字典 + 写入的案例
Sep 01 Python
Pycharm2020最新激活码|永久激活(附最新激活码和插件的详细教程)
Sep 29 Python
使用Django的JsonResponse返回数据的实现
Jan 15 Python
图解Python变量与赋值
Apr 03 #Python
Python实现的HMacMD5加密算法示例
Apr 03 #Python
Python通过调用mysql存储过程实现更新数据功能示例
Apr 03 #Python
python批量读取txt文件为DataFrame的方法
Apr 03 #Python
python逐行读写txt文件的实例讲解
Apr 03 #Python
Python实现的计算马氏距离算法示例
Apr 03 #Python
python2.7无法使用pip的解决方法(安装easy_install)
Apr 03 #Python
You might like
一个PHP并发访问实例代码
2012/09/06 PHP
PHP利用DWZ.CN服务生成短网址
2019/08/11 PHP
Laravel等框架模型关联的可用性浅析
2019/12/15 PHP
在jQuery1.5中使用deferred对象 着放大镜看Promise
2011/03/12 Javascript
javascript中万恶的function实例分析
2011/05/25 Javascript
jQuery实现 注册时选择阅读条款 左右移动
2013/04/11 Javascript
让JavaScript的Alert弹出框失效的方法禁止弹出警告框
2014/09/03 Javascript
js控制文本框只输入数字和小数点的方法
2015/03/10 Javascript
通用无限极下拉菜单的实现代码
2016/05/31 Javascript
jQuery实现微信长按识别二维码功能
2016/08/26 Javascript
AngularJs基于角色的前端访问控制的实现
2016/11/07 Javascript
简单实现JavaScript弹幕效果
2020/08/27 Javascript
Iphone手机、安卓手机浏览器控制默认缩放大小的方法总结(附代码)
2017/08/18 Javascript
webstorm中配置nodejs环境及npm的实例
2018/05/15 NodeJs
详解基于node.js的脚手架工具开发经历
2019/01/28 Javascript
vue在线动态切换主题色方案
2020/03/26 Javascript
js里面的变量范围分享
2020/07/18 Javascript
python使用reportlab画图示例(含中文汉字)
2013/12/03 Python
Python3.6简单操作Mysql数据库
2017/09/12 Python
python负载均衡的简单实现方法
2018/02/04 Python
Python自然语言处理 NLTK 库用法入门教程【经典】
2018/06/26 Python
在python里从协程返回一个值的示例
2019/02/19 Python
Python中字符串String的基本内置函数与过滤字符模块函数的基本用法
2019/05/27 Python
解决python 执行shell命令无法获取返回值的问题
2020/12/05 Python
blueseventy官网:铁人三项和比赛泳衣
2021/02/06 全球购物
瑞典最大的儿童用品网上商店:pinkorblue.se
2021/03/09 全球购物
房屋租赁意向书
2014/04/01 职场文书
婚假请假条格式及范文
2014/04/10 职场文书
合作协议书
2014/04/23 职场文书
生物科学专业自荐书
2014/06/20 职场文书
导航工程专业自荐信
2014/09/02 职场文书
导游词400字
2015/02/13 职场文书
2015年学校减负工作总结
2015/05/19 职场文书
力克胡哲观后感
2015/06/10 职场文书
加强党性修养心得体会
2016/01/21 职场文书
nginx rewrite功能使用场景分析
2022/05/30 Servers