使用Python的Tornado框架实现一个简单的WebQQ机器人


Posted in Python onApril 24, 2015

我打算将WebQQ单独出来运行, 一开始直接拷贝了pyxmpp2的mainloop, 但是跑起来问题多多, 所以我又研究了利用Tornado进行网络编程(这里), 所以我放弃了Pyxmpp2的mainloop,使用Tornado进行重写

首先放出项目代码
引子

WebQQ协议是一套基于HTTP的QQ协议, 而用Python的urllib2库进行请求太慢, 因为HTTP本身就使用socket请求, 所以改用多路复用I/O模型, 而Tornado简单高效, 看过代码后可以轻松上手.平台兼容性很好, 所以选择Tornado作为网络框架.
原理

首先实现了一个 HTTPStream类, 其主要接口是add_request方法, 它接受一个必选参数:request 是一个 urllib2.Request的实例, 和一个可选参数:readback是一个接受一个urllib2.urlopen(request)返回的Response参数的读取函数, 代码如下:

class HTTPStream(object):
  # 省略若干代码
  def add_request(self, request, readback = None):
    if not isinstance(request, urllib2.Request):
      raise ValueError, "Not a invaid requset"

    # 此处易触发timeout异常, 省略处理异常代码
    sock, data = self.http_sock.make_http_sock_data(request)

    fd = sock.fileno()
    self.fd_map[fd] = sock
    self.fd_request_map[fd] = request
    callback = partial(self._handle_events, request, data, readback)
    self.ioloop.add_handler(fd, callback, IOLoop.WRITE)

HTTPStream.add_request将urllib2.Request的实例解析出一个socket和一个用于socket发送的数据.前面文章介绍过了, tornado.ioloop.IOLoop.add_handler用于将注册socket, 其需要三个参数: socket的文件描述符, 接受文件描述符和事件参数的回调, 和注册的事件.

我们用到的回调是HTTPStream._handle_events:

class HTTPStream(object):
  # 省略若干代码
  def _handle_events(self, request, data, readback, fd, event):
    """ 用于处理Tornado事件
    Arguments:
      `request`  -  urllib.Request
      `data`   -  socket要写入的数据
      `readback` -  读取函数
      以上参数应当使用partial封装然后将此方法作为IOLoop.add_handler的callback
      `fd`    -  IOLoop传递 文件描述符
      `event`   -  IOLoop传递 tornado
    """
    s = self.fd_map[fd]

    if event & IOLoop.READ:
      # 省略错误处理
      resp = self.http_sock.make_response(s, request)
      args = readback(resp)
      s.setblocking(False)
      if args and len(args) == 3:
        t = threading.Thread(target = self.add_delay_request, args = args)
        t.setDaemon(True)
        t.start()

      if args and len(args) == 2:
        self.add_request(*args)
      self.ioloop.remove_handler(fd)

    if event & IOLoop.WRITE:
      s.sendall(data)
      if readback:
        self.ioloop.update_handler(fd, IOLoop.READ)
      else:
        self.ioloop.remove_handler(fd)

    if event & IOLoop.ERROR:
      pass

它接受的参数上面注释写的很清楚, 不做解释, 所以将此方法通过functools.partial封装做为callback传递给tornado.ioloop.IOLoop.add_handler, 并注册为写事件, 以便发送HTTP请求.

HTTPStream._handle_events用于处理事件, 当事件为写时就发送HTTP请求(根据urllib2.Request生成的用于发送的数据), 并判断是否有读取函数, 有则注册读事件, 当事件为读时就从socket中构建一个Response并传递给读取函数, 读取函数会返回3个值, 分别为: 下一个请求, 请求的读取函数(可为None, 为None则只请求不读取), 下一个请求的延迟(多长事件后添加此请求, 可选, 单位为秒)

依据读取函数返回的三个值来确定下一个请求, 并完成一系列的请求. 更加完整的代码请参见文章开头给出的项目代码

HTTPStream.http_sock.make_response执行时会将socket设为阻塞, 因为不设置阻塞会出现httplib.BadStatusLine异常.读取函数执行完毕,重新将socket设置为非阻塞, 并移除此socket(虽然做了这样的处理但是QQ连接时间稍长还是会触发httplib.BadStatusLine异常)

Python 相关文章推荐
Python中使用urllib2防止302跳转的代码例子
Jul 07 Python
Python socket C/S结构的聊天室应用实现
Nov 30 Python
在 Python 应用中使用 MongoDB的方法
Jan 05 Python
python3中set(集合)的语法总结分享
Mar 24 Python
python实现kMeans算法
Dec 21 Python
python顺序的读取文件夹下名称有序的文件方法
Jul 11 Python
基于tensorflow加载部分层的方法
Jul 26 Python
使用python判断你是青少年还是老年人
Nov 29 Python
python中线程和进程有何区别
Jun 17 Python
Python爬虫入门教程02之笔趣阁小说爬取
Jan 24 Python
用OpenCV进行年龄和性别检测的实现示例
Jan 29 Python
Python快速实现一键抠图功能的全过程
Jun 29 Python
Python程序中使用SQLAlchemy时出现乱码的解决方案
Apr 24 #Python
简单说明Python中的装饰器的用法
Apr 24 #Python
使用基于Python的Tornado框架的HTTP客户端的教程
Apr 24 #Python
简单介绍Python的Tornado框架中的协程异步实现原理
Apr 23 #Python
解决Python中由于logging模块误用导致的内存泄露
Apr 23 #Python
粗略分析Python中的内存泄漏
Apr 23 #Python
使用beaker让Facebook的Bottle框架支持session功能
Apr 23 #Python
You might like
新版PHP极大的增强功能和性能
2006/10/09 PHP
强烈声明: 不要使用(include/require)_once
2013/06/06 PHP
PHP反向代理类代码
2014/08/15 PHP
php + nginx项目中的权限详解
2017/05/23 PHP
showModelessDialog()使用详解
2006/09/21 Javascript
js类中的公有变量和私有变量
2008/07/24 Javascript
测试你的JS的掌握程度的代码
2009/12/09 Javascript
javascript预览上传图片发现的问题的解决方法
2010/11/25 Javascript
使用javascript过滤html的字符串(注释标记法)
2013/07/08 Javascript
讨论html与javascript在浏览器中的加载顺序问题
2013/11/27 Javascript
javascript中的循环语句for语句深入理解
2014/04/04 Javascript
jquery地址栏链接与a标签链接匹配之特效代码总结
2015/08/24 Javascript
JavaScript 2048 游戏实例代码(简单易懂)
2016/03/25 Javascript
jQuery查找dom的几种方法效率详解
2017/05/17 jQuery
微信小程序开发中var that =this的用法详解
2020/01/18 Javascript
在vue中实现禁止屏幕滚动,禁止屏幕滑动
2020/07/22 Javascript
如何手写一个简易的 Vuex
2020/10/10 Javascript
vue-video-player 断点续播的实现
2021/02/01 Vue.js
[26:52]LGD vs EG 2018国际邀请赛小组赛BO2 第一场 8.17
2018/08/18 DOTA
Python列表推导式的使用方法
2013/11/21 Python
在Python中操作列表之List.append()方法的使用
2015/05/20 Python
Python中input与raw_input 之间的比较
2017/08/20 Python
PyQT实现多窗口切换
2018/04/20 Python
使用PyInstaller将python转成可执行文件exe笔记
2018/05/26 Python
Python计算一个点到所有点的欧式距离实现方法
2019/07/04 Python
Django使用中间键实现csrf认证详解
2019/07/22 Python
Django mysqlclient安装和使用详解
2020/09/17 Python
canvas绘图按照contain或者cover方式适配并居中显示
2019/02/18 HTML / CSS
Ivory Isle Designs美国/加拿大:婚礼和活动文具公司
2018/08/21 全球购物
恶意软件的定义
2014/11/12 面试题
什么是Linux虚拟文件系统VFS
2015/08/25 面试题
2014爱耳日宣传教育活动总结
2014/03/09 职场文书
党校培训自我鉴定范文
2014/04/10 职场文书
环保公益策划方案
2014/08/15 职场文书
Nginx解决前端访问资源跨域问题的方法详解
2021/03/31 Servers
pytorch锁死在dataloader(训练时卡死)
2021/05/28 Python