Python实现优先级队列结构的方法详解


Posted in Python onJune 02, 2016

最简单的实现
一个队列至少满足2个方法,put和get.
借助最小堆来实现.
这里按"值越大优先级越高"的顺序.

#coding=utf-8 
from heapq import heappush, heappop 
class PriorityQueue: 
  def __init__(self): 
    self._queue = [] 
 
  def put(self, item, priority): 
    heappush(self._queue, (-priority, item)) 
 
  def get(self): 
    return heappop(self._queue)[-1] 
 
q = PriorityQueue() 
q.put('world', 1) 
q.put('hello', 2) 
print q.get() 
print q.get()

 使用heapq模块来实现
下面的类利用 heapq 模块实现了一个简单的优先级队列:

import heapq

class PriorityQueue:
  def __init__(self):
    self._queue = []
    self._index = 0

  def push(self, item, priority):
    heapq.heappush(self._queue, (-priority, self._index, item))
    self._index += 1

  def pop(self):
    return heapq.heappop(self._queue)[-1]

下面是它的使用方式:

>>> class Item:
...   def __init__(self, name):
...     self.name = name
...   def __repr__(self):
...     return 'Item({!r})'.format(self.name)
...
>>> q = PriorityQueue()
>>> q.push(Item('foo'), 1)
>>> q.push(Item('bar'), 5)
>>> q.push(Item('spam'), 4)
>>> q.push(Item('grok'), 1)
>>> q.pop()
Item('bar')
>>> q.pop()
Item('spam')
>>> q.pop()
Item('foo')
>>> q.pop()
Item('grok')
>>>

仔细观察可以发现,第一个 pop() 操作返回优先级最高的元素。 另外注意到如果两个有着相同优先级的元素( foo 和 grok ),pop操作按照它们被插入到队列的顺序返回的。

 函数 heapq.heappush() 和 heapq.heappop() 分别在队列 _queue 上插入和删除第一个元素, 并且队列_queue保证第一个元素拥有最小优先级(1.4节已经讨论过这个问题)。 heappop() 函数总是返回”最小的”的元素,这就是保证队列pop操作返回正确元素的关键。 另外,由于push和pop操作时间复杂度为O(log N),其中N是堆的大小,因此就算是N很大的时候它们运行速度也依旧很快。

在上面代码中,队列包含了一个 (-priority, index, item) 的元组。 优先级为负数的目的是使得元素按照优先级从高到低排序。 这个跟普通的按优先级从低到高排序的堆排序恰巧相反。

index 变量的作用是保证同等优先级元素的正确排序。 通过保存一个不断增加的 index 下标变量,可以确保元素按照它们插入的顺序排序。 而且, index 变量也在相同优先级元素比较的时候起到重要作用。

为了阐明这些,先假定Item实例是不支持排序的:

>>> a = Item('foo')
>>> b = Item('bar')
>>> a < b
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
TypeError: unorderable types: Item() < Item()
>>>

如果你使用元组 (priority, item) ,只要两个元素的优先级不同就能比较。 但是如果两个元素优先级一样的话,那么比较操作就会跟之前一样出错:

>>> a = (1, Item('foo'))
>>> b = (5, Item('bar'))
>>> a < b
True
>>> c = (1, Item('grok'))
>>> a < c
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
TypeError: unorderable types: Item() < Item()
>>>

通过引入另外的 index 变量组成三元组 (priority, index, item) ,就能很好的避免上面的错误, 因为不可能有两个元素有相同的 index 值。Python在做元组比较时候,如果前面的比较以及可以确定结果了, 后面的比较操作就不会发生了:

>>> a = (1, 0, Item('foo'))
>>> b = (5, 1, Item('bar'))
>>> c = (1, 2, Item('grok'))
>>> a < b
True
>>> a < c
True
>>>

如果你想在多个线程中使用同一个队列,那么你需要增加适当的锁和信号量机制。 可以查看12.3小节的例子演示是怎样做的。

深入思考
函数 heapq.heappush() 和 heapq.heappop() 分别在队列 _queue 上插入和删除第一个元素, 并且队列_queue保证第一个元素拥有最小优先级(1.4节已经讨论过这个问题)。 heappop() 函数总是返回”最小的”的元素,这就是保证队列pop操作返回正确元素的关键。 另外,由于push和pop操作时间复杂度为O(log N),其中N是堆的大小,因此就算是N很大的时候它们运行速度也依旧很快。

在上面代码中,队列包含了一个 (-priority, index, item) 的元组。 优先级为负数的目的是使得元素按照优先级从高到低排序。 这个跟普通的按优先级从低到高排序的堆排序恰巧相反。

index 变量的作用是保证同等优先级元素的正确排序。 通过保存一个不断增加的 index 下标变量,可以确保元素按照它们插入的顺序排序。 而且, index 变量也在相同优先级元素比较的时候起到重要作用。

为了阐明这些,先假定Item实例是不支持排序的:

>>> a = Item('foo')
>>> b = Item('bar')
>>> a < b
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
TypeError: unorderable types: Item() < Item()
>>>

如果你使用元组 (priority, item) ,只要两个元素的优先级不同就能比较。 但是如果两个元素优先级一样的话,那么比较操作就会跟之前一样出错:

>>> a = (1, Item('foo'))
>>> b = (5, Item('bar'))
>>> a < b
True
>>> c = (1, Item('grok'))
>>> a < c
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
TypeError: unorderable types: Item() < Item()
>>>

通过引入另外的 index 变量组成三元组 (priority, index, item) ,就能很好的避免上面的错误, 因为不可能有两个元素有相同的 index 值。Python在做元组比较时候,如果前面的比较以及可以确定结果了, 后面的比较操作就不会发生了:

>>> a = (1, 0, Item('foo'))
>>> b = (5, 1, Item('bar'))
>>> c = (1, 2, Item('grok'))
>>> a < b
True
>>> a < c
True
>>>

如果你想在多个线程中使用同一个队列,那么你需要增加适当的锁和信号量机制。 可以查看12.3小节的例子演示是怎样做的。

heapq 模块的官方文档有更详细的例子程序以及对于堆理论及其实现的详细说明。

Python 相关文章推荐
解决python字典对值(值为列表)赋值出现重复的问题
Jan 20 Python
python读csv文件时指定行为表头或无表头的方法
Jun 26 Python
Python封装成可带参数的EXE安装包实例
Aug 24 Python
python rsync服务器之间文件夹同步脚本
Aug 29 Python
python实现输入任意一个大写字母生成金字塔的示例
Oct 27 Python
pytorch 状态字典:state_dict使用详解
Jan 17 Python
python爬虫模块URL管理器模块用法解析
Feb 03 Python
python 一维二维插值实例
Apr 22 Python
Django ORM filter() 的运用详解
May 14 Python
浅析Python 条件控制语句
Jul 15 Python
python爬取”顶点小说网“《纯阳剑尊》的示例代码
Oct 16 Python
pycharm 复制代码出现空格的解决方式
Jan 15 Python
KMP算法精解及其Python版的代码示例
Jun 01 #Python
Python缩进和冒号详解
Jun 01 #Python
Python注释详解
Jun 01 #Python
深入理解python try异常处理机制
Jun 01 #Python
python学习 流程控制语句详解
Jun 01 #Python
python+Django+apache的配置方法详解
Jun 01 #Python
python中函数默认值使用注意点详解
Jun 01 #Python
You might like
【星际争霸1】人族1v7家ZBath
2020/03/04 星际争霸
PHP网站基础优化方法小结
2008/09/29 PHP
Symfony2学习笔记之模板用法详解
2016/03/17 PHP
PHP面向对象五大原则之依赖倒置原则(DIP)详解
2018/04/08 PHP
JavaScript 变量命名规则
2009/09/23 Javascript
十个优秀的Ajax/Javascript实例网站收集
2010/03/31 Javascript
jQuery提交多个表单的小例子
2013/06/30 Javascript
jQuery+css3动画属性制作猎豹浏览器宽屏banner焦点图
2015/03/16 Javascript
javascript删除数组重复元素的方法汇总
2015/06/24 Javascript
详解javascript实现自定义事件
2016/01/19 Javascript
基于AngularJS+HTML+Groovy实现登录功能
2016/02/17 Javascript
JS组件Bootstrap实现下拉菜单效果代码
2016/04/26 Javascript
基于jquery插件编写countdown计时器
2016/06/12 Javascript
JQueryEasyUI之DataGrid数据显示
2016/11/23 Javascript
微信小程序-拍照或选择图片并上传文件
2017/01/06 Javascript
JS在浏览器中解析Base64编码图像
2017/02/09 Javascript
微信小程序 监听手势滑动切换页面实例详解
2017/06/15 Javascript
详解原生js实现offset方法
2017/06/15 Javascript
利用Node.js了解与测量HTTP所花费的时间详解
2017/09/22 Javascript
js判断传入时间和当前时间大小实例(超简单)
2018/01/11 Javascript
JS正则表达式封装与使用操作示例
2019/05/15 Javascript
Python入门学习指南分享
2018/04/11 Python
python实现函数极小值
2019/07/10 Python
python使用turtle库绘制奥运五环
2020/02/24 Python
Python实现JS解密并爬取某音漫客网站
2020/10/23 Python
翻新二手苹果产品的网络领导者:Mac of all Trades
2017/12/19 全球购物
国际领先的在线时尚服装和配饰店:DressLily
2019/03/03 全球购物
个人求职简历中英文自我评价
2013/12/16 职场文书
学校火灾防控方案
2014/06/09 职场文书
家长会欢迎词
2015/01/23 职场文书
2015年植树节活动总结
2015/02/06 职场文书
中学教师师德师风承诺书
2015/04/28 职场文书
劳动仲裁撤诉申请书
2015/05/18 职场文书
2015年英语教师工作总结
2015/05/20 职场文书
Rhit高效可视化Nginx日志查看工具
2021/11/01 Servers
海贼王十大逆天果实 魂魂果实上榜,岩浆果实攻击力最强
2022/03/18 日漫