python中的reduce内建函数使用方法指南


Posted in Python onAugust 31, 2014

官方解释:

Apply function of two arguments cumulatively to the items of iterable, from left to right, so as to reduce the iterable to a single value. For example, reduce(lambda x, y: x+y, [1, 2, 3, 4, 5]) calculates ((((1+2)+3)+4)+5). The left argument, x, is the accumulated value and the right argument, y, is the update value from the iterable. If the optional initializer is present, it is placed before the items of the iterable in the calculation, and serves as a default when the iterable is empty. If initializer is not given and iterable contains only one item, the first item is returned. Roughly equivalent to:

意思就是说:将一个可迭代的对象应用到一个带有两个参数的方法上,我们称之为appFun,遍历这个可迭代对象,将其中的元素依次作为appFun的参数,但这个函数有两个参数,作为哪个参数呢?有这样的规则,看一下下面reduce方法的实现,有三个参数,第一个参数就是上面说的appFun,第二个参数就是那个可迭代的对象,而第三个呢?当调用reduce方法的时候给出了initializer这个参数,那么第一次调用appFun的时候这个参数值就作为第一个参数,而可迭代对象的元素依次作为appFun的第二个参数;如果调用reduce的时候没有给出initializer这个参数,那么第一次调用appFun的时候,可迭代对象的第一个元素就作为appFun的第一个元素,而可迭代器的从第二个元素到最后依次作为appFun的第二个参数,除第一次调用之外,appFun的第一个参数就是appFun的返回值了。例如reduce(lambda x, y: x+y, [1, 2, 3, 4, 5]),计算1到5的和,因为没有给定initializer参数,所以第一次调用x+y时,x=1,即列表的第一个元素,y=2,即列表的第二个元素,之后返回的1+2的结果作为第二次调用x+y中的x,即上一次的结果,y=2,即第二个元素,依次类推,知道得到1+2+3+4+5的结果。

这样看来,其实下面的代码定义是有一点问题,我们在程序中调用这段代码reduce(lambda x, y: x+y, [1, 2, 3, 4, 5]),得到的结果为16,而正确的结果为15,问题在于如果集合不是以0开始,那么按照如下代码,第一次调用x=1,即第一个元素,y也是等于1,也是第一个元素,而正确的y应该是2。所以真正的reduce方法应该和下面的例子是有差别的。

def reduce(function, iterable, initializer=None): 
  it = iter(iterable) 
  if initializer is None: 
    try: 
      initializer = next(it) 
    except StopIteration: 
      raise TypeError('reduce() of empty sequence with no initial value') 
  accum_value = initializer 
  for x in iterable: 
    accum_value = function(accum_value, x) 
  return accum_value

那么reduce函数能做什么,什么情况下要用reduce呢,看下面的例子:

例如上面的例子,实现一个整形集合的累加。假设lst = [1,2,3,4,5],实现累加的方式有很多:

第一种:用sum函数

sum(lst)

 
第二种:循环方式。

def customer_sum(lst): 
  result = 0 
  for x in lst: 
    result+=x 
  return result 
 
#或者 
def customer_sum(lst): 
  result = 0 
  while lst: 
      temp = lst.pop(0) 
      result+=temp 
  return result 
 
if __name__=="__main__": 
  lst = [1,2,3,4,5] 
  print customer_sum(lst)

第三种:递推求和

def add(lst,result): 
  if lst: 
    temp = lst.pop(0) 
    temp+=result 
    return add(lst,temp) 
  else: 
    return result 
 
if __name__=="__main__": 
  lst = [1,2,3,4,5] 
  print add(lst,0)

第四种:reduce方式

lst = [1,2,3,4,5] 
print reduce(lambda x,y:x+y,lst) 
#这种方式用lambda表示当做参数,因为没有提供reduce的第三个参数,所以第一次执行时x=1,y=2,第二次x=1+2,y=3,即列表的第三个元素 
 
 
#或者 
lst = [1,2,3,4,5] 
print reduce(lambda x,y:x+y,lst,0) 
#这种方式用lambda表示当做参数,因为指定了reduce的第三个参数为0,所以第一次执行时x=0,y=1,第二次x=0+1,y=2,即列表的第二个元素, 
假定指定reduce的第三个参数为100,那么第一次执行x=100,y仍然是遍历列表的元素,最后得到的结果为115 
 
 
 
#或者 
def add(x,y): 
  return x+y 
 
print reduce(add, lst) 
#与方式1相同,只不过把lambda表达式换成了自定义函数 
 
#或者 
def add(x,y): 
  return x+y 
 
print reduce(add, lst,0) 
#与方式2相同,只不过把lambda表达式换成了自定义函数

 
再举一个例子:有一个序列集合,例如[1,1,2,3,2,3,3,5,6,7,7,6,5,5,5],统计这个集合所有键的重复个数,例如1出现了两次,2出现了两次等。大致的思路就是用字典存储,元素就是字典的key,出现的次数就是字典的value。方法依然很多

第一种:for循环判断

def statistics(lst): 
  dic = {} 
  for k in lst: 
    if not k in dic: 
      dic[k] = 1 
    else: 
      dic[k] +=1 
  return dic 
 
lst = [1,1,2,3,2,3,3,5,6,7,7,6,5,5,5] 
print(statistics(lst))

第二种:比较取巧的,先把列表用set方式去重,然后用列表的count方法

def statistics2(lst): 
  m = set(lst) 
  dic = {} 
  for x in m: 
    dic[x] = lst.count(x) 
 
  return dic 
 
lst = [1,1,2,3,2,3,3,5,6,7,7,6,5,5,5] 
print statistics2(lst)

第三种:用reduce方式

def statistics(dic,k): 
  if not k in dic: 
    dic[k] = 1 
  else: 
    dic[k] +=1 
  return dic 
 
lst = [1,1,2,3,2,3,3,5,6,7,7,6,5,5,5] 
print reduce(statistics,lst,{})  
#提供第三个参数,第一次,初始字典为空,作为statistics的第一个参数,然后遍历lst,作为第二个参数,然后将返回的字典集合作为下一次的第一个参数 
 
或者 
d = {} 
d.extend(lst) 
print reduce(statistics,d) 
#不提供第三个参数,但是要在保证集合的第一个元素是一个字典对象,作为statistics的第一个参数,遍历集合依次作为第二个参数

通过上面的例子发现,凡是要对一个集合进行操作的,并且要有一个统计结果的,能够用循环或者递归方式解决的问题,一般情况下都可以用reduce方式实现。

reduce函数真是“一位好同志啊”!

Python 相关文章推荐
Python 调用VC++的动态链接库(DLL)
Sep 06 Python
将Django使用的数据库从MySQL迁移到PostgreSQL的教程
Apr 11 Python
python模拟enum枚举类型的方法小结
Apr 30 Python
使用Python脚本来获取Cisco设备信息的示例
May 04 Python
在Python中使用成员运算符的示例
May 13 Python
python 读写txt文件 json文件的实现方法
Oct 22 Python
Pytorch入门之mnist分类实例
Apr 14 Python
Python中新式类与经典类的区别详析
Jul 10 Python
Python随机数函数代码实例解析
Feb 09 Python
django 链接多个数据库 并使用原生sql实现
Mar 28 Python
Python利用for循环打印星号三角形的案例
Apr 12 Python
Python字典dict常用方法函数实例
Nov 09 Python
Python中使用ConfigParser解析ini配置文件实例
Aug 30 #Python
python进阶教程之动态类型详解
Aug 30 #Python
python进阶教程之异常处理
Aug 30 #Python
python进阶教程之函数对象(函数也是对象)
Aug 30 #Python
python进阶教程之循环对象
Aug 30 #Python
python进阶教程之循环相关函数range、enumerate、zip
Aug 30 #Python
python进阶教程之函数参数的多种传递方法
Aug 30 #Python
You might like
php explode函数实例代码
2012/02/27 PHP
Symfony2函数用法实例分析
2016/03/18 PHP
PHP编程计算两个时间段是否有交集的实现方法(不算边界重叠)
2017/05/30 PHP
PHP简单实现正则匹配省市区的方法
2018/04/13 PHP
PHP判断函数是否被定义的方法
2019/06/21 PHP
可输入的下拉框
2006/06/19 Javascript
AutoSave/自动存储功能实现
2007/03/24 Javascript
jQuery获取复选框被选中数量及判断选择值的方法详解
2016/05/25 Javascript
Bootstrap和Angularjs配合自制弹框的实例代码
2016/08/24 Javascript
自制微信公众号一键排版工具
2016/09/22 Javascript
JS实现图片上传预览功能
2016/11/21 Javascript
微信小程序  http请求封装详解及实例代码
2017/02/15 Javascript
vue.js项目中实用的小技巧汇总
2017/11/29 Javascript
[01:34]完美“圣”典宣传片震撼发布,12.17与你不见不散
2016/12/16 DOTA
Python利用递归和walk()遍历目录文件的方法示例
2017/07/14 Python
解决Pycharm 包已经下载,但是运行代码提示找不到模块的问题
2019/08/31 Python
Python 网络编程之UDP发送接收数据功能示例【基于socket套接字】
2019/10/11 Python
YUV转为jpg图像的实现
2019/12/09 Python
Numpy 多维数据数组的实现
2020/06/18 Python
Python常用断言函数实例汇总
2020/11/30 Python
python中字符串的编码与解码详析
2020/12/03 Python
CSS3轻松实现清新 Loading 效果的简单实例
2016/06/06 HTML / CSS
HTML5 拖放功能实现代码
2016/07/14 HTML / CSS
英国的一家创新礼品和小工具零售商:Menkind
2019/08/24 全球购物
商得四方公司面试题(gid+)
2014/04/30 面试题
Java中各种基本数据类型的默认值都是什么
2016/12/22 面试题
介绍一下Ruby的多线程处理
2013/02/01 面试题
岗位职责定义及内容
2013/11/08 职场文书
文明寝室申报材料
2014/05/12 职场文书
2014大学生职业生涯规划书最新范文
2014/09/13 职场文书
2014党员整改措施思想汇报
2014/10/07 职场文书
热血教师观后感
2015/06/10 职场文书
2016暑期师德培训心得体会
2016/01/09 职场文书
详解python中[-1]、[:-1]、[::-1]、[n::-1]使用方法
2021/04/25 Python
python3.9之你应该知道的新特性详解
2021/04/29 Python
教你使用pyinstaller打包Python教程
2021/05/27 Python