利用Fn.py库在Python中进行函数式编程


Posted in Python onApril 22, 2015

尽管Python事实上并不是一门纯函数式编程语言,但它本身是一门多范型语言,并给了你足够的自由利用函数式编程的便利。函数式风格有着各种理论与实际上的好处(你可以在Python的文档中找到这个列表):

  •     形式上可证
  •     模块性
  •     组合性
  •     易于调试及测试

虽然这份列表已经描述得够清楚了,但我还是很喜欢Michael O.Church在他的文章“函数式程序极少腐坏(Functional programs rarely rot)”中对函数式编程的优点所作的描述。我在PyCon UA 2012期间的讲座“Functional Programming with Python”中谈论了在Python中使用函数式方式的内容。我也提到,在你尝试在Python中编写可读同时又可维护的函数式代码时,你会很快发现诸多问题。

fn.py类库就是为了应对这些问题而诞生的。尽管它不可能解决所有问题,但对于希望从函数式编程方式中获取最大价值的开发者而言,它是一块“电池”,即使是在命令式方式占主导地位的程序中,也能够发挥作用。那么,它里面都有些什么呢?
Scala风格的Lambda定义

在Python中创建Lambda函数的语法非常冗长,来比较一下:

Python

map(lambda x: x*2, [1,2,3])

Scala

List(1,2,3).map(_*2)

Clojure

(map #(* % 2) '(1 2 3))

Haskell

map (2*) [1,2,3]

受Scala的启发,Fn.py提供了一个特别的_对象以简化Lambda语法。

from fn import _

assert (_ + _)(10, 5) = 15
assert list(map(_ * 2, range(5))) == [0,2,4,6,8]
assert list(filter(_ < 10, [9,10,11])) == [9]

除此之外还有许多场景可以使用_:所有的算术操作、属性解析、方法调用及分片算法。如果你不确定你的函数具体会做些什么,你可以将结果打印出来:

from fn import _ 

print (_ + 2) # "(x1) => (x1 + 2)" 
print (_ + _ * _) # "(x1, x2, x3) => (x1 + (x2 * x3))"

流(Stream)及无限序列的声明

Scala风格的惰性求值(Lazy-evaluated)流。其基本思路是:对每个新元素“按需”取值,并在所创建的全部迭代中共享计算出的元素值。Stream对象支持<<操作符,代表在需要时将新元素推入其中。

惰性求值流对无限序列的处理是一个强大的抽象。我们来看看在函数式编程语言中如何计算一个斐波那契序列。

Haskell

fibs = 0 : 1 : zipWith (+) fibs (tail fibs)

Clojure

(def fib (lazy-cat [0 1] (map + fib (rest fib))))

Scala

def fibs: Stream[Int] = 

     0 #:: 1 #:: fibs.zip(fibs.tail).map{case (a,b) => a + b}

现在你可以在Python中使用同样的方式了:

from fn import Stream 
from fn.iters import take, drop, map
from operator import add

f = Stream()
fib = f << [0, 1] << map(add, f, drop(1, f))

assert list(take(10, fib)) == [0,1,1,2,3,5,8,13,21,34]
assert fib[20] == 6765
assert list(fib[30:35]) == [832040,1346269,2178309,3524578,5702887]

蹦床(Trampolines)修饰符

fn.recur.tco是一个不需要大量栈空间分配就可以处理TCO的临时方案。让我们先从一个递归阶乘计算示例开始:

def fact(n):
   if n == 0: return 1
   return n * fact(n-1)

这种方式也能工作,但实现非常糟糕。为什么呢?因为它会递归式地保存之前的计算值以算出最终结果,因此消耗了大量的存储空间。如果你对一个很大的n值(超过了sys.getrecursionlimit()的值)执行这个函数,CPython就会以此方式失败中止:

>>> import sys
>>> fact(sys.getrecursionlimit() * 2)
... many many lines of stacktrace ...
RuntimeError: maximum recursion depth exceeded

这也是件好事,至少它避免了在你的代码中产生严重错误。

我们如何优化这个方案呢?答案很简单,只需改变函数以使用尾递归即可:

def fact(n, acc=1):
   if n == 0: return acc
   return fact(n-1, acc*n)

为什么这种方式更佳呢?因为你不需要保留之前的值以计算出最终结果。可以在Wikipedia上查看更多尾递归调用优化的内容。可是……Python的解释器会用和之前函数相同的方式执行这段函数,结果是你没得到任何优化。

fn.recur.tco为你提供了一种机制,使你可以使用“蹦床”方式获得一定的尾递归优化。同样的方式也使用在诸如Clojure语言中,主要思路是将函数调用序列转换为while循环。

from fn import recur

@recur.tco 
def fact(n, acc=1):
   if n == 0: return False, acc
   return True, (n-1, acc*n)

@recur.tco是一个修饰符,能将你的函数执行转为while循环并检验其输出内容:

  •     (False, result)代表运行完毕
  •     (True, args, kwargs)代表我们要继续调用函数并传递不同的参数
  •     (func, args, kwargs)代表在while循环中切换要执行的函数

函数式风格的错误处理

假设你有一个Request类,可以按照传入其中的参数名称得到对应的值。要想让其返回值格式为全大写、非空并且去除头尾空格的字符串,你需要这样写:

class Request(dict):
   def parameter(self, name):
     return self.get(name, None)

r = Request(testing="Fixed", empty=" ")
param = r.parameter("testing")
if param is None:
   fixed = ""
else:   
   param = param.strip()
   if len(param) == 0:
     fixed = ""
   else:
    fixed = param.upper()

额,看上去有些古怪。用fn.monad.Option来修改你的代码吧,它代表了可选值,每个Option实例可代表一个Full或者Empty(这点也受到了Scala中Option的启发)。它为你编写长运算序列提供了简便的方法,并且去掉除了许多if/else语句块。

from operator import methodcaller
from fn.monad import optionable

class Request(dict):
   @optionable
   def parameter(self, name):
     return self.get(name, None)

r = Request(testing="Fixed", empty=" ")
fixed = r.parameter("testing") 
     .map(methodcaller("strip")) 
     .filter(len) 
     .map(methodcaller("upper")) 
     .get_or("")

fn.monad.Option.or_call是个便利的方法,它允许你进行多次调用尝试以完成计算。例如,你有一个Request类,它有type,mimetype和url等几个可选属性,你需要使用最少一个属性值以分析它的“request类型”:

from fn.monad import Option 

request = dict(url="face.png", mimetype="PNG") 
tp = Option \ 
     .from_value(request.get("type", None)) \ # check "type" key first 
     .or_call(from_mimetype, request) \ # or.. check "mimetype" key 
     .or_call(from_extension, request) \ # or... get "url" and check extension 
     .get_or("application/undefined")

其余事项?

我仅仅描述了类库的一小部分,你还能够找到并使用以下功能:

  •     22个附加的itertools代码段,以扩展内置module的功能的附加功能
  •     将Python 2和Python 3的迭代器(iterator)(如range,map及filtter等等)使用进行了统一,这对使用跨版本的类库时非常有用
  •     为函数式组合及partial函数应用提供了简便的语法
  •     为使用高阶函数(apply,flip等等)提供了附加的操作符

正在进行中的工作

自从在Github上发布这个类库以来,我从社区中收到了许多审校观点、意见和建议,以及补丁和修复。我也在继续增强现有功能,并提供新的特性。近期的路线图包括以下内容:

  •     为使用可迭代对象(iterable),如foldl,foldr增加更多操作符
  •     更多的monad,如fn.monad.Either,以处理错误记录
  •     为大多数module提供C-accelerator
  •     为简化lambda arg1: lambda arg2:…形式而提供的curry函数的生成器
  •     更多文档,更多测试,更多示例代码
Python 相关文章推荐
在Python中调用ggplot的三种方法
Apr 08 Python
Python实现的数据结构与算法之链表详解
Apr 22 Python
python字符串编码识别模块chardet简单应用
Jun 15 Python
Python3中使用urllib的方法详解(header,代理,超时,认证,异常处理)
Sep 21 Python
python与sqlite3实现解密chrome cookie实例代码
Jan 20 Python
详谈Numpy中数组重塑、合并与拆分方法
Apr 17 Python
Python检测网络延迟的代码
May 15 Python
python3.x实现base64加密和解密
Mar 28 Python
浅谈python的输入输出,注释,基本数据类型
Apr 02 Python
python中几种自动微分库解析
Aug 29 Python
python3 中时间戳、时间、日期的转换和加减操作
Jul 14 Python
Python基于Opencv识别两张相似图片
Apr 25 Python
Python实现的数据结构与算法之基本搜索详解
Apr 22 #Python
Python实现的数据结构与算法之链表详解
Apr 22 #Python
Python实现的数据结构与算法之双端队列详解
Apr 22 #Python
Python实现的数据结构与算法之队列详解
Apr 22 #Python
详尽讲述用Python的Django框架测试驱动开发的教程
Apr 22 #Python
Hadoop中的Python框架的使用指南
Apr 22 #Python
Python实现提取文章摘要的方法
Apr 21 #Python
You might like
PHP header()函数常用方法总结
2014/04/11 PHP
php连接与操作PostgreSQL数据库的方法
2014/12/25 PHP
php使用ob_flush不能每隔一秒输出原理分析
2015/06/02 PHP
PHP7新特性foreach 修改示例介绍
2016/08/26 PHP
ThinkPHP框架获取最后一次执行SQL语句及变量调试简单操作示例
2018/06/13 PHP
Laravel实现ORM带条件搜索分页
2019/10/24 PHP
js+CSS 图片等比缩小并垂直居中实现代码
2008/12/01 Javascript
输入框过滤非数字的js代码
2014/09/18 Javascript
jQuery的css()方法用法实例
2014/12/24 Javascript
JS实现漂亮的淡蓝色滑动门效果代码
2015/09/23 Javascript
js简单网速测试方法完整实例
2015/12/15 Javascript
jQuery实现模仿微博下拉滚动条加载数据效果
2015/12/25 Javascript
jQuery实现百叶窗焦点图动画效果代码分享(附源码下载)
2016/03/14 Javascript
vue组件发布到npm简单步骤
2017/11/30 Javascript
JavaScript 日期时间选择器一些小结
2018/04/02 Javascript
详解适配器在JavaScript中的体现
2018/09/28 Javascript
nodejs npm错误Error:UNKNOWN:unknown error,mkdir 'D:\Develop\nodejs\node_global'at Error
2019/03/02 NodeJs
angular 实现下拉列表组件的示例代码
2019/03/09 Javascript
教你使用vue-cli快速构建的小说阅读器
2019/05/13 Javascript
JavaScript函数式编程(Functional Programming)组合函数(Composition)用法分析
2019/05/22 Javascript
bootstrap实现嵌套模态框的实例代码
2020/01/10 Javascript
原生js 实现表单验证功能
2021/02/08 Javascript
用Python的Flask框架结合MySQL写一个内存监控程序
2015/11/07 Python
简单谈谈python中的多进程
2016/11/06 Python
Python-Tkinter Text输入内容在界面显示的实例
2019/07/12 Python
Python使用指定端口进行http请求的例子
2019/07/25 Python
tensorflow获取预训练模型某层参数并赋值到当前网络指定层方式
2020/01/24 Python
html5记忆翻牌游戏实现思路及代码
2013/07/25 HTML / CSS
酒店保洁主管岗位职责
2013/11/28 职场文书
项目考察欢迎辞
2014/01/17 职场文书
《白鹅》教学反思
2014/04/13 职场文书
《菜园里》教学反思
2014/04/17 职场文书
企业法人代表任命书
2014/06/06 职场文书
应届毕业生求职信范文
2014/07/07 职场文书
优秀共产党员推荐材料
2014/12/18 职场文书
thinkphp 获取控制器及控制器方法
2021/04/16 PHP