Python中的Cookie模块如何使用


Posted in Python onJune 04, 2020

Cookie 模块,顾名思义,就是用来操作Cookie的模块。

Cookie这块小蛋糕,玩过Web的人都知道,它是Server与Client保持会话时用到的信息 切片。 Http协议本身是无状态的,也就是说,同一个客户端发送的两次请求,对于Web服务器来说,没有直接的关系。既然这样,有人会问,既然Http是无状态 的, 为什么有些网页,只有输入了用户名与密码通过验证之后才可以访问?

那是因为:对于通过身份验证的用户,Server会偷偷的在发往Client的数据中添 加 Cookie,Cookie中一般保存一个标识该Client的唯一的ID,Client在接下来对服务器的请求中,会将该ID以Cookie的形式一并 发往Server,Server从回传回来的Cookie中提取ID并与相应的用户绑定起来,从而实现身份验证。说白了,Cookie就是一个在服务器与客户端之间相互传递的字符串(下图通过FireFox的FireBug插件查看访问google.com时的Cookie)。

Cooke模块中定义了4个直接操作Cookie的类:BaseCookie、SimpleCookie、SerialCookie、 SmartCookie。其中,BaseCookie是基类,定义了操作Cookie的公共部分,其他3个类都继承自BaseCookie,它们之间的区 别仅仅在于序列化数据的方式不同。下面简单讲解这些类的使用。

BaseCookie基类: BaseCookies的行为非常像dict,可以用键/值对的形式来操作它,但是kye必须是字符串,value是Morsel对象 (下面会讲到Morsel)。BaseCookies定义了编码/解码,输入/输出操作的公共规范:

  • BaseCookie.value_encode(val):对数据进行序列化/反序列化。这些方法都返回字符串,以便通过Http传输。
  • BaseCookie.output():返回字符串,该字符串可以作为Http响应头发往客户端。
  • BaseCookie.js_output():返回嵌入js脚本的字符串,浏览器通过执行该脚本,就可以得到cooke数据。
  • BaseCookie.load(newdata):解析字符串为Cookie数据。

SimpleCookie、SerialCookie、SmartCookie都继承自BaseCookie,具有一致的行为,它们各自对 BaseCookie的value_decode, value_encode进行了重写并实现自己的序列化/反序列化策略,其中:

SimpleCookie内部使用str()来对数据进行序列化;

SerialCookie则通过pickle模块来序列化反序列化数据;

SmartCookie相对聪明点,对于非字符串数据,使用pickle序列/反序列化,否则将字符串原样返回。

下面的例子简单的说明如何使用Cookie模块:

import Cookie
c = Cookie.SimpleCookie()
c['name'] = 'DarkBull'
c['address'] = 'ChinaHangZhou'
c['address']['path'] = '/'
# 路径
c['address']['domain'] = 'appspot.com'
# domain
c['address']['expires'] = 'Fir, 01-Oct-2010 20:00:00 GMT' 
# 过期时间
print c.output()
print c.js_output()
# 输出结果,与上图对照
# Set-Cookie: address=ChinaHangZhou; Domain=appspot.com; expires=Fir, 01-Oct-2010 20:00:00 GMT; Path=/
# Set-Cookie: name=DarkBull
# 作为脚本输出
# <script type="text/javascript">
# document.cookie = "address=ChinaHangZhou; Domain=appspot.com; expires=Fir, 01-Oct-2010 20:00:00 GMT; Path=/";
# </script>
# <script type="text/javascript">
# document.cookie = "name=DarkBull";
# </script>

Morsel类 : 用于表示Cookie中每一项数据的属性而抽象的类。这些属性包括:expires, path, comment, domain, max-age, secure, version等等(看上图下划线标注部分)。如果你玩过web,对这些应该不会陌生,可以在RCF2109中找到他们的具体定义

Morsel.key,Morsel.value:Cookie数据项的key/value(value可以是二进制数据);

Morsel.coded_value:数据编码后得到的字符串。Http协议是基于文本的协议,Server无法直接向Client发送二进制数据,只有序列化成字符串后,才能发往Client;

Morsel.set(key, value, coded_value):设置Cookie数据项的key、value、coded_value;

Morsel.isReversvedKey(key):如果key是expires, path, comment, domain, max-age, secure, version, httponly中的一个,返回True,否则返回False;

Morsel.output():返回型如“Set-Cookie: …”的字符串,表示一个Cookie数据项;

Morsel.js_output():返回Cookie数据项的脚本字符串;

Morsel.OutputString(): 返回Morsel的字符串表示;

Morsel使用示例:

import Cookie
m = Cookie.Morsel()
m.set('name', 'DarkBull', 'DarkBull')
m['expires'] = 'Fir, 01-Oct-2010 20:00:00 GMT'
m['domain'] = 'appspot.com'
print m.output()
# 结果
# Set-Cookie: name=DarkBull; Domain=appspot.com; expires=Fir, 01-Oct-2010 20:00:00

知识点扩展:

为什么要使用Cookie呢?

Cookie,指某些网站为了辨别用户身份、进行session跟踪而储存在用户本地终端上的数据(通常经过加密)

比如说有些网站需要登录后才能访问某个页面,在登录之前,你想抓取某个页面内容是不允许的。那么我们可以利用Urllib2库保存我们登录的Cookie,然后再抓取其他页面就达到目的了。

以上就是Python中的Cookie模块如何使用的详细内容,更多关于Python中的Cookie模块用法的资料请关注三水点靠木其它相关文章!

Python 相关文章推荐
django自定义Field实现一个字段存储以逗号分隔的字符串
Apr 27 Python
python实现树形打印目录结构
Mar 29 Python
Python使用Dijkstra算法实现求解图中最短路径距离问题详解
May 16 Python
Python Numpy:找到list中的np.nan值方法
Oct 30 Python
使用Flask-Cache缓存实现给Flask提速的方法详解
Jun 11 Python
python爬虫爬取幽默笑话网站
Oct 24 Python
pytorch中交叉熵损失(nn.CrossEntropyLoss())的计算过程详解
Jan 02 Python
Python基于class()实现面向对象原理详解
Mar 26 Python
pycharm远程连接vagrant虚拟机中mariadb数据库
Jun 05 Python
Scrapy基于scrapy_redis实现分布式爬虫部署的示例
Sep 29 Python
pytorch 带batch的tensor类型图像显示操作
May 20 Python
分享Python异步爬取知乎热榜
Apr 12 Python
Python爬虫获取页面所有URL链接过程详解
Jun 04 #Python
Python中的全局变量如何理解
Jun 04 #Python
使用OpenCV获取图片连通域数量,并用不同颜色标记函
Jun 04 #Python
Python urllib2运行过程原理解析
Jun 04 #Python
Python如何生成xml文件
Jun 04 #Python
基于python代码批量处理图片resize
Jun 04 #Python
Python脚本如何在bilibili中查找弹幕发送者
Jun 04 #Python
You might like
基于asp+ajax和数据库驱动的二级联动菜单
2010/05/06 PHP
PHP实现无限级分类(不使用递归)
2015/10/22 PHP
php用正则判断是否为数字的方法
2016/03/25 PHP
JavaScript实现禁止后退的方法
2006/12/27 Javascript
Jquery AJAX 用于计算点击率(统计)
2010/06/30 Javascript
javascript基础之查找元素的详细介绍(访问节点)
2013/07/05 Javascript
使用JS读秒使用示例
2013/09/21 Javascript
jQuery获取和设置表单元素的方法
2014/02/14 Javascript
究竟什么是Node.js?Node.js有什么好处?
2015/05/29 Javascript
jquery实现简单的自动播放幻灯片效果
2015/06/13 Javascript
基于jQuery日历插件制作日历
2016/03/11 Javascript
jQuery1.9+中删除了live以后的替代方法
2016/06/17 Javascript
使用jQuery的toggle()方法对HTML标签进行显示、隐藏的方法(示例)
2016/09/01 Javascript
jQuery中$原理实例分析
2018/08/13 jQuery
JS/HTML5游戏常用算法之碰撞检测 包围盒检测算法详解【圆形情况】
2018/12/13 Javascript
微信打开网址添加在浏览器中打开提示的办法
2019/05/20 Javascript
微信小程序如何实现全局重新加载
2019/06/05 Javascript
TypeScript之调用栈的实现
2019/12/31 Javascript
Vue前端判断数据对象是否为空的实例
2020/09/02 Javascript
[01:05:40]VG vs Newbee 2018国际邀请赛小组赛BO2 第二场 8.17
2018/08/20 DOTA
[01:42]DOTA2 – 虚无之灵
2019/08/25 DOTA
Python functools模块学习总结
2015/05/09 Python
Python中easy_install 和 pip 的安装及使用
2017/06/05 Python
Python实现mysql数据库更新表数据接口的功能
2017/11/19 Python
对Python 简单串口收发GUI界面的实例详解
2019/06/12 Python
使用pandas 将DataFrame转化成dict
2019/12/10 Python
pandas使用之宽表变窄表的实现
2020/04/12 Python
selenium与xpath之获取指定位置的元素的实现
2021/01/26 Python
详解CSS3的opacity属性设置透明效果的用法
2016/05/09 HTML / CSS
英国领先的票务代理商之一:The Ticket Factory
2019/02/09 全球购物
党的群众路线教育实践活动批评与自我批评
2014/02/16 职场文书
会议主持词
2014/03/17 职场文书
协会周年庆活动方案
2014/08/26 职场文书
学校党委副书记个人对照检查材料思想汇报
2014/09/28 职场文书
研究生毕业登记表的自我鉴定范文
2019/07/15 职场文书
如何在Python中创建二叉树
2021/03/30 Python