python通过cookie模拟已登录状态的初步研究


Posted in Python onNovember 09, 2016

对于那些需要在登录环境下进行的爬虫操作,模拟登陆或伪装已登录状态是一个刚需。

分析了网上关于模拟登录的例子,很多都基于用户名/密码发起一个post请求,遇到有图片验证码的,比较理想的方法是进行人工干预,同步发起一个图片验证码的请求,将图片写到本地,人工查看后进行输入。

既然,少不了人工干预,为何登录操作不全程人工进行,已登录后再把浏览器的Cookie信息全拷贝出来,通过爬虫伪造成一个已登录的浏览器呢? 我暂时试了试国内的几个大网站,发现都行得通,可以模拟浏览器进行登录之后的很多操作,包括签到,修改个人资料等。

下面贴上简单的代码实现:

python通过cookie模拟已登录状态的初步研究

后话:关于图片验证码,为什么没有必要去搞一个自动识别?

因为像下面这种简单的,你也许花上几天就可以搞定:

python通过cookie模拟已登录状态的初步研究 python通过cookie模拟已登录状态的初步研究

但是很多网站它的验证码会不断地变换策略,它变一次可能很快,但对你来说可能就得花上好几天去改代码,也许你还没改完,人家又变了,总之,玩不过你也可以玩死你。

当它想换下面的姿势给你点惊喜,如果你还没破解出它的上一套验证码时,你肯定会后悔大学选错了专业:

python通过cookie模拟已登录状态的初步研究

为了开发出自动抢票软件,360用了高精尖的团队,也好像不能百分百识别出下面反人类的验证码:

python通过cookie模拟已登录状态的初步研究

以上所述是小编给大家介绍的python通过cookie模拟已登录状态的初步研究,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对三水点靠木网站的支持!

Python 相关文章推荐
跟老齐学Python之玩转字符串(2)
Sep 14 Python
对Python的Django框架中的项目进行单元测试的方法
Apr 11 Python
详解Python中的静态方法与类成员方法
Feb 28 Python
python开发简易版在线音乐播放器
Mar 03 Python
Python运算符重载详解及实例代码
Mar 07 Python
Python基于ThreadingTCPServer创建多线程代理的方法示例
Jan 11 Python
Django中使用第三方登录的示例代码
Aug 20 Python
python 3调用百度OCR API实现剪贴板文字识别
Sep 04 Python
Appium+Python自动化测试之运行App程序示例
Jan 23 Python
python批量修改文件夹及其子文件夹下的文件内容
Mar 15 Python
Python将字符串常量转化为变量方法总结
Mar 17 Python
Python3 中作为一等对象的函数解析
Dec 11 Python
Python内置函数OCT详解
Nov 09 #Python
windows10系统中安装python3.x+scrapy教程
Nov 08 #Python
简单谈谈python中的多进程
Nov 06 #Python
python自带的http模块详解
Nov 06 #Python
Python程序中设置HTTP代理
Nov 06 #Python
Python 搭建Web站点之Web服务器网关接口
Nov 06 #Python
Python 搭建Web站点之Web服务器与Web框架
Nov 06 #Python
You might like
全国FM电台频率大全 - 4 山西省
2020/03/11 无线电
生成静态页面的PHP类
2006/07/15 PHP
fleaphp常用方法分页之Pager使用方法
2011/04/23 PHP
PHP开发不能违背的安全规则 过滤用户输入
2011/05/01 PHP
str_replace只替换一次字符串的方法
2013/04/09 PHP
解析PHP中$_FILES的使用以及注意事项
2013/07/05 PHP
PHP记录和读取JSON格式日志文件
2016/07/07 PHP
PHP递归统计系统中代码行数
2019/09/19 PHP
JS 实现完美include载入实现代码
2010/08/05 Javascript
javascript中encodeURI和decodeURI方法使用介绍
2013/05/06 Javascript
jQuery 的全选(全非选)即取得被选中的值使用介绍
2013/11/12 Javascript
IE与FireFox的JavaScript兼容问题解决办法
2013/12/31 Javascript
js统计录入文本框中字符的个数并加以限制不超过多少
2014/05/23 Javascript
jQuery中prevAll()方法用法实例
2015/01/08 Javascript
js实现点击图片改变页面背景图的方法
2015/02/28 Javascript
基于jQuery+Cookie实现的防止刷新的在线考试倒计时
2015/06/19 Javascript
jQuery的remove()方法使用详解
2015/08/11 Javascript
使用CoffeeScrip优美方式编写javascript代码
2015/10/28 Javascript
jquery将标签元素的高设为屏幕的百分比
2017/04/19 jQuery
详解vue-cli 本地开发mock数据使用方法
2018/05/29 Javascript
vue+axios+mock.js环境搭建的方法步骤
2018/08/28 Javascript
vue forEach循环数组拿到自己想要的数据方法
2018/09/21 Javascript
JavaScript中工厂函数与构造函数示例详解
2019/05/06 Javascript
JS实现音乐钢琴特效
2020/01/06 Javascript
[46:28]EG vs Liquid 2019国际邀请赛淘汰赛 败者组 BO3 第二场 8.23
2019/09/05 DOTA
Python中的ctime()方法使用教程
2015/05/22 Python
基于循环神经网络(RNN)的古诗生成器
2018/03/26 Python
python traceback捕获并打印异常的方法
2018/08/31 Python
Python 实现两个服务器之间文件的上传方法
2019/02/13 Python
python 爬虫 实现增量去重和定时爬取实例
2020/02/28 Python
国际知名军事风格休闲装品牌:Alpha Industries(阿尔法工业)
2017/05/24 全球购物
Tommy Hilfiger美国官网:美国高端休闲领导品牌
2019/01/14 全球购物
执行总经理岗位职责
2014/02/03 职场文书
2015年幼儿园班主任个人工作总结
2015/10/22 职场文书
奶茶店的创业计划书该怎么写?
2019/07/15 职场文书
php引用传递
2021/04/01 PHP