Python爬虫实现验证码登录代码实例


Posted in Python onMay 10, 2019

很多网站为了避免被恶意访问,需要设置验证码登录,避免非人类的访问,Python爬虫实现验证码登录的原理则是先到登录页面将生成的验证码保存下来,然后人为输入后,包装后再POST给服务器,实现验证,这里还涉及到了Cookie,其实Cookie保存在本地主机上,避免用户重复输入用户名和密码,在连接服务器的时候将访问连接和Cookie组装起来POST给服务器。

这里涉及到了两次向服务器POST,一次是Cookie,这里还自行设计想要Cookie的内容,由于是要登录,Cookie中存放的则是用户名和密码。第二次POST则是向服务器提交验证。

这里用到Python3,主要用到的包是re  urllib.request   http.cookiejar

上代码,借鉴了别人的代码~~~

import re
import urllib.request
import http.cookiejar
#from http.comkie import CookieJar 上面那句和这句等同
 
loginurl='https://www.douban.com/accounts/login'
cookie = http.cookiejar.CookieJar()
opener = urllib.request.build_opener(urllib.request.HTTPCookieProcessor)#在已存的Cookie下建立连接
 
params={}
params['form_email']='用户名'
params['form_password']='密码'#这里写上已有的用户名和密码
params['source']='http://www.douban.com/accounts/login'
 
#从首页提交登陆
response = opener.open(loginurl,urllib.parse.urlencode(params).encode('utf-8'))#urllib.parse.urlencode(params).encode('utf-8')这个是向服务
#器POST的内容,可以打印一下response.geturl()请求的连接看一下
#print(response.geturl()[0:33])
#验证成功跳转至登陆页
if response.geturl()[0:33]=='https://accounts.douban.com/login':
    html = response.read().decode('utf-8')
    #print(html),可以先打印一下文件内容,为了看到网页元素更方便的写正则,可以复制下来,在需要获取的地方用(.+?)表示,然后用group()元组来取得,
    #验证图片地址
    imgurl=re.search('<img id="captcha_image" src="(.+?)" alt="captcha" class="captcha_image"/>',html)
    if imgurl:
       url=imgurl.group(1)
       #print(url)
       #将验证码以v.jpg保存在本地,在输入验证码的时候可以手工输入
       res=urllib.request.urlretrieve(url,'v.jpg')
       captcha = re.search('<input type="hidden" name="captcha-id" value="(.+?)"/>',html)
       #print(captcha.group(1))
       if captcha:
           vcode=input('请输入图片上的验证码:')
           params["captcha-solution"] = vcode
           params["captcha-id"] = captcha.group(1)#这个是动态生成的,需要从网页中获得
           params["user_login"] = "登录"
           #提交验证码验证
           response = opener.open(loginurl,urllib.parse.urlencode(params).encode('utf-8'))
           if response.geturl()=="https://www.douban.com/":
              print("login sucess")

以上所述是小编给大家介绍的Python爬虫实现验证码登录详解整合,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对三水点靠木网站的支持!

Python 相关文章推荐
python迭代器实例简析
Sep 25 Python
以911新闻为例演示Python实现数据可视化的教程
Apr 23 Python
深入解读Python解析XML的几种方式
Feb 16 Python
Python将图片转换为字符画的方法
Jun 16 Python
TensorFlow打印tensor值的实现方法
Jul 27 Python
python 调用钉钉机器人的方法
Feb 20 Python
scrapy-redis的安装部署步骤讲解
Feb 27 Python
python flask web服务实现更换默认端口和IP的方法
Jul 26 Python
Matplotlib scatter绘制散点图的方法实现
Jan 02 Python
Python模拟FTP文件服务器的操作方法
Feb 18 Python
Django实现将views.py中的数据传递到前端html页面,并展示
Mar 16 Python
python实现启动一个外部程序,并且不阻塞当前进程
Dec 05 Python
详解如何管理多个Python版本和虚拟环境
May 10 #Python
不到40行代码用Python实现一个简单的推荐系统
May 10 #Python
Python和Java的语法对比分析语法简洁上python的确完美胜出
May 10 #Python
Python3列表内置方法大全及示例代码小结
May 10 #Python
详解python 爬取12306验证码
May 10 #Python
详解用python写一个抽奖程序
May 10 #Python
python实现小球弹跳效果
May 10 #Python
You might like
基于PHP 面向对象之成员方法详解
2013/05/04 PHP
ie与session丢失(新窗口cookie丢失)实测及解决方案
2013/07/15 PHP
PHP实现小偷程序实例
2016/10/31 PHP
通过JAVASCRIPT读取ASP设定的COOKIE
2007/02/15 Javascript
Area 区域实现post提交数据的js写法
2014/04/22 Javascript
jQuery实现tab选项卡效果的方法
2015/07/08 Javascript
Angular设置title信息解决SEO方面存在问题
2016/08/19 Javascript
值得分享的bootstrap table实例
2016/09/22 Javascript
jQuery实现节点的追加、替换、删除、复制功能示例
2017/07/11 jQuery
微信小程序 自定义消息提示框
2017/08/06 Javascript
React组件内事件传参实现tab切换的示例代码
2018/07/04 Javascript
详解vue2.0+axios+mock+axios-mock+adapter实现登陆
2018/07/19 Javascript
用vue-cli开发vue时的代理设置方法
2018/09/20 Javascript
改进 JavaScript 和 Rust 的互操作性并深入认识 wasm-bindgen 组件
2019/07/13 Javascript
在layui.use 中自定义 function 的正确方法
2019/09/16 Javascript
vue点击页面空白处实现保存功能
2019/11/06 Javascript
微信小程序实现音频文件播放进度的实例代码
2020/03/02 Javascript
vue配置多代理服务接口地址操作
2020/09/08 Javascript
Vue实现指令式动态追加小球动画组件的步骤
2020/12/18 Vue.js
Python3.6简单操作Mysql数据库
2017/09/12 Python
python机器学习之神经网络(一)
2017/12/20 Python
python抓取网站的图片并下载到本地的方法
2018/05/22 Python
python 实现UTC时间加减的方法
2018/12/31 Python
python中pygame安装过程(超级详细)
2019/08/04 Python
Python集合操作方法详解
2020/02/09 Python
了解AppleShare protocol(AppleShare协议)吗
2015/08/28 面试题
机械设计及其自动化专业推荐信
2013/10/31 职场文书
早会主持词
2014/03/17 职场文书
取保候审保证书
2014/04/30 职场文书
入职担保书范文
2014/05/21 职场文书
毕业生工作求职信
2014/06/30 职场文书
群众路线四风自我剖析材料
2014/10/08 职场文书
2014年法务工作总结
2014/12/11 职场文书
病危通知书样本
2015/04/17 职场文书
房地产置业顾问工作总结
2015/10/23 职场文书
python scipy 稀疏矩阵的使用说明
2021/05/26 Python