详解python 爬取12306验证码


Posted in Python onMay 10, 2019

一个简单的验证码爬取程序

本文介绍了在Python2.7环境下爬取网站验证码:

思路就是获取验证码对应的url,然后发起requst请求,读取该URL对应的内容,然后写入到一个本地文件,实现一个验证码的保存。大量下载可以把以上程序写入一个死循环

代码实现部分:

import ssl
import urllib2
i=1
import time
while(1):

 #不加的话,无法访问12306 
  ssl._create_default_https_context = ssl._create_unverified_context
  # headers = {"User-Agent": "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_11_6) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/55.0.2883.95 Safari/537.36"}
  # req = urllib2.Request("http://211.87.155.19/(yfsvlfreem4d0b553vkfzfzt)/CheckCode.aspx", headers=headers)
  # https: // www.zhihu.com / captcha.gif?r = 1495351271125 & type = login
  req = urllib2.Request("https://kyfw.12306.cn/otn/passcodeNew/getPassCodeNew?module=login&rand=sjrand&0.7174227166135074")
  u=urllib2.urlopen(req)
  data = u.read()
  f = open("C:/Users/123/Desktop/4/"+str(i)+".jpg",'wb')
  print i
  # time.sleep(1)#有时需要加延时,以防被封。
  i=i+1
  f.write(data)
  f.close()

以下就是爬取的照片的截图

详解python 爬取12306验证码

12306的验证码经常让人眼花缭乱,眼睛仔细看也不能100%的对,算是验证码中比较难是别的。一般由八幅图和一个问题组成,而且图片大小位置固定,问题的位置也是固定的,这也稍微降低了识别的难度。八幅图中一般有两幅图是同一物体,有一个和它比较像。不过有一点暂时没法确定,就是样本库到底有多大,或者说是到底有多少个类别,如果进行训练的话,我们必须获取每个类别个的一定数量的图片作为样本。

以上所述是小编给大家介绍的python爬取12306验证码详解整合,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对三水点靠木网站的支持!

Python 相关文章推荐
Python 序列化 pickle/cPickle模块使用介绍
Nov 30 Python
python线程池(threadpool)模块使用笔记详解
Nov 17 Python
python利用requests库模拟post请求时json的使用教程
Dec 07 Python
使用pycharm设置控制台不换行的操作方法
Jan 19 Python
Python实现的微信支付方式总结【三种方式】
Apr 13 Python
分享8个非常流行的 Python 可视化工具包
Jun 05 Python
Python跳出多重循环的方法示例
Jul 03 Python
python读取Excel表格文件的方法
Sep 02 Python
pytorch中图像的数据格式实例
Feb 11 Python
PyInstaller的安装和使用的详细步骤
Jun 02 Python
PyCharm上安装Package的实现(以pandas为例)
Sep 18 Python
Django Admin后台模型列表页面如何添加自定义操作按钮
Nov 11 Python
详解用python写一个抽奖程序
May 10 #Python
python实现小球弹跳效果
May 10 #Python
基于python实现百度翻译功能
May 09 #Python
python使用time、datetime返回工作日列表实例代码
May 09 #Python
python 对字典按照value进行排序的方法
May 09 #Python
使用Django开发简单接口实现文章增删改查
May 09 #Python
python GUI实现小球满屏乱跑效果
May 09 #Python
You might like
自动生成文章摘要的代码[PHP 版本]
2007/03/20 PHP
按上下级层次关系输出内容的PHP代码
2010/07/17 PHP
php的array数组和使用实例简明教程(容易理解)
2014/03/20 PHP
Windows下的PHP安装文件线程安全和非线程安全的区别
2014/04/23 PHP
PHP实现15位身份证号转18位的方法分析
2019/10/16 PHP
PHP的HTTP客户端Guzzle简单使用方法分析
2019/10/30 PHP
跨浏览器开发经验总结(三)   警惕“IE依赖综合症”
2010/05/13 Javascript
jquery下利用jsonp跨域访问实现方法
2010/07/29 Javascript
js判断60秒以及倒计时示例代码
2014/01/24 Javascript
javascript处理表单示例(javascript提交表单)
2014/04/28 Javascript
js实现鼠标拖动功能
2017/03/20 Javascript
JS动态修改网页body的背景色实例代码
2017/10/07 Javascript
vue-auto-focus: 控制自动聚焦行为的 vue 指令方法
2018/08/25 Javascript
ES6如何用一句代码实现函数的柯里化
2020/01/18 Javascript
ES2020让代码更优美的运算符 (?.) (??)
2021/01/04 Javascript
[54:56]DOTA2上海特级锦标赛主赛事日 - 5 总决赛Liquid VS Secret第三局
2016/03/06 DOTA
[01:13:51]TNC vs Serenity 2018国际邀请赛小组赛BO2 第二场 8.18
2018/08/19 DOTA
Python实现图像几何变换
2015/07/06 Python
python抓取文件夹的所有文件
2018/02/27 Python
如何利用Boost.Python实现Python C/C++混合编程详解
2018/11/08 Python
对json字符串与python字符串的不同之处详解
2018/12/19 Python
python利用tkinter实现屏保
2019/07/30 Python
Python 异常的捕获、异常的传递与主动抛出异常操作示例
2019/09/23 Python
Python hmac模块使用实例解析
2019/12/24 Python
tensorflow-gpu安装的常见问题及解决方案
2020/01/20 Python
解决python运行启动报错问题
2020/06/01 Python
keras实现多种分类网络的方式
2020/06/11 Python
python实现npy格式文件转换为txt文件操作
2020/07/01 Python
CSS3教程(7):CSS3嵌入字体
2009/04/02 HTML / CSS
毕业自我鉴定范文
2013/11/06 职场文书
应届大学生自荐信
2013/12/05 职场文书
我的网上商城创业计划书
2013/12/26 职场文书
写给女生的道歉信
2014/01/08 职场文书
先进集体事迹材料
2014/02/17 职场文书
党员学习党的群众路线思想汇报(5篇)
2014/09/10 职场文书
2014年审计工作总结
2014/11/17 职场文书