Python数据抓取爬虫代理防封IP方法


Posted in Python onDecember 23, 2018

爬虫:一段自动抓取互联网信息的程序,从互联网上抓取对于我们有价值的信息,一般来说,Python爬虫程序很多时候都要使用(飞猪IP)代理的IP地址来爬取程序,但是默认的urlopen是无法使用代理的IP的,我就来分享一下Python爬虫怎样使用代理IP的经验。(推荐飞猪代理IP注册可免费使用,浏览器搜索可找到)

Python数据抓取爬虫代理防封IP方法

1、划重点,小编我用的是Python3哦,所以要导入urllib的request,然后我们调用ProxyHandler,它可以接收代理IP的参数。代理可以根据自己需要选择,当然免费的也是有的,但是可用率可想而知的。(飞猪IP)

Python数据抓取爬虫代理防封IP方法

2、接着把IP地址以字典的形式放入其中,这个IP地址是我乱写的,只是用来举例。设置键为http,当然有些是https的,然后后面就是IP地址以及端口号(9000),具体看你的IP地址是什么类型的,不同IP端口号可能不同根据你在飞猪提取的端口为准。

Python数据抓取爬虫代理防封IP方法

3、接着再用build_opener()来构建一个opener对象。

Python数据抓取爬虫代理防封IP方法

4、然后调用构建好的opener对象里面的open方法来发生请求。实际上urlopen也是类似这样使用内部定义好的opener.open(),这里就相当于我们自己重写。

Python数据抓取爬虫代理防封IP方法

5、当然了,如果我们使用install_opener(),就可以把之前自定义的opener设置成全局的。

Python数据抓取爬虫代理防封IP方法

6、设置成全局之后,如果我们再使用urlopen来发送请求,那么发送请求使用的IP地址就是代理IP,而不是本机的IP地址了。

Python数据抓取爬虫代理防封IP方法

7、最后再来说说使用代理遇到的错误,提示目标计算机积极拒绝,这就说明可能是代理IP无效,或者端口号错误,这就需要使用有效的IP才行哦。(这边现在是乱填写的IP地址)可选择飞猪的代理IP。

Python数据抓取爬虫代理防封IP方法

总结:以上就是本次关于Python数据抓取爬虫代理防封IP方法,感谢大家的阅读和对三水点靠木的支持。

Python 相关文章推荐
简单学习Python多进程Multiprocessing
Aug 29 Python
Python logging管理不同级别log打印和存储实例
Jan 19 Python
python导出hive数据表的schema实例代码
Jan 22 Python
使用Python进行QQ批量登录的实例代码
Jun 11 Python
解决Python pandas df 写入excel 出现的问题
Jul 04 Python
python 快速把超大txt文件转存为csv的实例
Oct 26 Python
PyTorch搭建一维线性回归模型(二)
May 22 Python
Django中的静态文件管理过程解析
Aug 01 Python
Python2和3字符编码的区别知识点整理
Aug 08 Python
Python selenium的基本使用方法分析
Dec 21 Python
关于Python字符串显示u...的解决方式
Mar 06 Python
python实现将字符串中的数字提取出来然后求和
Apr 02 Python
python3爬虫怎样构建请求header
Dec 23 #Python
windows下搭建python scrapy爬虫框架步骤
Dec 23 #Python
python构建基础的爬虫教学
Dec 23 #Python
Flask之请求钩子的实现
Dec 23 #Python
python爬虫获取新浪新闻教学
Dec 23 #Python
Python爬虫文件下载图文教程
Dec 23 #Python
python爬虫获取百度首页内容教学
Dec 23 #Python
You might like
PHP中HTTP方式下的Gzip压缩传输方法举偶
2007/02/15 PHP
PHP 如何获取二维数组中某个key的集合
2014/06/03 PHP
php实现给图片加灰色半透明效果的方法
2014/10/20 PHP
php实现的树形结构数据存取类实例
2014/11/29 PHP
基于laravel制作APP接口(API)
2016/03/15 PHP
Joomla数据库操作之JFactory::getDBO用法
2016/05/05 PHP
javascript DOM编程实例(智播客学习)
2009/11/23 Javascript
JavaScript arguments 多参传值函数
2010/10/24 Javascript
JQuery为textarea添加maxlength属性并且兼容IE
2013/04/25 Javascript
JavaScript创建对象的写法
2013/08/29 Javascript
ExtJS4如何给同一个formpanel不同的url
2014/05/02 Javascript
JS实现根据当前文字选择返回被选中的文字
2014/05/21 Javascript
sogou地图API用法实例教程
2014/09/11 Javascript
JS 实现Base64编码与解码实例详解
2016/11/07 Javascript
php 修改密码实现代码
2017/05/24 Javascript
基于iScroll实现内容滚动效果
2018/03/21 Javascript
vue如何解决循环引用组件报错的问题
2018/09/22 Javascript
python实现猜数字游戏(无重复数字)示例分享
2014/03/29 Python
Python实现遍历数据库并获取key的值
2015/05/17 Python
Python中max函数用法实例分析
2015/07/17 Python
使用Python和OpenCV检测图像中的物体并将物体裁剪下来
2019/10/30 Python
Python自动登录QQ的实现示例
2020/08/28 Python
python打包多类型文件的操作方法
2020/09/21 Python
Python 获取异常(Exception)信息的几种方法
2020/12/29 Python
Html5新增标签有哪些
2017/04/13 HTML / CSS
廉价航班、机票和酒店:JustFly
2018/02/07 全球购物
阳光体育:Sunny Sports(购买露营和远足设备)
2018/08/07 全球购物
C#面试题
2016/05/06 面试题
商业街策划方案
2014/05/31 职场文书
年度优秀员工获奖感言
2014/08/15 职场文书
当幸福来敲门观后感
2015/06/01 职场文书
雷锋的故事观后感
2015/06/10 职场文书
python基础入门之普通操作与函数(三)
2021/06/13 Python
MySQL 如何限制一张表的记录数
2021/09/14 MySQL
Vue自定义铃声提示音组件的实现
2022/01/22 Vue.js
实例详解Python的进程,线程和协程
2022/03/13 Python