Python爬虫设置代理IP(图文)


Posted in Python onDecember 23, 2018

在爬虫的过程中,我们经常会遇见很多网站采取了防爬取技术,或者说因为自己采集网站信息的强度和采集速度太大,给对方服务器带去了太多的压力。

如果你一直用同一个代理ip爬取这个网页,很有可能ip会被禁止访问网页,所以基本上做爬虫的都躲不过去ip的问题。

Python爬虫设置代理IP(图文)

1、我们在做爬虫的过程中经常会遇到这样的情况,最初爬虫正常运行,正常爬取数据,一切看起来都是那么美好,然而不久之后可能会出现错误,比如 403 Forbidden,这时候你打开网页一看,可能会看到“您的 IP 访问频率太高”这样的提示。出现这种情况的原因是网站采取了一些反爬虫措施,比如,服务器会检测某个 IP 在单位时间内的请求次数,如果超过了这个阈值,就会直接拒绝服务,返回一些错误信息,这种情况可以称为封 IP。

Python爬虫设置代理IP(图文)

爬虫代理获取

获取IP池其实要找信的过的爬虫代理,我用的就是飞猪爬虫代理  ,优点自然就是使用率高于99%,缺点是没有免费的,0.03元一个IP,一天可以用1000个,一次可以API提取200个 。当然如果你们的用量还不满足可以加! 

Python爬虫设置代理IP(图文)

Python爬虫设置代理IP(图文)

爬虫代理IP的使用

运行上面的代码会得到一个随机的proxies,把它直接传入requests的get方法中即可。

Python爬虫设置代理IP(图文)

Python爬虫设置代理IP(图文)

1、测试效果

本次测试得出的结论:飞猪IP爬虫代理,可用率、响应速度、稳定性、价格、安全性、使用频率,还是不错的,值得推荐

Python爬虫设置代理IP(图文)

总结:以上就是关于python爬虫设置代理IP的步骤内容,感谢大家的阅读和对三水点靠木的支持。

Python 相关文章推荐
python3.5使用tkinter制作记事本
Jun 20 Python
对Python通过pypyodbc访问Access数据库的方法详解
Oct 27 Python
Python 使用Numpy对矩阵进行转置的方法
Jan 28 Python
python重试装饰器的简单实现方法
Jan 31 Python
Python用字典构建多级菜单功能
Jul 11 Python
简单了解Python3里的一些新特性
Jul 13 Python
Python学习笔记之Break和Continue用法分析
Aug 14 Python
python求平均数、方差、中位数的例子
Aug 22 Python
python实现批量文件重命名
Oct 31 Python
浅谈python量化 双均线策略(金叉死叉)
Jun 03 Python
Python+logging输出到屏幕将log日志写入文件
Nov 11 Python
python Zmail模块简介与使用示例
Dec 19 Python
celery4+django2定时任务的实现代码
Dec 23 #Python
python3使用pandas获取股票数据的方法
Dec 22 #Python
Python实现将通信达.day文件读取为DataFrame
Dec 22 #Python
python3 cvs将数据读取为字典的方法
Dec 22 #Python
python将txt等文件中的数据读为numpy数组的方法
Dec 22 #Python
python将txt文件读取为字典的示例
Dec 22 #Python
Python3实现对列表按元组指定列进行排序的方法分析
Dec 22 #Python
You might like
功能齐全的PHP发送邮件类代码附详细说明
2008/07/10 PHP
php下清空字符串中的HTML标签的代码
2010/09/06 PHP
WordPress中Gravatar头像缓存到本地及相关优化的技巧
2015/12/19 PHP
基于ThinkPHP实现的日历功能实例详解
2017/04/15 PHP
jQuery动态添加删除select项(实现代码)
2013/09/03 Javascript
JS、CSS加载中的小问题探讨
2013/11/26 Javascript
JavaScript返回网页中超链接数量的方法
2015/04/03 Javascript
javascript实现超炫的向上滑行菜单实例
2015/08/03 Javascript
jQuery深拷贝Json对象简单示例
2016/07/06 Javascript
JS获得一个对象的所有属性和方法实例
2017/02/21 Javascript
JavaScript作用域链实例详解
2019/01/21 Javascript
在vue中利用v-html按分号将文本换行的例子
2019/11/14 Javascript
vue中使用vue-pdf的方法详解
2020/09/05 Javascript
Python学习笔记之os模块使用总结
2014/11/03 Python
Python中if __name__ == '__main__'作用解析
2015/06/29 Python
python使用pil进行图像处理(等比例压缩、裁剪)实例代码
2017/12/11 Python
Flask之flask-session的具体使用
2018/07/26 Python
python散点图实例之随机漫步
2018/08/27 Python
获取Pytorch中间某一层权重或者特征的例子
2019/08/17 Python
Python中url标签使用知识点总结
2020/01/16 Python
python通过opencv实现图片裁剪原理解析
2020/01/19 Python
使用darknet框架的imagenet数据分类预训练操作
2020/07/07 Python
css3实现信纸/同学录效果的示例代码
2018/12/11 HTML / CSS
CSS3 优势以及网页设计师如何使用CSS3技术
2009/07/29 HTML / CSS
美国最大的城市服装和运动鞋零售商:Jimmy Jazz
2016/11/19 全球购物
时装界的“朋克之母”:Vivienne Westwood
2017/07/06 全球购物
党的群众路线对照检查材料(个人)
2014/09/24 职场文书
公司党的群众路线教育实践活动领导班子对照检查材料
2014/09/25 职场文书
2014年小学教师工作总结
2014/11/10 职场文书
2014年电信员工工作总结
2014/12/19 职场文书
工厂清洁工岗位职责
2015/02/14 职场文书
统计工作个人总结
2015/03/03 职场文书
经典爱情感言
2015/08/03 职场文书
数据库的高级查询六:表连接查询:外连接(左外连接,右外连接,UNION关键字,连接中ON与WHERE的不同)
2021/04/05 MySQL
Java数据结构之堆(优先队列)
2022/05/20 Java/Android
Python自动操作神器PyAutoGUI的使用教程
2022/06/16 Python