Python爬虫设置代理IP(图文)


Posted in Python onDecember 23, 2018

在爬虫的过程中,我们经常会遇见很多网站采取了防爬取技术,或者说因为自己采集网站信息的强度和采集速度太大,给对方服务器带去了太多的压力。

如果你一直用同一个代理ip爬取这个网页,很有可能ip会被禁止访问网页,所以基本上做爬虫的都躲不过去ip的问题。

Python爬虫设置代理IP(图文)

1、我们在做爬虫的过程中经常会遇到这样的情况,最初爬虫正常运行,正常爬取数据,一切看起来都是那么美好,然而不久之后可能会出现错误,比如 403 Forbidden,这时候你打开网页一看,可能会看到“您的 IP 访问频率太高”这样的提示。出现这种情况的原因是网站采取了一些反爬虫措施,比如,服务器会检测某个 IP 在单位时间内的请求次数,如果超过了这个阈值,就会直接拒绝服务,返回一些错误信息,这种情况可以称为封 IP。

Python爬虫设置代理IP(图文)

爬虫代理获取

获取IP池其实要找信的过的爬虫代理,我用的就是飞猪爬虫代理  ,优点自然就是使用率高于99%,缺点是没有免费的,0.03元一个IP,一天可以用1000个,一次可以API提取200个 。当然如果你们的用量还不满足可以加! 

Python爬虫设置代理IP(图文)

Python爬虫设置代理IP(图文)

爬虫代理IP的使用

运行上面的代码会得到一个随机的proxies,把它直接传入requests的get方法中即可。

Python爬虫设置代理IP(图文)

Python爬虫设置代理IP(图文)

1、测试效果

本次测试得出的结论:飞猪IP爬虫代理,可用率、响应速度、稳定性、价格、安全性、使用频率,还是不错的,值得推荐

Python爬虫设置代理IP(图文)

总结:以上就是关于python爬虫设置代理IP的步骤内容,感谢大家的阅读和对三水点靠木的支持。

Python 相关文章推荐
Python中for循环详解
Jan 17 Python
Python的ORM框架SQLAlchemy入门教程
Apr 28 Python
Python正则替换字符串函数re.sub用法示例
Jan 19 Python
Python列表和元组的定义与使用操作示例
Jul 26 Python
Python测试人员需要掌握的知识
Feb 08 Python
Python 在字符串中加入变量的实例讲解
May 02 Python
pyqt 实现为长内容添加滑轮 scrollArea
Jun 19 Python
Python使用线程来接收串口数据的示例
Jul 02 Python
关于sys.stdout和print的区别详解
Dec 05 Python
Python格式化输出--%s,%d,%f的代码解析
Apr 29 Python
Python实现一个优先级队列的方法
Jul 31 Python
python绘制箱型图
Apr 27 Python
celery4+django2定时任务的实现代码
Dec 23 #Python
python3使用pandas获取股票数据的方法
Dec 22 #Python
Python实现将通信达.day文件读取为DataFrame
Dec 22 #Python
python3 cvs将数据读取为字典的方法
Dec 22 #Python
python将txt等文件中的数据读为numpy数组的方法
Dec 22 #Python
python将txt文件读取为字典的示例
Dec 22 #Python
Python3实现对列表按元组指定列进行排序的方法分析
Dec 22 #Python
You might like
如何跨站抓取别的站点的页面的补充
2006/10/09 PHP
PHP基础学习小结
2011/04/17 PHP
php 命名空间(namespace)原理与用法实例小结
2019/11/13 PHP
在子窗口中关闭父窗口的一句代码
2013/10/21 Javascript
jQuery中triggerHandler()方法用法实例
2015/01/19 Javascript
jQuery中on()方法用法实例详解
2015/02/06 Javascript
简单了解Backbone.js的Model模型以及View视图的源码
2016/02/14 Javascript
[js高手之路]寄生组合式继承的优势详解
2017/08/28 Javascript
解决html-jquery/js引用外部图片时遇到看不了或出现403的问题
2017/09/22 jQuery
微信小程序页面生命周期详解
2018/01/31 Javascript
微信小程序内拖动图片实现移动、放大、旋转的方法
2018/09/04 Javascript
在vue项目中引用Iview的方法
2018/09/14 Javascript
Vue Prop属性功能与用法实例详解
2019/02/23 Javascript
vue点击Dashboard不同内容 跳转到同一表格的实例
2020/11/13 Javascript
在Python中使用SimpleParse模块进行解析的教程
2015/04/11 Python
详解Python中最难理解的点-装饰器
2017/04/03 Python
Python实现判断给定列表是否有重复元素的方法
2018/04/11 Python
Python sklearn KFold 生成交叉验证数据集的方法
2018/12/11 Python
python图像和办公文档处理总结
2019/05/28 Python
Python argparse模块使用方法解析
2020/02/20 Python
设置jupyter中DataFrame的显示限制方式
2020/04/12 Python
让Django的BooleanField支持字符串形式的输入方式
2020/05/20 Python
CSS3 linear-gradient线性渐变生成加号和减号的方法
2017/11/21 HTML / CSS
澳大利亚在线高跟鞋商店:Shoe Me
2019/11/19 全球购物
Fox Racing英国官网:越野摩托车和山地自行车服装
2020/02/26 全球购物
应届实习生的自我评价范文
2014/01/05 职场文书
药剂专业求职信
2014/06/20 职场文书
文秘自荐信
2014/06/28 职场文书
关于学习的决心书
2015/02/05 职场文书
行政处罚听证告知书
2015/07/01 职场文书
科级干部培训心得体会
2016/01/06 职场文书
2019邀请函格式及范文
2019/05/20 职场文书
Mysql效率优化定位较低sql的两种方式
2021/05/26 MySQL
Pyhton爬虫知识之正则表达式详解
2022/04/01 Python
第四次工业革命,打工人与机器人的竞争
2022/04/21 数码科技
PostgreSQL怎么创建分区表详解
2022/06/25 PostgreSQL