python爬虫简单的添加代理进行访问的实现代码


Posted in Python onApril 04, 2019

在使用python对网页进行多次快速爬取的时候,访问次数过于频繁,服务器不会考虑User-Agent的信息,会直接把你视为爬虫,从而过滤掉,拒绝你的访问,在这种时候就需要设置代理,我们可以给proxies属性设置一个代理的IP地址,代码如下:

import requests
 from lxml import etree
 url = "https://www.ip.cn"
 headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.102 Safari/537.36 OPR/57.0.3098.116", }
 pro = {
 # 'https': 'https://118.122.92.252:37901', #四川省成都市 电信
 'https': 'https://27.17.45.90:43411', #湖北省武汉市 电信
 }
 try:
 response = requests.get(url, headers=headers, proxies=pro)
 html_str = response.content.decode()
 # print(html_str)
 html = etree.HTML(html_str)
 message = html.xpath("//div[@class='well']//p/text()")
 ip = html.xpath("//div[@class='well']//p/code/text()")
 eng = html.xpath("//div[@class='well']/p/text()")
 print(message[0]+ip[0])
 print(message[1]+ip[1])
 print(eng[2])
 except requests.exceptions.ProxyError as e:
 print("当前代理异常")
 except:
 print("当前请求异常")

在上面的代码中,调用requests库,对一个IP地址查询网页进行访问,随后使用lxml库的xpath对网页进行分析提取,返回用户访问此网页时自己的IP地址,如果代理设置成功,则会返回你的信息和IP地址,如下:

python爬虫简单的添加代理进行访问的实现代码

如果代理失败则会返回异常,在代码中使用了捕获异常,则会返回设置的提示信息,"当前代理异常",如果不是代理的错误则是"当前请求异常"

python爬虫简单的添加代理进行访问的实现代码

PS:免费的代理不是很稳定,在确认代码无误后,如果仍然返回异常,可尝试更换代理IP...

总结

以上所述是小编给大家介绍的python爬虫简单的添加代理进行访问的实现代码,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对三水点靠木网站的支持!

Python 相关文章推荐
Python中MySQL数据迁移到MongoDB脚本的方法
Apr 28 Python
详解使用pymysql在python中对mysql的增删改查操作(综合)
Jan 18 Python
Python3多进程 multiprocessing 模块实例详解
Jun 11 Python
Python自动发送邮件的方法实例总结
Dec 08 Python
Python类的继承用法示例
Jan 31 Python
python实现图书借阅系统
Feb 20 Python
Python装饰器限制函数运行时间超时则退出执行
Apr 09 Python
Python中一些深不见底的“坑”
Jun 12 Python
python 表格打印代码实例解析
Oct 12 Python
利用Tensorflow的队列多线程读取数据方式
Feb 05 Python
Numpy 理解ndarray对象的示例代码
Apr 03 Python
python 串行执行和并行执行实例
Apr 30 Python
Django项目中添加ldap登陆认证功能的实现
Apr 04 #Python
使用 Python 玩转 GitHub 的贡献板(推荐)
Apr 04 #Python
python中yield的用法详解——最简单,最清晰的解释
Apr 04 #Python
详解python项目实战:模拟登陆CSDN
Apr 04 #Python
Python实现字符串匹配的KMP算法
Apr 04 #Python
Python GUI编程完整示例
Apr 04 #Python
Python使用sax模块解析XML文件示例
Apr 04 #Python
You might like
Mysql数据库操作类( 1127版,提供源码下载 )
2010/12/02 PHP
php引用返回与取消引用的详解
2013/06/08 PHP
php使用Header函数,PHP_AUTH_PW和PHP_AUTH_USER做用户验证
2016/05/04 PHP
PHP使用第三方即时获取物流动态实例详解
2017/04/27 PHP
PHP基于socket实现的简单客户端和服务端通讯功能示例
2017/07/10 PHP
数组Array进行原型prototype扩展后带来的for in遍历问题
2010/02/07 Javascript
使用Curl命令查看请求响应时间方法
2016/11/04 Javascript
基于bootstrap-datetimepicker.js不支持IE8的快速解决方法
2016/11/07 Javascript
微信小程序 详解下拉加载与上拉刷新实现方法
2017/01/13 Javascript
JS复制对应id的内容到粘贴板(Ctrl+C效果)
2017/01/23 Javascript
JavaScript定时器setTimeout()和setInterval()详解
2017/08/18 Javascript
json字符串传到前台input的方法
2018/08/06 Javascript
详解webpack 最简打包结果分析
2019/02/20 Javascript
在layui中select更改后生效的方法
2019/09/05 Javascript
layui表格内容溢出的解决方法
2019/09/06 Javascript
[03:57]2016完美“圣”典风云人物:rOtk专访
2016/12/09 DOTA
python和pyqt实现360的CLable控件
2014/02/21 Python
Python入门篇之字典
2014/10/17 Python
Python中的Matplotlib模块入门教程
2015/04/15 Python
Python的Flask框架中web表单的教程
2015/04/20 Python
Python探索之实现一个简单的HTTP服务器
2017/10/28 Python
Python打印输出数组中全部元素
2018/03/13 Python
解决Python3中的中文字符编码的问题
2018/07/18 Python
python 列表递归求和、计数、求最大元素的实例
2018/11/28 Python
python远程邮件控制电脑升级版
2019/05/23 Python
Python字典对象实现原理详解
2019/07/01 Python
python 成功引入包但无法正常调用的解决
2020/03/09 Python
Python如何安装第三方模块
2020/05/28 Python
python爬虫爬取某网站视频的示例代码
2021/02/20 Python
CHARLES & KEITH加拿大官网:新加坡时尚品牌
2020/03/26 全球购物
美国价格实惠的在线眼镜网站:Zeelool
2020/12/25 全球购物
五好党支部事迹材料
2014/02/06 职场文书
交通事故代理词范文
2015/05/23 职场文书
高中家长意见怎么写
2015/06/03 职场文书
在人间读书笔记
2015/06/30 职场文书
速龙x4-860k处理器相当于i几
2022/04/20 数码科技