python爬虫简单的添加代理进行访问的实现代码


Posted in Python onApril 04, 2019

在使用python对网页进行多次快速爬取的时候,访问次数过于频繁,服务器不会考虑User-Agent的信息,会直接把你视为爬虫,从而过滤掉,拒绝你的访问,在这种时候就需要设置代理,我们可以给proxies属性设置一个代理的IP地址,代码如下:

import requests
 from lxml import etree
 url = "https://www.ip.cn"
 headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.102 Safari/537.36 OPR/57.0.3098.116", }
 pro = {
 # 'https': 'https://118.122.92.252:37901', #四川省成都市 电信
 'https': 'https://27.17.45.90:43411', #湖北省武汉市 电信
 }
 try:
 response = requests.get(url, headers=headers, proxies=pro)
 html_str = response.content.decode()
 # print(html_str)
 html = etree.HTML(html_str)
 message = html.xpath("//div[@class='well']//p/text()")
 ip = html.xpath("//div[@class='well']//p/code/text()")
 eng = html.xpath("//div[@class='well']/p/text()")
 print(message[0]+ip[0])
 print(message[1]+ip[1])
 print(eng[2])
 except requests.exceptions.ProxyError as e:
 print("当前代理异常")
 except:
 print("当前请求异常")

在上面的代码中,调用requests库,对一个IP地址查询网页进行访问,随后使用lxml库的xpath对网页进行分析提取,返回用户访问此网页时自己的IP地址,如果代理设置成功,则会返回你的信息和IP地址,如下:

python爬虫简单的添加代理进行访问的实现代码

如果代理失败则会返回异常,在代码中使用了捕获异常,则会返回设置的提示信息,"当前代理异常",如果不是代理的错误则是"当前请求异常"

python爬虫简单的添加代理进行访问的实现代码

PS:免费的代理不是很稳定,在确认代码无误后,如果仍然返回异常,可尝试更换代理IP...

总结

以上所述是小编给大家介绍的python爬虫简单的添加代理进行访问的实现代码,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对三水点靠木网站的支持!

Python 相关文章推荐
Python程序中用csv模块来操作csv文件的基本使用教程
Mar 03 Python
不要用强制方法杀掉python线程
Feb 26 Python
python dataframe常见操作方法:实现取行、列、切片、统计特征值
Jun 09 Python
Python多项式回归的实现方法
Mar 11 Python
Python中的asyncio代码详解
Jun 10 Python
python实现websocket的客户端压力测试
Jun 25 Python
Python制作微信好友背景墙教程(附完整代码)
Jul 17 Python
python下PyGame的下载与安装过程及遇到问题
Aug 04 Python
python3.7 利用函数os pandas利用excel对文件名进行归类
Sep 29 Python
Pytorch释放显存占用方式
Jan 13 Python
解决pyecharts运行后产生的html文件用浏览器打开空白
Mar 11 Python
pycharm设置默认的UTF-8编码模式的方法详解
Jun 01 Python
Django项目中添加ldap登陆认证功能的实现
Apr 04 #Python
使用 Python 玩转 GitHub 的贡献板(推荐)
Apr 04 #Python
python中yield的用法详解——最简单,最清晰的解释
Apr 04 #Python
详解python项目实战:模拟登陆CSDN
Apr 04 #Python
Python实现字符串匹配的KMP算法
Apr 04 #Python
Python GUI编程完整示例
Apr 04 #Python
Python使用sax模块解析XML文件示例
Apr 04 #Python
You might like
一些使用频率比较高的php函数
2008/10/03 PHP
PHP Memcached应用实现代码
2010/02/08 PHP
支持数组的ADDSLASHES的php函数
2010/02/16 PHP
phpmyadmin config.inc.php配置示例
2013/08/27 PHP
php使用curl模拟登录后采集页面的例子
2013/11/04 PHP
thinkPHP5框架设置404、403等http状态页面的方法
2018/06/05 PHP
PHP基于DateTime类解决Unix时间戳与日期互转问题【针对1970年前及2038年后时间戳】
2018/06/13 PHP
PHP html_entity_decode()函数讲解
2019/02/25 PHP
php菜单/评论数据递归分级算法的实现方法
2019/08/01 PHP
利用JS进行图片的切换即特效展示图片
2013/12/03 Javascript
JS、CSS以及img对DOMContentLoaded事件的影响
2014/08/12 Javascript
javascript判断移动端访问设备并解析对应CSS的方法
2015/02/05 Javascript
深入理解JavaScript系列(30):设计模式之外观模式详解
2015/03/03 Javascript
js实现Form栏显示全格式时间时钟效果代码
2015/08/19 Javascript
javascript倒计时效果实现
2015/11/12 Javascript
Centos7 中安装 Node.js v4.4.4
2016/11/03 Javascript
详解JavaScript中的属性和特性
2016/12/08 Javascript
jQuery插件HighCharts绘制2D金字塔图效果示例【附demo源码下载】
2017/03/09 Javascript
JS实现unicode和UTF-8之间的互相转换互转
2017/07/05 Javascript
React styled-components设置组件属性的方法
2018/08/07 Javascript
js代码编写无缝轮播图
2020/09/13 Javascript
Swiper实现导航栏滚动效果
2020/10/16 Javascript
python实现自动发送邮件
2018/06/20 Python
Python虚拟环境venv用法详解
2020/05/25 Python
django跳转页面传参的实现
2020/09/17 Python
python入门教程之基本算术运算符
2020/11/13 Python
英国广泛的照明产品网站:Lights4living
2018/01/28 全球购物
手机被没收检讨书
2014/02/22 职场文书
创意广告词
2014/03/17 职场文书
城管大队整治方案
2014/05/06 职场文书
美术课外活动总结
2014/07/08 职场文书
幼儿园安全责任书范本
2014/07/24 职场文书
开平碉楼导游词
2015/02/06 职场文书
2015年维修工作总结
2015/04/25 职场文书
2016公司年会主持词
2015/07/01 职场文书
经销商会议开幕词
2016/03/04 职场文书