对python使用http、https代理的实例讲解


Posted in Python onMay 07, 2018

在国内利用Python从Internet上爬取数据时,有些网站或API接口被限速或屏蔽,这时使用代理可以加速爬取过程,减少请求失败,Python程序使用代理的方法主要有以下几种:

(1)如果是在代码中使用一些网络库或爬虫框架进行数据爬取,一般这种框架都会支持设置代理,例如:

<span style="font-size:14px;">import urllib.request as urlreq 
# 设置https代理 
ph = urlreq.ProxyHandler({'https': 'https://127.0.0.1:1080'}) 
oper = urlreq.build_opener(ph) 
# 将代理安装到全局环境,这样所有请求都会自动使用代理 
urlreq.install_opener(oper) 
res = oper.open("https://www.google.com") 
print(res.read())</span>
<span style="font-size:14px;">import requests as req 
print(req.get("https://www.google.com", proxies={'https': 'https://127.0.0.1:1080'}).content)</span>

(2)如果使用的库没有提供设置代理的接口,但是底层使用了urllib、requests等库,可以尝试设置HTTP_PROXY 和HTTPS_PROXY环境变量,常用的网络库会自动识别这些环境变量,使用变量设置的代理发起请求,设置如下:

import os 
os.environ['http_proxy'] = 'http://127.0.0.1:1080' 
os.environ['https_proxy'] = 'https://127.0.0.1:1080'

(3)如果上述两种方法都没有用,那么还可以使用一些可以监听、拦截和修改网络包的工具和库如(Fiddler、mitmproxy)来拦截http请求包并修改地址,达到使用代理的效果。

以上这篇对python使用http、https代理的实例讲解就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
在Python中操作时间之tzset()方法的使用教程
May 22 Python
python实现多线程抓取知乎用户
Dec 12 Python
使用XML库的方式,实现RPC通信的方法(推荐)
Jun 14 Python
Python探索之自定义实现线程池
Oct 27 Python
TensorFlow实现RNN循环神经网络
Feb 28 Python
python中redis查看剩余过期时间及用正则通配符批量删除key的方法
Jul 30 Python
pandas.dataframe按行索引表达式选取方法
Oct 30 Python
python基础 range的用法解析
Aug 23 Python
使用tensorflow实现矩阵分解方式
Feb 07 Python
最新2019Pycharm安装教程 亲测
Feb 28 Python
python爬虫selenium模块详解
Mar 30 Python
Python机器学习之底层实现KNN
Jun 20 Python
python3 requests中使用ip代理池随机生成ip的实例
May 07 #Python
python使用代理ip访问网站的实例
May 07 #Python
一些Centos Python 生产环境的部署命令(推荐)
May 07 #Python
Python实现爬虫设置代理IP和伪装成浏览器的方法分享
May 07 #Python
Pyspider中给爬虫伪造随机请求头的实例
May 07 #Python
python通过伪装头部数据抵抗反爬虫的实例
May 07 #Python
Django Web开发中django-debug-toolbar的配置以及使用
May 06 #Python
You might like
一次编写,随处运行
2006/10/09 PHP
php cookis创建实现代码
2009/03/16 PHP
php的日期处理函数及uchome的function_coomon中日期处理函数的研究
2011/01/12 PHP
javascript模版引擎-tmpl的bug修复与性能优化分析
2011/10/23 Javascript
js禁止回车提交表单的示例代码
2013/12/23 Javascript
JavaScript中使用ActiveXObject操作本地文件夹的方法
2014/03/28 Javascript
JavaScrip调试技巧之断点调试
2015/10/22 Javascript
基于Bootstrap使用jQuery实现输入框组input-group的添加与删除
2016/05/03 Javascript
详解javascript 正则表达式之分组与前瞻匹配
2018/05/30 Javascript
Vue项目使用localStorage+Vuex保存用户登录信息
2019/05/27 Javascript
Vue proxyTable配置多个接口地址,解决跨域的问题
2020/09/11 Javascript
[01:51]2018年度CS GO最具人气外援-完美盛典
2018/12/16 DOTA
python str与repr的区别
2013/03/23 Python
编写Python脚本抓取网络小说来制作自己的阅读器
2015/08/20 Python
浅谈Python中用datetime包进行对时间的一些操作
2016/06/23 Python
python daemon守护进程实现
2016/08/27 Python
python3.x实现base64加密和解密
2019/03/28 Python
OpenCV+Python--RGB转HSI的实现
2019/11/27 Python
Python短信轰炸的代码
2020/03/25 Python
使用python检查yaml配置文件是否符合要求
2020/04/09 Python
使用Numpy对特征中的异常值进行替换及条件替换方式
2020/06/08 Python
Python模块常用四种安装方式
2020/10/20 Python
Python用requests库爬取返回为空的解决办法
2021/02/21 Python
Pytorch - TORCH.NN.INIT 参数初始化的操作
2021/02/27 Python
英国Radley包德国官网:Radley London德国
2019/11/18 全球购物
总经理秘书的岗位职责
2013/12/27 职场文书
好人好事事迹材料
2014/02/12 职场文书
《桃花心木》教学反思
2014/02/17 职场文书
绿色城市实施方案
2014/03/19 职场文书
党员干部承诺书
2014/03/25 职场文书
安全施工标语
2014/06/07 职场文书
小学国庆节活动方案策划书
2014/09/16 职场文书
英语四级考试作弊检讨书
2014/09/29 职场文书
检讨书格式范文
2015/05/07 职场文书
评测 | 大屏显示带收音机的高端音箱,JBL TUNE2便携式插卡音箱实测
2021/04/24 无线电
JavaScript如何优化逻辑判断代码详解
2021/06/08 Javascript