python爬虫快速响应服务器的做法


Posted in Python onNovember 24, 2020

不论是打开网页或者爬取一些资料的时候,我们想要的是计算机能在最短的时间内运行出结果,不然等待的时间过长会影响下一步工作的计划。这时候我们可以给计算机一个指令,限制最久能等待的时间,在我们能接受的时间内运行出结果。那么这个指令方法是什么呢?接下来我们一起看看吧。

requests之所以称为“HTTP for human”,因为其封装层次很高,其中一处体现就在:requests会自动处理服务器响应的重定向。我在做搜狗微信公众号抓取的时候,搜狗搜索列表页面的公众号文章地址,其实不是微信的地址而需要请求到搜狗到服务器做重定向,而requests的默认处理则是将整个过程全部搞定,对此可以这样:

In [1]: r = requests.get('http://xlzd.me', allow_redirects=False)

allow_redirects参数为False则表示不会主动重定向。

另外,有时候对方网站的响应时间太长了,我们希望在指定时间内完事,或者直接停止这个请求,这时候的做法是:

In [1]: r = requests.get('http://xlzd.me', timeout=3)

timeout表示这次请求最长我最长只等待多少秒

拓展:

为requests套上一层代理的做法也非常简单:

import requests
proxies = {
 "http": "http://192.168.31.1:3128",
 "https": "http://10.10.1.10:1080",
}
requests.get("http://xlzd.me", proxies=proxies)

到此这篇关于python爬虫快速响应服务器的做法的文章就介绍到这了,更多相关python爬虫中如何快速响应服务器内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
Python正则表达式介绍
Aug 06 Python
Python Web框架Pylons中使用MongoDB的例子
Dec 03 Python
python局域网ip扫描示例分享
Apr 03 Python
python生成器generator用法实例分析
Jun 04 Python
numpy.transpose对三维数组的转置方法
Apr 17 Python
pyqt5 实现多窗口跳转的方法
Jun 19 Python
python 图片去噪的方法示例
Jul 09 Python
django获取from表单multiple-select的value和id的方法
Jul 19 Python
python matplotlib库直方图绘制详解
Aug 10 Python
解决python虚拟环境切换无效的问题
Apr 30 Python
Python如何基于Tesseract实现识别文字功能
Jun 05 Python
python 安装移动复制第三方库操作
Jul 13 Python
PyCharm Community安装与配置的详细教程
Nov 24 #Python
python3爬虫GIL修改多线程实例讲解
Nov 24 #Python
Django URL参数Template反向解析
Nov 24 #Python
python3爬虫中引用Queue的实例讲解
Nov 24 #Python
python3爬虫中多线程的优势总结
Nov 24 #Python
利用python+ffmpeg合并B站视频及格式转换的实例代码
Nov 24 #Python
python 如何停止一个死循环的线程
Nov 24 #Python
You might like
PHP JS Ip地址及域名格式检测代码
2013/09/27 PHP
php用户注册时常用的检验函数实例总结
2014/12/22 PHP
php基于websocket搭建简易聊天室实践
2016/10/24 PHP
YII中Ueditor富文本编辑器文件和图片上传的配置图文教程
2017/03/15 PHP
thinkPHP3.2.2框架行为扩展及demo示例
2018/06/19 PHP
js中escape对应的C#解码函数 UrlDecode
2012/12/16 Javascript
jQuery动态显示和隐藏datagrid中的某一列的方法
2013/12/11 Javascript
jQuery+HTML5美女瀑布流布局实现方法
2015/09/21 Javascript
jQuery插件Timelinr 实现时间轴特效
2015/10/04 Javascript
jQuery EasyUi实战教程之布局篇
2016/01/26 Javascript
AngularJS中run方法的巧妙运用
2017/01/04 Javascript
JavaScript实现移动端页面按手机屏幕分辨率自动缩放的最强代码
2017/08/18 Javascript
jquery在vue脚手架中的使用方式示例
2017/08/29 jQuery
利用js给datalist或select动态添加option选项的方法
2018/01/25 Javascript
angularJs中json数据转换与本地存储的实例
2018/10/08 Javascript
jquery无缝图片轮播组件封装
2020/11/25 jQuery
JS中的防抖与节流及作用详解
2019/04/01 Javascript
原生JavaScript之es6中Class的用法分析
2020/02/23 Javascript
Js和VUE实现跑马灯效果
2020/05/25 Javascript
Python实现微信公众平台自定义菜单实例
2015/03/20 Python
python实现文件快照加密保护的方法
2015/06/30 Python
简单了解python gevent 协程使用及作用
2019/07/22 Python
Django url,从一个页面调到另个页面的方法
2019/08/21 Python
Django+python服务器部署与环境部署教程详解
2020/03/30 Python
使用CSS3的box-sizing属性解决div宽高被内边距撑开的问题
2016/06/28 HTML / CSS
html5模拟平抛运动(模拟小球平抛运动过程)
2013/07/25 HTML / CSS
Fossil德国官网:化石手表、手袋、珠宝及配件
2019/12/07 全球购物
教育学专业实习生的自我鉴定
2013/11/26 职场文书
环境整治工作方案
2014/05/18 职场文书
高考学习决心书
2015/02/04 职场文书
关于清明节的演讲稿2015
2015/03/18 职场文书
公司行政管理制度范本
2015/08/05 职场文书
《海上日出》教学反思
2016/02/23 职场文书
Nginx 负载均衡是什么以及该如何配置
2021/03/31 Servers
自己搭建resnet18网络并加载torchvision自带权重的操作
2021/05/13 Python
Python实现提取PDF简历信息并存入Excel
2022/04/02 Python