python爬虫快速响应服务器的做法


Posted in Python onNovember 24, 2020

不论是打开网页或者爬取一些资料的时候,我们想要的是计算机能在最短的时间内运行出结果,不然等待的时间过长会影响下一步工作的计划。这时候我们可以给计算机一个指令,限制最久能等待的时间,在我们能接受的时间内运行出结果。那么这个指令方法是什么呢?接下来我们一起看看吧。

requests之所以称为“HTTP for human”,因为其封装层次很高,其中一处体现就在:requests会自动处理服务器响应的重定向。我在做搜狗微信公众号抓取的时候,搜狗搜索列表页面的公众号文章地址,其实不是微信的地址而需要请求到搜狗到服务器做重定向,而requests的默认处理则是将整个过程全部搞定,对此可以这样:

In [1]: r = requests.get('http://xlzd.me', allow_redirects=False)

allow_redirects参数为False则表示不会主动重定向。

另外,有时候对方网站的响应时间太长了,我们希望在指定时间内完事,或者直接停止这个请求,这时候的做法是:

In [1]: r = requests.get('http://xlzd.me', timeout=3)

timeout表示这次请求最长我最长只等待多少秒

拓展:

为requests套上一层代理的做法也非常简单:

import requests
proxies = {
 "http": "http://192.168.31.1:3128",
 "https": "http://10.10.1.10:1080",
}
requests.get("http://xlzd.me", proxies=proxies)

到此这篇关于python爬虫快速响应服务器的做法的文章就介绍到这了,更多相关python爬虫中如何快速响应服务器内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
Python的__builtin__模块中的一些要点知识
May 02 Python
机器学习python实战之决策树
Nov 01 Python
python通过百度地图API获取某地址的经纬度详解
Jan 28 Python
Python数据分析之双色球基于线性回归算法预测下期中奖结果示例
Feb 08 Python
Python中py文件引用另一个py文件变量的方法
Apr 29 Python
Python实现注册、登录小程序功能
Sep 21 Python
使用Selenium破解新浪微博的四宫格验证码
Oct 19 Python
Python实现打砖块小游戏代码实例
May 18 Python
python中seaborn包常用图形使用详解
Nov 25 Python
Python selenium环境搭建实现过程解析
Sep 08 Python
pycharm实现猜数游戏
Dec 07 Python
Python函数对象与闭包函数
Apr 13 Python
PyCharm Community安装与配置的详细教程
Nov 24 #Python
python3爬虫GIL修改多线程实例讲解
Nov 24 #Python
Django URL参数Template反向解析
Nov 24 #Python
python3爬虫中引用Queue的实例讲解
Nov 24 #Python
python3爬虫中多线程的优势总结
Nov 24 #Python
利用python+ffmpeg合并B站视频及格式转换的实例代码
Nov 24 #Python
python 如何停止一个死循环的线程
Nov 24 #Python
You might like
用Flash图形化数据(二)
2006/10/09 PHP
PHP Zip压缩 在线对文件进行压缩的函数
2010/05/26 PHP
PHP实现的蚂蚁爬杆路径算法代码
2015/12/03 PHP
php对接java现实加签验签的实例
2016/11/25 PHP
php 删除指定文件夹的实例讲解
2017/07/25 PHP
通过jquery实现tab标签浏览效果
2007/02/20 Javascript
innertext , insertadjacentelement , insertadjacenthtml , insertadjacenttext 等区别
2007/06/29 Javascript
使用jQuery.Validate进行客户端验证(初级篇) 不使用微软验证控件的理由
2010/06/28 Javascript
Jquery UI震动效果实现原理及步骤
2013/02/04 Javascript
地址栏传递中文参数乱码在js里用escape转码
2013/08/28 Javascript
文本框只能选择数据到文本框禁止手动输入
2013/11/22 Javascript
js常用自定义公共函数汇总
2014/01/15 Javascript
jQuery的css()方法用法实例
2014/12/24 Javascript
基于jQuery.Hz2Py.js插件实现的汉字转拼音特效
2015/05/07 Javascript
JavaScript的React框架中的JSX语法学习入门教程
2016/03/05 Javascript
js实现模糊匹配功能
2017/02/15 Javascript
Vue.js如何优雅的进行form validation
2017/04/07 Javascript
重学 JS:为啥 await 不能用在 forEach 中详解
2019/04/15 Javascript
如何利用JavaScript编写更好的条件语句详解
2020/08/10 Javascript
JS实现炫酷雪花飘落效果
2020/08/19 Javascript
在SAE上部署Python的Django框架的一些问题汇总
2015/05/30 Python
详解python3百度指数抓取实例
2016/12/12 Python
Python下载网络小说实例代码
2018/02/03 Python
Django 路由控制的实现代码
2018/11/08 Python
python支付宝支付示例详解
2019/08/22 Python
Python容器类型公共方法总结
2020/08/19 Python
python statsmodel的使用
2020/12/21 Python
基于PyTorch中view的用法说明
2021/03/03 Python
TCP/IP模型的分界线
2012/12/01 面试题
酒店员工职业生涯规划
2014/02/25 职场文书
舞蹈教育学专业自荐信
2014/06/15 职场文书
2016感恩母亲节校园广播稿
2015/12/17 职场文书
股权投资协议书
2016/03/23 职场文书
2016年全国助残日活动总结
2016/04/01 职场文书
MySQL COUNT函数的使用与优化
2021/05/10 MySQL
《勇者辞职不干了》上卷BD发售宣传CM公开
2022/04/08 日漫