Python headers请求头如何实现快速添加


Posted in Python onNovember 03, 2020

1、为什么要设置headers?

在请求网页爬取的时候,输出的text信息中会出现抱歉,无法访问等字眼,这就是禁止爬取,需要通过反爬机制去解决这个问题。

headers是解决requests请求反爬的方法之一,相当于我们进去这个网页的服务器本身,假装自己本身在爬取数据。

对反爬虫网页,可以设置一些headers信息,模拟成浏览器取访问网站 。

2、 headers在哪里找?

谷歌或者火狐浏览器,在网页面上点击:右键?>检查?>剩余按照图中显示操作,需要按Fn+F5刷新出网页来

有的浏览器是点击:右键->查看元素,刷新

Python爬虫中Requests设置请求头Headers的方法

注意:headers中有很多内容,主要常用的就是user-agent 和 host,他们是以键对的形式展现出来,如果user-agent 以字典键对形式作为headers的内容,就可以反爬成功,就不需要其他键对;否则,需要加入headers下的更多键对形式。

代码如下

import re
# 下方引号内添加替换掉请求头内容
headers_str = """
Accept: application/json, text/javascript, */*; q=0.01
Accept-Encoding: gzip, deflate, br
Accept-Language: zh-CN,zh;q=0.9,en;q=0.8
Cache-Control: no-cache
Connection: keep-alive
Content-Length: 77
Content-Type: application/json
User-Agent: Mozilla/5.0 (iPhone; CPU iPhone OS 13_2_3 like Mac OS X) AppleWebKit/605.1.15 (KHTML, like Gecko) Version/13.0.3 Mobile/15E148 Safari/604.1
X-Apple-App-Id: 632
X-Apple-Frame-Id: daw-10beaddd-c22f-4fd4-8aba-ef4909a721dd
X-Requested-With: XMLHttpRequest
"""
pattern = '^(.*?):(.*)$'
for line in headers_str.splitlines():
  print(re.sub(pattern,'\'\\1\':\'\\2\',',line).replace(' ',''))

结果

Python headers请求头如何实现快速添加

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python实现向ppt文件里插入新幻灯片页面的方法
Apr 28 Python
一个月入门Python爬虫学习,轻松爬取大规模数据
Jan 03 Python
Python爬虫包BeautifulSoup学习实例(五)
Jun 17 Python
python将一组数分成每3个一组的实例
Nov 14 Python
Django异步任务之Celery的基本使用
Mar 23 Python
Python爬虫:将headers请求头字符串转为字典的方法
Aug 21 Python
Python aiohttp百万并发极限测试实例分析
Oct 26 Python
Python任务调度模块APScheduler使用
Apr 15 Python
Python 发送邮件方法总结
Aug 10 Python
Python requests HTTP验证登录实现流程
Nov 05 Python
python通用数据库操作工具 pydbclib的使用简介
Dec 21 Python
Python NumPy灰度图像的压缩原理讲解
Aug 04 Python
python time()的实例用法
Nov 03 #Python
Python-openpyxl表格读取写入的案例详解
Nov 02 #Python
Python常用扩展插件使用教程解析
Nov 02 #Python
python实现三壶谜题的示例详解
Nov 02 #Python
python 实现批量图片识别并翻译
Nov 02 #Python
基于python实现百度语音识别和图灵对话
Nov 02 #Python
用python进行视频剪辑
Nov 02 #Python
You might like
php中将时间差转换为字符串提示的实现代码
2011/08/08 PHP
php中单个数据库字段多列显示(单字段分页、横向输出)
2014/07/28 PHP
php批量删除数据库下指定前缀的表以prefix_为例
2014/08/24 PHP
php微信公众平台开发类实例
2015/04/01 PHP
php使用ffmpeg向视频中添加文字字幕的实现方法
2016/05/23 PHP
Laravle eloquent 多对多模型关联实例详解
2017/11/22 PHP
PHP日志LOG类定义与用法示例
2018/09/06 PHP
Laravel 数据库加密及数据库表前缀配置方法
2019/10/10 PHP
php解析非标准json、非规范json的方式实例
2020/12/10 PHP
一个XML格式数据转换为图表的例子
2010/02/09 Javascript
理解javascript中的回调函数(callback)
2014/09/02 Javascript
Angularjs制作简单的路由功能demo
2015/04/14 Javascript
浅谈Node.js:fs文件系统模块
2016/12/08 Javascript
AngularJS 仿微信图片手势缩放的实例
2017/09/28 Javascript
vue请求本地自己编写的json文件的方法
2019/04/25 Javascript
tracking.js实现前端人脸识别功能
2020/04/16 Javascript
vue项目使用$router.go(-1)返回时刷新原来的界面操作
2020/07/26 Javascript
原生JS实现多条件筛选
2020/08/19 Javascript
Python基于pillow判断图片完整性的方法
2016/09/18 Python
python: 自动安装缺失库文件的方法
2018/10/22 Python
在Pycharm中设置默认自动换行的方法
2019/01/16 Python
在python带权重的列表中随机取值的方法
2019/01/23 Python
pytorch 输出中间层特征的实例
2019/08/17 Python
Python 下载及安装详细步骤
2019/11/04 Python
Python pip安装模块提示错误解决方案
2020/05/22 Python
详解torch.Tensor的4种乘法
2020/09/03 Python
Mio Skincare法国官网:身体紧致及孕期身体护理
2018/04/04 全球购物
供货协议书范本
2014/04/22 职场文书
拔河比赛口号
2014/06/10 职场文书
瘦西湖导游词
2015/02/03 职场文书
孔庙导游词
2015/02/04 职场文书
营业员岗位职责
2015/02/11 职场文书
广告业务员岗位职责
2015/02/13 职场文书
签订劳动合同通知书
2015/04/16 职场文书
pytorch DataLoader的num_workers参数与设置大小详解
2021/05/28 Python
MySQL笔记 —SQL运算符
2022/01/18 MySQL