浅析Python requests 模块


Posted in Python onOctober 09, 2020

Python requests 模块

requests 模块是我们使用的 python爬虫 模块 可以完成市场进80%的爬虫需求。

安装

pip install requests

使用

requests模块代码编写的流程:

  • - 指定url
  • - 发起请求
  • - 获取响应对象中的数据
  • - 持久化存储
-------------案例-------------------------
import requests
# 指定url
url="https://www.sogou.com/"
# 发起请求
response = requests.get(url)
# 获取响应对象中的数据
page_text = response.text
# 持久化存储
with open('./sogou.html','w',encoding='utf-8') as fp:
  fp.write()
-------------------------------------------

参数

# post 数据
response = requests.post(url=url,data=data,headers=headers)

# get 数据
response = requests.get(url=url,data=data,headers=headers)

# 返回二进制数据
response.content 

# 返回字符串数据  
response.text  

# 返回json对象   
response.json()

其他了解

1、该模块实现爬取数据前需要查找需要爬取数据的指定URL,可通过浏览器自带抓包功能。

# 浏览器抓取 Ajax 请求
F12 --> Network --> XHR --> Name --> Response

2、上面的headers参数是进行UA伪装为了反反爬

反爬机制:UA检测 --> UA伪装

3、下面是http我们爬包是常用的请求头参数

- accept: 浏览器通过这个头告诉服务器,他所支持的数据类型
- Accept-Charset:浏览器通过这个头告诉服务器,它支持那种字符集

- Accept-Encoding:浏览器通过这个头告诉服务器,支持的压缩格式

- Accept-Language:浏览器通过这个头告诉服务器,他的语言环境

- Host:浏览器同过这个头告诉服务器,想访问哪台主机

- If-ModifiedSince:浏览器通过这个头告诉服务器,缓存数据的时间

- Heferer:浏览器通过这个头告诉服务器,客户及时那个页面来的,防盗链

- Connection:浏览器通过这个头告诉服务器,请求完后是断开链接还是保持链接

- X-Requested-With:XMLHttpRequest 代表通过ajax方式进行访问

- User-Agent:请求载体的身份标识

以上就是浅析Python requests 模块的详细内容,更多关于Python requests 模块的资料请关注三水点靠木其它相关文章!

Python 相关文章推荐
python爬取网站数据保存使用的方法
Nov 20 Python
Python os模块中的isfile()和isdir()函数均返回false问题解决方法
Feb 04 Python
python获取当前时间对应unix时间戳的方法
May 15 Python
django 发送邮件和缓存的实现代码
Jul 18 Python
Flask实现跨域请求的处理方法
Sep 27 Python
opencv实现图片模糊和锐化操作
Nov 19 Python
python 根据字典的键值进行排序的方法
Jul 24 Python
Python(PyS60)实现简单语音整点报时
Nov 18 Python
如何基于Python + requests实现发送HTTP请求
Jan 13 Python
python GUI库图形界面开发之PyQt5滚动条控件QScrollBar详细使用方法与实例
Mar 06 Python
ASP.NET Core中的配置详解
Feb 05 Python
基于Python实现流星雨效果的绘制
Mar 18 Python
Python特殊属性property原理及使用方法解析
Oct 09 #Python
python GUI计算器的实现
Oct 09 #Python
Numpy实现卷积神经网络(CNN)的示例
Oct 09 #Python
Python使用socket_TCP实现小文件下载功能
Oct 09 #Python
python实现逻辑回归的示例
Oct 09 #Python
Django生成数据库及添加用户报错解决方案
Oct 09 #Python
pip已经安装好第三方库但pycharm中import时还是标红的解决方案
Oct 09 #Python
You might like
smarty中post用法实例
2014/11/28 PHP
PHP实现模拟http请求的方法分析
2017/12/20 PHP
javascript脚本编程解决考试分数统计问题
2008/10/18 Javascript
JavaScript高级程序设计阅读笔记(十六) javascript检测浏览器和操作系统-detect.js
2012/08/14 Javascript
js局部刷新页面时间具体实现
2013/07/04 Javascript
SOSO地图JS画出标注和中心点以html形式运行
2013/08/09 Javascript
jquery.hotkeys监听键盘按下事件keydown插件
2014/05/11 Javascript
在JavaScript的AngularJS库中进行单元测试的方法
2015/06/23 Javascript
jquery form表单获取内容以及绑定数据
2016/02/24 Javascript
javascript使用闭包模拟对象的私有属性和方法
2016/10/05 Javascript
javascript 判断是否是微信浏览器的方法
2016/10/09 Javascript
js实现兼容PC端和移动端滑块拖动选择数字效果
2017/02/16 Javascript
详解JS获取HTML DOM元素的8种方法
2017/06/17 Javascript
JS禁止浏览器右键查看元素或按F12审查元素自动关闭页面示例代码
2017/09/07 Javascript
深入理解JavaScript的async/await
2018/08/05 Javascript
使用vuex较为优雅的实现一个购物车功能的示例代码
2019/12/09 Javascript
nodejs使用Sequelize框架操作数据库的实现
2020/10/21 NodeJs
vue-cli3自动消除console.log()的调试信息方式
2020/10/21 Javascript
[02:16]深扒TI7聊天轮盘语音出处2
2017/05/11 DOTA
[00:32]2018DOTA2亚洲邀请赛Liquid出场
2018/04/03 DOTA
python中合并两个文本文件并按照姓名首字母排序的例子
2014/04/25 Python
用Python实现命令行闹钟脚本实例
2016/09/05 Python
Django处理Ajax发送的Get请求代码详解
2019/07/29 Python
python 实现list或string按指定分段
2019/12/25 Python
python读取tif图片时保留其16bit的编码格式实例
2020/01/13 Python
python3.8下载及安装步骤详解
2020/01/15 Python
Python查找不限层级Json数据中某个key或者value的路径方式
2020/02/27 Python
解决echarts中饼图标签重叠的问题
2020/05/16 Python
python3中for循环踩过的坑记录
2020/12/14 Python
手工制作的意大利太阳镜和光学元件:Illesteva
2019/01/19 全球购物
俄罗斯隐形眼镜和眼镜在线商店:Cronos
2020/06/02 全球购物
爱祖国爱家乡演讲稿
2014/09/02 职场文书
购房个人委托书范本
2014/10/11 职场文书
2015年客房服务员工作总结
2015/05/15 职场文书
教师病假条范文
2015/08/17 职场文书
装修安全责任协议书
2016/03/22 职场文书