浅析Python requests 模块


Posted in Python onOctober 09, 2020

Python requests 模块

requests 模块是我们使用的 python爬虫 模块 可以完成市场进80%的爬虫需求。

安装

pip install requests

使用

requests模块代码编写的流程:

  • - 指定url
  • - 发起请求
  • - 获取响应对象中的数据
  • - 持久化存储
-------------案例-------------------------
import requests
# 指定url
url="https://www.sogou.com/"
# 发起请求
response = requests.get(url)
# 获取响应对象中的数据
page_text = response.text
# 持久化存储
with open('./sogou.html','w',encoding='utf-8') as fp:
  fp.write()
-------------------------------------------

参数

# post 数据
response = requests.post(url=url,data=data,headers=headers)

# get 数据
response = requests.get(url=url,data=data,headers=headers)

# 返回二进制数据
response.content 

# 返回字符串数据  
response.text  

# 返回json对象   
response.json()

其他了解

1、该模块实现爬取数据前需要查找需要爬取数据的指定URL,可通过浏览器自带抓包功能。

# 浏览器抓取 Ajax 请求
F12 --> Network --> XHR --> Name --> Response

2、上面的headers参数是进行UA伪装为了反反爬

反爬机制:UA检测 --> UA伪装

3、下面是http我们爬包是常用的请求头参数

- accept: 浏览器通过这个头告诉服务器,他所支持的数据类型
- Accept-Charset:浏览器通过这个头告诉服务器,它支持那种字符集

- Accept-Encoding:浏览器通过这个头告诉服务器,支持的压缩格式

- Accept-Language:浏览器通过这个头告诉服务器,他的语言环境

- Host:浏览器同过这个头告诉服务器,想访问哪台主机

- If-ModifiedSince:浏览器通过这个头告诉服务器,缓存数据的时间

- Heferer:浏览器通过这个头告诉服务器,客户及时那个页面来的,防盗链

- Connection:浏览器通过这个头告诉服务器,请求完后是断开链接还是保持链接

- X-Requested-With:XMLHttpRequest 代表通过ajax方式进行访问

- User-Agent:请求载体的身份标识

以上就是浅析Python requests 模块的详细内容,更多关于Python requests 模块的资料请关注三水点靠木其它相关文章!

Python 相关文章推荐
详解Python操作RabbitMQ服务器消息队列的远程结果返回
Jun 30 Python
Python 爬虫多线程详解及实例代码
Oct 08 Python
Python实现简易版的Web服务器(推荐)
Jan 29 Python
使用pandas中的DataFrame数据绘制柱状图的方法
Apr 10 Python
Python实现的根据IP地址计算子网掩码位数功能示例
May 23 Python
python3判断url链接是否为404的方法
Aug 10 Python
python 使用正则表达式按照多个空格分割字符的实例
Dec 20 Python
python自动化测试之DDT数据驱动的实现代码
Jul 23 Python
Python从文件中读取指定的行以及在文件指定位置写入
Sep 06 Python
Python实现报警信息实时发送至邮箱功能(实例代码)
Nov 11 Python
Python中关于logging模块的学习笔记
Jun 03 Python
Python判断远程服务器上Excel文件是否被人打开的方法
Jul 13 Python
Python特殊属性property原理及使用方法解析
Oct 09 #Python
python GUI计算器的实现
Oct 09 #Python
Numpy实现卷积神经网络(CNN)的示例
Oct 09 #Python
Python使用socket_TCP实现小文件下载功能
Oct 09 #Python
python实现逻辑回归的示例
Oct 09 #Python
Django生成数据库及添加用户报错解决方案
Oct 09 #Python
pip已经安装好第三方库但pycharm中import时还是标红的解决方案
Oct 09 #Python
You might like
通过缓存数据库结果提高PHP性能的原理介绍
2012/09/05 PHP
laravel-admin自动生成模块,及相关基础配置方法
2019/10/08 PHP
JQUERY 实现窗口滚动搜索框停靠效果(类似滚动停靠)
2013/03/27 Javascript
Javascript实现通过选择周数显示开始日和结束日的实现代码
2016/05/30 Javascript
jquery 实时监听输入框值变化的完美方法(必看)
2017/01/26 Javascript
jQuery滚动插件scrollable.js用法分析
2017/05/25 jQuery
详解Vuejs2.0 如何利用proxyTable实现跨域请求
2017/08/03 Javascript
Babel 入门教程学习笔记
2018/06/13 Javascript
Vue CLI3创建项目部署到Tomcat 使用ngrok映射到外网
2019/05/16 Javascript
vue-i18n结合Element-ui的配置方法
2019/05/20 Javascript
js实现打字小游戏
2019/12/17 Javascript
nodejs各种姿势断点调试的方法
2020/06/18 NodeJs
详解Vue的mixin策略
2020/11/19 Vue.js
Python的__builtin__模块中的一些要点知识
2015/05/02 Python
python字典DICT类型合并详解
2017/08/17 Python
Django使用Celery异步任务队列的使用
2018/03/13 Python
Python GUI布局尺寸适配方法
2018/10/11 Python
python匹配两个短语之间的字符实例
2018/12/25 Python
Django基础知识 web框架的本质详解
2019/07/18 Python
调用其他python脚本文件里面的类和方法过程解析
2019/11/15 Python
Django前后端分离csrf token获取方式
2020/12/25 Python
Python第三方库安装缓慢的解决方法
2021/02/06 Python
基于第一个PhoneGap(cordova)的应用详解
2013/05/03 HTML / CSS
阿里云:Aliyun.com
2017/02/15 全球购物
基督教卡片、励志礼品、家居装饰等:DaySpring
2018/10/12 全球购物
乌克兰巴士票购买网站:inBus
2021/03/12 全球购物
什么是Smarty变量操作符?如何使用Smarty变量操作符
2014/07/18 面试题
简单的JAVA编程面试题
2013/03/19 面试题
2015年幼儿园毕业感言
2014/02/12 职场文书
英语求职信范文
2014/05/23 职场文书
幼儿园小班教师个人工作总结
2015/02/06 职场文书
环卫处个人工作总结
2015/03/04 职场文书
酒店宣传语大全
2015/07/13 职场文书
幼儿园亲子活动感想
2015/08/07 职场文书
html+css实现赛博朋克风格按钮
2021/05/26 HTML / CSS
用Python监控你的朋友都在浏览哪些网站?
2021/05/27 Python