编程 Python

Python中request的基本使用解决乱码问题

Posted in Python onApril 12, 2022

各种请求方式

pip3 install requests
&gt;&gt;&gt; import requests
&gt;&gt;&gt; r = requests.get('https://www.cnblogs.com')
&gt;&gt;&gt; r = requests.post('https://www.cnblogs.com', data = {'key':'value'})
&gt;&gt;&gt; r = requests.put('https://www.cnblogs.com', data = {'key':'value'})
&gt;&gt;&gt; r = requests.delete('https://www.cnblogs.com')
&gt;&gt;&gt; r = requests.head('https://www.cnblogs.com')
&gt;&gt;&gt; r = requests.options('https://www.cnblogs.com')

request各种参数

参数	说明
params	字典或字节序列，作为参数增加到url中
data	字典，字节序列或文件对象，作为request的内容
json	JSON格式的数据，作为request的内容
headers	字典，HTTP定制头
cookies	字典或CookieJar， request中的cookie
auth	元组，支持HTTp认证功能
files	字典类型，传输文件
timeout	设定超时时间，秒为单位
proxies	字典类型，设定访问代理服务器，可以增加登录认证
allow_redirects	重定向开关，默认为True
stream	获取内容立即下载开关，默认为True
verify	认证SSL证书开关，默认为True
cert	本地SSL证书路径

request基本使用

import requests
response = requests.get('https://www.cnblogs.com/kermitjam/')
print(response.text)

print(respone.text)  # 响应体转成str
print(respone.content)  # 响应体二进制（图片，视频）
print(respone.status_code)  # 响应状态码
print(respone.headers)  # 响应头
print(respone.cookies)  # 服务端返回的cookie
print(respone.cookies.get_dict())  # 转成字典
print(respone.cookies.items())
print(respone.url)  # 当次请求的地址
print(respone.history)  # 如果有重定向，放到一个列表中.查看上一次请求从哪里来。(图片防盗链)
print(respone.encoding)  # 编码方式
print(respone.iter_content())  # 视频，图片迭代取值
content-length   # 查看下载前文件大小


response.iter_content() # 视频，图片迭代取值
with open("a.mp4",'wb') as f:
    for line in response.iter_content():
        f.write(line)

get请求携带参数

# 方式一：会转码,不推荐
response = requests.get('https://www.baidu.com/s?wd=%E7%BE%8E%E5%A5%B3')

# 方式二：推荐
response = requests.get('https://www.baidu.com/',params={'name':'美女','age':18})

get请求携带headers头

respone = requests.get('http://127.0.0.1:8000/',params={'name':'美女','age':18},
                   headers={
                       # 标志，什么东西发出的请求，浏览器信息，django框架，从哪取？（meta）
                       'User-Agent': 'request',
                       # 上一个页面的地址，图片防盗链
                       'Referer': 'xxx'
                   })
print(respone.status_code)

get请求携带cookie

带cookie,随机字符串(用户信息：也代表session)，不管后台用的token认证，还是session认证

一旦登陆了，带着cookie发送请求，表示登陆了（下单，12306买票，评论）

# 第一种方式
ret = requests.get('http://127.0.0.1:8000/',params={'name':'美女','age':18},
                   headers={
                       'cookie': 'key3=value;key2=value',
                   })

# 第二种方式
ret = requests.get('http://127.0.0.1:8000/',params={'name':'美女','age':18},
                   cookies={"islogin":"xxx"})
print(ret.status_code)

post请求携带数据(注册、登录)

# data:urlencoded编码
ret = requests.post('http://127.0.0.1:8000/', data={'name': "jeff", 'age': 18})


# data:json编码
import json
data = json.dumps({'name': "jeff", 'age': 18})
ret = requests.post('http://127.0.0.1:8000/', json=data)
print(ret)
# 注意：编码格式是请求头中带的，所以可以手动修改，在headers中改

session对象

# session对象
session=requests.session()
# 跟requests.get/post用起来完全一样，但是它处理了cookie
# 假设是一个登陆，并且成功
res = session.post('http://127.0.0.1:8000/')
# # 再向该网站发请求，就是登陆状态，不需要手动携带cookie
res = session.get("http://127.0.0.1:8000/")

print(res)

乱码问题

# 加载回来的页面，打印出来，乱码（我们用的是utf8编码），如果网站用gbk，

ret = requests.get('http://127.0.0.1:8000/')
ret.encoding='gbk'  # 修改编码

print(ret.apparent_encoding)  # 当前页面的编码
# ret.encoding = ret.apparent_encoding
print(ret.encoding)
print(ret.apparent_encoding)

解析json数据

# 返回数据，有可能是json格式，有可能是html格式
ret=requests.get('http://127.0.0.1:8000/')
# print(type(ret.text))
# print(ret.text)

a=ret.json()
print(a['name'])
print(type(a))

使用代理

代理简单解释：
	代理其实就是一个中介，A和B本来可以直连，中间插入一个C，C就是中介。
	
#高匿：服务端，根本不知道我是谁
#普通：服务端是能够知道我的ip的
#http请求头中：X-Forwarded-For：代理的过程

爬虫使用正向代理好处：
	1.突破频率限制。做个代理池，每次请求都是不同的Ip,服务器认为是不同的用户
	2.不会封自己的ip。

正向代理即是客户端代理, 代理客户端, 服务端不知道实际发起请求的客户端.
反向代理即是服务端代理, 代理服务端, 客户端不知道实际提供服务的服务端

ret = requests.get('https://www.pearvideo.com/', proxies={'http': '47.115.54.89'})
print(type(ret.text))
print(ret.text)

上传文件

# 爬虫用的比较少，后台写服务

file = {'myfile': open("1.txt", 'rb')}
ret = requests.post('http://127.0.0.1:8000/', files=file)
print(ret.content)

以上就是request基本使用及各种请求方式参数的示例的详细内容！

Python中request的基本使用解决乱码问题

- Author -

Jeff的技术栈

- Original Sources -

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

python获取本机mac地址和ip地址的方法

Apr 29 Python

python实现备份目录的方法

Aug 03 Python

如何在Python函数执行前后增加额外的行为

Oct 20 Python

Python分治法定义与应用实例详解

Jul 28 Python

python爬取基于m3u8协议的ts文件并合并

Apr 26 Python

使用Python中的reduce()函数求积的实例

Jun 28 Python

Python3.x+pyqtgraph实现数据可视化教程

Mar 14 Python

python实现五子棋程序

Apr 24 Python

浅析关于Keras的安装(pycharm)和初步理解

Oct 23 Python

Flask-SocketIO服务端安装及使用代码示例

Nov 26 Python

Python编写冷笑话生成器

Apr 20 Python

python实现简单的三子棋游戏

Apr 28 Python

python模拟浏览器使用selenium进入好友QQ空间并留言

Python安装使用Scrapy框架

Python使用华为API为图像设置多个锚点标签

python实现手机推送代码也就10行左右

Apr 12 #Python

Python内置包对JSON文件数据进行编码和解码

详细介绍python操作RabbitMq

Python selenium绕过webdriver监测执行javascript

Apr 12 #Python

You might like

一个PHP验证码类代码分享(已封装成类)

2011/07/17 PHP

浅谈php自定义错误日志

2015/02/13 PHP

PHP实现数组根据某个单元字段排序操作示例

2018/08/01 PHP

新鲜出炉的js tips提示效果

2011/04/03 Javascript

各浏览器中querySelector和querySelectorAll的实现差异分析

2012/05/23 Javascript

jqGrid日期格式的判断示例代码(开始日期与结束日期)

2013/11/08 Javascript

asm.js使用示例代码

2013/11/28 Javascript

js图片滚动效果时间可随意设定当鼠标移上去时停止

2014/06/26 Javascript

Flexigrid在IE下不显示数据的有效处理方法

2014/09/04 Javascript

bootstrap选项卡使用方法解析

2017/01/11 Javascript

基于zTree树形菜单的使用实例

2017/12/25 Javascript

JavaScript实现多态和继承的封装操作示例

2018/08/20 Javascript

微信小程序实现打开并下载服务器上面的pdf文件到手机

2019/09/20 Javascript

python链接Oracle数据库的方法

2015/06/28 Python

Python编程中对文件和存储器的读写示例

2016/01/25 Python

python如何在循环引用中管理内存

2018/03/20 Python

Python实现的直接插入排序算法示例

2018/04/29 Python

python实现逐个读取txt字符并修改

2018/12/24 Python

python可视化实现代码

2019/01/15 Python

Python使用ctypes调用C/C++的方法

2019/01/29 Python

Python整数对象实现原理详解

2019/07/01 Python

python 获取sqlite3数据库的表名和表字段名的实例

2019/07/17 Python

Python 连接 MySQL 的几种方法

2020/09/09 Python

澳大利亚最受欢迎的美发和美容在线商店：Catwalk

2018/12/12 全球购物

Roxy俄罗斯官方网站：冲浪和滑雪板的一切

2020/06/20 全球购物

MIKI HOUSE美国官方网上商店：日本领先的婴儿和儿童高级时装品牌

2020/06/21 全球购物

腾讯公司的一个sql题

2013/01/22 面试题

市场营销毕业生自荐信

2013/11/23 职场文书

创业计划书的主要内容有哪些

2014/01/29 职场文书

小学生竞选班干部演讲稿

2014/04/24 职场文书

付款承诺函范文

2015/01/21 职场文书

会计实训总结范文

2015/08/03 职场文书

接收函

2019/04/22 职场文书

go语言中http超时引发的事故解决

2021/06/02 Golang

Javascript的promise,async和await的区别详解

2022/03/24 Javascript

为什么MySQL不建议使用SELECT *

2022/04/03 MySQL