编程 Python

Python的requests网络编程包使用教程

Posted in Python onJuly 11, 2016

早就听说requests的库的强大，只是还没有接触，今天接触了一下，发现以前使用urllib，urllib2等方法真是太搓了……
这里写些简单的使用初步作为一个记录

一、下载

官方项目页： https://pypi.python.org/pypi/requests/#downloads
可以从上面直接下载。

二、发送无参数的get请求

>>> r = requests.get('http://httpbin.org/get')
>>> print r.text
{
 "args": {}, 
 "headers": {
  "Accept": "*/*", 
  "Accept-Encoding": "gzip, deflate", 
  "Connection": "close", 
  "Host": "httpbin.org", 
  "User-Agent": "python-requests/2.3.0 CPython/2.6.6 Windows/7", 
  "X-Request-Id": "8a28bbea-55cd-460b-bda3-f3427d66b700"
 }, 
 "origin": "124.192.129.84", 
 "url": "http://httpbin.org/get"
}

三、发送带参数的get请求,将key与value放入一个字典中，通过params参数来传递,其作用相当于urllib.urlencode

>>> import requests
>>> pqyload = {'q':'杨彦星'}
>>> r = requests.get('http://www.so.com/s',params = pqyload)
>>> r.url
u'http://www.so.com/s?q=%E6%9D%A8%E5%BD%A6%E6%98%9F'

四、发送post请求，通过data参数来传递,

>>> payload = {'a':'杨','b':'hello'}
>>> r = requests.post("http://httpbin.org/post", data=payload)
>>> print r.text
{
 "args": {}, 
 "data": "", 
 "files": {}, 
 "form": {
  "a": "\u6768", 
  "b": "hello"
 }, 
 "headers": {
  "Accept": "*/*", 
  "Accept-Encoding": "gzip, deflate", 
  "Connection": "close", 
  "Content-Length": "19", 
  "Content-Type": "application/x-www-form-urlencoded", 
  "Host": "httpbin.org", 
  "User-Agent": "python-requests/2.3.0 CPython/2.6.6 Windows/7", 
  "X-Request-Id": "c81cb937-04b8-4a2d-ba32-04b5c0b3ba98"
 }, 
 "json": null, 
 "origin": "124.192.129.84", 
 "url": "http://httpbin.org/post"
}
>>>

可以看到，post参数已经传到了form里,data不光可以接受字典类型的数据，还可以接受json等格式

>>> payload = {'a':'杨','b':'hello'}
>>> import json
>>> r = requests.post('http://httpbin.org/post', data=json.dumps(payload))

五、发送文件的post类型，这个相当于向网站上传一张图片，文档等操作，这时要使用files参数

>>> url = 'http://httpbin.org/post'
>>> files = {'file': open('touxiang.png', 'rb')}
>>> r = requests.post(url, files=files)

定制headers，使用headers参数来传递

>>> import json
>>> url = 'https://api.github.com/some/endpoint'
>>> payload = {'some': 'data'}
>>> headers = {'content-type': 'application/json'}
>>> r = requests.post(url, data=json.dumps(payload), headers=headers)

六、响应内容
响应状态码：

r = requests.get('http://httpbin.org/get')
print r.status_code

响应头：

>>> print r.headers
{'content-length': '519', 'server': 'gunicorn/18.0', 'connection': 'keep-alive', 'date': 'Sun, 15 Jun 2014 14:19:52 GMT', 'access-control-allow-origin': '*', 'content-type': 'application/json'}

也可以取到这个个别的响应头用来做一些判断，这里的参数是不区分大小写的

r.headers[‘Content-Type']
r.headers.get(‘Content-Type')

响应内容，前面已经在应用了：

r.text
r.content

七、获取响应中的cookies

>>> r = requests.get('http://www.baidu.com')
>>> r.cookies['BAIDUID']
'D5810267346AEFB0F25CB0D6D0E043E6:FG=1'

也可以自已定义请求的COOKIES

>>> url = 'http://httpbin.org/cookies'
>>> cookies = {'cookies_are':'working'}
>>> r = requests.get(url,cookies = cookies)
>>> 
>>> print r.text
{
 "cookies": {
  "cookies_are": "working"
 }
}
>>>

cookies还有很多，因为目前我也还不是很多，以后再扩充吧

八、使用timeout参数设置超时时间

>>> requests.get('http://github.com', timeout=1) 
<Response [200]>

如果将时间设置成非常小的数，如

requests.get('http://github.com', timeout=0.001)

，那么如果在timeout的时间内没有连接，那么将会抛出一个Timeout的异常

九、访问中使用session
先初始化一个session对象，

s = requests.Session()

然后使用这个session对象来进行访问，r = s.post(url,data = user)
以下通过访问人人网来获取首页中的最近来访问，然后再访问查看更多的来访来读取更多的最近来访
更多的来访就是以带session的访问http://www.renren.com/myfoot.do

#coding:utf-8
import requests
import re
url = r'http://www.renren.com/ajaxLogin'
user = {'email':'email','password':'pass'}
s = requests.Session()
r = s.post(url,data = user)
html = r.text
visit = []
first = re.compile(r'</span><span class="time-tip first-tip"><span class="tip-content">(.*?)</span>')
second = re.compile(r'</span><span class="time-tip"><span class="tip-content">(.*?)</span>')
third = re.compile(r'</span><span class="time-tip last-second-tip"><span class="tip-content">(.*?)</span>')
last = re.compile(r'</span><span class="time-tip last-tip"><span class="tip-content">(.*?)</span>')
visit.extend(first.findall(html))
visit.extend(second.findall(html))
visit.extend(third.findall(html))
visit.extend(last.findall(html))
for i in visit:
  print i
print '以下是更多的最近来访'
vm = s.get('http://www.renren.com/myfoot.do')
fm = re.compile(r'"name":"(.*?)"')
visitmore = fm.findall(vm.text)
for i in visitmore:
  print i

Python的requests网络编程包使用教程

十、requests-cookies
Cookies就像字典一样储存了各个项的值并保存起来, 例如我们的用户名, 密码, 登录信息等都可以保存起来. 当网页再次被加载时可以从cookies中找到相关的信息并从而免除再次输入赋值的过程.
在requests中使用get等请求时同样可以赋予cookies信息. 例如我们从浏览器中获取某次网页加载时请求的cookies, 可以同样赋予requests再次使用.
requests请求时加入cookies={key:value}参数即可传递cookies.

import requests
url = 'http://httpbin.org/cookies'
cookies = dict(cookies_are='working')

r = requests.get(url, cookies=cookies)
r.text
#'{"cookies": {"cookies_are": "working"}}'

查询某次请求的cookies很简单, 就像获得headers一样使用cookies属性即可:

url = 'http://example.com/some/cookie/setting/url'
r = requests.get(url)

r.cookies['example_cookie_name']
# 'example_cookie_value'

以下函数可以分解浏览器获得的cookies字符串到一个字典,从而帮助我们模拟requests请求.

def browsercookiesdict(s):
 '''Covert cookies string from browser to a dict'''
 ss=s.split(';')
 outdict={}
 for item in ss:
 i1=item.split('=',1)[0].strip()
 i2=item.split('=',1)[1].strip()
 outdict[i1]=i2
 return outdict

Python的requests网络编程包使用教程

- Author -

Kevin_Yang

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

python的Template使用指南

Sep 11 Python

在Python的Django框架中simple-todo工具的简单使用

May 30 Python

python检查字符串是否是正确ISBN的方法

Jul 11 Python

浅谈Python类的__getitem__和__setitem__特殊方法

Dec 25 Python

python算法表示概念扫盲教程

Apr 13 Python

Python进阶之递归函数的用法及其示例

Jan 31 Python

Python构建图像分类识别器的方法

Jan 12 Python

Python多线程多进程实例对比解析

Mar 12 Python

python实现文字版扫雷

Apr 24 Python

详解python的xlwings库读写excel操作总结

Feb 26 Python

python 制作一个gui界面的翻译工具

May 14 Python

Jupyter notebook 不自动弹出网页的解决方案

May 21 Python

Python的SQLalchemy模块连接与操作MySQL的基础示例

Jul 11 #Python

Python中的异常处理相关语句基础学习笔记

Jul 11 #Python

Python编写简单的HTML页面合并脚本

Jul 11 #Python

Python中super()函数简介及用法分享

Jul 11 #Python

Swift中的协议(protocol)学习教程

Jul 08 #Python

Python中多线程的创建及基本调用方法

Jul 08 #Python

使用PyInstaller将Python程序文件转换为可执行程序文件

Jul 08 #Python

You might like

超外差式晶体管收音机的组装与统调

2021/03/01 无线电

php 空格,换行,跳格使用说明

2009/12/18 PHP

用PHP实现浏览器点击下载TXT文档的方法详解

2013/06/02 PHP

laravel安装和配置教程

2014/10/29 PHP

CI框架验证码CAPTCHA辅助函数用法实例

2014/11/05 PHP

深入理解PHP之源码目录结构与功能说明

2016/06/01 PHP

php删除数组指定元素实现代码

2017/05/03 PHP

jscript之Open an Excel Spreadsheet

2007/06/13 Javascript

firefox插件Firebug的使用教程

2010/01/02 Javascript

jQuery 获取对象定位子对象

2010/05/31 Javascript

jQuery学习笔记(2)--用jquery实现各种模态提示框代码及项目构架

2013/04/08 Javascript

解析js如何获取当前url中的参数值并复制给input

2013/06/23 Javascript

使用纯javascript实现经典扫雷游戏

2015/04/23 Javascript

详解AngularJS中的filter过滤器用法

2016/01/04 Javascript

Jquery技巧(必须掌握)

2016/03/16 Javascript

JS使用JSON作为参数实例分析

2016/06/23 Javascript

easyui combobox开启搜索自动完成功能的实例代码

2016/11/08 Javascript

js记录点击某个按钮的次数-刷新次数为初始状态的实例

2017/02/15 Javascript

nodejs基于mssql模块连接sqlserver数据库的简单封装操作示例

2018/01/05 NodeJs

js遍历详解(forEach, map, for, for...in, for...of)

2019/08/28 Javascript

JS如何生成随机验证码

2020/03/02 Javascript

原生js实现简单轮播图

2020/10/26 Javascript

python if not in 多条件判断代码

2016/09/21 Python

PyQt5下拉式复选框QComboCheckBox的实例

2019/06/25 Python

Selenium alert 弹窗处理的示例代码

2020/08/06 Python

HTML5中判断横屏竖屏的方法(移动端)

2016/08/04 HTML / CSS

草莓网化妆品澳大利亚站：Strawberrynet AU

2017/12/18 全球购物

荷兰超市：DEEN

2018/03/14 全球购物

加拿大租车网站：Enterprise Rent-A-Car

2018/07/26 全球购物

全球最大运动品牌的男装、女装和童装官方库存商：A&A Sports

2021/01/17 全球购物

网络工程系信息安全技术专业大学生求职信

2013/10/22 职场文书

自荐信的两点禁忌

2013/10/30 职场文书

财务部绩效考核方案

2014/05/04 职场文书

公益广告标语

2014/06/19 职场文书

法制宣传标语集锦

2014/06/25 职场文书

合作协议书格式

2014/08/19 职场文书