python爬虫基础教程:requests库(二)代码实例


Posted in Python onApril 09, 2019

get请求

简单使用

import requests
'''
想要学习Python?Python学习交流群:973783996满足你的需求,资料都已经上传群文件,可以自行下载!
'''
response = requests.get("https://www.baidu.com/")
#text返回的是unicode的字符串,可能会出现乱码情况
# print(response.text)
 
#content返回的是字节,需要解码
print(response.content.decode('utf-8'))
 
 
# print(response.url)       #https://www.baidu.com/
# print(response.status_code)   #200
# print(response.encoding)    #ISO-8859-1

添加headers和params

import requests
 
params = {
  'wd':'python'
}
headers = {
  'User-Agent':'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/64.0.3282.140 Safari/537.36'
}
 
response = requests.get("https://www.baidu.com/s",params=params,headers=headers)
 
#content返回的是字节,需要解码
with open('baidu.html','w',encoding='utf-8') as f:
  f.write(response.content.decode('utf-8'))

POST请求

爬去拉钩网职位信息

import requests
 
url = "https://www.lagou.com/jobs/positionAjax.json?city=%E5%8C%97%E4%BA%AC&needAddtionalResult=false"
 
data = {
  'first':'true',
  'pn':1,
  'kd':'python'
}
 
headers = {
  "User-Agent":"Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/64.0.3282.140 Safari/537.36",
  "Referer":"https://www.lagou.com/jobs/list_python?city=%E5%8C%97%E4%BA%AC&cl=false&fromSearch=true&labelWords=&suginput="
}
 
response = requests.post(url,data=data,headers=headers)
# print(response.text)
print(type(response.text))    #<class 'str'>
print(type(response.json()))   #<class 'dict'>
 
print(response.json())      #获取为字典的形式

使用代理

import requests
 
proxy = {'http':'115.210.31.236.55:9000'}
 
response = requests.get("https://www.baidu.com/",proxies=proxy)
 
print(response.content.decode('utf-8'))

session登录

# _*_ coding:utf-8 _*_
 
import requests
 
# 1. 创建session对象,可以保存Cookie值
ssion = requests.session()
 
# 2. 处理 headers
headers = {'User-Agent':'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/60.0.3112.101 Safari/537.36'}
 
# 3. 需要登录的用户名和密码
data = {"email":"158xxxxxxxx", "password":"pythonxxxxxxx"}
 
# 4. 发送附带用户名和密码的请求,并获取登录后的Cookie值,保存在ssion里
ssion.post("http://www.renren.com/PLogin.do", data = data)
 
# 5. ssion包含用户登录后的Cookie值,可以直接访问那些登录后才可以访问的页面
response = ssion.get("http://zhibo.renren.com/news/108")
 
# 6. 打印响应内容
print(response.text)
 

以上所述是小编给大家介绍的python爬虫基础教程:requests库(二)详解整合,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对三水点靠木网站的支持!

Python 相关文章推荐
打印出python 当前全局变量和入口参数的所有属性
Jul 01 Python
Python常见数据结构详解
Jul 24 Python
在Python的Flask框架中实现单元测试的教程
Apr 20 Python
Python 2.x如何设置命令执行的超时时间实例
Oct 19 Python
Python多线程threading模块用法实例分析
May 22 Python
对Python强大的可变参数传递机制详解
Jun 13 Python
Python参数类型以及常见的坑详解
Jul 08 Python
python实现飞机大战游戏(pygame版)
Oct 26 Python
基于nexus3配置Python仓库过程详解
Jun 15 Python
Python tkinter界面实现历史天气查询的示例代码
Aug 23 Python
2021年pycharm的最新安装教程及基本使用图文详解
Apr 03 Python
如何使用PyCharm及常用配置详解
Jun 03 Python
一个可以套路别人的python小程序实例代码
Apr 09 #Python
Python装饰器限制函数运行时间超时则退出执行
Apr 09 #Python
详解Python 解压缩文件
Apr 09 #Python
Python使用pandas和xlsxwriter读写xlsx文件的方法示例
Apr 09 #Python
Python中使用logging和traceback模块记录日志和跟踪异常
Apr 09 #Python
由Python编写的MySQL管理工具代码实例
Apr 09 #Python
python实现爬山算法的思路详解
Apr 09 #Python
You might like
咖啡历史、消费和行业趋势
2021/03/03 咖啡文化
杏林同学录(七)
2006/10/09 PHP
php 实现进制转换(二进制、八进制、十六进制)互相转换实现代码
2010/10/22 PHP
PHP文件锁函数flock()详细介绍
2014/11/18 PHP
php使用Imagick生成图片的方法
2015/07/31 PHP
PHP定时执行任务的3种方法详解
2015/12/21 PHP
php面试中关于面向对象的相关问题
2019/02/13 PHP
PHP的微信支付接口使用方法讲解
2019/03/08 PHP
11种ASP连接数据库的方法
2015/09/18 Javascript
有关json_decode乱码及NULL的问题
2015/10/13 Javascript
单行 JS 实现移动端金钱格式的输入规则
2017/05/22 Javascript
vue增删改查的简单操作
2017/07/15 Javascript
详解如何让InstantClick兼容MathJax、百度统计等
2017/09/12 Javascript
移动前端图片压缩上传的实例
2017/12/06 Javascript
jQuery实现滚动到底部时自动加载更多的方法示例
2018/02/18 jQuery
Nodejs核心模块之net和http的使用详解
2019/04/02 NodeJs
jQuery/JS监听input输入框值变化实例
2019/10/17 jQuery
使用JavaScript实现贪吃蛇游戏
2020/09/29 Javascript
vue实现一个获取按键展示快捷键效果的Input组件
2021/01/13 Vue.js
[10:53]2018DOTA2国际邀请赛寻真——EG
2018/08/11 DOTA
Python实现求最大公约数及判断素数的方法
2015/05/26 Python
windows上安装Anaconda和python的教程详解
2017/03/28 Python
python实现xlsx文件分析详解
2018/01/02 Python
python 限制函数执行时间,自己实现timeout的实例
2019/01/12 Python
python代理工具mitmproxy使用指南
2019/07/04 Python
Python多重继承之菱形继承的实例详解
2020/02/12 Python
英国领先的野生鸟类食品供应商:GardenBird
2018/08/09 全球购物
劳力士官方珠宝商:J.R. Dunn Jewelers
2018/09/29 全球购物
世界领先的电子书网站:eBooks.com(在线购买小说、非小说和教科书)
2019/03/30 全球购物
应届毕业生应聘自荐信
2013/12/07 职场文书
国际会议邀请函范文
2014/01/16 职场文书
模具毕业生推荐信
2014/02/15 职场文书
颁奖典礼主持词
2014/03/25 职场文书
鉴定评语大全
2014/05/05 职场文书
学生会干部自我鉴定2014
2014/09/18 职场文书
2015年感恩节演讲稿(优选篇)
2015/03/20 职场文书