python cookie反爬处理的实现


Posted in Python onNovember 01, 2020

Cookies的处理

作用
保存客户端的相关状态

在爬虫中如果遇到了cookie的反爬如何处理?

手动处理
    在抓包工具中捕获cookie,将其封装在headers中
    应用场景:cookie没有有效时长且不是动态变化

自动处理
 使用session机制
 使用场景:动态变化的cookie
 session对象:该对象和requests模块用法几乎一致.如果在请求的过程中产生了cookie,如果该请求使用session发起的,则cookie会被自动存储到session中.

案例

爬取雪球网中的新闻资讯数据:https://xueqiu.com/

#获取一个session对象
import requests
headers = {
  'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/75.0.3770.100 Safari/537.36'
}
session = requests.Session()
main_url = 'https://xueqiu.com' #推测对该url发起请求会产生cookie
session.get(main_url,headers=headers)
url = 'https://xueqiu.com/v4/statuses/public_timeline_by_category.json'
params = {
  'since_id': '-1',
  'max_id': '20346152',
  'count': '15',
  'category': '-1',
}
page_text = session.get(url,headers=headers,params=params).json()
page_text

到此这篇关于python cookie反爬处理的实现的文章就介绍到这了,更多相关python cookie反爬内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
Python中使用glob和rmtree删除目录子目录及所有文件的例子
Nov 21 Python
Python进程间通信用法实例
Jun 04 Python
让python 3支持mysqldb的解决方法
Feb 14 Python
Python中getpass模块无回显输入源码解析
Jan 11 Python
Python字符串格式化%s%d%f详解
Feb 02 Python
Python爬虫框架Scrapy常用命令总结
Jul 26 Python
用Python生成HTML表格的方法示例
Mar 06 Python
python怎么删除缓存文件
Jul 19 Python
python 逐步回归算法
Apr 06 Python
python 利用PyAutoGUI快速构建自动化操作脚本
May 31 Python
能让Python提速超40倍的神器Cython详解
Jun 24 Python
python神经网络学习 使用Keras进行简单分类
May 04 Python
10个python爬虫入门实例(小结)
Nov 01 #Python
利用pipenv和pyenv管理多个相互独立的Python虚拟开发环境
Nov 01 #Python
Python经纬度坐标转换为距离及角度的实现
Nov 01 #Python
详解Anaconda安装tensorflow报错问题解决方法
Nov 01 #Python
python Cartopy的基础使用详解
Nov 01 #Python
Python中使用aiohttp模拟服务器出现错误问题及解决方法
Oct 31 #Python
关于python中导入文件到list的问题
Oct 31 #Python
You might like
php学习笔记 PHP面向对象的程序设计
2011/06/13 PHP
完美解决PHP中的Cannot modify header information 问题
2013/08/12 PHP
php检测网页是否被百度收录的函数代码
2013/10/09 PHP
php中substr()函数参数说明及用法实例
2014/11/15 PHP
PHP jQuery+Ajax结合写批量删除功能
2017/05/19 PHP
如何用javascript去掉字符串里的所有空格
2007/02/08 Javascript
javascript 清除输入框中的数据
2009/04/13 Javascript
extjs grid设置某列背景颜色和字体颜色的实现方法
2010/09/06 Javascript
JS上传前预览图片实例
2013/03/25 Javascript
javascript禁用Tab键脚本实例
2013/11/22 Javascript
基于jquery css3实现点击动画弹出表单源码特效
2015/08/31 Javascript
Nodejs中解决cluster模块的多进程如何共享数据问题
2016/11/10 NodeJs
angularjs实现table增加tr的方法
2018/02/27 Javascript
webpack分离css单独打包的方法
2018/06/12 Javascript
vue 实现axios拦截、页面跳转和token 验证
2018/07/17 Javascript
Koa代理Http请求的示例代码
2018/10/10 Javascript
js中自定义react数据验证组件实例详解
2018/10/19 Javascript
浅谈在vue-cli3项目中解决动态引入图片img404的问题
2020/08/04 Javascript
解决vue项目中某一页面不想引用公共组件app.vue的问题
2020/08/14 Javascript
wepy--用vantUI 实现上弹列表并选择相应的值操作
2020/11/03 Javascript
Python读写unicode文件的方法
2015/07/10 Python
python目录与文件名操作例子
2016/08/28 Python
Python 中Django验证码功能的实现代码
2019/06/20 Python
python 实现单通道转3通道
2019/12/03 Python
使用Python发现隐藏的wifi
2020/03/04 Python
Python实现EM算法实例代码
2020/10/04 Python
基于CSS3的animation属性实现微信拍一拍动画效果
2020/06/22 HTML / CSS
美国最大点评网站:Yelp
2018/02/14 全球购物
一份婚庆公司创业计划书
2014/01/11 职场文书
一年级班主任感言
2014/03/08 职场文书
2014年财务科工作总结
2014/11/11 职场文书
婚礼父母答谢词
2015/01/04 职场文书
小学信息技术教学反思
2016/02/16 职场文书
2016年学校安全教育月活动总结
2016/04/06 职场文书
创业计划书之校园超市
2019/09/12 职场文书
JavaScript实现简单的音乐播放器
2022/08/14 Javascript