python cookie反爬处理的实现


Posted in Python onNovember 01, 2020

Cookies的处理

作用
保存客户端的相关状态

在爬虫中如果遇到了cookie的反爬如何处理?

手动处理
    在抓包工具中捕获cookie,将其封装在headers中
    应用场景:cookie没有有效时长且不是动态变化

自动处理
 使用session机制
 使用场景:动态变化的cookie
 session对象:该对象和requests模块用法几乎一致.如果在请求的过程中产生了cookie,如果该请求使用session发起的,则cookie会被自动存储到session中.

案例

爬取雪球网中的新闻资讯数据:https://xueqiu.com/

#获取一个session对象
import requests
headers = {
  'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/75.0.3770.100 Safari/537.36'
}
session = requests.Session()
main_url = 'https://xueqiu.com' #推测对该url发起请求会产生cookie
session.get(main_url,headers=headers)
url = 'https://xueqiu.com/v4/statuses/public_timeline_by_category.json'
params = {
  'since_id': '-1',
  'max_id': '20346152',
  'count': '15',
  'category': '-1',
}
page_text = session.get(url,headers=headers,params=params).json()
page_text

到此这篇关于python cookie反爬处理的实现的文章就介绍到这了,更多相关python cookie反爬内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
Python的Flask框架中集成CKeditor富文本编辑器的教程
Jun 13 Python
Python2与python3中 for 循环语句基础与实例分析
Nov 20 Python
微信跳一跳小游戏python脚本
Jan 05 Python
Python爬虫小技巧之伪造随机的User-Agent
Sep 13 Python
Python实现的旋转数组功能算法示例
Feb 23 Python
Python OpenCV 使用滑动条来调整函数参数的方法
Jul 08 Python
Django基础知识 web框架的本质详解
Jul 18 Python
kafka监控获取指定topic的消息总量示例
Dec 23 Python
pytorch快速搭建神经网络_Sequential操作
Jun 17 Python
opencv 阈值分割的具体使用
Jul 08 Python
安装pyinstaller遇到的各种问题(小结)
Nov 20 Python
Python学习之异常中的finally使用详解
Mar 16 Python
10个python爬虫入门实例(小结)
Nov 01 #Python
利用pipenv和pyenv管理多个相互独立的Python虚拟开发环境
Nov 01 #Python
Python经纬度坐标转换为距离及角度的实现
Nov 01 #Python
详解Anaconda安装tensorflow报错问题解决方法
Nov 01 #Python
python Cartopy的基础使用详解
Nov 01 #Python
Python中使用aiohttp模拟服务器出现错误问题及解决方法
Oct 31 #Python
关于python中导入文件到list的问题
Oct 31 #Python
You might like
世界上第一台立体声收音机
2021/03/01 无线电
oracle资料库函式库
2006/10/09 PHP
服务器端解压缩zip的脚本
2006/12/22 PHP
PHP面向对象之事务脚本模式(详解)
2017/06/07 PHP
PHP+Apache环境中如何隐藏Apache版本
2017/11/24 PHP
javascript 从if else 到 switch case 再到抽象
2010/07/17 Javascript
jquery获取下拉列表的值为null的解决方法
2011/03/18 Javascript
js二级地域选择的实现方法
2013/06/17 Javascript
JavaScript SetInterval与setTimeout使用方法详解
2013/11/15 Javascript
简单实用的反馈表单无刷新提交带验证
2013/11/15 Javascript
asp知识整理笔记3(问答模式)
2015/09/27 Javascript
Node.js的基本知识简单汇总
2016/09/19 Javascript
jQuery视差滚动效果网页实现方法经验总结
2016/09/29 Javascript
js捕捉键盘事件和按键键值的方法
2016/10/10 Javascript
Angular.js与node.js项目里用cookie校验账户登录详解
2017/02/22 Javascript
ajax实现加载页面、删除、查看详细信息 bootstrap美化页面!
2017/03/14 Javascript
jQuery animate()实现背景色渐变效果的处理方法【使用jQuery.color.js插件】
2017/03/15 Javascript
jquery中关于bind()方法的使用技巧分享
2017/03/30 jQuery
mpvue中使用flyjs全局拦截的实现代码
2018/09/13 Javascript
解决node终端下运行js文件不支持ES6语法
2020/04/04 Javascript
如何修改Vue打包后文件的接口地址配置的方法
2020/04/22 Javascript
matplotlib在python上绘制3D散点图实例详解
2017/12/09 Python
使用Python AIML搭建聊天机器人的方法示例
2018/07/09 Python
CSS3 新增选择器的实例
2019/11/13 HTML / CSS
IE9下html5初试小刀
2010/09/21 HTML / CSS
Bodum官网:咖啡和茶壶、玻璃器皿、厨房电器等
2018/08/01 全球购物
假日旅行社实习自我鉴定
2013/09/24 职场文书
企业新年寄语
2014/04/04 职场文书
元旦联欢会策划方案
2014/06/11 职场文书
教师党的群众路线教育实践活动个人对照检查材料
2014/09/23 职场文书
加强机关作风建设心得体会
2014/10/22 职场文书
2015年元旦晚会活动总结(学生会)
2014/11/28 职场文书
Win11怎么启动任务管理器?Win11启动任务管理器的几种方法
2021/11/23 数码科技
ConditionalOnProperty配置swagger不生效问题及解决
2022/06/14 Java/Android
springboot实现string转json json里面带数组
2022/06/16 Java/Android
win11自动弹出虚拟键盘怎么关闭? Win11关闭虚拟键盘的技巧
2023/01/09 数码科技