python 利用浏览器 Cookie 模拟登录的用户访问知乎的方法


Posted in Python onJuly 11, 2019

首先在火狐浏览器上登录知乎,然后使用火狐浏览器插件 Httpfox 获取 GET 请求的Cookie,这里注意使用状态值为 200(获取成功)的某次GET.

python 利用浏览器 Cookie 模拟登录的用户访问知乎的方法

将 Cookies 复制出来,注意这一行非常长,不要人为添加换行符。而且 Cookie 中使用了双引号,最后复制到代码里使用单引号包起来。

使用下边代码检验是否是模拟了登录的用户的请求:

import requests
import re
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64; rv:53.0) Gecko/20100101 Firefox/53.0',
'Cookie':'q_c1=034d8149e54a425496b7dd78be571390|1496424997000|1496424997000; r_cap_id="ZDE4MTg2NGFhMjdlNDlhMTllZWFlMmJmNjkzN2MyMzI=|1496487358|d6df41ad90d6d1a94bcbd27f2962fea69d2ec1b6"; cap_id="OTc1NmViYzJlNDZjNDVlY2E1YTZiNTZjNTFkMjZkNDY=|1496487358|52ac19a9e05ee48e155d2b4d57d414792873c062"; d_c0="AEACLgSM2guPTmR8y-3r_XCeIy3RVmMIrQ0=|1496424997"; __utma=51854390.870770348.1496424950.1496483801.1496485796.4; __utmz=51854390.1496485796.4.3.utmcsr=baidu|utmccn=(organic)|utmcmd=organic; __utmv=51854390.100--|2=registration_date=20141101=1^3=entry_date=20141101=1; _zap=5b305d08-cca7-4182-b1a8-1d8190e94a3b; aliyungf_tc=AQAAAFdv8y0T4AMAj5NK3+HVvqiouPgb; acw_tc=AQAAAHPUpVJ7LQQAj5NK35xm3ILOPUBu; _xsrf=85bb3aa751345649abdd275cb42ed704; __utmc=51854390; capsion_ticket="2|1:0|10:1496486629|14:capsion_ticket|44:ODJkNDE0MDQ1MjNmNDYwZTlhZGViZWNhNWNlZDI4Y2E=|6ded3f3e82c25526f236a4bd135705bb334e25d8df96750d89afa5ae4ab49a04"; __utmb=51854390.8.10.1496485796; __utmt=1; z_c0=Mi4wQUFCQVJBVV9BQUFBUUFJdUJJemFDeGNBQUFCaEFsVk56U0phV1FCdTNCeVduZVZ3X0hweWxnWTRIeTZmMmtyUEFn|1496487376|d6107bbdbb3ccd015757953a40ee1ecedae6834c'
}
r = requests.get("https://www.zhihu.com/question/20273782", headers = headers)
text = r.text
re.compile(r"加入知乎").search(text)

如果是登录的用户,响应的内容中包含用户名。没用登录的话,响应的内容中包含 “登录”,“加入知乎” ,可以据此来判断。

Cookie 每次登录的值都不一样,退出之后再登录需要重新采集。

以上这篇python 利用浏览器 Cookie 模拟登录的用户访问知乎的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python实现爬虫下载漫画示例
Feb 16 Python
python pandas库中DataFrame对行和列的操作实例讲解
Jun 09 Python
opencv python 傅里叶变换的使用
Jul 21 Python
Python eval的常见错误封装及利用原理详解
Mar 26 Python
Django 中自定义 Admin 样式与功能的实现方法
Jul 04 Python
Python获取时间范围内日期列表和周列表的函数
Aug 05 Python
浅谈Python_Openpyxl使用(最全总结)
Sep 05 Python
django 实现celery动态设置周期任务执行时间
Nov 19 Python
解决Pycharm 导入其他文件夹源码的2种方法
Feb 12 Python
Python编程快速上手——strip()函数的正则表达式实现方法分析
Feb 29 Python
Python实现异步IO的示例
Nov 05 Python
深入理解pytorch库的dockerfile
Jun 10 Python
PowerBI和Python关于数据分析的对比
Jul 11 #Python
pow在python中的含义及用法
Jul 11 #Python
Python简单处理坐标排序问题示例
Jul 11 #Python
如何使用Python自动控制windows桌面
Jul 11 #Python
python字典嵌套字典的情况下找到某个key的value详解
Jul 10 #Python
如何安装并使用conda指令管理python环境
Jul 10 #Python
python变量的存储原理详解
Jul 10 #Python
You might like
使用php测试硬盘写入速度示例
2014/01/27 PHP
PHP封装的HttpClient类用法实例
2015/06/17 PHP
详解php比较操作符的安全问题
2015/12/03 PHP
使用Zookeeper分布式部署PHP应用程序
2019/03/15 PHP
PHP命名空间定义与用法实例分析
2019/08/14 PHP
JavaScript实现找出字符串中第一个不重复的字符
2014/09/03 Javascript
node.js使用npm 安装插件时提示install Error: ENOENT报错的解决方法
2014/11/20 Javascript
jQuery EasyUI实现右键菜单变灰不可用效果
2015/09/24 Javascript
什么是Vue.js框架 为什么选择它?
2017/10/17 Javascript
nodejs基于WS模块实现WebSocket聊天功能的方法
2018/01/12 NodeJs
使用vue-router设置每个页面的title方法
2018/02/11 Javascript
webpack公共组件引用路径简化小技巧
2018/06/15 Javascript
vue2.0 下拉框默认标题设置方法
2018/08/22 Javascript
解决Echarts2竖直datazoom滑动后显示数据不全的问题
2020/07/20 Javascript
详解vue中v-on事件监听指令的基本用法
2020/07/22 Javascript
Python设计模式之单例模式实例
2014/04/26 Python
Python学习笔记(一)(基础入门之环境搭建)
2014/06/05 Python
python append、extend与insert的区别
2016/10/13 Python
python根据list重命名文件夹里的所有文件实例
2018/10/25 Python
python 限制函数执行时间,自己实现timeout的实例
2019/01/12 Python
Flask-WTF表单的使用方法
2019/07/12 Python
对Python _取log的几种方式小结
2019/07/25 Python
Python 判断时间是否在时间区间内的实例
2020/05/16 Python
加拿大时装零售商:Influence U
2018/12/22 全球购物
俄罗斯有趣和原创礼物网上商店:MagicMag
2019/08/01 全球购物
法国春天百货官网:Printemps.com
2020/06/29 全球购物
vue项目实现分页效果
2021/03/24 Vue.js
怎样有效的进行自我评价
2013/10/06 职场文书
音乐表演专业毕业生求职信
2013/10/14 职场文书
“四风”问题的主要表现和危害思想汇报
2014/09/19 职场文书
党员批评与自我批评
2014/10/15 职场文书
土建技术员岗位职责
2015/04/11 职场文书
毛主席纪念堂观后感
2015/06/17 职场文书
学习杨善洲同志先进事迹心得体会
2016/01/23 职场文书
2017年寒假社区服务活动总结
2016/04/06 职场文书
用 Python 元类的特性实现 ORM 框架
2021/05/19 Python