Python爬虫scrapy框架Cookie池(微博Cookie池)的使用


Posted in Python onJanuary 13, 2021

下载代码Cookie池(这里主要是微博登录,也可以自己配置置其他的站点网址)

下载代码GitHub:https://github.com/Python3WebSpider/CookiesPool

Python爬虫scrapy框架Cookie池(微博Cookie池)的使用

下载安装过后注意看网页下面的相关基础配置和操作!!!!!!!!!!!!!

自己的设置主要有下面几步:

1、配置其他设置

Python爬虫scrapy框架Cookie池(微博Cookie池)的使用

2、设置使用的浏览器

Python爬虫scrapy框架Cookie池(微博Cookie池)的使用

Python爬虫scrapy框架Cookie池(微博Cookie池)的使用

3、设置模拟登陆

Python爬虫scrapy框架Cookie池(微博Cookie池)的使用

源码cookies.py的修改(以下两处不修改可能会产生bug)

Python爬虫scrapy框架Cookie池(微博Cookie池)的使用

 Python爬虫scrapy框架Cookie池(微博Cookie池)的使用

4、获取cookie

随机获取Cookies: http://localhost:5000/weibo/random(注意:cookie使用时是需要后期处理的!!)

Python爬虫scrapy框架Cookie池(微博Cookie池)的使用

简单的处理方式,如下代码(偶尔需要对获取的cookie处理):

def get_cookie(self):
    return requests.get('http://127.0.0.1:5000/weibo/random').text
 
  def stringToDict(self,cookie):
    itemDict = {}
    items = cookie.replace(':', '=').split(',')
    for item in items:
      key = item.split('=')[0].replace(' ', '').strip(' "')
      value = item.split('=')[1].strip(' "')
      itemDict[key] = value
    return itemDict

scrapy爬虫的使用示例(爬取微博):

middlewares.py中自定义请求中间件

def start_requests(self):
    ua = UserAgent()
    headers = {
      'User-Agent': ua.random,
      }
    cookies = self.stringToDict(str(self.get_cookie().strip('{|}')))
 
    yield scrapy.Request(url=self.start_urls[0], headers=headers,
               cookies=cookies, callback=self.parse)
cookies = self.stringToDict(str(self.get_cookie().strip('{|}')))

    yield scrapy.Request(url=self.start_urls[0], headers=headers,
               cookies=cookies, callback=self.parse)

settings.py 中的配置:

Python爬虫scrapy框架Cookie池(微博Cookie池)的使用

5、录入账号和密码:

Python爬虫scrapy框架Cookie池(微博Cookie池)的使用

格式规定(账号----密码)

Python爬虫scrapy框架Cookie池(微博Cookie池)的使用

6、验证:(注意:使用cmd)

Python爬虫scrapy框架Cookie池(微博Cookie池)的使用

7、使用时注意保持cmd打开运行!!

使用时一定要打开cmd,并运行如第6步。

得到Cookie是判断是否处理处理Cookie(几乎都需要!!)类比第4步!!!

到此这篇关于Python爬虫scrapy框架Cookie池(微博Cookie池)的使用的文章就介绍到这了,更多相关scrapy Cookie池内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
详解Python中 __get__和__getattr__和__getattribute__的区别
Jun 16 Python
Python爬虫之模拟知乎登录的方法教程
May 25 Python
快速了解Python相对导入
Jan 12 Python
Python闭包之返回函数的函数用法示例
Jan 27 Python
python DataFrame 修改列的顺序实例
Apr 10 Python
Python numpy实现二维数组和一维数组拼接的方法
Jun 05 Python
python3中函数参数的四种简单用法
Jul 09 Python
使用TensorFlow实现二分类的方法示例
Feb 05 Python
基于python实现高速视频传输程序
May 05 Python
使用python来调用CAN通讯的DLL实现方法
Jul 03 Python
Python with用法:自动关闭文件进程
Jul 10 Python
react+django清除浏览器缓存的几种方法小结
Jul 17 Python
matplotlib交互式数据光标实现(mplcursors)
Jan 13 #Python
Python 生成短8位唯一id实战教程
Jan 13 #Python
python uuid生成唯一id或str的最简单案例
Jan 13 #Python
全网最全python库selenium自动化使用详细教程
Jan 12 #Python
[原创]赚疯了!转手立赚800+?大佬的python「抢茅台脚本」使用教程
Jan 12 #Python
五分钟学会怎么用python做一个简单的贪吃蛇
Jan 12 #Python
python生成word合同的实例方法
Jan 12 #Python
You might like
PHP set_error_handler()函数使用详解(示例)
2013/11/12 PHP
php根据一个给定范围和步进生成数组的方法
2015/06/19 PHP
用js实现的自定义的对话框的实现代码
2010/03/21 Javascript
Javascript 中的 call 和 apply使用介绍
2012/02/22 Javascript
js中window.open()的所有参数详细解析
2014/01/09 Javascript
jQuery判断元素是否存在的可靠方法
2014/05/06 Javascript
Javascript调用函数方法的几种方式介绍
2015/03/20 Javascript
jQuery学习心得总结(必看篇)
2016/06/10 Javascript
js实现select选择框效果及美化
2016/08/19 Javascript
详解Vue.js之视图和数据的双向绑定(v-model)
2017/06/23 Javascript
基于javaScript的this指向总结
2017/07/22 Javascript
JS实现头条新闻的经典轮播图效果示例
2019/01/30 Javascript
微信小程序wxml列表渲染原理解析
2019/11/27 Javascript
koa2的中间件功能及应用示例
2020/03/05 Javascript
JavaScript实现动态留言板
2020/03/16 Javascript
[03:08]迎霜节狂欢!2018年迎霜节珍藏Ⅰ一览
2018/12/25 DOTA
[49:11]完美世界DOTA2联赛PWL S3 INK ICE vs DLG 第二场 12.20
2020/12/23 DOTA
Python中死锁的形成示例及死锁情况的防止
2016/06/14 Python
利用标准库fractions模块让Python支持分数类型的方法详解
2017/08/11 Python
解决python中无法自动补全代码的问题
2018/12/04 Python
numpy中的meshgrid函数的使用
2019/07/31 Python
python实现邮件自动发送
2019/08/10 Python
Python基于codecs模块实现文件读写案例解析
2020/05/11 Python
解决python cv2.imread 读取中文路径的图片返回为None的问题
2020/06/02 Python
python是怎么被发明的
2020/06/15 Python
改变 Python 中线程执行顺序的方法
2020/09/24 Python
生物化学研究助理员求职信
2013/10/09 职场文书
怎样客观的做好自我评价
2013/12/28 职场文书
《天游峰的扫路人》教学反思
2014/04/25 职场文书
爱情保证书大全
2014/04/29 职场文书
个人合伙协议书范本
2014/10/14 职场文书
工伤事故证明
2014/10/20 职场文书
滴水洞导游词
2015/02/10 职场文书
党员个人总结自评
2015/02/14 职场文书
话题作文之生命的旋律
2019/12/17 职场文书
第四次工业革命,打工人与机器人的竞争
2022/04/21 数码科技