基于scrapy的redis安装和配置方法


Posted in Python onJune 13, 2018

在定向爬虫的制作过程中,使用分布式爬取技术可以显著提高爬取效率。而 Redis 配合 Scrapy 是实现分布式爬取的基础。

Redis 是一个高性能的 Key-Value 数据库,它把数据保存在内存里。因此可以有非常快的数据读写速度。

scrapy-redis 的安装

pip install scrapy-redis
easy_install scrapy-redis

下载

http://redis.io/download

版本推荐

stable 3.0.2

运行redis

redis-server redis.conf

清空缓存

redis-cli flushdb

scrapy配置redis

settings.py配置redis

SCHEDULER = "scrapy_redis.scheduler.Scheduler"
SCHEDULER_PERSIST = True
SCHEDULER_QUEUE_CLASS = 'scrapy_redis.queue.SpiderPriorityQueue'
REDIS_URL = None # 一般情况可以省去
REDIS_HOST = '127.0.0.1' # 也可以根据情况改成 localhost
REDIS_PORT = 6379

在scrapy中使用scrapy-redis

spider 继承RedisSpider

class tempSpider(RedisSpider) 
name = "temp"
redis_key = ''temp:start_url"

以上这篇基于scrapy的redis安装和配置方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python交换变量
Sep 06 Python
使用python绘制常用的图表
Aug 27 Python
python 捕获 shell/bash 脚本的输出结果实例
Jan 04 Python
django初始化数据库的实例
May 27 Python
Python中的Django基本命令实例详解
Jul 15 Python
使用Python的toolz库开始函数式编程的方法
Nov 15 Python
OpenCV图像颜色反转算法详解
May 13 Python
Python基于pygame实现单机版五子棋对战
Dec 26 Python
tensorboard 可以显示graph,却不能显示scalar的解决方式
Feb 15 Python
Python实现异步IO的示例
Nov 05 Python
Python获取android设备cpu和内存占用情况
Nov 15 Python
Python Flask请求扩展与中间件相关知识总结
Jun 11 Python
mac下给python3安装requests库和scrapy库的实例
Jun 13 #Python
Python3实现将本地JSON大数据文件写入MySQL数据库的方法
Jun 13 #Python
解决Mac安装scrapy失败的问题
Jun 13 #Python
mac安装scrapy并创建项目的实例讲解
Jun 13 #Python
解决Tensorflow安装成功,但在导入时报错的问题
Jun 13 #Python
基于pip install django失败时的解决方法
Jun 12 #Python
基于Python pip用国内镜像下载的方法
Jun 12 #Python
You might like
FCKeditor添加自定义按钮
2008/03/27 PHP
PHP伪造referer实例代码
2008/09/20 PHP
限制ckeditor上传图片文件大小的方法
2013/11/15 PHP
PHP技术开发微信公众平台
2015/07/22 PHP
PHP中模拟链表和链表的基本操作示例
2016/02/27 PHP
js实现简单模态窗口,背景灰显
2008/11/14 Javascript
JavaScript 面向对象的之私有成员和公开成员
2010/05/04 Javascript
js 剪切板的用法(clipboardData.setData)与js match函数介绍
2013/11/19 Javascript
深入理解Javascript里的依赖注入
2014/03/19 Javascript
JavaScript中的console.profile()函数详细介绍
2014/12/29 Javascript
jQuery中outerHeight()方法用法实例
2015/01/19 Javascript
Bootstrap零基础入门教程(二)
2016/07/18 Javascript
AngularJS 实现JavaScript 动画效果详解
2016/09/08 Javascript
vue-router 中router-view不能渲染的解决方法
2017/05/23 Javascript
解决webpack打包速度慢的解决办法汇总
2017/07/06 Javascript
vue组件的写法汇总
2018/04/12 Javascript
分享Angular http interceptors 拦截器使用(推荐)
2019/11/10 Javascript
微信小程序开发(三):返回上一级页面并刷新操作示例【页面栈】
2020/06/01 Javascript
Python实现partial改变方法默认参数
2014/08/18 Python
python学生管理系统开发
2019/01/30 Python
python中设置超时跳过,超时退出的方式
2019/12/13 Python
解决Pytorch自定义层出现多Variable共享内存错误问题
2020/06/28 Python
Scrapy爬虫文件批量运行的实现
2020/09/30 Python
Visual-Click葡萄牙:欧洲领先的在线眼镜商
2020/02/17 全球购物
日本亚马逊官方网站:Amazon.co.jp
2020/04/14 全球购物
地质灾害防治方案
2014/05/14 职场文书
投标授权委托书范文
2014/08/02 职场文书
年终晚会活动方案
2014/08/21 职场文书
院系推荐意见
2015/06/05 职场文书
党员理论学习心得体会
2016/01/21 职场文书
多人股份制合作协议书
2016/03/19 职场文书
用Python爬取某乎手机APP数据
2021/06/15 Python
解析Redis Cluster原理
2021/06/21 Redis
详解Java ES多节点任务的高效分发与收集实现
2021/06/30 Java/Android
Python 匹配文本并在其上一行追加文本
2022/05/11 Python
python语言中pandas字符串分割str.split()函数
2022/08/05 Python