基于scrapy的redis安装和配置方法


Posted in Python onJune 13, 2018

在定向爬虫的制作过程中,使用分布式爬取技术可以显著提高爬取效率。而 Redis 配合 Scrapy 是实现分布式爬取的基础。

Redis 是一个高性能的 Key-Value 数据库,它把数据保存在内存里。因此可以有非常快的数据读写速度。

scrapy-redis 的安装

pip install scrapy-redis
easy_install scrapy-redis

下载

http://redis.io/download

版本推荐

stable 3.0.2

运行redis

redis-server redis.conf

清空缓存

redis-cli flushdb

scrapy配置redis

settings.py配置redis

SCHEDULER = "scrapy_redis.scheduler.Scheduler"
SCHEDULER_PERSIST = True
SCHEDULER_QUEUE_CLASS = 'scrapy_redis.queue.SpiderPriorityQueue'
REDIS_URL = None # 一般情况可以省去
REDIS_HOST = '127.0.0.1' # 也可以根据情况改成 localhost
REDIS_PORT = 6379

在scrapy中使用scrapy-redis

spider 继承RedisSpider

class tempSpider(RedisSpider) 
name = "temp"
redis_key = ''temp:start_url"

以上这篇基于scrapy的redis安装和配置方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
pycharm 使用心得(三)Hello world!
Jun 05 Python
Python的Asyncore异步Socket模块及实现端口转发的例子
Jun 14 Python
Python 中开发pattern的string模板(template) 实例详解
Apr 01 Python
Python多进程库multiprocessing中进程池Pool类的使用详解
Nov 24 Python
Python建立Map写Excel表实例解析
Jan 17 Python
python实现贪吃蛇小游戏
Mar 21 Python
Django 实现图片上传和显示过程详解
Jul 18 Python
简单的Python调度器Schedule详解
Aug 30 Python
解决python DataFrame 打印结果不换行问题
Apr 09 Python
基于python实现检索标记敏感词并输出
May 07 Python
快速了解Python开发环境Spyder
Jun 29 Python
协程Python 中实现多任务耗资源最小的方式
Oct 19 Python
mac下给python3安装requests库和scrapy库的实例
Jun 13 #Python
Python3实现将本地JSON大数据文件写入MySQL数据库的方法
Jun 13 #Python
解决Mac安装scrapy失败的问题
Jun 13 #Python
mac安装scrapy并创建项目的实例讲解
Jun 13 #Python
解决Tensorflow安装成功,但在导入时报错的问题
Jun 13 #Python
基于pip install django失败时的解决方法
Jun 12 #Python
基于Python pip用国内镜像下载的方法
Jun 12 #Python
You might like
PHP4与PHP5的时间格式问题
2008/02/17 PHP
PHP实现利用MySQL保存session的方法
2014/08/23 PHP
thinkphp文件处理类Dir.class.php的用法分析
2014/12/08 PHP
PHP入门教程之上传文件实例详解
2016/09/11 PHP
thinkPHP中验证码的简单实现方法
2016/12/05 PHP
PHP判断数组是否为空的常用方法(五种方法)
2017/02/08 PHP
Bootstrap+PHP实现多图上传功能实例详解
2018/04/08 PHP
解决AJAX中跨域访问出现'没有权限'的错误
2008/08/20 Javascript
Javascript 中的 call 和 apply使用介绍
2012/02/22 Javascript
js正文内容高亮效果的实现方法
2013/06/30 Javascript
JS实现漂亮的淡蓝色滑动门效果代码
2015/09/23 Javascript
工作中比较实用的JavaScript验证和数据处理的干货(经典)
2016/08/03 Javascript
通过扫描二维码打开app的实现代码
2016/11/10 Javascript
Bootstrap模态对话框中显示动态内容的方法
2018/08/10 Javascript
[02:52]DOTA2新手基础教程 米波
2014/01/21 DOTA
[01:33]PWL开团时刻DAY2-开雾与反开雾
2020/10/31 DOTA
python模拟登录百度代码分享(获取百度贴吧等级)
2013/12/27 Python
python中dir函数用法分析
2015/04/17 Python
python3抓取中文网页的方法
2015/07/28 Python
详解python单例模式与metaclass
2016/01/15 Python
Python基于生成器迭代实现的八皇后问题示例
2018/05/23 Python
python cs架构实现简单文件传输
2020/03/20 Python
pandas删除指定行详解
2019/04/04 Python
python 递归调用返回None的问题及解决方法
2020/03/16 Python
记一次django内存异常排查及解决方法
2020/08/07 Python
python如何使用腾讯云发送短信
2020/09/17 Python
VIVOBAREFOOT赤脚鞋:让您的脚做自然的事情
2017/06/01 全球购物
英国高档百货连锁店:John Lewis
2017/11/20 全球购物
企业统计员岗位职责
2013/12/13 职场文书
成功的酒店创业计划书
2013/12/27 职场文书
《植物妈妈有办法》教学反思
2014/02/25 职场文书
大学学雷锋活动总结
2014/06/26 职场文书
村委会贫困证明范本
2014/09/17 职场文书
简短清晨问候语
2015/11/10 职场文书
2016关于学习党章的心得体会
2016/01/15 职场文书
实战Python爬虫爬取酷我音乐
2022/04/11 Python