基于scrapy的redis安装和配置方法


Posted in Python onJune 13, 2018

在定向爬虫的制作过程中,使用分布式爬取技术可以显著提高爬取效率。而 Redis 配合 Scrapy 是实现分布式爬取的基础。

Redis 是一个高性能的 Key-Value 数据库,它把数据保存在内存里。因此可以有非常快的数据读写速度。

scrapy-redis 的安装

pip install scrapy-redis
easy_install scrapy-redis

下载

http://redis.io/download

版本推荐

stable 3.0.2

运行redis

redis-server redis.conf

清空缓存

redis-cli flushdb

scrapy配置redis

settings.py配置redis

SCHEDULER = "scrapy_redis.scheduler.Scheduler"
SCHEDULER_PERSIST = True
SCHEDULER_QUEUE_CLASS = 'scrapy_redis.queue.SpiderPriorityQueue'
REDIS_URL = None # 一般情况可以省去
REDIS_HOST = '127.0.0.1' # 也可以根据情况改成 localhost
REDIS_PORT = 6379

在scrapy中使用scrapy-redis

spider 继承RedisSpider

class tempSpider(RedisSpider) 
name = "temp"
redis_key = ''temp:start_url"

以上这篇基于scrapy的redis安装和配置方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python环境下搭建属于自己的pip源的教程
May 05 Python
python 出现SyntaxError: non-keyword arg after keyword arg错误解决办法
Feb 14 Python
Python3实现将本地JSON大数据文件写入MySQL数据库的方法
Jun 13 Python
Python2包含中文报错的解决方法
Jul 09 Python
对python特殊函数 __call__()的使用详解
Jul 02 Python
django+tornado实现实时查看远程日志的方法
Aug 12 Python
Django Admin中增加导出CSV功能过程解析
Sep 04 Python
基于Python爬虫采集天气网实时信息
Jun 05 Python
基于PyTorch的permute和reshape/view的区别介绍
Jun 18 Python
Python3实现建造者模式的示例代码
Jun 28 Python
Python通过len函数返回对象长度
Oct 22 Python
python 使用Tensorflow训练BP神经网络实现鸢尾花分类
May 12 Python
mac下给python3安装requests库和scrapy库的实例
Jun 13 #Python
Python3实现将本地JSON大数据文件写入MySQL数据库的方法
Jun 13 #Python
解决Mac安装scrapy失败的问题
Jun 13 #Python
mac安装scrapy并创建项目的实例讲解
Jun 13 #Python
解决Tensorflow安装成功,但在导入时报错的问题
Jun 13 #Python
基于pip install django失败时的解决方法
Jun 12 #Python
基于Python pip用国内镜像下载的方法
Jun 12 #Python
You might like
网站当前的在线人数
2006/10/09 PHP
php模拟服务器实现autoindex效果的方法
2015/03/10 PHP
php利用ffmpeg提取视频中音频与视频画面的方法详解
2017/06/07 PHP
Windows平台实现PHP连接SQL Server2008的方法
2017/07/26 PHP
表单填写时用回车代替TAB的实现方法
2007/10/09 Javascript
json简单介绍
2008/06/10 Javascript
JS/jQuery实现默认显示部分文字点击按钮显示全部内容
2013/05/13 Javascript
jquery基础教程之数组使用详解
2014/03/10 Javascript
javascript实现简单的贪吃蛇游戏
2015/03/31 Javascript
JavaScript中数组继承的简单示例
2015/07/29 Javascript
Labelauty?jQuery单选框/复选框美化插件分享
2015/09/26 Javascript
jquery.Jcrop结合JAVA后台实现图片裁剪上传实例
2016/11/05 Javascript
微信小程序 网络API发起请求详解
2016/11/09 Javascript
JS产生随机数的用法小结
2016/12/10 Javascript
Angular2利用组件与指令实现图片轮播组件
2017/03/27 Javascript
JavaScript使用原型和原型链实现对象继承的方法详解
2017/04/05 Javascript
layui导航栏实现代码
2017/05/19 Javascript
微信小程序实现点击按钮修改文字大小功能【附demo源码下载】
2017/12/06 Javascript
微信小程序发送短信验证码完整实例
2019/01/07 Javascript
vue-cli随机生成port源码的方法
2019/09/02 Javascript
Python3中使用urllib的方法详解(header,代理,超时,认证,异常处理)
2016/09/21 Python
Python中单、双下划线的区别总结
2017/12/01 Python
Python内置模块turtle绘图详解
2017/12/09 Python
Python中getpass模块无回显输入源码解析
2018/01/11 Python
pyqt5实现绘制ui,列表窗口,滚动窗口显示图片的方法
2019/06/20 Python
PyTorch中Tensor的维度变换实现
2019/08/18 Python
Django之路由层的实现
2019/09/09 Python
python等待10秒执行下一命令的方法
2020/07/19 Python
Python tempfile模块生成临时文件和临时目录
2020/09/30 Python
HTML5的video标签的浏览器兼容性增强方案分享
2016/05/19 HTML / CSS
加拿大高尔夫超市:Golf Town
2018/01/12 全球购物
Yves Rocher捷克官方网站:植物化妆品的创造者
2019/07/31 全球购物
个人自荐书
2013/12/20 职场文书
教师业务培训方案
2014/05/01 职场文书
2015年文员个人工作总结
2015/04/09 职场文书
JavaGUI模仿QQ聊天功能完整版
2021/07/04 Java/Android