python scrapy重复执行实现代码详解


Posted in Python onDecember 28, 2019

这篇文章主要介绍了python scrapy重复执行实现代码详解,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下

Scrapy是一个为了爬取网站数据,提取结构性数据而编写的应用框架,我们只需要实现少量的代码,就能够快速的抓取

Scrapy模块:

1、scheduler:用来存放url队列

2、downloader:发送请求

3、spiders:提取数据和url

4、itemPipeline:数据保存

from twisted.internet import reactor, defer
from scrapy.crawler import CrawlerRunner
from scrapy.utils.log import configure_logging
import time
import logging
from scrapy.utils.project import get_project_settings
 
 
#在控制台打印日志
configure_logging()
#CrawlerRunner获取settings.py里的设置信息
runner = CrawlerRunner(get_project_settings())
 
@defer.inlineCallbacks
def crawl():
  while True:
    logging.info("new cycle starting")
    yield runner.crawl("xxxxx")
    #1s跑一次
    time.sleep(1)
  reactor.stop()
 
crawl()
reactor.run()

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python实现的一个自动售饮料程序代码分享
Aug 25 Python
举例详解Python中的split()函数的使用方法
Apr 07 Python
python获取外网ip地址的方法总结
Jul 02 Python
剖析Django中模版标签的解析与参数传递
Jul 21 Python
python 自定义对象的打印方法
Jan 12 Python
浅谈Python 列表字典赋值的陷阱
Jan 20 Python
Python3.5 Pandas模块之Series用法实例分析
Apr 23 Python
python找出一个列表中相同元素的多个索引实例
Jun 11 Python
python实现证件照换底功能
Aug 20 Python
Django 创建后台,配置sqlite3教程
Nov 18 Python
解决Pytorch 加载训练好的模型 遇到的error问题
Jan 10 Python
Python实现随机爬山算法
Jan 29 Python
Python统计时间内的并发数代码实例
Dec 28 #Python
如何基于python实现脚本加密
Dec 28 #Python
python使用配置文件过程详解
Dec 28 #Python
python正则表达式匹配IP代码实例
Dec 28 #Python
python爬虫模拟浏览器访问-User-Agent过程解析
Dec 28 #Python
python爬虫添加请求头代码实例
Dec 28 #Python
python使用rsa非对称加密过程解析
Dec 28 #Python
You might like
js下函数般调用正则的方法附代码
2008/06/22 PHP
php截取后台登陆密码的代码
2012/05/05 PHP
在PHP中使用redis
2013/11/04 PHP
var与Javascript变量隐式声明
2009/09/17 Javascript
JavaScript中实现块作用域的方法
2010/04/01 Javascript
JavaScript中圆括号()和方括号[]的特殊用法疑问解答
2013/08/06 Javascript
Js表格万条数据瞬间加载实现代码
2014/02/20 Javascript
js的image onload事件使用遇到的问题
2014/07/15 Javascript
jquery插件qrcode在线生成二维码
2015/04/26 Javascript
使用DNode实现php和nodejs之间通信的简单实例
2015/07/06 NodeJs
jQuery学习笔记之Ajax用法实例详解
2015/12/01 Javascript
JavaScript使用DeviceOne开发实战(三)仿微信应用
2015/12/02 Javascript
AngularJS框架的ng-app指令与自动加载实现方法分析
2017/01/04 Javascript
js实现贪吃蛇小游戏(容易理解)
2017/01/22 Javascript
angular directive的简单使用总结
2017/05/24 Javascript
vue通过cookie获取用户登录信息的思路详解
2018/10/30 Javascript
微信小程序拍照和摄像功能实现方法示例
2019/02/01 Javascript
微信小程序移动拖拽视图-movable-view实例详解
2019/08/17 Javascript
js 递归json树实现根据子id查父id的方法分析
2019/11/08 Javascript
[03:49]DOTA2英雄基础教程 光之守卫
2014/01/14 DOTA
[02:10]2018DOTA2亚洲邀请赛赛前采访-Liquid
2018/04/03 DOTA
解决Python找不到ssl模块问题 No module named _ssl的方法
2019/04/29 Python
Python流程控制 if else实现解析
2019/09/02 Python
利用OpenCV中对图像数据进行64F和8U转换的方式
2020/06/03 Python
Django serializer优化类视图的实现示例
2020/07/16 Python
canvas进阶之如何画出平滑的曲线
2018/10/15 HTML / CSS
英语专业毕业个人求职自荐信
2013/09/21 职场文书
优秀食品类广告词
2014/03/19 职场文书
幼儿园安全生产月活动总结
2014/07/05 职场文书
县政府办公室领导班子对照检查材料思想汇报
2014/09/28 职场文书
关于群众路线的心得体会
2014/11/05 职场文书
2015年公司后勤管理工作总结
2015/05/13 职场文书
2015年公路养护工作总结
2015/05/13 职场文书
golang 定时任务方面time.Sleep和time.Tick的优劣对比分析
2021/05/05 Golang
《Estab Life》4月6日播出 正式PV、主视觉图公开
2022/03/20 日漫
引用计数法和root搜索算法以及JVM中判定对象需要回收的方法
2022/04/19 Java/Android