python scrapy重复执行实现代码详解


Posted in Python onDecember 28, 2019

这篇文章主要介绍了python scrapy重复执行实现代码详解,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下

Scrapy是一个为了爬取网站数据,提取结构性数据而编写的应用框架,我们只需要实现少量的代码,就能够快速的抓取

Scrapy模块:

1、scheduler:用来存放url队列

2、downloader:发送请求

3、spiders:提取数据和url

4、itemPipeline:数据保存

from twisted.internet import reactor, defer
from scrapy.crawler import CrawlerRunner
from scrapy.utils.log import configure_logging
import time
import logging
from scrapy.utils.project import get_project_settings
 
 
#在控制台打印日志
configure_logging()
#CrawlerRunner获取settings.py里的设置信息
runner = CrawlerRunner(get_project_settings())
 
@defer.inlineCallbacks
def crawl():
  while True:
    logging.info("new cycle starting")
    yield runner.crawl("xxxxx")
    #1s跑一次
    time.sleep(1)
  reactor.stop()
 
crawl()
reactor.run()

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
跟老齐学Python之有容乃大的list(2)
Sep 15 Python
python判断图片宽度和高度后删除图片的方法
May 22 Python
python tensorflow基于cnn实现手写数字识别
Jan 01 Python
Python cookbook(数据结构与算法)从序列中移除重复项且保持元素间顺序不变的方法
Mar 13 Python
Python实现平行坐标图的两种方法小结
Jul 04 Python
对python中的*args与**kwgs的含义与作用详解
Aug 28 Python
Python银行系统实战源码
Oct 25 Python
Django框架模板用法入门教程
Nov 04 Python
jupyter notebook 添加kernel permission denied的操作
Apr 21 Python
python3爬虫中异步协程的用法
Jul 10 Python
Python 通过正则表达式快速获取电影的下载地址
Aug 17 Python
Python图像读写方法对比
Nov 16 Python
Python统计时间内的并发数代码实例
Dec 28 #Python
如何基于python实现脚本加密
Dec 28 #Python
python使用配置文件过程详解
Dec 28 #Python
python正则表达式匹配IP代码实例
Dec 28 #Python
python爬虫模拟浏览器访问-User-Agent过程解析
Dec 28 #Python
python爬虫添加请求头代码实例
Dec 28 #Python
python使用rsa非对称加密过程解析
Dec 28 #Python
You might like
PHP开发中常用的8个小技巧
2008/08/27 PHP
PHP原生模板引擎 最简单的模板引擎
2012/04/25 PHP
ThinkPHP做文字水印时提示call an undefined function exif_imagetype()解决方法
2014/10/30 PHP
php+xml实现在线英文词典查询的方法
2015/01/23 PHP
PHP将Excel导入数据库及数据库数据导出至Excel的方法
2015/06/24 PHP
使用Codeigniter重写insert的方法(推荐)
2017/03/23 PHP
Laravel5.7 数据库操作迁移的实现方法
2019/04/12 PHP
图片onload事件触发问题解决方法
2011/07/31 Javascript
Javascript+CSS实现影像卷帘效果思路及代码
2014/10/20 Javascript
js实现鼠标触发图片抖动效果的方法
2015/02/27 Javascript
jQuery实现简单的DIV拖动效果
2016/02/19 Javascript
JavaScript中的call和apply的用途以及区别
2017/01/11 Javascript
jQuery 添加样式属性的优先级别方法(推荐)
2017/06/08 jQuery
es6学习之解构时应该注意的点
2017/08/29 Javascript
angular第三方包开发整理(小结)
2018/04/19 Javascript
微信小程序实现同时上传多张图片
2020/02/03 Javascript
jquery实现聊天机器人
2020/02/08 jQuery
关于vue 结合原生js 解决echarts resize问题
2020/07/26 Javascript
typescript配置alias的详细步骤
2020/08/12 Javascript
[50:01]Ti4 冒泡赛第二天 NEWBEE vs Titan
2014/07/15 DOTA
[58:25]VP vs RNG 2019国际邀请赛小组赛 BO2 第一场 8.15
2019/08/17 DOTA
用Python编写一个基于终端的实现翻译的脚本
2015/04/24 Python
Python的Twisted框架上手前所必须了解的异步编程思想
2016/05/25 Python
python实现报表自动化详解
2017/11/16 Python
使用Django和Python创建Json response的方法
2018/03/26 Python
python3解析库lxml的安装与基本使用
2018/06/27 Python
python机器学习之KNN分类算法
2018/08/29 Python
Python检查和同步本地时间(北京时间)的实现方法
2018/12/03 Python
python抓取网页内容并进行语音播报的方法
2018/12/24 Python
瑞士隐形眼镜和护理产品网上商店:Linsenklick
2019/10/21 全球购物
DIY手工制作经营店创业计划书
2014/02/01 职场文书
活动策划求职信模板
2014/04/21 职场文书
2015年元旦主持词开场白
2014/12/14 职场文书
2015年度个人业务工作总结
2015/04/27 职场文书
大学学生会主席竞选稿
2015/11/19 职场文书
《花钟》教学反思
2016/02/17 职场文书