python scrapy重复执行实现代码详解


Posted in Python onDecember 28, 2019

这篇文章主要介绍了python scrapy重复执行实现代码详解,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下

Scrapy是一个为了爬取网站数据,提取结构性数据而编写的应用框架,我们只需要实现少量的代码,就能够快速的抓取

Scrapy模块:

1、scheduler:用来存放url队列

2、downloader:发送请求

3、spiders:提取数据和url

4、itemPipeline:数据保存

from twisted.internet import reactor, defer
from scrapy.crawler import CrawlerRunner
from scrapy.utils.log import configure_logging
import time
import logging
from scrapy.utils.project import get_project_settings
 
 
#在控制台打印日志
configure_logging()
#CrawlerRunner获取settings.py里的设置信息
runner = CrawlerRunner(get_project_settings())
 
@defer.inlineCallbacks
def crawl():
  while True:
    logging.info("new cycle starting")
    yield runner.crawl("xxxxx")
    #1s跑一次
    time.sleep(1)
  reactor.stop()
 
crawl()
reactor.run()

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python编程-将Python程序转化为可执行程序[整理]
Apr 09 Python
Python中出现IndentationError:unindent does not match any outer indentation level错误的解决方法
Apr 18 Python
详解python:time模块用法
Mar 25 Python
python 经典数字滤波实例
Dec 16 Python
python通过移动端访问查看电脑界面
Jan 06 Python
Python交互环境下打印和输入函数的实例内容
Feb 16 Python
Python实现电视里的5毛特效实例代码详解
May 15 Python
Pandas把dataframe或series转换成list的方法
Jun 14 Python
python 密码学示例——理解哈希(Hash)算法
Sep 21 Python
关于探究python中sys.argv时遇到的问题详解
Feb 23 Python
Python基础知识之变量的详解
Apr 14 Python
Python爬虫中urllib3与urllib的区别是什么
Jul 21 Python
Python统计时间内的并发数代码实例
Dec 28 #Python
如何基于python实现脚本加密
Dec 28 #Python
python使用配置文件过程详解
Dec 28 #Python
python正则表达式匹配IP代码实例
Dec 28 #Python
python爬虫模拟浏览器访问-User-Agent过程解析
Dec 28 #Python
python爬虫添加请求头代码实例
Dec 28 #Python
python使用rsa非对称加密过程解析
Dec 28 #Python
You might like
PHP CURL或file_get_contents获取网页标题的代码及两者效率的稳定性问题
2015/11/30 PHP
使用php完成常见的文件上传功能(推荐)
2017/01/13 PHP
如何通过View::first使用Laravel Blade的动态模板详解
2017/09/21 PHP
Thinkphp5框架简单实现钩子(Hook)行为的方法示例
2019/09/03 PHP
自己实现string的substring方法 人民币小写转大写,数字反转,正则优化
2012/09/02 Javascript
解析js原生方法创建表格效率测试
2013/07/08 Javascript
Document:getElementsByName()使用方法及示例
2013/10/28 Javascript
IE6兼容透明背景图片及解决方案
2015/08/19 Javascript
AngularJS实现表单验证功能
2017/01/09 Javascript
Node.JS中事件轮询(Event Loop)的解析
2017/02/25 Javascript
nodejs创建简易web服务器与文件读写的实例
2017/09/07 NodeJs
给vue项目添加ESLint的详细步骤
2017/09/29 Javascript
AjaxFileUpload.js实现异步上传文件功能
2019/04/19 Javascript
vue遍历生成的输入框 绑定及修改值示例
2019/10/30 Javascript
[46:44]VG vs TNC Supermajor小组赛B组败者组决赛 BO3 第一场 6.2
2018/06/03 DOTA
Python 网络爬虫--关于简单的模拟登录实例讲解
2018/06/01 Python
BP神经网络原理及Python实现代码
2018/12/18 Python
Python基础学习之基本数据结构详解【数字、字符串、列表、元组、集合、字典】
2019/06/18 Python
Django如何自定义model创建数据库索引的顺序
2019/06/20 Python
django 微信网页授权认证api的步骤详解
2019/07/30 Python
使用python求解二次规划的问题
2020/02/29 Python
python网络编程socket实现服务端、客户端操作详解
2020/03/24 Python
Python实现迪杰斯特拉算法过程解析
2020/09/18 Python
python利用paramiko实现交换机巡检的示例
2020/09/22 Python
基于Python的接口自动化unittest测试框架和ddt数据驱动详解
2021/01/27 Python
10个顶级Python实用库推荐
2021/03/04 Python
倩碧澳大利亚官网:Clinique澳大利亚
2019/07/22 全球购物
高一自我鉴定
2013/12/17 职场文书
人力管理专业毕业生求职信
2014/02/27 职场文书
信息技术培训感言
2014/03/06 职场文书
销售个人求职信范文
2014/04/28 职场文书
2015年初中元旦晚会活动总结
2014/11/28 职场文书
2014年扶贫帮困工作总结
2014/12/09 职场文书
Nginx 502 Bad Gateway错误原因及解决方案
2021/03/31 Servers
详解MySQL中的主键与事务
2021/05/27 MySQL
阿里云日志过滤器配置日志服务
2022/04/09 Servers