pycharm下打开、执行并调试scrapy爬虫程序的方法


Posted in Python onNovember 29, 2017

首先得有一个Scrapy项目,我在Desktop上新建一个Scrapy的项目叫test,在Desktop目录打开命令行,键入命令:scrapy startproject test1

pycharm下打开、执行并调试scrapy爬虫程序的方法

目录结构如下:

pycharm下打开、执行并调试scrapy爬虫程序的方法

pycharm下打开、执行并调试scrapy爬虫程序的方法

pycharm下打开、执行并调试scrapy爬虫程序的方法

打开Pycharm,选择open

pycharm下打开、执行并调试scrapy爬虫程序的方法

选择项目,ok

pycharm下打开、执行并调试scrapy爬虫程序的方法

打开如下界面之后,按alt + 1, 打开project 面板

pycharm下打开、执行并调试scrapy爬虫程序的方法

pycharm下打开、执行并调试scrapy爬虫程序的方法

在test1/spiders/,文件夹下,新建一个爬虫spider.py, 注意代码中的name="dmoz"。这个名字后面会用到。

pycharm下打开、执行并调试scrapy爬虫程序的方法

在test1目录和scrapy.cfg同级目录下面,新建一个begin.py文件(便于理解可以写成main.py),注意箭头2所指的名字和第5步中的name='dmoz'名字是一样的。

from scrapy import cmdline
cmdline.execute("scrapy crawl dmoz".split())

pycharm下打开、执行并调试scrapy爬虫程序的方法

7. 上面把文件搞定了,下面要配置一下pycharm了。点击Run->Edit Configurations

pycharm下打开、执行并调试scrapy爬虫程序的方法

8. 新建一个运行的python模块

pycharm下打开、执行并调试scrapy爬虫程序的方法

9. Name:改成spider; script:选择刚才新建的那个begin.py文件;Working Direciton:改成自己的工作目录

pycharm下打开、执行并调试scrapy爬虫程序的方法

10. 至此,大功告成了,点击下图,右上角的按钮就能运行了。

pycharm下打开、执行并调试scrapy爬虫程序的方法

调试

可以在其他代码中设置断点,就可以debug运行

pycharm下打开、执行并调试scrapy爬虫程序的方法

pycharm下打开、执行并调试scrapy爬虫程序的方法

遇到问题

1. Unknown command: crawl

调试运行,断点并未命中,控制台输出信息如下:

H:\Python\Python36\python.exe "H:\Program Files (x86)\JetBrains\PyCharm Community Edition 4.5.4\helpers\pydev\pydevd.py" --multiproc --client 127.0.0.1 --port 59810 --file H:/Python/Python36/Lib/site-packages/scrapy/cmdline.py crawl quotes -o quotes.jl
pydev debugger: process 4740 is connecting

Connected to pydev debugger (build 141.3058)
Scrapy 1.3.2 - no active project

Unknown command: crawl

Use "scrapy" to see available commands

Process finished with exit code 2

工作目录设置有误,造成无法识别 scrapy 命令,按照上文所说,将工作目录设置为包含 scrapy.cfg,重新运行,问题解决。

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
编写Python爬虫抓取暴走漫画上gif图片的实例分享
Apr 20 Python
python逆序打印各位数字的方法
Jun 25 Python
python实现停车管理系统
Nov 30 Python
Python实现对字典分别按键(key)和值(value)进行排序的方法分析
Dec 19 Python
Python字符串的常见操作实例小结
Apr 08 Python
Python Opencv提取图片中某种颜色组成的图形的方法
Sep 19 Python
Python中Flask-RESTful编写API接口(小白入门)
Dec 11 Python
解决Tensorboard可视化错误:不显示数据 No scalar data was found
Feb 15 Python
django中嵌套的try-except实例
May 21 Python
用python查找统一局域网下ip对应的mac地址
Jan 13 Python
用Python可视化新冠疫情数据
Jan 18 Python
Python实现学生管理系统并生成exe可执行文件详解流程
Jan 22 Python
Python快速排序算法实例分析
Nov 29 #Python
Python3学习urllib的使用方法示例
Nov 29 #Python
Python实现的选择排序算法示例
Nov 29 #Python
Python实现的桶排序算法示例
Nov 29 #Python
[原创]教女朋友学Python(一)运行环境搭建
Nov 29 #Python
对变量赋值的理解--Pyton中让两个值互换的实现方法
Nov 29 #Python
基于Python函数的作用域规则和闭包(详解)
Nov 29 #Python
You might like
上传文件先创建目录 再上传到目录里面去
2010/12/29 PHP
Yii2中datetime类的使用
2016/12/17 PHP
零基础学JavaScript最新动画教程+iso光盘下载
2008/01/22 Javascript
Extjs Ajax 乱码问题解决方案
2009/04/15 Javascript
js 操作select相关方法函数
2009/12/06 Javascript
手机开发必备技巧:javascript及CSS功能代码分享
2015/05/25 Javascript
JS实现两表格里数据来回转移的方法
2015/05/28 Javascript
node.js路径处理方法以及绝对路径详解
2021/03/04 Javascript
vue组件父与子通信详解(一)
2017/11/07 Javascript
js 判断一个数字是不是2的n次方幂的实例
2017/11/26 Javascript
jQuery选择器之基本过滤选择器用法实例分析
2019/02/19 jQuery
js字符串处理之绝妙的代码
2019/04/05 Javascript
如何实现双向绑定mvvm的原理实现
2019/05/28 Javascript
五分钟搞懂Vuex实用知识(小结)
2019/08/12 Javascript
vue data恢复初始化数据的实现方法
2019/10/31 Javascript
vue+echarts实现动态折线图的方法与注意
2020/09/01 Javascript
python 多线程实现检测服务器在线情况
2015/11/25 Python
详解Python装饰器由浅入深
2016/12/09 Python
Python 实现「食行生鲜」签到领积分功能
2018/09/26 Python
对python 读取线的shp文件实例详解
2018/12/22 Python
python numpy生成等差数列、等比数列的实例
2020/02/25 Python
Python Scrapy图片爬取原理及代码实例
2020/06/12 Python
Pytorch实现将模型的所有参数的梯度清0
2020/06/24 Python
使用css3做0.5px的细线的示例代码
2018/01/18 HTML / CSS
HTML5中原生的右键菜单创建方法
2016/06/28 HTML / CSS
澳大利亚女士时装在线:Rockmans
2018/09/26 全球购物
如何安装ruby on rails
2014/02/09 面试题
社会实践自我鉴定
2013/11/07 职场文书
简历中的自我评价范文
2014/02/05 职场文书
原料仓仓管员岗位职责
2014/07/08 职场文书
市场部岗位职责
2015/02/12 职场文书
2015暑期社会实践通讯稿
2015/07/18 职场文书
六一儿童节园长致辞
2015/07/31 职场文书
酒桌上的祝酒词
2015/08/12 职场文书
社会实践心得体会范文
2016/01/14 职场文书
大学生村官驻村工作心得体会
2016/01/23 职场文书