pycharm下打开、执行并调试scrapy爬虫程序的方法


Posted in Python onNovember 29, 2017

首先得有一个Scrapy项目,我在Desktop上新建一个Scrapy的项目叫test,在Desktop目录打开命令行,键入命令:scrapy startproject test1

pycharm下打开、执行并调试scrapy爬虫程序的方法

目录结构如下:

pycharm下打开、执行并调试scrapy爬虫程序的方法

pycharm下打开、执行并调试scrapy爬虫程序的方法

pycharm下打开、执行并调试scrapy爬虫程序的方法

打开Pycharm,选择open

pycharm下打开、执行并调试scrapy爬虫程序的方法

选择项目,ok

pycharm下打开、执行并调试scrapy爬虫程序的方法

打开如下界面之后,按alt + 1, 打开project 面板

pycharm下打开、执行并调试scrapy爬虫程序的方法

pycharm下打开、执行并调试scrapy爬虫程序的方法

在test1/spiders/,文件夹下,新建一个爬虫spider.py, 注意代码中的name="dmoz"。这个名字后面会用到。

pycharm下打开、执行并调试scrapy爬虫程序的方法

在test1目录和scrapy.cfg同级目录下面,新建一个begin.py文件(便于理解可以写成main.py),注意箭头2所指的名字和第5步中的name='dmoz'名字是一样的。

from scrapy import cmdline
cmdline.execute("scrapy crawl dmoz".split())

pycharm下打开、执行并调试scrapy爬虫程序的方法

7. 上面把文件搞定了,下面要配置一下pycharm了。点击Run->Edit Configurations

pycharm下打开、执行并调试scrapy爬虫程序的方法

8. 新建一个运行的python模块

pycharm下打开、执行并调试scrapy爬虫程序的方法

9. Name:改成spider; script:选择刚才新建的那个begin.py文件;Working Direciton:改成自己的工作目录

pycharm下打开、执行并调试scrapy爬虫程序的方法

10. 至此,大功告成了,点击下图,右上角的按钮就能运行了。

pycharm下打开、执行并调试scrapy爬虫程序的方法

调试

可以在其他代码中设置断点,就可以debug运行

pycharm下打开、执行并调试scrapy爬虫程序的方法

pycharm下打开、执行并调试scrapy爬虫程序的方法

遇到问题

1. Unknown command: crawl

调试运行,断点并未命中,控制台输出信息如下:

H:\Python\Python36\python.exe "H:\Program Files (x86)\JetBrains\PyCharm Community Edition 4.5.4\helpers\pydev\pydevd.py" --multiproc --client 127.0.0.1 --port 59810 --file H:/Python/Python36/Lib/site-packages/scrapy/cmdline.py crawl quotes -o quotes.jl
pydev debugger: process 4740 is connecting

Connected to pydev debugger (build 141.3058)
Scrapy 1.3.2 - no active project

Unknown command: crawl

Use "scrapy" to see available commands

Process finished with exit code 2

工作目录设置有误,造成无法识别 scrapy 命令,按照上文所说,将工作目录设置为包含 scrapy.cfg,重新运行,问题解决。

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
一个简单的python程序实例(通讯录)
Nov 29 Python
win10下Python3.6安装、配置以及pip安装包教程
Oct 01 Python
Python实现希尔排序算法的原理与用法实例分析
Nov 23 Python
Python常见字典内建函数用法示例
May 14 Python
浅谈Pandas:Series和DataFrame间的算术元素
Dec 22 Python
python os.path.isfile 的使用误区详解
Nov 29 Python
Keras load_model 导入错误的解决方式
Jun 09 Python
python怎么提高计算速度
Jun 11 Python
基于logstash实现日志文件同步elasticsearch
Aug 06 Python
详解python datetime模块
Aug 17 Python
python中uuid模块实例浅析
Dec 29 Python
python中 Flask Web 表单的使用方法
May 20 Python
Python快速排序算法实例分析
Nov 29 #Python
Python3学习urllib的使用方法示例
Nov 29 #Python
Python实现的选择排序算法示例
Nov 29 #Python
Python实现的桶排序算法示例
Nov 29 #Python
[原创]教女朋友学Python(一)运行环境搭建
Nov 29 #Python
对变量赋值的理解--Pyton中让两个值互换的实现方法
Nov 29 #Python
基于Python函数的作用域规则和闭包(详解)
Nov 29 #Python
You might like
我的论坛源代码(一)
2006/10/09 PHP
完美解决令人抓狂的zend studio 7代码提示(content Assist)速度慢的问题
2013/06/20 PHP
thinkphp配置连接数据库技巧
2014/12/02 PHP
PHP使用GETDATE获取当前日期时间作为一个关联数组的方法
2015/03/19 PHP
thinkPHP简单遍历数组方法分析
2016/05/16 PHP
laravel5创建service provider和facade的方法详解
2016/07/26 PHP
javascript 写的一个简单的timer
2009/07/30 Javascript
function foo的原型与prototype属性解惑
2010/11/19 Javascript
jQuery hover 延时器实现代码
2011/03/12 Javascript
xmlhttp缓存清除的2种解决方法
2013/12/13 Javascript
js中function()使用方法
2013/12/24 Javascript
使用JQuery库提供的扩展功能实现自定义方法
2014/09/09 Javascript
javascript中通过arguments参数伪装方法重载
2014/10/08 Javascript
JavaScript实现数字数组按照倒序排列的方法
2015/04/06 Javascript
JS鼠标拖拽实例分析
2015/11/23 Javascript
使用node.js对音视频文件加密的实例代码
2017/08/30 Javascript
NodeJs搭建本地服务器之使用手机访问的实例讲解
2018/05/12 NodeJs
vscode配置vue下的es6规范自动格式化详解
2019/03/20 Javascript
使用layer.msg 时间设置不起作用的解决方法
2019/09/12 Javascript
你不可不知的Vue.js列表渲染详解
2019/10/01 Javascript
vue实现在进行增删改操作后刷新页面
2020/08/05 Javascript
Python3爬虫学习入门教程
2018/12/11 Python
Python使用numpy模块实现矩阵和列表的连接操作方法
2019/06/26 Python
python批量替换文件名中的共同字符实例
2020/03/05 Python
Python实现子类调用父类的初始化实例
2020/03/12 Python
Oroton中国官网:澳洲知名奢侈配饰品牌
2017/03/26 全球购物
Dr.Jart+美国官网:韩国药妆品牌
2019/01/18 全球购物
华为python面试题
2016/05/03 面试题
生产经理的自我评价分享
2013/11/07 职场文书
法学专业本科生自荐信范文
2013/12/17 职场文书
《小石潭记》教学反思
2014/02/13 职场文书
安全生产专项整治方案
2014/05/06 职场文书
环保建议书200字
2014/05/14 职场文书
人事任命书格式
2014/06/05 职场文书
开展批评与自我批评发言材料
2014/10/17 职场文书
民事辩护词范文
2015/05/21 职场文书