pycharm下打开、执行并调试scrapy爬虫程序的方法


Posted in Python onNovember 29, 2017

首先得有一个Scrapy项目,我在Desktop上新建一个Scrapy的项目叫test,在Desktop目录打开命令行,键入命令:scrapy startproject test1

pycharm下打开、执行并调试scrapy爬虫程序的方法

目录结构如下:

pycharm下打开、执行并调试scrapy爬虫程序的方法

pycharm下打开、执行并调试scrapy爬虫程序的方法

pycharm下打开、执行并调试scrapy爬虫程序的方法

打开Pycharm,选择open

pycharm下打开、执行并调试scrapy爬虫程序的方法

选择项目,ok

pycharm下打开、执行并调试scrapy爬虫程序的方法

打开如下界面之后,按alt + 1, 打开project 面板

pycharm下打开、执行并调试scrapy爬虫程序的方法

pycharm下打开、执行并调试scrapy爬虫程序的方法

在test1/spiders/,文件夹下,新建一个爬虫spider.py, 注意代码中的name="dmoz"。这个名字后面会用到。

pycharm下打开、执行并调试scrapy爬虫程序的方法

在test1目录和scrapy.cfg同级目录下面,新建一个begin.py文件(便于理解可以写成main.py),注意箭头2所指的名字和第5步中的name='dmoz'名字是一样的。

from scrapy import cmdline
cmdline.execute("scrapy crawl dmoz".split())

pycharm下打开、执行并调试scrapy爬虫程序的方法

7. 上面把文件搞定了,下面要配置一下pycharm了。点击Run->Edit Configurations

pycharm下打开、执行并调试scrapy爬虫程序的方法

8. 新建一个运行的python模块

pycharm下打开、执行并调试scrapy爬虫程序的方法

9. Name:改成spider; script:选择刚才新建的那个begin.py文件;Working Direciton:改成自己的工作目录

pycharm下打开、执行并调试scrapy爬虫程序的方法

10. 至此,大功告成了,点击下图,右上角的按钮就能运行了。

pycharm下打开、执行并调试scrapy爬虫程序的方法

调试

可以在其他代码中设置断点,就可以debug运行

pycharm下打开、执行并调试scrapy爬虫程序的方法

pycharm下打开、执行并调试scrapy爬虫程序的方法

遇到问题

1. Unknown command: crawl

调试运行,断点并未命中,控制台输出信息如下:

H:\Python\Python36\python.exe "H:\Program Files (x86)\JetBrains\PyCharm Community Edition 4.5.4\helpers\pydev\pydevd.py" --multiproc --client 127.0.0.1 --port 59810 --file H:/Python/Python36/Lib/site-packages/scrapy/cmdline.py crawl quotes -o quotes.jl
pydev debugger: process 4740 is connecting

Connected to pydev debugger (build 141.3058)
Scrapy 1.3.2 - no active project

Unknown command: crawl

Use "scrapy" to see available commands

Process finished with exit code 2

工作目录设置有误,造成无法识别 scrapy 命令,按照上文所说,将工作目录设置为包含 scrapy.cfg,重新运行,问题解决。

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python3实现短网址和数字相互转换的方法
Apr 28 Python
Python设计足球联赛赛程表程序的思路与简单实现示例
Jun 28 Python
Django rest framework实现分页的示例
May 24 Python
浅谈Python 列表字典赋值的陷阱
Jan 20 Python
Python弹出输入框并获取输入值的实例
Jun 18 Python
python实现websocket的客户端压力测试
Jun 25 Python
Pytorch之view及view_as使用详解
Dec 31 Python
开启Django博客的RSS功能的实现方法
Feb 17 Python
完美解决jupyter由于无法import新包的问题
May 26 Python
使用bandit对目标python代码进行安全函数扫描的案例分析
Jan 27 Python
使用pytorch实现线性回归
Apr 11 Python
pytorch中的torch.nn.Conv2d()函数图文详解
Feb 28 Python
Python快速排序算法实例分析
Nov 29 #Python
Python3学习urllib的使用方法示例
Nov 29 #Python
Python实现的选择排序算法示例
Nov 29 #Python
Python实现的桶排序算法示例
Nov 29 #Python
[原创]教女朋友学Python(一)运行环境搭建
Nov 29 #Python
对变量赋值的理解--Pyton中让两个值互换的实现方法
Nov 29 #Python
基于Python函数的作用域规则和闭包(详解)
Nov 29 #Python
You might like
PHP中读取照片exif信息的方法
2014/08/20 PHP
PHP 数据结构队列(SplQueue)和优先队列(SplPriorityQueue)简单使用实例
2015/05/12 PHP
php array_multisort 对数组进行排序详解及实例代码
2016/10/27 PHP
PHP保留两位小数的几种方法
2019/07/24 PHP
关于Yii2框架跑脚本时内存泄漏问题的分析与解决
2019/12/01 PHP
js活用事件触发对象动作
2008/08/10 Javascript
你必须知道的Javascript知识点之"this指针"的应用
2013/04/23 Javascript
json格式数据的添加,删除及排序方法
2016/01/21 Javascript
JS正则截取两个字符串之间及字符串前后内容的方法
2017/01/06 Javascript
jQuery EasyUI 组件加上“清除”功能实例详解
2017/04/11 jQuery
angularjs下拉框空白的解决办法
2017/06/20 Javascript
node使用UEditor富文本编辑器的方法实例
2017/07/11 Javascript
深入理解ES6 Promise 扩展always方法
2017/09/26 Javascript
详解小程序原生使用ES7 async/await语法
2018/08/06 Javascript
JS实现二维数组元素的排列组合运算简单示例
2019/01/28 Javascript
基于vue实现一个神奇的动态按钮效果
2019/05/15 Javascript
如何在vue 中使用柱状图 并自修改配置
2021/01/21 Vue.js
[02:05]2014DOTA2西雅图邀请赛 老队长全明星大猜想谁不服就按进显示器
2014/07/08 DOTA
python实现字典(dict)和字符串(string)的相互转换方法
2017/03/01 Python
python对配置文件.ini进行增删改查操作的方法示例
2017/07/28 Python
python如何为创建大量实例节省内存
2018/03/20 Python
Python continue继续循环用法总结
2018/06/10 Python
Python列表解析配合if else的方法
2018/06/23 Python
python实现决策树分类
2018/08/30 Python
Python GUI编程学习笔记之tkinter控件的介绍及基本使用方法详解
2020/03/30 Python
Pytorch转tflite方式
2020/05/25 Python
详解HTML5常用的语义化标签
2019/09/27 HTML / CSS
阿里云:Aliyun.com
2017/02/15 全球购物
Vans(范斯)德国官网:美国南加州的原创极限运动潮牌
2017/05/02 全球购物
艺术设计专业个人求职信
2013/09/21 职场文书
给物业的表扬信
2014/01/21 职场文书
工作推荐信范文
2014/05/10 职场文书
常务副县长“四风”个人对照检查材料思想汇报
2014/10/02 职场文书
宿舍卫生管理制度
2015/08/05 职场文书
2019教师的学习计划
2019/06/25 职场文书
幽默导游词应该怎么写?
2019/08/26 职场文书