Pycharm+Scrapy安装并且初始化项目的方法


Posted in Python onJanuary 15, 2019

前言

Scrapy是一个开源的网络爬虫框架,Python编写的。最初设计用于网页抓取,也可以用来提取数据使用API或作为一个通用的网络爬虫。是数据采集不可必备的利器。

安装

pip install scrapy

如果使用上面的命令太慢。国内可以使用豆瓣源进行加速。

pip install -i https://pypi.douban.com/simple scrapy

注意要写错了,是 https://pypi.douban.com/simple 很多包都可以使用这个源进行加速,这也是pip的一个技巧,还可以使用阿里云进行加速。

安装完成之后在命令行输入

scrapy -v

如果出现了相应的版本号就说明安装成功。

创建项目

目前还没有IDE 能够创建scrapy的项目,我们必须手动初始化项目。

1、找一个目录

输入命令

scrapy startproject SpiderObject

命令行出现这样的结果说明创建成果

You can start your first spider with:
 cd SpiderObject
 scrapy genspider example example.com

去文件夹中看看

Pycharm+Scrapy安装并且初始化项目的方法

初始化项目

使用pycharm打开该项目

Pycharm+Scrapy安装并且初始化项目的方法

如果出现这个页面就说明对了。

Pycharm+Scrapy安装并且初始化项目的方法

下面生成一个模板

打开pycharm的terminal

Pycharm+Scrapy安装并且初始化项目的方法

输入

scrapy genspider BiduSpider http://www.baidu.com

我们的spider 包下面会多一个文件

Pycharm+Scrapy安装并且初始化项目的方法

这说明我们的spider创建成功。可以在pytharm中使用这个 强大的框架了。

以上这篇Pycharm+Scrapy安装并且初始化项目的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python 布尔操作实现代码
Mar 23 Python
python抓取网页图片并放到指定文件夹
Apr 24 Python
利用python打印出菱形、三角形以及矩形的方法实例
Aug 08 Python
python使用xlrd和xlwt读写Excel文件的实例代码
Sep 05 Python
Python判断两个文件是否相同与两个文本进行相同项筛选的方法
Mar 01 Python
详解将Pandas中的DataFrame类型转换成Numpy中array类型的三种方法
Jul 06 Python
python RC4加密操作示例【测试可用】
Sep 26 Python
Python绘图实现显示中文
Dec 04 Python
Python使用monkey.patch_all()解决协程阻塞问题
Apr 15 Python
Python Django中间件使用原理及流程分析
Jun 13 Python
python安装后的目录在哪里
Jun 21 Python
Python将QQ聊天记录生成词云的示例代码
Feb 10 Python
PyCharm 设置SciView工具窗口的方法
Jan 15 #Python
Python设计模式之抽象工厂模式原理与用法详解
Jan 15 #Python
用Pycharm实现鼠标滚轮控制字体大小的方法
Jan 15 #Python
解决在pycharm中显示额外的 figure 窗口问题
Jan 15 #Python
python调用opencv实现猫脸检测功能
Jan 15 #Python
python可视化实现代码
Jan 15 #Python
Python饼状图的绘制实例
Jan 15 #Python
You might like
php获得文件扩展名三法
2006/11/25 PHP
安装APACHE
2007/01/15 PHP
CodeIgniter基于Email类发邮件的方法
2016/03/29 PHP
php微信高级接口调用方法(自定义菜单接口、客服接口、二维码)
2016/11/28 PHP
40个有创意的jQuery图片、内容滑动及弹出插件收藏集之一
2011/12/31 Javascript
Prototype源码浅析 String部分(四)之补充
2012/01/16 Javascript
js获取网页高度(详细整理)
2012/12/28 Javascript
利用百度地图JSAPI生成h7n9禽流感分布图实现代码
2013/04/15 Javascript
几种延迟加载JS代码的方法加快网页的访问速度
2013/10/12 Javascript
深入理解JavaScript高级之词法作用域和作用域链
2013/12/10 Javascript
最常见和最有用的字符串相关的方法详解
2017/02/06 Javascript
写给小白看的JavaScript异步
2017/11/29 Javascript
JavaScript函数、闭包、原型、面向对象学习笔记
2018/09/06 Javascript
JS字符串补全方法padStart()和padEnd()
2020/05/27 Javascript
python抽取指定url页面的title方法
2018/05/11 Python
Python设计模式之适配器模式原理与用法详解
2019/01/15 Python
python实现二级登陆菜单及安装过程
2019/06/21 Python
python输出电脑上所有的串口名的方法
2019/07/02 Python
django自带serializers序列化返回指定字段的方法
2019/08/21 Python
解决Python使用列表副本的问题
2019/12/19 Python
python logging设置level失败的解决方法
2020/02/19 Python
基于Python+QT的gui程序开发实现
2020/07/03 Python
基于python requests selenium爬取excel vba过程解析
2020/08/12 Python
新西兰演唱会和体育门票网站:Ticketmaster新西兰
2017/10/07 全球购物
英国皇室御用百货:福南梅森(Fortnum & Mason)
2017/12/03 全球购物
美国首屈一指的高品质珠宝设计师和零售商:Allurez
2018/01/23 全球购物
武汉东之林科技有限公司机试
2013/09/17 面试题
Linux文件系统类型
2012/09/16 面试题
META-INF文件夹中的MANIFEST.MF的作用
2016/06/21 面试题
2014年社区学雷锋活动总结
2014/03/09 职场文书
校长寄语大全
2014/04/09 职场文书
迎国庆主题班会
2015/08/17 职场文书
创业计划书之DIY自助厨房
2019/09/06 职场文书
《分一些蚊子进来》读后感3篇
2020/01/09 职场文书
解析在浏览器地址栏输入一个URL后发生了什么
2021/06/21 Servers
使用logback实现按自己的需求打印日志到自定义的文件里
2021/08/30 Java/Android