Pycharm+Scrapy安装并且初始化项目的方法


Posted in Python onJanuary 15, 2019

前言

Scrapy是一个开源的网络爬虫框架,Python编写的。最初设计用于网页抓取,也可以用来提取数据使用API或作为一个通用的网络爬虫。是数据采集不可必备的利器。

安装

pip install scrapy

如果使用上面的命令太慢。国内可以使用豆瓣源进行加速。

pip install -i https://pypi.douban.com/simple scrapy

注意要写错了,是 https://pypi.douban.com/simple 很多包都可以使用这个源进行加速,这也是pip的一个技巧,还可以使用阿里云进行加速。

安装完成之后在命令行输入

scrapy -v

如果出现了相应的版本号就说明安装成功。

创建项目

目前还没有IDE 能够创建scrapy的项目,我们必须手动初始化项目。

1、找一个目录

输入命令

scrapy startproject SpiderObject

命令行出现这样的结果说明创建成果

You can start your first spider with:
 cd SpiderObject
 scrapy genspider example example.com

去文件夹中看看

Pycharm+Scrapy安装并且初始化项目的方法

初始化项目

使用pycharm打开该项目

Pycharm+Scrapy安装并且初始化项目的方法

如果出现这个页面就说明对了。

Pycharm+Scrapy安装并且初始化项目的方法

下面生成一个模板

打开pycharm的terminal

Pycharm+Scrapy安装并且初始化项目的方法

输入

scrapy genspider BiduSpider http://www.baidu.com

我们的spider 包下面会多一个文件

Pycharm+Scrapy安装并且初始化项目的方法

这说明我们的spider创建成功。可以在pytharm中使用这个 强大的框架了。

以上这篇Pycharm+Scrapy安装并且初始化项目的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python编写的最短路径算法
Mar 25 Python
详解Python程序与服务器连接的WSGI接口
Apr 29 Python
Python读取Word(.docx)正文信息的方法
Mar 15 Python
解决Django中多条件查询的问题
Jul 18 Python
python selenium 查找隐藏元素 自动播放视频功能
Jul 24 Python
django的ORM操作 增加和查询
Jul 26 Python
Python使用get_text()方法从大段html中提取文本的实例
Aug 27 Python
python异步编程 使用yield from过程解析
Sep 25 Python
Python 闭包,函数分隔作用域,nonlocal声明非局部变量操作示例
Oct 14 Python
python sorted函数原理解析及练习
Feb 10 Python
Keras实现将两个模型连接到一起
May 23 Python
详解BeautifulSoup获取特定标签下内容的方法
Dec 07 Python
PyCharm 设置SciView工具窗口的方法
Jan 15 #Python
Python设计模式之抽象工厂模式原理与用法详解
Jan 15 #Python
用Pycharm实现鼠标滚轮控制字体大小的方法
Jan 15 #Python
解决在pycharm中显示额外的 figure 窗口问题
Jan 15 #Python
python调用opencv实现猫脸检测功能
Jan 15 #Python
python可视化实现代码
Jan 15 #Python
Python饼状图的绘制实例
Jan 15 #Python
You might like
PHP中通过ADO调用Access数据库的方法测试不通过
2006/12/31 PHP
php生成zip压缩文件的方法详解
2013/06/09 PHP
php限制上传文件类型并保存上传文件的方法
2015/03/13 PHP
php集成套件服务器xampp安装使用教程(适合第一次玩PHP的新手)
2015/06/03 PHP
php  单例模式详细介绍及实现源码
2016/11/05 PHP
Laravel 修改默认日志文件名称和位置的例子
2019/10/17 PHP
模仿百度三维地图的js数据分享
2011/05/12 Javascript
ASP.NET jQuery 实例14 在ASP.NET form中校验时间范围
2012/02/03 Javascript
JSCode all of Brower 全局屏蔽网页右键功能 具体实现
2013/06/05 Javascript
原生js配合cookie制作保存路径的拖拽
2015/12/29 Javascript
JavaScript中的冒泡排序法
2016/08/03 Javascript
jQuery实现两个select控件的互移操作
2016/12/22 Javascript
JavaScript之DOM插入更新删除_动力节点Java学院整理
2017/07/03 Javascript
angularjs实现猜数字大小功能
2020/05/20 Javascript
纯js实现隔行变色效果
2017/11/29 Javascript
详解最新vue-cli 2.9.1的webpack存在问题
2017/12/16 Javascript
vue将时间戳转换成自定义时间格式的方法
2018/03/02 Javascript
微信小程序 行的删除和增加操作实现详解
2019/09/29 Javascript
webpack3.0升级4.0的方法步骤
2020/04/02 Javascript
解决Vue中使用keepAlive不缓存问题
2020/08/04 Javascript
在js文件中引入(调用)另一个js文件的三种方法
2020/09/11 Javascript
windows下wxPython开发环境安装与配置方法
2014/06/28 Python
Python中使用partial改变方法默认参数实例
2015/04/28 Python
python3音乐播放器简单实现代码
2020/04/20 Python
Python编程实现生成特定范围内不重复多个随机数的2种方法
2017/04/14 Python
Python cookbook(数据结构与算法)实现对不原生支持比较操作的对象排序算法示例
2018/03/15 Python
python程序控制NAO机器人行走
2019/04/29 Python
python 扩展print打印文件路径和当前时间信息的实例代码
2019/10/11 Python
Django使用rest_framework写出API
2020/05/21 Python
canvas学习总结三之绘制路径-线段
2019/01/31 HTML / CSS
十八大闭幕感言
2014/01/22 职场文书
教书育人演讲稿
2014/09/11 职场文书
2014年党的群众路线教育实践活动整改措施(个人版)
2014/09/25 职场文书
公安机关纪律作风整顿剖析
2014/10/10 职场文书
python scipy 稀疏矩阵的使用说明
2021/05/26 Python
JS 基本概念详细介绍
2021/10/16 Javascript