零基础写python爬虫之爬虫框架Scrapy安装配置


Posted in Python onNovember 06, 2014

前面十章爬虫笔记陆陆续续记录了一些简单的Python爬虫知识,
用来解决简单的贴吧下载,绩点运算自然不在话下。
不过要想批量下载大量的内容,比如知乎的所有的问答,那便显得游刃不有余了点。
于是乎,爬虫框架Scrapy就这样出场了!
Scrapy = Scrach+Python,Scrach这个单词是抓取的意思,

Scrapy的官网地址:点我点我。

那么下面来简单的演示一下Scrapy的安装流程。
具体流程参照:https://3water.com/article/48607.htm
友情提醒:一定要按照Python的版本下载,要不然安装的时候会提醒找不到Python。建议大家安装32位是因为有些版本的必备软件64位不好找。

1.安装Python(建议32位)

建议安装Python2.7.x,3.x貌似还不支持。
安装完了记得配置环境,将python目录和python目录下的Scripts目录添加到系统环境变量的Path里。
在cmd中输入python如果出现版本信息说明配置完毕。

2.安装lxml

lxml是一种使用 Python 编写的库,可以迅速、灵活地处理 XML。点击这里选择对应的Python版本安装。

3.安装setuptools

用来安装egg文件,点击这里下载python2.7的对应版本的setuptools。

4.安装zope.interface

可以使用第三步下载的setuptools来安装egg文件,现在也有exe版本,点击这里下载。

5.安装Twisted

Twisted是用Python实现的基于事件驱动的网络引擎框架,点击这里下载。

6.安装pyOpenSSL

pyOpenSSL是Python的OpenSSL接口,点击这里下载。

7.安装win32py

提供win32api,点击这里下载

8.安装Scrapy

终于到了激动人心的时候了!安装了那么多小部件之后终于轮到主角登场。
直接在cmd中输入easy_install scrapy回车即可。

9.检查安装

打开一个cmd窗口,在任意位置执行scrapy命令,得到下列页面,表示环境配置成功。

零基础写python爬虫之爬虫框架Scrapy安装配置

Python 相关文章推荐
python实现的生成随机迷宫算法核心代码分享(含游戏完整代码)
Jul 11 Python
Python内置的字符串处理函数详细整理(覆盖日常所用)
Aug 19 Python
Python实现聊天机器人的示例代码
Jul 09 Python
浅谈python中拼接路径os.path.join斜杠的问题
Oct 23 Python
解决pycharm py文件运行后停止按钮变成了灰色的问题
Nov 29 Python
python django 原生sql 获取数据的例子
Aug 14 Python
python读取dicom图像示例(SimpleITK和dicom包实现)
Jan 16 Python
解决tensorflow打印tensor有省略号的问题
Feb 04 Python
详解如何在pyqt中通过OpenCV实现对窗口的透视变换
Sep 20 Python
Python中的None与 NULL(即空字符)的区别详解
Sep 24 Python
关于python中导入文件到list的问题
Oct 31 Python
python playwright之元素定位示例详解
Jul 23 Python
零基础写python爬虫之爬虫编写全记录
Nov 06 #Python
零基础写python爬虫之打包生成exe文件
Nov 06 #Python
零基础写python爬虫之抓取百度贴吧并存储到本地txt文件改进版
Nov 06 #Python
零基础写python爬虫之抓取糗事百科代码分享
Nov 06 #Python
零基础写python爬虫之神器正则表达式
Nov 06 #Python
零基础写python爬虫之抓取百度贴吧代码分享
Nov 06 #Python
零基础写python爬虫之urllib2使用指南
Nov 05 #Python
You might like
thinkPHP中U方法加密传递参数功能示例
2018/05/29 PHP
js检测客户端不是firefox则提示下载
2007/04/07 Javascript
查询绑定数据岛的表格中的文本并修改显示方式的js代码
2009/12/15 Javascript
jQuery EasyUI API 中文文档 - Spinner微调器使用
2011/10/21 Javascript
THREE.JS入门教程(6)创建自己的全景图实现步骤
2013/01/25 Javascript
再谈JavaScript线程
2015/07/10 Javascript
js+CSS实现模拟华丽的select控件下拉菜单效果
2015/09/01 Javascript
JS实现简单的二维矩阵乘积运算
2016/01/26 Javascript
浅析Nodejs npm常用命令
2016/06/14 NodeJs
JavaScript动态数量的文件上传控件
2016/11/18 Javascript
VueJs单页应用实现微信网页授权及微信分享功能示例
2017/07/26 Javascript
浅谈关于angularJs中使用$.ajax的注意点
2017/08/12 Javascript
详解vue + vuex + directives实现权限按钮的思路
2017/10/24 Javascript
移动端H5页面返回并刷新页面(BFcache)的方法
2018/11/06 Javascript
vue实现codemirror代码编辑器中的SQL代码格式化功能
2019/08/27 Javascript
vue中的mescroll搜索运用及各种填坑处理
2019/10/30 Javascript
JavaScript仿京东秒杀倒计时
2020/03/17 Javascript
Python深入学习之闭包
2014/08/31 Python
Python模块搜索概念介绍及模块安装方法介绍
2015/06/03 Python
Python简单连接MongoDB数据库的方法
2016/03/15 Python
Python实现的爬虫功能代码
2017/06/24 Python
pyqt5自定义信号实例解析
2018/01/31 Python
keras Lambda自定义层实现数据的切片方式,Lambda传参数
2020/06/11 Python
python 三种方法提取pdf中的图片
2021/02/07 Python
Python3.9.1中使用match方法详解
2021/02/08 Python
微软新西兰官方网站:Microsoft New Zealand
2018/08/17 全球购物
构造方法和其他方法的区别?怎么调用父类的构造方法
2013/09/22 面试题
英语专业毕业生自荐信
2013/10/28 职场文书
初中生学习的自我评价
2013/11/14 职场文书
微笑面对生活演讲稿
2014/05/13 职场文书
触电现场处置方案
2014/05/14 职场文书
暑期学习心得体会
2014/09/02 职场文书
股东授权委托书范文
2014/09/13 职场文书
医德考评自我评价
2014/09/14 职场文书
标准离婚协议书(2014版)
2014/10/05 职场文书
IDEA 2022 Translation 未知错误 翻译文档失败
2022/04/24 Java/Android