零基础写python爬虫之爬虫框架Scrapy安装配置


Posted in Python onNovember 06, 2014

前面十章爬虫笔记陆陆续续记录了一些简单的Python爬虫知识,
用来解决简单的贴吧下载,绩点运算自然不在话下。
不过要想批量下载大量的内容,比如知乎的所有的问答,那便显得游刃不有余了点。
于是乎,爬虫框架Scrapy就这样出场了!
Scrapy = Scrach+Python,Scrach这个单词是抓取的意思,

Scrapy的官网地址:点我点我。

那么下面来简单的演示一下Scrapy的安装流程。
具体流程参照:https://3water.com/article/48607.htm
友情提醒:一定要按照Python的版本下载,要不然安装的时候会提醒找不到Python。建议大家安装32位是因为有些版本的必备软件64位不好找。

1.安装Python(建议32位)

建议安装Python2.7.x,3.x貌似还不支持。
安装完了记得配置环境,将python目录和python目录下的Scripts目录添加到系统环境变量的Path里。
在cmd中输入python如果出现版本信息说明配置完毕。

2.安装lxml

lxml是一种使用 Python 编写的库,可以迅速、灵活地处理 XML。点击这里选择对应的Python版本安装。

3.安装setuptools

用来安装egg文件,点击这里下载python2.7的对应版本的setuptools。

4.安装zope.interface

可以使用第三步下载的setuptools来安装egg文件,现在也有exe版本,点击这里下载。

5.安装Twisted

Twisted是用Python实现的基于事件驱动的网络引擎框架,点击这里下载。

6.安装pyOpenSSL

pyOpenSSL是Python的OpenSSL接口,点击这里下载。

7.安装win32py

提供win32api,点击这里下载

8.安装Scrapy

终于到了激动人心的时候了!安装了那么多小部件之后终于轮到主角登场。
直接在cmd中输入easy_install scrapy回车即可。

9.检查安装

打开一个cmd窗口,在任意位置执行scrapy命令,得到下列页面,表示环境配置成功。

零基础写python爬虫之爬虫框架Scrapy安装配置

Python 相关文章推荐
Django返回json数据用法示例
Sep 18 Python
python顺序的读取文件夹下名称有序的文件方法
Jul 11 Python
python递归全排列实现方法
Aug 18 Python
pycharm 取消默认的右击运行unittest的方法
Nov 29 Python
Python中logging.NullHandler 的使用教程
Nov 29 Python
在SQLite-Python中实现返回、查询中文字段的方法
Jul 17 Python
Python关于反射的实例代码分享
Feb 20 Python
浅析matlab中imadjust函数
Feb 27 Python
Python开发之身份证验证库id_validator验证身份证号合法性及根据身份证号返回住址年龄等信息
Mar 20 Python
jupyter notebook中新建cell的方法与快捷键操作
Apr 22 Python
opencv 图像轮廓的实现示例
Jul 08 Python
python cv2图像质量压缩的算法示例
Jun 04 Python
零基础写python爬虫之爬虫编写全记录
Nov 06 #Python
零基础写python爬虫之打包生成exe文件
Nov 06 #Python
零基础写python爬虫之抓取百度贴吧并存储到本地txt文件改进版
Nov 06 #Python
零基础写python爬虫之抓取糗事百科代码分享
Nov 06 #Python
零基础写python爬虫之神器正则表达式
Nov 06 #Python
零基础写python爬虫之抓取百度贴吧代码分享
Nov 06 #Python
零基础写python爬虫之urllib2使用指南
Nov 05 #Python
You might like
PHP实现生成数据字典功能示例
2018/05/24 PHP
Laravel使用Queue队列的技巧汇总
2019/09/02 PHP
捕获关闭窗口的脚本
2009/01/10 Javascript
浏览器脚本兼容 文本框中,回车键触发事件的兼容
2010/06/21 Javascript
JQuery FlexiGrid的asp.net完美解决方案 dotNetFlexGrid-.Net原生的异步表格控件
2010/09/12 Javascript
一个简单的JS鼠标悬停特效具体方法
2013/06/17 Javascript
jQuery之选择组件的深入解析
2013/06/19 Javascript
JavaScript中一个奇葩的IE浏览器判断方法
2014/04/16 Javascript
nodejs 的 session 简单使用
2016/06/06 NodeJs
jQuery EasyUI编辑DataGrid用combobox实现多级联动
2016/08/29 Javascript
javascript获取以及设置光标位置
2017/02/16 Javascript
JS生成随机打乱数组的方法示例
2017/12/23 Javascript
Vue 仿QQ左滑删除组件功能
2018/03/12 Javascript
js提取中文拼音首字母的封装工具类
2018/03/12 Javascript
JavaScript面试出现频繁的一些易错点整理
2018/03/29 Javascript
node静态服务器实现静态读取文件或文件夹
2019/12/03 Javascript
vue中使用极验验证码的方法(附demo)
2019/12/04 Javascript
js String.prototype.trim字符去前后空格的扩展
2020/08/23 Javascript
Node.js API详解之 net模块实例分析
2020/05/18 Javascript
Vue中 axios delete请求参数操作
2020/08/25 Javascript
解决Mint-ui 框架Popup和Datetime Picker组件滚动穿透的问题
2020/11/04 Javascript
深入解析Python中的WSGI接口
2015/05/11 Python
Python中对元组和列表按条件进行排序的方法示例
2015/11/10 Python
python+ffmpeg视频并发直播压力测试
2018/03/06 Python
Python matplotlib绘制饼状图功能示例
2019/09/10 Python
python模式 工厂模式原理及实例详解
2020/02/11 Python
python实现连连看游戏
2020/02/14 Python
python GUI库图形界面开发之PyQt5时间控件QTimer详细使用方法与实例
2020/02/26 Python
纯CSS3实现扇形动画菜单(简化版)实例源码
2017/01/17 HTML / CSS
求职推荐信
2013/10/28 职场文书
通用求职信范文模板分享
2013/12/27 职场文书
优秀的应届生自荐信
2014/05/23 职场文书
送温暖献爱心活动总结
2014/07/08 职场文书
2014年监理个人工作总结
2014/12/11 职场文书
2016年最美孝心少年事迹材料
2016/02/26 职场文书
Python爬虫之自动爬取某车之家各车销售数据
2021/06/02 Python