零基础写python爬虫之爬虫框架Scrapy安装配置


Posted in Python onNovember 06, 2014

前面十章爬虫笔记陆陆续续记录了一些简单的Python爬虫知识,
用来解决简单的贴吧下载,绩点运算自然不在话下。
不过要想批量下载大量的内容,比如知乎的所有的问答,那便显得游刃不有余了点。
于是乎,爬虫框架Scrapy就这样出场了!
Scrapy = Scrach+Python,Scrach这个单词是抓取的意思,

Scrapy的官网地址:点我点我。

那么下面来简单的演示一下Scrapy的安装流程。
具体流程参照:https://3water.com/article/48607.htm
友情提醒:一定要按照Python的版本下载,要不然安装的时候会提醒找不到Python。建议大家安装32位是因为有些版本的必备软件64位不好找。

1.安装Python(建议32位)

建议安装Python2.7.x,3.x貌似还不支持。
安装完了记得配置环境,将python目录和python目录下的Scripts目录添加到系统环境变量的Path里。
在cmd中输入python如果出现版本信息说明配置完毕。

2.安装lxml

lxml是一种使用 Python 编写的库,可以迅速、灵活地处理 XML。点击这里选择对应的Python版本安装。

3.安装setuptools

用来安装egg文件,点击这里下载python2.7的对应版本的setuptools。

4.安装zope.interface

可以使用第三步下载的setuptools来安装egg文件,现在也有exe版本,点击这里下载。

5.安装Twisted

Twisted是用Python实现的基于事件驱动的网络引擎框架,点击这里下载。

6.安装pyOpenSSL

pyOpenSSL是Python的OpenSSL接口,点击这里下载。

7.安装win32py

提供win32api,点击这里下载

8.安装Scrapy

终于到了激动人心的时候了!安装了那么多小部件之后终于轮到主角登场。
直接在cmd中输入easy_install scrapy回车即可。

9.检查安装

打开一个cmd窗口,在任意位置执行scrapy命令,得到下列页面,表示环境配置成功。

零基础写python爬虫之爬虫框架Scrapy安装配置

Python 相关文章推荐
详解Python验证码识别
Jan 25 Python
python实现将读入的多维list转为一维list的方法
Jun 28 Python
CentOS7下python3.7.0安装教程
Jul 30 Python
Python3列表内置方法大全及示例代码小结
May 10 Python
Python语言进阶知识点总结
May 28 Python
Python split() 函数拆分字符串将字符串转化为列的方法
Jul 16 Python
python Elasticsearch索引建立和数据的上传详解
Aug 04 Python
如何通过Python3和ssl实现加密通信功能
May 09 Python
python opencv 实现读取、显示、写入图像的方法
Jun 08 Python
django下创建多个app并设置urls方法
Aug 02 Python
Python selenium爬取微信公众号文章代码详解
Aug 12 Python
Python自动化实战之接口请求的实现
May 30 Python
零基础写python爬虫之爬虫编写全记录
Nov 06 #Python
零基础写python爬虫之打包生成exe文件
Nov 06 #Python
零基础写python爬虫之抓取百度贴吧并存储到本地txt文件改进版
Nov 06 #Python
零基础写python爬虫之抓取糗事百科代码分享
Nov 06 #Python
零基础写python爬虫之神器正则表达式
Nov 06 #Python
零基础写python爬虫之抓取百度贴吧代码分享
Nov 06 #Python
零基础写python爬虫之urllib2使用指南
Nov 05 #Python
You might like
php对大文件进行读取操作的实现代码
2013/01/23 PHP
jquer之ajaxQueue简单实现代码
2011/09/15 Javascript
Javascript 多浏览器兼容总结(实战经验)
2013/10/30 Javascript
jquery给图片添加鼠标经过时的边框效果
2013/11/12 Javascript
快速解决FusionCharts联动的中文乱码问题
2013/12/04 Javascript
使用pjax实现无刷新更改页面url
2015/02/05 Javascript
jquery实现用户打分评分特效
2015/05/28 Javascript
介绍JavaScript的一个微型模版
2015/06/24 Javascript
BootstrapTable+KnockoutJS自定义T4模板快速生成增删改查页面
2016/08/01 Javascript
js修改onclick动作的四种方法(推荐)
2016/08/18 Javascript
微信小程序滚动Tab实现左右可滑动切换
2017/08/17 Javascript
vue2.0 使用element-ui里的upload组件实现图片预览效果方法
2018/09/04 Javascript
详解超简单的react服务器渲染(ssr)入坑指南
2019/02/28 Javascript
利用vue-i18n实现多语言切换效果的方法
2019/06/19 Javascript
小程序实现左滑删除效果
2019/07/25 Javascript
python目录与文件名操作例子
2016/08/28 Python
Python使用openpyxl读写excel文件的方法
2017/06/30 Python
Python实现二维数组按照某行或列排序的方法【numpy lexsort】
2017/09/22 Python
Python for循环中的陷阱详解
2018/07/13 Python
python特性语法之遍历、公共方法、引用
2018/08/08 Python
python匹配两个短语之间的字符实例
2018/12/25 Python
Python 文件操作之读取文件(read),文件指针与写入文件(write),文件打开方式示例
2019/09/29 Python
tensorflow 实现自定义layer并添加到计算图中
2020/02/04 Python
沪江旗下的海量优质课程平台:沪江网校
2017/11/07 全球购物
伦敦高达60%折扣的钻石珠宝商:Purely Diamonds
2018/06/24 全球购物
Desigual美国官方网站:西班牙服装品牌
2019/03/29 全球购物
什么是符号链接,什么是硬链接?符号链接与硬链接的区别是什么?
2013/05/03 面试题
教师绩效考核方案
2014/01/21 职场文书
《凡卡》教学反思
2014/04/09 职场文书
青春无悔演讲稿
2014/05/08 职场文书
生活部的活动方案
2014/08/19 职场文书
董事长年会致辞
2015/07/29 职场文书
幼师自荐信范文(2016推荐篇)
2016/01/28 职场文书
《迟到》教学反思
2016/02/24 职场文书
祝福语集锦:给满月宝宝的祝福语
2019/11/20 职场文书
Java新手教程之ArrayList的基本使用
2021/06/20 Java/Android