Windows下安装Scrapy


Posted in Python onOctober 17, 2018

这几天正好有需求实现一个爬虫程序,想到爬虫程序立马就想到了python,python相关的爬虫资料好像也特别多。于是就决定用python来实现爬虫程序了,正好发现了python有一个开源库scrapy,正是用来实现爬虫框架的,于是果断采用这个实现。下面就先安装scrapy,决定在windows下面安装。

Scrapy简介

Scrapy,Python开发的一个快速、高层次的屏幕抓取和web抓取框架,用于抓取web站点并从页面中提取结构化的数据。

Scrapy用途广泛,可以用于数据挖掘、监测和自动化测试。

Scrapy吸引人的地方在于它是一个框架,任何人都可以根据需求方便的修改。它也提供了多种类型爬虫的基类,如BaseSpider、sitemap爬虫等,最新版本又提供了web2.0爬虫的支持。

安装依赖

  • Scrapy安装依赖于以下几个Python库
  • lxml, an efficient XML and HTML parser
  • parsel, an HTML/XML data extraction library written on top of lxml,
  • w3lib, a multi-purpose helper for dealing with URLs and web page encodings
  • twisted, an asynchronous networking framework
  • cryptography and pyOpenSSL, to deal with various network-level security needs

我选择手动安装这些依赖

  • pip install lxml
  • pip install parsel
  • pip install w3lib
  • pip install twisted
  • pip install cryptography
  • pip install pyOpenSSL

其他的安装都很顺利,就是在安装twisted的时候报错了。

Microsoft Visual C++ 14.0 is required. Get it with "Microsoft Visual C++ Build Tools": http://landinghub.visualstudio.com/visual-cpp-build-tools

于是下载离线的安装(下载自己的版本)
https://www.lfd.uci.edu/~gohlke/pythonlibs/#twisted

下载到一个目录,然后用

pip install Twisted-17.9.0-cp36-cp36m-win32.whl

之后再用下面的命令安装就可以了

pip install Scrapy

在命令行中输入scrapy,出现如下界面,则表示安装成功

Windows下安装Scrapy

总结

以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,谢谢大家对三水点靠木的支持。如果你想了解更多相关内容请查看下面相关链接

Python 相关文章推荐
Python模块学习 re 正则表达式
May 19 Python
linux下python抓屏实现方法
May 22 Python
Python中取整的几种方法小结
Jan 06 Python
SQLite3中文编码 Python的实现
Jan 11 Python
解决python2.7用pip安装包时出现错误的问题
Jan 23 Python
使用Python对SQLite数据库操作
Apr 06 Python
深入理解python中的select模块
Apr 23 Python
Python小进度条显示代码
Mar 05 Python
python实现的汉诺塔算法示例
Oct 23 Python
用python画一只可爱的皮卡丘实例
Nov 21 Python
关于多元线性回归分析——Python&SPSS
Feb 24 Python
python获取天气接口给指定微信好友发天气预报
Dec 28 Python
python高级特性和高阶函数及使用详解
Oct 17 #Python
基于python实现学生管理系统
Oct 17 #Python
python3.4控制用户输入与输出的方法
Oct 17 #Python
python学生信息管理系统(完整版)
Apr 05 #Python
python3的输入方式及多组输入方法
Oct 17 #Python
Python3.6使用tesseract-ocr的正确方法
Oct 17 #Python
python学生信息管理系统(初级版)
Oct 17 #Python
You might like
ThinkPHP CURD方法之table方法详解
2014/06/18 PHP
PHP框架性能测试报告
2016/05/08 PHP
模仿JQuery.extend函数扩展自己对象的js代码
2009/12/09 Javascript
JQuery 学习笔记01 JQuery初接触
2010/05/06 Javascript
在JS数组特定索引处指定位置插入元素的技巧
2014/08/24 Javascript
分享9个最好用的JavaScript开发工具和代码编辑器
2015/03/24 Javascript
使用Node.js为其他程序编写扩展的基本方法
2015/06/23 Javascript
jQuery实现MSN中文网滑动Tab菜单效果代码
2015/09/09 Javascript
针对BootStrap中tabs控件的美化和完善(推荐)
2016/07/06 Javascript
JavaScript中的Reflect对象详解(ES6新特性)
2016/07/22 Javascript
详解Vue文档中几个易忽视部分的剖析
2018/03/24 Javascript
vue非父子组件通信问题及解决方法
2018/06/11 Javascript
使用koa-log4管理nodeJs日志笔记的使用方法
2018/11/30 NodeJs
JS使用Prim算法和Kruskal算法实现最小生成树
2019/01/17 Javascript
React中阻止事件冒泡的问题详析
2019/04/12 Javascript
为Python的Tornado框架配置使用Jinja2模板引擎的方法
2016/06/30 Python
快速入手Python字符编码
2016/08/03 Python
TensorFlow安装及jupyter notebook配置方法
2017/09/08 Python
Python实现曲线拟合操作示例【基于numpy,scipy,matplotlib库】
2018/07/12 Python
利用Python将每日一句定时推送至微信的实现方法
2018/08/13 Python
python模块常用用法实例详解
2019/10/17 Python
python实现银行管理系统
2019/10/25 Python
利用4行Python代码监测每一行程序的运行时间和空间消耗
2020/04/22 Python
Jupyter Notebook添加代码自动补全功能的实现
2021/01/07 Python
浅谈HTML5 Web Worker的使用
2018/01/05 HTML / CSS
迪卡侬印尼体育用品商店:Decathlon印尼
2020/03/11 全球购物
党支部书记岗位责任制
2014/02/11 职场文书
彩色的非洲教学反思
2014/02/18 职场文书
励志演讲稿800字
2014/08/21 职场文书
小学生民族团结演讲稿
2014/08/27 职场文书
2014年变电站工作总结
2014/12/19 职场文书
通报表扬范文
2015/01/17 职场文书
学校标语口号大全
2015/12/26 职场文书
Matlab求解数组中的最大值及它所在的具体位置
2021/04/16 Python
Java 使用类型为Object的变量指向任意类型的对象
2022/04/13 Java/Android
win10音频服务未响应怎么解决?win10音频服务未响应未修复的解决方法
2022/08/14 数码科技