Windows下安装Scrapy


Posted in Python onOctober 17, 2018

这几天正好有需求实现一个爬虫程序,想到爬虫程序立马就想到了python,python相关的爬虫资料好像也特别多。于是就决定用python来实现爬虫程序了,正好发现了python有一个开源库scrapy,正是用来实现爬虫框架的,于是果断采用这个实现。下面就先安装scrapy,决定在windows下面安装。

Scrapy简介

Scrapy,Python开发的一个快速、高层次的屏幕抓取和web抓取框架,用于抓取web站点并从页面中提取结构化的数据。

Scrapy用途广泛,可以用于数据挖掘、监测和自动化测试。

Scrapy吸引人的地方在于它是一个框架,任何人都可以根据需求方便的修改。它也提供了多种类型爬虫的基类,如BaseSpider、sitemap爬虫等,最新版本又提供了web2.0爬虫的支持。

安装依赖

  • Scrapy安装依赖于以下几个Python库
  • lxml, an efficient XML and HTML parser
  • parsel, an HTML/XML data extraction library written on top of lxml,
  • w3lib, a multi-purpose helper for dealing with URLs and web page encodings
  • twisted, an asynchronous networking framework
  • cryptography and pyOpenSSL, to deal with various network-level security needs

我选择手动安装这些依赖

  • pip install lxml
  • pip install parsel
  • pip install w3lib
  • pip install twisted
  • pip install cryptography
  • pip install pyOpenSSL

其他的安装都很顺利,就是在安装twisted的时候报错了。

Microsoft Visual C++ 14.0 is required. Get it with "Microsoft Visual C++ Build Tools": http://landinghub.visualstudio.com/visual-cpp-build-tools

于是下载离线的安装(下载自己的版本)
https://www.lfd.uci.edu/~gohlke/pythonlibs/#twisted

下载到一个目录,然后用

pip install Twisted-17.9.0-cp36-cp36m-win32.whl

之后再用下面的命令安装就可以了

pip install Scrapy

在命令行中输入scrapy,出现如下界面,则表示安装成功

Windows下安装Scrapy

总结

以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,谢谢大家对三水点靠木的支持。如果你想了解更多相关内容请查看下面相关链接

Python 相关文章推荐
python 解析XML python模块xml.dom解析xml实例代码
Feb 07 Python
Python抓取京东图书评论数据
Aug 31 Python
Python字符串格式化%s%d%f详解
Feb 02 Python
python MysqlDb模块安装及其使用详解
Feb 23 Python
pthon贪吃蛇游戏详细代码
Jan 27 Python
Python pip替换为阿里源的方法步骤
Jul 02 Python
利用Python进行图像的加法,图像混合(附代码)
Jul 14 Python
Python使用正则表达式分割字符串的实现方法
Jul 16 Python
Python之数据序列化(json、pickle、shelve)详解
Aug 30 Python
Python 日期的转换及计算的具体使用详解
Jan 16 Python
django修改models重建数据库的操作
Mar 31 Python
浅析Python打包时包含静态文件处理方法
Jan 15 Python
python高级特性和高阶函数及使用详解
Oct 17 #Python
基于python实现学生管理系统
Oct 17 #Python
python3.4控制用户输入与输出的方法
Oct 17 #Python
python学生信息管理系统(完整版)
Apr 05 #Python
python3的输入方式及多组输入方法
Oct 17 #Python
Python3.6使用tesseract-ocr的正确方法
Oct 17 #Python
python学生信息管理系统(初级版)
Oct 17 #Python
You might like
在MongoDB中模拟Auto Increment的php代码
2011/03/06 PHP
php对mongodb的扩展(初出茅庐)
2012/11/11 PHP
解决yii2左侧菜单子级无法高亮问题的方法
2016/05/08 PHP
详解php协程知识点
2018/09/21 PHP
windows系统下简单nodejs安装及环境配置
2013/01/08 NodeJs
解析javascript 数组以及json元素的添加删除
2013/06/26 Javascript
Jquery取得iframe下内容的方法
2013/11/18 Javascript
关于jquery中动态增加select,事件无效的快速解决方法
2016/08/29 Javascript
javascript 实现动态侧边栏实例详解
2016/11/11 Javascript
javascript数据类型详解
2017/02/07 Javascript
JS同步、异步、延迟加载的方法
2018/05/05 Javascript
讲解vue-router之命名路由和命名视图
2018/05/28 Javascript
vue组件实现可搜索下拉框扩展
2020/10/23 Javascript
Nodejs处理异常操作示例
2018/12/25 NodeJs
微信小程序搜索功能(附:小程序前端+PHP后端)
2019/02/28 Javascript
javascript实现文字跑马灯效果
2020/06/18 Javascript
浅析Python 中整型对象存储的位置
2016/05/16 Python
python 爬虫出现403禁止访问错误详解
2017/03/11 Python
python3.7通过thrift操作hbase的示例代码
2020/01/14 Python
Python ORM框架Peewee用法详解
2020/04/29 Python
Django的ListView超详细用法(含分页paginate)
2020/05/21 Python
聊聊Python pandas 中loc函数的使用,及跟iloc的区别说明
2021/03/03 Python
CSS3的新特性介绍
2008/10/31 HTML / CSS
2分钟教你实现环形/扇形菜单(基础版)
2020/01/15 HTML / CSS
详解px单位html5响应式方案
2018/03/08 HTML / CSS
英国在线自行车商店:Evans Cycles
2016/09/26 全球购物
Office DEPOT法国官网:欧迪办公用品采购
2018/01/03 全球购物
精油和天然健康美容产品:Art Naturals
2018/01/27 全球购物
JNI的定义
2012/11/25 面试题
Java程序员面试题
2013/07/15 面试题
家长评语大全
2014/01/22 职场文书
出纳员岗位职责
2014/03/13 职场文书
歌唱比赛主持词
2014/03/18 职场文书
培训心得体会怎么写
2016/01/25 职场文书
基于Java的MathML转图片的方法(示例代码)
2021/06/23 Java/Android
win10如何快速切换窗口 win10切换窗口快捷键分享
2022/07/23 数码科技