Python3爬虫中pyspider的安装步骤


Posted in Python onJuly 29, 2020

pyspider是国人binux编写的强大的网络爬虫框架,它带有强大的WebUI、脚本编辑器、任务监控器、项目管理器以及结果处理器,同时支持多种数据库后端、多种消息队列,另外还支持JavaScript渲染页面的爬取,使用起来非常方便,本节介绍一下它的安装过程。

1. 相关链接

官方文档:http://docs.pyspider.org/

PyPI:https://pypi.python.org/pypi/pyspider

GitHub:https://github.com/binux/pyspider

官方教程:http://docs.pyspider.org/en/latest/tutorial

在线实例:http://demo.pyspider.org

2. 准备工作

pyspider是支持JavaScript渲染的,而这个过程是依赖于PhantomJS的,所以还需要安装PhantomJS(具体的安装过程详见1.2.5节)。

3. pip安装

这里推荐使用pip安装,命令如下:

pip3 install pyspider

命令执行完毕即可完成安装。

4. 常见错误

Windows下可能会出现这样的错误提示:

Command "python setup.py egg_info" failed with error code 1 in /tmp/pip-build-vXo1W3/pycurl

这是PyCurl安装错误,此时需要安装PyCurl库。从http://www.lfd.uci.edu/~gohlke/pythonlibs/#pycurl找到对应的Python版本,然后下载相应的wheel文件即可。比如Windows 64位、Python 3.6,则需要下载pycurl‑7.43.0‑cp36‑cp36m‑win_amd64.whl,随后用pip安装即可,命令如下:

pip3 install pycurl‑7.43.0‑cp36‑cp36m‑win_amd64.whl

如果在Linux下遇到PyCurl的错误,可以参考本文:https://3water.com/article/192094.htm。

5. 验证安装

安装完成之后,可以直接在命令行下启动pyspider:

pyspider all

此时控制台会有类似如图1-74所示的输出。

Python3爬虫中pyspider的安装步骤

这时pyspider的Web服务就会在本地5000端口运行。直接在浏览器中打开http://localhost:5000/,即可进入pyspider的WebUI管理页面,如图1-75所示,这证明pyspider已经安装成功了。

Python3爬虫中pyspider的安装步骤

后面,我们会详细介绍pyspider的用法。

到此这篇关于Python3爬虫中pyspider的安装步骤的文章就介绍到这了,更多相关Python3爬虫pyspider的安装内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
零基础学Python(一)Python环境安装
Aug 20 Python
python实现查询苹果手机维修进度
Mar 16 Python
Python下Fabric的简单部署方法
Jul 14 Python
django中send_mail功能实现详解
Feb 06 Python
在Mac上删除自己安装的Python方法
Oct 29 Python
python保存二维数组到txt文件中的方法
Nov 15 Python
python Pexpect 实现输密码 scp 拷贝的方法
Jan 03 Python
Python队列RabbitMQ 使用方法实例记录
Aug 05 Python
Python读取多列数据以及用matplotlib制作图表方法实例
Sep 23 Python
如何通过python计算圆周率PI
Nov 11 Python
Python常用断言函数实例汇总
Nov 30 Python
Python爬取奶茶店数据分析哪家最好喝以及性价比
Sep 23 Python
关于Python3爬虫利器Appium的安装步骤
Jul 29 #Python
Python3爬虫mitmproxy的安装步骤
Jul 29 #Python
Python使用jpype模块调用jar包过程解析
Jul 29 #Python
Python 防止死锁的方法
Jul 29 #Python
Python定义一个Actor任务
Jul 29 #Python
Python如何重新加载模块
Jul 29 #Python
Python加速程序运行的方法
Jul 29 #Python
You might like
在PHP中养成7个面向对象的好习惯
2010/01/28 PHP
PHP Ajax JavaScript Json获取天气信息实现代码
2016/08/17 PHP
php5.5使用PHPMailer-5.2发送邮件的完整步骤
2018/10/14 PHP
PHP设计模式之 策略模式Strategy详解【对象行为型】
2020/05/01 PHP
微信JS-SDK坐标位置如何转换为百度地图坐标
2016/07/04 Javascript
微信小程序 扎金花简单实例
2017/02/21 Javascript
老生常谈jacascript DOM节点获取
2017/04/17 Javascript
在Vue中获取组件声明时的name属性方法
2018/09/12 Javascript
详解async/await 异步应用的常用场景
2019/05/13 Javascript
JS实现图片切换特效
2019/12/23 Javascript
Vue 中获取当前时间并实时刷新的实现代码
2020/05/12 Javascript
PYTHON正则表达式 re模块使用说明
2011/05/19 Python
python之模拟鼠标键盘动作具体实现
2013/12/30 Python
python中global与nonlocal比较
2014/11/21 Python
python使用正则表达式匹配字符串开头并打印示例
2017/01/11 Python
Django 使用logging打印日志的实例
2018/04/28 Python
Django--权限Permissions的例子
2019/08/28 Python
pycharm全局搜索的具体步骤
2020/07/28 Python
canvas简单连线动画的实现代码
2020/02/04 HTML / CSS
英国家庭珠宝商:T. H. Baker
2018/02/08 全球购物
Footshop罗马尼亚:最好的运动鞋选择
2019/09/10 全球购物
德国、奥地利和瑞士最大的旅行和度假门户网站:HolidayCheck
2019/11/14 全球购物
PHP如何删除一个Cookie值
2012/11/15 面试题
大学毕业生自我鉴定
2013/11/05 职场文书
测控技术与仪器个人求职信范文
2013/12/30 职场文书
教学实习自我评价
2014/01/28 职场文书
数学检讨书1000字
2014/02/24 职场文书
电子装配专业毕业生求职信
2014/04/23 职场文书
小学校园广播稿集锦
2014/10/04 职场文书
幼儿园母亲节活动总结
2015/02/10 职场文书
治理商业贿赂工作总结
2015/08/10 职场文书
辞职信怎么写?
2019/05/21 职场文书
Nginx代理同域名前后端分离项目的完整步骤
2021/03/31 Servers
基于CSS3画一个iPhone
2021/04/21 HTML / CSS
一篇文章学会Vue中间件管道
2021/06/20 Vue.js
MySQL外键约束(Foreign Key)案例详解
2022/06/28 MySQL