Python3爬虫中pyspider的安装步骤


Posted in Python onJuly 29, 2020

pyspider是国人binux编写的强大的网络爬虫框架,它带有强大的WebUI、脚本编辑器、任务监控器、项目管理器以及结果处理器,同时支持多种数据库后端、多种消息队列,另外还支持JavaScript渲染页面的爬取,使用起来非常方便,本节介绍一下它的安装过程。

1. 相关链接

官方文档:http://docs.pyspider.org/

PyPI:https://pypi.python.org/pypi/pyspider

GitHub:https://github.com/binux/pyspider

官方教程:http://docs.pyspider.org/en/latest/tutorial

在线实例:http://demo.pyspider.org

2. 准备工作

pyspider是支持JavaScript渲染的,而这个过程是依赖于PhantomJS的,所以还需要安装PhantomJS(具体的安装过程详见1.2.5节)。

3. pip安装

这里推荐使用pip安装,命令如下:

pip3 install pyspider

命令执行完毕即可完成安装。

4. 常见错误

Windows下可能会出现这样的错误提示:

Command "python setup.py egg_info" failed with error code 1 in /tmp/pip-build-vXo1W3/pycurl

这是PyCurl安装错误,此时需要安装PyCurl库。从http://www.lfd.uci.edu/~gohlke/pythonlibs/#pycurl找到对应的Python版本,然后下载相应的wheel文件即可。比如Windows 64位、Python 3.6,则需要下载pycurl‑7.43.0‑cp36‑cp36m‑win_amd64.whl,随后用pip安装即可,命令如下:

pip3 install pycurl‑7.43.0‑cp36‑cp36m‑win_amd64.whl

如果在Linux下遇到PyCurl的错误,可以参考本文:https://3water.com/article/192094.htm。

5. 验证安装

安装完成之后,可以直接在命令行下启动pyspider:

pyspider all

此时控制台会有类似如图1-74所示的输出。

Python3爬虫中pyspider的安装步骤

这时pyspider的Web服务就会在本地5000端口运行。直接在浏览器中打开http://localhost:5000/,即可进入pyspider的WebUI管理页面,如图1-75所示,这证明pyspider已经安装成功了。

Python3爬虫中pyspider的安装步骤

后面,我们会详细介绍pyspider的用法。

到此这篇关于Python3爬虫中pyspider的安装步骤的文章就介绍到这了,更多相关Python3爬虫pyspider的安装内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
linux下安装easy_install的方法
Feb 10 Python
从零学python系列之新版本导入httplib模块报ImportError解决方案
May 23 Python
用Python的Django框架来制作一个RSS阅读器
Jul 22 Python
ansible作为python模块库使用的方法实例
Jan 17 Python
Python cookbook(数据结构与算法)将名称映射到序列元素中的方法
Mar 22 Python
python使用Flask操作mysql实现登录功能
May 14 Python
Python图像处理之直线和曲线的拟合与绘制【curve_fit()应用】
Dec 26 Python
详解Python数据分析--Pandas知识点
Mar 23 Python
使用pandas库对csv文件进行筛选保存
May 25 Python
python程序如何进行保存
Jul 03 Python
PyCharm2020.1.2社区版安装,配置及使用教程详解(Windows)
Aug 07 Python
使用Python+Appuim 清理微信的方法
Jan 26 Python
关于Python3爬虫利器Appium的安装步骤
Jul 29 #Python
Python3爬虫mitmproxy的安装步骤
Jul 29 #Python
Python使用jpype模块调用jar包过程解析
Jul 29 #Python
Python 防止死锁的方法
Jul 29 #Python
Python定义一个Actor任务
Jul 29 #Python
Python如何重新加载模块
Jul 29 #Python
Python加速程序运行的方法
Jul 29 #Python
You might like
php中根据变量的类型 选择echo或dump
2012/07/05 PHP
PHP间隔一段时间执行代码的方法
2014/12/02 PHP
Laravel使用Caching缓存数据减轻数据库查询压力的方法
2016/03/15 PHP
PHP查看SSL证书信息的方法
2016/09/22 PHP
Laravel5.4简单实现app接口Api Token认证方法
2019/08/29 PHP
JQuery设置和去除disabled属性的5种方法总结
2013/05/16 Javascript
网站如何做到完全不需要jQuery也可以满足简单需求
2013/06/27 Javascript
详解WordPress开发中get_current_screen()函数的使用
2016/01/11 Javascript
AngularJS 中的Promise --- $q服务详解
2016/09/14 Javascript
Chrome不支持showModalDialog模态对话框和无法返回returnValue问题的解决方法
2016/10/30 Javascript
JavaScript之map reduce_动力节点Java学院整理
2017/06/29 Javascript
vue + element-ui实现简洁的导入导出功能
2017/12/22 Javascript
vue2.0父子组件间传递数据的方法
2018/08/16 Javascript
原生JS实现前端本地文件上传
2018/09/08 Javascript
Vue-Cli 3.0 中配置高德地图的两种方式
2019/06/19 Javascript
关于vue表单提交防双/多击的例子
2019/10/31 Javascript
详解Angular Karma测试的持续集成实践
2019/11/15 Javascript
Python时区设置方法与pytz查询时区教程
2013/11/27 Python
Python程序设计入门(5)类的使用简介
2014/06/16 Python
python对指定目录下文件进行批量重命名的方法
2015/04/18 Python
python3基于OpenCV实现证件照背景替换
2018/07/18 Python
Python设计模式之观察者模式原理与用法详解
2019/01/16 Python
详解Numpy数组转置的三种方法T、transpose、swapaxes
2019/05/27 Python
Python 网络编程之UDP发送接收数据功能示例【基于socket套接字】
2019/10/11 Python
Python 时间戳之获取整点凌晨时间戳的操作方法
2020/01/28 Python
python实现与redis交互操作详解
2020/04/21 Python
介绍一下SQL中union,intersect和minus
2012/04/05 面试题
农业开发项目建议书
2014/05/16 职场文书
模具专业求职信
2014/06/26 职场文书
小学生美德少年事迹材料
2014/08/24 职场文书
2014年社区国庆节活动方案
2014/09/16 职场文书
2015年银行大堂经理工作总结
2015/04/24 职场文书
婚姻出轨保证书
2015/05/08 职场文书
结婚堵门保证书
2015/05/08 职场文书
2015年教学管理工作总结
2015/05/20 职场文书
杨善洲电影观后感
2015/06/04 职场文书