Python数据抓取爬虫代理防封IP方法


Posted in Python onDecember 23, 2018

爬虫:一段自动抓取互联网信息的程序,从互联网上抓取对于我们有价值的信息,一般来说,Python爬虫程序很多时候都要使用(飞猪IP)代理的IP地址来爬取程序,但是默认的urlopen是无法使用代理的IP的,我就来分享一下Python爬虫怎样使用代理IP的经验。(推荐飞猪代理IP注册可免费使用,浏览器搜索可找到)

Python数据抓取爬虫代理防封IP方法

1、划重点,小编我用的是Python3哦,所以要导入urllib的request,然后我们调用ProxyHandler,它可以接收代理IP的参数。代理可以根据自己需要选择,当然免费的也是有的,但是可用率可想而知的。(飞猪IP)

Python数据抓取爬虫代理防封IP方法

2、接着把IP地址以字典的形式放入其中,这个IP地址是我乱写的,只是用来举例。设置键为http,当然有些是https的,然后后面就是IP地址以及端口号(9000),具体看你的IP地址是什么类型的,不同IP端口号可能不同根据你在飞猪提取的端口为准。

Python数据抓取爬虫代理防封IP方法

3、接着再用build_opener()来构建一个opener对象。

Python数据抓取爬虫代理防封IP方法

4、然后调用构建好的opener对象里面的open方法来发生请求。实际上urlopen也是类似这样使用内部定义好的opener.open(),这里就相当于我们自己重写。

Python数据抓取爬虫代理防封IP方法

5、当然了,如果我们使用install_opener(),就可以把之前自定义的opener设置成全局的。

Python数据抓取爬虫代理防封IP方法

6、设置成全局之后,如果我们再使用urlopen来发送请求,那么发送请求使用的IP地址就是代理IP,而不是本机的IP地址了。

Python数据抓取爬虫代理防封IP方法

7、最后再来说说使用代理遇到的错误,提示目标计算机积极拒绝,这就说明可能是代理IP无效,或者端口号错误,这就需要使用有效的IP才行哦。(这边现在是乱填写的IP地址)可选择飞猪的代理IP。

Python数据抓取爬虫代理防封IP方法

总结:以上就是本次关于Python数据抓取爬虫代理防封IP方法,感谢大家的阅读和对三水点靠木的支持。

Python 相关文章推荐
简述Python中的面向对象编程的概念
Apr 27 Python
Python AES加密模块用法分析
May 22 Python
python绘制直线的方法
Jun 30 Python
使用Python正则表达式操作文本数据的方法
May 14 Python
Django如何开发简单的查询接口详解
May 17 Python
Python OpenCV 调用摄像头并截图保存功能的实现代码
Jul 02 Python
解决python 文本过滤和清理问题
Aug 28 Python
详解numpy矩阵的创建与数据类型
Oct 18 Python
python pprint模块中print()和pprint()两者的区别
Feb 10 Python
Python try except异常捕获机制原理解析
Apr 18 Python
OpenCV 之按位运算举例解析
Jun 19 Python
python 基于wx实现音乐播放
Nov 24 Python
python3爬虫怎样构建请求header
Dec 23 #Python
windows下搭建python scrapy爬虫框架步骤
Dec 23 #Python
python构建基础的爬虫教学
Dec 23 #Python
Flask之请求钩子的实现
Dec 23 #Python
python爬虫获取新浪新闻教学
Dec 23 #Python
Python爬虫文件下载图文教程
Dec 23 #Python
python爬虫获取百度首页内容教学
Dec 23 #Python
You might like
咖啡知识 咖啡养豆要养多久 排气又是什么
2021/03/06 新手入门
php allow_url_include的应用和解释
2010/04/22 PHP
PHP 数组和字符串互相转换实现方法
2013/03/26 PHP
php中Socket创建与监听实现方法
2015/01/05 PHP
PHP的Yii框架中过滤器相关的使用总结
2016/03/29 PHP
Yii框架连接mongodb数据库的代码
2016/07/27 PHP
详解PHP中的外观模式facade pattern
2018/02/05 PHP
PHP的mysqli_select_db()函数讲解
2019/01/23 PHP
PHP实现通过二维数组键值获取一维键名操作示例
2019/10/11 PHP
发两个小东西,ASP/PHP 学习工具。 用JavaScript写的
2007/04/12 Javascript
IE Firefox 使用自定义标签的区别
2009/10/15 Javascript
windows系统下简单nodejs安装及环境配置
2013/01/08 NodeJs
jquery 触发a链接点击事件解决方案
2013/05/02 Javascript
JavaScript实现将数组数据添加到Select下拉框的方法
2015/08/21 Javascript
分享五个有用的jquery小技巧
2015/10/08 Javascript
JS对象是否拥有某属性如何判断
2017/02/03 Javascript
AngularJS表格添加序号的方法
2017/03/03 Javascript
d3.js实现立体柱图的方法详解
2017/04/28 Javascript
jQuery 实现双击编辑表格功能
2017/06/19 jQuery
基于Axios 常用的请求方法别名(详解)
2018/03/13 Javascript
React中this丢失的四种解决方法
2019/03/12 Javascript
深入理解JavaScript 箭头函数
2019/05/30 Javascript
taro小程序添加骨架屏的实现代码
2019/11/15 Javascript
Nuxt.js的路由跳转操作(页面跳转nuxt-link)
2020/11/06 Javascript
jQuery实现动态向上滚动
2020/12/21 jQuery
JavaScript/TypeScript 实现并发请求控制的示例代码
2021/01/18 Javascript
[50:45]2018DOTA2亚洲邀请赛 4.6 淘汰赛 VP vs TNC 第一场
2018/04/10 DOTA
keras的siamese(孪生网络)实现案例
2020/06/12 Python
解决keras,val_categorical_accuracy:,0.0000e+00问题
2020/07/02 Python
Numpy数组的广播机制的实现
2020/11/03 Python
CSS3之多背景background使用示例
2013/10/18 HTML / CSS
STRATHBERRY苏贝瑞包包官网:西班牙高级工匠手工打造
2020/11/10 全球购物
Elizabeth Gage官网:英国最好的珠宝设计之一
2020/09/26 全球购物
俄罗斯园林植物网上商店:Garshinka
2020/07/16 全球购物
国际政治个人自荐信范文
2013/11/26 职场文书
redis 解决库存并发问题实现数量控制
2022/04/08 Redis