Scrapy 配置动态代理IP的实现


Posted in Python onSeptember 28, 2020

应用 Scrapy框架 ,配置动态IP处理反爬。

# settings 配置中间件
DOWNLOADER_MIDDLEWARES = {
  'text.middlewares.TextDownloaderMiddleware': 543,
  # 'text.middlewares.RandomUserAgentMiddleware': 544,
  # 'text.middlewares.CheckUserAgentMiddleware': 545,
  'text.middlewares.ProxyMiddleware': 546,
  'text.middlewares.CheckProxyMiddleware': 547
}

 
# settings 配置可用动态IP
PROXIES = [
  "http://101.231.104.82:80",
  "http://39.137.69.6:8080",
  "http://39.137.69.10:8080",
  "http://39.137.69.7:80",
  "http://39.137.77.66:8080",
  "http://117.191.11.102:80",
  "http://117.191.11.113:8080",
  "http://117.191.11.113:80",
  "http://120.210.219.103:8080",
  "http://120.210.219.104:80",
  "http://120.210.219.102:80",
  "http://119.41.236.180:8010",
  "http://117.191.11.80:8080"
]
# middlewares 配置中间件
import random

class ProxyMiddleware(object):

  def process_request(self, request, spider):
    ip = random.choice(spider.settings.get('PROXIES'))
    print('测试IP:', ip)
    request.meta['proxy'] = ip


class CheckProxyMiddleware(object):

  def process_response(self, request, response, spider):
    print('代理IP:', request.meta['proxy'])
    return response

到此这篇关于Scrapy 配置动态代理IP的实现的文章就介绍到这了,更多相关Scrapy 动态代理IP内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
python判断windows隐藏文件的方法
Mar 21 Python
Python的自动化部署模块Fabric的安装及使用指南
Jan 19 Python
Python实现破解12306图片验证码的方法分析
Dec 29 Python
Python cookbook(数据结构与算法)从字典中提取子集的方法示例
Mar 22 Python
Python3.6+Django2.0以上 xadmin站点的配置和使用教程图解
Jun 04 Python
Python脚本利用adb进行手机控制的方法
Jul 08 Python
python利用re,bs4,requests模块获取股票数据
Jul 29 Python
Python2和3字符编码的区别知识点整理
Aug 08 Python
将tensorflow.Variable中的某些元素取出组成一个新的矩阵示例
Jan 04 Python
Python类继承和多态原理解析
Feb 05 Python
python 双循环遍历list 变量判断代码
May 04 Python
Python爬虫破解登陆哔哩哔哩的方法
Nov 17 Python
Scrapy中如何向Spider传入参数的方法实现
Sep 28 #Python
详解向scrapy中的spider传递参数的几种方法(2种)
Sep 28 #Python
小结Python的反射机制
Sep 28 #Python
scrapy与selenium结合爬取数据(爬取动态网站)的示例代码
Sep 28 #Python
scrapy结合selenium解析动态页面的实现
Sep 28 #Python
互斥锁解决 Python 中多线程共享全局变量的问题(推荐)
Sep 28 #Python
python 常见的反爬虫策略
Sep 27 #Python
You might like
日本收入最高的漫画家:海贼王作者版税年收入高达8.45亿元
2020/03/04 日漫
PHP 函数call_user_func和call_user_func_array用法详解
2014/03/02 PHP
php实现的click captcha点击验证码类实例
2014/09/23 PHP
thinkphp使用literal防止模板标签被解析的方法
2014/11/22 PHP
制作个性化的WordPress登陆界面的实例教程
2016/05/21 PHP
jQuery 行背景颜色的交替显示(隔行变色)实现代码
2009/12/13 Javascript
JavaScript类和继承 prototype属性
2010/09/03 Javascript
Dom 是什么的详细说明
2010/10/25 Javascript
jquery使用jquery.zclip插件复制对象的实例教程
2013/12/04 Javascript
js写的方法实现上传图片之后查看大图
2014/03/05 Javascript
JavaScript异步编程Promise模式的6个特性
2014/04/03 Javascript
jQuery检测返回值的数据类型
2015/07/13 Javascript
js实现(全选)多选按钮的方法【附实例】
2016/03/30 Javascript
微信js-sdk地理位置接口用法示例
2016/10/12 Javascript
原生JS实现不断变化的标签
2017/05/22 Javascript
js 奇葩技巧之隐藏代码
2017/08/11 Javascript
node.js爬取中关村的在线电瓶车信息
2018/11/13 Javascript
NodeJS有难度的面试题(能答对几个)
2019/10/09 NodeJs
Vue+Node实现商品列表的分页、排序、筛选,添加购物车功能详解
2019/12/07 Javascript
详解vue3.0 diff算法的使用(超详细)
2020/07/01 Javascript
vue 出现data-v-xxx的原因及解决
2020/08/04 Javascript
Python设计模式之工厂模式简单示例
2018/01/09 Python
python 实现倒排索引的方法
2018/12/25 Python
使用pandas读取文件的实现
2019/07/31 Python
Django实现auth模块下的登录注册与注销功能
2019/10/10 Python
使用OpenCV-python3实现滑动条更新图像的Canny边缘检测功能
2019/12/12 Python
通过Python实现一个简单的html页面
2020/05/16 Python
python中翻译功能translate模块实现方法
2020/12/17 Python
俄罗斯卫浴采暖及维修用品超级市场:Dkrussia
2020/05/12 全球购物
员工教育培训协议书
2014/09/27 职场文书
个人股份转让协议书范本
2015/01/28 职场文书
学校教师培训工作总结
2015/10/14 职场文书
再也不用花钱买漫画!Python爬取某漫画的脚本及源码
2021/06/09 Python
JPA如何使用entityManager执行SQL并指定返回类型
2021/06/15 Java/Android
Python快速实现一键抠图功能的全过程
2021/06/29 Python
SQL实现LeetCode(180.连续的数字)
2021/08/04 MySQL