Scrapy 配置动态代理IP的实现


Posted in Python onSeptember 28, 2020

应用 Scrapy框架 ,配置动态IP处理反爬。

# settings 配置中间件
DOWNLOADER_MIDDLEWARES = {
  'text.middlewares.TextDownloaderMiddleware': 543,
  # 'text.middlewares.RandomUserAgentMiddleware': 544,
  # 'text.middlewares.CheckUserAgentMiddleware': 545,
  'text.middlewares.ProxyMiddleware': 546,
  'text.middlewares.CheckProxyMiddleware': 547
}

 
# settings 配置可用动态IP
PROXIES = [
  "http://101.231.104.82:80",
  "http://39.137.69.6:8080",
  "http://39.137.69.10:8080",
  "http://39.137.69.7:80",
  "http://39.137.77.66:8080",
  "http://117.191.11.102:80",
  "http://117.191.11.113:8080",
  "http://117.191.11.113:80",
  "http://120.210.219.103:8080",
  "http://120.210.219.104:80",
  "http://120.210.219.102:80",
  "http://119.41.236.180:8010",
  "http://117.191.11.80:8080"
]
# middlewares 配置中间件
import random

class ProxyMiddleware(object):

  def process_request(self, request, spider):
    ip = random.choice(spider.settings.get('PROXIES'))
    print('测试IP:', ip)
    request.meta['proxy'] = ip


class CheckProxyMiddleware(object):

  def process_response(self, request, response, spider):
    print('代理IP:', request.meta['proxy'])
    return response

到此这篇关于Scrapy 配置动态代理IP的实现的文章就介绍到这了,更多相关Scrapy 动态代理IP内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
python 域名分析工具实现代码
Jul 15 Python
详尽讲述用Python的Django框架测试驱动开发的教程
Apr 22 Python
Python检测一个对象是否为字符串类的方法
May 21 Python
Python基础教程之浅拷贝和深拷贝实例详解
Jul 15 Python
python中redis查看剩余过期时间及用正则通配符批量删除key的方法
Jul 30 Python
python列表list保留顺序去重的实例
Dec 14 Python
Python实现网站表单提交和模板
Jan 15 Python
Python面向对象程序设计类的封装与继承用法示例
Apr 12 Python
Python如何在DataFrame增加数值
Feb 14 Python
Django中从mysql数据库中获取数据传到echarts方式
Apr 07 Python
python 3.8.3 安装配置图文教程
May 21 Python
Python虚拟环境venv用法详解
May 25 Python
Scrapy中如何向Spider传入参数的方法实现
Sep 28 #Python
详解向scrapy中的spider传递参数的几种方法(2种)
Sep 28 #Python
小结Python的反射机制
Sep 28 #Python
scrapy与selenium结合爬取数据(爬取动态网站)的示例代码
Sep 28 #Python
scrapy结合selenium解析动态页面的实现
Sep 28 #Python
互斥锁解决 Python 中多线程共享全局变量的问题(推荐)
Sep 28 #Python
python 常见的反爬虫策略
Sep 27 #Python
You might like
php 中文字符入库或显示乱码问题的解决方法
2010/04/12 PHP
Smarty foreach控制循环次数的实现详解
2013/07/03 PHP
五款PHP代码重构工具推荐
2014/10/14 PHP
PHP抓取淘宝商品的用户晒单评论+图片+搜索商品列表实例
2016/04/14 PHP
PHP最常用的正则表达式
2017/02/13 PHP
syntaxhighlighter 使用方法
2007/07/02 Javascript
JavaScript实现快速排序(自已编写)
2012/12/19 Javascript
快速查找数组中的某个元素并返回下标示例
2013/09/03 Javascript
file控件选择上传文件确定后触发的js事件是哪个
2014/03/17 Javascript
提取jquery的ready()方法单独使用示例
2014/03/25 Javascript
基于JavaScript创建动态Dom
2015/12/08 Javascript
jquery获取文档高度和窗口高度汇总
2016/01/25 Javascript
JavaScript+canvas实现七色板效果实例
2016/02/18 Javascript
BootStrap下jQuery自动完成的样式调整
2016/05/30 Javascript
vue-router 学习快速入门
2017/03/01 Javascript
Angular 4依赖注入学习教程之简介(一)
2017/06/04 Javascript
Node 自动化部署的方法
2017/10/17 Javascript
Vue实现购物车场景下的应用
2017/11/27 Javascript
spyder常用快捷键(分享)
2017/07/19 Python
Python cookbook(数据结构与算法)字典相关计算问题示例
2018/02/18 Python
NLTK 3.2.4 环境搭建教程
2018/09/19 Python
解决python "No module named pip" 的问题
2018/10/13 Python
Django 路由层URLconf的实现
2019/12/30 Python
Python找出列表中出现次数最多的元素三种方式
2020/02/24 Python
Python使用re模块验证危险字符
2020/05/21 Python
Pytorch通过保存为ONNX模型转TensorRT5的实现
2020/05/25 Python
pycharm实现猜数游戏
2020/12/07 Python
Python就将所有的英文单词首字母变成大写
2021/02/12 Python
Html5剪切板功能的实现代码
2018/06/29 HTML / CSS
android面试问题与答案
2016/12/27 面试题
建筑总经理岗位职责
2014/02/02 职场文书
安全标语口号
2014/06/09 职场文书
法学专业毕业生求职信
2014/06/12 职场文书
幼儿园教师师德师风承诺书
2015/04/28 职场文书
政审证明范文
2015/06/19 职场文书
Django对接elasticsearch实现全文检索的示例代码
2021/08/02 Python