Python使用scrapy采集时伪装成HTTP/1.1的方法


Posted in Python onApril 08, 2015

本文实例讲述了Python使用scrapy采集时伪装成HTTP/1.1的方法。分享给大家供大家参考。具体如下:

添加下面的代码到 settings.py 文件

DOWNLOADER_HTTPCLIENTFACTORY = 'myproject.downloader.HTTPClientFactory'

保存以下代码到单独的.py文件
from scrapy.core.downloader.webclient import ScrapyHTTPClientFactory, ScrapyHTTPPageGetter

class PageGetter(ScrapyHTTPPageGetter):

    def sendCommand(self, command, path):

        self.transport.write('%s %s HTTP/1.1\r\n' % (command, path))

class HTTPClientFactory(ScrapyHTTPClientFactory):

     protocol = PageGetter

希望本文所述对大家的Python程序设计有所帮助。

Python 相关文章推荐
python实现在控制台输入密码不显示的方法
Jul 02 Python
Python中的Descriptor描述符学习教程
Jun 02 Python
浅谈用Python实现一个大数据搜索引擎
Nov 28 Python
基于PyQt4和PySide实现输入对话框效果
Feb 27 Python
python 获取等间隔的数组实例
Jul 04 Python
详解Python二维数组与三维数组切片的方法
Jul 18 Python
利用Python检测URL状态
Jul 31 Python
ubuntu 18.04 安装opencv3.4.5的教程(图解)
Nov 04 Python
python manage.py runserver流程解析
Nov 08 Python
python列表切片和嵌套列表取值操作详解
Feb 27 Python
Python虚拟环境的创建和包下载过程分析
Jun 19 Python
解决Python安装cryptography报错问题
Sep 03 Python
Python打印scrapy蜘蛛抓取树结构的方法
Apr 08 #Python
使用IPython来操作Docker容器的入门指引
Apr 08 #Python
仅用50行Python代码实现一个简单的代理服务器
Apr 08 #Python
用Python实现一个简单的能够发送带附件的邮件程序的教程
Apr 08 #Python
Python 创建子进程模块subprocess详解
Apr 08 #Python
Python中使用gzip模块压缩文件的简单教程
Apr 08 #Python
Python使用scrapy抓取网站sitemap信息的方法
Apr 08 #Python
You might like
Yii扩展组件编写方法实例分析
2015/06/29 PHP
PHP图形计数器程序显示网站用户浏览量
2016/07/20 PHP
PHP redis实现超迷你全文检索
2017/03/04 PHP
POST一个JSON格式的数据给Restful服务实例详解
2017/04/07 PHP
身份证号码前六位所代表的省,市,区, 以及地区编码下载
2007/04/12 Javascript
JavaScript动态修改背景颜色的方法
2015/04/16 Javascript
JavaScipt中栈的实现方法
2016/02/17 Javascript
jQuery点击其他地方时菜单消失的实现方法
2016/04/22 Javascript
判断JS对象是否拥有某属性的方法推荐
2016/05/12 Javascript
浅谈JavaScript 数据属性和访问器属性
2016/09/01 Javascript
浅谈JS使用[ ]来访问对象属性
2016/09/21 Javascript
BootStrap Fileinput插件和Bootstrap table表格插件相结合实现文件上传、预览、提交的导入Excel数据操作步骤
2017/08/07 Javascript
Element-ui table中过滤条件变更表格内容的方法
2018/03/02 Javascript
原生js检测页面加载完毕的实例
2018/09/11 Javascript
简单实现节流函数和防抖函数过程解析
2019/10/08 Javascript
Vue.js页面中有多个input搜索框如何实现防抖操作
2019/11/04 Javascript
[02:08]2014DOTA2国际邀请赛 430专访:力争取得小组前二
2014/07/11 DOTA
[36:54]Mineski vs Winstrike 2018国际邀请赛小组赛BO2 第一场 8.16
2018/08/17 DOTA
Python和Ruby中each循环引用变量问题(一个隐秘BUG?)
2014/06/04 Python
理解python多线程(python多线程简明教程)
2014/06/09 Python
简单的连接MySQL与Python的Bottle框架的方法
2015/04/30 Python
python代码过长的换行方法
2018/07/19 Python
使用python Telnet远程登录执行程序的方法
2019/01/26 Python
Python爬虫:将headers请求头字符串转为字典的方法
2019/08/21 Python
python 调试冷知识(小结)
2019/11/11 Python
Python运行异常管理解决方案
2020/03/09 Python
PyQt5 QDockWidget控件应用详解
2020/08/12 Python
selenium判断元素是否存在的两种方法小结
2020/12/07 Python
全网最细 Python 格式化输出用法讲解(推荐)
2021/01/18 Python
澳大利亚香水在线商店:City Perfume
2020/09/02 全球购物
毕业设计计划书
2014/01/09 职场文书
2015年清明节网上祭英烈留言寄语
2015/03/04 职场文书
毕业论文指导老师意见
2015/06/04 职场文书
2015年学校管理工作总结
2015/07/20 职场文书
在Spring-Boot中如何使用@Value注解注入集合类
2021/08/02 Java/Android
Vue Element plus使用方法梳理
2022/12/24 Vue.js