Python使用scrapy采集时伪装成HTTP/1.1的方法


Posted in Python onApril 08, 2015

本文实例讲述了Python使用scrapy采集时伪装成HTTP/1.1的方法。分享给大家供大家参考。具体如下:

添加下面的代码到 settings.py 文件

DOWNLOADER_HTTPCLIENTFACTORY = 'myproject.downloader.HTTPClientFactory'

保存以下代码到单独的.py文件
from scrapy.core.downloader.webclient import ScrapyHTTPClientFactory, ScrapyHTTPPageGetter

class PageGetter(ScrapyHTTPPageGetter):

    def sendCommand(self, command, path):

        self.transport.write('%s %s HTTP/1.1\r\n' % (command, path))

class HTTPClientFactory(ScrapyHTTPClientFactory):

     protocol = PageGetter

希望本文所述对大家的Python程序设计有所帮助。

Python 相关文章推荐
Python 列表排序方法reverse、sort、sorted详解
Jan 22 Python
python安装numpy&安装matplotlib& scipy的教程
Nov 02 Python
详解appium+python 启动一个app步骤
Dec 20 Python
Python框架Flask的基本数据库操作方法分析
Jul 13 Python
Python3.5文件修改操作实例分析
May 01 Python
Python中的asyncio代码详解
Jun 10 Python
pyqt5实现按钮添加背景图片以及背景图片的切换方法
Jun 13 Python
python celery分布式任务队列的使用详解
Jul 08 Python
python3 tcp的粘包现象和解决办法解析
Dec 09 Python
tensorflow 只恢复部分模型参数的实例
Jan 06 Python
Python字典实现伪切片功能
Oct 28 Python
python 对图片进行简单的处理
Jun 23 Python
Python打印scrapy蜘蛛抓取树结构的方法
Apr 08 #Python
使用IPython来操作Docker容器的入门指引
Apr 08 #Python
仅用50行Python代码实现一个简单的代理服务器
Apr 08 #Python
用Python实现一个简单的能够发送带附件的邮件程序的教程
Apr 08 #Python
Python 创建子进程模块subprocess详解
Apr 08 #Python
Python中使用gzip模块压缩文件的简单教程
Apr 08 #Python
Python使用scrapy抓取网站sitemap信息的方法
Apr 08 #Python
You might like
php从数组中随机选择若干不重复元素的方法
2015/03/14 PHP
通过隐藏option实现select的联动效果
2009/11/10 Javascript
jquery URL参数判断,确定菜单样式
2010/05/31 Javascript
jquery css 设置table的奇偶行背景色示例
2014/06/03 Javascript
jQuery不使用插件及swf实现无刷新文件上传
2014/12/08 Javascript
AngularJS初始化静态模板详解
2016/01/14 Javascript
Javascript必知必会(四)js类型转换
2016/06/08 Javascript
AngularJS教程之简单应用程序示例
2016/08/16 Javascript
如何使用Vuex+Vue.js构建单页应用
2016/10/27 Javascript
jQuery 遍历map()方法详解
2016/11/04 Javascript
利用JS实现页面删除并重新排序功能
2016/12/09 Javascript
vue中tab选项卡的实现思路
2018/11/25 Javascript
微信小程序保存多张图片的实现方法
2019/03/05 Javascript
javascript使用Blob对象实现的下载文件操作示例
2020/04/18 Javascript
JavaScript本地储存:localStorage、sessionStorage、cookie的使用
2020/10/13 Javascript
vue element-ul实现展开和收起功能的实例代码
2020/11/25 Vue.js
教你用python3根据关键词爬取百度百科的内容
2016/08/18 Python
Python实现一个转存纯真IP数据库的脚本分享
2017/05/21 Python
python读写csv文件实例代码
2019/07/05 Python
python如何实现从视频中提取每秒图片
2020/10/22 Python
Python 下载及安装详细步骤
2019/11/04 Python
Python 余弦相似度与皮尔逊相关系数 计算实例
2019/12/23 Python
基于jupyter代码无法在pycharm中运行的解决方法
2020/04/21 Python
python os模块常用的29种方法使用详解
2020/06/02 Python
Pycharm的Available Packages为空的解决方法
2020/09/18 Python
使用canvas对多图片拼合并导出图片的方法
2018/08/28 HTML / CSS
几个Shell Script面试题
2012/08/31 面试题
境外导游求职信
2014/02/27 职场文书
授权委托书怎么写
2014/04/03 职场文书
客户经理竞聘演讲稿
2014/05/15 职场文书
学校党员个人问题整改措施思想汇报
2014/10/08 职场文书
2014年宣传工作总结
2014/11/18 职场文书
工作岗位职责范本
2015/02/15 职场文书
2016春节家属慰问信
2015/03/25 职场文书
Vue Element UI自定义描述列表组件
2021/05/18 Vue.js
python使用pywinauto驱动微信客户端实现公众号爬虫
2021/05/19 Python