Python使用scrapy采集时伪装成HTTP/1.1的方法


Posted in Python onApril 08, 2015

本文实例讲述了Python使用scrapy采集时伪装成HTTP/1.1的方法。分享给大家供大家参考。具体如下:

添加下面的代码到 settings.py 文件

DOWNLOADER_HTTPCLIENTFACTORY = 'myproject.downloader.HTTPClientFactory'

保存以下代码到单独的.py文件
from scrapy.core.downloader.webclient import ScrapyHTTPClientFactory, ScrapyHTTPPageGetter

class PageGetter(ScrapyHTTPPageGetter):

    def sendCommand(self, command, path):

        self.transport.write('%s %s HTTP/1.1\r\n' % (command, path))

class HTTPClientFactory(ScrapyHTTPClientFactory):

     protocol = PageGetter

希望本文所述对大家的Python程序设计有所帮助。

Python 相关文章推荐
python显示天气预报
Mar 02 Python
python 字典(dict)遍历的四种方法性能测试报告
Jun 25 Python
基于Python实现的ID3决策树功能示例
Jan 02 Python
Python paramiko模块的使用示例
Apr 11 Python
python保存数据到本地文件的方法
Jun 23 Python
详解Python发送email的三种方式
Oct 18 Python
对python实现合并两个排序链表的方法详解
Jan 23 Python
python监控进程状态,记录重启时间及进程号的实例
Jul 15 Python
python3 map函数和filter函数详解
Aug 26 Python
使用python实现kNN分类算法
Oct 16 Python
Python实例教程之检索输出月份日历表
Dec 16 Python
Python3中PyQt5简单实现文件打开及保存
Jun 10 Python
Python打印scrapy蜘蛛抓取树结构的方法
Apr 08 #Python
使用IPython来操作Docker容器的入门指引
Apr 08 #Python
仅用50行Python代码实现一个简单的代理服务器
Apr 08 #Python
用Python实现一个简单的能够发送带附件的邮件程序的教程
Apr 08 #Python
Python 创建子进程模块subprocess详解
Apr 08 #Python
Python中使用gzip模块压缩文件的简单教程
Apr 08 #Python
Python使用scrapy抓取网站sitemap信息的方法
Apr 08 #Python
You might like
一个程序下载的管理程序(一)
2006/10/09 PHP
php empty函数判断mysql表单是否为空
2010/04/12 PHP
PHP根据传入参数合并多个JS和CSS文件的简单实现
2014/06/13 PHP
yii2中关于加密解密的那些事儿
2018/06/12 PHP
PHP设计模式之单例模式定义与用法分析
2019/03/26 PHP
PHP防止sql注入小技巧之sql预处理原理与实现方法分析
2019/12/13 PHP
php实现将数组或对象写入到文件的方法小结【三种方法】
2020/04/22 PHP
基于zepto.js实现仿手机QQ空间的大图查看组件ImageView.js详解
2015/03/05 Javascript
js完美实现@提到好友特效(兼容各大浏览器)
2015/03/16 Javascript
跟我学习javascript的垃圾回收机制与内存管理
2015/11/23 Javascript
JavaScript中eval函数的问题
2016/01/31 Javascript
js添加千分位的实现代码(超简单)
2016/08/01 Javascript
使用jQuery实现页面定时弹出广告效果
2017/08/24 jQuery
vue.js实现格式化时间并每秒更新显示功能示例
2018/07/07 Javascript
详解vue axios二次封装
2018/07/22 Javascript
vue如何安装使用Quill富文本编辑器
2018/09/21 Javascript
微信小程序实现顶部下拉菜单栏
2018/11/04 Javascript
JS/HTML5游戏常用算法之碰撞检测 像素检测算法实例详解
2018/12/12 Javascript
javascript使用canvas实现饼状图效果
2020/09/08 Javascript
python进阶教程之词典、字典、dict
2014/08/29 Python
python使用锁访问共享变量实例解析
2018/02/08 Python
Django处理文件上传File Uploads的实例
2018/05/28 Python
python画图--输出指定像素点的颜色值方法
2019/07/03 Python
pycharm解决关闭flask后依旧可以访问服务的问题
2020/04/03 Python
如何在Windows中安装多个python解释器
2020/06/16 Python
CSS3与动画有关的属性transition、animation、transform对比(史上最全版)
2017/08/18 HTML / CSS
印度最大的时尚购物网站:Myntra
2018/09/13 全球购物
报关专员求职信范文
2014/02/22 职场文书
村庄绿化方案
2014/05/07 职场文书
服务承诺口号
2014/05/22 职场文书
金融专业求职信
2014/08/05 职场文书
90行Python代码开发个人云盘应用
2021/04/20 Python
只用40行Python代码就能写出pdf转word小工具
2021/05/31 Python
CSS3实现列表无限滚动/轮播效果
2021/06/23 HTML / CSS
Python图像处理库PIL详细使用说明
2022/04/06 Python
Tomcat弱口令复现及利用
2022/05/06 Servers