python爬虫添加请求头代码实例


Posted in Python onDecember 28, 2019

这篇文章主要介绍了python爬虫添加请求头代码实例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下

request

import requests


headers = {
  # 'Accept': 'application/json, text/javascript, */*; q=0.01',
  # 'Accept': '*/*',
  # 'Accept-Language': 'zh-CN,zh;q=0.9,en;q=0.8,en-US;q=0.7',
  # 'Cache-Control': 'no-cache',
  # 'accept-encoding': 'gzip, deflate, br',
  'User-Agent': 'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.97 Safari/537.36',
  'Referer': 'https://www.google.com/'
}

resp = requests.get('http://httpbin.org/get', headers=headers)
print(resp.content)

urllib

import urllib, urllib2
def get_page_source(url):
  headers = {'Accept': '*/*',
        'Accept-Language': 'en-US,en;q=0.8',
        'Cache-Control': 'max-age=0',
        'User-Agent': 'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/48.0.2564.116 Safari/537.36',
        'Connection': 'keep-alive',
        'Referer': 'http://www.baidu.com/'
        }
  req = urllib2.Request(url, None, headers)
  response = urllib2.urlopen(req)
  page_source = response.read()
  return page_source

phantomjs请求页面

from selenium import webdriver
from selenium.webdriver.common.desired_capabilities import DesiredCapabilities
def get_headers_driver():
  desire = DesiredCapabilities.PHANTOMJS.copy()
  headers = {'Accept': '*/*',
        'Accept-Language': 'en-US,en;q=0.8',
        'Cache-Control': 'max-age=0',
        'User-Agent': 'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/48.0.2564.116 Safari/537.36',
        'Connection': 'keep-alive',
        'Referer': 'http://www.baidu.com/'
        }
  for key, value in headers.iteritems():
    desire['phantomjs.page.customHeaders.{}'.format(key)] = value
  driver = webdriver.PhantomJS(desired_capabilities=desire, service_args=['--load-images=yes'])#将yes改成no可以让浏览器不加载图片
  return driver

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python基础教程之python消息摘要算法使用示例
Feb 10 Python
Python下实现的RSA加密/解密及签名/验证功能示例
Jul 17 Python
Pandas 数据框增、删、改、查、去重、抽样基本操作方法
Apr 12 Python
python print 按逗号或空格分隔的方法
May 02 Python
pygame游戏之旅 添加icon和bgm音效的方法
Nov 21 Python
python多进程间通信代码实例
Sep 30 Python
python将时分秒转换成秒的实例
Dec 07 Python
pytorch实现保证每次运行使用的随机数都相同
Feb 20 Python
PyQt5 界面显示无响应的实现
Mar 26 Python
python和js交互调用的方法
Jun 23 Python
Python变量格式化输出实现原理解析
Aug 06 Python
Python爬取酷狗MP3音频的步骤
Feb 26 Python
python使用rsa非对称加密过程解析
Dec 28 #Python
Python遍历字典方式就实例详解
Dec 28 #Python
python基于opencv检测程序运行效率
Dec 28 #Python
把vgg-face.mat权重迁移到pytorch模型示例
Dec 27 #Python
Pytorch 多维数组运算过程的索引处理方式
Dec 27 #Python
Pytorch 之修改Tensor部分值方式
Dec 27 #Python
pytorch 实现tensor与numpy数组转换
Dec 27 #Python
You might like
php调用dll的实例操作动画与代码分享
2012/08/14 PHP
基于simple_html_dom的使用小结
2013/07/01 PHP
详解PHP数组赋值方法
2015/11/07 PHP
PHP中类的继承和用法实例分析
2016/05/24 PHP
php创建类并调用的实例方法
2019/09/25 PHP
onkeydown事件解决按回车键直接提交数据的需求
2013/04/11 Javascript
抛弃Nginx使用nodejs做反向代理服务器
2014/07/17 NodeJs
使用documentElement正确取得当前可见区域的大小
2014/07/25 Javascript
js生成随机数(指定范围)的实例代码
2016/07/10 Javascript
javascript事件的绑定基础实例讲解(34)
2017/02/14 Javascript
JavaScript中this关键字用法实例分析
2018/08/24 Javascript
vue利用v-for嵌套输出多层对象,分别输出到个表的方法
2018/09/07 Javascript
详解JavaScript 浮点数运算的精度问题
2019/07/23 Javascript
springboot+vue+对接支付宝接口+二维码扫描支付功能(沙箱环境)
2020/10/15 Javascript
[54:02]2018DOTA2亚洲邀请赛 4.1 小组赛 B组 IG vs VGJ.T
2018/04/03 DOTA
Python  __getattr__与__setattr__使用方法
2008/09/06 Python
python快速排序代码实例
2013/11/21 Python
python清除字符串里非数字字符的方法
2015/07/02 Python
12步教你理解Python装饰器
2016/02/25 Python
Python双向循环链表实现方法分析
2018/07/30 Python
Python 中@property的用法详解
2020/01/15 Python
浅谈Python中的模块
2020/06/10 Python
Python生成并下载文件后端代码实例
2020/08/31 Python
解决PyCharm无法使用lxml库的问题(图解)
2020/12/22 Python
纽约手袋品牌:KARA
2018/03/18 全球购物
优秀毕业生求职信范文
2014/01/02 职场文书
国培远程培训感言
2014/03/08 职场文书
学习十八大坚定理想信念心得体会
2014/03/11 职场文书
消防安全承诺书
2014/05/22 职场文书
中层领导干部群众路线对照检查材料思想汇报
2014/10/02 职场文书
党建工作目标管理责任书
2015/01/29 职场文书
永不妥协观后感
2015/06/10 职场文书
爱国主题班会教案
2015/08/14 职场文书
2016年第16个全民国防教育日宣传活动总结
2016/04/05 职场文书
KVM基础命令详解
2022/04/30 Servers
使用ICOM IC-R9500接收机同时测评十台收音机中波接收性能
2022/05/10 无线电