python爬虫添加请求头代码实例


Posted in Python onDecember 28, 2019

这篇文章主要介绍了python爬虫添加请求头代码实例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下

request

import requests


headers = {
  # 'Accept': 'application/json, text/javascript, */*; q=0.01',
  # 'Accept': '*/*',
  # 'Accept-Language': 'zh-CN,zh;q=0.9,en;q=0.8,en-US;q=0.7',
  # 'Cache-Control': 'no-cache',
  # 'accept-encoding': 'gzip, deflate, br',
  'User-Agent': 'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.97 Safari/537.36',
  'Referer': 'https://www.google.com/'
}

resp = requests.get('http://httpbin.org/get', headers=headers)
print(resp.content)

urllib

import urllib, urllib2
def get_page_source(url):
  headers = {'Accept': '*/*',
        'Accept-Language': 'en-US,en;q=0.8',
        'Cache-Control': 'max-age=0',
        'User-Agent': 'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/48.0.2564.116 Safari/537.36',
        'Connection': 'keep-alive',
        'Referer': 'http://www.baidu.com/'
        }
  req = urllib2.Request(url, None, headers)
  response = urllib2.urlopen(req)
  page_source = response.read()
  return page_source

phantomjs请求页面

from selenium import webdriver
from selenium.webdriver.common.desired_capabilities import DesiredCapabilities
def get_headers_driver():
  desire = DesiredCapabilities.PHANTOMJS.copy()
  headers = {'Accept': '*/*',
        'Accept-Language': 'en-US,en;q=0.8',
        'Cache-Control': 'max-age=0',
        'User-Agent': 'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/48.0.2564.116 Safari/537.36',
        'Connection': 'keep-alive',
        'Referer': 'http://www.baidu.com/'
        }
  for key, value in headers.iteritems():
    desire['phantomjs.page.customHeaders.{}'.format(key)] = value
  driver = webdriver.PhantomJS(desired_capabilities=desire, service_args=['--load-images=yes'])#将yes改成no可以让浏览器不加载图片
  return driver

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python中实现两个字典(dict)合并的方法
Sep 23 Python
Python采用socket模拟TCP通讯的实现方法
Nov 19 Python
用Python进行一些简单的自然语言处理的教程
Mar 31 Python
Python基础教程之正则表达式基本语法以及re模块
Mar 25 Python
python 出现SyntaxError: non-keyword arg after keyword arg错误解决办法
Feb 14 Python
Python基于pygame模块播放MP3的方法示例
Sep 30 Python
Python cookbook(数据结构与算法)将名称映射到序列元素中的方法
Mar 22 Python
Python3运算符常见用法分析
Feb 14 Python
matplotlib 对坐标的控制,加图例注释的操作
Apr 17 Python
解决安装新版PyQt5、PyQT5-tool后打不开并Designer.exe提示no Qt platform plugin的问题
Apr 24 Python
python求numpy中array按列非零元素的平均值案例
Jun 08 Python
python使用torch随机初始化参数
Mar 22 Python
python使用rsa非对称加密过程解析
Dec 28 #Python
Python遍历字典方式就实例详解
Dec 28 #Python
python基于opencv检测程序运行效率
Dec 28 #Python
把vgg-face.mat权重迁移到pytorch模型示例
Dec 27 #Python
Pytorch 多维数组运算过程的索引处理方式
Dec 27 #Python
Pytorch 之修改Tensor部分值方式
Dec 27 #Python
pytorch 实现tensor与numpy数组转换
Dec 27 #Python
You might like
php 无限分类的树类代码
2009/12/03 PHP
php中如何判断一个网页请求是ajax请求还是普通请求
2013/08/10 PHP
PHP中VC6、VC9、TS、NTS版本的区别与用法详解
2013/10/26 PHP
javascript dom 操作详解 js加强
2009/07/13 Javascript
基于jquery实现发送文章到手机的代码
2014/12/26 Javascript
JavaScript中函数表达式和函数声明及函数声明与函数表达式的不同
2015/11/15 Javascript
js实现仿qq消息的弹出窗效果
2016/01/06 Javascript
浅谈jquery选择器 :first与:first-child的区别
2016/11/20 Javascript
js操作浏览器的参数方法
2017/01/21 Javascript
jquery dataTable 后台加载数据并分页实例代码
2017/06/07 jQuery
webpack实现热更新(实施同步刷新)
2017/07/28 Javascript
IE9 elementUI文件上传的问题解决
2018/10/17 Javascript
解决ie11 SCRIPT5011:不能执行已释放Script的代码问题
2019/05/05 Javascript
[16:27]DOTA2 HEROS教学视频教你分分钟做大人-艾欧
2014/06/11 DOTA
[10:18]2018DOTA2国际邀请赛寻真——找回自信的TNCPredator
2018/08/13 DOTA
[01:02:26]DOTA2-DPC中国联赛 正赛 SAG vs RNG BO3 第二场 1月18日
2021/03/11 DOTA
简单使用Python自动生成文章
2014/12/25 Python
python 链接和操作 memcache方法
2017/03/04 Python
通过Python 获取Android设备信息的轻量级框架
2017/12/18 Python
Python使用selenium + headless chrome获取网页内容的方法示例
2019/10/16 Python
Python高级特性——详解多维数组切片(Slice)
2019/11/26 Python
TensorFlow tf.nn.conv2d实现卷积的方式
2020/01/03 Python
GafasWorld西班牙:购买太阳镜、眼镜和隐形眼镜
2019/09/08 全球购物
伦敦鲜花递送:Flower Station
2021/02/03 全球购物
酒店销售主管岗位职责
2014/01/04 职场文书
购房意向书范本
2014/04/01 职场文书
一岗双责责任书
2014/04/15 职场文书
学雷锋志愿者活动总结
2014/06/27 职场文书
国庆节促销广告语2014
2014/09/19 职场文书
教师师德师风自我剖析材料
2014/09/29 职场文书
个人求职信格式范文
2015/03/20 职场文书
小学开学典礼新闻稿
2015/07/17 职场文书
小学数学新课改心得体会
2016/01/22 职场文书
高中政治教学反思
2016/02/23 职场文书
pytorch中的numel函数用法说明
2021/05/13 Python
一篇文章了解正则表达式的替换技巧
2022/02/24 Javascript