python爬虫模拟浏览器访问-User-Agent过程解析


Posted in Python onDecember 28, 2019

这篇文章主要介绍了python爬虫模拟浏览器访问-User-Agent过程解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下

模拟浏览器访问-User-Agent:

import urllib2

#User-Agent 模拟浏览器访问
headers = {"User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/79.0.3945.88 Safari/537.36"}

#通过urllib2.Request()方法构造一个请求对象
request = urllib2.Request("http://www.baidu.com/",headers = headers)


#向指定的URL地址发送请求,并返回服务器响应的类文件对象
#response是服务器响应的类文件,除了支持文件操作的方法外,还支持以下常用的方法:
response = urllib2.urlopen(request)



#服务器返回的类文件对象支持python文件对象的操作方法
#read()方法就是读取文件里的全部内容,返回字符串
html = response.read()

#返回HTTP的响应码,成功返回200,4服务器页面出错;5.服务器问题
print response.getcode()

#返回实际数据的实际URL,防止重定向问题
print response.geturl()

#返回服务器响应的HTTP报头
print response.info()


#打印响应内容
print(html)

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python中zip()函数用法实例教程
Jul 31 Python
《Python之禅》中对于Python编程过程中的一些建议
Apr 03 Python
Python 爬虫爬取指定博客的所有文章
Feb 17 Python
VSCode下配置python调试运行环境的方法
Apr 06 Python
PyQt5每天必学之工具提示功能
Apr 19 Python
python3 打开外部程序及关闭的示例
Nov 06 Python
python实现蒙特卡罗方法教程
Jan 28 Python
详解Python循环作用域与闭包
Mar 21 Python
使用python脚本自动创建pip.ini配置文件代码实例
Sep 20 Python
服务器端jupyter notebook映射到本地浏览器的操作
Apr 14 Python
Python常见反爬虫机制解决方案
Jun 01 Python
Python 详解通过Scrapy框架实现爬取CSDN全站热榜标题热词流程
Nov 11 Python
python爬虫添加请求头代码实例
Dec 28 #Python
python使用rsa非对称加密过程解析
Dec 28 #Python
Python遍历字典方式就实例详解
Dec 28 #Python
python基于opencv检测程序运行效率
Dec 28 #Python
把vgg-face.mat权重迁移到pytorch模型示例
Dec 27 #Python
Pytorch 多维数组运算过程的索引处理方式
Dec 27 #Python
Pytorch 之修改Tensor部分值方式
Dec 27 #Python
You might like
php中取得文件的后缀名?
2012/02/20 PHP
PHP基础知识回顾
2012/08/16 PHP
php面象对象数据库操作类实例
2014/12/02 PHP
Laravel框架Blade模板简介及模板继承用法分析
2019/12/03 PHP
Alliance vs AM BO3 第一场2.13
2021/03/10 DOTA
javascript编程起步(第四课)
2007/01/10 Javascript
jquery 单击li防止重复加载的实现代码
2010/12/24 Javascript
获取元素距离浏览器周边的位置的方法getBoundingClientRect
2013/04/17 Javascript
Javascript代码在页面加载时的执行顺序介绍
2013/05/03 Javascript
javascript常用对话框小集
2013/09/13 Javascript
jQuery 文本框得失焦点的简单实例
2014/02/19 Javascript
代码获取历史上的今天发生的事
2014/04/11 Javascript
javascript时间函数大全
2014/06/30 Javascript
ExpressJS入门实例
2015/01/14 Javascript
Javascript中的数组常用方法解析
2016/06/17 Javascript
javascript实现根据函数名称字符串动态执行函数的方法示例
2016/12/28 Javascript
利用vue开发一个所谓的数独方法实例
2017/12/21 Javascript
laydate如何根据开始时间或者结束时间限制范围
2018/11/15 Javascript
解决layui的input独占一行的问题
2019/09/10 Javascript
Vue实现 点击显示再点击隐藏效果(点击页面空白区域也隐藏效果)
2020/01/16 Javascript
基于element-ui对话框el-dialog初始化的校验问题解决
2020/09/11 Javascript
详解Python中for循环的使用方法
2015/05/14 Python
VTK与Python实现机械臂三维模型可视化详解
2017/12/13 Python
Python使用add_subplot与subplot画子图操作示例
2018/06/01 Python
python使用adbapi实现MySQL数据库的异步存储
2019/03/19 Python
Python企业编码生成系统总体系统设计概述
2019/07/26 Python
Django 拆分model和view的实现方法
2019/08/16 Python
Python爬虫之urllib基础用法教程
2019/10/12 Python
python中sympy库求常微分方程的用法
2020/04/28 Python
关于前端上传文件全面基础扫盲贴(入门)
2019/08/01 HTML / CSS
拉斯维加斯城市观光通行证:Las Vegas Pass
2019/05/21 全球购物
群众路线个人剖析材料及整改措施
2014/11/04 职场文书
品质保证书格式
2015/02/28 职场文书
简单介绍 http请求响应参数、无连接无状态、MIME、状态码、端口、telnet、curl
2021/03/31 HTML / CSS
小程序后台PHP版本部署运行 LNMP+WNMP
2021/04/01 Servers
CentOS下安装Jenkins的完整步骤
2022/04/07 Servers