Python爬虫之UserAgent的使用实例


Posted in Python onFebruary 21, 2019

问题: 在Python爬虫的过程中经常要模拟UserAgent, 因此自动生成UserAgent十分有用, 最近看到一个Python库(fake-useragent),可以随机生成各种UserAgent, 在这里记录一下, 留给自己爬虫使用。

安装 pip install fake-useragent

使用案例

基本使用

from fake_useragent import UserAgent
ua = UserAgent()
ua.ie
# Mozilla/5.0 (Windows; U; MSIE 9.0; Windows NT 9.0; en-US);
ua.msie
# Mozilla/5.0 (compatible; MSIE 10.0; Macintosh; Intel Mac OS X 10_7_3; Trident/6.0)'
ua['Internet Explorer']
# Mozilla/5.0 (compatible; MSIE 8.0; Windows NT 6.1; Trident/4.0; GTB7.4; InfoPath.2; SV1; .NET CLR 3.3.69573; WOW64; en-US)
ua.opera
# Opera/9.80 (X11; Linux i686; U; ru) Presto/2.8.131 Version/11.11
ua.chrome
# Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.2 (KHTML, like Gecko) Chrome/22.0.1216.0 Safari/537.2'
ua.google
# Mozilla/5.0 (Macintosh; Intel Mac OS X 10_7_4) AppleWebKit/537.13 (KHTML, like Gecko) Chrome/24.0.1290.1 Safari/537.13
ua['google chrome']
# Mozilla/5.0 (X11; CrOS i686 2268.111.0) AppleWebKit/536.11 (KHTML, like Gecko) Chrome/20.0.1132.57 Safari/536.11
ua.firefox
# Mozilla/5.0 (Windows NT 6.2; Win64; x64; rv:16.0.1) Gecko/20121011 Firefox/16.0.1
ua.ff
# Mozilla/5.0 (X11; Ubuntu; Linux i686; rv:15.0) Gecko/20100101 Firefox/15.0.1
ua.safari
# Mozilla/5.0 (iPad; CPU OS 6_0 like Mac OS X) AppleWebKit/536.26 (KHTML, like Gecko) Version/6.0 Mobile/10A5355d Safari/8536.25
# and the best one, random via real world browser usage statistic
ua.random

注意:

fake-useragent 将收集到的数据缓存到temp文件夹, 例如 /tmp, 更新数据:

from fake_useragent import UserAgent
ua = UserAgent()
ua.update()

有时候会因为网络或者其他问题,出现异常(fake_useragent.errors.FakeUserAgentError: Maximum amount of retries reached), 可以禁用服务器缓存(从这里踩了一个坑, 没仔细看文档的锅):

from fake_useragent import UserAgent
ua = UserAgent(use_cache_server=False)

可以自己添加本地数据文件(v0.1.4+)

import fake_useragent
# I am STRONGLY!!! recommend to use version suffix
location = '/home/user/fake_useragent%s.json' % fake_useragent.VERSION
ua = fake_useragent.UserAgent(path=location)
ua.random

其他功能用到的也不是很多,详细见文档吧。

总结

以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,谢谢大家对三水点靠木的支持。如果你想了解更多相关内容请查看下面相关链接

Python 相关文章推荐
python pickle 和 shelve模块的用法
Sep 16 Python
Python配置文件解析模块ConfigParser使用实例
Apr 13 Python
Python基于回溯法子集树模板解决旅行商问题(TSP)实例
Sep 05 Python
Python视频爬虫实现下载头条视频功能示例
May 07 Python
对python 调用类属性的方法详解
Jul 02 Python
python画图把时间作为横坐标的方法
Jul 07 Python
在Python中使用filter去除列表中值为假及空字符串的例子
Nov 18 Python
python实现差分隐私Laplace机制详解
Nov 25 Python
关于Python 中的时间处理包datetime和arrow的方法详解
Mar 19 Python
Python更换pip源方法过程解析
May 19 Python
python如何修改文件时间属性
Feb 05 Python
python 提取html文本的方法
May 20 Python
利用python实现在微信群刷屏的方法
Feb 21 #Python
Python实现微信自动好友验证,自动回复,发送群聊链接方法
Feb 21 #Python
使用python itchat包爬取微信好友头像形成矩形头像集的方法
Feb 21 #Python
对python借助百度云API对评论进行观点抽取的方法详解
Feb 21 #Python
用python实现刷点击率的示例代码
Feb 21 #Python
Python快速转换numpy数组中Nan和Inf的方法实例说明
Feb 21 #Python
python根据文章标题内容自动生成摘要的实例
Feb 21 #Python
You might like
一个程序下载的管理程序(二)
2006/10/09 PHP
Search File Contents PHP 搜索目录文本内容的代码
2010/02/21 PHP
用PHP为SHOPEX增加日志功能代码
2010/07/02 PHP
php用ini_get获取php.ini里变量值的方法
2015/03/04 PHP
Laravel中日期时间处理包Carbon的简单使用
2017/09/21 PHP
用函数式编程技术编写优美的 JavaScript_ibm
2008/05/16 Javascript
javascript针对DOM的应用分析(二)
2012/04/15 Javascript
javascript笛卡尔积算法实现方法
2015/04/08 Javascript
HTML+CSS+JS实现完美兼容各大浏览器的TABLE固定列
2015/04/26 Javascript
基于javascript实现泡泡大冒险网页版小游戏
2016/03/23 Javascript
JavaScript高仿支付宝倒计时页面及代码实现
2016/10/21 Javascript
AngularJS实现路由实例
2017/02/12 Javascript
VUE中v-model和v-for指令详解
2017/06/23 Javascript
Bootstrap一款超好用的前端框架
2017/09/25 Javascript
配置一个vue3.0项目的完整步骤
2019/04/26 Javascript
探索JavaScript中私有成员的相关知识
2019/06/13 Javascript
JavaScript提升机制Hoisting详解
2019/10/23 Javascript
javascript实现的图片预览和上传功能示例【兼容IE 9】
2020/05/01 Javascript
vue 实现click同时传入事件对象和自定义参数
2021/01/29 Vue.js
Python多进程同步Lock、Semaphore、Event实例
2014/11/21 Python
Python脚本暴力破解栅栏密码
2015/10/19 Python
独特的python循环语句
2016/11/20 Python
200 行python 代码实现 2048 游戏
2018/01/12 Python
pytorch使用Variable实现线性回归
2019/05/21 Python
500行代码使用python写个微信小游戏飞机大战游戏
2019/10/16 Python
python实现名片管理器的示例代码
2019/12/17 Python
python 如何将office文件转换为PDF
2020/09/22 Python
详解vscode实现远程linux服务器上Python开发
2020/11/10 Python
Radley英国官网:英国莱德利小狗包
2019/03/21 全球购物
YSL圣罗兰美妆俄罗斯官网:Yves Saint Lauret RU
2020/09/23 全球购物
计算机专业个人求职信范例
2013/09/23 职场文书
个人简历中的自我评价范例
2013/10/29 职场文书
日语求职信范文
2013/12/17 职场文书
服务标语大全
2014/06/18 职场文书
我的中国梦演讲稿500字
2014/08/19 职场文书
2014年社区重阳节活动策划方案
2014/09/16 职场文书