Selenium+BeautifulSoup+json获取Script标签内的json数据


Posted in Python onDecember 07, 2020

Selenium爬虫遇到 数据是以 JSON 字符串的形式包裹在 Script 标签中,

假设Script标签下代码如下:

<script id="DATA_INFO" type="application/json" >
{
  "user": {
    "isLogin": true,
    "userInfo": {
      "id": 123456,
      "nickname": "LiMing",
      "intro": "人生苦短,我用python"
    }
  }
}
</script>

此时drive.find_elements_by_xpath('//*[@id="DATA_INFO"] 只能定位到元素,但是无法通过.text方法,获取Script标签下的json数据

from bs4 import BeautifulSoup as bs
import json as js
#selenium获取当前页面源码
html = drive.page_source
#BeautifulSoup转换页面源码
bs=BeautifulSoup(html,'lxml')
#获取Script标签下的完整json数据,并通过json加载成字典格式
js_test=js.loads(bs.find("script",{"id":"DATA_INFO"}).get_text())
#获取Script标签下的nickname 值
js_tes

到此这篇关于Selenium+BeautifulSoup+json获取Script标签内的json数据的文章就介绍到这了,更多相关Selenium+BeautifulSoup获取json内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
python实现文件快照加密保护的方法
Jun 30 Python
Python编程中的文件操作攻略
Oct 16 Python
利用python实现命令行有道词典的方法示例
Jan 31 Python
python绘制条形图方法代码详解
Dec 19 Python
SVM基本概念及Python实现代码
Dec 27 Python
对Python中plt的画图函数详解
Nov 07 Python
将python图片转为二进制文本的实例
Jan 24 Python
Python基于OpenCV实现人脸检测并保存
Jul 23 Python
Python使用lambda表达式对字典排序操作示例
Jul 25 Python
Python要如何实现列表排序的几种方法
Feb 21 Python
Keras 切换后端方式(Theano和TensorFlow)
Jun 19 Python
Python爬虫实例之2021猫眼票房字体加密反爬策略(粗略版)
Feb 22 Python
Python爬虫实战案例之爬取喜马拉雅音频数据详解
Dec 07 #Python
用python对excel查重
Dec 07 #Python
python3 通过 pybind11 使用Eigen加速代码的步骤详解
Dec 07 #Python
python 通过 pybind11 使用Eigen加速代码的步骤
Dec 07 #Python
Python中BeautifulSoup通过查找Id获取元素信息
Dec 07 #Python
BeautifulSoup中find和find_all的使用详解
Dec 07 #Python
python爬虫beautifulsoup解析html方法
Dec 07 #Python
You might like
Zend studio文件注释模板设置方法
2013/09/29 PHP
php+jQuery+Ajax实现点赞效果的方法(附源码下载)
2020/07/21 PHP
PHP PDOStatement::fetchObject讲解
2019/02/01 PHP
JavaScript中Array 对象相关的几个方法
2006/12/22 Javascript
有趣的JavaScript数组长度问题代码说明
2011/01/20 Javascript
js+html5获取用户地理位置信息并在Google地图上显示的方法
2015/06/05 Javascript
JS+DIV+CSS实现仿表单下拉列表效果
2015/08/18 Javascript
Bootstrap布局方式详解
2016/05/27 Javascript
关于JS变量和作用域详解
2016/07/28 Javascript
深入理解React中es6创建组件this的方法
2016/08/29 Javascript
Vue.js每天必学之方法与事件处理器
2016/09/06 Javascript
浅谈jQuery效果函数
2016/09/16 Javascript
javascript中异常处理案例(推荐)
2016/10/03 Javascript
Spring Boot+AngularJS+BootStrap实现进度条示例代码
2017/03/02 Javascript
vue新vue-cli3环境配置和模拟json数据的实例
2018/09/19 Javascript
Vue框架TypeScript装饰器使用指南小结
2019/02/18 Javascript
Vue运用transition实现过渡动画
2019/05/06 Javascript
vuex实现数据状态持久化
2019/11/11 Javascript
微信小程序基于高德地图API实现天气组件(动态效果)
2020/10/22 Javascript
[00:11]战神迅矛
2019/03/06 DOTA
50行代码实现贪吃蛇(具体思路及代码)
2013/04/27 Python
深入理解NumPy简明教程---数组3(组合)
2016/12/17 Python
python使用matplotlib画柱状图、散点图
2019/03/18 Python
python3 实现函数写文件路径的正确方法
2019/11/27 Python
css3中用animation的steps属性制作帧动画
2019/04/25 HTML / CSS
意大利奢华内衣制造商:Cosabella
2017/08/29 全球购物
菲律宾票务网站:StubHub菲律宾
2018/04/21 全球购物
配置管理计划的主要内容有哪些
2014/06/20 面试题
大学校庆邀请函
2014/01/11 职场文书
陈安之励志演讲稿
2014/08/21 职场文书
大学生第一学年自我鉴定2015
2014/09/28 职场文书
办理护照工作证明
2014/10/10 职场文书
人事任命通知书
2015/04/21 职场文书
2015年度绩效考核工作总结
2015/05/27 职场文书
JS Object构造函数之Object.freeze
2021/04/28 Javascript
68行Python代码实现带难度升级的贪吃蛇
2022/01/18 Python