Selenium+BeautifulSoup+json获取Script标签内的json数据


Posted in Python onDecember 07, 2020

Selenium爬虫遇到 数据是以 JSON 字符串的形式包裹在 Script 标签中,

假设Script标签下代码如下:

<script id="DATA_INFO" type="application/json" >
{
  "user": {
    "isLogin": true,
    "userInfo": {
      "id": 123456,
      "nickname": "LiMing",
      "intro": "人生苦短,我用python"
    }
  }
}
</script>

此时drive.find_elements_by_xpath('//*[@id="DATA_INFO"] 只能定位到元素,但是无法通过.text方法,获取Script标签下的json数据

from bs4 import BeautifulSoup as bs
import json as js
#selenium获取当前页面源码
html = drive.page_source
#BeautifulSoup转换页面源码
bs=BeautifulSoup(html,'lxml')
#获取Script标签下的完整json数据,并通过json加载成字典格式
js_test=js.loads(bs.find("script",{"id":"DATA_INFO"}).get_text())
#获取Script标签下的nickname 值
js_tes

到此这篇关于Selenium+BeautifulSoup+json获取Script标签内的json数据的文章就介绍到这了,更多相关Selenium+BeautifulSoup获取json内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
wxPython窗口中文乱码解决方法
Oct 11 Python
50行Python代码实现人脸检测功能
Jan 23 Python
Python3.5.3下配置opencv3.2.0的操作方法
Apr 02 Python
python监控nginx端口和进程状态
Sep 06 Python
解决Tensorflow 内存泄露问题
Feb 05 Python
python sklearn包——混淆矩阵、分类报告等自动生成方式
Feb 28 Python
Python多线程多进程实例对比解析
Mar 12 Python
python实现3D地图可视化
Mar 25 Python
使用Django xadmin 实现修改时间选择器为不可输入状态
Mar 30 Python
Spring http服务远程调用实现过程解析
Jun 11 Python
python pandas dataframe 去重函数的具体使用
Jul 20 Python
python中pop()函数的语法与实例
Dec 01 Python
Python爬虫实战案例之爬取喜马拉雅音频数据详解
Dec 07 #Python
用python对excel查重
Dec 07 #Python
python3 通过 pybind11 使用Eigen加速代码的步骤详解
Dec 07 #Python
python 通过 pybind11 使用Eigen加速代码的步骤
Dec 07 #Python
Python中BeautifulSoup通过查找Id获取元素信息
Dec 07 #Python
BeautifulSoup中find和find_all的使用详解
Dec 07 #Python
python爬虫beautifulsoup解析html方法
Dec 07 #Python
You might like
PHP 读取和修改大文件的某行内容的代码
2009/10/30 PHP
PHP中调用ASP.NET的WebService的代码
2011/04/22 PHP
克隆一个新项目的快捷方式
2013/04/10 PHP
使用session判断用户登录用户权限(超简单)
2013/06/08 PHP
jquery 利用show和hidden实现级联菜单示例代码
2013/08/09 Javascript
jquery validate添加自定义验证规则(验证邮箱 邮政编码)
2013/12/04 Javascript
ajax提交表单实现网页无刷新注册示例
2014/05/08 Javascript
jQuery制作简洁的多级联动Select下拉框
2014/12/23 Javascript
jquery插件jquery.beforeafter.js实现左右拖拽分隔条对比图片的方法
2015/08/07 Javascript
JS实现的3D拖拽翻页效果代码
2015/10/31 Javascript
JavaScript原生xmlHttp与jquery的ajax方法json数据格式实例
2015/12/04 Javascript
详解Backbone.js框架中的模型Model与其集合collection
2016/05/05 Javascript
BootStrap智能表单实战系列(九)表单图片上传的支持
2016/06/13 Javascript
jQuery图片轮播(二)利用构造函数和原型创建对象以实现继承
2016/12/06 Javascript
JavaScript 网页中实现一个计算当年还剩多少时间的倒数计时程序
2017/01/25 Javascript
Vue.js中数据绑定的语法教程
2017/06/02 Javascript
对Vue table 动态表格td可编辑的方法详解
2018/08/28 Javascript
基于webpack4.X从零搭建React脚手架的方法步骤
2018/12/23 Javascript
细说webpack6 Babel的使用详解
2019/09/26 Javascript
全面解析Python的While循环语句的使用方法
2015/10/13 Python
Python实现使用卷积提取图片轮廓功能示例
2018/05/12 Python
华为校园招聘上机笔试题 扑克牌大小(python)
2020/04/22 Python
Python之数据序列化(json、pickle、shelve)详解
2019/08/30 Python
Keras load_model 导入错误的解决方式
2020/06/09 Python
GNC健安喜美国官网:美国第一营养品牌
2016/07/22 全球购物
德国箱包网上商店:koffer24.de
2016/07/27 全球购物
世界上最大的高分辨率在线图片库:Alamy
2018/07/07 全球购物
美国翻新电子产品商店:The Store
2019/10/08 全球购物
法国滑雪假期的专家:Ski Planet
2019/11/02 全球购物
会计专业自荐信
2013/12/02 职场文书
公休请假条
2014/04/11 职场文书
2014机关干部学习“焦裕禄精神”思想汇报
2014/09/19 职场文书
2016读书月活动心得体会
2016/01/14 职场文书
golang 如何通过反射创建新对象
2021/04/28 Golang
Java练习之潜艇小游戏的实现
2022/03/16 Java/Android
mysql如何查询连续记录
2022/05/11 MySQL