Python lxml解析HTML并用xpath获取元素的方法


Posted in Python onJanuary 02, 2019

代码

使用方法见注释

#-*- coding: UTF-8 -*-

from lxml import etree

source = u'''
<div><p class="p1" data-a="1">测试数据1</p>
<p class="p1" data-a="2">测试数据2</p>
<p class="p1" data-a="3" style="height:100px;">
<strong class="s">测试数据3</strong></p>
<p class="p1" data-a="4" width="200"><img src="1.jpg" class="img"/><br/>
图片</p>
'''

# 从字符串解析
page = etree.HTML(source)

# 元素列表
ps = page.xpath("//p")
for p in ps:
  print u"属性:%s" % p.attrib
  print u"文本:%s" % p.text

# 文本列表
ts = page.xpath("//p/text()")
for t in ts:
  print t

# xpath定位 
ls = page.xpath('//p[@class="p1"][last()]/img')
for l in ls:
  print l.attrib

以上这篇Python lxml解析HTML并用xpath获取元素的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
如何解决django配置settings时遇到Could not import settings 'conf.local'
Nov 18 Python
python使用range函数计算一组数和的方法
May 07 Python
python使用reportlab实现图片转换成pdf的方法
May 22 Python
浅析python递归函数和河内塔问题
Apr 18 Python
python 输出上个月的月末日期实例
Apr 11 Python
Django中如何使用sass的方法步骤
Jul 09 Python
让Python脚本暂停执行的几种方法(小结)
Jul 11 Python
Django实现文件上传下载功能
Oct 06 Python
Python matplotlib画曲线例题解析
Feb 07 Python
Python 实现RSA加解密文本文件
Dec 30 Python
matplotlib绘制多子图共享鼠标光标的方法示例
Jan 08 Python
Python Pandas pandas.read_sql函数实例用法
Jun 21 Python
用xpath获取指定标签下的所有text的实例
Jan 02 #Python
在python中获取div的文本内容并和想定结果进行对比详解
Jan 02 #Python
python的xpath获取div标签内html内容,实现innerhtml功能的方法
Jan 02 #Python
python后端接收前端回传的文件方法
Jan 02 #Python
python requests.post带head和body的实例
Jan 02 #Python
python批量获取html内body内容的实例
Jan 02 #Python
如何在django里上传csv文件并进行入库处理的方法
Jan 02 #Python
You might like
Ajax+PHP 边学边练之四 表单
2009/11/27 PHP
PHP 可阅读随机字符串代码
2010/05/26 PHP
PHP简单计算两个时间差的方法示例
2017/06/20 PHP
PHP生成加减算法方式的验证码实例
2018/03/12 PHP
PHP设计模式之装饰器(装饰者)模式(Decorator)入门与应用详解
2019/12/13 PHP
JavaScript 浏览器验证代码(来自discuz)
2010/07/17 Javascript
JavaScript 用Node.js写Shell脚本[译]
2012/09/20 Javascript
一个JavaScript递归实现反转数组字符串的实例
2014/10/14 Javascript
9款2014最热门jQuery实用特效推荐
2014/12/07 Javascript
JavaScript实现三阶幻方算法谜题解答
2014/12/29 Javascript
HTML5+setCutomValidity()函数验证表单实例分享
2015/04/24 Javascript
javascript中this的四种用法
2015/05/11 Javascript
Javascript简写条件语句(推荐)
2016/06/12 Javascript
浅谈vue首屏加载优化
2018/06/28 Javascript
elementUI 设置input的只读或禁用的方法
2018/10/30 Javascript
vue项目从node8.x升级到12.x后的问题解决
2019/10/25 Javascript
JS Html转义和反转义(html编码和解码)的实现与使用方法总结
2020/03/10 Javascript
[53:38]OG vs LGD 2018国际邀请赛淘汰赛BO3 第三场 8.26
2018/08/30 DOTA
有关wxpython pyqt内存占用问题分析
2014/06/09 Python
Python win32com 操作Exce的l简单方法(必看)
2017/05/25 Python
python通过elixir包操作mysql数据库实例代码
2018/01/31 Python
快速解决安装python没有scripts文件夹的问题
2018/04/03 Python
python实现基于朴素贝叶斯的垃圾分类算法
2019/07/09 Python
Python 调用 Outlook 发送邮件过程解析
2019/08/08 Python
Python代码块及缓存机制原理详解
2019/12/13 Python
python 删除系统中的文件(按时间,大小,扩展名)
2020/11/19 Python
Python lxml库的简单介绍及基本使用讲解
2020/12/22 Python
Farfetch澳大利亚官网:Farfetch Australia
2020/04/26 全球购物
木马的传播途径主要有哪些
2016/04/08 面试题
Servlet都有哪些方法?主要作用是什么?
2014/03/04 面试题
设计总监岗位职责
2013/12/07 职场文书
邮政员工辞职信
2014/01/16 职场文书
含预算的公司户外活动方案
2014/08/16 职场文书
英语三分钟演讲稿
2014/08/19 职场文书
百家讲坛观后感
2015/06/12 职场文书
Python 居然可以在 Excel 中画画你知道吗
2022/02/15 Python