python xpath获取页面注释的方法


Posted in Python onJanuary 14, 2019

版本信息:

python 2.7.12

lxml 3.8.0

from lxml import etree
 
html_str = """
<div id="box1">this from blog.csdn.net/lncxydjq , DO NOT COPY!
  <div id="box2">*****
    <!--can u get me, bitch?-->
  </div>
</div>
"""
 
html = etree.HTML(html_str)
 
print html.xpath('//div[@id="box1"]/div/node()')[1]
print type(html.xpath('//div[@id="box1"]/div/node()')[1])
print html.xpath('//div[@id="box1"]/div/node()')[1].text
 
"""output:
<!--can u get me, bitch?-->
<type 'lxml.etree._Comment'>
can u get me, bitch?
"""

以上这篇python xpath获取页面注释的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python使用os模块的os.walk遍历文件夹示例
Jan 27 Python
python简单实现计算过期时间的方法
Jun 09 Python
Python实现修改IE注册表功能示例
May 10 Python
python3实现windows下同名进程监控
Jun 21 Python
Python静态类型检查新工具之pyright 使用指南
Apr 26 Python
anaconda中更改python版本的方法步骤
Jul 14 Python
Python完成哈夫曼树编码过程及原理详解
Jul 29 Python
python实现爬虫抓取小说功能示例【抓取金庸小说】
Aug 09 Python
Python 使用 prettytable 库打印表格美化输出功能
Dec 26 Python
Python如何实现远程方法调用
Aug 07 Python
python中pandas.read_csv()函数的深入讲解
Mar 29 Python
教你漂亮打印Pandas DataFrames和Series
May 29 Python
Python面向对象之类的定义与继承用法示例
Jan 14 #Python
Python读取csv文件分隔符设置方法
Jan 14 #Python
Python装饰器用法实例分析
Jan 14 #Python
浅谈python str.format与制表符\t关于中文对齐的细节问题
Jan 14 #Python
对Python中创建进程的两种方式以及进程池详解
Jan 14 #Python
对Python多线程读写文件加锁的实例详解
Jan 14 #Python
Python多进程写入同一文件的方法
Jan 14 #Python
You might like
php注销代码(session注销)
2012/05/31 PHP
php curl的深入解析
2013/06/02 PHP
PHP模板引擎Smarty之配置文件在模板变量中的使用方法示例
2016/04/11 PHP
比较详细的javascript对象的property和prototype是什么一种关系
2007/08/06 Javascript
javascript学习笔记(十四) window对象使用介绍
2012/06/20 Javascript
十个迅速提升JQuery性能让你的JQuery跑得更快
2012/12/10 Javascript
jQuery如何实现点击页面获得当前点击元素的id或其他信息
2014/01/09 Javascript
css结合js制作下拉菜单示例代码
2014/02/27 Javascript
JavaSript中变量的作用域闭包的深入理解
2014/05/12 Javascript
nodejs开发环境配置与使用
2014/11/17 NodeJs
JavaScript数组前面插入元素的方法
2015/04/06 Javascript
javascript动态创建表格及添加数据实例详解
2015/05/13 Javascript
JavaScript获取当前cpu使用率的方法
2015/12/15 Javascript
angular bootstrap timepicker TypeError提示怎么办
2017/06/13 Javascript
vue 子组件向父组件传值方法
2018/02/26 Javascript
详解vue2.0 资源文件assets和static的区别
2018/11/27 Javascript
vue-cli随机生成port源码的方法
2019/09/02 Javascript
浅谈js数组splice删除某个元素爬坑
2020/10/14 Javascript
[56:01]2018DOTA2亚洲邀请赛 3.31 小组赛 B组 Effect vs EG
2018/03/31 DOTA
[01:10:48]完美世界DOTA2联赛PWL S2 GXR vs PXG 第一场 11.18
2020/11/18 DOTA
让python的Cookie.py模块支持冒号做key的方法
2010/12/28 Python
python一键升级所有pip package的方法
2017/01/16 Python
Python中selenium实现文件上传所有方法整理总结
2017/04/01 Python
Python3简单实现串口通信的方法
2019/06/12 Python
使用OpenCV实现仿射变换—平移功能
2019/08/29 Python
区分python中的进程与线程
2020/08/13 Python
Expedia加拿大官方网站:加拿大最大的在线旅游提供商
2017/12/31 全球购物
意大利领先的奢侈品在线时装零售商:MCLABELS
2020/10/13 全球购物
JACK & JONES荷兰官网:男士服装和鞋子
2021/03/07 全球购物
Python中pass语句的作用是什么
2016/06/01 面试题
做一个有道德的人演讲稿
2014/05/14 职场文书
学校募捐倡议书
2014/05/14 职场文书
英语分层教学实施方案
2014/06/15 职场文书
2014年组织委员工作总结
2014/12/01 职场文书
python 机器学习的标准化、归一化、正则化、离散化和白化
2021/04/16 Python
MySQL解决Navicat设置默认字符串时的报错问题
2022/06/16 MySQL