python xpath获取页面注释的方法


Posted in Python onJanuary 14, 2019

版本信息:

python 2.7.12

lxml 3.8.0

from lxml import etree
 
html_str = """
<div id="box1">this from blog.csdn.net/lncxydjq , DO NOT COPY!
  <div id="box2">*****
    <!--can u get me, bitch?-->
  </div>
</div>
"""
 
html = etree.HTML(html_str)
 
print html.xpath('//div[@id="box1"]/div/node()')[1]
print type(html.xpath('//div[@id="box1"]/div/node()')[1])
print html.xpath('//div[@id="box1"]/div/node()')[1].text
 
"""output:
<!--can u get me, bitch?-->
<type 'lxml.etree._Comment'>
can u get me, bitch?
"""

以上这篇python xpath获取页面注释的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
零基础写python爬虫之使用urllib2组件抓取网页内容
Nov 04 Python
Python简单检测文本类型的2种方法【基于文件头及cchardet库】
Sep 18 Python
Centos 升级到python3后pip 无法使用的解决方法
Jun 12 Python
使用python爬虫获取黄金价格的核心代码
Jun 13 Python
python 产生token及token验证的方法
Dec 26 Python
详解Python网络框架Django和Scrapy安装指南
Apr 01 Python
Django密码系统实现过程详解
Jul 19 Python
django项目环境搭建及在虚拟机本地创建django项目的教程
Aug 02 Python
运行tensorflow python程序,限制对GPU和CPU的占用操作
Feb 06 Python
Python实现计算图像RGB均值方式
Jun 04 Python
使用Keras中的ImageDataGenerator进行批次读图方式
Jun 17 Python
ASP.NET Core中的配置详解
Feb 05 Python
Python面向对象之类的定义与继承用法示例
Jan 14 #Python
Python读取csv文件分隔符设置方法
Jan 14 #Python
Python装饰器用法实例分析
Jan 14 #Python
浅谈python str.format与制表符\t关于中文对齐的细节问题
Jan 14 #Python
对Python中创建进程的两种方式以及进程池详解
Jan 14 #Python
对Python多线程读写文件加锁的实例详解
Jan 14 #Python
Python多进程写入同一文件的方法
Jan 14 #Python
You might like
Banner程序
2006/10/09 PHP
解决控件遮挡问题:关于有窗口元素和无窗口元素
2007/01/28 PHP
PHP中用正则表达式清除字符串的空白
2011/01/17 PHP
Laravel实现表单提交
2017/05/07 PHP
php多进程并发编程防止出现僵尸进程的方法分析
2020/02/28 PHP
PHP实现递归的三种方法
2020/07/04 PHP
PhpStorm 2020.3:新增开箱即用的PHP 8属性(推荐)
2020/10/30 PHP
php中Swoole的热更新实现代码实例
2021/03/04 PHP
Prototype使用指南之array.js
2007/01/10 Javascript
jquery 常用操作整理 基础入门篇
2009/10/14 Javascript
JavaScript原型链示例分享
2014/01/26 Javascript
JavaScript也谈内存优化
2014/06/06 Javascript
JavaScript学习笔记之JS函数
2015/01/22 Javascript
JavaScript把数组作为堆栈使用的方法
2015/03/20 Javascript
jQuery使用after()方法在元素后面添加多项内容的方法
2015/03/26 Javascript
关注jquery技巧提高jquery技能(前端开发必学)
2015/11/02 Javascript
jQuery多条件筛选如何实现
2015/11/04 Javascript
jquery判断当前浏览器的实现代码
2015/11/07 Javascript
javascript每日必学之封装
2016/02/23 Javascript
Angularjs实现分页和分页算法的示例代码
2016/12/23 Javascript
JS常见创建类的方法小结【工厂方式,构造器方式,原型方式,联合方式等】
2017/04/01 Javascript
node.js将MongoDB数据同步到MySQL的步骤
2017/12/10 Javascript
《javascript少儿编程》location术语总结
2018/05/27 Javascript
微信小程序实现星级评价效果
2018/12/28 Javascript
python多线程与多进程及其区别详解
2019/08/08 Python
pytorch如何冻结某层参数的实现
2020/01/10 Python
keras自动编码器实现系列之卷积自动编码器操作
2020/07/03 Python
详解Selenium-webdriver绕开反爬虫机制的4种方法
2020/10/28 Python
python使用smtplib模块发送邮件
2020/12/17 Python
BISSELL官网:北美吸尘器第一品牌
2019/03/14 全球购物
党政领导班子群众路线对照检查材料思想汇报
2014/09/27 职场文书
2014年教育工作总结
2014/11/26 职场文书
未来,这5大方向都很适合创业
2019/07/22 职场文书
详解使用 CSS prefers-* 规范提升网站的可访问性与健壮性
2021/05/25 HTML / CSS
Redis特殊数据类型HyperLogLog基数统计算法讲解
2022/06/01 Redis
el-table-column 内容不自动换行的解决方法
2022/08/14 Vue.js