浅谈Python采集网页时正则表达式匹配换行符的问题


Posted in Python onDecember 20, 2018

如下所示:

p1 = r'(?<=<div class="ds_cr">)(.*?)(?=<div id="pageurl">)' #这样采集html时出错,采集不到数据,正则中 . 是不能匹配换行符,改成如下:
p1 = r'(?<=<div class="ds_cr">)([\s\S]*?)(?=<div id="pageurl">)' # 这是我们写的正则表达式规则,你现在可以不理解啥意思

[\s\S]

\s

匹配任何空白字符,包括空格、制表符、换页符等等。等价于[ \f\n\r\t\v]。

\S

匹配任何非空白字符。等价于[^ \f\n\r\t\v]。

以上这篇浅谈Python采集网页时正则表达式匹配换行符的问题就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python实现3行代码解简单的一元一次方程
Aug 18 Python
python opencv实现切变换 不裁减图片
Jul 26 Python
python与caffe改变通道顺序的方法
Aug 04 Python
PyTorch 1.0 正式版已经发布了
Dec 13 Python
对python中GUI,Label和Button的实例详解
Jun 27 Python
关于pymysql模块的使用以及代码详解
Sep 01 Python
详解python路径拼接os.path.join()函数的用法
Oct 09 Python
python实现输入任意一个大写字母生成金字塔的示例
Oct 27 Python
在Mac中配置Python虚拟环境过程解析
Jun 22 Python
Python使用grequests并发发送请求的示例
Nov 05 Python
Python安装Bs4的多种方法
Nov 28 Python
Elasticsearch 数据类型及管理
Apr 19 Python
Python实现正则表达式匹配任意的邮箱方法
Dec 20 #Python
用Python编写一个高效的端口扫描器的方法
Dec 20 #Python
python re正则匹配网页中图片url地址的方法
Dec 20 #Python
python使用pdfminer解析pdf文件的方法示例
Dec 20 #Python
python爬取指定微信公众号文章
Dec 20 #Python
在Django中URL正则表达式匹配的方法
Dec 20 #Python
python采集微信公众号文章
Dec 20 #Python
You might like
PHP4(windows版本)中的COM函数
2006/10/09 PHP
聊天室php&amp;mysql(五)
2006/10/09 PHP
PHP 简单日历实现代码
2009/10/28 PHP
ThinkPHP实现生成和校验验证码功能
2017/04/28 PHP
浅谈thinkphp5 instance 的简单实现
2017/07/30 PHP
php策略模式简单示例分析【区别于工厂模式】
2019/09/25 PHP
PHP常用函数之格式化时间操作示例
2019/10/21 PHP
多个checkbox被选中时如何判断是否有自己想要的
2014/09/22 Javascript
实现无刷新联动例子汇总
2015/05/20 Javascript
jquery获取form表单input元素值的简单实例
2016/05/30 Javascript
JS控制HTML元素的显示和隐藏的两种方法
2016/09/27 Javascript
jQuery Easy UI中根据第一个下拉框选中的值设置第二个下拉框是否可以编辑
2016/11/29 Javascript
详解weex默认webpack.config.js改造
2018/01/08 Javascript
node的process以及child_process模块学习笔记
2018/03/06 Javascript
在vue中给列表中的奇数行添加class的实现方法
2018/09/05 Javascript
jQuery超简单遮罩层实现方法示例
2018/09/06 jQuery
解决js相同的正则多次调用test()返回的值却不同的问题
2018/10/10 Javascript
小程序云开发初探(小结)
2018/10/24 Javascript
jQuery实现高级检索功能
2019/05/28 jQuery
[00:55]2015国际邀请赛中国区预选赛5月23日——28日约战上海
2015/05/25 DOTA
[01:05:30]VP vs TNC 2018国际邀请赛小组赛BO2 第一场 8.17
2018/08/20 DOTA
python使用Flask框架获取用户IP地址的方法
2015/03/21 Python
python连接mysql实例分享
2016/10/09 Python
Python使用PDFMiner解析PDF代码实例
2017/03/27 Python
Python一行代码实现快速排序的方法
2019/04/30 Python
pyqt5 从本地选择图片 并显示在label上的实例
2019/06/13 Python
Scrapy框架实现的登录网站操作示例
2020/02/06 Python
Python使用socketServer包搭建简易服务器过程详解
2020/06/12 Python
torchxrayvision包安装过程(附pytorch1.6cpu版安装)
2020/08/26 Python
python中用ggplot绘制画图实例讲解
2021/01/26 Python
Notino匈牙利:购买香水和化妆品
2019/04/12 全球购物
会计电算化专业应届大学生求职信
2013/10/22 职场文书
反邪教警示教育方案
2014/05/13 职场文书
民主生活会对照检查材料思想汇报
2014/09/27 职场文书
婚宴祝酒词大全
2015/08/10 职场文书
PyTorch dropout设置训练和测试模式的实现
2021/05/27 Python