浅谈Python采集网页时正则表达式匹配换行符的问题


Posted in Python onDecember 20, 2018

如下所示:

p1 = r'(?<=<div class="ds_cr">)(.*?)(?=<div id="pageurl">)' #这样采集html时出错,采集不到数据,正则中 . 是不能匹配换行符,改成如下:
p1 = r'(?<=<div class="ds_cr">)([\s\S]*?)(?=<div id="pageurl">)' # 这是我们写的正则表达式规则,你现在可以不理解啥意思

[\s\S]

\s

匹配任何空白字符,包括空格、制表符、换页符等等。等价于[ \f\n\r\t\v]。

\S

匹配任何非空白字符。等价于[^ \f\n\r\t\v]。

以上这篇浅谈Python采集网页时正则表达式匹配换行符的问题就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python单元测试框架unittest简明使用实例
Apr 13 Python
python使用wxpython开发简单记事本的方法
May 20 Python
Python实现批量读取word中表格信息的方法
Jul 30 Python
selenium+python设置爬虫代理IP的方法
Nov 29 Python
python中struct模块之字节型数据的处理方法
Aug 27 Python
python 内置函数汇总详解
Sep 16 Python
余弦相似性计算及python代码实现过程解析
Sep 18 Python
解决运行出现'dict' object has no attribute 'has_key'问题
Jul 15 Python
python批量检查两个对应的txt文件的行数是否一致的实例代码
Oct 31 Python
使用pandas实现筛选出指定列值所对应的行
Dec 13 Python
Python 中Operator模块的使用
Jan 30 Python
解析目标检测之IoU
Jun 26 Python
Python实现正则表达式匹配任意的邮箱方法
Dec 20 #Python
用Python编写一个高效的端口扫描器的方法
Dec 20 #Python
python re正则匹配网页中图片url地址的方法
Dec 20 #Python
python使用pdfminer解析pdf文件的方法示例
Dec 20 #Python
python爬取指定微信公众号文章
Dec 20 #Python
在Django中URL正则表达式匹配的方法
Dec 20 #Python
python采集微信公众号文章
Dec 20 #Python
You might like
我的论坛源代码(八)
2006/10/09 PHP
繁体中文转换为简体中文的PHP函数
2006/10/09 PHP
PHP中trim()函数简单使用指南
2015/04/16 PHP
强制设为首页代码
2006/06/19 Javascript
Firefox div高度自适应
2009/04/28 Javascript
JavaScript Tips 使用DocumentFragment加快DOM渲染速度
2010/06/28 Javascript
转换json格式的日期为Javascript对象的函数
2010/07/13 Javascript
基于jquery实现漂亮的动态信息提示效果
2011/08/02 Javascript
javascript判断两个IP地址是否在同一个网段的实现思路
2013/12/13 Javascript
jquery datatable后台封装数据示例代码
2014/08/07 Javascript
AspNet中使用JQuery上传插件Uploadify详解
2015/05/20 Javascript
全面解析Bootstrap表单使用方法(表单控件)
2015/11/24 Javascript
深入理解Java线程编程中的阻塞队列容器
2015/12/07 Javascript
JSON对象 详解及实例代码
2016/10/18 Javascript
3种不同的ContextMenu右键菜单实现代码
2016/11/03 Javascript
JS运动特效之完美运动框架实例分析
2018/01/24 Javascript
Vue+ElementUI项目使用webpack输出MPA的方法
2019/08/27 Javascript
ES6字符串的扩展实例
2020/12/21 Javascript
[01:25]2015国际邀请赛最佳短片奖——斧王《拆塔英雄:天赋异禀》
2015/09/22 DOTA
Python实现的读写json文件功能示例
2018/06/05 Python
python 自动去除空行的实例
2018/07/24 Python
Python MongoDB 插入数据时已存在则不执行,不存在则插入的解决方法
2019/09/24 Python
在pandas中遍历DataFrame行的实现方法
2019/10/23 Python
Python+MySQL随机试卷及答案生成程序的示例代码
2021/02/01 Python
CSS3中Transform动画属性用法详解
2016/07/04 HTML / CSS
css3 中实现炫酷的loading效果
2019/04/26 HTML / CSS
利用Bootstrap实现漂亮简洁的CSS3价格表实例源码
2017/03/02 HTML / CSS
iframe跨域的几种常用方法
2019/11/11 HTML / CSS
精选奢华:THE LIST
2019/09/05 全球购物
2013年大学生的自我鉴定
2013/10/24 职场文书
软件毕业生个人鉴定
2014/03/03 职场文书
寻找最美家庭活动方案
2014/08/20 职场文书
仓库保管员岗位职责
2015/02/09 职场文书
手把手教你实现PyTorch的MNIST数据集
2021/06/28 Python
使用Java去实现超市会员管理系统
2022/03/18 Java/Android
国际最新研究在陨石中发现DNA主要成分 或由陨石带来地球
2022/04/29 数码科技