浅谈Python采集网页时正则表达式匹配换行符的问题


Posted in Python onDecember 20, 2018

如下所示:

p1 = r'(?<=<div class="ds_cr">)(.*?)(?=<div id="pageurl">)' #这样采集html时出错,采集不到数据,正则中 . 是不能匹配换行符,改成如下:
p1 = r'(?<=<div class="ds_cr">)([\s\S]*?)(?=<div id="pageurl">)' # 这是我们写的正则表达式规则,你现在可以不理解啥意思

[\s\S]

\s

匹配任何空白字符,包括空格、制表符、换页符等等。等价于[ \f\n\r\t\v]。

\S

匹配任何非空白字符。等价于[^ \f\n\r\t\v]。

以上这篇浅谈Python采集网页时正则表达式匹配换行符的问题就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python深入学习之闭包
Aug 31 Python
Python实现基于HTTP文件传输实例
Nov 08 Python
python执行子进程实现进程间通信的方法
Jun 02 Python
pandas数据预处理之dataframe的groupby操作方法
Apr 13 Python
python学生信息管理系统(完整版)
Apr 05 Python
python用plt画图时,cmp设置方法
Dec 13 Python
Python实现网站表单提交和模板
Jan 15 Python
Python语言检测模块langid和langdetect的使用实例
Feb 19 Python
Django ORM 查询管理器源码解析
Aug 05 Python
Django实现文件上传下载功能
Oct 06 Python
python由已知数组快速生成新数组的方法
Apr 08 Python
拒绝盗图!教你怎么用python给图片加水印
Jun 04 Python
Python实现正则表达式匹配任意的邮箱方法
Dec 20 #Python
用Python编写一个高效的端口扫描器的方法
Dec 20 #Python
python re正则匹配网页中图片url地址的方法
Dec 20 #Python
python使用pdfminer解析pdf文件的方法示例
Dec 20 #Python
python爬取指定微信公众号文章
Dec 20 #Python
在Django中URL正则表达式匹配的方法
Dec 20 #Python
python采集微信公众号文章
Dec 20 #Python
You might like
php和jquery实现地图区域数据统计展示数据示例
2014/02/12 PHP
destoon会员注册提示“数据校验失败(2)”解决方法
2014/06/21 PHP
ThinkPHP实现支付宝接口功能实例
2014/12/02 PHP
php 从指定数字中获取随机组合的简单方法(推荐)
2017/04/05 PHP
用jQuery技术实现Tab页界面之二
2009/09/21 Javascript
js 页面刷新location.reload和location.replace的区别小结
2009/12/24 Javascript
js之ActiveX控件使用说明 new ActiveXObject()
2014/03/03 Javascript
js常用系统函数用法实例分析
2015/01/12 Javascript
探究Javascript模板引擎mustache.js使用方法
2016/01/26 Javascript
AngularJS基础 ng-dblclick 指令用法
2016/08/01 Javascript
浅谈Vue父子组件和非父子组件传值问题
2017/08/22 Javascript
js使用xml数据载体实现城市省份二级联动效果
2017/11/08 Javascript
axios发送post请求,提交图片类型表单数据方法
2018/03/16 Javascript
纯JS实现的读取excel文件内容功能示例【支持所有浏览器】
2018/06/23 Javascript
vue v-for循环重复数据无法添加问题解决方法【加track-by='索引'】
2019/03/15 Javascript
[02:35]DOTA2英雄基础教程 末日使者
2013/12/04 DOTA
在GitHub Pages上使用Pelican搭建博客的教程
2015/04/25 Python
python logging 日志轮转文件不删除问题的解决方法
2016/08/02 Python
Python连接PostgreSQL数据库的方法
2016/11/28 Python
Django Admin实现三级联动的示例代码(省市区)
2018/06/22 Python
Python实现计算文件MD5和SHA1的方法示例
2019/06/11 Python
python 利用turtle模块画出没有角的方格
2019/11/23 Python
python获取系统内存占用信息的实例方法
2020/07/17 Python
June Jacobs尊积帕官网:知名的spa水疗护肤品牌
2019/03/21 全球购物
Subside Sports德国:足球球衣和球迷商品
2019/06/08 全球购物
如果一个类实现了多个接口但是这些接口有相同的方法名将会怎样
2013/06/16 面试题
用JAVA实现一种排序,JAVA类实现序列化的方法(二种)
2014/04/23 面试题
会议开场欢迎词
2014/01/15 职场文书
有关爱国演讲稿
2014/05/07 职场文书
教师竞聘上岗演讲稿
2014/09/03 职场文书
公司股东合作协议书
2014/09/14 职场文书
思想品德评语大全
2014/12/31 职场文书
出国导师推荐信
2015/03/25 职场文书
导游词之麻姑仙境
2019/11/18 职场文书
「月刊Comic Alive」2022年5月号封面公开
2022/03/21 日漫
详解Python flask的前后端交互
2022/03/31 Python