使用Python提取文本中含有特定字符串的方法示例


Posted in Python onDecember 09, 2020

今天搞了一天的文本处理,发现python真的太适合做数据处理了。废话不多说,一起学习吧!

1.我的原始数据是这样的,如图

使用Python提取文本中含有特定字符串的方法示例

2.如果要提取每行含有pass的字符串,代码如下:

import re

filepath = "E:/untitled1/analyze_log/test.log"
txt = open(filepath, "r").read()

result=""
test_text = re.findall("..............+pass", txt)#取出每行含有pass的文本
result = result +'\n'.join(test_text)#换行输出
print(result)

3.执行上面代码,可以取出每行含有pass的文本,如图:

使用Python提取文本中含有特定字符串的方法示例

4.其实我真正要提取的是每行类似上图红色框内的字符串,代码实现如下:

import re

filepath = "E:/untitled1/analyze_log/test.log"
txt = open(filepath, "r").read()

result=""
test_text = re.findall("..............+pass", txt)#取出每行含有pass的文本
result = result +'\n'.join(test_text)#换行输出
del_num = re.sub("\d+ ", "", result)#去掉每行行首的数字
del_awake = del_num.replace("awake", "")#去掉awake
del_commd = del_awake.replace("commd", "")#去掉commd
del_string1 = re.sub("-a+\d\d\d\d-\d.wav", "", del_commd)#去掉-a0023-1.wav类型的字符串
del_string2 = re.sub("-a+\d\d\d\d.wav", "", del_string1)#去掉-a0016.wav类型的字符串
print(del_string2)

5.执行上面代码,可以取出最后我需要的文本,如图:

使用Python提取文本中含有特定字符串的方法示例

6.拓展

使用Python提取文本中含有特定字符串的方法示例

7.示例代码

import re

str = 'Hello123/World 45_?6bye'
result1 = re.findall('\d',str)#\d匹配任何十进制数
result2 = re.findall('\d+',str)#\d+可匹配一位或多位数字使用
result3 = re.findall('\D',str)#\d匹配非数字字符任何十进制数
result4 = re.findall('\w',str)#\w匹配任何字母数字字符,包括下划线在内
result5 = re.findall('\W',str)#\W匹配非任何字母数字字符,包括下划线在内
result6 = re.findall('\s',str)#\s匹配任何空白字符
result7 = re.findall('\S',str)#\S匹配非任何空白字符
result8 = re.findall('\AHello',str)#\A仅匹配字符串开头
result9 = re.findall('bye\Z',str)#\Z仅匹配字符串结尾
print(result1)
print(result2)
print(result3)
print(result4)
print(result5)
print(result6)
print(result7)
print(result8)
print(result9)

接下来会更几篇关于文本处理的博客,一边学习一边记笔记。加油!

到此这篇关于使用Python提取文本中含有特定字符串的文章就介绍到这了,更多相关Python提取文本特定字符串内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
python 异常处理总结
Oct 18 Python
Ubuntu安装Jupyter Notebook教程
Oct 18 Python
浅谈Python NLP入门教程
Dec 25 Python
PyQt5每天必学之组合框
Apr 20 Python
Php多进程实现代码
May 07 Python
浅谈dataframe中更改列属性的方法
Jul 10 Python
Python读取Excel表格,并同时画折线图和柱状图的方法
Oct 14 Python
浅谈pytorch grad_fn以及权重梯度不更新的问题
Aug 20 Python
python 对任意数据和曲线进行拟合并求出函数表达式的三种解决方案
Feb 18 Python
PyQt5连接MySQL及QMYSQL driver not loaded错误解决
Apr 29 Python
Python unittest生成测试报告过程解析
Sep 08 Python
详解在OpenCV中如何使用图像像素
Mar 03 Python
python使用正则表达式匹配txt特定字符串(有换行)
Dec 09 #Python
PyTorch中clone()、detach()及相关扩展详解
Dec 09 #Python
python调用jenkinsAPI构建jenkins,并传递参数的示例
Dec 09 #Python
python excel多行合并的方法
Dec 09 #Python
PyTorch中的拷贝与就地操作详解
Dec 09 #Python
python 调用Google翻译接口的方法
Dec 09 #Python
浅析Python 中的 WSGI 接口和 WSGI 服务的运行
Dec 09 #Python
You might like
PHP学习之输出字符串(echo,print,printf,print_r和var_dump)
2011/04/17 PHP
php获取网页中图片、DIV内容的简单方法
2014/06/19 PHP
Win7 64位系统下PHP连接Oracle数据库
2014/08/20 PHP
php实现的Curl封装类Curl.class.php用法实例分析
2015/09/25 PHP
Yii2 rbac权限控制之rule教程详解
2016/06/23 PHP
thinkphp 手机号和用户名同时登录
2017/01/20 PHP
jQuery源码分析-04 选择器-Sizzle-工作原理分析
2011/11/14 Javascript
javascript数组排序汇总
2015/07/07 Javascript
jQuery.trim() 函数及trim()用法详解
2015/10/26 Javascript
Bootstrap实现响应式导航栏效果
2015/12/28 Javascript
学习javascript文件加载优化
2016/02/19 Javascript
js实现select二级联动下拉菜单
2020/04/17 Javascript
jQuery事件处理的特征(事件命名机制)
2016/08/23 Javascript
Nodejs进阶:核心模块net入门学习与实例讲解
2016/11/21 NodeJs
浅谈javascript中的事件冒泡和事件捕获
2016/12/28 Javascript
详解在 Angular 项目中添加 clean-blog 模板
2017/07/04 Javascript
JavaScript使用atan2来绘制箭头和曲线的实例
2017/09/14 Javascript
解决vue项目中页面调用数据 在数据加载完毕之前出现undefined问题
2019/11/14 Javascript
[59:48]DOTA2-DPC中国联赛 正赛 VG vs Magma BO3 第一场 1月26日
2021/03/11 DOTA
python bottle框架支持jquery ajax的RESTful风格的PUT和DELETE方法
2017/05/24 Python
Scrapy抓取京东商品、豆瓣电影及代码分享
2017/11/23 Python
python 爬虫一键爬取 淘宝天猫宝贝页面主图颜色图和详情图的教程
2018/05/22 Python
使用Tensorflow实现可视化中间层和卷积层
2020/01/24 Python
Python内置函数property()如何使用
2020/09/01 Python
深入解析HTML5的IndexedDB索引数据库
2015/09/14 HTML / CSS
印尼最大的网上书店:Gramedia.com
2018/09/13 全球购物
动物科学专业毕业生的自我评价
2013/11/29 职场文书
外贸英语专业求职信范文
2013/12/25 职场文书
大学生饮食配送创业计划书
2014/01/04 职场文书
中国好声音华少广告词
2014/03/17 职场文书
大型会议策划方案
2014/05/17 职场文书
房产转让协议书(2014版)
2014/09/30 职场文书
给领导的感谢信范文
2015/01/23 职场文书
人与自然的观后感
2015/06/18 职场文书
使用numpy实现矩阵的翻转(flip)与旋转
2021/06/03 Python
MySQL创建管理子分区
2022/04/13 MySQL