使用Python提取文本中含有特定字符串的方法示例


Posted in Python onDecember 09, 2020

今天搞了一天的文本处理,发现python真的太适合做数据处理了。废话不多说,一起学习吧!

1.我的原始数据是这样的,如图

使用Python提取文本中含有特定字符串的方法示例

2.如果要提取每行含有pass的字符串,代码如下:

import re

filepath = "E:/untitled1/analyze_log/test.log"
txt = open(filepath, "r").read()

result=""
test_text = re.findall("..............+pass", txt)#取出每行含有pass的文本
result = result +'\n'.join(test_text)#换行输出
print(result)

3.执行上面代码,可以取出每行含有pass的文本,如图:

使用Python提取文本中含有特定字符串的方法示例

4.其实我真正要提取的是每行类似上图红色框内的字符串,代码实现如下:

import re

filepath = "E:/untitled1/analyze_log/test.log"
txt = open(filepath, "r").read()

result=""
test_text = re.findall("..............+pass", txt)#取出每行含有pass的文本
result = result +'\n'.join(test_text)#换行输出
del_num = re.sub("\d+ ", "", result)#去掉每行行首的数字
del_awake = del_num.replace("awake", "")#去掉awake
del_commd = del_awake.replace("commd", "")#去掉commd
del_string1 = re.sub("-a+\d\d\d\d-\d.wav", "", del_commd)#去掉-a0023-1.wav类型的字符串
del_string2 = re.sub("-a+\d\d\d\d.wav", "", del_string1)#去掉-a0016.wav类型的字符串
print(del_string2)

5.执行上面代码,可以取出最后我需要的文本,如图:

使用Python提取文本中含有特定字符串的方法示例

6.拓展

使用Python提取文本中含有特定字符串的方法示例

7.示例代码

import re

str = 'Hello123/World 45_?6bye'
result1 = re.findall('\d',str)#\d匹配任何十进制数
result2 = re.findall('\d+',str)#\d+可匹配一位或多位数字使用
result3 = re.findall('\D',str)#\d匹配非数字字符任何十进制数
result4 = re.findall('\w',str)#\w匹配任何字母数字字符,包括下划线在内
result5 = re.findall('\W',str)#\W匹配非任何字母数字字符,包括下划线在内
result6 = re.findall('\s',str)#\s匹配任何空白字符
result7 = re.findall('\S',str)#\S匹配非任何空白字符
result8 = re.findall('\AHello',str)#\A仅匹配字符串开头
result9 = re.findall('bye\Z',str)#\Z仅匹配字符串结尾
print(result1)
print(result2)
print(result3)
print(result4)
print(result5)
print(result6)
print(result7)
print(result8)
print(result9)

接下来会更几篇关于文本处理的博客,一边学习一边记笔记。加油!

到此这篇关于使用Python提取文本中含有特定字符串的文章就介绍到这了,更多相关Python提取文本特定字符串内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
python简单程序读取串口信息的方法
Mar 13 Python
Python selenium如何设置等待时间
Sep 15 Python
在ubuntu16.04中将python3设置为默认的命令写法
Oct 31 Python
Python之lambda匿名函数及map和filter的用法
Mar 05 Python
Python实现决策树并且使用Graphviz可视化的例子
Aug 09 Python
Django通用类视图实现忘记密码重置密码功能示例
Dec 17 Python
python 定义类时,实现内部方法的互相调用
Dec 25 Python
python在不同条件下的输入与输出
Feb 13 Python
Keras框架中的epoch、bacth、batch size、iteration使用介绍
Jun 10 Python
python语音识别指南终极版(有这一篇足矣)
Sep 09 Python
用Python实现定时备份Mongodb数据并上传到FTP服务器
Jan 27 Python
pandas中DataFrame重置索引的几种方法
May 24 Python
python使用正则表达式匹配txt特定字符串(有换行)
Dec 09 #Python
PyTorch中clone()、detach()及相关扩展详解
Dec 09 #Python
python调用jenkinsAPI构建jenkins,并传递参数的示例
Dec 09 #Python
python excel多行合并的方法
Dec 09 #Python
PyTorch中的拷贝与就地操作详解
Dec 09 #Python
python 调用Google翻译接口的方法
Dec 09 #Python
浅析Python 中的 WSGI 接口和 WSGI 服务的运行
Dec 09 #Python
You might like
基于qmail的完整WEBMAIL解决方案安装详解
2006/10/09 PHP
php实现仿写CodeIgniter的购物车类
2015/07/29 PHP
浅谈PHP中关于foreach使用引用变量的坑
2016/11/14 PHP
php成功操作redis cluster集群的实例教程
2019/01/13 PHP
js 面向对象的技术创建高级 Web 应用程序
2010/02/25 Javascript
JQUERY设置IFRAME的SRC值的代码
2010/11/30 Javascript
js换图片效果可进行定时操作
2014/06/09 Javascript
javascript数组去重的六种方法汇总
2015/08/16 Javascript
jquery中表单 多选框的一种巧妙写法
2015/09/06 Javascript
Javascript数组Array方法解读
2016/03/13 Javascript
PassWord输入框代码分享
2016/06/07 Javascript
javascript鼠标跟随运动3种效果(眼球效果,苹果菜单,方向跟随)
2016/10/27 Javascript
JavaScript中的call和apply的用途以及区别
2017/01/11 Javascript
从零学习node.js之mysql数据库的操作(五)
2017/02/24 Javascript
ES6学习教程之Map的常用方法总结
2017/08/03 Javascript
详解express与koa中间件模式对比
2017/08/07 Javascript
JavaScript工具库之Lodash详解
2019/06/15 Javascript
Js图片点击切换轮播实现代码
2020/07/27 Javascript
[54:28]EG vs OG 2019国际邀请赛小组赛 BO2 第一场 8.16
2019/08/18 DOTA
pandas多级分组实现排序的方法
2018/04/20 Python
python3正则提取字符串里的中文实例
2019/01/31 Python
Python面向对象程序设计之私有属性及私有方法示例
2019/04/08 Python
python 内置函数汇总详解
2019/09/16 Python
python SocketServer源码深入解读
2019/09/17 Python
python获取array中指定元素的示例
2019/11/26 Python
Python HTMLTestRunner测试报告view按钮失效解决方案
2020/05/25 Python
Python正则re模块使用步骤及原理解析
2020/08/18 Python
PyQt5多线程防卡死和多窗口用法的实现
2020/09/15 Python
纯CSS实现聊天框小尖角、气泡效果
2014/04/04 HTML / CSS
Urban Outfitters英国官网:美国平价服饰品牌
2016/11/25 全球购物
计算机应用专业学生的自我评价分享
2013/11/03 职场文书
2014保险公司个人工作总结
2014/12/09 职场文书
2014预防青少年违法犯罪工作总结
2014/12/10 职场文书
中英文求职信范文
2015/03/19 职场文书
风之谷观后感
2015/06/11 职场文书
Python开发简易五子棋小游戏
2022/05/02 Python