Python 批量读取文件中指定字符的实现


Posted in Python onMarch 06, 2020

1、背景

从指定的NLP生成的文件中读取指定的字符。

2、待读取文件

Python 批量读取文件中指定字符的实现

是以":"作为分隔符的数据,每一行以回车结束。此文件为XXX.train

3、读取每一句中的汉字

...
file_train = os.path.join(rootDir,"data/train/rg_train_"+modle_date+"_"+aiscene+".train") 
with open(file_train, 'r')as fp:
	textlist = fp.readlines()
	for text in textlist:
		if ":" in text:
			L4ID = text.split(":")[-2]
			Msg = text.split(":")[-1]
			if query_start == Msg.strip("\n"):
				print("Msg is in train:",Msg)
...

代码中先获取文件,然后读取每一行,然后以":"作为分隔符。(-1代表倒数第一个,-2代表倒数第二个)

不管是txt文件还是xml文件还是其他的,都可以用这种方法来批量替换文件中字符串:

# -*- coding:utf-8 -*-
__author__ = 'ShawDa'

import glob

xmls = glob.glob('xml_files/*.xml')
for one_xml in xmls:
  print(one_xml)
  f = open(one_xml, 'r+', encoding='utf-8')
  all_the_lines = f.readlines()
  f.seek(0)
  f.truncate()
  for line in all_the_lines:
    line = line.replace('dog', 'pig')
    line = line.replace('cat', 'bike')
    f.write(line)
  f.close()

到此这篇关于Python 批量读取文件中指定字符的实现的文章就介绍到这了,更多相关Python 批量读取指定字符内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
python通过exifread模块获得图片exif信息的方法
Mar 16 Python
Python cookbook(数据结构与算法)将名称映射到序列元素中的方法
Mar 22 Python
python中in在list和dict中查找效率的对比分析
May 04 Python
计算机二级python学习教程(2) python语言基本语法元素
May 16 Python
Python 串口读写的实现方法
Jun 12 Python
python把转列表为集合的方法
Jun 28 Python
Python基础之高级变量类型实例详解
Jan 03 Python
如何使用Cython对python代码进行加密
Jul 08 Python
Python实现JS解密并爬取某音漫客网站
Oct 23 Python
pandas实现导出数据的四种方式
Dec 13 Python
Python答题卡识别并给出分数的实现代码
Jun 22 Python
Python中的socket网络模块介绍
Jul 23 Python
python GUI库图形界面开发之PyQt5布局控件QGridLayout详细使用方法与实例
Mar 06 #Python
python3 xpath和requests应用详解
Mar 06 #Python
python 装饰器功能与用法案例详解
Mar 06 #Python
python GUI库图形界面开发之PyQt5布局控件QVBoxLayout详细使用方法与实例
Mar 06 #Python
利用 Python ElementTree 生成 xml的实例
Mar 06 #Python
Python3 xml.etree.ElementTree支持的XPath语法详解
Mar 06 #Python
python GUI库图形界面开发之PyQt5布局控件QHBoxLayout详细使用方法与实例
Mar 06 #Python
You might like
一致性哈希算法以及其PHP实现详细解析
2013/08/24 PHP
PHP的MVC模式实现原理分析(一相简单的MVC框架范例)
2014/04/29 PHP
php使用fgetcsv读取csv文件出现乱码的解决方法
2014/11/08 PHP
php_imagick实现图片剪切、旋转、锐化、减色或增加特效的方法
2014/12/15 PHP
javascript下有关dom以及xml节点访问兼容问题
2007/11/26 Javascript
Javascript 判断客户端浏览器类型代码
2010/03/01 Javascript
window.open的页面如何刷新(父页面)上层页面
2012/12/28 Javascript
利用javascript实现web页面中指定区域打印
2013/10/30 Javascript
深入理解setTimeout函数和setInterval函数
2016/05/20 Javascript
教你JS中的运算符乘方、开方及变量格式转换
2016/08/09 Javascript
基于vue-cli创建的项目的目录结构及说明介绍
2017/11/23 Javascript
Vue2.5 结合 Element UI 之 Table 和 Pagination 组件实现分页功能
2018/01/26 Javascript
jQuery实现的回车触发按钮事件功能示例
2018/03/25 jQuery
vue.js做一个简单的编辑菜谱功能
2018/05/08 Javascript
vue-cli3全面配置详解
2018/11/14 Javascript
加速vue组件渲染之性能优化
2020/04/09 Javascript
vite2.0+vue3移动端项目实战详解
2021/03/03 Vue.js
python数据结构之二叉树的遍历实例
2014/04/29 Python
python socket 超时设置 errno 10054
2014/07/01 Python
Python3基础之list列表实例解析
2014/08/13 Python
在Django框架中编写Contact表单的教程
2015/07/17 Python
Python获取央视节目单的实现代码
2015/07/25 Python
使用Python对Excel进行读写操作
2017/03/30 Python
python numpy数组的索引和切片的操作方法
2018/10/20 Python
pandas修改DataFrame列名的实现方法
2019/02/22 Python
Python如何实现强制数据类型转换
2019/11/22 Python
Python命令行参数定义及需要注意的地方
2020/11/30 Python
HTML5实现移动端复制功能
2018/04/19 HTML / CSS
法制报告会主持词
2014/04/02 职场文书
公务员上班玩游戏检讨书
2014/09/17 职场文书
2014年项目经理工作总结
2014/11/24 职场文书
小学音乐教师个人工作总结
2015/02/05 职场文书
同事去世追悼词
2015/06/23 职场文书
请假条应该怎么写?
2019/06/24 职场文书
HashMap实现保存两个key相同的数据
2021/06/30 Java/Android
修改并编译golang源码的操作步骤
2021/07/25 Golang