Python 文本文件内容批量抽取实例


Posted in Python onDecember 10, 2018

Python新手编写脚本处理数据,各种心酸各种语法查找,以此留念!

原始数据格式如下图所示:

Python 文本文件内容批量抽取实例

这里是一个人脸测试数据,其中每行第一个为测试图片编号,后面为Top 7图片编号及其对应的评分,即与测试图片的相似度度量结果。我们这里的目的是将每行Top 7对应的评分数据抽取出来,并且将评分第二的数值与一个阈值(这里是0.7)进行比较,超过阈值表示此次测试成功,结果为正样本,记为1,否则置0。并最终将其保存至另一个文本文件用于作为机器学习模型的训练样本数据。

Python脚本处理后的文件格式如下所示:

Python 文本文件内容批量抽取实例

对应的Python代码如下所示,附有小白详细注释。

# -*- coding: cp936 -*-
import re
import linecache
filename = 'face_test_data.txt'
 
with open(filename, 'r') as f:
 line = f.readline()
 while line:
  eachline = line.split()###按行读取文本文件
  #print eachline 返回一个列表,以空格作为元素拆分标识
  #print line 返回的是一整行数据,相当于一个字符串元素
  count = len(eachline)#返回列表长度,即列表元素数目
  n = 0
  element = []#初始化空列表用于存储所需评分数据
  while n < count:
   elem_index = eachline[n:n+1] #类型为列表
   #print elem_index, len(elem_index[0])
   #print elem_index 返回类型为列表
   if len(elem_index[0]) > 24:
    element.append(elem_index[0][25:])
   #element = [qiege(elem_index[n]) for elem_index in eachline]
   n=n+1
  #print element[1] #概率数值列表
  
  if element[1] >= '0.7':
   element.append(1)
   #print '1'
  else:
   element.append(0)
   #print '0'
   
  #生成每行末尾有\t文件
  ''' 
  file = open('preprocess.txt', 'a')
  for i in range(len(element)):
   file.write(str(element[i])+'\t')
  file.write('\n')
  file.close()
  '''
  #生成每行末尾无\t文件,可直接用于np.loadtxt()读取文本生成矩阵数据
  file = open('_preprocess.txt', 'a')
  for i in range(len(element)-1):
   file.write(str(element[i])+'\t')
  file.write(str(element[-1])+'\n')
  #file.write('\n')
  file.close() 
 
  line = f.readline()

以上这篇Python 文本文件内容批量抽取实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python关键字and和or用法实例
May 28 Python
matplotlib绘制动画代码示例
Jan 02 Python
使用Python通过win32 COM实现Word文档的写入与保存方法
May 08 Python
如何优雅地改进Django中的模板碎片缓存详解
Jul 04 Python
python实现二级登陆菜单及安装过程
Jun 21 Python
Python 控制终端输出文字的实例
Jul 12 Python
利用python读取YUV文件 转RGB 8bit/10bit通用
Dec 09 Python
Django重设Admin密码过程解析
Feb 10 Python
关于tensorflow softmax函数用法解析
Jun 30 Python
通过实例了解python__slots__使用方法
Sep 14 Python
pytorch加载语音类自定义数据集的方法教程
Nov 10 Python
python中delattr删除对象方法的代码分析
Dec 15 Python
Python中作用域的深入讲解
Dec 10 #Python
python实现根据文件关键字进行切分为多个文件的示例
Dec 10 #Python
Python文件常见操作实例分析【读写、遍历】
Dec 10 #Python
一篇文章搞懂Python的类与对象名称空间
Dec 10 #Python
django使用LDAP验证的方法示例
Dec 10 #Python
python在TXT文件中按照某一字符串取出该字符串所在的行方法
Dec 10 #Python
python文件拆分与重组实例
Dec 10 #Python
You might like
一个PHP的String类代码
2010/04/20 PHP
Thinkphp无限级分类代码
2015/11/11 PHP
YII2.0之Activeform表单组件用法实例
2016/01/09 PHP
Laravel validate error处理,ajax,json示例
2019/10/25 PHP
jquery pagination插件实现无刷新分页代码
2009/10/13 Javascript
JavaScript数据类型之基本类型和引用类型的值
2015/04/01 Javascript
jquery自定义表格样式
2015/11/23 Javascript
快速学习jQuery插件 Cookie插件使用方法
2015/12/01 Javascript
基于JavaScript实现弹出框效果
2016/02/19 Javascript
Bootstrap中点击按钮后变灰并显示加载中实例代码
2016/09/23 Javascript
JavaScript 过滤关键字
2017/03/20 Javascript
ES6学习笔记之正则表达式和字符串正则方法分析
2017/04/25 Javascript
React Native实现进度条弹框的示例代码
2017/07/17 Javascript
浅谈Vue初学之props的驼峰命名
2018/07/19 Javascript
Vue列表渲染的示例代码
2018/11/01 Javascript
JS深入学习之数组对象排序操作示例
2020/05/01 Javascript
nodejs中使用worker_threads来创建新的线程的方法
2021/01/22 NodeJs
Python计算三维矢量幅度的方法
2015/06/15 Python
对python添加模块路径的三种方法总结
2018/10/16 Python
python将txt文件读入为np.array的方法
2018/10/30 Python
Django配置文件代码说明
2019/12/04 Python
如何搭建pytorch环境的方法步骤
2020/05/06 Python
Python astype(np.float)函数使用方法解析
2020/06/08 Python
python 爬取腾讯视频评论的实现步骤
2021/02/18 Python
HTML5之SVG 2D入门11—用户交互性(动画)介绍及应用
2013/01/30 HTML / CSS
Under Armour西班牙官网:美国知名的高端功能性运动品牌
2018/12/12 全球购物
英国时尚配饰、珠宝和服装网站:KJ Beckett
2020/01/23 全球购物
J2SDK1.5与J2SDK5.0有什么区别
2012/09/19 面试题
中专生职业生涯规划书范文
2013/12/29 职场文书
咖啡店创业计划书
2014/08/15 职场文书
2015年中学体育教师工作总结
2015/10/23 职场文书
2019年共青团工作条例最新版
2019/11/12 职场文书
Spring Bean的实例化之属性注入源码剖析过程
2021/06/13 Java/Android
python机器学习创建基于规则聊天机器人过程示例详解
2021/11/02 Python
MySQL数据库优化之通过索引解决SQL性能问题
2022/04/10 MySQL
笔记本自带的win11如何跳过联网激活?
2022/04/20 数码科技