Python 文本文件内容批量抽取实例


Posted in Python onDecember 10, 2018

Python新手编写脚本处理数据,各种心酸各种语法查找,以此留念!

原始数据格式如下图所示:

Python 文本文件内容批量抽取实例

这里是一个人脸测试数据,其中每行第一个为测试图片编号,后面为Top 7图片编号及其对应的评分,即与测试图片的相似度度量结果。我们这里的目的是将每行Top 7对应的评分数据抽取出来,并且将评分第二的数值与一个阈值(这里是0.7)进行比较,超过阈值表示此次测试成功,结果为正样本,记为1,否则置0。并最终将其保存至另一个文本文件用于作为机器学习模型的训练样本数据。

Python脚本处理后的文件格式如下所示:

Python 文本文件内容批量抽取实例

对应的Python代码如下所示,附有小白详细注释。

# -*- coding: cp936 -*-
import re
import linecache
filename = 'face_test_data.txt'
 
with open(filename, 'r') as f:
 line = f.readline()
 while line:
  eachline = line.split()###按行读取文本文件
  #print eachline 返回一个列表,以空格作为元素拆分标识
  #print line 返回的是一整行数据,相当于一个字符串元素
  count = len(eachline)#返回列表长度,即列表元素数目
  n = 0
  element = []#初始化空列表用于存储所需评分数据
  while n < count:
   elem_index = eachline[n:n+1] #类型为列表
   #print elem_index, len(elem_index[0])
   #print elem_index 返回类型为列表
   if len(elem_index[0]) > 24:
    element.append(elem_index[0][25:])
   #element = [qiege(elem_index[n]) for elem_index in eachline]
   n=n+1
  #print element[1] #概率数值列表
  
  if element[1] >= '0.7':
   element.append(1)
   #print '1'
  else:
   element.append(0)
   #print '0'
   
  #生成每行末尾有\t文件
  ''' 
  file = open('preprocess.txt', 'a')
  for i in range(len(element)):
   file.write(str(element[i])+'\t')
  file.write('\n')
  file.close()
  '''
  #生成每行末尾无\t文件,可直接用于np.loadtxt()读取文本生成矩阵数据
  file = open('_preprocess.txt', 'a')
  for i in range(len(element)-1):
   file.write(str(element[i])+'\t')
  file.write(str(element[-1])+'\n')
  #file.write('\n')
  file.close() 
 
  line = f.readline()

以上这篇Python 文本文件内容批量抽取实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python解决Fedora解压zip时中文乱码的方法
Sep 18 Python
apache部署python程序出现503错误的解决方法
Jul 24 Python
Selenium 模拟浏览器动态加载页面的实现方法
May 16 Python
python中使用print输出中文的方法
Jul 16 Python
Python设计模式之解释器模式原理与用法实例分析
Jan 10 Python
Python面向对象之类的定义与继承用法示例
Jan 14 Python
在python中对变量判断是否为None的三种方法总结
Jan 23 Python
对pandas处理json数据的方法详解
Feb 08 Python
Python 可变类型和不可变类型及引用过程解析
Sep 27 Python
python关于倒排列的知识点总结
Oct 13 Python
python实现图片九宫格分割的示例
Apr 25 Python
Django + Taro 前后端分离项目实现企业微信登录功能
Apr 07 Python
Python中作用域的深入讲解
Dec 10 #Python
python实现根据文件关键字进行切分为多个文件的示例
Dec 10 #Python
Python文件常见操作实例分析【读写、遍历】
Dec 10 #Python
一篇文章搞懂Python的类与对象名称空间
Dec 10 #Python
django使用LDAP验证的方法示例
Dec 10 #Python
python在TXT文件中按照某一字符串取出该字符串所在的行方法
Dec 10 #Python
python文件拆分与重组实例
Dec 10 #Python
You might like
JSON在PHP中的应用介绍
2012/09/08 PHP
使用PHP计算两个路径的相对路径
2013/06/14 PHP
PHP中Fatal error session_start()错误解决步骤
2014/08/05 PHP
使用composer命令加载vendor中的第三方类库 的方法
2019/07/09 PHP
JavaScript Distilled 基础知识与函数
2010/04/07 Javascript
HTML中的setCapture和releaseCapture使用介绍
2012/03/21 Javascript
FF火狐下获取一个元素同类型的相邻元素实现代码
2012/12/15 Javascript
javascript避免数字计算精度误差的方法详解
2014/03/05 Javascript
浅析Javascript中“==”与“===”的区别
2014/12/23 Javascript
JavaScript中常见获取元素的方法汇总
2015/03/04 Javascript
15个值得开发人员关注的jQuery开发技巧和心得总结【经典收藏】
2016/05/25 Javascript
用NodeJS实现批量查询地理位置的经纬度接口
2016/08/16 NodeJs
详解js中call与apply关键字的作用
2016/11/21 Javascript
使用node.js中的Buffer类处理二进制数据的方法
2016/11/26 Javascript
基于 Vue.js 2.0 酷炫自适应背景视频登录页面实现方式
2018/01/17 Javascript
vue实现滑动到底部加载更多效果
2020/10/27 Javascript
js 实现 list转换成tree的方法示例(数组到树)
2019/08/18 Javascript
解决vue初始化项目时,一直卡在Project description上的问题
2019/10/31 Javascript
vue $set 给数据赋值的实例
2019/11/09 Javascript
VSCode Vue开发推荐插件和VSCode快捷键(小结)
2020/08/08 Javascript
JavaScript实现无限轮播效果
2020/11/19 Javascript
Python3实现生成随机密码的方法
2014/08/23 Python
Python3结合Dlib实现人脸识别和剪切
2018/01/24 Python
python学生信息管理系统(初级版)
2018/10/17 Python
解决python 3 urllib 没有 urlencode 属性的问题
2019/08/22 Python
在django中自定义字段Field详解
2019/12/03 Python
Matplotlib 折线图plot()所有用法详解
2020/07/28 Python
英国电信商店:BT Shop
2019/12/17 全球购物
英国顶尖手表珠宝品牌独家授权经销商:HS Johnson
2020/10/28 全球购物
网吧最新创业计划书范文
2014/03/27 职场文书
抗震救灾标语
2014/06/26 职场文书
学校领导班子四风对照检查材料
2014/09/27 职场文书
处罚决定书范文
2015/06/24 职场文书
咖啡厅里的创业计划书
2019/08/21 职场文书
创业计划书之暑假培训班
2019/11/09 职场文书
Vue3中的Refs和Ref详情
2021/11/11 Vue.js