python读取文本中数据并转化为DataFrame的实例


Posted in Python onApril 10, 2018

在技术问答中看到一个这样的问题,感觉相对比较常见,就单开一篇文章写下来。

从纯文本格式文件 “file_in”中读取数据,格式如下:

python读取文本中数据并转化为DataFrame的实例

需要输出成“file_out”,格式如下:

python读取文本中数据并转化为DataFrame的实例

数据的原格式是“类别:内容”,以空行“\n”为分条目,转换后变成一个条目一行,按照类别顺序依次写出内容。

建议读取后,使用pandas,把数据建立称DataFrame的表格。这样方便以后处理数据。但是原格式并不是通常的表格格式,所以要先做一些简单的处理。

#coding:utf8
import sys
from pandas import DataFrame  #DataFrame通常来装二维的表格
import pandas as pd      #pandas是流行的做数据分析的包
#建立字典,键和值都从文件里读出来。键是nam,age……,值是lili,jim……
dict_data={}
#打开文件
with open('file_in.txt','r')as df:
  #读每一行
  for line in df:
    #如果这行是换行符就跳过,这里用'\n'的长度来找空行
    if line.count('\n') == len(line):
      continue
    #对每行清除前后空格(如果有的话),然后用":"分割
    for kv in [line.strip().split(':')]:
      #按照键,把值写进去
      dict_data.setdefault(kv[0],[]).append(kv[1])
#print(dict_data)看看效果
#这是把键读出来成为一个列表
columnsname=list(dict_data.keys())
#建立一个DataFrame,列名即为键名,也就是nam,age……
frame = DataFrame(dict_data,columns=columnsname)
#把DataFrame输出到一个表,不要行名字和列名字
frame.to_csv('file_out0.txt',index=False,header=False)

以上这篇python读取文本中数据并转化为DataFrame的实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python中实现从目录中过滤出指定文件类型的文件
Feb 02 Python
对numpy中布尔型数组的处理方法详解
Apr 17 Python
Python数据持久化shelve模块用法分析
Jun 29 Python
python使用参数对嵌套字典进行取值的方法
Apr 26 Python
python2 中 unicode 和 str 之间的转换及与python3 str 的区别
Jul 25 Python
python3实现elasticsearch批量更新数据
Dec 03 Python
opencv-python 读取图像并转换颜色空间实例
Dec 09 Python
django admin 根据choice字段选择的不同来显示不同的页面方式
May 13 Python
学会python自动收发邮件 代替你问候女友
May 20 Python
如何使用python写截屏小工具
Sep 29 Python
django使用多个数据库的方法实例
Mar 04 Python
python自动化调用百度api解决验证码
Apr 13 Python
python实现百度语音识别api
Apr 10 #Python
Python Selenium Cookie 绕过验证码实现登录示例代码
Apr 10 #Python
浅谈pandas中Dataframe的查询方法([], loc, iloc, at, iat, ix)
Apr 10 #Python
python pandas dataframe 行列选择,切片操作方法
Apr 10 #Python
python3下实现搜狗AI API的代码示例
Apr 10 #Python
Python基于pycrypto实现的AES加密和解密算法示例
Apr 10 #Python
浅谈Pandas中map, applymap and apply的区别
Apr 10 #Python
You might like
PHP中限制IP段访问、禁止IP提交表单的代码
2011/04/23 PHP
php导入导出excel实例
2013/10/25 PHP
ThinkPHP单字母函数(快捷方法)使用总结
2014/07/23 PHP
PHP防盗链代码实例
2014/08/27 PHP
thinkphp的静态缓存用法分析
2014/11/29 PHP
jQuery Mobile + PHP实现文件上传
2014/12/12 PHP
PHP实现的字符串匹配算法示例【sunday算法】
2017/12/19 PHP
PHP正则之正向预查与反向预查讲解与实例
2020/04/06 PHP
如何简单地用YUI做JavaScript动画
2007/03/10 Javascript
js判断ie版本号的简单实现代码
2014/03/05 Javascript
jquery动态添加元素事件失效问题解决方法
2014/05/23 Javascript
5款JavaScript代码压缩工具推荐
2014/07/07 Javascript
JavaScript实现从数组中选出和等于固定值的n个数
2014/09/03 Javascript
jQuery实现的瀑布流加载效果示例
2016/09/13 Javascript
常用js,css文件统一加载方法(推荐) 并在加载之后调用回调函数
2016/09/23 Javascript
在vue中获取token,并将token写进header的方法
2018/09/26 Javascript
vue中通过使用$attrs实现组件之间的数据传递功能
2019/09/01 Javascript
Vue中watch、computed、updated三者的区别及用法
2020/07/27 Javascript
Vue+Bootstrap实现简易学生管理系统
2021/02/09 Vue.js
[03:56]显微镜下的DOTA2第十一期——鬼畜的死亡先知播音员
2014/06/23 DOTA
[03:24]CDEC.Y赛前采访 努力备战2016国际邀请赛中国区预选赛
2016/06/25 DOTA
[46:55]完美世界DOTA2联赛决赛 FTD vs Phoenix 第三场 11.08
2020/11/11 DOTA
Python的ORM框架SQLAlchemy入门教程
2014/04/28 Python
python 3.6 tkinter+urllib+json实现火车车次信息查询功能
2017/12/20 Python
Python面向对象之类的内置attr属性示例
2018/12/14 Python
python 通过邮件控制实现远程控制电脑操作
2020/03/16 Python
python如何变换环境
2020/07/21 Python
django创建css文件夹的具体方法
2020/07/31 Python
通过代码实例了解Python3编程技巧
2020/10/13 Python
匡威帆布鞋美国官网:Converse美国
2016/08/22 全球购物
软件生产职位结构化面试主要考察要素及面试题库
2015/06/12 面试题
node中使用shell脚本的方法步骤
2021/03/23 Javascript
分公司总经理岗位职责
2014/07/30 职场文书
MySQL不使用order by实现排名的三种思路总结
2021/06/02 MySQL
Opencv中cv2.floodFill算法的使用
2021/06/18 Python
Python下载商品数据并连接数据库且保存数据
2022/03/31 Python