python读取文本中数据并转化为DataFrame的实例


Posted in Python onApril 10, 2018

在技术问答中看到一个这样的问题,感觉相对比较常见,就单开一篇文章写下来。

从纯文本格式文件 “file_in”中读取数据,格式如下:

python读取文本中数据并转化为DataFrame的实例

需要输出成“file_out”,格式如下:

python读取文本中数据并转化为DataFrame的实例

数据的原格式是“类别:内容”,以空行“\n”为分条目,转换后变成一个条目一行,按照类别顺序依次写出内容。

建议读取后,使用pandas,把数据建立称DataFrame的表格。这样方便以后处理数据。但是原格式并不是通常的表格格式,所以要先做一些简单的处理。

#coding:utf8
import sys
from pandas import DataFrame  #DataFrame通常来装二维的表格
import pandas as pd      #pandas是流行的做数据分析的包
#建立字典,键和值都从文件里读出来。键是nam,age……,值是lili,jim……
dict_data={}
#打开文件
with open('file_in.txt','r')as df:
  #读每一行
  for line in df:
    #如果这行是换行符就跳过,这里用'\n'的长度来找空行
    if line.count('\n') == len(line):
      continue
    #对每行清除前后空格(如果有的话),然后用":"分割
    for kv in [line.strip().split(':')]:
      #按照键,把值写进去
      dict_data.setdefault(kv[0],[]).append(kv[1])
#print(dict_data)看看效果
#这是把键读出来成为一个列表
columnsname=list(dict_data.keys())
#建立一个DataFrame,列名即为键名,也就是nam,age……
frame = DataFrame(dict_data,columns=columnsname)
#把DataFrame输出到一个表,不要行名字和列名字
frame.to_csv('file_out0.txt',index=False,header=False)

以上这篇python读取文本中数据并转化为DataFrame的实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python中基本的日期时间处理的学习教程
Oct 16 Python
浅谈python中列表、字符串、字典的常用操作
Sep 19 Python
Python变量赋值的秘密分享
Apr 03 Python
Python PyAutoGUI模块控制鼠标和键盘实现自动化任务详解
Sep 04 Python
Python实现的ftp服务器功能详解【附源码下载】
Jun 26 Python
Python3的高阶函数map,reduce,filter的示例详解
Jul 23 Python
python3多线程知识点总结
Sep 26 Python
python使用 cx_Oracle 模块进行查询操作示例
Nov 28 Python
python使用建议与技巧分享(二)
Aug 17 Python
python基于pygame实现飞机大作战小游戏
Nov 19 Python
Python中过滤字符串列表的方法
Dec 22 Python
Python Pandas模块实现数据的统计分析的方法
Jun 24 Python
python实现百度语音识别api
Apr 10 #Python
Python Selenium Cookie 绕过验证码实现登录示例代码
Apr 10 #Python
浅谈pandas中Dataframe的查询方法([], loc, iloc, at, iat, ix)
Apr 10 #Python
python pandas dataframe 行列选择,切片操作方法
Apr 10 #Python
python3下实现搜狗AI API的代码示例
Apr 10 #Python
Python基于pycrypto实现的AES加密和解密算法示例
Apr 10 #Python
浅谈Pandas中map, applymap and apply的区别
Apr 10 #Python
You might like
PHP 字符串编码截取函数(兼容utf-8和gb2312)
2009/05/02 PHP
关于mysql字符集设置了character_set_client=binary 在gbk情况下会出现表描述是乱码的情况
2013/01/06 PHP
PHP 绘制网站登录首页图片验证码
2016/04/12 PHP
php传值和传引用的区别点总结
2019/11/19 PHP
ThinkPHP5与单元测试PHPUnit使用详解
2020/02/23 PHP
js函数的引用, 关于内存的开销
2012/09/17 Javascript
Javascript 运动中Offset的bug解决方案
2014/12/24 Javascript
jQuery UI插件自定义confirm确认框的方法
2015/03/20 Javascript
JS排序方法(sort,bubble,select,insert)代码汇总
2016/01/30 Javascript
JavaScript实现Base64编码转换
2016/04/23 Javascript
Boostrap实现的登录界面实例代码
2016/10/09 Javascript
ionic实现底部分享功能
2017/05/11 Javascript
Angular2搜索和重置按钮过场动画
2017/05/24 Javascript
easyui下拉框动态级联加载的示例代码
2017/11/29 Javascript
vue.js的computed,filter,get,set的用法及区别详解
2018/03/08 Javascript
AngularJS使用Filter自定义过滤器控制ng-repeat去除重复功能示例
2018/04/21 Javascript
js实现移动端吸顶效果
2020/01/08 Javascript
微信小程序实现二维码签到考勤系统
2020/01/16 Javascript
JS字符串和数组如何实现相互转化
2020/07/02 Javascript
vue实现日历表格(element-ui)
2020/09/24 Javascript
微信小程序对图片进行canvas压缩的方法示例详解
2020/11/12 Javascript
vue-cli 3如何使用vue-bootstrap-datetimepicker日期插件
2021/02/20 Vue.js
跟老齐学Python之玩转字符串(2)更新篇
2014/09/28 Python
django开发之settings.py中变量的全局引用详解
2017/03/29 Python
python中利用队列asyncio.Queue进行通讯详解
2017/09/10 Python
磁盘垃圾文件清理器python代码实现
2020/08/24 Python
Python整数对象实现原理详解
2019/07/01 Python
OpenCV 模板匹配
2019/07/10 Python
Origins加拿大官网:雅诗兰黛集团高端植物护肤品牌
2017/11/19 全球购物
美国价格实惠的在线眼镜网站:Zeelool
2020/12/25 全球购物
社会公德演讲稿
2014/05/20 职场文书
试用期员工工作自我评价
2014/09/10 职场文书
捐书活动倡议书
2015/04/27 职场文书
房贷工资证明范本
2015/06/12 职场文书
500字作文之难忘的同学
2019/12/20 职场文书
Java 常见的限流算法详细分析并实现
2022/04/07 Java/Android