python读取文本中数据并转化为DataFrame的实例


Posted in Python onApril 10, 2018

在技术问答中看到一个这样的问题,感觉相对比较常见,就单开一篇文章写下来。

从纯文本格式文件 “file_in”中读取数据,格式如下:

python读取文本中数据并转化为DataFrame的实例

需要输出成“file_out”,格式如下:

python读取文本中数据并转化为DataFrame的实例

数据的原格式是“类别:内容”,以空行“\n”为分条目,转换后变成一个条目一行,按照类别顺序依次写出内容。

建议读取后,使用pandas,把数据建立称DataFrame的表格。这样方便以后处理数据。但是原格式并不是通常的表格格式,所以要先做一些简单的处理。

#coding:utf8
import sys
from pandas import DataFrame  #DataFrame通常来装二维的表格
import pandas as pd      #pandas是流行的做数据分析的包
#建立字典,键和值都从文件里读出来。键是nam,age……,值是lili,jim……
dict_data={}
#打开文件
with open('file_in.txt','r')as df:
  #读每一行
  for line in df:
    #如果这行是换行符就跳过,这里用'\n'的长度来找空行
    if line.count('\n') == len(line):
      continue
    #对每行清除前后空格(如果有的话),然后用":"分割
    for kv in [line.strip().split(':')]:
      #按照键,把值写进去
      dict_data.setdefault(kv[0],[]).append(kv[1])
#print(dict_data)看看效果
#这是把键读出来成为一个列表
columnsname=list(dict_data.keys())
#建立一个DataFrame,列名即为键名,也就是nam,age……
frame = DataFrame(dict_data,columns=columnsname)
#把DataFrame输出到一个表,不要行名字和列名字
frame.to_csv('file_out0.txt',index=False,header=False)

以上这篇python读取文本中数据并转化为DataFrame的实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python三元运算实现方法
Jan 12 Python
CentOS 7下Python 2.7升级至Python3.6.1的实战教程
Jul 06 Python
详解Django解决ajax跨域访问问题
Aug 24 Python
python实现归并排序算法
Nov 22 Python
对Python多线程读写文件加锁的实例详解
Jan 14 Python
Django页面数据的缓存与使用的具体方法
Apr 23 Python
Python进度条的制作代码实例
Aug 31 Python
Pycharm和Idea支持的vim插件的方法
Feb 21 Python
Python pathlib模块使用方法及实例解析
Oct 05 Python
python实现粒子群算法
Oct 15 Python
使用Python提取文本中含有特定字符串的方法示例
Dec 09 Python
python中requests库+xpath+lxml简单使用
Apr 29 Python
python实现百度语音识别api
Apr 10 #Python
Python Selenium Cookie 绕过验证码实现登录示例代码
Apr 10 #Python
浅谈pandas中Dataframe的查询方法([], loc, iloc, at, iat, ix)
Apr 10 #Python
python pandas dataframe 行列选择,切片操作方法
Apr 10 #Python
python3下实现搜狗AI API的代码示例
Apr 10 #Python
Python基于pycrypto实现的AES加密和解密算法示例
Apr 10 #Python
浅谈Pandas中map, applymap and apply的区别
Apr 10 #Python
You might like
PHP5+UTF8多文件上传类
2008/10/17 PHP
用php随机生成福彩双色球号码的2种方法
2013/02/04 PHP
php数组转成json格式的方法
2015/03/09 PHP
Laravel 5 框架入门(四)完结篇
2015/04/09 PHP
简单谈谈PHP中的include、include_once、require以及require_once语句
2016/04/23 PHP
php反射类ReflectionClass用法分析
2016/05/12 PHP
PHP将字符串首字母大小写转换的实例
2017/01/21 PHP
在laravel中使用Symfony的Crawler组件分析HTML
2017/06/19 PHP
PHP中rename()函数的妙用讲解
2019/02/28 PHP
laravel-admin 管理平台获取当前登陆用户信息的例子
2019/10/08 PHP
jquery动态加载js三种方法实例
2013/08/03 Javascript
jquery的选择器的使用技巧之如何选择input框
2013/09/22 Javascript
深入理解javascript动态插入技术
2013/11/12 Javascript
jquery弹出层类代码分享
2013/12/27 Javascript
iframe的onreadystatechange事件在firefox下的使用
2014/04/16 Javascript
仿淘宝TAB切换搜索框搜索切换的相关内容
2014/09/21 Javascript
jquery+html5制作超酷的圆盘时钟表
2015/04/14 Javascript
解决jquery实现的radio重新选中的问题
2015/07/03 Javascript
JS实现转动随机数抽奖特效代码
2020/04/16 Javascript
实例剖析AngularJS框架中数据的双向绑定运用
2016/03/04 Javascript
jQuery ajax方法传递中文时出现中文乱码的解决方法
2016/07/25 Javascript
Vue props中Object和Array设置默认值操作
2020/07/30 Javascript
js实现点击上传图片并设为模糊背景
2020/08/02 Javascript
Vue使用v-viewer实现图片预览
2020/10/21 Javascript
[47:38]Optic vs VGJ.S 2018国际邀请赛小组赛BO2 第二场 8.17
2018/08/20 DOTA
PyTorch上搭建简单神经网络实现回归和分类的示例
2018/04/28 Python
详解HTML5如何使用可选样式表为网站或应用添加黑暗模式
2020/04/07 HTML / CSS
CHARLES & KEITH英国官网:新加坡时尚品牌
2018/07/04 全球购物
澳大利亚运动鞋商店:Platypus Shoes
2019/09/27 全球购物
法学个人求职信范文
2014/01/27 职场文书
医药营销个人求职信
2014/04/12 职场文书
先进工作者推荐材料
2014/12/23 职场文书
简历自我评价优缺点
2015/03/11 职场文书
面试复试通知单
2015/04/24 职场文书
java后台调用接口及处理跨域问题的解决
2022/03/24 Java/Android
JavaScript中reduce()的用法
2022/05/11 Javascript