pandas string转dataframe的方法


Posted in Python onApril 11, 2018

今天业务上碰到用pandas处理一个大文件的内存不够问题,需要做concat 合并多个文件,每个文件数据在1.4亿行左右。当时第一反应是把dataframe分割成多块小文件处理,后面发现即使pandas内存问题解决了,用pickle做保存数据时也会提升内存不够的报错,后来把dataframe对象转化成string,发现内存占用减少了近一半。

所以打算用先转成string再dump到离线文件里,官网文档上只有to_string的说明,而从string转dataframe却没有提供直接的函数。

其实很简单,我们可以把string放到一个文件对象里,然后通过read_csv函数来创建dataframe对象。

import sys
if sys.version_info[0] < 3:
from StringIO import StringIO
else:
from io import StringIO
import pandas as pd
TESTDATA=StringIO("""col1;col2;col3
1;4.4;99
2;4.5;200
3;4.7;65
4;3.2;140
""")
df = pd.read_csv(TESTDATA, sep=";")

以上这篇pandas string转dataframe的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python序列之list和tuple常用方法以及注意事项
Jan 09 Python
Python解析最简单的验证码
Jan 07 Python
Python cookbook(数据结构与算法)字典相关计算问题示例
Feb 18 Python
CentOS7下python3.7.0安装教程
Jul 30 Python
python 字符串只保留汉字的方法
Nov 16 Python
python 移动图片到另外一个文件夹的实例
Jan 10 Python
Python的Tkinter点击按钮触发事件的例子
Jul 19 Python
Form表单及django的form表单的补充
Jul 25 Python
python基于K-means聚类算法的图像分割
Oct 30 Python
python 申请内存空间,用于创建多维数组的实例
Dec 02 Python
基于K.image_data_format() == 'channels_first' 的理解
Jun 29 Python
Python 列表反转显示的四种方法
Nov 16 Python
Python实现统计给定列表中指定数字出现次数的方法
Apr 11 #Python
DataFrame中的object转换成float的方法
Apr 10 #Python
pandas object格式转float64格式的方法
Apr 10 #Python
python 处理dataframe中的时间字段方法
Apr 10 #Python
python调用API实现智能回复机器人
Apr 10 #Python
python读取文本中数据并转化为DataFrame的实例
Apr 10 #Python
python实现百度语音识别api
Apr 10 #Python
You might like
实例(Smarty+FCKeditor新闻系统)
2007/01/02 PHP
PHP+jQuery实现自动补全功能源码
2013/05/15 PHP
PHP中魔术变量__METHOD__与__FUNCTION__的区别
2014/09/29 PHP
PHP简单判断iPhone、iPad、Android及PC设备的方法
2016/10/11 PHP
thinkphp5 migrate数据库迁移工具
2018/02/20 PHP
Laravel 5.1 框架Blade模板引擎用法实例分析
2020/01/04 PHP
javascript 清除输入框中的数据
2009/04/13 Javascript
Javascript 继承机制实例
2009/08/12 Javascript
Javascript变量函数浅析
2011/09/02 Javascript
extjs关于treePanel+chekBox全部选中以及清空选中问题探讨
2013/04/02 Javascript
AngularJS中取消对HTML片段转义的方法例子
2015/01/04 Javascript
JavaScript插件化开发教程 (三)
2015/01/27 Javascript
PHP+jQuery+Ajax+Mysql如何实现发表心情功能
2015/08/06 Javascript
jquery trigger函数执行两次的解决方法
2016/02/29 Javascript
js仿淘宝和百度文库的评分功能
2016/05/15 Javascript
浅谈angular懒加载的一些坑
2016/08/20 Javascript
JS调用某段SQL语句的方法
2016/10/20 Javascript
简单实现JavaScript图片切换效果
2016/11/28 Javascript
详解js前端代码异常监控
2017/01/11 Javascript
Vue+element-ui 实现表格的分页功能示例
2018/08/18 Javascript
JavaScript实现省市联动效果
2019/11/22 Javascript
OpenLayer3自定义测量控件MeasureTool
2020/09/28 Javascript
如何使用RoughViz可视化Vue.js中的草绘图表
2021/01/30 Vue.js
[12:21]VICI vs TNC (BO3)
2018/06/07 DOTA
Python list操作用法总结
2015/11/10 Python
python实现windows壁纸定期更换功能
2019/01/21 Python
Python异常处理知识点总结
2019/02/18 Python
Python实现在线批量美颜功能过程解析
2020/06/10 Python
PyCharm+Miniconda3安装配置教程详解
2021/02/16 Python
学历公证书范本
2014/04/09 职场文书
2014年化工厂工作总结
2014/11/25 职场文书
个人维稳承诺书
2015/05/04 职场文书
校园广播站开场白
2015/06/01 职场文书
2016幼儿园中班开学寄语
2015/12/03 职场文书
SpringDataJPA实体类关系映射配置方式
2021/12/06 Java/Android
三星 3nm 芯片将于第二季度开始量产
2022/04/29 数码科技