pandas string转dataframe的方法


Posted in Python onApril 11, 2018

今天业务上碰到用pandas处理一个大文件的内存不够问题,需要做concat 合并多个文件,每个文件数据在1.4亿行左右。当时第一反应是把dataframe分割成多块小文件处理,后面发现即使pandas内存问题解决了,用pickle做保存数据时也会提升内存不够的报错,后来把dataframe对象转化成string,发现内存占用减少了近一半。

所以打算用先转成string再dump到离线文件里,官网文档上只有to_string的说明,而从string转dataframe却没有提供直接的函数。

其实很简单,我们可以把string放到一个文件对象里,然后通过read_csv函数来创建dataframe对象。

import sys
if sys.version_info[0] < 3:
from StringIO import StringIO
else:
from io import StringIO
import pandas as pd
TESTDATA=StringIO("""col1;col2;col3
1;4.4;99
2;4.5;200
3;4.7;65
4;3.2;140
""")
df = pd.read_csv(TESTDATA, sep=";")

以上这篇pandas string转dataframe的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
使用Python的PEAK来适配协议的教程
Apr 14 Python
在Python中处理字符串之isdigit()方法的使用
May 18 Python
在Django中进行用户注册和邮箱验证的方法
May 09 Python
通过Py2exe将自己的python程序打包成.exe/.app的方法
May 26 Python
win7 x64系统中安装Scrapy的方法
Nov 18 Python
PYTHON绘制雷达图代码实例
Oct 15 Python
python保存log日志,实现用log日志画图
Dec 24 Python
Python如何通过Flask-Mail发送电子邮件
Jan 29 Python
基于logstash实现日志文件同步elasticsearch
Aug 06 Python
Python实现简单的猜单词小游戏
Oct 28 Python
python os.listdir()乱码解决方案
Jan 31 Python
用python实现监控视频人数统计
May 21 Python
Python实现统计给定列表中指定数字出现次数的方法
Apr 11 #Python
DataFrame中的object转换成float的方法
Apr 10 #Python
pandas object格式转float64格式的方法
Apr 10 #Python
python 处理dataframe中的时间字段方法
Apr 10 #Python
python调用API实现智能回复机器人
Apr 10 #Python
python读取文本中数据并转化为DataFrame的实例
Apr 10 #Python
python实现百度语音识别api
Apr 10 #Python
You might like
php通过array_merge()函数合并关联和非关联数组的方法
2015/03/18 PHP
php链表用法实例分析
2015/07/09 PHP
PHP下载远程图片并保存到本地方法总结
2016/01/22 PHP
php上传后台无法收到数据解决方法
2019/10/28 PHP
JS 动态获取节点代码innerHTML分析 [IE,FF]
2009/11/30 Javascript
javascript 实用的文字链提示框效果
2010/06/30 Javascript
25个优雅的jQuery Tooltip插件推荐
2011/05/25 Javascript
jquery remove方法应用详解
2012/11/22 Javascript
jQuery 选择器详解
2015/01/19 Javascript
JQuery中基础过滤选择器用法实例分析
2015/05/18 Javascript
JS读写CSS样式的方法汇总
2016/08/16 Javascript
浅谈vue项目优化之页面的按需加载(vue+webpack)
2017/12/11 Javascript
es6 for循环中let和var区别详解
2020/01/12 Javascript
在Vue中使用Echarts实例图的方法实例
2020/10/10 Javascript
利用JavaScript模拟京东按键输入功能
2020/12/01 Javascript
Python多线程经典问题之乘客做公交车算法实例
2017/03/22 Python
python 容器总结整理
2017/04/04 Python
python中print()函数的“,”与java中System.out.print()函数中的“+”功能详解
2017/11/24 Python
Python实现类似比特币的加密货币区块链的创建与交易实例
2018/03/20 Python
基于python实现百度翻译功能
2019/05/09 Python
python3.7 的新特性详解
2019/07/25 Python
Python Django view 两种return的实现方式
2020/03/16 Python
python 引用传递和值传递详解(实参,形参)
2020/06/05 Python
python和JavaScript哪个容易上手
2020/06/23 Python
详解Anaconda安装tensorflow报错问题解决方法
2020/11/01 Python
解决python3.6用cx_Oracle库连接Oracle的问题
2020/12/07 Python
Mountain Warehouse澳大利亚官网:欧洲家庭户外品牌倡导者
2016/11/20 全球购物
土木工程个人自荐信范文
2013/11/30 职场文书
水利公司纪检监察自我鉴定
2014/02/25 职场文书
愚人节活动策划方案
2014/03/11 职场文书
对公司合理化的建议书
2014/03/12 职场文书
大型活动组织方案
2014/05/10 职场文书
单位政审意见范文
2015/06/04 职场文书
导游词之镜泊湖
2019/12/09 职场文书
python如何在word中存储本地图片
2021/04/07 Python
python 命令行传参方法总结
2021/05/25 Python