通过Pandas读取大文件的实例


Posted in Python onJune 07, 2018

当数据文件过大时,由于计算机内存有限,需要对大文件进行分块读取:

import pandas as pd
f = open('E:/学习相关/Python/数据样例/用户侧数据/test数据.csv')
reader = pd.read_csv(f, sep=',', iterator=True)
loop = True
chunkSize = 100000
chunks = []
while loop:
 try:
 chunk = reader.get_chunk(chunkSize)
 chunks.append(chunk)
 except StopIteration:
 loop = False
 print("Iteration is stopped.")
df = pd.concat(chunks, ignore_index=True)
print(df)

read_csv()函数的iterator参数等于True时,表示返回一个TextParser以便逐块读取文件;

chunkSize表示文件块的大小,用于迭代;

TextParser类的get_chunk方法用于读取任意大小的文件块;

StopIteration的异常表示在循环对象穷尽所有元素时报错;

concat()函数用于将数据做轴向连接:

pd.concat(objs, axis=0, join='outer', join_axes=None, ignore_index=False, keys=None, levels=None, names=None, Verify_integrity=False)

常用参数:

objs:Series,DataFrame或者是Panel构成的序列list;

axis:需要合并连接的轴,0是行,1是列;

join:连接的参数,inner或outer;

ignore=True表示重建索引。

以上这篇通过Pandas读取大文件的实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python文件读写操作与linux shell变量命令交互执行的方法
Jan 14 Python
Python合并多个装饰器小技巧
Apr 28 Python
python常用函数详解
Sep 13 Python
python爬虫框架scrapy实战之爬取京东商城进阶篇
Apr 24 Python
Python计算两个日期相差天数的方法示例
May 23 Python
Python实现确认字符串是否包含指定字符串的实例
May 02 Python
Python之使用adb shell命令启动应用的方法详解
Jan 07 Python
Python自动化运维之Ansible定义主机与组规则操作详解
Jun 13 Python
python爬虫 线程池创建并获取文件代码实例
Sep 28 Python
python字符串下标与切片及使用方法
Feb 13 Python
Python用5行代码实现批量抠图的示例代码
Apr 14 Python
python字符串的多行输出的实例详解
Jun 08 Python
Pandas:DataFrame对象的基础操作方法
Jun 07 #Python
Python中偏函数用法示例
Jun 07 #Python
网红编程语言Python将纳入高考你怎么看?
Jun 07 #Python
python指定写入文件时的编码格式方法
Jun 07 #Python
Python实现的爬虫刷回复功能示例
Jun 07 #Python
异步任务队列Celery在Django中的使用方法
Jun 07 #Python
浅谈python中对于json写入txt文件的编码问题
Jun 07 #Python
You might like
解析如何用php screw加密php源代码
2013/06/20 PHP
php生成二维码不保存服务器还有下载功能的实现代码
2018/08/09 PHP
JavaScript中的Array对象使用说明
2011/01/17 Javascript
『jQuery』取指定url格式及分割函数应用
2013/04/22 Javascript
js调用css属性写法
2013/09/21 Javascript
JS保留两位小数 四舍五入函数的小例子
2013/11/20 Javascript
jquery禁用右键单击功能屏蔽F5刷新
2014/03/17 Javascript
ActiveX控件与Javascript之间的交互示例
2014/06/04 Javascript
jQuery Ajax()方法使用指南
2014/11/19 Javascript
基于javascript实现简单的抽奖系统
2020/04/15 Javascript
jQuery获取table行数并输出单元格内容的实现方法
2016/06/30 Javascript
js实现文字超出部分用省略号代替实例代码
2016/09/01 Javascript
JQuery实现文字无缝滚动效果示例代码(Marquee插件)
2017/03/07 Javascript
详解javascript appendChild()的完整功能
2018/08/18 Javascript
小程序开发基础之view视图容器
2018/08/21 Javascript
分享vue里swiper的一些坑
2018/08/30 Javascript
vue中接口域名配置为全局变量的实现方法
2018/09/20 Javascript
细说Vue组件的服务器端渲染的过程
2019/05/30 Javascript
微信小程序以7天为周期连续签到7天功能效果的示例代码
2020/08/20 Javascript
解决vue2中使用elementUi打包报错的问题
2020/09/22 Javascript
JavaScript实现商品评价五星好评
2020/11/30 Javascript
python re模块findall()函数实例解析
2018/01/19 Python
Python操作mongodb的9个步骤
2018/06/04 Python
python开发准备工作之配置虚拟环境(非常重要)
2019/02/11 Python
实例讲解Python中浮点型的基本内容
2019/02/11 Python
Java Unsafe类实现原理及测试代码
2020/09/15 Python
python中K-means算法基础知识点
2021/01/25 Python
工地门卫岗位职责
2013/12/30 职场文书
幼儿教育感言
2014/02/05 职场文书
会计电算化应届生自荐信
2014/02/25 职场文书
舞蹈毕业生的自我评价
2014/03/05 职场文书
2014年医学生毕业自我鉴定
2014/03/26 职场文书
小学雷锋月活动总结
2014/07/03 职场文书
贫民窟的百万富翁观后感
2015/06/09 职场文书
vue3使用vue-router的完整步骤记录
2021/06/20 Vue.js
vue中 this.$set的使用详解
2021/11/17 Vue.js