通过Pandas读取大文件的实例


Posted in Python onJune 07, 2018

当数据文件过大时,由于计算机内存有限,需要对大文件进行分块读取:

import pandas as pd
f = open('E:/学习相关/Python/数据样例/用户侧数据/test数据.csv')
reader = pd.read_csv(f, sep=',', iterator=True)
loop = True
chunkSize = 100000
chunks = []
while loop:
 try:
 chunk = reader.get_chunk(chunkSize)
 chunks.append(chunk)
 except StopIteration:
 loop = False
 print("Iteration is stopped.")
df = pd.concat(chunks, ignore_index=True)
print(df)

read_csv()函数的iterator参数等于True时,表示返回一个TextParser以便逐块读取文件;

chunkSize表示文件块的大小,用于迭代;

TextParser类的get_chunk方法用于读取任意大小的文件块;

StopIteration的异常表示在循环对象穷尽所有元素时报错;

concat()函数用于将数据做轴向连接:

pd.concat(objs, axis=0, join='outer', join_axes=None, ignore_index=False, keys=None, levels=None, names=None, Verify_integrity=False)

常用参数:

objs:Series,DataFrame或者是Panel构成的序列list;

axis:需要合并连接的轴,0是行,1是列;

join:连接的参数,inner或outer;

ignore=True表示重建索引。

以上这篇通过Pandas读取大文件的实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python模拟登录12306的方法
Dec 30 Python
Python扫描IP段查看指定端口是否开放的方法
Jun 09 Python
使用pandas对两个dataframe进行join的实例
Jun 08 Python
Python 正则表达式匹配字符串中的http链接方法
Dec 25 Python
Python面向对象程序设计中类的定义、实例化、封装及私有变量/方法详解
Feb 28 Python
python画图的函数用法以及技巧
Jun 28 Python
python GUI库图形界面开发之PyQt5状态栏控件QStatusBar详细使用方法实例
Feb 28 Python
PyCharm设置Ipython交互环境和宏快捷键进行数据分析图文详解
Apr 23 Python
pyspark 随机森林的实现
Apr 24 Python
python读取hdfs上的parquet文件方式
Jun 06 Python
Python Web项目Cherrypy使用方法镜像
Nov 05 Python
Python安装使用Scrapy框架
Apr 12 Python
Pandas:DataFrame对象的基础操作方法
Jun 07 #Python
Python中偏函数用法示例
Jun 07 #Python
网红编程语言Python将纳入高考你怎么看?
Jun 07 #Python
python指定写入文件时的编码格式方法
Jun 07 #Python
Python实现的爬虫刷回复功能示例
Jun 07 #Python
异步任务队列Celery在Django中的使用方法
Jun 07 #Python
浅谈python中对于json写入txt文件的编码问题
Jun 07 #Python
You might like
第一个无线电台是由谁发明的
2021/03/01 无线电
无数据库的详细域名查询程序PHP版(4)
2006/10/09 PHP
PHP 远程文件管理,可以给表格排序,遍历目录,时间排序
2009/08/07 PHP
php将文件夹打包成zip文件的简单实现方法
2016/10/04 PHP
PHP设置Cookie的HTTPONLY属性方法
2017/02/09 PHP
Nginx下ThinkPHP5的配置方法详解
2017/08/01 PHP
php在windows环境下获得cpu内存实时使用率(推荐)
2018/02/08 PHP
PHP调用其他文件中的类
2018/04/02 PHP
JavaScript调用Activex控件的事件的实现方法
2010/04/11 Javascript
jQuery EasyUI API 中文文档 - ValidateBox验证框
2011/10/06 Javascript
javascript中xml操作实现代码
2011/11/21 Javascript
jquery等宽输出文字插件使用介绍
2013/09/18 Javascript
jquery日历控件实现方法分享
2014/03/07 Javascript
BOOTSTRAP时间控件显示在模态框下面的bug修复
2015/02/05 Javascript
介绍JavaScript的一个微型模版
2015/06/24 Javascript
js带缩略图的图片轮播效果代码分享
2015/09/14 Javascript
如何学JavaScript?前辈的经验之谈
2016/12/28 Javascript
JS实现移动端实时监听输入框变化的实例代码
2017/04/12 Javascript
详解nodeJS之二进制buffer对象
2017/06/03 NodeJs
select标签设置默认选中的选项方法
2018/03/02 Javascript
vue页面离开后执行函数的实例
2018/03/13 Javascript
MockJs结合json-server模拟后台数据
2020/08/26 Javascript
vue中更改数组中属性,在页面中不生效的解决方法
2019/10/30 Javascript
基于html+css+js实现简易计算器代码实例
2020/02/28 Javascript
python中itertools模块zip_longest函数详解
2018/06/12 Python
Python绘制正余弦函数图像的方法
2018/08/28 Python
Pandas中Series和DataFrame的索引实现
2019/06/27 Python
python multiprocessing多进程变量共享与加锁的实现
2019/10/02 Python
Python接口测试数据库封装实现原理
2020/05/09 Python
Tensorflow tensor 数学运算和逻辑运算方式
2020/06/30 Python
香港太阳眼镜网上商店:SmartBuyGlasses香港
2016/07/22 全球购物
三查三看党性分析材料
2014/02/18 职场文书
国庆节演讲稿
2014/05/27 职场文书
优秀班主任推荐材料
2014/12/17 职场文书
幼儿园教师辞职信
2019/06/21 职场文书
vue中使用mockjs配置和使用方式
2022/04/06 Vue.js