Python Pandas批量读取csv文件到dataframe的方法


Posted in Python onOctober 08, 2018

PYTHON Pandas批量读取csv文件到DATAFRAME

Python Pandas批量读取csv文件到dataframe的方法

首先使用glob.glob获得文件路径。然后定义一个列表,读取文件后再使用concat合并读取到的数据。

#读取数据
import pandas as pd
import numpy as np
import glob,os
path=r'e:\tj\month\fx1806'
file=glob.glob(os.path.join(path, "zq*.xls"))
print(file)
dl= []
for f in file:
 dl.append(pd.read_excel(f,header=[0,1],index_col=None))
df=pd.concat(dl)

下面看下Python使用pandas处理CSV文件的方法

Python中有许多方便的库可以用来进行数据处理,尤其是Numpy和Pandas,再搭配matplot画图专用模块,功能十分强大。

CSV(Comma-Separated Values)格式的文件是指以纯文本形式存储的表格数据,这意味着不能简单的使用Excel表格工具进行处理,而且Excel表格处理的数据量十分有限,而使用Pandas来处理数据量巨大的CSV文件就容易的多了。

我用到的是自己用其他硬件工具抓取得数据,硬件环境是在Linux平台上搭建的,当时数据是在运行脚本后直接输出在terminal里的,数据量十分庞大,为了保存获得的数据,在Linux下使用了数据流重定向,把数据全部保存到了文本文件中,形成了一个本地csv文件。

Pandas读取本地CSV文件并设置Dataframe(数据格式)

import pandas as pd
import numpy as np
df=pd.read_csv('filename',header=None,sep=' ') #filename可以直接从盘符开始,标明每一级的文件夹直到csv文件,header=None表示头部为空,sep=' '表示数据间使用空格作为分隔符,如果分隔符是逗号,只需换成 ‘,'即可。
print df.head()
print df.tail()
#作为示例,输出CSV文件的前5行和最后5行,这是pandas默认的输出5行,可以根据需要自己设定输出几行的值

Python Pandas批量读取csv文件到dataframe的方法

图片中显示了我本地数据的前5行与最后5行,最前面一列没有标号的是行号,数据一共有13列,标号从0到12,一行显示不完全,在第9列以后换了行,并且用反斜杠“\”标注了出来。

2017年4月28日更新

使用pandas直接读取本地的csv文件后,csv文件的列索引默认为从0开始的数字,重定义列索引的语句如下:

import pandas as pd
import numpy as np
df=pd.read_csv('filename',header=None,sep=' ',names=["week",'month','date','time','year','name1','freq1','name2','freq2','name3','data1','name4','data2'])
print df1234

此时打印出的文件信息如下,列索引已经被重命名:

Python Pandas批量读取csv文件到dataframe的方法

总结

以上所述是小编给大家介绍的Python Pandas批量读取csv文件到dataframe的方法,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对三水点靠木网站的支持!

Python 相关文章推荐
vc6编写python扩展的方法分享
Jan 17 Python
python实现定时同步本机与北京时间的方法
Mar 24 Python
简单谈谈python中的Queue与多进程
Aug 25 Python
python自动重试第三方包retrying模块的方法
Apr 24 Python
Python访问MongoDB,并且转换成Dataframe的方法
Oct 15 Python
python实现雪花飘落效果实例讲解
Jun 18 Python
django做form表单的数据验证过程详解
Jul 26 Python
将Python文件打包成.EXE可执行文件的方法
Aug 11 Python
python实现12306登录并保存cookie的方法示例
Dec 17 Python
python连接mongodb集群方法详解
Feb 13 Python
浅谈django 模型类使用save()方法的好处与注意事项
Mar 28 Python
python中pyqtgraph知识点总结
Jan 26 Python
Python中的函数式编程:不可变的数据结构
Oct 08 #Python
详解多线程Django程序耗尽数据库连接的问题
Oct 08 #Python
JSON文件及Python对JSON文件的读写操作
Oct 07 #Python
Python实现登陆文件验证方法
Oct 06 #Python
python对日志进行处理的实例代码
Oct 06 #Python
浅析Python函数式编程
Oct 06 #Python
Python实现iOS自动化打包详解步骤
Oct 03 #Python
You might like
PHP的历史和优缺点
2006/10/09 PHP
php mysql数据库操作类
2008/06/04 PHP
php源码之将图片转化为data/base64数据流实例详解
2016/11/27 PHP
php实现PDO中捕获SQL语句错误的方法
2017/02/16 PHP
javascript firefox兼容ie的dom方法脚本
2008/05/18 Javascript
比较简单的异步加载JS文件的代码
2009/07/18 Javascript
jquery DIV撑大让滚动条滚到最底部代码
2013/06/06 Javascript
jQuery的ready方法详解
2014/11/27 Javascript
jquery 动态合并单元格的实现方法
2016/08/26 Javascript
js继承实现方法详解
2016/12/16 Javascript
Angular.js中ng-include用法及多标签页面的实现方式详解
2017/05/07 Javascript
JavaScript命名空间模式实例详解
2019/06/20 Javascript
JavaScript canvas基于数组生成柱状图代码实例
2020/03/06 Javascript
Python实现图像几何变换
2015/07/06 Python
python 多个参数不为空校验方法
2019/02/14 Python
Python完成毫秒级抢淘宝大单功能
2019/06/06 Python
Python代码太长换行的实现
2019/07/05 Python
通过python连接Linux命令行代码实例
2020/02/18 Python
Pycharm及python安装详细教程(图解)
2020/07/31 Python
关于python tushare Tkinter构建的简单股票可视化查询系统(Beta v0.13)
2020/10/19 Python
python 实现倒计时功能(gui界面)
2020/11/11 Python
HTML5梦幻之旅——炫丽的流星雨效果实现过程
2013/08/06 HTML / CSS
html5小程序飞入购物车(抛物线绘制运动轨迹点)
2020/10/19 HTML / CSS
关于webview适配H5上传照片或者视频文件的方法
2020/11/04 HTML / CSS
《理想》教学反思
2014/02/17 职场文书
安全生产月演讲稿
2014/05/09 职场文书
公司年终奖分配方案
2014/06/16 职场文书
学校花圃的标语
2014/06/18 职场文书
无保留意见审计报告
2015/06/05 职场文书
闪闪的红星观后感
2015/06/08 职场文书
四则混合运算教学反思
2016/02/23 职场文书
告诉你创业计划书的8个实用技巧
2019/07/12 职场文书
关于拾金不昧的感谢信(五篇)
2019/10/18 职场文书
Navicat连接MySQL错误描述分析
2021/06/02 MySQL
MySQL的Query Cache图文详解
2021/07/01 MySQL
分析SQL窗口函数之聚合窗口函数
2022/04/21 Oracle