Python Pandas批量读取csv文件到dataframe的方法


Posted in Python onOctober 08, 2018

PYTHON Pandas批量读取csv文件到DATAFRAME

Python Pandas批量读取csv文件到dataframe的方法

首先使用glob.glob获得文件路径。然后定义一个列表,读取文件后再使用concat合并读取到的数据。

#读取数据
import pandas as pd
import numpy as np
import glob,os
path=r'e:\tj\month\fx1806'
file=glob.glob(os.path.join(path, "zq*.xls"))
print(file)
dl= []
for f in file:
 dl.append(pd.read_excel(f,header=[0,1],index_col=None))
df=pd.concat(dl)

下面看下Python使用pandas处理CSV文件的方法

Python中有许多方便的库可以用来进行数据处理,尤其是Numpy和Pandas,再搭配matplot画图专用模块,功能十分强大。

CSV(Comma-Separated Values)格式的文件是指以纯文本形式存储的表格数据,这意味着不能简单的使用Excel表格工具进行处理,而且Excel表格处理的数据量十分有限,而使用Pandas来处理数据量巨大的CSV文件就容易的多了。

我用到的是自己用其他硬件工具抓取得数据,硬件环境是在Linux平台上搭建的,当时数据是在运行脚本后直接输出在terminal里的,数据量十分庞大,为了保存获得的数据,在Linux下使用了数据流重定向,把数据全部保存到了文本文件中,形成了一个本地csv文件。

Pandas读取本地CSV文件并设置Dataframe(数据格式)

import pandas as pd
import numpy as np
df=pd.read_csv('filename',header=None,sep=' ') #filename可以直接从盘符开始,标明每一级的文件夹直到csv文件,header=None表示头部为空,sep=' '表示数据间使用空格作为分隔符,如果分隔符是逗号,只需换成 ‘,'即可。
print df.head()
print df.tail()
#作为示例,输出CSV文件的前5行和最后5行,这是pandas默认的输出5行,可以根据需要自己设定输出几行的值

Python Pandas批量读取csv文件到dataframe的方法

图片中显示了我本地数据的前5行与最后5行,最前面一列没有标号的是行号,数据一共有13列,标号从0到12,一行显示不完全,在第9列以后换了行,并且用反斜杠“\”标注了出来。

2017年4月28日更新

使用pandas直接读取本地的csv文件后,csv文件的列索引默认为从0开始的数字,重定义列索引的语句如下:

import pandas as pd
import numpy as np
df=pd.read_csv('filename',header=None,sep=' ',names=["week",'month','date','time','year','name1','freq1','name2','freq2','name3','data1','name4','data2'])
print df1234

此时打印出的文件信息如下,列索引已经被重命名:

Python Pandas批量读取csv文件到dataframe的方法

总结

以上所述是小编给大家介绍的Python Pandas批量读取csv文件到dataframe的方法,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对三水点靠木网站的支持!

Python 相关文章推荐
Python的Flask框架中使用Flask-SQLAlchemy管理数据库的教程
Jun 14 Python
python Matplotlib画图之调整字体大小的示例
Nov 20 Python
Python实现XML文件解析的示例代码
Feb 05 Python
python中(str,list,tuple)基础知识汇总
Feb 20 Python
解决pyinstaller打包pyqt5的问题
Jan 08 Python
Python Pexpect库的简单使用方法
Jan 29 Python
在自动化中用python实现键盘操作的方法详解
Jul 19 Python
Python django框架输入汉字,数字,字符生成二维码实现详解
Sep 24 Python
.img/.hdr格式转.nii格式的操作
Jul 01 Python
Python 使用双重循环打印图形菱形操作
Aug 09 Python
4款Python 类型检查工具,你选择哪个呢?
Oct 30 Python
如何用Matlab和Python读取Netcdf文件
Feb 19 Python
Python中的函数式编程:不可变的数据结构
Oct 08 #Python
详解多线程Django程序耗尽数据库连接的问题
Oct 08 #Python
JSON文件及Python对JSON文件的读写操作
Oct 07 #Python
Python实现登陆文件验证方法
Oct 06 #Python
python对日志进行处理的实例代码
Oct 06 #Python
浅析Python函数式编程
Oct 06 #Python
Python实现iOS自动化打包详解步骤
Oct 03 #Python
You might like
在Mac OS上搭建Nginx+PHP+MySQL开发环境的教程
2015/12/21 PHP
Yii隐藏URL中index.php的方法
2016/07/12 PHP
php实现获取农历(阴历)、节日、节气的类与用法示例
2017/11/20 PHP
PHP 图片处理
2020/09/16 PHP
Jquery图形报表插件 jqplot简介及参数详解
2012/10/10 Javascript
我的Node.js学习之路(一)
2014/07/06 Javascript
js创建表单元素并使用submit进行提交
2014/08/14 Javascript
JavaScript将字符串转换为整数的方法
2015/04/14 Javascript
nodejs通过phantomjs实现下载网页
2015/05/04 NodeJs
js实现仿阿里巴巴城市选择框效果实例
2015/06/24 Javascript
Asp.Net之JS生成分页条的方法
2016/11/23 Javascript
angular或者js怎么确定选中ul中的哪几个li
2017/08/16 Javascript
详解JQuery基础动画操作
2019/04/12 jQuery
从表单校验看JavaScript策略模式的使用详解
2020/10/17 Javascript
[02:53]DOTA2英雄基础教程 山岭巨人小小
2013/12/09 DOTA
[48:44]2014 DOTA2国际邀请赛中国区预选赛5.21 TongFu VS HGT
2014/05/22 DOTA
详解JavaScript编程中的window与window.screen对象
2015/10/26 Python
Python最火、R极具潜力 2017机器学习调查报告
2017/12/11 Python
python 不以科学计数法输出的方法
2018/07/16 Python
win10 64bit下python NLTK安装教程
2018/09/19 Python
python中的Elasticsearch操作汇总
2019/10/30 Python
python全局变量引用与修改过程解析
2020/01/07 Python
使用tensorboard可视化loss和acc的实例
2020/01/21 Python
PyTorch中Tensor的数据类型和运算的使用
2020/09/03 Python
python中doctest库实例用法
2020/12/31 Python
css3图片边框border-image的用法
2017/06/30 HTML / CSS
css3实例教程 一款纯css3实现的环形导航菜单
2014/10/20 HTML / CSS
CSS3媒体查询Media Queries基础学习教程
2016/02/29 HTML / CSS
HTML5 script元素async、defer异步加载使用介绍
2013/08/23 HTML / CSS
Html5页面上如何禁止手机虚拟键盘弹出
2020/03/19 HTML / CSS
美国时尚在线:Showpo
2017/09/08 全球购物
线程问题:wait()方法是定义在哪个类里面
2015/07/07 面试题
毕业生个人的自我评价优秀范文
2013/10/03 职场文书
《植物妈妈有办法》教学反思
2014/02/25 职场文书
介绍信样本
2015/01/31 职场文书
vue 给数组添加新对象并赋值
2022/04/20 Vue.js