Python Pandas批量读取csv文件到dataframe的方法


Posted in Python onOctober 08, 2018

PYTHON Pandas批量读取csv文件到DATAFRAME

Python Pandas批量读取csv文件到dataframe的方法

首先使用glob.glob获得文件路径。然后定义一个列表,读取文件后再使用concat合并读取到的数据。

#读取数据
import pandas as pd
import numpy as np
import glob,os
path=r'e:\tj\month\fx1806'
file=glob.glob(os.path.join(path, "zq*.xls"))
print(file)
dl= []
for f in file:
 dl.append(pd.read_excel(f,header=[0,1],index_col=None))
df=pd.concat(dl)

下面看下Python使用pandas处理CSV文件的方法

Python中有许多方便的库可以用来进行数据处理,尤其是Numpy和Pandas,再搭配matplot画图专用模块,功能十分强大。

CSV(Comma-Separated Values)格式的文件是指以纯文本形式存储的表格数据,这意味着不能简单的使用Excel表格工具进行处理,而且Excel表格处理的数据量十分有限,而使用Pandas来处理数据量巨大的CSV文件就容易的多了。

我用到的是自己用其他硬件工具抓取得数据,硬件环境是在Linux平台上搭建的,当时数据是在运行脚本后直接输出在terminal里的,数据量十分庞大,为了保存获得的数据,在Linux下使用了数据流重定向,把数据全部保存到了文本文件中,形成了一个本地csv文件。

Pandas读取本地CSV文件并设置Dataframe(数据格式)

import pandas as pd
import numpy as np
df=pd.read_csv('filename',header=None,sep=' ') #filename可以直接从盘符开始,标明每一级的文件夹直到csv文件,header=None表示头部为空,sep=' '表示数据间使用空格作为分隔符,如果分隔符是逗号,只需换成 ‘,'即可。
print df.head()
print df.tail()
#作为示例,输出CSV文件的前5行和最后5行,这是pandas默认的输出5行,可以根据需要自己设定输出几行的值

Python Pandas批量读取csv文件到dataframe的方法

图片中显示了我本地数据的前5行与最后5行,最前面一列没有标号的是行号,数据一共有13列,标号从0到12,一行显示不完全,在第9列以后换了行,并且用反斜杠“\”标注了出来。

2017年4月28日更新

使用pandas直接读取本地的csv文件后,csv文件的列索引默认为从0开始的数字,重定义列索引的语句如下:

import pandas as pd
import numpy as np
df=pd.read_csv('filename',header=None,sep=' ',names=["week",'month','date','time','year','name1','freq1','name2','freq2','name3','data1','name4','data2'])
print df1234

此时打印出的文件信息如下,列索引已经被重命名:

Python Pandas批量读取csv文件到dataframe的方法

总结

以上所述是小编给大家介绍的Python Pandas批量读取csv文件到dataframe的方法,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对三水点靠木网站的支持!

Python 相关文章推荐
Python转换HTML到Text纯文本的方法
Jan 15 Python
Python进阶学习之特殊方法实例详析
Dec 01 Python
Python排序搜索基本算法之归并排序实例分析
Dec 08 Python
python调用tcpdump抓包过滤的方法
Jul 18 Python
flask入门之表单的实现
Jul 18 Python
浅谈django三种缓存模式的使用及注意点
Sep 30 Python
Python中时间datetime的处理与转换用法总结
Feb 18 Python
Python全局锁中如何合理运用多线程(多进程)
Nov 06 Python
python 监测内存和cpu的使用率实例
Nov 28 Python
keras tensorflow 实现在python下多进程运行
Feb 06 Python
pandas之分组groupby()的使用整理与总结
Jun 18 Python
关于 Python json中load和loads区别
Nov 07 Python
Python中的函数式编程:不可变的数据结构
Oct 08 #Python
详解多线程Django程序耗尽数据库连接的问题
Oct 08 #Python
JSON文件及Python对JSON文件的读写操作
Oct 07 #Python
Python实现登陆文件验证方法
Oct 06 #Python
python对日志进行处理的实例代码
Oct 06 #Python
浅析Python函数式编程
Oct 06 #Python
Python实现iOS自动化打包详解步骤
Oct 03 #Python
You might like
WINDOWS下php5.2.4+mysql6.0+apache2.2.4+ZendOptimizer-3.3.0配置
2008/03/28 PHP
php读取二进制流(C语言结构体struct数据文件)的深入解析
2013/06/13 PHP
Smarty中调用FCKeditor的方法
2014/10/27 PHP
33道php常见面试题及答案
2015/07/06 PHP
一个PHP实现的轻量级简单爬虫
2015/07/08 PHP
javascript 在网页中的运用(asp.net)
2009/11/23 Javascript
精通JavaScript 纠正 cleanWhitespace函数
2010/03/11 Javascript
jQuery实现隔行背景色变色
2014/11/24 Javascript
node.js中的http.get方法使用说明
2014/12/14 Javascript
JavaScript闭包详解
2015/02/02 Javascript
JavaScript实现文字与图片拖拽效果的方法
2015/02/16 Javascript
javascript自定义右键弹出菜单实现方法
2015/05/25 Javascript
JavaScript动态数量的文件上传控件
2016/11/18 Javascript
Bootstrap页面标题Page Header的实现方法
2017/03/22 Javascript
Iscrool下拉刷新功能实现方法(推荐)
2017/06/26 Javascript
vue中vee validate表单校验的几种基本使用
2018/06/25 Javascript
vue添加axios,并且指定baseurl的方法
2018/09/19 Javascript
详解Angular Karma测试的持续集成实践
2019/11/15 Javascript
如何使用 JavaScript 操作浏览器历史记录 API
2020/11/24 Javascript
Python中endswith()函数的基本使用
2015/04/07 Python
python3.6使用pymysql连接Mysql数据库
2018/05/25 Python
利用python画出折线图
2018/07/26 Python
Python人脸识别第三方库face_recognition接口说明文档
2019/05/03 Python
Jupyter打开图形界面并画出正弦函数图像实例
2020/04/24 Python
利用Python如何制作贪吃蛇及AI版贪吃蛇详解
2020/08/24 Python
python爬取代理IP并进行有效的IP测试实现
2020/10/09 Python
TensorFlow2.0使用keras训练模型的实现
2021/02/20 Python
韩国11街:11STREET
2018/03/27 全球购物
迪卡侬中国官网:Decathlon中国
2020/08/10 全球购物
会计专业职业规划:规划自我赢取未来
2014/02/12 职场文书
股东协议书范本
2014/04/14 职场文书
一年级学生评语大全
2014/04/21 职场文书
省级青年文明号申报材料
2014/05/23 职场文书
关爱残疾人标语
2014/06/25 职场文书
白鹤梁导游词
2015/02/06 职场文书
旷工检讨书大全
2015/08/15 职场文书