Python使用pandas处理CSV文件的实例讲解


Posted in Python onJune 22, 2018

Python中有许多方便的库可以用来进行数据处理,尤其是Numpy和Pandas,再搭配matplot画图专用模块,功能十分强大。

CSV(Comma-Separated Values)格式的文件是指以纯文本形式存储的表格数据,这意味着不能简单的使用Excel表格工具进行处理,而且Excel表格处理的数据量十分有限,而使用Pandas来处理数据量巨大的CSV文件就容易的多了。

我用到的是自己用其他硬件工具抓取得数据,硬件环境是在Linux平台上搭建的,当时数据是在运行脚本后直接输出在terminal里的,数据量十分庞大,为了保存获得的数据,在Linux下使用了数据流重定向,把数据全部保存到了文本文件中,形成了一个本地csv文件。

Pandas读取本地CSV文件并设置Dataframe(数据格式)

import pandas as pd
import numpy as np
df=pd.read_csv('filename',header=None,sep=' ') #filename可以直接从盘符开始,标明每一级的文件夹直到csv文件,header=None表示头部为空,sep=' '表示数据间使用空格作为分隔符,如果分隔符是逗号,只需换成 ‘,'即可。
print df.head()
print df.tail()
#作为示例,输出CSV文件的前5行和最后5行,这是pandas默认的输出5行,可以根据需要自己设定输出几行的值

Python使用pandas处理CSV文件的实例讲解

数据读取示例

图片中显示了我本地数据的前5行与最后5行,最前面一列没有标号的是行号,数据一共有13列,标号从0到12,一行显示不完全,在第9列以后换了行,并且用反斜杠“\”标注了出来。

2017年4月28日更新

使用pandas直接读取本地的csv文件后,csv文件的列索引默认为从0开始的数字,重定义列索引的语句如下:

import pandas as pd
import numpy as np
df=pd.read_csv('filename',header=None,sep=' ',names=["week",'month','date','time','year','name1','freq1','name2','freq2','name3','data1','name4','data2'])
print df

此时打印出的文件信息如下,列索引已经被重命名:

Python使用pandas处理CSV文件的实例讲解

以上这篇Python使用pandas处理CSV文件的实例讲解就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
urllib2自定义opener详解
Feb 07 Python
python类和函数中使用静态变量的方法
May 09 Python
Python如何读取MySQL数据库表数据
Mar 11 Python
Python3中使用PyMongo的方法详解
Jul 28 Python
matlab中实现矩阵删除一行或一列的方法
Apr 04 Python
Python数据可视化之画图
Jan 15 Python
Python数据类型之Tuple元组实例详解
May 08 Python
Django发送邮件和itsdangerous模块的配合使用解析
Aug 10 Python
python离线安装外部依赖包的实现
Feb 13 Python
解决python3插入mysql时内容带有引号的问题
Mar 02 Python
20行Python代码实现视频字符化功能
Apr 13 Python
Python实现一个简单的毕业生信息管理系统的示例代码
Jun 08 Python
python处理csv中的空值方法
Jun 22 #Python
Python实现base64编码的图片保存到本地功能示例
Jun 22 #Python
关于python2 csv写入空白行的问题
Jun 22 #Python
浅谈Python2、Python3相对路径、绝对路径导入方法
Jun 22 #Python
Python基于pandas实现json格式转换成dataframe的方法
Jun 22 #Python
深入浅析Python的类
Jun 22 #Python
基于python绘制科赫雪花
Jun 22 #Python
You might like
漫威DC御用漫画家去世 他的表情包曾走红网络
2020/04/09 欧美动漫
PHP.MVC的模板标签系统(四)
2006/09/05 PHP
php生成zip压缩文件的方法详解
2013/06/09 PHP
Yii框架在页面输出执行sql语句以方便调试的实现方法
2014/12/24 PHP
PHP里的单例类写法实例
2015/06/25 PHP
PHP如何防止用户重复提交表单
2020/12/09 PHP
在IE,Firefox,Safari,Chrome,Opera浏览器上调试javascript
2008/12/02 Javascript
JavaScript 学习笔记(十一)
2010/01/19 Javascript
Nodejs进程管理模块forever详解
2014/06/01 NodeJs
node.js中的fs.lchown方法使用说明
2014/12/16 Javascript
jquery实现仿Flash的横向滑动菜单效果代码
2015/09/17 Javascript
每天一篇javascript学习小结(Date对象)
2015/11/13 Javascript
jQuery+css实现炫目的动态块漂移效果
2016/01/28 Javascript
Google 地图API Map()构造器详解
2016/08/06 Javascript
node.js express捕获全局异常的三种方法实例分析
2019/12/27 Javascript
详解JavaScript之ES5的继承
2020/07/08 Javascript
关于Node.js中频繁修改代码重启服务器的问题
2020/10/15 Javascript
python 获取文件下所有文件或目录os.walk()的实例
2018/04/23 Python
python迭代dict的key和value的方法
2018/07/06 Python
学习python可以干什么
2019/02/26 Python
Python中栈、队列与优先级队列的实现方法
2019/06/30 Python
Python3.7安装keras和TensorFlow的教程图解
2020/06/18 Python
Keras使用tensorboard显示训练过程的实例
2020/02/15 Python
HTML5 CSS3给网站设计带来出色效果
2009/07/16 HTML / CSS
HTML5给汉字加拼音收起展开组件的实现代码
2020/04/08 HTML / CSS
西班牙品牌鞋子、服装和配饰在线商店:Esdemarca
2021/02/17 全球购物
局部内部类是否可以访问非final变量?
2013/04/20 面试题
为什么如下的代码int a=100,b=100;long int c=a * b;不能工作
2013/11/29 面试题
最新的大学生找工作自我评价
2013/09/29 职场文书
大学生护理专业自荐信
2013/10/03 职场文书
外贸实习生自荐信范文
2013/11/24 职场文书
自荐信格式简述
2014/01/25 职场文书
团支部建设方案
2014/05/02 职场文书
《我在为谁工作》:工作的质量往往决定生活的质量
2019/12/27 职场文书
react合成事件与原生事件的相关理解
2021/05/13 Javascript
vue使用wavesurfer.js解决音频可视化播放问题
2022/04/04 Vue.js