Python使用pandas处理CSV文件的实例讲解


Posted in Python onJune 22, 2018

Python中有许多方便的库可以用来进行数据处理,尤其是Numpy和Pandas,再搭配matplot画图专用模块,功能十分强大。

CSV(Comma-Separated Values)格式的文件是指以纯文本形式存储的表格数据,这意味着不能简单的使用Excel表格工具进行处理,而且Excel表格处理的数据量十分有限,而使用Pandas来处理数据量巨大的CSV文件就容易的多了。

我用到的是自己用其他硬件工具抓取得数据,硬件环境是在Linux平台上搭建的,当时数据是在运行脚本后直接输出在terminal里的,数据量十分庞大,为了保存获得的数据,在Linux下使用了数据流重定向,把数据全部保存到了文本文件中,形成了一个本地csv文件。

Pandas读取本地CSV文件并设置Dataframe(数据格式)

import pandas as pd
import numpy as np
df=pd.read_csv('filename',header=None,sep=' ') #filename可以直接从盘符开始,标明每一级的文件夹直到csv文件,header=None表示头部为空,sep=' '表示数据间使用空格作为分隔符,如果分隔符是逗号,只需换成 ‘,'即可。
print df.head()
print df.tail()
#作为示例,输出CSV文件的前5行和最后5行,这是pandas默认的输出5行,可以根据需要自己设定输出几行的值

Python使用pandas处理CSV文件的实例讲解

数据读取示例

图片中显示了我本地数据的前5行与最后5行,最前面一列没有标号的是行号,数据一共有13列,标号从0到12,一行显示不完全,在第9列以后换了行,并且用反斜杠“\”标注了出来。

2017年4月28日更新

使用pandas直接读取本地的csv文件后,csv文件的列索引默认为从0开始的数字,重定义列索引的语句如下:

import pandas as pd
import numpy as np
df=pd.read_csv('filename',header=None,sep=' ',names=["week",'month','date','time','year','name1','freq1','name2','freq2','name3','data1','name4','data2'])
print df

此时打印出的文件信息如下,列索引已经被重命名:

Python使用pandas处理CSV文件的实例讲解

以上这篇Python使用pandas处理CSV文件的实例讲解就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
在Python中操作时间之strptime()方法的使用
Dec 30 Python
Python matplotlib 画图窗口显示到gui或者控制台的实例
May 24 Python
Python实现购物评论文本情感分析操作【基于中文文本挖掘库snownlp】
Aug 07 Python
详解PyCharm配置Anaconda的艰难心路历程
Aug 13 Python
python3 实现一行输入,空格隔开的示例
Nov 14 Python
对Pycharm创建py文件时自定义头部模板的方法详解
Feb 12 Python
深入了解Python枚举类型的相关知识
Jul 09 Python
python实现数据分析与建模
Jul 11 Python
django框架使用方法详解
Jul 18 Python
对django后台admin下拉框进行过滤的实例
Jul 26 Python
python 实现方阵的对角线遍历示例
Nov 29 Python
使用python实现数组、链表、队列、栈的方法
Dec 20 Python
python处理csv中的空值方法
Jun 22 #Python
Python实现base64编码的图片保存到本地功能示例
Jun 22 #Python
关于python2 csv写入空白行的问题
Jun 22 #Python
浅谈Python2、Python3相对路径、绝对路径导入方法
Jun 22 #Python
Python基于pandas实现json格式转换成dataframe的方法
Jun 22 #Python
深入浅析Python的类
Jun 22 #Python
基于python绘制科赫雪花
Jun 22 #Python
You might like
php合并数组array_merge函数运算符加号与的区别
2008/10/31 PHP
Codeigniter控制器controller继承问题实例分析
2016/01/19 PHP
thinkphp3.x中session方法的用法分析
2016/05/20 PHP
Laravle eloquent 多对多模型关联实例详解
2017/11/22 PHP
Laravel 集成 Geetest验证码的方法
2018/05/14 PHP
PHP-FPM 设置多pool及配置文件重写操作示例
2019/10/02 PHP
简述JavaScript对传统文档对象模型的支持
2015/06/16 Javascript
js实现的黑背景灰色二级导航菜单效果代码
2015/08/24 Javascript
总结JavaScript设计模式编程中的享元模式使用
2016/05/21 Javascript
深入理解 JavaScript 中的 JSON
2017/04/06 Javascript
深入理解Angular.JS中的Scope继承
2017/06/04 Javascript
javascript+jQuery实现360开机时间显示效果
2017/11/03 jQuery
Bootstrap Table 双击、单击行获取该行及全表内容
2018/08/31 Javascript
layui实现tab的添加拒绝重复的方法
2019/09/04 Javascript
javascript实现鼠标点击生成文字特效
2019/12/24 Javascript
Javascript 模拟mvc实现点餐程序案例详解
2020/12/24 Javascript
基于Python实现对PDF文件的OCR识别
2016/08/05 Python
Python实现运行其他程序的四种方式实例分析
2017/08/17 Python
windows下Virtualenvwrapper安装教程
2017/12/13 Python
Python cookbook(数据结构与算法)将名称映射到序列元素中的方法
2018/03/22 Python
python3学习之Splash的安装与实例教程
2018/07/09 Python
详解Python安装tesserocr遇到的各种问题及解决办法
2019/03/07 Python
网易2016研发工程师编程题 奖学金(python)
2019/06/19 Python
python字符串替换第一个字符串的方法
2019/06/26 Python
pytorch中的embedding词向量的使用方法
2019/08/18 Python
html5指南-5.使用web storage存储键值对的数据
2013/01/07 HTML / CSS
仓管员岗位职责范文
2013/11/08 职场文书
2014年法院工作总结
2014/11/24 职场文书
2014年培训工作总结范文
2014/11/27 职场文书
夫妻分居协议书范本
2014/11/28 职场文书
社会实践活动报告
2015/02/05 职场文书
幼儿教师师德师风自我评价
2015/03/05 职场文书
中秋节寄语2015
2015/03/24 职场文书
企业计划生育责任书
2015/05/09 职场文书
教师节座谈会主持词
2015/07/03 职场文书
深入解析NumPy中的Broadcasting广播机制
2021/05/30 Python