对Python 2.7 pandas 中的read_excel详解


Posted in Python onMay 04, 2018

导入pandas模块:

import pandas as pd

使用import读入pandas模块,并且为了方便使用其缩写pd指代。

读入待处理的excel文件:

df = pd.read_excel('log.xls')

通过使用read_excel函数读入excel文件,后面需要替换成excel文件所在的路径。读入之后变为pandas的DataFrame对象。DataFrame是一个面向列(column-oriented)的二维表结构,且含有列表和行标,对excel文件的操作就转换为对DataFrame操作。另外,如果一个excel含有多个表,如果你只想读入其中一个可以:

df = pd.read_excel('log.xls', sheetname=1)

增加了一个参数sheetname,表示的是第几个表,从0开始计数。我上面设置的是1,也就是第二个表。

读入之后,可以先查看表头信息和每一列的数据类型:

df.dtypes

输出如下:

Member   object
Unnamed: 1 float64
Unnamed: 2 float64
Unnamed: 3 float64
Unnamed: 4 float64
Unnamed: 5 float64
家内外活动类型  object
Unnamed: 7  object
activity  object
dtype: object

提取每个member连续出现的最后一行数据:

new_df = df.drop_duplicates(subset='Member', keep='last')

以上语句的意思是根据Member字段去除掉多余的行,并且保留相同行的最后一行数据。这些就得到了每一个member最后一行的数据了,返回了经过筛选后的DataFrame。

接下来需要将处理后的结果,保存为excel文件:

out = pd.ExcelWriter('output.xls')
new_df.to_excel(out)
out.save()

output.xls是你要保存的文件名,可以任取;然后将DataFrame的内容保存到该文件,最后保存该文件到系统的磁盘上。

接下来,你就可以在当前目录看到一个新的文件,可以直接使用excel打开查看。

Pandas还提供了很多的API,可以根据具体的任务,查找API文档,找到合适的函数来完成任务。

附:一个完整的示例

#coding=utf-8
import pandas as pd
 
# 读入excel文件中的第2个表
df = pd.read_excel('log.xls', sheetname=1)
# 查看表的数据类型
print df.dtypes
# 查看Member列的数据
print df['Member']
 
'''
# 新建一列,每一行的值是Member列和activity列相同行值的和
for i in df.index:
 df['activity_2'][i] = df['Member'][i] + df['activity'][i]
'''
 
# 根据Member字段去除掉多余的行,并且保留相同行的最后一行数据
new_df = df.drop_duplicates(subset='Member', keep='last')
# 导出结果
out = pd.ExcelWriter('output.xls')
new_df.to_excel(out)
out.save()

以上这篇对Python 2.7 pandas 中的read_excel详解就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python备份文件的脚本
Aug 11 Python
使用DataFrame删除行和列的实例讲解
Apr 08 Python
给你一面国旗 教你用python画中国国旗
Sep 24 Python
python使用opencv实现马赛克效果示例
Sep 28 Python
Django1.11自带分页器paginator的使用方法
Oct 31 Python
用python中的matplotlib绘制方程图像代码
Nov 21 Python
python框架Django实战商城项目之工程搭建过程图文详解
Mar 09 Python
手把手教你安装Windows版本的Tensorflow
Mar 26 Python
python+pygame实现坦克大战小游戏的示例代码(可以自定义子弹速度)
Aug 11 Python
python使用隐式循环快速求和的实现示例
Sep 11 Python
matplotlib bar()实现百分比堆积柱状图
Feb 24 Python
Pytest中skip和skipif的具体使用方法
Jun 30 Python
Python3读取Excel数据存入MySQL的方法
May 04 #Python
详解Django之admin组件的使用和源码剖析
May 04 #Python
Python实现正弦信号的时域波形和频谱图示例【基于matplotlib】
May 04 #Python
使用python3+xlrd解析Excel的实例
May 04 #Python
对python中的xlsxwriter库简单分析
May 04 #Python
使用实现XlsxWriter创建Excel文件并编辑
May 04 #Python
Python实现获取前100组勾股数的方法示例
May 04 #Python
You might like
CPU步进是什么意思?i3-9100F B0步进和U0步进区别知识科普
2020/03/17 数码科技
Apache, PHP在Windows 9x/NT下的安装与配置 (二)
2006/10/09 PHP
PHP 学习路线与时间表
2010/02/21 PHP
限制ckeditor上传图片文件大小的方法
2013/11/15 PHP
Smarty高级应用之缓存操作技巧分析
2016/05/14 PHP
php实现微信公众平台发红包功能
2018/06/14 PHP
php7 新增功能实例总结
2020/05/25 PHP
jquery快捷动态绑定键盘事件的操作函数代码
2013/10/17 Javascript
nodejs调用cmd命令实现复制目录
2015/05/04 NodeJs
javascript元素动态创建实现方法
2015/05/13 Javascript
javascript日期格式化方法汇总
2015/10/04 Javascript
解析Node.js基于模块和包的代码部署方式
2016/02/16 Javascript
基于CSS3和jQuery实现跟随鼠标方位的Hover特效
2016/07/25 Javascript
layui文件上传控件带更改后数据传值的方法
2019/09/23 Javascript
vue vantUI tab切换时 list组件不触发load事件的问题及解决方法
2020/02/14 Javascript
微信小程序实现单个或多个倒计时功能
2020/11/01 Javascript
[41:37]DOTA2北京网鱼队选拔赛——冲击职业之路
2015/04/13 DOTA
[49:15]DOTA2-DPC中国联赛 正赛 CDEC vs XG BO3 第二场 1月19日
2021/03/11 DOTA
Python基于matplotlib绘制栈式直方图的方法示例
2017/08/09 Python
对Python中Iterator和Iterable的区别详解
2018/10/18 Python
python批量赋值操作实例
2018/10/22 Python
Python使用Pandas库常见操作详解
2020/01/16 Python
QT5 Designer 打不开的问题及解决方法
2020/08/20 Python
使用html2canvas.js实现页面截图并显示或上传的示例代码
2018/12/18 HTML / CSS
经典优秀个人求职自荐信格式
2013/09/25 职场文书
思想政治自我鉴定
2013/10/06 职场文书
档案检查欢迎词
2014/01/13 职场文书
运动会解说词100字
2014/01/31 职场文书
财务人员的自我评价范文
2014/03/03 职场文书
2014年大学生四年规划书范文
2014/04/03 职场文书
班级团队活动方案
2014/08/14 职场文书
殡葬服务心得体会
2014/09/11 职场文书
软件研发工程师岗位职责
2014/09/30 职场文书
论文答辩开场白大全
2015/05/27 职场文书
贫困生证明范文
2015/06/16 职场文书
德生TECSUN S-2000使用手册文字版
2022/05/10 无线电