对Python 2.7 pandas 中的read_excel详解


Posted in Python onMay 04, 2018

导入pandas模块:

import pandas as pd

使用import读入pandas模块,并且为了方便使用其缩写pd指代。

读入待处理的excel文件:

df = pd.read_excel('log.xls')

通过使用read_excel函数读入excel文件,后面需要替换成excel文件所在的路径。读入之后变为pandas的DataFrame对象。DataFrame是一个面向列(column-oriented)的二维表结构,且含有列表和行标,对excel文件的操作就转换为对DataFrame操作。另外,如果一个excel含有多个表,如果你只想读入其中一个可以:

df = pd.read_excel('log.xls', sheetname=1)

增加了一个参数sheetname,表示的是第几个表,从0开始计数。我上面设置的是1,也就是第二个表。

读入之后,可以先查看表头信息和每一列的数据类型:

df.dtypes

输出如下:

Member   object
Unnamed: 1 float64
Unnamed: 2 float64
Unnamed: 3 float64
Unnamed: 4 float64
Unnamed: 5 float64
家内外活动类型  object
Unnamed: 7  object
activity  object
dtype: object

提取每个member连续出现的最后一行数据:

new_df = df.drop_duplicates(subset='Member', keep='last')

以上语句的意思是根据Member字段去除掉多余的行,并且保留相同行的最后一行数据。这些就得到了每一个member最后一行的数据了,返回了经过筛选后的DataFrame。

接下来需要将处理后的结果,保存为excel文件:

out = pd.ExcelWriter('output.xls')
new_df.to_excel(out)
out.save()

output.xls是你要保存的文件名,可以任取;然后将DataFrame的内容保存到该文件,最后保存该文件到系统的磁盘上。

接下来,你就可以在当前目录看到一个新的文件,可以直接使用excel打开查看。

Pandas还提供了很多的API,可以根据具体的任务,查找API文档,找到合适的函数来完成任务。

附:一个完整的示例

#coding=utf-8
import pandas as pd
 
# 读入excel文件中的第2个表
df = pd.read_excel('log.xls', sheetname=1)
# 查看表的数据类型
print df.dtypes
# 查看Member列的数据
print df['Member']
 
'''
# 新建一列,每一行的值是Member列和activity列相同行值的和
for i in df.index:
 df['activity_2'][i] = df['Member'][i] + df['activity'][i]
'''
 
# 根据Member字段去除掉多余的行,并且保留相同行的最后一行数据
new_df = df.drop_duplicates(subset='Member', keep='last')
# 导出结果
out = pd.ExcelWriter('output.xls')
new_df.to_excel(out)
out.save()

以上这篇对Python 2.7 pandas 中的read_excel详解就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
给Python中的MySQLdb模块添加超时功能的教程
May 05 Python
python删除不需要的python文件方法
Apr 24 Python
python2 与 python3 实现共存的方法
Jul 12 Python
python中redis查看剩余过期时间及用正则通配符批量删除key的方法
Jul 30 Python
Python GUI布局尺寸适配方法
Oct 11 Python
python解析json串与正则匹配对比方法
Dec 20 Python
解决python给列表里添加字典时被最后一个覆盖的问题
Jan 21 Python
Python交互环境下打印和输入函数的实例内容
Feb 16 Python
numpy矩阵数值太多不能全部显示的解决
May 14 Python
详解Python中的路径问题
Sep 02 Python
python各种excel写入方式的速度对比
Nov 10 Python
python通配符之glob模块的使用详解
Apr 24 Python
Python3读取Excel数据存入MySQL的方法
May 04 #Python
详解Django之admin组件的使用和源码剖析
May 04 #Python
Python实现正弦信号的时域波形和频谱图示例【基于matplotlib】
May 04 #Python
使用python3+xlrd解析Excel的实例
May 04 #Python
对python中的xlsxwriter库简单分析
May 04 #Python
使用实现XlsxWriter创建Excel文件并编辑
May 04 #Python
Python实现获取前100组勾股数的方法示例
May 04 #Python
You might like
php中判断数组是一维,二维,还是多维的解决方法
2013/05/04 PHP
解析PHP函数array_flip()在重复数组元素删除中的作用
2013/06/27 PHP
php生成4位数字验证码的实现代码
2015/11/23 PHP
ThinkPHP使用Ueditor的方法详解
2016/05/20 PHP
Yii 框架控制器创建使用及控制器响应操作示例
2019/10/14 PHP
确保Laravel网站不会被嵌入到其他站点中的方法
2019/10/18 PHP
一个很酷的拖动层的js类,兼容IE及Firefox
2009/06/23 Javascript
jQuery EasyUI API 中文文档 DateTimeBox日期时间框
2011/10/16 Javascript
jQuery load方法用法集锦
2011/12/06 Javascript
基于jquery自己写tab滑动门(通用版)
2012/10/30 Javascript
javascript中的delete使用详解
2013/04/11 Javascript
[JSF]使用DataModel处理表行事件的实例代码
2013/08/05 Javascript
扩展jQuery对象时如何扩展成员变量具体怎么实现
2014/04/25 Javascript
node.js中的fs.mkdirSync方法使用说明
2014/12/17 Javascript
Jquery结合HTML5实现文件上传
2015/06/25 Javascript
基于jquery实现页面滚动到底自动加载数据的功能
2015/12/19 Javascript
js中el表达式的使用和非空判断方法
2018/03/28 Javascript
node实现基于token的身份验证
2018/04/09 Javascript
vue项目中,main.js,App.vue,index.html的调用方法
2018/09/20 Javascript
react使用CSS实现react动画功能示例
2020/05/18 Javascript
jquery.validate自定义验证用法实例分析【成功提示与择要提示】
2020/06/06 jQuery
JavaScript动画实例之粒子文本的实现方法详解
2020/07/28 Javascript
antd Select下拉菜单动态添加option里的内容操作
2020/11/02 Javascript
python 写的一个爬虫程序源码
2016/02/28 Python
Python 中 function(#) (X)格式 和 (#)在Python3.*中的注意事项
2018/11/30 Python
基于YUV 数据格式详解及python实现方式
2019/12/09 Python
CSS3 translate导致字体模糊的实例代码
2019/08/30 HTML / CSS
美国半成品食材配送服务商:Home Chef
2018/01/25 全球购物
莫斯科大型旅游休闲商品超市:Camping.ru
2020/09/16 全球购物
如何通过jdbc调用存储过程
2012/04/19 面试题
中秋节主持词
2014/04/02 职场文书
市场营销调查计划书
2014/05/02 职场文书
志愿者宣传口号
2014/06/17 职场文书
2015社区精神文明建设工作总结
2015/04/21 职场文书
2015秋季运动会通讯稿
2015/07/18 职场文书
B站评分公认最好看的动漫,你的名字评分9.9,第六备受喜欢
2022/03/18 日漫