对Python 2.7 pandas 中的read_excel详解


Posted in Python onMay 04, 2018

导入pandas模块:

import pandas as pd

使用import读入pandas模块,并且为了方便使用其缩写pd指代。

读入待处理的excel文件:

df = pd.read_excel('log.xls')

通过使用read_excel函数读入excel文件,后面需要替换成excel文件所在的路径。读入之后变为pandas的DataFrame对象。DataFrame是一个面向列(column-oriented)的二维表结构,且含有列表和行标,对excel文件的操作就转换为对DataFrame操作。另外,如果一个excel含有多个表,如果你只想读入其中一个可以:

df = pd.read_excel('log.xls', sheetname=1)

增加了一个参数sheetname,表示的是第几个表,从0开始计数。我上面设置的是1,也就是第二个表。

读入之后,可以先查看表头信息和每一列的数据类型:

df.dtypes

输出如下:

Member   object
Unnamed: 1 float64
Unnamed: 2 float64
Unnamed: 3 float64
Unnamed: 4 float64
Unnamed: 5 float64
家内外活动类型  object
Unnamed: 7  object
activity  object
dtype: object

提取每个member连续出现的最后一行数据:

new_df = df.drop_duplicates(subset='Member', keep='last')

以上语句的意思是根据Member字段去除掉多余的行,并且保留相同行的最后一行数据。这些就得到了每一个member最后一行的数据了,返回了经过筛选后的DataFrame。

接下来需要将处理后的结果,保存为excel文件:

out = pd.ExcelWriter('output.xls')
new_df.to_excel(out)
out.save()

output.xls是你要保存的文件名,可以任取;然后将DataFrame的内容保存到该文件,最后保存该文件到系统的磁盘上。

接下来,你就可以在当前目录看到一个新的文件,可以直接使用excel打开查看。

Pandas还提供了很多的API,可以根据具体的任务,查找API文档,找到合适的函数来完成任务。

附:一个完整的示例

#coding=utf-8
import pandas as pd
 
# 读入excel文件中的第2个表
df = pd.read_excel('log.xls', sheetname=1)
# 查看表的数据类型
print df.dtypes
# 查看Member列的数据
print df['Member']
 
'''
# 新建一列,每一行的值是Member列和activity列相同行值的和
for i in df.index:
 df['activity_2'][i] = df['Member'][i] + df['activity'][i]
'''
 
# 根据Member字段去除掉多余的行,并且保留相同行的最后一行数据
new_df = df.drop_duplicates(subset='Member', keep='last')
# 导出结果
out = pd.ExcelWriter('output.xls')
new_df.to_excel(out)
out.save()

以上这篇对Python 2.7 pandas 中的read_excel详解就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Eclipse中Python开发环境搭建简单教程
Mar 23 Python
Python+微信接口实现运维报警
Aug 27 Python
13个最常用的Python深度学习库介绍
Oct 28 Python
Python if语句知识点用法总结
Jun 10 Python
python读取TXT每行,并存到LIST中的方法
Oct 26 Python
python判断输入日期为第几天的实例
Nov 13 Python
python 自动重连wifi windows的方法
Dec 18 Python
python Web flask 视图内容和模板实现代码
Aug 23 Python
Python实现串口通信(pyserial)过程解析
Sep 25 Python
基于Python爬取爱奇艺资源过程解析
Mar 02 Python
Python使用pyyaml模块处理yaml数据
Apr 14 Python
如何基于pandas读取csv后合并两个股票
Sep 25 Python
Python3读取Excel数据存入MySQL的方法
May 04 #Python
详解Django之admin组件的使用和源码剖析
May 04 #Python
Python实现正弦信号的时域波形和频谱图示例【基于matplotlib】
May 04 #Python
使用python3+xlrd解析Excel的实例
May 04 #Python
对python中的xlsxwriter库简单分析
May 04 #Python
使用实现XlsxWriter创建Excel文件并编辑
May 04 #Python
Python实现获取前100组勾股数的方法示例
May 04 #Python
You might like
用PHP进行MySQL删除记录操作代码
2008/06/07 PHP
使用PHP实现密保卡功能实现代码<打包下载直接运行>
2011/10/09 PHP
使用php完成常见的文件上传功能(推荐)
2017/01/13 PHP
js 方法实现返回多个数据的代码
2009/04/30 Javascript
jquery 将disabled的元素置为enabled的三种方法
2009/07/25 Javascript
从零开始学习jQuery (三) 管理jQuery包装集
2011/02/23 Javascript
JavaScript插入动态样式实现代码
2012/02/22 Javascript
JavaScript 高级篇之函数 (四)
2012/04/07 Javascript
Jquery获取和修改img的src值的方法
2014/02/17 Javascript
node.js正则表达式获取网页中所有链接的代码实例
2014/06/03 Javascript
jQuery选择器源码解读(八):addCombinator函数
2015/03/31 Javascript
Javascript实现跑马灯效果的简单实例
2016/05/31 Javascript
基于JavaScript实现复选框的全选和取消全选
2017/02/09 Javascript
ES6新特性八:async函数用法实例详解
2017/04/21 Javascript
Vue.js子组件向父组件通信的方法实例代码详解
2018/12/10 Javascript
JS中min函数实例讲解
2019/02/18 Javascript
Vue实现计算器计算效果
2020/08/17 Javascript
vue+elementUI动态增加表单项并添加验证的代码详解
2020/12/17 Vue.js
使用原生javascript开发计算器实例代码
2021/02/21 Javascript
Python随机生成彩票号码的方法
2015/03/05 Python
在Python3中使用asyncio库进行快速数据抓取的教程
2015/04/02 Python
深入解析Python中的urllib2模块
2015/11/13 Python
pandas 使用apply同时处理两列数据的方法
2018/04/20 Python
使用Django启动命令行及执行脚本的方法
2018/05/29 Python
python 实现将txt文件多行合并为一行并将中间的空格去掉方法
2018/12/20 Python
CSS3 calc()会计算属性详解
2018/02/27 HTML / CSS
Expedia英国:全球最大的在线旅游公司
2017/09/07 全球购物
Stio官网:男女、儿童户外服装
2019/12/13 全球购物
旷课检讨书2000字
2014/01/14 职场文书
群众路线查摆问题整改措施
2014/10/10 职场文书
生日寿星公答谢词
2015/09/29 职场文书
高效课堂教学反思
2016/02/24 职场文书
浅谈Redis在直播场景的实践方案
2021/04/27 Redis
详解CSS开发过程中的20个快速提升技巧
2021/05/21 HTML / CSS
python的列表生成式,生成器和generator对象你了解吗
2022/03/16 Python
日本十大血腥动漫,那些被禁播的动漫盘点
2022/03/21 日漫