pandas去重复行并分类汇总的实现方法


Posted in Python onJanuary 29, 2019

今天主要记录一下pandas去重复行以及如何分类汇总。以下面的数据帧作为一个例子: 

import pandas as pd
data=pd.DataFrame({'产品':['A','A','A','A'],'数量':[50,50,30,30]})

pandas判断dataframe是否含有重复行数据用:df.duplicated()

pandas去重复行并分类汇总的实现方法

 第一次出现的数据为False.重复的数据行就被记录为True。

去掉重复行数据使用data.drop_duplicates().

pandas去重复行并分类汇总的实现方法

 可以看到索引乱了,我们使用data.reset_index(),里面的参数drop=True,表明要舍掉原来的索引,不然的话原来的索引会保留下来。

pandas去重复行并分类汇总的实现方法

 分类汇总主要使用groupby(表明汇总的条件列)以及agg(要汇总的字段/列以及汇总的方式:求和还是最大最小值或者计数)。完整代码如下图

# -*- coding: utf-8 -*-
"""
Created on Fri Jul 20 09:08:10 2018
@author: FanXiaoLei
"""
import pandas as pd
data=pd.DataFrame({'产品':['A','A','A','A'],'数量':[50,50,30,30]})
if data.duplicated:
  dataA=data.drop_duplicates().reset_index(drop=True)
print(dataA)
dataB=dataA.groupby(by='产品').agg({'数量':sum})
print('数据汇总结果:')
print(dataB)

结果展示如下图:

pandas去重复行并分类汇总的实现方法

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python实现字符串格式化的方法小结
Feb 20 Python
Python实现PS图像调整颜色梯度效果示例
Jan 25 Python
用python 实现在不确定行数情况下多行输入方法
Jan 28 Python
Python实现 版本号对比功能的实例代码
Apr 18 Python
python的内存管理和垃圾回收机制详解
May 18 Python
Python箱型图处理离群点的例子
Dec 09 Python
python opencv 检测移动物体并截图保存实例
Mar 10 Python
Python3 selenium 实现QQ群接龙自动化功能
Apr 17 Python
利用Python如何实时检测自身内存占用
May 09 Python
tensorflow使用CNN分析mnist手写体数字数据集
Jun 17 Python
Python的信号库Blinker用法详解
Dec 31 Python
详解Python中的文件操作
Jan 14 Python
spark dataframe 将一列展开,把该列所有值都变成新列的方法
Jan 29 #Python
Python使用ctypes调用C/C++的方法
Jan 29 #Python
dataframe 按条件替换某一列中的值方法
Jan 29 #Python
Numpy之random函数使用学习
Jan 29 #Python
pandas DataFrame 删除重复的行的实现方法
Jan 29 #Python
使用Python向DataFrame中指定位置添加一列或多列的方法
Jan 29 #Python
Python Pexpect库的简单使用方法
Jan 29 #Python
You might like
第九节 绑定 [9]
2006/10/09 PHP
php 提速工具eAccelerator 配置参数详解
2010/05/16 PHP
php 深入理解strtotime函数的使用详解
2013/05/23 PHP
php获取网页请求状态程序示例
2014/06/17 PHP
整理php防注入和XSS攻击通用过滤
2015/09/13 PHP
php apache开启跨域模式过程详解
2019/07/08 PHP
静态图片的十一种滤镜效果--不支持Ie7及非IE浏览器。
2007/03/06 Javascript
用javascript实现的仿Flash广告图片轮换效果
2007/04/24 Javascript
js 实现打印网页中定义的部分内容的代码
2010/04/01 Javascript
js读取本地excel文档数据的代码
2010/11/11 Javascript
图片img的src不变让浏览器重新加载实现方法
2013/03/29 Javascript
javascript简单实现等比例缩小图片的方法
2016/07/27 Javascript
基于JavaScript实现的折半查找算法示例
2017/04/14 Javascript
bootstrap-table组合表头的实现方法
2017/09/07 Javascript
layui select动态添加option的实例
2018/03/07 Javascript
Vue Router的懒加载路径的解决方法
2018/06/21 Javascript
vue实现简单图片上传
2020/06/30 Javascript
js 数据类型判断的方法
2020/12/03 Javascript
[46:09]2014 DOTA2华西杯精英邀请赛 5 25 LGD VS VG第三场
2014/05/26 DOTA
[01:03:03]VP vs Mineski 2018国际邀请赛淘汰赛BO3 第一场 8.22
2018/08/23 DOTA
python在Windows8下获取本机ip地址的方法
2015/03/14 Python
python如何获取服务器硬件信息
2017/05/11 Python
CentOS 6.5下安装Python 3.5.2(与Python2并存)
2017/06/05 Python
Python内置函数 next的具体使用方法
2017/11/24 Python
Python中的Socket 与 ScoketServer 通信及遇到问题解决方法
2019/04/01 Python
Django 自定义分页器的实现代码
2019/11/24 Python
Pycharm2020.1安装中文语言插件的详细教程(不需要汉化)
2020/08/07 Python
CSS3弹性盒模型开发笔记(三)
2016/04/26 HTML / CSS
Stefania Mode英国:奢华设计师和时尚服装
2017/10/23 全球购物
悬挂训练绳:TRX
2017/12/14 全球购物
美国独家设计师眼镜在线光学商店:Glasses Gallery
2017/12/28 全球购物
设置器与访问器的定义以及各自特点
2016/01/08 面试题
人力资源管理专业应届生求职信
2014/04/24 职场文书
2014小学教师个人工作总结
2014/11/10 职场文书
劳动者解除劳动合同通知书
2015/04/16 职场文书
详解Js模块化的作用原理和方案
2021/04/29 Javascript