pandas去重复行并分类汇总的实现方法


Posted in Python onJanuary 29, 2019

今天主要记录一下pandas去重复行以及如何分类汇总。以下面的数据帧作为一个例子: 

import pandas as pd
data=pd.DataFrame({'产品':['A','A','A','A'],'数量':[50,50,30,30]})

pandas判断dataframe是否含有重复行数据用:df.duplicated()

pandas去重复行并分类汇总的实现方法

 第一次出现的数据为False.重复的数据行就被记录为True。

去掉重复行数据使用data.drop_duplicates().

pandas去重复行并分类汇总的实现方法

 可以看到索引乱了,我们使用data.reset_index(),里面的参数drop=True,表明要舍掉原来的索引,不然的话原来的索引会保留下来。

pandas去重复行并分类汇总的实现方法

 分类汇总主要使用groupby(表明汇总的条件列)以及agg(要汇总的字段/列以及汇总的方式:求和还是最大最小值或者计数)。完整代码如下图

# -*- coding: utf-8 -*-
"""
Created on Fri Jul 20 09:08:10 2018
@author: FanXiaoLei
"""
import pandas as pd
data=pd.DataFrame({'产品':['A','A','A','A'],'数量':[50,50,30,30]})
if data.duplicated:
  dataA=data.drop_duplicates().reset_index(drop=True)
print(dataA)
dataB=dataA.groupby(by='产品').agg({'数量':sum})
print('数据汇总结果:')
print(dataB)

结果展示如下图:

pandas去重复行并分类汇总的实现方法

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python socket编程实例详解
May 27 Python
使用简单工厂模式来进行Python的设计模式编程
Mar 01 Python
python多线程方式执行多个bat代码
Jun 07 Python
python实现多线程抓取知乎用户
Dec 12 Python
Python时间戳使用和相互转换详解
Dec 11 Python
selenium python 实现基本自动化测试的示例代码
Feb 25 Python
pytorch 在sequential中使用view来reshape的例子
Aug 20 Python
python实现感知机模型的示例
Sep 30 Python
利用python进行文件操作
Dec 04 Python
python中复数的共轭复数知识点总结
Dec 06 Python
python自动化发送邮件实例讲解
Jan 04 Python
Django rest framework如何自定义用户表
Jun 09 Python
spark dataframe 将一列展开,把该列所有值都变成新列的方法
Jan 29 #Python
Python使用ctypes调用C/C++的方法
Jan 29 #Python
dataframe 按条件替换某一列中的值方法
Jan 29 #Python
Numpy之random函数使用学习
Jan 29 #Python
pandas DataFrame 删除重复的行的实现方法
Jan 29 #Python
使用Python向DataFrame中指定位置添加一列或多列的方法
Jan 29 #Python
Python Pexpect库的简单使用方法
Jan 29 #Python
You might like
浅谈PHP语法(1)
2006/10/09 PHP
PHP4与PHP5的时间格式问题
2008/02/17 PHP
php使用CURL伪造IP和来源实例详解
2015/01/15 PHP
javascript getElementsByName()的用法说明
2009/07/31 Javascript
修改jquery里的dialog对话框插件为框架页(iframe) 的方法
2010/09/14 Javascript
jQuery 表单验证扩展代码(二)
2010/10/20 Javascript
jquery方法+js一般方法+js面向对象方法实现拖拽效果
2012/08/30 Javascript
jQuery动画效果-fadeIn fadeOut淡入浅出示例代码
2013/08/28 Javascript
js生成的验证码的实现与技术分析
2014/09/17 Javascript
使用Javascript简单实现图片无缝滚动
2014/12/05 Javascript
webpack入门+react环境配置
2017/02/08 Javascript
微信小程序 商城开发(ecshop )简单实例
2017/04/07 Javascript
浅谈struts1 & jquery form 文件异步上传
2017/05/25 jQuery
vue iView 上传组件之手动上传功能
2018/03/16 Javascript
使用react实现手机号的数据同步显示功能的示例代码
2018/04/03 Javascript
iview通过Dropdown(下拉菜单)实现的右键菜单
2018/10/26 Javascript
jQuery实现侧边栏隐藏与显示的方法详解
2018/12/22 jQuery
Vue实战教程之仿肯德基宅急送App
2019/07/19 Javascript
[07:59]2014DOTA2叨叨刀塔 林熊猫称被邀请赛现场盛况震撼
2014/07/21 DOTA
Python中encode()方法的使用简介
2015/05/18 Python
Python的Tornado框架实现图片上传及图片大小修改功能
2016/06/30 Python
python数据类型_字符串常用操作(详解)
2017/05/30 Python
Ubuntu安装Jupyter Notebook教程
2017/10/18 Python
Python基于xlrd模块操作Excel的方法示例
2018/06/21 Python
Django 中间键和上下文处理器的使用
2019/03/17 Python
运动会入场解说词
2014/02/07 职场文书
乔迁之喜主持词
2014/03/27 职场文书
学生会宣传部部长竞选演讲稿
2014/04/25 职场文书
国家奖学金获奖感言
2014/08/16 职场文书
我为党旗添光彩演讲稿
2014/09/10 职场文书
施工安全协议书范本
2014/09/26 职场文书
关于运动会广播稿200字
2014/10/08 职场文书
2016八一建军节慰问信
2015/11/30 职场文书
Python 使用dict实现switch的操作
2021/04/07 Python
Python 制作自动化翻译工具
2021/04/25 Python
apache ftpserver搭建ftp服务器
2022/05/20 Servers