pandas去重复行并分类汇总的实现方法


Posted in Python onJanuary 29, 2019

今天主要记录一下pandas去重复行以及如何分类汇总。以下面的数据帧作为一个例子: 

import pandas as pd
data=pd.DataFrame({'产品':['A','A','A','A'],'数量':[50,50,30,30]})

pandas判断dataframe是否含有重复行数据用:df.duplicated()

pandas去重复行并分类汇总的实现方法

 第一次出现的数据为False.重复的数据行就被记录为True。

去掉重复行数据使用data.drop_duplicates().

pandas去重复行并分类汇总的实现方法

 可以看到索引乱了,我们使用data.reset_index(),里面的参数drop=True,表明要舍掉原来的索引,不然的话原来的索引会保留下来。

pandas去重复行并分类汇总的实现方法

 分类汇总主要使用groupby(表明汇总的条件列)以及agg(要汇总的字段/列以及汇总的方式:求和还是最大最小值或者计数)。完整代码如下图

# -*- coding: utf-8 -*-
"""
Created on Fri Jul 20 09:08:10 2018
@author: FanXiaoLei
"""
import pandas as pd
data=pd.DataFrame({'产品':['A','A','A','A'],'数量':[50,50,30,30]})
if data.duplicated:
  dataA=data.drop_duplicates().reset_index(drop=True)
print(dataA)
dataB=dataA.groupby(by='产品').agg({'数量':sum})
print('数据汇总结果:')
print(dataB)

结果展示如下图:

pandas去重复行并分类汇总的实现方法

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python实现统计文本文件字数的方法
May 05 Python
Python类的继承用法示例
Jan 31 Python
详解python中递归函数
Apr 16 Python
python Django的web开发实例(入门)
Jul 31 Python
浅谈Django+Gunicorn+Nginx部署之路
Sep 11 Python
Python tkinter常用操作代码实例
Jan 03 Python
Python Pandas 对列/行进行选择,增加,删除操作
May 17 Python
Python3通过chmod修改目录或文件权限的方法示例
Jun 08 Python
python selenium xpath定位操作
Sep 01 Python
matplotlib绘制鼠标的十字光标的实现(内置方式)
Jan 06 Python
python3读取文件指定行的三种方法
May 24 Python
Python NumPy灰度图像的压缩原理讲解
Aug 04 Python
spark dataframe 将一列展开,把该列所有值都变成新列的方法
Jan 29 #Python
Python使用ctypes调用C/C++的方法
Jan 29 #Python
dataframe 按条件替换某一列中的值方法
Jan 29 #Python
Numpy之random函数使用学习
Jan 29 #Python
pandas DataFrame 删除重复的行的实现方法
Jan 29 #Python
使用Python向DataFrame中指定位置添加一列或多列的方法
Jan 29 #Python
Python Pexpect库的简单使用方法
Jan 29 #Python
You might like
php中判断字符串是否全是中文或含有中文的实现代码
2011/09/16 PHP
PHP 第二节 数据类型之数值型
2012/04/28 PHP
PHP的PDO常用类库实例分析
2016/04/07 PHP
PHP实现的大文件切割与合并功能示例
2018/04/10 PHP
学习ExtJS accordion布局
2009/10/08 Javascript
一个关于jqGrid使用的小例子(行按钮)
2011/11/04 Javascript
jQuery+JSON+jPlayer实现QQ空间音乐查询功能示例
2013/06/17 Javascript
jquery实现点击展开列表同时隐藏其他列表
2015/08/10 Javascript
用JavaScript来美化HTML的select标签的下拉列表效果
2015/11/17 Javascript
js实现简单计算器
2015/11/22 Javascript
详解javascript中对数据格式化的思考
2017/01/23 Javascript
不使用JavaScript实现菜单的打开和关闭效果demo
2018/05/01 Javascript
微信小程序单选radio及多选checkbox按钮用法示例
2019/04/30 Javascript
JavaScript剩余操作符Rest Operator详解
2019/07/20 Javascript
微信小程序实现禁止分享代码实例
2019/10/19 Javascript
Vue移动端项目实现使用手机预览调试操作
2020/07/18 Javascript
[01:33]完美世界DOTA2联赛PWL S3 集锦第二期
2020/12/21 DOTA
python聊天程序实例代码分享
2013/11/18 Python
Python排序搜索基本算法之冒泡排序实例分析
2017/12/09 Python
django query模块
2019/04/20 Python
Python3.5内置模块之time与datetime模块用法实例分析
2019/04/27 Python
pycharm中显示CSS提示的知识点总结
2019/07/29 Python
python中编写函数并调用的知识点总结
2021/01/13 Python
python实现马丁策略的实例详解
2021/01/15 Python
带有css3动画效果的兼容多浏览器简单导航条示例
2014/01/26 HTML / CSS
美国室内盆栽植物购买网站:Plants.com
2020/04/24 全球购物
销售工作人员的自我评价分享
2013/11/10 职场文书
管道维修工岗位职责
2013/12/27 职场文书
农业资源与环境专业自荐信范文
2013/12/30 职场文书
精神文明单位申报材料
2014/05/02 职场文书
总经理人事任命书
2014/06/05 职场文书
计算机软件专业求职信
2014/06/10 职场文书
乡镇三严三实学习心得体会
2014/10/13 职场文书
环保建议书作文300字
2015/09/14 职场文书
初中数学教学反思范文
2016/02/17 职场文书
HTML页面中使两个div并排显示的实现
2022/05/15 HTML / CSS