Pandas统计重复的列里面的值方法


Posted in Python onJanuary 30, 2019

pandas

代码如下:

import pandas as pd
import numpy as np

salaries = pd.DataFrame({
 'name': ['BOSS', 'Lilei', 'Lilei', 'Han', 'BOSS', 'BOSS', 'Han', 'BOSS'],
 'Year': [2016, 2016, 2016, 2016, 2017, 2017, 2017, 2017],
 'Salary': [1, 2, 3, 4, 5, 6, 7, 8],
 'Bonus': [2, 2, 2, 2, 3, 4, 5, 6]
})
print(salaries)
print(salaries['Bonus'].duplicated(keep='first'))
print(salaries[salaries['Bonus'].duplicated(keep='first')].index)
print(salaries[salaries['Bonus'].duplicated(keep='first')])
print(salaries['Bonus'].duplicated(keep='last'))
print(salaries[salaries['Bonus'].duplicated(keep='last')].index)
print(salaries[salaries['Bonus'].duplicated(keep='last')])

输出如下:

Bonus Salary Year name
0  2  1 2016 BOSS
1  2  2 2016 Lilei
2  2  3 2016 Lilei
3  2  4 2016 Han
4  3  5 2017 BOSS
5  4  6 2017 BOSS
6  5  7 2017 Han
7  6  8 2017 BOSS
0 False
1  True
2  True
3  True
4 False
5 False
6 False
7 False
Name: Bonus, dtype: bool
Int64Index([1, 2, 3], dtype='int64')
 Bonus Salary Year name
1  2  2 2016 Lilei
2  2  3 2016 Lilei
3  2  4 2016 Han
0  True
1  True
2  True
3 False
4 False
5 False
6 False
7 False
Name: Bonus, dtype: bool
Int64Index([0, 1, 2], dtype='int64')
 Bonus Salary Year name
0  2  1 2016 BOSS
1  2  2 2016 Lilei
2  2  3 2016 Lilei

非pandas

对于如nunpy中的这些操作主要如下:

假设有数组

a = np.array([1, 2, 1, 3, 3, 3, 0])

想找出 [1 3]

则有

方法1

m = np.zeros_like(a, dtype=bool)
m[np.unique(a, return_index=True)[1]] = True
a[~m]
方法2

a[~np.in1d(np.arange(len(a)), np.unique(a, return_index=True)[1], assume_unique=True)]
方法3

np.setxor1d(a, np.unique(a), assume_unique=True)
方法4

u, i = np.unique(a, return_inverse=True)
u[np.bincount(i) > 1]
方法5

s = np.sort(a, axis=None)
s[:-1][s[1:] == s[:-1]]

参考:https://stackoverflow.com/questions/11528078/determining-duplicate-values-in-an-array

以上这篇Pandas统计重复的列里面的值方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python使用Socket(Https)Post登录百度的实现代码
May 18 Python
python笔记(1) 关于我们应不应该继续学习python
Oct 24 Python
利用Python为iOS10生成图标和截屏
Sep 24 Python
git进行版本控制心得详谈
Dec 10 Python
NetworkX之Prim算法(实例讲解)
Dec 22 Python
python+opencv轮廓检测代码解析
Jan 05 Python
Python简直是万能的,这5大主要用途你一定要知道!(推荐)
Apr 03 Python
Python3 执行Linux Bash命令的方法
Jul 12 Python
python打包生成so文件的实现
Oct 30 Python
jupyter notebook 写代码自动补全的实现
Nov 02 Python
如何在python中实现ECDSA你知道吗
Nov 23 Python
Python如何利用pandas读取csv数据并绘图
Jul 07 Python
自学python的建议和周期预算
Jan 30 #Python
python DataFrame 取差集实例
Jan 30 #Python
对python dataframe逻辑取值的方法详解
Jan 30 #Python
对Python中DataFrame选择某列值为XX的行实例详解
Jan 29 #Python
把pandas转换int型为str型的方法
Jan 29 #Python
使用pandas把某一列的字符值转换为数字的实例
Jan 29 #Python
Python不同目录间进行模块调用的实现方法
Jan 29 #Python
You might like
一拳超人中怪人协会钦定! S级别最强四人!
2020/03/02 日漫
一个颜色轮换的简单例子
2006/10/09 PHP
第4章 数据处理-php数组的处理-郑阿奇
2011/07/04 PHP
7个超级实用的PHP代码片段
2011/07/11 PHP
PHP连接MSSQL时nvarchar字段长度被截断为255的解决方法
2014/12/25 PHP
PHP序列化的四种实现方法与横向对比
2018/11/29 PHP
jquery获取自定义属性(attr和prop)实例介绍
2013/04/21 Javascript
javascript 获取模态窗口的滚动位置代码
2013/08/06 Javascript
jQuery遍历Form示例代码
2013/09/03 Javascript
js在指定位置增加节点函数insertBefore()用法实例
2015/01/12 Javascript
Bootstrap每天必学之导航条
2015/11/27 Javascript
有关jQuery中parent()和siblings()的小问题
2016/06/01 Javascript
JS从数组中随机取出几个数组元素的方法
2016/08/02 Javascript
关于js对textarea换行符的处理方法浅析
2018/08/03 Javascript
[02:45]DOTA2英雄基础教程 伐木机
2013/12/23 DOTA
[55:02]2014 DOTA2国际邀请赛中国区预选赛 HGT VS Orenda
2014/05/21 DOTA
跟老齐学Python之让人欢喜让人忧的迭代
2014/10/02 Python
计算机二级python学习教程(1) 教大家如何学习python
2019/05/16 Python
Pandas之Dropna滤除缺失数据的实现方法
2019/06/25 Python
python3 实现函数写文件路径的正确方法
2019/11/27 Python
Python基于Serializer实现字段验证及序列化
2020/11/04 Python
python链表类中获取元素实例方法
2021/02/23 Python
css3的图形3d翻转效果应用示例
2014/04/08 HTML / CSS
CSS3色彩模式有哪些?CSS3 HSL色彩模式的定义
2016/04/26 HTML / CSS
采用专利算法搜索最廉价的机票:CheapAir
2016/09/10 全球购物
在阿尔卑斯山或希腊度过快乐假期:Alpine Elements
2019/12/28 全球购物
可以使用抽象函数重写基类中的虚函数吗
2013/06/02 面试题
客户代表自我评价范例
2013/09/24 职场文书
体育教师工作总结的自我评价
2013/10/10 职场文书
大学生学习2014全国两会心得体会
2014/03/13 职场文书
无偿献血倡议书
2014/04/14 职场文书
乡镇遵守党的政治纪律情况对照检查材料
2014/09/26 职场文书
县政府领导班子四风问题对照检查材料思想汇报
2014/09/26 职场文书
前端学习——JavaScript原生实现购物车案例
2021/03/31 Javascript
MySQL 全文索引使用指南
2021/05/25 MySQL
Mysql 数据库中的 redo log 和 binlog 写入策略
2022/04/26 MySQL