Pandas统计重复的列里面的值方法


Posted in Python onJanuary 30, 2019

pandas

代码如下:

import pandas as pd
import numpy as np

salaries = pd.DataFrame({
 'name': ['BOSS', 'Lilei', 'Lilei', 'Han', 'BOSS', 'BOSS', 'Han', 'BOSS'],
 'Year': [2016, 2016, 2016, 2016, 2017, 2017, 2017, 2017],
 'Salary': [1, 2, 3, 4, 5, 6, 7, 8],
 'Bonus': [2, 2, 2, 2, 3, 4, 5, 6]
})
print(salaries)
print(salaries['Bonus'].duplicated(keep='first'))
print(salaries[salaries['Bonus'].duplicated(keep='first')].index)
print(salaries[salaries['Bonus'].duplicated(keep='first')])
print(salaries['Bonus'].duplicated(keep='last'))
print(salaries[salaries['Bonus'].duplicated(keep='last')].index)
print(salaries[salaries['Bonus'].duplicated(keep='last')])

输出如下:

Bonus Salary Year name
0  2  1 2016 BOSS
1  2  2 2016 Lilei
2  2  3 2016 Lilei
3  2  4 2016 Han
4  3  5 2017 BOSS
5  4  6 2017 BOSS
6  5  7 2017 Han
7  6  8 2017 BOSS
0 False
1  True
2  True
3  True
4 False
5 False
6 False
7 False
Name: Bonus, dtype: bool
Int64Index([1, 2, 3], dtype='int64')
 Bonus Salary Year name
1  2  2 2016 Lilei
2  2  3 2016 Lilei
3  2  4 2016 Han
0  True
1  True
2  True
3 False
4 False
5 False
6 False
7 False
Name: Bonus, dtype: bool
Int64Index([0, 1, 2], dtype='int64')
 Bonus Salary Year name
0  2  1 2016 BOSS
1  2  2 2016 Lilei
2  2  3 2016 Lilei

非pandas

对于如nunpy中的这些操作主要如下:

假设有数组

a = np.array([1, 2, 1, 3, 3, 3, 0])

想找出 [1 3]

则有

方法1

m = np.zeros_like(a, dtype=bool)
m[np.unique(a, return_index=True)[1]] = True
a[~m]
方法2

a[~np.in1d(np.arange(len(a)), np.unique(a, return_index=True)[1], assume_unique=True)]
方法3

np.setxor1d(a, np.unique(a), assume_unique=True)
方法4

u, i = np.unique(a, return_inverse=True)
u[np.bincount(i) > 1]
方法5

s = np.sort(a, axis=None)
s[:-1][s[1:] == s[:-1]]

参考:https://stackoverflow.com/questions/11528078/determining-duplicate-values-in-an-array

以上这篇Pandas统计重复的列里面的值方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python抓取京东价格分析京东商品价格走势
Jan 09 Python
Python生成随机MAC地址
Mar 10 Python
python中xrange用法分析
Apr 15 Python
python实现用户答题功能
Jan 17 Python
python3爬取数据至mysql的方法
Jun 26 Python
python使用tornado实现登录和登出
Jul 28 Python
Python Numpy库安装与基本操作示例
Jan 08 Python
Python设计模式之工厂方法模式实例详解
Jan 18 Python
Python中zip()函数的简单用法举例
Sep 02 Python
Python3标准库glob文件名模式匹配的问题
Mar 13 Python
Python+OpenCV图像处理——实现轮廓发现
Oct 23 Python
基于Pytorch版yolov5的滑块验证码破解思路详解
Feb 25 Python
自学python的建议和周期预算
Jan 30 #Python
python DataFrame 取差集实例
Jan 30 #Python
对python dataframe逻辑取值的方法详解
Jan 30 #Python
对Python中DataFrame选择某列值为XX的行实例详解
Jan 29 #Python
把pandas转换int型为str型的方法
Jan 29 #Python
使用pandas把某一列的字符值转换为数字的实例
Jan 29 #Python
Python不同目录间进行模块调用的实现方法
Jan 29 #Python
You might like
论建造顺序的重要性
2020/03/04 星际争霸
咖啡知识 咖啡养豆要养多久 排气又是什么
2021/03/06 新手入门
使用PHP获取汉字的拼音(全部与首字母)
2013/06/27 PHP
ThinkPHP自动填充实现无限级分类的方法
2014/08/22 PHP
php实现可逆加密的方法
2015/08/11 PHP
Yii实现显示静态页的方法
2016/04/25 PHP
php批量删除操作(数据访问)
2017/05/23 PHP
用Javascript同时提交多个Web表单的方法
2009/12/26 Javascript
js操作iframe的一些方法介绍
2013/06/25 Javascript
from 表单提交返回值用post或者是get方法实现
2013/08/21 Javascript
jquery实现显示已选用户
2014/07/21 Javascript
js事件源window.event.srcElement兼容性写法(详解)
2016/11/25 Javascript
Vue 中对图片地址进行拼接的方法
2018/09/03 Javascript
vue视图不更新情况详解
2019/05/16 Javascript
微信小程序把百度地图坐标转换成腾讯地图坐标过程详解
2019/07/10 Javascript
基于vue-simple-uploader封装文件分片上传、秒传及断点续传的全局上传插件功能
2021/02/23 Vue.js
python中定义结构体的方法
2013/03/04 Python
使用python的chardet库获得文件编码并修改编码
2014/01/22 Python
利用Python绘制MySQL数据图实现数据可视化
2015/03/30 Python
为Python程序添加图形化界面的教程
2015/04/29 Python
python交互式图形编程实例(一)
2017/11/17 Python
完美解决python中ndarray 默认用科学计数法显示的问题
2018/07/14 Python
Python3.7安装keras和TensorFlow的教程图解
2020/06/18 Python
Django中自定义查询对象的具体使用
2019/10/13 Python
Python利用Scrapy框架爬取豆瓣电影示例
2020/01/17 Python
浅谈keras使用中val_acc和acc值不同步的思考
2020/06/18 Python
Python 使用生成器代替线程的方法
2020/08/04 Python
CSS3中的content属性使用示例
2015/07/20 HTML / CSS
施华洛世奇巴西官网:SWAROVSKI巴西
2019/12/03 全球购物
应用化学专业本科生求职信
2013/09/29 职场文书
三方股东合作协议书范本
2014/09/28 职场文书
应聘教师自荐信
2015/03/26 职场文书
2015年试用期工作总结范文
2015/05/28 职场文书
2015年政治教研组工作总结
2015/07/22 职场文书
消防安全培训工作总结
2015/10/23 职场文书
2016年秋季趣味运动会开幕词
2016/03/04 职场文书