pandas统计重复值次数的方法实现


Posted in Python onFebruary 20, 2021

本文主要介绍了pandas统计重复值次数的方法实现,分享给大家,具体如下:

from pandas import DataFrame

df = DataFrame({'key1':['a','a','b','b','a','a'],
        'key2':['one','two','one','two','one','one'],
        'data1':[1,2,3,2,1,1],
        # 'data2':np.random.randn(5)
        })
# 打印数据框
print(df)
#  data1 key1 key2
# 0   1  a one
# 1   2  a two
# 2   3  b one
# 3   2  b two
# 4   1  a one
# 5   1  a one

# 重复项
print(df[df.duplicated()])
#  data1 key1 key2
# 4   1  a one
# 5   1  a one

# 统计重复值
dup=df[df.duplicated()].count()
print(dup) # 最后两项重复
# data1  2
# key1   2
# key2   2

# 去除重复项
nodup=df[-df.duplicated()]
print(nodup)
#  data1 key1 key2
# 0   1  a one
# 1   2  a two
# 2   3  b one
# 3   2  b two

pandas 中 dataframe 重复元素个数的获取

方法有二:

1. 在调用duplicated方法后,非重复的元素会被标记为False,而重复的元素会被标记为True

count = 0
for i in users_info['user_id'].duplicated():
  if i == True:
    count = count + 1
count

【注1】users_info为一个dataframe框,user_id为其中一列

【注2】duplicated( )方法只会把重复的元素标记为True,而不会标记被重复的元素

2.这行代码的速度更快,drop_duplicates(['user_id'])方法为删除user_id列中相同的元素

users_info.shape[0] - users_info.drop_duplicates(['user_id']).shape[0]

【注】shape[0] 为获取行数

到此这篇关于pandas统计重复值次数的方法实现的文章就介绍到这了,更多相关pandas统计重复值次数内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
python使用Image处理图片常用技巧分析
Jun 01 Python
Python利用Beautiful Soup模块修改内容方法示例
Mar 27 Python
老生常谈Python基础之字符编码
Jun 14 Python
Python+OpenCV人脸检测原理及示例详解
Oct 19 Python
Python 实现引用其他.py文件中的类和类的方法
Apr 29 Python
windows下pycharm安装、创建文件、配置默认模板
Jul 31 Python
Python中fnmatch模块的使用详情
Nov 30 Python
pytorch 图像预处理之减去均值,除以方差的实例
Jan 02 Python
使用Python和百度语音识别生成视频字幕的实现
Apr 09 Python
浅谈pymysql查询语句中带有in时传递参数的问题
Jun 05 Python
最简单的matplotlib安装教程(小白)
Jul 28 Python
Pyecharts 中Geo函数常用参数的用法说明
Feb 01 Python
pandas 按日期范围筛选数据的实现
Feb 20 #Python
基于Python-Pycharm实现的猴子摘桃小游戏(源代码)
Feb 20 #Python
pandas按条件筛选数据的实现
Feb 20 #Python
python实现b站直播自动发送弹幕功能
Feb 20 #Python
如何用 Python 制作 GitHub 消息助手
Feb 20 #Python
详解tf.device()指定tensorflow运行的GPU或CPU设备实现
Feb 20 #Python
Python 的 f-string 可以连接字符串与数字的原因解析
Feb 20 #Python
You might like
php去除换行符的方法小结(PHP_EOL变量的使用)
2013/02/16 PHP
ThinkPHP3.2.2的插件控制器功能简述
2014/07/09 PHP
浅谈php优化需要注意的地方
2014/11/27 PHP
Laravel Memcached缓存驱动的配置与应用方法分析
2016/10/08 PHP
Javascript与flash交互通信基础教程
2008/08/07 Javascript
JSON.parse 解析字符串出错的解决方法
2010/07/08 Javascript
js中判断数字\字母\中文的正则表达式 (实例)
2012/06/29 Javascript
鼠标放在图片上显示大图的JS代码
2013/03/26 Javascript
javascript中with()方法的语法格式及使用
2014/08/04 Javascript
Ext4.2的Ext.grid.plugin.RowExpander无法触发事件解决办法
2014/08/15 Javascript
js实现多选项切换导航菜单的方法
2015/02/06 Javascript
JS返回只包含数字类型的数组实例分析
2016/12/16 Javascript
BootStrap table删除指定行的注意事项(笔记整理)
2017/02/05 Javascript
值得分享和收藏的xmlplus组件学习教程
2017/05/05 Javascript
详解10分钟学会vue滚动行为
2017/09/21 Javascript
详解Vue中CSS样式穿透问题
2019/09/12 Javascript
使用JavaScript通过前端发送电子邮件
2020/05/22 Javascript
Python使用爬虫猜密码
2016/02/19 Python
详解python里的命名规范
2018/07/16 Python
使用python实现mqtt的发布和订阅
2019/05/05 Python
opencv调整图像亮度对比度的示例代码
2019/09/27 Python
python GUI库图形界面开发之PyQt5计数器控件QSpinBox详细使用方法与实例
2020/02/28 Python
使用python matploblib库绘制准确率,损失率折线图
2020/06/16 Python
详解Python yaml模块
2020/09/23 Python
AT&T Wireless:手机、无限数据计划和配件
2018/06/03 全球购物
维多利亚的秘密官方网站:Victoria’s Secret
2018/10/24 全球购物
婴儿地球:Baby Earth
2018/12/25 全球购物
2014元旦晚会策划方案
2014/02/19 职场文书
银行柜员求职自荐书
2014/06/18 职场文书
小学数学教研活动总结
2014/07/01 职场文书
授权委托书格式范文
2014/08/02 职场文书
个人授权委托书格式
2014/08/30 职场文书
团队会宣传标语
2014/10/09 职场文书
自主招生英文自荐信
2015/03/25 职场文书
演讲开场白和结束语
2015/05/29 职场文书
通过shell脚本对mysql的增删改查及my.cnf的配置
2021/07/07 MySQL