pandas统计重复值次数的方法实现


Posted in Python onFebruary 20, 2021

本文主要介绍了pandas统计重复值次数的方法实现,分享给大家,具体如下:

from pandas import DataFrame

df = DataFrame({'key1':['a','a','b','b','a','a'],
        'key2':['one','two','one','two','one','one'],
        'data1':[1,2,3,2,1,1],
        # 'data2':np.random.randn(5)
        })
# 打印数据框
print(df)
#  data1 key1 key2
# 0   1  a one
# 1   2  a two
# 2   3  b one
# 3   2  b two
# 4   1  a one
# 5   1  a one

# 重复项
print(df[df.duplicated()])
#  data1 key1 key2
# 4   1  a one
# 5   1  a one

# 统计重复值
dup=df[df.duplicated()].count()
print(dup) # 最后两项重复
# data1  2
# key1   2
# key2   2

# 去除重复项
nodup=df[-df.duplicated()]
print(nodup)
#  data1 key1 key2
# 0   1  a one
# 1   2  a two
# 2   3  b one
# 3   2  b two

pandas 中 dataframe 重复元素个数的获取

方法有二:

1. 在调用duplicated方法后,非重复的元素会被标记为False,而重复的元素会被标记为True

count = 0
for i in users_info['user_id'].duplicated():
  if i == True:
    count = count + 1
count

【注1】users_info为一个dataframe框,user_id为其中一列

【注2】duplicated( )方法只会把重复的元素标记为True,而不会标记被重复的元素

2.这行代码的速度更快,drop_duplicates(['user_id'])方法为删除user_id列中相同的元素

users_info.shape[0] - users_info.drop_duplicates(['user_id']).shape[0]

【注】shape[0] 为获取行数

到此这篇关于pandas统计重复值次数的方法实现的文章就介绍到这了,更多相关pandas统计重复值次数内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
python将文本转换成图片输出的方法
Apr 28 Python
Python实现的HTTP并发测试完整示例
Apr 23 Python
Python中音频处理库pydub的使用教程
Jun 07 Python
Python random模块用法解析及简单示例
Dec 18 Python
Python实现的计算器功能示例
Apr 26 Python
Python3模拟登录操作实例分析
Mar 12 Python
Python初学者常见错误详解
Jul 02 Python
python树的同构学习笔记
Sep 14 Python
Django实现WebSSH操作物理机或虚拟机的方法
Nov 06 Python
如何基于python实现画不同品种的樱花树
Jan 03 Python
opencv中图像叠加/图像融合/按位操作的实现
Apr 01 Python
Python爬取你好李焕英豆瓣短评生成词云的示例代码
Feb 24 Python
pandas 按日期范围筛选数据的实现
Feb 20 #Python
基于Python-Pycharm实现的猴子摘桃小游戏(源代码)
Feb 20 #Python
pandas按条件筛选数据的实现
Feb 20 #Python
python实现b站直播自动发送弹幕功能
Feb 20 #Python
如何用 Python 制作 GitHub 消息助手
Feb 20 #Python
详解tf.device()指定tensorflow运行的GPU或CPU设备实现
Feb 20 #Python
Python 的 f-string 可以连接字符串与数字的原因解析
Feb 20 #Python
You might like
php sprintf()函数让你的sql操作更安全
2008/07/23 PHP
PHP 万年历实现代码
2012/10/18 PHP
destoon整合UCenter图文教程
2014/06/21 PHP
php实现获取局域网所有用户的电脑IP和主机名、及mac地址完整实例
2014/07/18 PHP
PHP中读取照片exif信息的方法
2014/08/20 PHP
php通过记录IP来防止表单重复提交方法分析
2014/12/16 PHP
PHP curl使用实例
2015/07/02 PHP
PHP安全之register_globals的on和off的区别
2020/07/23 PHP
PHP+Mysql分布式事务与解决方案深入理解
2021/02/27 PHP
JavaScript asp.net 获取当前超链接中的文本
2009/04/14 Javascript
15 个 JavaScript Web UI 库
2010/05/19 Javascript
js触发onchange事件的方法说明
2014/03/08 Javascript
javascript监听鼠标滚轮事件浅析
2014/06/05 Javascript
学习Angular中作用域需要注意的坑
2016/08/17 Javascript
JS不完全国际化&本地化手册 之 理论篇
2016/09/27 Javascript
浅谈使用splice函数对数组中的元素进行删除时的注意事项
2016/12/04 Javascript
详解jQuery停止动画——stop()方法的使用
2016/12/14 Javascript
微信小程序 Button 组件详解及简单实例
2017/01/10 Javascript
javascript实现复选框全选或反选
2017/02/04 Javascript
从零学习node.js之详解异步控制工具async(八)
2017/02/27 Javascript
Vue数字输入框组件使用方法详解
2020/02/10 Javascript
JS严格模式原理与用法实例分析
2020/04/27 Javascript
详解 Python中LEGB和闭包及装饰器
2017/08/03 Python
Python数据处理numpy.median的实例讲解
2018/04/02 Python
Python  Django 母版和继承解析
2019/08/09 Python
PyQt5+Pycharm安装和配置图文教程详解
2020/03/24 Python
Python使用windows设置定时执行脚本
2020/11/12 Python
CSS3 优势以及网页设计师如何使用CSS3技术
2009/07/29 HTML / CSS
《厄运打不垮的信念》教学反思
2014/04/13 职场文书
会员活动策划方案
2014/08/19 职场文书
2014年幼师工作总结
2014/11/22 职场文书
2015大学党建带团建工作总结
2015/07/23 职场文书
街道办残联2016年助残日活动总结
2016/04/01 职场文书
求职自荐信该如何书写?
2019/06/24 职场文书
python可视化之颜色映射详解
2021/09/15 Python
Python 恐龙跑跑小游戏实现流程
2022/02/15 Python