python中pandas对多列进行分组统计的实现


Posted in Python onJune 18, 2021

使用groupby([ ]).size()统计的结果,值相同的字段值会不显示

python中pandas对多列进行分组统计的实现

如上图所示,第一个空着的行是982499 7 3388 1,因为此行与前面一行的这两个字段值是一样的,所以不显示。第二个空着的行是390192 22 4278 1,因为此行与前面一行的第一个字段值是一样的,所以不显示。这样的展示方式更直观,但对于刚用的人,可能会让其以为是缺失值。

如果还不明白可以看下面的全部数据及操作。

import pandas as pd
res6 = pd.read_csv('test.csv')
res6.shape
(12, 3)
res6.columns
Index(['user_id', 'cate', 'shop_id'], dtype='object')
res6.info()
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 12 entries, 0 to 11
Data columns (total 3 columns):
user_id    12 non-null int64
cate       12 non-null int64
shop_id    12 non-null int64
dtypes: int64(3)
memory usage: 368.0 bytes
res6.describe()

 

  user_id cate shop_id
count 1.200000e+01 12.000000 12.000000
mean 6.468688e+05 10.666667 3594.000000
std 3.988181e+05 6.665151 373.271775
min 2.421410e+05 7.000000 3388.000000
25% 3.901920e+05 7.000000 3388.000000
50% 4.938730e+05 7.000000 3388.000000
75% 9.824990e+05 10.250000 3586.250000
max 1.558165e+06 23.000000 4278.000000
res6

 

  user_id cate shop_id
0 390192 20 4178
1 390192 23 4179
2 390192 22 4278
3 1021819 7 3388
4 242141 7 3388
5 283284 7 3388
6 1558165 7 3388
7 533696 7 3388
8 982499 7 3388
9 493873 7 3388
10 493873 7 3388
11 982499 7 3389
res6['user_id'].value_counts()
390192     3
982499     2
493873     2
242141     1
1021819    1
533696     1
1558165    1
283284     1
Name: user_id, dtype: int64
res6.groupby(['user_id']).size().sort_values(ascending=False)
user_id
390192     3
982499     2
493873     2
1558165    1
1021819    1
533696     1
283284     1
242141     1
dtype: int64
res6.groupby(['user_id', 'cate']).size().sort_values(ascending=False)
user_id  cate
982499   7       2
493873   7       2
1558165  7       1
1021819  7       1
533696   7       1
390192   23      1
         22      1
         20      1
283284   7       1
242141   7       1
dtype: int64
res6_test = res6.groupby(['user_id', 'cate', 'shop_id']).size().sort_values(ascending=False)
res6_test
user_id  cate  shop_id
493873   7     3388       2
1558165  7     3388       1
1021819  7     3388       1
982499   7     3389       1
               3388       1
533696   7     3388       1
390192   23    4179       1
         22    4278       1
         20    4178       1
283284   7     3388       1
242141   7     3388       1
dtype: int64

到此这篇关于python中pandas对多列进行分组统计的实现的文章就介绍到这了,更多相关pandas多列分组统计内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
Python中的对象,方法,类,实例,函数用法分析
Jan 15 Python
利用python获取某年中每个月的第一天和最后一天
Dec 15 Python
Python中的单继承与多继承实例分析
May 10 Python
Python发送邮件测试报告操作实例详解
Dec 08 Python
对Python实现简单的API接口实例讲解
Dec 10 Python
Python从数据库读取大量数据批量写入文件的方法
Dec 10 Python
python 使用socket传输图片视频等文件的实现方式
Aug 07 Python
关于阿里云oss获取sts凭证 app直传 python的实例
Aug 20 Python
Python内置方法实现字符串的秘钥加解密(推荐)
Dec 09 Python
python多线程使用方法实例详解
Dec 30 Python
python 基于opencv操作摄像头
Dec 24 Python
教你用Python爬取英雄联盟皮肤原画
Jun 13 Python
python 常用的异步框架汇总整理
Jun 18 #Python
Opencv中cv2.floodFill算法的使用
Python下opencv使用hough变换检测直线与圆
python 网络编程要点总结
Jun 18 #Python
python opencv检测直线 cv2.HoughLinesP的实现
Jun 18 #Python
教你用Python+selenium搭建自动化测试环境
Jun 18 #Python
详解Python函数print用法
Jun 18 #Python
You might like
用PHP动态生成虚拟现实VRML网页
2006/10/09 PHP
PHP文件缓存类实现代码
2015/10/26 PHP
jquery1.4.2 for Visual studio 2010 模板文件
2010/07/14 Javascript
jQuery 源码分析笔记(4) Ready函数
2011/06/02 Javascript
HTML长文本截取含有HTML代码同样适用的两种方法
2013/07/31 Javascript
jQuery函数的第二个参数获取指定上下文中的DOM元素
2014/05/19 Javascript
js实现图片点击左右轮播
2015/07/08 Javascript
JS实现DIV容器赋值的方法
2015/12/14 Javascript
轻松实现js图片预览功能
2016/01/18 Javascript
node.js实现快速截图
2016/08/27 Javascript
如何处理JSON中的特殊字符
2016/11/30 Javascript
jQuery实现遮罩层登录对话框
2016/12/29 Javascript
js自定义弹框插件的封装
2020/08/24 Javascript
js html实现计算器功能
2018/11/13 Javascript
react native 仿微信聊天室实例代码
2019/09/17 Javascript
layui点击左侧导航栏,实现不刷新整个页面,只刷新局部的方法
2019/09/25 Javascript
从零使用TypeScript开发项目打包发布到npm
2020/02/14 Javascript
js实现简易ATM功能
2020/10/27 Javascript
flask中使用SQLAlchemy进行辅助开发的代码
2013/02/10 Python
Python中文件操作简明介绍
2015/04/13 Python
Python AES加密模块用法分析
2017/05/22 Python
python分布式环境下的限流器的示例
2017/10/26 Python
python 如何将数据写入本地txt文本文件的实现方法
2019/09/11 Python
浅谈在JupyterNotebook下导入自己的模块的问题
2020/04/16 Python
matplotlib 生成的图像中无法显示中文字符的解决方法
2020/06/10 Python
Guess美国官网:美国知名服装品牌
2019/04/08 全球购物
艺术专业大学生自我评价
2013/09/22 职场文书
青年创业培训欢迎词
2014/01/08 职场文书
国培教师自我鉴定
2014/02/12 职场文书
运动员口号
2014/06/09 职场文书
领导班子个人对照检查材料(群众路线)
2014/09/26 职场文书
2015年度信用社工作总结
2015/05/04 职场文书
民事上诉状范文
2015/05/22 职场文书
2016年世界人口日宣传活动总结
2016/04/05 职场文书
导游词之太行山青龙峡
2020/01/14 职场文书
Python 统计序列中元素的出现频度
2022/04/26 Python