python中pandas对多列进行分组统计的实现


Posted in Python onJune 18, 2021

使用groupby([ ]).size()统计的结果,值相同的字段值会不显示

python中pandas对多列进行分组统计的实现

如上图所示,第一个空着的行是982499 7 3388 1,因为此行与前面一行的这两个字段值是一样的,所以不显示。第二个空着的行是390192 22 4278 1,因为此行与前面一行的第一个字段值是一样的,所以不显示。这样的展示方式更直观,但对于刚用的人,可能会让其以为是缺失值。

如果还不明白可以看下面的全部数据及操作。

import pandas as pd
res6 = pd.read_csv('test.csv')
res6.shape
(12, 3)
res6.columns
Index(['user_id', 'cate', 'shop_id'], dtype='object')
res6.info()
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 12 entries, 0 to 11
Data columns (total 3 columns):
user_id    12 non-null int64
cate       12 non-null int64
shop_id    12 non-null int64
dtypes: int64(3)
memory usage: 368.0 bytes
res6.describe()

 

  user_id cate shop_id
count 1.200000e+01 12.000000 12.000000
mean 6.468688e+05 10.666667 3594.000000
std 3.988181e+05 6.665151 373.271775
min 2.421410e+05 7.000000 3388.000000
25% 3.901920e+05 7.000000 3388.000000
50% 4.938730e+05 7.000000 3388.000000
75% 9.824990e+05 10.250000 3586.250000
max 1.558165e+06 23.000000 4278.000000
res6

 

  user_id cate shop_id
0 390192 20 4178
1 390192 23 4179
2 390192 22 4278
3 1021819 7 3388
4 242141 7 3388
5 283284 7 3388
6 1558165 7 3388
7 533696 7 3388
8 982499 7 3388
9 493873 7 3388
10 493873 7 3388
11 982499 7 3389
res6['user_id'].value_counts()
390192     3
982499     2
493873     2
242141     1
1021819    1
533696     1
1558165    1
283284     1
Name: user_id, dtype: int64
res6.groupby(['user_id']).size().sort_values(ascending=False)
user_id
390192     3
982499     2
493873     2
1558165    1
1021819    1
533696     1
283284     1
242141     1
dtype: int64
res6.groupby(['user_id', 'cate']).size().sort_values(ascending=False)
user_id  cate
982499   7       2
493873   7       2
1558165  7       1
1021819  7       1
533696   7       1
390192   23      1
         22      1
         20      1
283284   7       1
242141   7       1
dtype: int64
res6_test = res6.groupby(['user_id', 'cate', 'shop_id']).size().sort_values(ascending=False)
res6_test
user_id  cate  shop_id
493873   7     3388       2
1558165  7     3388       1
1021819  7     3388       1
982499   7     3389       1
               3388       1
533696   7     3388       1
390192   23    4179       1
         22    4278       1
         20    4178       1
283284   7     3388       1
242141   7     3388       1
dtype: int64

到此这篇关于python中pandas对多列进行分组统计的实现的文章就介绍到这了,更多相关pandas多列分组统计内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
Python最长公共子串算法实例
Mar 07 Python
python3如何将docx转换成pdf文件
Mar 23 Python
python3写的简单本地文件上传服务器实例
Jun 04 Python
python中正则表达式 re.findall 用法
Oct 23 Python
对Python3使运行暂停的方法详解
Feb 18 Python
谈一谈基于python的面向对象编程基础
May 21 Python
Django 响应数据response的返回源码详解
Aug 06 Python
django组合搜索实现过程详解(附代码)
Aug 06 Python
python SocketServer源码深入解读
Sep 17 Python
django中的图片验证码功能
Sep 18 Python
Python使用gluon/mxnet模块实现的mnist手写数字识别功能完整示例
Dec 18 Python
Python 从attribute到property详解
Mar 05 Python
python 常用的异步框架汇总整理
Jun 18 #Python
Opencv中cv2.floodFill算法的使用
Python下opencv使用hough变换检测直线与圆
python 网络编程要点总结
Jun 18 #Python
python opencv检测直线 cv2.HoughLinesP的实现
Jun 18 #Python
教你用Python+selenium搭建自动化测试环境
Jun 18 #Python
详解Python函数print用法
Jun 18 #Python
You might like
php eval函数用法 PHP中eval()函数小技巧
2012/10/31 PHP
使用PHP实现蜘蛛访问日志统计
2013/07/05 PHP
php中chdir()函数用法实例
2014/11/13 PHP
在html页面上拖放移动标签
2010/01/08 Javascript
JQuery中的ready函数冲突的解决方法
2010/05/17 Javascript
在js中判断checkboxlist(.net控件客户端id)是否有选中
2013/04/11 Javascript
jQuery简单实现banner图片切换
2014/01/02 Javascript
为jquery的ajaxfileupload增加附加参数的方法
2014/03/04 Javascript
seajs加载jquery时提示$ is not a function该怎么解决
2015/10/23 Javascript
js自调用匿名函数的三种写法(推荐)
2016/08/19 Javascript
AngularJS实现表单验证功能
2017/01/09 Javascript
BootstrapTable请求数据时设置超时(timeout)的方法
2017/01/22 Javascript
详解vue-cli构建项目反向代理配置
2017/09/07 Javascript
vue利用axios来完成数据的交互
2018/03/23 Javascript
VUE 配置vue-devtools调试工具及安装方法
2018/09/30 Javascript
JS实现换肤功能的方法实例详解
2019/01/30 Javascript
vue遍历生成的输入框 绑定及修改值示例
2019/10/30 Javascript
解决$store.getters调用不执行的问题
2019/11/08 Javascript
JavaScript 接口原理与用法实例详解
2020/05/12 Javascript
在webstorm中配置less的方法详解
2020/09/25 Javascript
Python的Django框架中TEMPLATES项的设置教程
2015/05/29 Python
Python实现翻转数组功能示例
2018/01/12 Python
python opencv之SURF算法示例
2018/02/24 Python
Python中的二维数组实例(list与numpy.array)
2018/04/13 Python
python中嵌套函数的实操步骤
2019/02/27 Python
如何使用 Python 读取文件和照片的创建日期
2020/09/05 Python
利用HTML5中的Canvas绘制一张笑脸的教程
2015/05/07 HTML / CSS
Myholidays美国:在线旅游网站
2019/08/16 全球购物
环境工程专业个人求职信
2013/12/05 职场文书
英文自荐信
2013/12/19 职场文书
入股协议书
2014/04/14 职场文书
支行行长竞聘演讲稿
2014/05/15 职场文书
十周年庆典策划方案
2014/06/03 职场文书
公司应聘自荐书
2014/06/14 职场文书
浅析CSS在DevTools 中架构演变
2021/10/05 HTML / CSS
python​格式化字符串
2022/04/20 Python