Django中Aggregation聚合的基本使用方法


Posted in Python onJuly 09, 2020

Django 的 filter、exclude 等方法使得对数据库的查询很方便了。这在数据量较小的时候还不错,但如果数据量很大,或者查询条件比较复杂,那么查询效率就会很低。

提高数据库查询效率可以通过原生 SQL 语句来实现,但是它的缺点就是需要开发者熟练掌握 SQL。倘若查询条件是动态变化的,则编写 SQL 会更加困难。

对于以便捷著称的 Django,怎么能忍受这样的事。于是就有了 Aggregation聚合 。

聚合最好的例子就是官网给的案例了:

# models.py

from django.db import models

class Author(models.Model):
  name = models.CharField(max_length=100)
  age = models.IntegerField()

class Publisher(models.Model):
  name = models.CharField(max_length=300)

class Book(models.Model):
  name = models.CharField(max_length=300)
  pages = models.IntegerField()
  price = models.DecimalField(max_digits=10, decimal_places=2)
  rating = models.FloatField()
  authors = models.ManyToManyField(Author)
  publisher = models.ForeignKey(Publisher, on_delete=models.CASCADE)
  pubdate = models.DateField()

class Store(models.Model):
  name = models.CharField(max_length=300)
  books = models.ManyToManyField(Book)

接下来可以这样求所有书籍的平均价格:

>>> from django.db.models import Avg, Max, Min

>>> Book.objects.all().aggregate(Avg('price'))
{'price__avg': Decimal('30.67')}

实际上可以省掉 all() :

>>> Book.objects.aggregate(Avg('price'))
{'price__avg': Decimal('30.67')}

还可以指定返回的键名:

>>> Book.objects.aggregate(price_avg=Avg('price'))
{'price_avg': Decimal('30.67')}

如果要获取所有书籍中的最高价格:

>>> Book.objects.aggregate(Max('price'))
{'price__max': Decimal('44')}

获取所有书籍中的最低价格:

>>> Book.objects.aggregate(Min('price'))
{'price__min': Decimal('12')}

aggregate() 方法返回的不再是 QuerySet 了,而是一个包含查询结果的字典。如果我要对 QerySet 中每个元素都进行聚合计算、并且返回的仍然是 QuerySet ,那就要用到 annotate() 方法了。

annotate 翻译过来就是 注解 ,它的作用有点像给 QuerySet 中的每个元素临时贴上一个临时的字段,字段的值是分组聚合运算的结果。

比方说要给查询集中的每本书籍都增加一个字段,字段内容是外链到书籍的作者的数量:

>>> from django.db.models import Count

>>> q = Book.objects.annotate(Count('authors'))
>>> q[0].authors__count
3

与 aggregate() 的语法类似,也可以给这个字段自定义个名字:

>>> q = Book.objects.annotate(a_count=Count('authors'))

跨外链查询字段也是可以的:

>>> s = Store.objects.annotate(min_price=Min('books__price'), max_price=Max('books__price'))

>>> s[0].min_price
Decimal('12')
>>> s[0].max_price
Decimal('44')

既然 annotate() 返回的是查询集,那么自然也可以和 filter() 、 exclude() 等查询方法组合使用:

>>> b = Book.objects.filter(name__startswith="Django").annotate(num_authors=Count('authors'))
>>> b[0].num_authors
4

联用的时候 filter 、 annotate 的顺序会影响返回结果,所以逻辑要想清楚。

也可以排序:

>>> Book.objects.annotate(num_authors=Count('authors')).order_by('num_authors')

总而言之, aggregate 和 annotate 用于组合查询。当你需要对某些字段进行聚合操作时(比如Sum, Avg, Max),请使用 aggregate 。如果你想要对数据集先进行分组(Group By)然后再进行某些聚合操作或排序时,请使用 annotate 。

进行此类查询有时候容易让人迷惑,如果你对查询的结果有任何的疑问,最好的方法就是直接查看它所执行的 SQL 原始语句,像这样:

>>> b = Book.objects.annotate(num_authors=Count('authors')).order_by('num_authors')
>>> print(b.query)
SELECT "aggregation_book"."id", "aggregation_book"."name",
"aggregation_book"."pages", "aggregation_book"."price",
"aggregation_book"."rating", "aggregation_book"."publisher_id", 
"aggregation_book"."pubdate", COUNT("aggregation_book_authors"."author_id") 
AS "num_authors" FROM "aggregation_book" LEFT OUTER JOIN "aggregation_book_authors" 
ON ("aggregation_book"."id" = "aggregation_book_authors"."book_id") 
GROUP BY "aggregation_book"."id", "aggregation_book"."name",
"aggregation_book"."pages", "aggregation_book"."price",
"aggregation_book"."rating", "aggregation_book"."publisher_id", 
"aggregation_book"."pubdate"
ORDER BY "num_authors" ASC

相关文档: Aggregation

复合使用聚合时的相互干扰问题: Count and Sum annotations interfere with each other

总结

到此这篇关于Django中Aggregation聚合的基本使用方法就介绍到这了,更多相关Django Aggregation聚合使用内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
浅析Python基础-流程控制
Mar 18 Python
Python get获取页面cookie代码实例
Sep 12 Python
python实现手机销售管理系统
Mar 19 Python
Django中在xadmin中集成DjangoUeditor过程详解
Jul 24 Python
python 实现矩阵按对角线打印
Nov 29 Python
2020新版本pycharm+anaconda+opencv+pyqt环境配置学习笔记,亲测可用
Mar 24 Python
django实现后台显示媒体文件
Apr 07 Python
Python中flatten( ),matrix.A用法说明
Jul 05 Python
Python txt文件常用读写操作代码实例
Aug 03 Python
pycharm 使用tab跳出正在编辑的括号(){}{}等问题
Feb 26 Python
你喜欢篮球吗?Python实现篮球游戏
Jun 11 Python
Python中else的三种使用场景
Jun 16 Python
Python  word实现读取及导出代码解析
Jul 09 #Python
推荐技术人员一款Python开源库(造数据神器)
Jul 08 #Python
实例讲解Python 迭代器与生成器
Jul 08 #Python
opencv 阈值分割的具体使用
Jul 08 #Python
如何表示python中的相对路径
Jul 08 #Python
如何卸载python插件
Jul 08 #Python
python中数字是否为可变类型
Jul 08 #Python
You might like
php接口与接口引用的深入解析
2013/08/09 PHP
php中foreach结合curl实现多线程的方法分析
2016/09/22 PHP
使用composer安装使用thinkphp6.0框架问题【视频教程】
2019/10/01 PHP
发现的以前不知道的函数
2006/09/19 Javascript
利用javascript查看html源文件
2006/11/08 Javascript
利用onresize使得div可以随着屏幕大小而自适应的代码
2010/01/15 Javascript
JavaScript中的细节分析
2012/06/30 Javascript
JS实现点击按钮自动增加一个单元格的方法
2015/03/09 Javascript
jQuery动态加载css文件实现方法
2016/06/15 Javascript
JS中闭包的经典用法小结(2则示例)
2016/12/28 Javascript
JavaScript数据类型和变量_动力节点Java学院整理
2017/06/26 Javascript
react-native 封装选择弹出框示例(试用ios&android)
2017/07/11 Javascript
JS和jQuery通过this获取html标签中的属性值(实例代码)
2017/09/11 jQuery
解决vue router组件状态刷新消失的问题
2018/08/01 Javascript
详解基于React.js和Node.js的SSR实现方案
2019/03/21 Javascript
python处理圆角图片、圆形图片的例子
2014/04/25 Python
Python抽象类的新写法
2015/06/18 Python
Python极简代码实现杨辉三角示例代码
2016/11/15 Python
python日期时间转为字符串或者格式化输出的实例
2018/05/29 Python
Python从Excel中读取日期一列的方法
2018/11/28 Python
pandas实现将dataframe满足某一条件的值选出
2019/06/12 Python
python下载的库包存放路径
2020/07/27 Python
python+django+selenium搭建简易自动化测试
2020/08/19 Python
去加拿大的旅行和假期:Canadian Affair
2016/10/25 全球购物
日本民宿预约平台:STAY JAPAN
2017/07/01 全球购物
光电信息专业应届生求职信
2013/10/07 职场文书
草船借箭教学反思
2014/02/03 职场文书
企业内控岗位的职责
2014/02/07 职场文书
自考毕业自我鉴定
2014/03/18 职场文书
影视广告专业求职信
2014/09/02 职场文书
学生吸烟检讨书
2014/09/14 职场文书
支部书记四风问题对照检查材料
2014/10/04 职场文书
2014年新农村建设工作总结
2014/12/01 职场文书
2014年政务公开工作总结
2014/12/09 职场文书
2015年小学美术工作总结
2015/05/25 职场文书
大学生奖学金获奖感言(范文)
2019/08/15 职场文书