SQL 聚合查询

最新推荐文章于 2024-02-16 20:50:27 发布

WayBling

最新推荐文章于 2024-02-16 20:50:27 发布

阅读量2.3w

点赞数 14

本文链接：https://blog.csdn.net/picway/article/details/80719497

版权

如果我们要统计一张表的数据量，例如，想查询students表一共有多少条记录，难道必须用SELECT * FROM students查出来然后再数一数有多少行吗？

这个方法当然可以，但是比较弱智。对于统计总数、平均数这类计算，SQL提供了专门的聚合函数，使用聚合函数进行查询，就是聚合查询，它可以快速获得结果。
仍然以查询students表一共有多少条记录为例，我们可以使用SQL内置的COUNT()函数查询：

SELECT COUNT(*) FROM students;

COUNT()表示查询所有列的行数，要注意聚合的计算结果虽然是一个数字，但查询的结果仍然是一个二维表，只是这个二维表只有一行一列，并且列名是COUNT()。
通常，使用聚合查询时，我们应该给列名设置一个别名，便于处理结果：

SELECT COUNT(*) num FROM students;

所有的UDAF（即聚合函数）都应该支持分组查询，内置的聚合函数有：

sum(列名) 求和  　　　　
max(列名) 最大值 　　　　
min(列名) 最小值 　　　　
avg(列名) 平均值 　　　　
first(列名)   第一条记录   
last(列名)    最后一条记录  
count(列名)   统计记录数   注意和count(*)的区别

COUNT(*)和COUNT(id)实际上是一样的效果。另外注意，聚合查询同样可以使用WHERE条件，因此我们可以方便地统计出有多少男生、多少女生、多少80分以上的学生等：

SELECT COUNT(*) boys FROM students WHERE gender = 'M';

除了COUNT()函数外，SQL还提供了如下聚合函数：

谈到聚合查询必然会涉及group by

“Group By”从字面意义上理解就是根据“By”指定的规则对数据进行分组，所谓的分组就是将一个“数据集”划分成若干个“小区域”，然后针对若干个“小区域”进行数据处理。

聚合函数和分组查询结合在一起，可以更方便灵活地进行数据查询。

SELECT COUNT(*) boys FROM students GROUP BY age;

where 子句的作用是在对查询结果进行分组前，将不符合where条件的行去掉，即在分组之前过滤数据，where条件中不能包含聚组函数，使用where条件过滤出特定的行。

having 子句的作用是筛选满足条件的组，即在分组之后过滤数据，条件中经常包含聚组函数，使用having 条件过滤出特定的组，也可以使用多个分组标准进行分组。

结合之前的文章，总结一下过滤的顺序

on->join->where->group by->having

解释一下，on是在join之前，很容易理解，join要根据on的条件生成键进行MR计算，where对于发生在join 之后，因此where里的过滤条件不会减少数据输入量，不过分区限制会。group by会对where过滤后的数据分组并进行聚合，having则对聚合后的结果再进行过滤。

关注