GROUP BY 聚合函数

    本文将详细介绍 TiDB 支持的聚合函数。

    TiDB 支持的 MySQL GROUP BY 聚合函数如下所示:

    另外,TiDB 还支持以下聚合函数:

    • APPROX_PERCENTILE(expr, constant_integer_expr)

      该函数用于计算 expr 值的百分位数。参数 constant_integer_expr 是一个取值为区间 [1,100] 内整数的常量表达式,表示百分数。一个百分位数 Pkk为百分数)表示数据集中至少有 k% 的数据小于等于 Pk

      以下是一个计算第 50 百分位数的例子:

      1. select approx_percentile(a, 50) from t;
      1. | approx_percentile(a, 50) |
      2. +--------------------------+
      3. +--------------------------+
      4. 1 row in set (0.00 sec)

    TiDB 目前不支持 GROUP BY 修饰符,例如 WITH ROLLUP,将来会提供支持。详情参阅 。

    TiDB 支持 SQL 模式 ONLY_FULL_GROUP_BY,当启用该模式时,TiDB 拒绝不明确的非聚合列的查询。例如,以下查询在启用 ONLY_FULL_GROUP_BY 时是不合规的,因为 SELECT 列表中的非聚合列 “b” 在 GROUP BY 语句中不显示:

    1. drop table if exists t;
    2. create table t(a bigint, b bigint, c bigint);
    3. insert into t values(1, 2, 3), (2, 2, 3), (3, 2, 3);
    1. select a, b, sum(c) from t group by a;
    1. set sql_mode = 'ONLY_FULL_GROUP_BY';
    1. Query OK, 0 rows affected (0.00 sec)
    1. select a, b, sum(c) from t group by a;
    1. ERROR 1055 (42000): Expression #2 of SELECT list is not in GROUP BY clause and contains nonaggregated column 'b' which is not functionally dependent on columns in GROUP BY clause; this is incompatible with sql_mode=only_full_group_by

    目前,TiDB 默认开启 SQL 模式 ONLY_FULL_GROUP_BY

    TiDB 目前实现的 ONLY_FULL_GROUP_BY 没有 MySQL 5.7 严格。例如,假设我们执行以下查询,希望结果按 “c” 排序:

    要对结果进行排序,必须先清除重复。但选择保留哪一行会影响 c 的保留值,也会影响排序,并使其具有任意性。

    • 表达式等同于 SELECT 列表中的一个。
    • 表达式引用并属于查询选择表的所有列都是 SELECT 列表的元素。

    但是在 TiDB 中,上述查询是合规的,详情参阅 。

    TiDB 中另一个标准 SQL 的扩展允许 HAVING 子句中的引用使用 SELECT 列表中的别名表达式。例如:以下查询返回在 orders 中只出现一次的 name 值:

    1. group by name
    2. having count(name) = 1;

    这个 TiDB 扩展允许在聚合列的 HAVING 子句中使用别名:

    1. select name, count(name) as c from orders
    2. group by name
    3. having c = 1;

    标准 SQL 只支持 GROUP BY 子句中的列表达式,以下语句不合规,因为 FLOOR(value/100) 是一个非列表达式:

    1. select id, floor(value/100)
    2. from tbl_name
    3. group by id, floor(value/100);

    TiDB 对标准 SQL 的扩展支持 GROUP BY 子句中非列表达式,认为上述语句合规。

    标准 SQL 也不支持 GROUP BY 子句中使用别名。TiDB 对标准 SQL 的扩展支持使用别名,查询的另一种写法如下:

    1. select id, floor(value/100) as val
    2. from tbl_name
    3. group by id, val;
    • JSON_ARRAYAGG