该语句用于创建物化视图。

    该操作为异步操作,提交成功后,需通过 SHOW ALTER TABLE MATERIALIZED VIEW 查看作业进度。在显示 FINISHED 后既可通过 命令来查看物化视图的 schema 了。

    语法:

    说明:

    • MV name:物化视图的名称,必填项。相同表的物化视图名称不可重复。

    • query:用于构建物化视图的查询语句,查询语句的结果既物化视图的数据。目前支持的 query 格式为:

      1. SELECT select_expr[, select_expr ...]
      2. FROM [Base view name]
      3. GROUP BY column_name[, column_name ...]
      4. ORDER BY column_name[, column_name ...]

      语法和查询语句语法一致。

      • select_expr:物化视图的 schema 中所有的列。
        • 仅支持不带表达式计算的单列,聚合列。
        • 其中聚合函数目前仅支持 SUM, MIN, MAX 三种,且聚合函数的参数只能是不带表达式计算的单列。
        • 至少包含一个单列。
        • 所有涉及到的列,均只能出现一次。
      • base view name:物化视图的原始表名,必填项。
        • 必须是单表,且非子查询
      • group by:物化视图的分组列,选填项。
        • 不填则数据不进行分组。
      • order by:物化视图的排序列,选填项。
        • 排序列的声明顺序必须和 select_expr 中列声明顺序一致。
        • 如果不声明 order by,则根据规则自动补充排序列。 如果物化视图是聚合类型,则所有的分组列自动补充为排序列。 如果物化视图是非聚合类型,则前 36 个字节自动补充为排序列。
        • 如果自动补充的排序个数小于3个,则前三个作为排序列。 如果 query 中包含分组列的话,则排序列必须和分组列一致。
    • 声明物化视图的一些配置,选填项。

      1. PROPERTIES ("key" = "value", "key" = "value" ...)

      以下几个配置,均可声明在此处:

      1. short_key: 排序列的个数。
      2. timeout: 物化视图构建的超时时间。

    Base 表结构为

    1. mysql> desc duplicate_table;
    2. +-------+--------+------+------+---------+-------+
    3. | Field | Type | Null | Key | Default | Extra |
    4. +-------+--------+------+------+---------+-------+
    5. | k1 | INT | Yes | true | N/A | |
    6. | k2 | INT | Yes | true | N/A | |
    7. | k4 | BIGINT | Yes | true | N/A | |
    8. +-------+--------+------+------+---------+-------+
    1. create table duplicate_table(
    2. k1 int null,
    3. k2 int null,
    4. k3 bigint null,
    5. k4 bigint null
    6. duplicate key (k1,k2,k3,k4)
    7. distributed BY hash(k4) buckets 3
    8. properties("replication_num" = "1");

    注意:如果物化视图包含了base表的分区列和分桶列,那么这些列必须作为物化视图中的key列

    1. 创建一个仅包含原始表 (k1, k2)列的物化视图

      物化视图的 schema 如下图,物化视图仅包含两列 k1, k2 且不带任何聚合

      1. +-----------------+-------+--------+------+------+---------+-------+
      2. | IndexName | Field | Type | Null | Key | Default | Extra |
      3. +-----------------+-------+--------+------+------+---------+-------+
      4. | k1_k2 | k1 | INT | Yes | true | N/A | |
      5. | | k2 | INT | Yes | true | N/A | |
      6. +-----------------+-------+--------+------+------+---------+-------+
    2. 创建一个以 k2 为排序列的物化视图

      1. create materialized view k2_order as
      2. select k2, k1 from duplicate_table order by k2;
      1. +-----------------+-------+--------+------+-------+---------+-------+
      2. | IndexName | Field | Type | Null | Key | Default | Extra |
      3. +-----------------+-------+--------+------+-------+---------+-------+
      4. | k2_order | k2 | INT | Yes | true | N/A | |
      5. | | k1 | INT | Yes | false | N/A | NONE |
      6. +-----------------+-------+--------+------+-------+---------+-------+
    3. 创建一个以 k1, k2 分组,k3 列为 SUM 聚合的物化视图

      1. create materialized view k1_k2_sumk3 as
      2. select k1, k2, sum(k3) from duplicate_table group by k1, k2;

      物化视图的 schema 如下图,物化视图包含两列 k1, k2,sum(k3) 其中 k1, k2 为分组列,sum(k3) 为根据 k1, k2 分组后的 k3 列的求和值。

      由于物化视图没有声明排序列,且物化视图带聚合数据,系统默认补充分组列 k1, k2 为排序列。

      1. +-----------------+-------+--------+------+-------+---------+-------+
      2. | IndexName | Field | Type | Null | Key | Default | Extra |
      3. +-----------------+-------+--------+------+-------+---------+-------+
      4. | k1_k2_sumk3 | k1 | INT | Yes | true | N/A | |
      5. | | k3 | BIGINT | Yes | false | N/A | SUM |
      6. +-----------------+-------+--------+------+-------+---------+-------+
    4. 创建一个去除重复行的物化视图

      物化视图 schema 如下图,物化视图包含 k1, k2, k3, k4列,且不存在重复行。

      1. +-----------------+-------+--------+------+-------+---------+-------+
      2. +-----------------+-------+--------+------+-------+---------+-------+
      3. | deduplicate | k1 | INT | Yes | true | N/A | |
      4. | | k2 | INT | Yes | true | N/A | |
      5. | | k3 | BIGINT | Yes | true | N/A | |
      6. | | k4 | BIGINT | Yes | true | N/A | |
      7. +-----------------+-------+--------+------+-------+---------+-------+
    5. 创建一个不声明排序列的非聚合型物化视图

      all_type_table 的 schema 如下

      1. +-------+--------------+------+-------+---------+-------+
      2. | Field | Type | Null | Key | Default | Extra |
      3. +-------+--------------+------+-------+---------+-------+
      4. | k1 | TINYINT | Yes | true | N/A | |
      5. | k2 | SMALLINT | Yes | true | N/A | |
      6. | k3 | INT | Yes | true | N/A | |
      7. | k4 | BIGINT | Yes | true | N/A | |
      8. | k5 | DECIMAL(9,0) | Yes | true | N/A | |
      9. | k6 | DOUBLE | Yes | false | N/A | NONE |
      10. | k7 | VARCHAR(20) | Yes | false | N/A | NONE |
      11. +-------+--------------+------+-------+---------+-------+
      1. create materialized view mv_1 as
      2. select k3, k4, k5, k6, k7 from all_type_table;

      系统默认补充的排序列为 k3, k4, k5 三列。这三列类型的字节数之和为 4(INT) + 8(BIGINT) + 16(DECIMAL) = 28 < 36。所以补充的是这三列作为排序列。 物化视图的 schema 如下,可以看到其中 k3, k4, k5 列的 key 字段为 true,也就是排序列。k6, k7 列的 key 字段为 false,也就是非排序列。

      1. +----------------+-------+--------------+------+-------+---------+-------+
      2. | IndexName | Field | Type | Null | Key | Default | Extra |
      3. +----------------+-------+--------------+------+-------+---------+-------+
      4. | mv_1 | k3 | INT | Yes | true | N/A | |
      5. | | k4 | BIGINT | Yes | true | N/A | |
      6. | | k5 | DECIMAL(9,0) | Yes | true | N/A | |
      7. | | k6 | DOUBLE | Yes | false | N/A | NONE |
      8. | | k7 | VARCHAR(20) | Yes | false | N/A | NONE |