分区

    特性简介

    数据分区是在一个节点内部对数据按照用户指定的策略做进一步的水平分表,将表按照指定范围划分为多个数据互不重叠的部分。

    对于大多数用户使用场景,分区表和普通表相比具有以下优点:

    • 改善查询性能:对分区对象的查询可以仅搜索自己关心的分区,提高检索效率。
    • 增强可用性:如果分区表的某个分区出现故障,表在其他分区的数据仍然可用。

    特性描述

    目前openGauss数据库支持范围分区表、列表分区表、哈希分区表、间隔分区表、二级分区表:

    • 范围分区表:将数据基于范围映射到每一个分区,这个范围是由创建分区表时指定的分区键决定的。这种分区方式是最为常用的。

    • 列表分区表:将数据基于各个分区内包含的键值映射到每一个分区,分区包含的键值在创建分区时指定。

      列表分区功能,即根据表的一列,将要插入表的记录中出现的键值分为若干个列表(这些列表在不同的分区里没有重叠),然后为每个列表创建一个分区,用来存储相应的数据。

    • 哈希分区表:将数据通过哈希映射到每一个分区,每一个分区中存储了具有相同哈希值的记录。

      哈希分区功能,即根据表的一列,通过内部哈希算法将要插入表的记录划分到对应的分区中。

    用户在CREATE TABLE时增加PARTITION参数,即表示针对此表应用数据分区功能。用户可以在实际使用中根据需要调整建表时的分区键,使每次查询结果尽可能存储在相同或者最少的分区内(称为“分区剪枝”),通过获取连续I/O大幅度提升查询性能。

    实际业务中,时间经常被作为查询对象的过滤条件。因此,用户可考虑选择时间列为分区键,键值范围可根据总数据量、一次查询数据量调整。

    支持范围分区表的合并功能。

    特性约束

    无。