缓存表

    本文介绍了 TiDB 缓存表的使用场景、使用示例、与其他 TiDB 功能的兼容性限制。

    TiDB 缓存表功能适用于以下特点的表:

    • 表的数据量不大
    • 只读表,或者几乎很少修改
    • 表的访问很频繁,期望有更好的读性能

    当表的数据量不大,访问又特别频繁的情况下,数据会集中在 TiKV 一个 Region 上,形成热点,从而影响性能。因此,TiDB 缓存表的典型使用场景如下:

    • 配置表,业务通过该表读取配置信息
    • 金融场景中的存储汇率的表,该表不会实时更新,每天只更新一次
    • 银行分行或者网点信息表,该表很少新增记录项

    以配置表为例,当业务重启的瞬间,全部连接一起加载配置,会造成较高的数据库读延迟。如果使用了缓存表,则可以解决这样的问题。

    使用示例

    本节通过示例介绍缓存表的使用方法。

    假设已存在普通表 :

    通过 ALTER TABLE 语句,可以将这张表设置成缓存表:

    1. ALTER TABLE users CACHE;
    1. Query OK, 0 rows affected (0.01 sec)

    要验证一张表是否为缓存表,使用 SHOW CREATE TABLE 语句。如果为缓存表,返回结果中会带有 CACHED ON 属性:

    1. SHOW CREATE TABLE users;
    1. +-------+----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------+
    2. | Table | Create Table |
    3. +-------+----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------+
    4. | users | CREATE TABLE `users` (
    5. `id` bigint(20) NOT NULL,
    6. `name` varchar(100) DEFAULT NULL,
    7. PRIMARY KEY (`id`) /*T![clustered_index] CLUSTERED */
    8. +-------+----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------+
    9. 1 row in set (0.00 sec)
    1. TRACE SELECT * FROM users;
    1. +------------------------------------------------+-----------------+------------+
    2. | operation | startTS | duration |
    3. +------------------------------------------------+-----------------+------------+
    4. | trace | 17:47:39.969980 | 827.73µs |
    5. | ├─session.ExecuteStmt | 17:47:39.969986 | 413.31µs |
    6. | ├─executor.Compile | 17:47:39.969993 | 198.29µs |
    7. | └─TableReaderExecutor.Open | 17:47:39.970294 | 47.068µs |
    8. | └─distsql.Select | 17:47:39.970312 | 24.729µs |
    9. | └─regionRequest.SendReqCtx | 17:47:39.970454 | 189.601µs |
    10. | ├─*executor.UnionScanExec.Next | 17:47:39.970407 | 353.073µs |
    11. | ├─*executor.TableReaderExecutor.Next | 17:47:39.970411 | 301.106µs |
    12. | └─*executor.TableReaderExecutor.Next | 17:47:39.970746 | 6.57µs |
    13. | └─*executor.UnionScanExec.Next | 17:47:39.970772 | 17.589µs |
    14. | └─*executor.TableReaderExecutor.Next | 17:47:39.970776 | 6.59µs |
    15. +------------------------------------------------+-----------------+------------+
    16. 12 rows in set (0.01 sec)

    而再次执行 trace,返回结果中不再有 regionRequest.SendReqCtx,表示 TiDB 已经不再从 TiKV 读取数据,而是直接从内存中读取:

    注意,读取缓存表会使用 UnionScan 算子,所以通过 explain 查看缓存表的执行计划时,可能会在结果中看到 UnionScan

    1. +-------------------------+---------+-----------+---------------+--------------------------------+
    2. | id | estRows | task | access object | operator info |
    3. +-------------------------+---------+-----------+---------------+--------------------------------+
    4. | UnionScan_5 | 1.00 | root | | |
    5. | └─TableReader_7 | 1.00 | root | | data:TableFullScan_6 |
    6. | └─TableFullScan_6 | 1.00 | cop[tikv] | table:users | keep order:false, stats:pseudo |
    7. 3 rows in set (0.00 sec)

    缓存表支持写入数据。例如,往 users 表中插入一条记录:

    1. INSERT INTO users(id, name) VALUES(1001, 'Davis');
    1. SELECT * FROM users;
    1. +------+-------+
    2. | id | name |
    3. +------+-------+
    4. | 1001 | Davis |
    5. +------+-------+
    6. 1 row in set (0.00 sec)

    注意

    往缓存表写入数据时,有可能出现秒级别的写入延迟。延迟的时长由全局环境变量 控制。你可根据实际业务能否承受此限制带来的延迟,决定是否适合使用缓存表功能。例如,对于完全只读的场景,可以将 tidb_table_cache_lease 调大:

    1. set @@global.tidb_table_cache_lease = 10;

    缓存表的写入延时高是受到实现的限制。存在多个 TiDB 实例时,一个 TiDB 实例并不知道其它的 TiDB 实例是否缓存了数据,如果该实例直接修改了表数据,而其它 TiDB 实例依然读取旧的缓存数据,就会读到错误的结果。为了保证数据正确性,缓存表的实现使用了一套基于 lease 的复杂机制:读操作在缓存数据同时,还会对于缓存设置一个有效期,也就是 lease。在 lease 过期之前,无法对数据执行修改操作。因为修改操作必须等待 lease 过期,所以会出现写入延迟。

    缓存表相关的元信息存储在 mysql.table_cache_meta 表中。这张表记录了所有缓存表的 ID、当前的锁状态 lock_type,以及锁租约 lease 相关的信息。这张表仅供 TiDB 内部使用,不建议用户修改该表,否则可能导致不可预期的错误。

    缓存表 - 图2

    对缓存表执行 DDL 语句会失败。若要对缓存表执行 DDL 语句,需要先去掉缓存属性,将缓存表设回普通表后,才能对其执行 DDL 语句。

    1. TRUNCATE TABLE users;
    1. ERROR 8242 (HY000): 'Truncate Table' is unsupported on cache tables.
    1. mysql> ALTER TABLE users ADD INDEX k_id(id);
    1. ERROR 8242 (HY000): 'Alter Table' is unsupported on cache tables.

    使用 ALTER TABLE t NOCACHE 语句可以将缓存表恢复成普通表:

    1. ALTER TABLE users NOCACHE
    1. Query OK, 0 rows affected (0.00 sec)

    由于 TiDB 将整张缓存表的数据加载到 TiDB 进程的内存中,并且执行修改操作后缓存会失效,需要重新加载,所以 TiDB 缓存表只适用于表比较小的场景。

    目前 TiDB 对于每张缓存表的大小限制为 64 MB。如果表的数据超过了 64 MB,执行 ALTER TABLE t CACHE 会失败。

    与其他 TiDB 功能的兼容性限制

    以下是缓存表不支持的功能:

    • 不支持对分区表执行 ALTER TABLE t CACHE 操作
    • 不支持对临时表执行 ALTER TABLE t CACHE 操作
    • 不支持对视图执行 ALTER TABLE t CACHE 操作
    • 不支持 Stale Read 功能
    • 不支持对缓存表直接做 DDL 操作,需要先通过 ALTER TABLE t NOCACHE 将缓存表改回普通表后再进行 DDL 操作。

    以下是缓存表无法使用缓存的场景:

    • 设置系统变量 tidb_snapshot 读取历史数据
    • 执行修改操作期间,已有缓存会失效,直到数据被再次加载

    缓存表并不是标准的 MySQL 功能,而是 TiDB 扩展。只有 TiDB 能识别 语句。所有的 TiDB 数据迁移工具均不支持缓存表功能,包括 Backup & Restore (BR)、TiCDC、Dumpling 等组件,它们会将缓存表当作普通表处理。

    这意味着,备份恢复一张缓存表时,它会变成一张普通表。如果下游集群是另一套 TiDB 集群并且你希望继续使用缓存表功能,可以对下游集群中的表执行 ALTER TABLE ... CACHE 手动开启缓存表功能。

    另请参阅