元数据锁

    在 TiDB 中,对元数据对象的更改采用的是在线异步变更算法。事务在执行时会获取开始时对应的元数据快照。如果事务执行过程中相关表上发生了元数据的更改,为了保证数据的一致性,TiDB 会返回 的错误,导致用户事务提交失败。

    为了解决这个问题,在 TiDB v6.3.0 中,online DDL 算法中引入了元数据锁特性。通过协调表元数据变更过程中 DML 语句和 DDL 语句的优先级,让执行中的 DDL 语句等待持有旧版本元数据的 DML 语句提交,尽可能避免 DML 语句报错。

    适用场景

    元数据锁适用于所有的 DDL 语句,包括但不限于:

    使用元数据锁机制会给 TiDB DDL 任务的执行带来一定的性能影响。为了降低元数据锁对 DDL 任务的影响,下列场景不需要加元数据锁:

    • 开启了 auto-commit 的查询语句
    • 开启了 Stale Read 功能
    • 访问临时表

    在 v6.5.0 及之后的版本中,TiDB 默认开启元数据锁特性。当集群从 v6.5.0 之前的版本升级到 v6.5.0 及之后的版本时,TiDB 会自动开启元数据锁功能。如果需要关闭元数据锁,你可以将系统变量 设置为 OFF

    元数据锁的影响

    • 对于 DML 语句来说,元数据锁不会导致 DML 语句被阻塞,因此也不会存在死锁的问题。

    • 对于 DDL 语句来说,在进行元数据状态变更时,会被涉及相关元数据的旧事务所阻塞。例如以下的执行流程:

      在可重复读隔离级别下,如果从事务开始到确定一个表的元数据过程中,执行了加索引或者变更列类型等需要更改数据的 DDL,则有以下表现:

    TiDB v6.3.0 引入了 视图,可以用于查看当前阻塞的 DDL 的相关信息。

    注意

    查询 mysql.tidb_mdl_view 视图需要有 PROCESS 权限

    可以从上面的输出结果中了解到,有一个 SESSION ID2199023255957 的事务阻塞了该添加索引 DDL 的执行。该事务执行的 SQL 语句如 SQL_DIGESTS 中所示,即 ["begin","select * from `t`"]。如果想要使被阻塞的 DDL 能够继续执行,可以通过如下 Global KILL 命令中止 SESSION ID2199023255957 的事务:

    中止该事务后,再次查询 视图。此时,查询结果不再显示上面的事务信息,说明 DDL 不再被阻塞:

    元数据锁的原理

    TiDB 中 DDL 操作使用的是 online DDL 模式。一个 DDL 语句在执行过程中,需要修改定义的对象元数据版本可能会进行多次小版本变更,而元数据在线异步变更的算法只论证了相邻的两个小版本之间是兼容的,即在相邻的两个元数据版本间操作,不会破坏 DDL 变更对象所存储的数据一致性。

    以添加索引为例,DDL 语句的状态会经历 None -> Delete Only,Delete Only -> Write Only,Write Only -> Write Reorg,Write Reorg -> Public 这四个变化。

    以下的提交流程将违反“相邻的两个小版本之间是兼容的”约束:

    其中 txn4 提交时采用的元数据版本与集群最新的元数据版本相差了两个版本,会影响数据正确性。

    实现

    • DDL 语句进行状态变更时,会向所有的 TiDB 节点推送最新版本的元数据。如果一个 TiDB 节点上所有与这次状态变更相关的事务使用的元数据版本与当前元数据版本之差小于 2,则称这个 TiDB 节点获得了该元数据对象的元数据锁。当集群中的所有 TiDB 节点都获得了该元数据对象的元数据锁后,才能进行下一次状态变更。