TiDB 事务概览

    TiDB 支持分布式事务,提供乐观事务与两种事务模式。TiDB 3.0.8 及以后版本,TiDB 默认采用悲观事务模式。

    本文主要介绍涉及事务的常用语句、显式/隐式事务、事务的隔离级别和惰性检查,以及事务大小的限制。

    常用的变量包括 、、tidb_retry_limit 以及 。

    要显式地开启一个新事务,既可以使用 BEGIN 语句,也可以使用 语句,两者效果相同。

    语法:

    1. START TRANSACTION;
    1. START TRANSACTION WITH CONSISTENT SNAPSHOT;
    1. START TRANSACTION WITH CAUSAL CONSISTENCY ONLY;

    如果执行以上语句时,当前 Session 正处于一个事务的中间过程,那么系统会先自动提交当前事务,再开启一个新的事务。

    注意:

    与 MySQL 不同的是,TiDB 在执行完上述语句后即会获取当前数据库快照,而 MySQL 的 BEGINSTART TRANSACTION 是在开启事务后的第一个从 InnoDB 读数据的 SELECT 语句(非 SELECT FOR UPDATE)后获取快照,START TRANSACTION WITH CONSISTENT SNAPSHOT 是语句执行时获取快照。因此,TiDB 中的 BEGINSTART TRANSACTIONSTART TRANSACTION WITH CONSISTENT SNAPSHOT 都等效为 MySQL 中的 START TRANSACTION WITH CONSISTENT SNAPSHOT

    提交事务

    语句用于提交 TiDB 在当前事务中进行的所有修改。

    语法:

    1. COMMIT;

    ROLLBACK 语句用于回滚并撤销当前事务的所有修改。

    语法:

    如果客户端连接中止或关闭,也会自动回滚该事务。

    自动提交

    举例:

    1. mysql> CREATE TABLE t1 (
    2. -> id INT NOT NULL PRIMARY KEY auto_increment,
    3. -> pad1 VARCHAR(100)
    4. -> );
    5. Query OK, 0 rows affected (0.09 sec)
    6. mysql> SELECT @@autocommit;
    7. +--------------+
    8. | @@autocommit |
    9. +--------------+
    10. | 1 |
    11. +--------------+
    12. 1 row in set (0.00 sec)
    13. mysql> INSERT INTO t1 VALUES (1, 'test');
    14. Query OK, 1 row affected (0.02 sec)
    15. mysql> ROLLBACK;
    16. Query OK, 0 rows affected (0.01 sec)
    17. mysql> SELECT * FROM t1;
    18. +----+------+
    19. | id | pad1 |
    20. +----+------+
    21. | 1 | test |
    22. +----+------+
    23. 1 row in set (0.00 sec)

    以上示例中,ROLLBACK 语句没产生任何效果。由于 INSERT 语句是在自动提交的情况下执行的,等同于以下单语句事务:

    1. START TRANSACTION;
    2. INSERT INTO t1 VALUES (1, 'test');
    3. COMMIT;

    如果已显式地启动事务,则不适用自动提交。以下示例,ROLLBACK 语句成功撤回了 INSERT 语句:

    1. -> id INT NOT NULL PRIMARY KEY auto_increment,
    2. -> pad1 VARCHAR(100)
    3. Query OK, 0 rows affected (0.10 sec)
    4. mysql> SELECT @@autocommit;
    5. +--------------+
    6. | @@autocommit |
    7. +--------------+
    8. | 1 |
    9. +--------------+
    10. 1 row in set (0.00 sec)
    11. mysql> START TRANSACTION;
    12. Query OK, 0 rows affected (0.00 sec)
    13. mysql> INSERT INTO t2 VALUES (1, 'test');
    14. Query OK, 1 row affected (0.02 sec)
    15. mysql> ROLLBACK;
    16. Query OK, 0 rows affected (0.00 sec)
    17. mysql> SELECT * FROM t2;
    18. Empty set (0.00 sec)

    autocommit 是一个系统变量,可以基于 Session 或 Global 进行。

    举例:

    1. SET autocommit = 0;

    注意:

    有些语句是隐式提交的。例如,执行 [BEGIN|START TRANCATION] 语句时,TiDB 会隐式提交上一个事务,并开启一个新的事务以满足 MySQL 兼容性的需求。详情参见 implicit commit

    TiDB 可以显式地使用事务(通过 [BEGIN|START TRANSACTION]/COMMIT 语句定义事务的开始和结束)或者隐式地使用事务 (SET autocommit = 1)。

    在自动提交状态下,使用 [BEGIN|START TRANSACTION] 语句会显式地开启一个事务,同时也会禁用自动提交,使隐式事务变成显式事务。直到执行 COMMITROLLBACK 语句时才会恢复到此前默认的自动提交状态。

    对于 DDL 语句,会自动提交并且不能回滚。如果运行 DDL 的时候,正在一个事务的中间过程中,会先自动提交当前事务,再执行 DDL。

    惰性检查

    执行 DML 语句时,乐观事务默认不会检查主键约束或,而是在 COMMIT 事务时进行这些检查。

    举例:

    1. CREATE TABLE t1 (id INT NOT NULL PRIMARY KEY);
    2. INSERT INTO t1 VALUES (1);
    3. BEGIN OPTIMISTIC;
    4. INSERT INTO t1 VALUES (1); -- MySQL 返回错误;TiDB 返回成功。
    5. INSERT INTO t1 VALUES (2);
    6. COMMIT; -- MySQL 提交成功;TiDB 返回错误,事务回滚。
    7. SELECT * FROM t1; -- MySQL 返回 1 2TiDB 返回 1
    1. mysql> CREATE TABLE t1 (id INT NOT NULL PRIMARY KEY);
    2. Query OK, 0 rows affected (0.10 sec)
    3. mysql> INSERT INTO t1 VALUES (1);
    4. Query OK, 1 row affected (0.02 sec)
    5. mysql> BEGIN OPTIMISTIC;
    6. Query OK, 0 rows affected (0.00 sec)
    7. mysql> INSERT INTO t1 VALUES (1); -- MySQL 返回错误;TiDB 返回成功。
    8. Query OK, 1 row affected (0.00 sec)
    9. mysql> INSERT INTO t1 VALUES (2);
    10. Query OK, 1 row affected (0.00 sec)
    11. ERROR 1062 (23000): Duplicate entry '1' for key 'PRIMARY'
    12. mysql> SELECT * FROM t1; -- MySQL 返回 1 2TiDB 返回 1
    13. +----+
    14. | id |
    15. +----+
    16. | 1 |
    17. 1 row in set (0.01 sec)

    惰性检查优化通过批处理约束检查并减少网络通信来提升性能。可以通过设置 tidb_constraint_check_in_place = TRUE 禁用该行为。

    TiDB 支持语句执行失败后的原子性回滚。如果语句报错,则所做的修改将不会生效。该事务将保持打开状态,并且在发出 COMMITROLLBACK 语句之前可以进行其他修改。

    1. CREATE TABLE test (id INT NOT NULL PRIMARY KEY);
    2. BEGIN;
    3. INSERT INTO test VALUES (1);
    4. INSERT INTO tset VALUES (2); -- tset 拼写错误,使该语句执行出错。
    5. INSERT INTO test VALUES (1),(2); -- 违反 PRIMARY KEY 约束,语句不生效。
    6. INSERT INTO test VALUES (3);
    7. COMMIT;
    8. SELECT * FROM test;
    1. mysql> CREATE TABLE test (id INT NOT NULL PRIMARY KEY);
    2. Query OK, 0 rows affected (0.09 sec)
    3. mysql> BEGIN;
    4. Query OK, 0 rows affected (0.00 sec)
    5. mysql> INSERT INTO test VALUES (1);
    6. Query OK, 1 row affected (0.02 sec)
    7. mysql> INSERT INTO tset VALUES (2); -- tset 拼写错误,使该语句执行出错。
    8. ERROR 1146 (42S02): Table 'test.tset' doesn't exist
    9. mysql> INSERT INTO test VALUES (1),(2); -- 违反 PRIMARY KEY 约束,语句不生效。
    10. ERROR 1062 (23000): Duplicate entry '1' for key 'PRIMARY'
    11. mysql> INSERT INTO test VALUES (3);
    12. Query OK, 1 row affected (0.00 sec)
    13. mysql> COMMIT;
    14. Query OK, 0 rows affected (0.01 sec)
    15. mysql> SELECT * FROM test;
    16. +----+
    17. | id |
    18. +----+
    19. | 1 |
    20. | 3 |
    21. +----+
    22. 2 rows in set (0.00 sec)

    以上例子中,INSERT 语句执行失败之后,事务保持打开状态。最后的 INSERT 语句执行成功,并且提交了修改。

    事务限制

    由于底层存储引擎的限制,TiDB 要求单行不超过 6 MB。可以将一行的所有列根据类型转换为字节数并加和来估算单行大小。

    TiDB 中,单个事务的总大小默认不超过 100 MB,这个默认值可以通过配置文件中的配置项 txn-total-size-limit 进行修改,最大支持 10 GB。单个事务的实际大小限制还取决于服务器剩余可用内存的大小,执行事务时 TiDB 进程的内存消耗相对于事务大小会存在一定程度的放大,最大可能达到提交事务大小的 6 倍以上。

    在 4.0 以前的版本,TiDB 限制了单个事务的键值对的总数量不超过 30 万条,从 4.0 版本起 TiDB 取消了这项限制。

    注意:

    通常,用户会开启 TiDB Binlog 将数据向下游进行同步。某些场景下,用户会使用消息中间件来消费同步到下游的 binlog,例如 Kafka。

    以 Kafka 为例,Kafka 的单条消息处理能力的上限是 1 GB。因此,当把 txn-total-size-limit 设置为 1 GB 以上时,可能出现事务在 TiDB 中执行成功,但下游 Kafka 报错的情况。为避免这种情况出现,请用户根据最终消费者的限制来决定 txn-total-size-limit 的实际大小。例如:下游使用了 Kafka,则 txn-total-size-limit 不应超过 1 GB。

    TiDB 支持开启因果一致性的事务。因果一致性的事务在提交时无需向 PD 获取时间戳,所以提交延迟更低。开启因果一致性事务的语法为:

    默认情况下,TiDB 保证线性一致性。在线性一致性的情况下,如果事务 2 在事务 1 提交完成后提交,逻辑上事务 2 就应该在事务 1 后发生。

    因果一致性弱于线性一致性。在因果一致性的情况下,只有事务 1 和事务 2 加锁或写入的数据有交集时(即事务 1 和事务 2 存在数据库可知的因果关系时),才能保证事务的提交顺序与事务的发生顺序保持一致。目前暂不支持传入数据库外部的因果关系。

    采用因果一致性的两个事务有以下特性:

    有潜在因果关系的事务之间的逻辑顺序与物理提交顺序一致

    假设事务 1 和事务 2 都采用因果一致性,并先后执行如下语句:

    上面的例子中,事务 1 对 id = 1 的记录加了锁,事务 2 的事务对 id = 1 的记录进行了修改,所以事务 1 和事务 2 有潜在的因果关系。所以即使用因果一致性开启事务,只要事务 2 在事务 1 提交成功后才提交,逻辑上事务 2 就必定比事务 1 晚发生。因此,不存在某个事务读到了事务 2 对 id = 1 记录的修改,但却没有读到事务 1 对 id = 2 记录的修改的情况。

    假设 id = 1id = 2 的记录最初值都为 0,事务 1 和事务 2 都采用因果一致性,并先后执行如下语句:

    在本例中,事务 1 不读取 id = 1 的记录。此时事务 1 和事务 2 没有数据库可知的因果关系。如果使用因果一致性开启事务,即使物理时间上事务 2 在事务 1 提交完成后才开始提交,TiDB 也不保证逻辑上事务 2 比事务 1 晚发生。

    此时如果有一个事务 3 在事务 1 提交前开启,并在事务 2 提交后读取 id = 1id = 2 的记录,事务 3 可能读到 id = 1 的值为 2 但是 的值为 0。

    不加锁的读取不产生因果关系

    假设事务 1 和事务 2 都采用因果一致性,并先后执行如下语句: