MySQL事务隔离原理

首先来介绍一下 MySQL 里面的“视图”的概念。

1、视图：查询语句定义的虚拟表，可以通过 create view ... 来创建。

2、一致性视图：InnoDB 实现的，在 MVCC 中用到的，用于支持 RC (Read Commited，读提交) 和 RR （Repeatable Read，可重复读）隔离级别的实现。

一致性视图工作原理

通过之前的文章我们知道，在可重复读隔离级别下，事务开始前会创建一个一致性视图。下面我们来详细说明一下这个一致性视图的工作原理。

在InnoDB 引擎中，每个事务都有一个唯一的ID，就是 transaction id。它是在事务开始的时候向系统申请的，是严格按顺序递增的。我们知道，每个数据行都是有多个版本的。每一次的事务更新都会有一个新的版本，并且每个版本都有对应的 transaction id（row trx_id）。

上图是一条行数据的多个版本，最新的版本是 V4。但是需要注意的是，上图中的 U1、U2、U3 对应的就是 undo log (回滚日志)，小版本 trx_id 的值都是通过 undo log 计算出来的。

按照可重复读的语义，每个事务启动的时候只能看到已经提交的事务，并且在本事务执行的过程中，不可以读取到其他事务的更新操作。在InnoDB 中，为每个事务构造了一个当前事务ID数组的快照，就是记录事务开启时，当前正在执行的事务ID 的集合。数组里面 trx_id 最小的记为低水位，trx_id 最大的 + 1 记为高水位。如下图所示：

对于一个新事务而言，所读取到的记录版本的 trx_id 可能有以下几种情况：

1、在绿色区域：说明数据版本在事务开始前已提交，当前版本是可见的。

2、在红色区域：说明数据版本在事务开始后变更的，当前版本是不可见的。

3、在橙色区域：包含 2 种情况。

A、如果数据版本的 trx_id 在数组中，说明是正在执行的事务，不可见。

B、如果数据版本的 trx_id 不在数组中，说明是已经提交的事务，可见。

对于 MVCC 的多版本图，如果当前有一个事务，它的低水位是 18 。此时它访问这个数据行时，会通过 V4 版本计算出 V3 的版本。由此我们可以看出，InnoDB 利用了数据多版本的特点，实现了快速创建快照的能力。

我们下面看一个 Demo：1、事务A 开始前，系统中只有一个 99 的已提交事务；2、事务 A、B、C的版本号分别是 100、101、102，且当前系统中只有这 4 个事务；3、事务开始前，(1, 1) 这一行数据的 trx_id 是 90.

上图从事务A的可重复读角度看来，101、102 版本都不可见，因此找到了 90 这个版本的数据。

更新操作

前面一段说了，数据行多版本的读取规则。下面说明一下，更新数据的读取规则。如下所示：

上面事务B 执行的过程中，有事务 C的提交流程。此时事务B 就不能按照 undo log 回滚到 90 这个版本了（如果是这样事务B 执行完成数据就变成 (1, 2)了，与正确的结果 (1, 3) 不符）。此时更新的读取为“当前读”，也就是读取到最新的数据，事务B 执行完 k=k+1 后，再次获取 k 的值时，返回的就是 (1, 3) 了。

上面的过程，我们看到的是事务C 在事务B 执行更新之前就已经提交了。如果事务C 没有提交，那又会是一个什么流程呢？

从上图可以看出，如果事务C' 没有提交，那么事务B 的更新就会等待，知道事务C' 执行完成。

可重复读和读已提交的区别

在可重复读隔离级别下，需要在事务开启前创建一个一致性视图。而读已提交，则是每执行一个语句前都会创建一个新的视图。

参考：《极客时间：MySQL实战》、《高性能MySQL》

相关推荐