• 面试官:MySQL 为什么使用 MVCC?原理是什么?

面试官:MySQL 为什么使用 MVCC?原理是什么?

2025-08-16 12:32:45 栏目:宝塔面板 57 阅读

大家好,我是君哥。

MVCC 中文名称叫多版本并发控制,是 InnoDB 引擎为了提高并发效率引入的协议。今天来聊一聊 MVCC。

1.基础知识

数据库事务并发通常会遇到三个问题:

  • 脏读:事务 A 读取了事务 B 未提交的修改数据。如果事务 B 回滚,事务 A 读取的数据就是无效的脏数据。
  • 不可重复读:同一事务内多次读取同一行数据,这条数据因为被其他事务修改过并且已经提交事务,导致多次读取到的结果不一致。
  • 幻读:同一事务内多次查询同一范围内的数据,因其他事务插入或删除符合条件的数据,导致事务在后面读取到的结果集不一样,像产生了幻觉。

其实出现幻读也会造成不可重复,所以幻读和不可重复读有时容易混淆。不可重复度主要针对的是老数据的修改,而幻读针对的是数据插入或数据删除。

针对这三个并发问题,数据库引入了隔离级别,不同隔离级别可以解决不同的问题。下面介绍的隔离级别隔离性依次变弱,并发性能依次变强。

串行化(Serializable):事务对数据读写都是串行化的。 

可重复读(Repeatable Read):事务执行过程中,多次读取同一行数据,读取结果一致。MySQL 默认隔离级别就是可重复读。 

读已提交数据(Read Committed):事务执行过程中,如果有其他事务修改了数据并且提交事务,当前事务可以读取到最新提交的数据。 

读未提交数据(Read Uncommitted):事务执行过程中,可以读取到其他事务未提交的数据。

下表展示了这四种隔离级别对脏读、幻读、可重复读的解决情况。

隔离级别/并发问题

脏读

不可重复读

幻读

串行化

x

x

x

可重复度

x

x

x

读已提交

x

读未提交

可重复读并没有完全解决幻读,配合 MySQL 中的 Next-Key Lock 来解决。

2.MVCC

上面讲了数据库事务并发存在的问题和 MySQL 的事务隔离级别。那什么是 MVCC 呢?

2.1 版本链

MVCC 是对同一行数据,记录多个事务的修改版本,这些版本串联起来,保存在 undolog 中。

InnoDB 引擎在每行记录中会添加了 3 个隐藏的列:

  • DB_TRX_ID:修改(插入、更新或删除)这一条数据的事务 id;
  • DB_ROLL_PTR:回滚指针,指向修改前的历史版本,用于回滚操作;
  • DB_ROW_ID:当表中不定义主键时用作主键来自动生成聚簇索引。

MVCC 通过上面两个字段,把每个事务修改后的数据和修改前的历史版本串联起来,形成一个版本链。

举一个例子,我们有一张记录账户余额的表 t_account,字段包括 id、account(账户)、amount(金额)。初始阶段,id = 10,account = 1100  的这条记录在事务 1 提交后这个账户剩余金额是 100,事务 2 把剩余金额改成了 150,事务 3 把剩余金额改成了 200。

如下图,事务回滚的时候,可以根据 DB_ROLL_PTR 指向的版本,回滚到这个版本的数据。

图片

2.2 ReadView

上面讲了 MVCC 中的版本链,那如果现在有一个事务要读取 id = 10,account = 1100  的这条记录,这时候版本链上面有多个版本,这个事务应该读取哪个版本呢?

这时我们引入一个新的概念 ReadView(读视图),用来控制当前事务应该读取上面版本链中的那一个版本数据,它只作用于可重复读和读已提交这两个隔离级别。它主要包含 4 个属性: 

MVCC 是指对同一行数据,记录多个事务的修改版本,这些版本串联起来,保存在 undolog 中。

InnoDB 引擎在每行记录中会添加了 3 个隐藏的列:

  • DB_TRX_ID:修改(插入、更新或删除)这一条数据的事务 id;
  • DB_ROLL_PTR:回滚指针,指向修改前的历史版本,用于回滚操作;
  • DB_ROW_ID:如果表中没有定义主键,这个字段用作主键来自动生成聚簇索引。

ReadView 对可重复读和读已提交这 2 个隔离级别来说,有下面的不同:

  • 已提交读:事务中每次查询操作,都会创建一个新的 ReadView。在上面的例子中,m_ids 集合是 {2,3},这时事务 4 开始,查询 t_account 中 id = 10 的记录,会新建一个 ReadView,查询到 amount = 100,如果事务 4 执行过程中,事务 2 提交,事务 4 中再次查询查询 t_account 中 id = 10 的记录,会再次创建一个 ReadView,查到 amount = 150。如下图:

图片

  • 可重复读:只有事务开始的时候,创建一个新的 ReadView,后面的读操作都公用这个 ReadView。在上面的例子中,m_ids 集合是 {2,3},这时事务 4 开始,查询 t_account 中 id = 10 的记录,会创建一个 ReadView,查询到 amount = 100,如果事务 4 执行过程中,事务 2 提交,事务 4 中再次查询查询 t_account 中 id = 10 的记录,还是使用之前的 ReadView,查到 amount = 100。如下图:

图片

2.3 修改隔离级别

其实在实际使用中,我们在一个事务中很少用到重复读的情况,这种情况多数是代码写的有问题。所以好多公司会修改 MySQL 的默认隔离级别,改成读已提交。

改成读已提交还有一个好处就是可以减少死锁发生。

当然,读已提交不能解决幻读问题。比如在一个事务中,查询了两次订单量,两次查询中间又有新订单生成,订单数量会发现不一样。这类情况就要看业务上能不能接受了。

总结

MVCC 是 MySQL 中非常重要的一个并发优化,从事务隔离级别、版本链、ReadView 这几个方面着手,很容易理解 MVCC 的原理。

本文地址:https://www.yitenyun.com/326.html

搜索文章

Tags

数据库 API FastAPI Calcite 电商系统 MySQL Web 应用 异步数据库 数据同步 ACK 双主架构 循环复制 TIME_WAIT 运维 负载均衡 JumpServer SSL 堡垒机 跳板机 HTTPS JumpServer安装 堡垒机安装 Linux安装JumpServer Deepseek 宝塔面板 Linux宝塔 Docker 生命周期 esxi esxi6 root密码不对 无法登录 web无法登录 HexHub 序列 核心机制 Windows Windows server net3.5 .NET 安装出错 服务器 管理口 HTTPS加密 宝塔面板打不开 宝塔面板无法访问 查看硬件 Linux查看硬件 Linux查看CPU Linux查看内存 Windows宝塔 Mysql重置密码 Oracle 处理机制 InnoDB 数据库锁 无法访问宝塔面板 开源 PostgreSQL 存储引擎 监控 连接控制 机制 服务器性能 Serverless 无服务器 语言 ES 协同 技术 Spring Redis 异步化 缓存方案 缓存架构 缓存穿透 分页查询 索引 高可用 group by Undo Log GreatSQL 连接数 SQL 动态查询 机器学习 日志文件 MIXED 3 响应模型 R2DBC SVM Embedding 优化 万能公式 R edis 线程 数据 主库 RocketMQ 长轮询 配置 工具 自定义序列化 Linux 安全 ​Redis 推荐模型 Postgres OTel Iceberg 云原生 Netstat Linux 服务器 端口 AI 助手 SQLark scp Linux的scp怎么用 scp上传 scp下载 scp命令 SQLite-Web SQLite 数据库管理工具 向量数据库 大模型 共享锁 PG DBA 存储 openHalo Hash 字段 Recursive 查询 电商 系统 OB 单机版 Ftp 架构 流量 Rsync 锁机制 • 索引 • 数据库 修改DNS Centos7如何修改DNS redo log 重做日志 数据分类 加密 磁盘架构 人工智能 推荐系统 场景 聚簇 非聚簇 sftp 服务器 参数 线上 库存 预扣 向量库 Milvus 业务 同城 双活 信息化 智能运维 MySQL 9.3 防火墙 黑客 MVCC Python 高效统计 今天这篇文章就跟大家 Doris SeaTunnel 不宕机 分库 分表 数据备份 传统数据库 向量化 mini-redis INCR指令 缓存 窗口 函数 Redisson 锁芯 RDB AOF 网络架构 网络配置 INSERT COMPACT prometheus Alert PostGIS 启动故障 Canal Web 事务 Java 开发 IT运维 崖山 新版本 filelock MongoDB 数据结构 核心架构 订阅机制 引擎 性能 数据脱敏 加密算法 B+Tree ID 字段 分布式 集中式 ZODB Go 数据库迁移 读写 容器 数据类型 虚拟服务器 虚拟机 内存 网络故障 容器化 DBMS 管理系统 频繁 Codis 模型 Redis 8.0 OAuth2 Token JOIN 微软 SQL Server AI功能 聚簇索引 非聚簇索引 QPS 高并发 国产数据库 发件箱模式 自动重启 Pottery 原子性 工具链 部署 Entity 速度 服务器中毒 事务隔离 SpringAI 分页方案 排版 Testcloud 云端自动化 SSH Caffeine CP Web 接口 排行榜 排序 数据集成工具 MCP 开放协议 行业 趋势 数据页 Redka 悲观锁 乐观锁 StarRocks 数据仓库 sqlmock LRU 大表 业务场景 分页 AIOPS 分布式架构 分布式锁​ 1 优化器 池化技术 连接池 单点故障 仪表盘 网络 dbt 数据转换工具 Order 意向锁 记录锁 EasyExcel MySQL8 事务同步 InfluxDB 日志 IT RAG HelixDB 字典 对象 双引擎 订单 播客 单线程 主从复制 代理 Crash 代码 编程 UUIDv7 主键 UUID ID Ansible LLM 语句 恢复数据 Pump Valkey Valkey8.0 ReadView 产业链 兼容性 数据字典 线程安全 List 类型 Weaviate 失效 MGR 分布式集群 解锁 调优 Next-Key 表空间 分布式锁 Zookeeper 慢SQL优化 关系数据库 GitHub Git RR 互联网 矢量存储 数据库类型 AI代理 查询规划 国产 用户 算法 快照读 当前读 视图 千万级 神经系统 count(*) count(主键) 行数 CAS 技巧 拦截器 动态代理 多线程 并发控制 恢复机制 闪回