• 面试官:MySQL 为什么使用 MVCC?原理是什么?

面试官:MySQL 为什么使用 MVCC?原理是什么?

2025-08-16 12:32:45 栏目:宝塔面板 105 阅读

大家好,我是君哥。

MVCC 中文名称叫多版本并发控制,是 InnoDB 引擎为了提高并发效率引入的协议。今天来聊一聊 MVCC。

1.基础知识

数据库事务并发通常会遇到三个问题:

  • 脏读:事务 A 读取了事务 B 未提交的修改数据。如果事务 B 回滚,事务 A 读取的数据就是无效的脏数据。
  • 不可重复读:同一事务内多次读取同一行数据,这条数据因为被其他事务修改过并且已经提交事务,导致多次读取到的结果不一致。
  • 幻读:同一事务内多次查询同一范围内的数据,因其他事务插入或删除符合条件的数据,导致事务在后面读取到的结果集不一样,像产生了幻觉。

其实出现幻读也会造成不可重复,所以幻读和不可重复读有时容易混淆。不可重复度主要针对的是老数据的修改,而幻读针对的是数据插入或数据删除。

针对这三个并发问题,数据库引入了隔离级别,不同隔离级别可以解决不同的问题。下面介绍的隔离级别隔离性依次变弱,并发性能依次变强。

串行化(Serializable):事务对数据读写都是串行化的。 

可重复读(Repeatable Read):事务执行过程中,多次读取同一行数据,读取结果一致。MySQL 默认隔离级别就是可重复读。 

读已提交数据(Read Committed):事务执行过程中,如果有其他事务修改了数据并且提交事务,当前事务可以读取到最新提交的数据。 

读未提交数据(Read Uncommitted):事务执行过程中,可以读取到其他事务未提交的数据。

下表展示了这四种隔离级别对脏读、幻读、可重复读的解决情况。

隔离级别/并发问题

脏读

不可重复读

幻读

串行化

x

x

x

可重复度

x

x

x

读已提交

x

读未提交

可重复读并没有完全解决幻读,配合 MySQL 中的 Next-Key Lock 来解决。

2.MVCC

上面讲了数据库事务并发存在的问题和 MySQL 的事务隔离级别。那什么是 MVCC 呢?

2.1 版本链

MVCC 是对同一行数据,记录多个事务的修改版本,这些版本串联起来,保存在 undolog 中。

InnoDB 引擎在每行记录中会添加了 3 个隐藏的列:

  • DB_TRX_ID:修改(插入、更新或删除)这一条数据的事务 id;
  • DB_ROLL_PTR:回滚指针,指向修改前的历史版本,用于回滚操作;
  • DB_ROW_ID:当表中不定义主键时用作主键来自动生成聚簇索引。

MVCC 通过上面两个字段,把每个事务修改后的数据和修改前的历史版本串联起来,形成一个版本链。

举一个例子,我们有一张记录账户余额的表 t_account,字段包括 id、account(账户)、amount(金额)。初始阶段,id = 10,account = 1100  的这条记录在事务 1 提交后这个账户剩余金额是 100,事务 2 把剩余金额改成了 150,事务 3 把剩余金额改成了 200。

如下图,事务回滚的时候,可以根据 DB_ROLL_PTR 指向的版本,回滚到这个版本的数据。

图片

2.2 ReadView

上面讲了 MVCC 中的版本链,那如果现在有一个事务要读取 id = 10,account = 1100  的这条记录,这时候版本链上面有多个版本,这个事务应该读取哪个版本呢?

这时我们引入一个新的概念 ReadView(读视图),用来控制当前事务应该读取上面版本链中的那一个版本数据,它只作用于可重复读和读已提交这两个隔离级别。它主要包含 4 个属性: 

MVCC 是指对同一行数据,记录多个事务的修改版本,这些版本串联起来,保存在 undolog 中。

InnoDB 引擎在每行记录中会添加了 3 个隐藏的列:

  • DB_TRX_ID:修改(插入、更新或删除)这一条数据的事务 id;
  • DB_ROLL_PTR:回滚指针,指向修改前的历史版本,用于回滚操作;
  • DB_ROW_ID:如果表中没有定义主键,这个字段用作主键来自动生成聚簇索引。

ReadView 对可重复读和读已提交这 2 个隔离级别来说,有下面的不同:

  • 已提交读:事务中每次查询操作,都会创建一个新的 ReadView。在上面的例子中,m_ids 集合是 {2,3},这时事务 4 开始,查询 t_account 中 id = 10 的记录,会新建一个 ReadView,查询到 amount = 100,如果事务 4 执行过程中,事务 2 提交,事务 4 中再次查询查询 t_account 中 id = 10 的记录,会再次创建一个 ReadView,查到 amount = 150。如下图:

图片

  • 可重复读:只有事务开始的时候,创建一个新的 ReadView,后面的读操作都公用这个 ReadView。在上面的例子中,m_ids 集合是 {2,3},这时事务 4 开始,查询 t_account 中 id = 10 的记录,会创建一个 ReadView,查询到 amount = 100,如果事务 4 执行过程中,事务 2 提交,事务 4 中再次查询查询 t_account 中 id = 10 的记录,还是使用之前的 ReadView,查到 amount = 100。如下图:

图片

2.3 修改隔离级别

其实在实际使用中,我们在一个事务中很少用到重复读的情况,这种情况多数是代码写的有问题。所以好多公司会修改 MySQL 的默认隔离级别,改成读已提交。

改成读已提交还有一个好处就是可以减少死锁发生。

当然,读已提交不能解决幻读问题。比如在一个事务中,查询了两次订单量,两次查询中间又有新订单生成,订单数量会发现不一样。这类情况就要看业务上能不能接受了。

总结

MVCC 是 MySQL 中非常重要的一个并发优化,从事务隔离级别、版本链、ReadView 这几个方面着手,很容易理解 MVCC 的原理。

本文地址:https://www.yitenyun.com/326.html

搜索文章

Tags

数据库 API FastAPI Calcite 电商系统 MySQL Web 应用 异步数据库 数据同步 ACK 双主架构 循环复制 TIME_WAIT 运维 负载均衡 服务器 管理口 JumpServer SSL 堡垒机 跳板机 HTTPS HexHub Docker 服务器性能 JumpServer安装 堡垒机安装 Linux安装JumpServer SQL 查询 生命周期 Deepseek 宝塔面板 Linux宝塔 esxi esxi6 root密码不对 无法登录 web无法登录 锁机制 序列 核心机制 行业 趋势 Windows Windows server net3.5 .NET 安装出错 HTTPS加密 开源 PostgreSQL 存储引擎 Windows宝塔 Mysql重置密码 宝塔面板打不开 宝塔面板无法访问 查看硬件 Linux查看硬件 Linux查看CPU Linux查看内存 机器学习 Redis Undo Log 机制 Oracle 处理机制 Spring 动态查询 无法访问宝塔面板 响应模型 InnoDB 数据库锁 优化 万能公式 连接控制 监控 异步化 Serverless 无服务器 语言 ES 协同 group by 索引 openHalo 工具 Postgres OTel Iceberg 技术 高可用 缓存方案 缓存架构 缓存穿透 分页查询 scp Linux的scp怎么用 scp上传 scp下载 scp命令 SVM Embedding 存储 国产数据库 GreatSQL 连接数 数据 主库 Linux 安全 R edis 线程 日志文件 MIXED 3 SQLite-Web SQLite 数据库管理工具 R2DBC Netstat Linux 服务器 端口 加密 场景 ​Redis 推荐模型 OB 单机版 Recursive 自定义序列化 防火墙 黑客 启动故障 云原生 RocketMQ 长轮询 配置 AI 助手 向量数据库 大模型 共享锁 SQLark Canal PG DBA Hash 字段 信息化 智能运维 不宕机 Rsync Ftp 磁盘架构 同城 双活 Python 向量库 Milvus 架构 电商 系统 业务 IT运维 分库 分表 PostGIS 修改DNS Centos7如何修改DNS 数据分类 语句 传统数据库 向量化 redo log 重做日志 流量 聚簇 非聚簇 线上 库存 预扣 filelock MVCC 频繁 Codis MongoDB 数据结构 MCP 开放协议 缓存 MySQL 9.3 失效 • 索引 • 数据库 人工智能 推荐系统 Web 接口 开发 数据类型 sftp 服务器 参数 mini-redis INCR指令 ZODB 千万级 大表 Redisson 锁芯 工具链 Doris SeaTunnel EasyExcel MySQL8 主从复制 代理 INSERT 分布式架构 分布式锁​ 聚簇索引 非聚簇索引 高效统计 今天这篇文章就跟大家 事务 Java prometheus Alert 数据备份 崖山 新版本 COMPACT 窗口 函数 虚拟服务器 虚拟机 内存 发件箱模式 SSH 容器 MGR 分布式集群 数据脱敏 加密算法 网络架构 网络配置 分页 引擎 性能 Web 网络故障 QPS 高并发 RDB AOF 数据集成工具 核心架构 订阅机制 Go 数据库迁移 自动重启 容器化 数据页 Redis 8.0 读写 速度 服务器中毒 B+Tree ID 字段 播客 分布式 集中式 StarRocks 数据仓库 Redka 模型 OAuth2 Token 微软 SQL Server AI功能 Valkey Valkey8.0 SpringAI 排行榜 排序 池化技术 连接池 DBMS 管理系统 JOIN Entity 关系数据库 Caffeine CP 数据字典 兼容性 事务隔离 LRU 原子性 业务场景 Weaviate Testcloud 云端自动化 网络 dbt 数据转换工具 分页方案 排版 部署 1 ReadView 事务同步 Pottery InfluxDB 优化器 意向锁 记录锁 AIOPS UUID ID 日志 悲观锁 乐观锁 sqlmock 单点故障 UUIDv7 主键 仪表盘 Pump 单线程 对象 Order 编程 分布式锁 Zookeeper Crash 代码 RAG HelixDB Ansible 产业链 字典 恢复数据 订单 IT 双引擎 LLM List 类型 拦截器 动态代理 国产 用户 线程安全 慢SQL优化 count(*) count(主键) 行数 表空间 快照读 当前读 视图 解锁 调优 Next-Key RR 互联网 GitHub Git 神经系统 矢量存储 数据库类型 AI代理 CAS 查询规划 算法 技巧 多线程 并发控制 恢复机制 闪回