• 面试官:MySQL表中有2千万条数据,B+树层高是多少?

面试官:MySQL表中有2千万条数据,B+树层高是多少?

2025-05-20 01:00:08 栏目:宝塔面板 107 阅读

大家好,我是君哥。

MySQL 默认存储引擎是 InnoDB,跟 MyISAM 相比,InnoDB 支持事务、支持行级锁、支持主键和外键、索引存储上使用 B+ 树。

那如果 MySQL 一张表存储了 2 千万条数据,B+ 树层高是多少呢?今天来聊一聊这个面试题。

InnoDB 存储

在 InnoDB 存储引擎中,是以索引组织表的方式存放数据的,也就是表中数据是根据主键顺序以索引的形式存放的。数据存储在 B+ 树中,每一个索引对应一棵 B+ 树。

我们知道,计算机中,磁盘存储数据的最小单位是扇区,一个扇区大小为 512B。而文件系统的最小单位是块,一个块大小是 4K。

那 InnoDB 具体是以什么单位来存放数据呢?InnoDB 是以页为单位存放数据的,一个页大小是 16K。如下图:

B+ 树索引

跟 MyISAM 不一样的是,InnoDB 使用聚簇索引,叶子节点存储数据,不用独立的行存储。下面是 MyISAM 的存储结构:

InnoDB 主键索引每个叶节点包含了主键值和所有的剩余字段。二级索引的叶节点中存储是索引键和主键值,以此作为指向行的“指针”。如下图:

B+ 树叶子节点存储了数据,非叶子节点(索引节点)则存储了 key 和指针。这样存储的优势是可以在索引节点通过二分查找快速找到数据所在页,时间复杂度为 O(log n)。找到数据页后再去数据页中找数据就很容易了。

前面讲到,InnoDB 以页为单位来存储数据,每页 16k,那如果一条数据占 1k 的空间,那每页可以存储 16 条数据。

而索引节点保存的是 key 和指针。假如 key 的数据类型是 bigint,占 8B,指针大小在 InnoDB 中固定占 6B,那索引节点占空间大小为 14B,那每页存放的索引节点就是 1170。


16 * 1024B/14B = 1170。

因此假如 B+ 树高度为 2 层,则存放的数据为 1170(页)* 16(每页 16 条数据)= 18720。 同理如果 B+ 树高度为 3 层,则存放的数据为 1170(页)* 1170(每页 1170 索引节点)* 16(每页 16 条数据)= 21902400。

回到问题,一张表中有 2 千万条数据,B+ 树有几层?如果小于等于 21902400 条,则 B+ 树是 3 层,如果大于 21902400,则 B+ 树是 4 层。

注意前提条件,一条数据占用空间大小是 1k,索引节点(索引节点)中 key 占用空间为 8B。

总结

本节以一道经典的面试题,引出了 MySQL 中 InnoDB 的存储结构。理解了这个存储结构,就可以很好的理解索引和数据查找原理了。

本文地址:https://www.yitenyun.com/219.html

搜索文章

Tags

数据库 API FastAPI Calcite 电商系统 MySQL Web 应用 异步数据库 数据同步 ACK 双主架构 循环复制 TIME_WAIT 运维 负载均衡 服务器 管理口 HexHub Docker JumpServer SSL 堡垒机 跳板机 HTTPS 服务器性能 JumpServer安装 堡垒机安装 Linux安装JumpServer SQL 查询 生命周期 Deepseek 宝塔面板 Linux宝塔 锁机制 esxi esxi6 root密码不对 无法登录 web无法登录 行业 趋势 序列 核心机制 Windows Windows server net3.5 .NET 安装出错 HTTPS加密 开源 PostgreSQL 存储引擎 宝塔面板打不开 宝塔面板无法访问 Windows宝塔 Mysql重置密码 机器学习 Redis 查看硬件 Linux查看硬件 Linux查看CPU Linux查看内存 Undo Log 机制 Spring 动态查询 响应模型 Oracle 处理机制 优化 万能公式 InnoDB 数据库锁 连接控制 group by 索引 Serverless 无服务器 语言 监控 无法访问宝塔面板 异步化 ES 协同 Postgres OTel Iceberg 工具 openHalo scp Linux的scp怎么用 scp上传 scp下载 scp命令 技术 缓存方案 缓存架构 缓存穿透 国产数据库 高可用 分页查询 数据 主库 SVM Embedding Linux 安全 SQLite-Web SQLite 数据库管理工具 GreatSQL 连接数 Netstat Linux 服务器 端口 存储 云原生 加密 场景 R edis 线程 R2DBC Recursive 防火墙 黑客 启动故障 SQLark OB 单机版 向量数据库 大模型 共享锁 日志文件 MIXED 3 ​Redis 推荐模型 Canal AI 助手 自定义序列化 RocketMQ 长轮询 配置 信息化 智能运维 PG DBA 不宕机 Python 传统数据库 向量化 向量库 Milvus 业务 同城 双活 Web 接口 开发 聚簇 非聚簇 Ftp 电商 系统 线上 库存 预扣 修改DNS Centos7如何修改DNS IT运维 Hash 字段 Rsync 架构 filelock 数据类型 分库 分表 MySQL 9.3 磁盘架构 缓存 MongoDB MCP 开放协议 sftp 服务器 参数 mini-redis INCR指令 数据结构 redo log 重做日志 数据分类 • 索引 • 数据库 ZODB 语句 流量 频繁 Codis PostGIS Doris SeaTunnel 分布式架构 分布式锁​ 窗口 函数 MVCC Go 数据库迁移 数据备份 虚拟服务器 虚拟机 内存 工具链 人工智能 推荐系统 Redisson 锁芯 失效 EasyExcel MySQL8 主从复制 代理 prometheus Alert MGR 分布式集群 分页 千万级 大表 聚簇索引 非聚簇索引 高效统计 今天这篇文章就跟大家 网络故障 播客 StarRocks 数据仓库 网络架构 网络配置 引擎 性能 INSERT 崖山 新版本 事务 Java COMPACT 数据集成工具 发件箱模式 容器 Entity 核心架构 订阅机制 QPS 高并发 SSH Redka Web B+Tree ID 字段 Weaviate RDB AOF 关系数据库 数据脱敏 加密算法 数据页 Redis 8.0 速度 服务器中毒 Caffeine CP Valkey Valkey8.0 DBMS 管理系统 分布式 集中式 OAuth2 Token 自动重启 容器化 模型 SpringAI 读写 微软 SQL Server AI功能 LRU 原子性 排行榜 排序 池化技术 连接池 数据字典 兼容性 JOIN 事务隔离 意向锁 记录锁 UUID ID dbt 数据转换工具 业务场景 Testcloud 云端自动化 单点故障 分页方案 排版 部署 日志 1 ReadView 优化器 网络 Pottery InfluxDB 悲观锁 乐观锁 sqlmock 事务同步 UUIDv7 主键 分布式锁 Zookeeper AIOPS 仪表盘 对象 双引擎 RAG HelixDB 产业链 Order 编程 字典 Ansible Pump 单线程 拦截器 动态代理 恢复数据 Crash 代码 线程安全 国产 用户 快照读 当前读 视图 LLM IT 订单 List 类型 慢SQL优化 count(*) count(主键) 行数 表空间 RR 互联网 神经系统 解锁 调优 Next-Key 矢量存储 数据库类型 AI代理 CAS 查询规划 多线程 GitHub Git 算法 技巧 并发控制 恢复机制 闪回