• 聚簇与非聚簇索引、回表及索引下推原理

聚簇与非聚簇索引、回表及索引下推原理

2025-04-28 07:37:03 栏目:宝塔面板 64 阅读

引言

在数据库领域,聚簇索引和非聚簇索引是至关重要的概念,它们在数据组织与存储方式上截然不同,深刻影响着查询性能。

聚簇索引:数据与索引的紧密结合

聚簇索引的核心特点是数据与索引存储在一处。其非叶子节点存放索引字段值,叶子节点则承载对应记录的整行数据。在InnoDB存储引擎里,聚簇索引依表的主键构建,表数据会依照主键顺序存储于磁盘,保证了行的物理存储顺序与主键逻辑顺序一致,这使得聚簇索引在查找时速度优势显著。

图片

例如,若有一张员工表,以员工ID为主键构建聚簇索引,那么在查询时,一旦定位到索引节点,即可直接获取该行员工的全部信息,无需额外操作。

非聚簇索引:索引与数据的分离存储

与聚簇索引相反,非聚簇索引将索引和数据分开存放。它的叶子节点包含索引字段值以及指向数据页数据行的逻辑指针。在InnoDB中,非聚簇索引通常基于非主键字段创建,也被称作二级索引。

图片

如在上述员工表中,若针对员工年龄创建非聚簇索引,其叶子节点会存储年龄值及对应的员工ID指针。这意味着通过非聚簇索引查询时,先找到索引值对应的主键ID,再凭借主键ID去查找所需数据,此过程即为回表操作。

回表操作:非聚簇索引查询的额外步骤

在InnoDB中,由于非聚簇索引叶子节点仅存储主键值,当执行查询时,如依据员工年龄查找员工其他信息,首先要通过非聚簇索引获取主键ID,接着利用该主键ID再次查询数据表以获取完整数据,这增加了查询的I/O开销。相比之下,使用聚簇索引(主键索引)查询则无需回表,效率更高。为减少回表次数,可借助覆盖索引和索引下推技术优化。

覆盖索引:减少数据读取的高效策略

覆盖索引是指查询语句所需数据能直接从索引获取,无需访问数据表。例如,表中有联合索引idx_key1_key2 (key1,key2),当执行SELECT key2 FROM covering_index_sample WHERE key1 = 'keytest';时,可直接利用索引返回结果,避免回表。

但需注意,若不符合最左前缀匹配原则,如SELECT key1 FROM covering_index_sample WHERE key2 = 'keytest';,虽看似覆盖索引,但会扫描索引树,无法有效利用索引。并且,若查询信息不在联合索引内,如SELECT key2, key3 FROM covering_index_sample WHERE key1 = 'keytest';也无法使用覆盖索引。

索引下推:优化查询性能的有力手段

索引下推是MySQL 5.6引入的默认开启优化技术(可关闭)。以people表的(zipcode,lastname,firstname)索引为例,对于查询SELECT * FROM people WHERE zipcode='123' AND lastname LIKE '%yian%' AND address LIKE '%Main Street%';,若未启用索引下推,MySQL先依zipcode='123' 从存储引擎获取数据返回服务端,再在服务端判断其他条件;启用后,会先筛选符合zipcode='123'且满足lastname LIKE '%yian%'的索引,符合条件才定位数据,有效减少回表次数。

不仅限于LIKE条件,联合索引中非前导列因类型不匹配等原因索引失效需扫表回表时,如select d from t2 where a = "ni" and b = 1; (b 字段索引失效),也可利用索引下推优化。

在执行计划中,使用索引下推时extra字段会显示"Using index condition" 。

本文地址:https://www.yitenyun.com/171.html

搜索文章

Tags

数据库 API FastAPI Calcite 电商系统 MySQL 数据同步 ACK Web 应用 异步数据库 双主架构 循环复制 Deepseek 宝塔面板 Linux宝塔 Docker 生命周期 序列 核心机制 JumpServer JumpServer安装 堡垒机安装 Linux安装JumpServer esxi esxi6 root密码不对 无法登录 web无法登录 Windows Windows server net3.5 .NET 安装出错 宝塔面板打不开 宝塔面板无法访问 SSL 堡垒机 跳板机 HTTPS 查看硬件 Linux查看硬件 Linux查看CPU Linux查看内存 无法访问宝塔面板 Windows宝塔 Mysql重置密码 HTTPS加密 连接控制 机制 ES 协同 Oracle 处理机制 Serverless 无服务器 语言 OB 单机版 Spring SQL 动态查询 scp Linux的scp怎么用 scp上传 scp下载 scp命令 技术 存储 索引 运维 缓存方案 缓存架构 缓存穿透 分页查询 Rsync 架构 InnoDB 日志文件 MIXED 3 响应模型 RocketMQ 长轮询 配置 监控 修改DNS Centos7如何修改DNS HexHub Redis 电商 系统 Linux 安全 服务器 聚簇 非聚簇 MySQL 9.3 异步化 防火墙 黑客 数据 主库 group by sftp 服务器 参数 自定义序列化 查询 SQLark PostgreSQL 数据库锁 开源 存储引擎 管理口 业务 SQLite-Web SQLite 数据库管理工具 R edis 线程 线上 库存 预扣 人工智能 向量数据库 推荐系统 Doris SeaTunnel MVCC 加密 场景 流量 工具 共享锁 PG DBA Ftp ​Redis 机器学习 推荐模型 信息化 智能运维 数据备份 网络架构 网络配置 redo log 重做日志 高可用 Canal B+Tree ID 字段 • 索引 • 数据库 RDB AOF Redis 8.0 AI 助手 GreatSQL 连接数 Postgres OTel Iceberg Python 优化 万能公式 缓存 核心架构 订阅机制 同城 双活 网络故障 INSERT COMPACT Hash 字段 自动重启 Web 云原生 微软 SQL Server AI功能 prometheus Alert 不宕机 IT运维 大模型 引擎 性能 分库 分表 SVM Embedding 高效统计 今天这篇文章就跟大家 虚拟服务器 虚拟机 内存 向量库 Milvus OAuth2 Token Netstat Linux 服务器 端口 单点故障 Entity 开发 ZODB DBMS 管理系统 MongoDB 容器 sqlmock LRU 崖山 新版本 Undo Log 容器化 窗口 函数 mini-redis INCR指令 JOIN openHalo 数据集成工具 分布式 集中式 SpringAI 悲观锁 乐观锁 磁盘架构 排行榜 排序 Redka 数据脱敏 加密算法 Redisson 锁芯 QPS 高并发 PostGIS Testcloud 云端自动化 分页 数据结构 EasyExcel MySQL8 Recursive 数据类型 模型 启动故障 大表 业务场景 StarRocks 数据仓库 意向锁 记录锁 分布式架构 分布式锁​ Pottery 聚簇索引 非聚簇索引 原子性 AIOPS R2DBC Caffeine CP SSH IT 网络 MCP 开放协议 InfluxDB 1 事务 Java 池化技术 连接池 Web 接口 部署 dbt 数据转换工具 RAG HelixDB 工具链 发件箱模式 数据分类 filelock 速度 服务器中毒 事务隔离 字典 传统数据库 向量化 对象 读写 Go 数据库迁移 仪表盘 优化器 单线程 双引擎 频繁 Codis 分页方案 排版 数据页 Order 线程安全 LLM Crash 代码 List 类型 事务同步 UUIDv7 主键 订单 Pump 日志 Ansible