• 聚簇与非聚簇索引、回表及索引下推原理

聚簇与非聚簇索引、回表及索引下推原理

2025-04-28 07:37:03 栏目:宝塔面板 88 阅读

引言

在数据库领域,聚簇索引和非聚簇索引是至关重要的概念,它们在数据组织与存储方式上截然不同,深刻影响着查询性能。

聚簇索引:数据与索引的紧密结合

聚簇索引的核心特点是数据与索引存储在一处。其非叶子节点存放索引字段值,叶子节点则承载对应记录的整行数据。在InnoDB存储引擎里,聚簇索引依表的主键构建,表数据会依照主键顺序存储于磁盘,保证了行的物理存储顺序与主键逻辑顺序一致,这使得聚簇索引在查找时速度优势显著。

图片

例如,若有一张员工表,以员工ID为主键构建聚簇索引,那么在查询时,一旦定位到索引节点,即可直接获取该行员工的全部信息,无需额外操作。

非聚簇索引:索引与数据的分离存储

与聚簇索引相反,非聚簇索引将索引和数据分开存放。它的叶子节点包含索引字段值以及指向数据页数据行的逻辑指针。在InnoDB中,非聚簇索引通常基于非主键字段创建,也被称作二级索引。

图片

如在上述员工表中,若针对员工年龄创建非聚簇索引,其叶子节点会存储年龄值及对应的员工ID指针。这意味着通过非聚簇索引查询时,先找到索引值对应的主键ID,再凭借主键ID去查找所需数据,此过程即为回表操作。

回表操作:非聚簇索引查询的额外步骤

在InnoDB中,由于非聚簇索引叶子节点仅存储主键值,当执行查询时,如依据员工年龄查找员工其他信息,首先要通过非聚簇索引获取主键ID,接着利用该主键ID再次查询数据表以获取完整数据,这增加了查询的I/O开销。相比之下,使用聚簇索引(主键索引)查询则无需回表,效率更高。为减少回表次数,可借助覆盖索引和索引下推技术优化。

覆盖索引:减少数据读取的高效策略

覆盖索引是指查询语句所需数据能直接从索引获取,无需访问数据表。例如,表中有联合索引idx_key1_key2 (key1,key2),当执行SELECT key2 FROM covering_index_sample WHERE key1 = 'keytest';时,可直接利用索引返回结果,避免回表。

但需注意,若不符合最左前缀匹配原则,如SELECT key1 FROM covering_index_sample WHERE key2 = 'keytest';,虽看似覆盖索引,但会扫描索引树,无法有效利用索引。并且,若查询信息不在联合索引内,如SELECT key2, key3 FROM covering_index_sample WHERE key1 = 'keytest';也无法使用覆盖索引。

索引下推:优化查询性能的有力手段

索引下推是MySQL 5.6引入的默认开启优化技术(可关闭)。以people表的(zipcode,lastname,firstname)索引为例,对于查询SELECT * FROM people WHERE zipcode='123' AND lastname LIKE '%yian%' AND address LIKE '%Main Street%';,若未启用索引下推,MySQL先依zipcode='123' 从存储引擎获取数据返回服务端,再在服务端判断其他条件;启用后,会先筛选符合zipcode='123'且满足lastname LIKE '%yian%'的索引,符合条件才定位数据,有效减少回表次数。

不仅限于LIKE条件,联合索引中非前导列因类型不匹配等原因索引失效需扫表回表时,如select d from t2 where a = "ni" and b = 1; (b 字段索引失效),也可利用索引下推优化。

在执行计划中,使用索引下推时extra字段会显示"Using index condition" 。

本文地址:https://www.yitenyun.com/171.html

搜索文章

Tags

数据库 API FastAPI Calcite 电商系统 MySQL Web 应用 异步数据库 数据同步 ACK 双主架构 循环复制 TIME_WAIT 运维 负载均衡 Deepseek 宝塔面板 Linux宝塔 Docker JumpServer JumpServer安装 堡垒机安装 Linux安装JumpServer esxi esxi6 root密码不对 无法登录 web无法登录 生命周期 SSL 堡垒机 跳板机 HTTPS 序列 核心机制 HexHub Windows Windows server net3.5 .NET 安装出错 HTTPS加密 宝塔面板打不开 宝塔面板无法访问 查看硬件 Linux查看硬件 Linux查看CPU Linux查看内存 InnoDB 数据库锁 Oracle 处理机制 连接控制 机制 无法访问宝塔面板 ES 协同 监控 Windows宝塔 Mysql重置密码 Serverless 无服务器 语言 技术 开源 PostgreSQL 存储引擎 group by 索引 Spring Redis 异步化 分页查询 服务器 管理口 高可用 缓存方案 缓存架构 缓存穿透 SQL 动态查询 响应模型 自定义序列化 SVM Embedding 日志文件 MIXED 3 GreatSQL 连接数 数据 主库 SQLark 云原生 PG DBA 服务器性能 scp Linux的scp怎么用 scp上传 scp下载 scp命令 ​Redis 机器学习 推荐模型 R edis 线程 Netstat Linux 服务器 端口 AI 助手 向量数据库 大模型 Linux 安全 工具 共享锁 存储 Undo Log 查询 SQLite-Web SQLite 数据库管理工具 openHalo OB 单机版 电商 系统 Rsync Recursive 架构 R2DBC • 索引 • 数据库 Postgres OTel Iceberg RocketMQ 长轮询 配置 聚簇 非聚簇 数据分类 加密 优化 万能公式 修改DNS Centos7如何修改DNS sftp 服务器 参数 redo log 重做日志 磁盘架构 流量 同城 双活 防火墙 黑客 Ftp Hash 字段 场景 信息化 智能运维 mini-redis INCR指令 RDB AOF MVCC 人工智能 推荐系统 数据备份 MySQL 9.3 高效统计 今天这篇文章就跟大家 业务 窗口 函数 缓存 网络架构 网络配置 INSERT COMPACT 向量库 Milvus Redisson 锁芯 Doris SeaTunnel 线上 库存 预扣 事务 Java 开发 B+Tree ID 字段 核心架构 订阅机制 prometheus Alert 引擎 性能 Python PostGIS 崖山 新版本 MongoDB 数据结构 IT运维 不宕机 Web 数据脱敏 加密算法 数据类型 传统数据库 向量化 分布式 集中式 虚拟服务器 虚拟机 内存 ZODB 读写 模型 OAuth2 Token filelock JOIN Canal 网络故障 容器 容器化 DBMS 管理系统 QPS 高并发 Redis 8.0 微软 SQL Server AI功能 自动重启 Pottery Testcloud 云端自动化 发件箱模式 部署 聚簇索引 非聚簇索引 SpringAI 锁机制 分页方案 排版 Entity 工具链 排行榜 排序 速度 服务器中毒 分库 分表 事务隔离 启动故障 数据页 1 悲观锁 乐观锁 StarRocks 数据仓库 SSH Caffeine CP Web 接口 LRU 池化技术 连接池 单点故障 Go 数据库迁移 MCP 开放协议 sqlmock 频繁 Codis 原子性 大表 业务场景 数据集成工具 Redka 分页 意向锁 记录锁 AIOPS 优化器 Order 网络 分布式架构 分布式锁​ dbt 数据转换工具 日志 EasyExcel MySQL8 IT 仪表盘 对象 单线程 字典 InfluxDB RAG HelixDB 行业 趋势 双引擎 Ansible 事务同步 Crash 代码 国产数据库 LLM UUIDv7 主键 订单 线程安全 List 类型 Pump UUID ID 主从复制 代理 Next-Key 编程 关系数据库 播客 解锁 调优 ReadView 产业链 兼容性 语句 Valkey Valkey8.0 恢复数据 MGR 分布式集群 数据字典 失效 算法 国产 用户 快照读 当前读 视图 GitHub Git 矢量存储 数据库类型 AI代理 查询规划 千万级 Weaviate RR 互联网 慢SQL优化 count(*) count(主键) 行数 分布式锁 Zookeeper 神经系统 表空间 并发控制 恢复机制 拦截器 动态代理 CAS 多线程 技巧 闪回