• 聚簇与非聚簇索引、回表及索引下推原理

聚簇与非聚簇索引、回表及索引下推原理

2025-04-28 07:37:03 栏目:宝塔面板 99 阅读

引言

在数据库领域,聚簇索引和非聚簇索引是至关重要的概念,它们在数据组织与存储方式上截然不同,深刻影响着查询性能。

聚簇索引:数据与索引的紧密结合

聚簇索引的核心特点是数据与索引存储在一处。其非叶子节点存放索引字段值,叶子节点则承载对应记录的整行数据。在InnoDB存储引擎里,聚簇索引依表的主键构建,表数据会依照主键顺序存储于磁盘,保证了行的物理存储顺序与主键逻辑顺序一致,这使得聚簇索引在查找时速度优势显著。

图片

例如,若有一张员工表,以员工ID为主键构建聚簇索引,那么在查询时,一旦定位到索引节点,即可直接获取该行员工的全部信息,无需额外操作。

非聚簇索引:索引与数据的分离存储

与聚簇索引相反,非聚簇索引将索引和数据分开存放。它的叶子节点包含索引字段值以及指向数据页数据行的逻辑指针。在InnoDB中,非聚簇索引通常基于非主键字段创建,也被称作二级索引。

图片

如在上述员工表中,若针对员工年龄创建非聚簇索引,其叶子节点会存储年龄值及对应的员工ID指针。这意味着通过非聚簇索引查询时,先找到索引值对应的主键ID,再凭借主键ID去查找所需数据,此过程即为回表操作。

回表操作:非聚簇索引查询的额外步骤

在InnoDB中,由于非聚簇索引叶子节点仅存储主键值,当执行查询时,如依据员工年龄查找员工其他信息,首先要通过非聚簇索引获取主键ID,接着利用该主键ID再次查询数据表以获取完整数据,这增加了查询的I/O开销。相比之下,使用聚簇索引(主键索引)查询则无需回表,效率更高。为减少回表次数,可借助覆盖索引和索引下推技术优化。

覆盖索引:减少数据读取的高效策略

覆盖索引是指查询语句所需数据能直接从索引获取,无需访问数据表。例如,表中有联合索引idx_key1_key2 (key1,key2),当执行SELECT key2 FROM covering_index_sample WHERE key1 = 'keytest';时,可直接利用索引返回结果,避免回表。

但需注意,若不符合最左前缀匹配原则,如SELECT key1 FROM covering_index_sample WHERE key2 = 'keytest';,虽看似覆盖索引,但会扫描索引树,无法有效利用索引。并且,若查询信息不在联合索引内,如SELECT key2, key3 FROM covering_index_sample WHERE key1 = 'keytest';也无法使用覆盖索引。

索引下推:优化查询性能的有力手段

索引下推是MySQL 5.6引入的默认开启优化技术(可关闭)。以people表的(zipcode,lastname,firstname)索引为例,对于查询SELECT * FROM people WHERE zipcode='123' AND lastname LIKE '%yian%' AND address LIKE '%Main Street%';,若未启用索引下推,MySQL先依zipcode='123' 从存储引擎获取数据返回服务端,再在服务端判断其他条件;启用后,会先筛选符合zipcode='123'且满足lastname LIKE '%yian%'的索引,符合条件才定位数据,有效减少回表次数。

不仅限于LIKE条件,联合索引中非前导列因类型不匹配等原因索引失效需扫表回表时,如select d from t2 where a = "ni" and b = 1; (b 字段索引失效),也可利用索引下推优化。

在执行计划中,使用索引下推时extra字段会显示"Using index condition" 。

本文地址:https://www.yitenyun.com/171.html

搜索文章

Tags

数据库 API FastAPI Calcite 电商系统 MySQL Web 应用 异步数据库 数据同步 ACK 双主架构 循环复制 JumpServer SSL 堡垒机 跳板机 HTTPS TIME_WAIT 运维 负载均衡 HexHub Docker JumpServer安装 堡垒机安装 Linux安装JumpServer Deepseek 宝塔面板 Linux宝塔 生命周期 esxi esxi6 root密码不对 无法登录 web无法登录 服务器 管理口 序列 核心机制 HTTPS加密 Windows Windows server net3.5 .NET 安装出错 服务器性能 查看硬件 Linux查看硬件 Linux查看CPU Linux查看内存 宝塔面板打不开 宝塔面板无法访问 开源 PostgreSQL 存储引擎 Windows宝塔 Mysql重置密码 Oracle 处理机制 无法访问宝塔面板 连接控制 机制 InnoDB 数据库锁 监控 Serverless 无服务器 语言 Spring Redis 异步化 ES 技术 协同 Undo Log group by 索引 SQL 优化 万能公式 分页查询 缓存方案 缓存架构 缓存穿透 高可用 动态查询 GreatSQL 连接数 机器学习 工具 响应模型 查询 scp Linux的scp怎么用 scp上传 scp下载 scp命令 日志文件 MIXED 3 R edis 线程 SVM Embedding 加密 场景 R2DBC 锁机制 数据 主库 Netstat Linux 服务器 端口 openHalo Linux 安全 Postgres OTel Iceberg 云原生 RocketMQ 长轮询 配置 存储 AI 助手 ​Redis 推荐模型 SQLite-Web SQLite 数据库管理工具 Recursive 自定义序列化 SQLark 共享锁 Hash 字段 向量数据库 大模型 PG DBA Ftp 电商 系统 OB 单机版 国产数据库 架构 启动故障 MySQL 9.3 修改DNS Centos7如何修改DNS 人工智能 推荐系统 数据分类 • 索引 • 数据库 流量 Rsync sftp 服务器 参数 防火墙 黑客 线上 库存 预扣 磁盘架构 业务 redo log 重做日志 分库 分表 同城 双活 信息化 智能运维 Python mini-redis INCR指令 MVCC 不宕机 聚簇 非聚簇 向量库 Milvus Canal PostGIS 传统数据库 向量化 行业 趋势 INSERT COMPACT 缓存 Redisson 锁芯 高效统计 今天这篇文章就跟大家 网络架构 网络配置 Doris SeaTunnel prometheus Alert 数据备份 filelock 事务 Java 开发 虚拟服务器 虚拟机 内存 语句 Web 窗口 函数 ZODB 数据脱敏 加密算法 RDB AOF MongoDB 数据结构 读写 引擎 性能 容器 IT运维 核心架构 订阅机制 Go 数据库迁移 失效 OAuth2 Token 自动重启 数据类型 频繁 Codis B+Tree ID 字段 模型 Redis 8.0 发件箱模式 容器化 分布式 集中式 崖山 新版本 网络故障 SSH 微软 SQL Server AI功能 MCP 开放协议 DBMS 管理系统 聚簇索引 非聚簇索引 播客 SpringAI Web 接口 部署 QPS 高并发 Entity 数据页 JOIN 排行榜 排序 数据集成工具 Caffeine CP 原子性 Testcloud 云端自动化 速度 服务器中毒 网络 Pottery StarRocks 数据仓库 工具链 池化技术 连接池 Redka 主从复制 代理 事务隔离 分布式架构 分布式锁​ 分页方案 排版 1 大表 业务场景 dbt 数据转换工具 悲观锁 乐观锁 LRU 分页 AIOPS 日志 优化器 EasyExcel MySQL8 单点故障 sqlmock Order 意向锁 记录锁 仪表盘 事务同步 数据字典 兼容性 InfluxDB 对象 UUIDv7 主键 ReadView 单线程 RAG HelixDB Ansible UUID ID Crash 代码 订单 IT 双引擎 LLM 字典 Weaviate 产业链 编程 Valkey Valkey8.0 恢复数据 千万级 MGR 分布式集群 分布式锁 Zookeeper 线程安全 Pump List 类型 关系数据库 拦截器 动态代理 Next-Key 表空间 解锁 调优 慢SQL优化 快照读 当前读 视图 国产 用户 RR 互联网 GitHub Git 神经系统 矢量存储 数据库类型 AI代理 算法 查询规划 count(*) count(主键) 行数 技巧 CAS 并发控制 恢复机制 多线程 闪回