• 明明是同一条SQL,为什么有时候走索引a,有时候却走索引b ?

明明是同一条SQL,为什么有时候走索引a,有时候却走索引b ?

2025-05-28 01:37:03 栏目:宝塔面板 78 阅读

前言

想象你是一家餐厅的服务员,面前有两个菜单:

  • 菜单A:按菜品分类排列(前菜、主菜、甜点)
  • 菜单B:按价格从低到高排列

当顾客说:"我要最便宜的川菜"。

你会:

  • 先用菜单B找到所有低价菜
  • 从中筛选川菜

或者:

  • 先用菜单A找到所有川菜
  • 再按价格排序

这就是MySQL优化器的日常决策

明明是同一条SQL,有时候走的索引a,而有时候走的索引b,就是它的锅。

今天这篇文章跟大家一起聊聊,MySQL选错索引的问题,希望对你会有所帮助。

1.一个让程序员崩溃的案例

现在有个需求:查询今年开始已付款的前100个订单。

给status字段创建了索引idx_status。

给create_time字段创建了索引idx_create_time。

查询订单的sql如下:

SELECT * FROM orders 
WHERE status = 'paid'      -- 状态条件
AND create_time > '2025-01-01' -- 时间条件
ORDER BY amount DESC 
LIMIT 100;

周一执行计划如下

使用索引:idx_status(状态索引)  
扫描行数:500行  
耗时:0.1秒

周二执行计划如下

使用索引:idx_create_time(时间索引)  
扫描行数:50万行  
耗时:8秒

周一只扫描了500行数据,而周二却扫描了50万行数据。

周一耗时0.1秒,而周二耗时却又8秒。

同一SQL在不同时间性能差异80倍!

让我们拆解背后的原因。

2.揭秘优化器的"决策三步曲"

MySQL优化器的决策流程如下:

成本计算示例

索引名称

预估扫描行数

回表次数

排序成本

总成本

idx_status

50万

50万次

需要排序

1050分

idx_create_time

5万

5万次

无需排序

600分

根据扫描行数、回表次数、排序成本,计算一个总成本的分数。

优化器会选择总成本更低的idx_create_time索引。

3.导致索引切换的四大真凶

真凶1:数据分布变化

场景还原

  • 周一数据:已支付订单5万条,其中2025年的5万条
  • 周二数据:已支付订单50万条,其中2025年的50万条

这个例子中数据分布变化很大,周二的数据,比周一的数据一下子多了45万。

可能会影响总成本的分数。

我们可以通过下面的SQL查看数据分布:

SELECT 
  COUNT(*) AS total,
  SUM(status='paid') AS paid_count,
  SUM(create_time>'2023-01-01') AS new_orders 
FROM orders;

真凶2:统计信息过期

统计信息过期,就像用去年的地图导航,新修的路不会出现在地图上。

MySQL的"地图"就是统计信息。

我们可以通过ANALYZE TABLE ... DELETE STATISTICS命令删除统计信息:

ANALYZE TABLE orders DELETE STATISTICS;

这时候查询可能变成全表扫描:

EXPLAIN SELECT...

显示type: ALL

那么,如何解决这个问题呢?

使用ANALYZE TABLE命令,刷新统计信息(相当于更新地图):

ANALYZE TABLE orders;

真凶3:索引覆盖度差异

点餐类比

  • 菜单A能直接看到菜品价格 → 无需问厨师(覆盖索引)
  • 菜单B只能看到菜品名 → 需要问厨师详情(回表查询)

下面的SQL会走idx_status(需要回表):

SELECT * FROM orders WHERE status='paid';

下面的SQL会走idx_create_time(覆盖索引):

SELECT create_time FROM 
orders WHERE create_time>'2023-01-01';

真凶4:索引碎片化

索引碎片化就像书本的目录页被撕破,找内容变得困难。

检查方法

SHOW TABLE STATUS LIKE 'orders';

查看Data_free字段,值越大碎片越多。

优化方案

使用ALTER TABLE命令重建索引。

ALTER TABLE orders ENGINE=INNODB;

4.问题排查四步法

第一步:查看当前执行计划

使用EXPLAIN查看当前SQL的执行计划:

EXPLAIN 
SELECT * FROM orders 
WHERE status='paid' 
AND create_time>'2023-01-01';

第二步:检查统计信息

使用SHOW INDEX命令检查索引的统计信息:

SHOW INDEX FROM orders;

关注Cardinality字段,值越接近真实数据越好。

第三步:分析数据分布

使用下面的SQL分析数据分布:

SELECT 
  COUNT(*) AS total,
  AVG(LENGTH(status)) AS status_avg_len 
FROM orders;

第四步:追踪优化器思考过程

SET optimizer_trace="enabled=on";
SELECT * FROM orders WHERE ...;
SELECT * FROM INFORMATION_SCHEMA.OPTIMIZER_TRACE;

开启optimizer_trace,然后通过INFORMATION_SCHEMA.OPTIMIZER_TRACE表查看追踪优化器思考过程。

5.三大终极解决方案

方案1:引导优化器选择

使用FORCE INDEX强制使用指定索引:

SELECT * FROM orders FORCE INDEX(idx_status) WHERE ...;

方案2:创建更优索引

创建更优的联合索引:

ALTER TABLE orders 
ADD INDEX idx_status_create_time(status,create_time);

方案3:定期维护计划

  1. 定期统计信息更新
  2. 定期碎片率检查
  3. 定期索引重建

总结

六个必须检查的点

  • WHERE条件字段是否有合适索引
  • ORDER BY/GROUP BY是否利用索引排序
  • 统计信息是否最新(尤其大表每天更新)
  • 是否存在索引碎片(每月检查一次)
  • 是否出现索引合并(INDEX_MERGE)
  • 是否使用覆盖索引(减少回表)

三条黄金法则

  1. 二八定律:20%的索引满足80%的查询
  2. 数据驱动:定期分析查询模式调整索引
  3. 防御编程:核心查询明确指定索引

本文地址:https://www.yitenyun.com/244.html

搜索文章

Tags

数据库 API FastAPI Calcite 电商系统 MySQL Web 应用 异步数据库 数据同步 ACK 双主架构 循环复制 JumpServer SSL 堡垒机 跳板机 HTTPS TIME_WAIT 运维 负载均衡 HexHub Docker JumpServer安装 堡垒机安装 Linux安装JumpServer Deepseek 宝塔面板 Linux宝塔 生命周期 esxi esxi6 root密码不对 无法登录 web无法登录 服务器 管理口 序列 核心机制 HTTPS加密 Windows Windows server net3.5 .NET 安装出错 服务器性能 查看硬件 Linux查看硬件 Linux查看CPU Linux查看内存 宝塔面板打不开 宝塔面板无法访问 开源 PostgreSQL 存储引擎 Windows宝塔 Mysql重置密码 Oracle 处理机制 无法访问宝塔面板 连接控制 机制 InnoDB 数据库锁 监控 Serverless 无服务器 语言 Spring Redis 异步化 ES 协同 技术 Undo Log group by 索引 SQL 优化 万能公式 分页查询 缓存方案 缓存架构 缓存穿透 高可用 动态查询 GreatSQL 连接数 机器学习 工具 响应模型 查询 scp Linux的scp怎么用 scp上传 scp下载 scp命令 日志文件 MIXED 3 R edis 线程 SVM Embedding 加密 场景 R2DBC 锁机制 数据 主库 Netstat Linux 服务器 端口 openHalo Linux 安全 Postgres OTel Iceberg 云原生 RocketMQ 长轮询 配置 存储 AI 助手 ​Redis 推荐模型 SQLite-Web SQLite 数据库管理工具 Recursive 自定义序列化 SQLark 共享锁 向量数据库 大模型 Hash 字段 PG DBA 电商 系统 Ftp OB 单机版 国产数据库 架构 启动故障 MySQL 9.3 修改DNS Centos7如何修改DNS 人工智能 推荐系统 数据分类 • 索引 • 数据库 磁盘架构 流量 Rsync sftp 服务器 参数 防火墙 黑客 线上 库存 预扣 redo log 重做日志 业务 分库 分表 同城 双活 信息化 智能运维 Python mini-redis INCR指令 MVCC 不宕机 聚簇 非聚簇 向量库 Milvus Canal PostGIS 传统数据库 向量化 行业 趋势 INSERT COMPACT 缓存 Redisson 锁芯 高效统计 今天这篇文章就跟大家 网络架构 网络配置 Doris SeaTunnel prometheus Alert 数据备份 虚拟服务器 虚拟机 内存 filelock 事务 Java 开发 ZODB 语句 Web 窗口 函数 RDB AOF 数据脱敏 加密算法 MongoDB 数据结构 读写 引擎 性能 容器 IT运维 核心架构 订阅机制 Go 数据库迁移 失效 OAuth2 Token Redis 8.0 自动重启 数据类型 频繁 Codis B+Tree ID 字段 模型 发件箱模式 容器化 分布式 集中式 崖山 新版本 网络故障 SSH 微软 SQL Server AI功能 MCP 开放协议 DBMS 管理系统 聚簇索引 非聚簇索引 播客 SpringAI 数据集成工具 Web 接口 部署 QPS 高并发 JOIN Entity 数据页 排行榜 排序 速度 服务器中毒 Caffeine CP 原子性 StarRocks 数据仓库 工具链 Testcloud 云端自动化 网络 Pottery 池化技术 连接池 Redka 大表 业务场景 主从复制 代理 事务隔离 分布式架构 分布式锁​ 分页方案 排版 1 悲观锁 乐观锁 dbt 数据转换工具 LRU 分页 AIOPS 日志 优化器 EasyExcel MySQL8 单点故障 sqlmock Order 意向锁 记录锁 仪表盘 数据字典 兼容性 事务同步 InfluxDB 对象 UUIDv7 主键 ReadView 单线程 RAG HelixDB Ansible UUID ID 订单 Crash 代码 IT 双引擎 LLM 字典 Weaviate 产业链 编程 Valkey Valkey8.0 恢复数据 千万级 MGR 分布式集群 分布式锁 Zookeeper 线程安全 Pump List 类型 关系数据库 拦截器 动态代理 Next-Key 表空间 解锁 调优 慢SQL优化 快照读 当前读 视图 国产 用户 RR 互联网 GitHub Git 神经系统 矢量存储 数据库类型 AI代理 算法 查询规划 count(*) count(主键) 行数 技巧 并发控制 恢复机制 CAS 多线程 闪回