面试官：使用 MySQL 时，你们是怎样做大表清理的？

2025-06-13 02:37:03 栏目：宝塔面板 106 阅读

使用 MySQL 时，我们经常会遇到大表清理的情况。做大表清理的目的，一般是为了减表空间使用，提高表的操作性能。今天来聊一聊怎样做大表清理。

一、SQL 清除

最直接的方式就是使用 delete 语句来删除，可以使用主键：

delete from test1 where id in(...) order by id;

delete 语句存在的问题是 InnoDB 引擎只会把 SQL 中删除的记录标记为删除，并不会回收磁盘空间，也就是说磁盘数据文件大小并不会减小。当然删除的这条数据在磁盘文件中的位置是可以复用的，比如删除一条 id 为 4 的记录，就可以成功插入一条 id 为 4 的记录。

delete 语句删除还有一个缺点是会留下大量磁盘碎片，影响索引性能。

注意： 1.使用 delete 语句时可以使用 order by 对删除条件进行排序，这样可以保证删除顺序，避免全表扫描； 2.删除之前要做备份。

二、逻辑删除

既然使用 delete 语句做清理不能释放表空间，那我们不如对数据做逻辑删除。

//del_flag=1 表示逻辑删除
update test1 set del_flag = '1' where id in(...);

这样做的好处是并不会留下磁盘碎片，对索引性能没有影响。但也存在缺点，那就是归档的时候需要对所有数据的删除标识（del_flag）做判断。

三、使用分区表

如果业务上没有特殊要求，可以使用分区表，对分区直接做清理。比如以月为单位创建分区，对三个月以上的表做归档后直接把分区表 drop 掉。

ALTER TABLE test1 DROP PARTITION part202503;

分区表清理适合用于定期清理的场景，而且分区键必须要跟清理条件相符合，每月按周、按月、按季度，建表之前需要提前规划好清理策略。

如果分区键需要按照业务属性（比如身份证号）来定义，按照分区清理可能就不合适了。

四、使用临时表

MySQL 官方文档给的一种删除方式是先把不删除的数据备份到一张临时表，然后再把原表改名，把临时表改成原表名字，最后 drop 掉原表。

//1.备份数据到临时表
INSERT INTO test1_copy SELECT * FROM test1 WHERE id in(...) ;
//2.把原表改名，把临时表改名为原表名字
RENAME TABLE test1 TO test1_old, test1_copy TO test1_copy;
//3.删除原表
DROP TABLE test1_old;

RENAME 语句可以防止其他会话再操作 test1 表，所以这个过程不会有并发问题。

但是在写入频率高的情况下，如果服务不中断，并不能保证执行备份语句和 rename 语句之间没有数据写入。

五、重建表

为了避免上一节存在的问题，可以使用重建表的语句：

alter table test1 engine=InnoDB

在 MySQL 5.6 之后，支持 Online DDL，所以 SQL 执行过程中，test1 表依然可以进行增删改操作，这些操作会记录在日志文件中，重建表完成后，在新表上做重放，因此不用担心丢失数据。Online DDL 重建表的流程如下：

1. 建立一个临时文件，扫描 test1 表的所有记录并生成 B+ 树，存储到临时文件中；

2. 生成临时文件的过程中，对 test1 的所有增删改操作记录到一个日志文件中；

3. 临时文件生成后，将日志文件中的操作在临时文件做重放，这样临时文件的数据跟 test1 数据文件中数据逻辑上相同；

4. 用临时文件替换test1 表的数据文件。

六、使用归档工具

可以考虑使用归档工具比如 Percona Toolkit。

七、总结

大表清理是工作中经常遇到的情况，大表清理的方法有很多，可以根据自己实际的业务场景选择合理的清理方式，无论选择哪一种方案，都要注意一下三点：

1. 清理之前做好数据备份；

2. 清理过程要评估是否对业务有影响，是否会中段业务；

3. 确定好清理周期。

本文地址：https://www.yitenyun.com/284.html

上一篇：数据更新策略：到底是先更新数据库还是先更新缓···

下一篇：维护笔记：Oracle 启动失败 ORA-03113 + ORA-19···

搜索文章

所有分类

宝塔面板（254） Windows （2） Linux （8）香港服务器（0）美国服务器（0）香港站群服务器（0）美国站群服务器（0）

Tags