亿级流量，如何保证Redis与MySQL的一致性？失败如何设计补偿？

2025-06-06 02:00:03 栏目：宝塔面板 94 阅读

说在前面

只要使用到缓存，无论是本地缓存还是使用Redis做缓存，那么就会存在数据同步不一致的问题。

1、先读取缓存，缓存数据有，则立即返回结果；
2、如果缓存中没有数据，则从数据库中读取数据；
3、把读取到的数据同步到缓存中，提供下次读请求返回数据；

这样的作法是大多数人使用缓存的方式，这样能有效减轻数据库压力，但是如果修改删除数据，因为缓存无法感知到数据在数据库中的修改。

这样就会造成数据库中的数据与缓存中数据不一致。

那么该如何解决呢？

有下面4种解决方案：

1、先更新缓存，再更新数据库；
2、先更新数据库，再更新缓存；
3、先删除缓存，后更新数据库；
4、先更新数据库，后删除缓存；

下面我们一一来看下每个方案的可行性：

一、先更新缓存，再更新数据库

这个方案我们一般不考虑。原因是更新缓存成功，但是更新数据库出现异常了。

会导致缓存数据与数据库数据完全不一致，而且很难察觉，因为缓存中的数据一直都存在。

二、先更新DB，再更新缓存

这个方案我们一般也是不考虑，原因跟方案1一样，数据库更新成功了，缓存更新失败，同样会出现数据不一致问题，且不容易被发现，因为缓存中一直存在数据。

三、先删除缓存，后更新DB

这个方案再并发场景下也会出问题，具体出现的原因如下：

两个并发请求：请求A（更新操作）和请求B（读取操作）

1、请求A会先删除Redis中的数据，然后去更新数据库；
2、此时请求B看到Redis中的数据是空的，回去数据库中查询该值，补充到Redis缓存中；
3、此时请求A并没有更新成功，或者是事务还未提交（MySQL的事务隔离级别，会导致未提交的事务数据不会被另一个线程看到），请求B去数据库查询得到旧值.；

这时候就会产生数据库和Redis数据不一致的问题。

因此一般也不建议这种方式

虽然不建议，但是如果你是采用了这种方式，该如何解决数据不一致的问题呢？

其实最简单的办法就是延时双删的策略：

1、先淘汰缓存；
2、再写数据库；
3、休眠1s，再次淘汰缓存；

这样做，可以将1s内所造成的缓存脏数据，再次删除。

但是，但是，这个1s怎么确定的，具体该休眠多久呢？

1、自行评估自己的项目的读数据业务逻辑的耗时（这个我们可以利用SkyWalking等监控工具评估耗时）；
2、评估写数据的休眠时间（在读数据业务耗时的基础上，加几百ms即可）；

这样做的目的，就是确保读请求结束，写请求可以删除读请求造成的缓存脏数据。

延时双删就能彻底解决不一致吗？如果面试官这样问你，你千万不能回答是的。

第一，我们评估的延时时间（读请求耗时+几百毫秒），并不能完全代表实际运行过程中的耗时，运行过程如果因为系统压力过大，我们评估的耗时就是不准确，仍然会导致数据不一致的出现

第二，延时双删虽然在保证事务提交完以后再进行删除缓存，但是如果你使用的是MySQL的读写分离的机构，主从同步之间其实也会有时间差。

此时该如何解决呢？

解决办法有两个：

1、还是使用延时双删策略，只是睡眠时间改为在主从同步的延时时间基础上，加几百毫秒（读接口耗时+主从延迟时间+几百毫秒）；
2、对Redis进行填充数据查询（更新缓存时查询数据库），强制走主库查询，那么我们延时双删就没必要增加主从延时时间了（增加个主从延时时间也会增加更大的不确定性，因为主从延时时间也是不稳定的）；

如果面试官继续深入的问你，采用这种同步延时双删的淘汰策略，接口的吞吐量降低怎么办？（数据变更时，更新接口都要多休眠一个延时时间）

既然同步会降低吞吐量，那就同步改异步（性能优化的常用手段）。

将第二次删除的操作，异步起一个线程，异步删除，这样写的请求就不用沉睡一段时间后才能返回了。

总的来说，先删除缓存，再更新数据库的方式，还是瑕疵较多，发生数据一致性的问题和性能问题的概率更大。比如：

1、先删除缓存可能导致读请求因缓存缺失而大量访问数据库（尤其是高并发场景的电商，可能一瞬间就把数据库打挂了）；
2、读请求接口的耗时和写缓存的时间，估算不够准确，会导致延迟双删中的sleep时间不好设置；

下面我们来看最后一种解决方案，这个解决方式是4个方案中发生数据不一致性的概率最低的。