• Redis如何保证高可用?

Redis如何保证高可用?

2025-08-16 12:33:02 栏目:宝塔面板 39 阅读

前言

我亲历过Redis宕机导致损失惨重的教训。

真正的Redis高可用不是简单的主从复制,而是构建能自动愈合的分布式神经系统。

这篇文章跟大家一起聊聊Redis如何保证高可用,希望对你会有所帮助。

这两天苏三的星球太火爆了,公众号上所有的优惠券都已经抢完了。

一、主从复制:高可用的基石与陷阱

主从复制全流程解析

图片

致命陷阱:异步复制导致的数据丢失

# 主节点写入后宕机(未同步到从节点)  
SET order:1001 "confirmed"  
# 从节点提升为主节点后,订单状态丢失

解决方案:

// 强制同步写入(谨慎使用)  
Jedis jedis = new Jedis("master", 6379);  
jedis.waitReplicas(1, 1000); // 等待1个从节点同步

二、哨兵模式:自动故障转移的艺术

三节点哨兵集群部署

图片

哨兵选举四部曲:

  1. 主观下线(SDOWN):单个哨兵检测到主节点失联
  2. 客观下线(ODOWN):超过quorum数量的哨兵确认
  3. 领导者选举:基于Raft算法选出主哨兵
  4. 故障转移:提升最优从节点为新主节点

Java客户端连接哨兵示例:

Set sentinels = new HashSet<>();  
sentinels.add("192.168.1.10:26379");  
sentinels.add("192.168.1.11:26379");  

JedisSentinelPool pool = new JedisSentinelPool(  
    "mymaster", sentinels, poolConfig);  

try (Jedis jedis = pool.getResource()) {  
    // 自动路由到当前主节点  
    jedis.set("config:timeout", "500");   
}

三、Redis Cluster:水平扩展的终极方案

数据分片原理

图片

节点通信Gossip协议:

// 模拟节点间状态传播  
public void gossip(Node node) {  
    // 随机选择3个节点交换状态  
    List peers = selectRandomPeers(3);  
    for (Node peer : peers) {  
        sendPing(peer, currentState);  
    }  
}

跨槽位操作解决方案:

# 错误:多key不在同槽位  
MGET user:1001:name user:1002:age  

# 正确:使用hash tag强制同槽位  
MGET user:{1001}:name user:{1001}:age

四、多级高可用架构设计

电商平台真实案例

图片

四层防护体系:

  1. 代理层:Twemproxy自动路由+负载均衡
  2. 集群层:双集群互备+就近访问
  3. 数据层:1主2从+读写分离
  4. 灾备层:跨地域异步复制

五、避坑指南

脑裂问题:最危险的故障模式

发生场景:

图片

解决方案:

# 1. 增加哨兵节点数(至少3个)  
sentinel monitor mymaster 192.168.1.10 6379 2  

# 2. 设置主节点最小从节点数  
min-replicas-to-write 1

缓存雪崩预防

// 缓存穿透+雪崩防护代码示例  
public String getProductInfo(String id) {  
    // 1. 查询缓存  
    String cacheKey = "product:" + id;  
    String value = jedis.get(cacheKey);  

    // 2. 缓存穿透:空值缓存  
    if ("NULL_OBJ".equals(value)) returnnull;  

    // 3. 缓存未命中  
    if (value == null) {  
        // 4. 互斥锁防止雪崩  
        if (jedis.setnx("lock:"+id, "1") == 1) {  
            jedis.expire("lock:"+id, 3); // 避免死锁  
            try {  
                // 5. 数据库查询  
                value = db.query("SELECT...");  
                // 6. 空结果防穿透  
                jedis.setex(cacheKey, 300, value == null ? "NULL_OBJ" : value);  
            } finally {  
                jedis.del("lock:"+id);  
            }  
        } else {  
            // 7. 其他线程等待重试  
            Thread.sleep(100);  
            return getProductInfo(id);  
        }  
    }  
    return value;  
}

六、监控体系:高可用的生命线

告警规则示例:

# 复制延迟 > 5秒  
repl_delay{instance="*"} > 5  

# 内存使用 > 90%  
memory_used_percentage > 0.9  

# 连接数 > 80%上限  
connected_clients / maxclients > 0.8

总结

三级防御体系:

图片

五个核心原则:

  1. 冗余设计:最少1主2从,跨机架部署
  2. 自动故障转移:哨兵quorum数 = 节点数/2 + 1
  3. 容量规划:内存使用率控制在70%以下
  4. 性能隔离:业务集群物理隔离
  5. 混沌工程:定期模拟节点宕机、网络分区

高可用的本质不是避免故障,而是在故障发生时系统仍能持续提供服务。

通过主从复制、哨兵机制、Cluster集群的三级防御,配合严谨的监控和容量规划,才能构建真正弹性的Redis架构。

本文地址:https://www.yitenyun.com/332.html

搜索文章

Tags

数据库 API FastAPI Calcite 电商系统 MySQL Web 应用 异步数据库 数据同步 ACK 双主架构 循环复制 TIME_WAIT 运维 负载均衡 JumpServer SSL 堡垒机 跳板机 HTTPS JumpServer安装 堡垒机安装 Linux安装JumpServer Deepseek 宝塔面板 Linux宝塔 Docker 生命周期 esxi esxi6 root密码不对 无法登录 web无法登录 HexHub 序列 核心机制 Windows Windows server net3.5 .NET 安装出错 服务器 管理口 HTTPS加密 宝塔面板打不开 宝塔面板无法访问 查看硬件 Linux查看硬件 Linux查看CPU Linux查看内存 Windows宝塔 Mysql重置密码 Oracle 处理机制 InnoDB 数据库锁 无法访问宝塔面板 开源 PostgreSQL 存储引擎 监控 连接控制 机制 Serverless 无服务器 语言 服务器性能 ES 协同 技术 Spring Redis 异步化 缓存方案 缓存架构 缓存穿透 分页查询 索引 group by 高可用 Undo Log GreatSQL 连接数 SQL 动态查询 机器学习 日志文件 MIXED 3 响应模型 R2DBC SVM Embedding 优化 万能公式 R edis 线程 数据 主库 自定义序列化 RocketMQ 长轮询 配置 Postgres OTel Iceberg 工具 云原生 Netstat Linux 服务器 端口 Linux 安全 ​Redis 推荐模型 SQLark scp Linux的scp怎么用 scp上传 scp下载 scp命令 AI 助手 共享锁 PG DBA 向量数据库 大模型 openHalo 存储 SQLite-Web SQLite 数据库管理工具 Recursive Hash 字段 电商 系统 OB 单机版 查询 Ftp 架构 锁机制 • 索引 • 数据库 流量 Rsync 修改DNS Centos7如何修改DNS redo log 重做日志 数据分类 加密 磁盘架构 聚簇 非聚簇 sftp 服务器 参数 向量库 Milvus 线上 库存 预扣 人工智能 推荐系统 场景 同城 双活 信息化 智能运维 MySQL 9.3 防火墙 黑客 业务 Python 高效统计 今天这篇文章就跟大家 Doris SeaTunnel MVCC 数据备份 传统数据库 向量化 不宕机 mini-redis INCR指令 缓存 窗口 函数 Redisson 锁芯 RDB AOF INSERT COMPACT 网络架构 网络配置 分库 分表 prometheus Alert PostGIS 启动故障 事务 Java 开发 Canal Web 崖山 新版本 filelock MongoDB 数据结构 IT运维 B+Tree ID 字段 分布式 集中式 ZODB 核心架构 订阅机制 引擎 性能 数据脱敏 加密算法 Go 数据库迁移 容器 数据类型 虚拟服务器 虚拟机 内存 读写 网络故障 容器化 DBMS 管理系统 频繁 Codis 模型 Redis 8.0 OAuth2 Token JOIN QPS 高并发 微软 SQL Server AI功能 Pottery 聚簇索引 非聚簇索引 原子性 工具链 国产数据库 发件箱模式 自动重启 部署 Entity SpringAI Testcloud 云端自动化 速度 服务器中毒 事务隔离 Web 接口 分页方案 排版 排行榜 排序 SSH Caffeine CP 行业 趋势 数据页 数据集成工具 MCP 开放协议 悲观锁 乐观锁 StarRocks 数据仓库 Redka sqlmock LRU 大表 业务场景 分布式架构 分布式锁​ 1 分页 AIOPS dbt 数据转换工具 优化器 池化技术 连接池 单点故障 仪表盘 网络 Order 意向锁 记录锁 EasyExcel MySQL8 InfluxDB 事务同步 日志 IT 字典 RAG HelixDB 对象 双引擎 订单 播客 单线程 Crash 代码 主从复制 代理 Ansible 编程 UUIDv7 主键 UUID ID LLM 语句 恢复数据 Pump Valkey Valkey8.0 ReadView 线程安全 产业链 兼容性 数据字典 List 类型 失效 Weaviate MGR 分布式集群 解锁 调优 表空间 Next-Key 分布式锁 Zookeeper 慢SQL优化 关系数据库 矢量存储 数据库类型 AI代理 RR 互联网 GitHub Git 查询规划 国产 用户 算法 千万级 快照读 当前读 视图 神经系统 count(*) count(主键) 行数 CAS 技巧 拦截器 动态代理 多线程 并发控制 恢复机制 闪回