主从复制、哨兵与 Cluster 对比解析Redis 集群手札

前言

在分布式系统中，Redis 作为高性能内存数据库，其集群方案的选择直接影响系统的稳定性、可用性与扩展性。Redis 集群的核心演进逻辑，是逐步解决数据可靠性（防单点丢数据）、服务高可用性（防单点断服务）、数据扩展性（突破单机瓶颈）三大核心诉求。以下从三种核心集群方案的原理、特点、案例出发，梳理其区别与适用场景。

基础认知：为什么需要 Redis 集群？

单机 Redis 存在三大致命局限，集群方案正是为解决这些问题而生：

单点故障风险：单机宕机后，数据可能丢失，服务直接中断；
性能瓶颈：单机读写 QPS 有限（通常万级），无法支撑高并发场景；
存储瓶颈：单机内存容量有限，无法存储海量数据（如千万级商品、亿级订单）。

三大集群方案详解

1. 主从复制（Replication）：数据冗余与读写分离的基石

定位

最基础的集群方案，核心解决数据可靠性与读性能扩展，是哨兵、Cluster 模式的底层基础。

架构

采用 “一主（Master）多从（Slave）” 结构：

主节点（Master）：唯一处理写操作（新增、修改、删除）；
从节点（Slave）：通过异步复制主节点数据，仅承担读操作（查询）。

工作原理

全量同步：从节点启动时，向主节点发送 SYNC 命令；主节点执行 BGSAVE 生成 RDB 快照，发送给从节点，从节点加载快照完成初始数据同步；
增量同步：全量同步后，主节点将后续收到的写命令存入 “复制缓冲区”，异步推送给所有从节点，保证从节点数据与主节点一致。

核心优缺点

优点	缺点
1. 数据热备：从节点实时备份主节点数据，避免单点数据丢失； 2. 读写分离：从节点分担读请求，提升整体读 QPS； 3. 部署简单：无需额外组件，配置成本低。	1. 无自动故障转移：主节点宕机后，需人工执行 `slaveof no one` 切换从节点为新主，服务中断时间长； 2. 写性能瓶颈：所有写操作集中在主节点，无法突破单机写上限； 3. 存储瓶颈：所有节点存储全量数据，无法突破单机内存限制。

2. 哨兵模式（Sentinel）：主从架构的高可用升级

定位

在主从复制基础上，通过引入 “哨兵节点” 解决服务高可用性问题（自动故障转移），但未解决存储与写性能瓶颈。

架构

“主从节点 + 哨兵集群（≥3 个奇数节点）” 结构：

哨兵节点（Sentinel）：独立进程，不存储数据，仅负责监控、故障判定与转移；
数据节点：沿用主从复制的 “一主多从”，主写从读。

工作原理

核心实现 “监控 – 判定 – 转移 – 发现” 四大能力：

监控：所有哨兵节点实时 ping 主从节点，检查节点健康状态；
故障判定：
- 主观下线（SDOWN）：单个哨兵发现主节点无响应，标记为 “疑似宕机”；
- 客观下线（ODOWN）：超过半数哨兵（如 3 个哨兵中 2 个）确认主节点无响应，判定为 “真正宕机”；
故障转移：哨兵集群通过 Raft 算法选举 1 个 “Leader 哨兵”，由其执行：
- 选一个健康从节点，提升为新主节点；
- 让其他从节点复制新主节点数据；
- 通知客户端新主节点地址；
服务发现：客户端连接哨兵集群，而非直接连数据节点，故障转移对客户端透明。

核心优缺点

优点	缺点
1. 自动故障转移：主节点宕机后，10-30 秒内完成切换，服务中断时间短； 2. 无需人工干预：故障检测、转移全自动化； 3. 兼容主从优势：保留读写分离与数据热备能力。	1. 写性能瓶颈：仍为 “一主多从”，所有写操作集中在单主节点； 2. 存储瓶颈：所有节点存储全量数据，无法突破单机内存限制； 3. 运维成本增加：需维护哨兵集群，确保哨兵节点高可用。

3. Cluster 集群：分布式扩展的终极方案

定位

Redis 原生分布式方案，同时解决高可用性与数据扩展性（存储 + 写性能），适用于海量数据、高并发场景。

架构

去中心化的 “多主多从” 结构：

主节点（≥3 个）：每个主节点负责一部分数据，可独立处理写操作；
从节点（每个主节点对应 1+ 个）：复制主节点数据，主节点宕机时自动升级为新主；
哈希槽（Slot）：核心分片机制，将数据空间划分为 16384 个槽，每个主节点负责一段连续的槽（如主 1 负责 0-5460，主 2 负责 5461-10922）。

核心原理：数据分片与路由

数据路由：对每个 Key 计算 CRC16(key) % 16384，得到其所属的 “哈希槽”；
分片管理：客户端根据槽与主节点的映射关系，将请求发送到对应主节点；若客户端连接错节点，会收到 MOVED 指令，重定向到正确节点；
故障转移：主节点宕机后，其从节点通过 Raft 算法选举新主，接管原主节点的哈希槽，实现高可用。

核心优缺点

优点	缺点
1. 海量存储：数据分片存储，容量随主节点数量水平扩展（如 10 主节点可存 10 倍单机数据）； 2. 高性能：多主节点并行处理写操作，写 QPS 线性提升； 3. 原生高可用：内置故障转移，无需额外哨兵组件。	1. 架构复杂：部署、运维、故障排查成本高（需监控槽分布、节点状态）； 2. 客户端限制：需支持 Cluster 协议（如 Lettuce、Redisson），否则需处理 `MOVED` 重定向； 3. 功能限制：不支持跨节点多 Key 操作（如 `MSET` 多 Key 不在同一槽）、跨节点事务。

三种方案对比与选型指南

特性	主从复制	哨兵模式	Cluster 集群
核心目标	数据备份、读性能扩展	高可用（自动故障转移）	高可用 + 存储 / 写扩展
数据模型	全量数据副本（所有节点存全量）	全量数据副本	数据分片（按槽存储）
写性能	单点写入（瓶颈）	单点写入（瓶颈）	多点写入（水平扩展）
存储容量	单机上限	单机上限	水平扩展（无上限）
数据备份	✅	✅	✅
读写分离	✅	✅	✅
自动故障转移	❌（手动）	✅	✅
横向扩展	❌	❌	✅
高可用	❌（主从挂了要手动切）	✅	✅
复杂度(运维维护度)	低	中	高
客户端要求	低	中（需要支持 Sentinel）	高（需要支持 Cluster）
适用数据量	小	中	大
典型场景	备份、简单读写分离	核心业务高可用	海量数据、高并发

选型建议（2025 年最佳实践）

小项目 / 低并发 / 预算有限：
- 使用 主从复制，手动切换从节点（适合数据量小的内部系统）。
- 特点：数据量小（<10GB）、写请求少（QPS < 1000）、服务中断代价低；
中项目 / 高可用要求 / 单节点够用：
- 使用 哨兵模式 + 主从复制（适合小公司核心业务，如支付、用户管理）。
- 特点：数据量适中（10GB-50GB）、需高可用（服务中断代价高）、写请求不高（QPS < 5000）；
大项目 / 海量数据 / 高并发 / 横向扩展：
- 使用 Cluster 集群（适合电商、金融、大数据平台）。
- 特点：数据量巨大（>50GB）、写并发高（QPS > 5000）、需高可用；
微服务架构：
- 可以使用 多个哨兵集群 或 一个 Cluster 集群，根据业务模块划分。

经常听到哨兵模式已经逐渐被 Cluster 集群取代的自己理解

Redis Cluster 虽然是未来主流，适合生产环境的大多数高可用需求，但是实际中Sentinel 模式够简单在中小型场景完全够用。因此呢Sentinel 模式并不是完全淘汰的。

选型的核心逻辑是贴合业务需求：无需追求 “最先进” 的方案，而是选择 “成本与收益匹配” 的方案 —— 小型项目用主从足够，中型项目加哨兵保障可用，大型项目再上 Cluster 突破瓶颈。

主从复制、哨兵与 Cluster 对比解析Redis 集群手札

前言

基础认知：为什么需要 Redis 集群？

三大集群方案详解

1. 主从复制（Replication）：数据冗余与读写分离的基石

定位

架构

工作原理

核心优缺点

2. 哨兵模式（Sentinel）：主从架构的高可用升级

定位

架构

工作原理

核心优缺点

3. Cluster 集群：分布式扩展的终极方案

定位

架构

核心原理：数据分片与路由

核心优缺点

三种方案对比与选型指南

选型建议（2025 年最佳实践）

经常听到哨兵模式 已经逐渐被 Cluster 集群 取代的自己理解

发送评论 编辑评论

经常听到哨兵模式已经逐渐被 Cluster 集群取代的自己理解

发送评论编辑评论