理解Redis-Cluster集群

Redis作为一款性能优异的内存数据库,支撑着微博亿级社交平台,也成为很多互联网公司的标配。这里将以Redis Cluster集群为核心,基于最新的Redis5版本,从原理再到实战,玩转Redis集群

常见Redis集群方案

在介绍Redis Cluster集群方案之前,为了方便对比,先简单了解一下业界常见的Redis集群方案:

1 基于客户端分片


Redis Sharding是Redis Cluster出来之前,业界普遍使用的多Redis实例集群方法。其主要思想是基于哈希算法,根据Redis数据的key的哈希值对数据进行分片,将数据映射到各自节点上

优点在于实现简单,缺点在于当Redis集群调整,每个客户端都需要更新调整

2 基于代理服务器分片


客户端发送请求到独立部署代理组件,代理组件解析客户端的数据,并将请求转发至正确的节点,最后将结果回复给客户端

优点在于透明接入,容易集群扩展,缺点在于多了一层代理转发,性能有所损耗

3 Redis Sentinel(哨兵)


Redis Sentinel是官方从Redis 2.6版本提供的高可用方案,在Redis主从复制集群的基础上,增加Sentinel集群监控整个Redis集群。当Redis集群master节点发生故障时,Sentinel进行故障切换,选举出新的master,同时Sentinel本身支持高可用集群部署

优点在于支持集群高可用,高性能读写,缺点在于没有实现数据分片,每个节点需要承载完整数据集,负载能力受当个Redis服务器限制,仅支持通过增加机器内存实现垂直扩容,不支持水平扩展

Redis Cluster设计

1 整体设计

Redis Cluster 是 在 3.0 版本正式推出的高可用集群方案,相比Redis Sentinel,Redis Cluster方案不需要额外部署Sentinel集群,而是通过集群内部通信实现集群监控,故障时主从切换;同时,支持内部基于哈希实现数据分片,支持动态水平扩容

整体架构如下:


集群中有多个主节点,每个主节点有多个从节点,主从节点间数据一致,最少需要3个主节点,每个主节点最少需要1个从节点

  • 高可用:当master节点故障时,自动主从切换
  • 高性能:主节点提供读写服务,从节点只读服务,提高系统吞吐量
  • 可扩展性:集群的数据分片存储,主节点间数据各不同,各自维护对应数据,可以为集群添加节点进行扩容,也可以下线部分节点进行水平缩容

2 数据分片

将整个数据集按照一定规则分配到多个节点上,称为数据分片,Redis Cluster采用的分片方案是哈希分片


基本原理如下:
Redis Cluster首先定义了编号0 ~ 16383的区间,称为槽,所有的键根据哈希函数映射到0 ~ 16383整数槽内,计算公式:slot=CRC16(key)&16383。每一个节点负责维护一部分槽以及槽所映射的键值数据

槽是 Redis 集群管理数据的基本单位,集群扩容收缩就是槽和数据在节点之间的移动

槽与节点映射关系如下:

  • 每个集群节点维护着一个16384 bit (2kB)的位数组,每个bit对应相同编号的槽,用 0 / 1标识对于某个槽自己是否拥有
  • 集群节点同时还维护着槽到集群节点的映射,是由长度为16384,数组下标代表槽编号,值为节点信息的数组

3 集群扩容

Redis Cluster支持不影响集群对外服务的情况下,对集群进行动态扩容或缩容,当Redis 新节点加入现有集群后,需要为其迁移槽和数据,确保迁移后每个节点负责相似数量的槽,使数据分布均匀在各节点上

整个数据迁移涉及系列操作,Redis提供了集群管理工具,包括基于Ruby的redis-trib.rb,还Redis5新提供的基于C语言redis-cli,下面的介绍以redis-cli为例

源节点将指定slot数据迁移到目标节点,基本流程如下:

  • (1) redis-cli设置目标节点指定slot状态importing,让目标节点准备迁入slot数据
  • (2) redis-cli设置源节点指定slot状态migrating,让让源节点准备迁出slot的数据
  • (3) redis-cli批量迁移源节点指定slot中的数据到目标节点
  • (4) 数据迁移完后 redis-cli向集群所有主节点通知槽被分配给目标节点,主节点更新slot与节点映射关系信息

通常情况下,如果客户端请求的数据不在节点上,节点会回复 MOVED 重定向信息,客户端根据该信息再请求正确的节点。对于正在迁移的slot数据,保证客户端仍然能正常访问的设计如下:

  • (1) 迁移完成后才更新slot与节点映射关系信息,如果迁移进行中的映射信息保持与迁移前一致
  • (2) 如果客户端访问源节点,访问的key尚未迁出,则正常的处理该key
  • (3) 如果客户端访问源节点,访问的key尚已迁出,源节点返回ASK重定向信息
  • (4) 客户端根据ASK 重定向异常提取出目标节点信息,先向目标节点发送ASKING命令请求操作,再执行键命令

ASK 和 MOVED 这2个重定向控制有如下区别:

  • ASK 重定向说明集群正在进行 slot 数据迁移,客户端无法知道什么时候迁移完成,因此只能是临时性的重定向,客户端不会更新 slot 到 Redis 节点的映射缓存。
  • MOVED 重定向说明键对应的slot 已经明确指定到新的节点,因此需要更新 slot 到 Redis 节点的映射缓存

4 CAP取舍

CAP包括:一致性(Consistency)、可用性(Availability)、分区容错性(Partition tolerance),系统如果不能在时限内达成数据一致性,就意味着发生了分区的情况,必须在C和A之间做出选择

Redis Cluster选择了AP架构,为了保证可用性,Redis并不保证强一致性,在特定条件下会出现数据不一致甚至丢失写操作


第一个原因是:为了在性能和一致性上做出权衡,主从节点间数据同步是异步复制的,当客户端成功写入master节点,master返回成功,master节点才将写操作异步复制给slave节点

另外一个原因是,当集群发送网络分区,集群可能会分为两部分:多数派和少数派,假如masterA节点位于少数派,如果网络分区发生时间较短,那么集群将会继续正常运作;如果分区的时间足够长,让多数派中选举为新的master替代matsterA,那么分区期间写入masterA的数据就丢失了

在网络分区期间, 客户端可以向matsterA发送写命令的最大时间是有限制的, 这一时间限制称为节点超时时间(cluster-node-timeout),是 Redis集群的一个重要的配置选项

集群搭建

2018年10月 Redis 发布了稳定版本的 5.0 版本,推出了各种新特性,其中一点是集群管理工具从基于Ruby的redis-trib.rb移植到基于C语言redis-cli中,方便集群的构建和管理

Redis Cluster集群运行至少需要包含3个主节点,实现高可用最少需要3主3从6个节点

以下步骤基于Redis 5.0.5版本,介绍如何在一台 Linux 服务器上搭建有3主3从的6节点的 Redis集群

  • 步骤1 创建安装目录

    mkdir -p /data/project/redis-cluster
  • 步骤2 下载源码并解压编译

    cd /data/project/redis-cluster
    wget http://download.redis.io/releases/redis-5.0.5.tar.gz
    tar xzf redis-5.0.5.tar.gz
    cd redis-5.0.5
    make

    执行make后,如果报错“jemalloc/jemalloc.h:没有那个文件或目录”,可以改为用以下命令:

    make MALLOC=libc
  • 步骤3 创建6个Redis配置文件
    6个配置文件不能在同一个目录,下面Redis 6个节点分别安装在7000~7005端口
    首先创建配置文件目录及文件,定义如下:

    mkdir -p /data/project/redis-cluster/nodes/7000
    mkdir -p /data/project/redis-cluster/nodes/7001
    mkdir -p /data/project/redis-cluster/nodes/7002
    mkdir -p /data/project/redis-cluster/nodes/7003
    mkdir -p /data/project/redis-cluster/nodes/7004
    mkdir -p /data/project/redis-cluster/nodes/7005
    

touch /data/project/redis-cluster/nodes/7000/redis.conf
touch /data/project/redis-cluster/nodes/7001/redis.conf
touch /data/project/redis-cluster/nodes/7002/redis.conf
touch /data/project/redis-cluster/nodes/7003/redis.conf
touch /data/project/redis-cluster/nodes/7004/redis.conf
touch /data/project/redis-cluster/nodes/7005/redis.conf

redis.conf配置文件的内容为:
```shell
############################## 网络 ##############################
#端口
port 7000
#非保护模式,如果值为yes,则必须是 bind配置指定的ip的机器连接或者使用密码连接
protected-mode no 

############################## 通用 ##############################
#后台运行
daemonize yes 
#记录redis进程pid
pidfile  /var/run/redis_7000.pid

############################## 集群 ##############################
#启用集群模式
cluster-enabled yes 
cluster-config-file nodes_7000.conf
#集群节点如果在该超时时间(毫秒)内不可达,则认为节点处于故障状态
cluster-node-timeout 15000

############################## 持久化 ##############################
#AOF, RDB持久化文件目录
dir /data/project/redis-cluster/nodes
#开启AOF持久化
appendonly yes
#AOF文件名
appendfilename "appendonly_7000.aof"
#当目前aof文件大小超过上一次重写的aof文件大小的百分之多少进行重写
auto-aof-rewrite-percentage 100
#设置允许重写的最小aof文件大小,避免了达到约定百分比但尺寸仍然很小的情况还要重写
auto-aof-rewrite-min-size 64mb
#RDB文件名
dbfilename dump_7000.rdb

其中 port 、 pidfile、cluster-config-file、appendfilename、 dbfilename配置需要随着节点的不同而调整

配置项说明可以参考redis-5.0.5/redis.conf,每一项都介绍得很详细,推荐阅读

  • 步骤4 启动节点
    /data/project/redis-cluster/redis-5.0.5/src/redis-server /data/project/redis-cluster/nodes/7000/redis.conf
    /data/project/redis-cluster/redis-5.0.5/src/redis-server /data/project/redis-cluster/nodes/7001/redis.conf
    /data/project/redis-cluster/redis-5.0.5/src/redis-server /data/project/redis-cluster/nodes/7002/redis.conf
    /data/project/redis-cluster/redis-5.0.5/src/redis-server /data/project/redis-cluster/nodes/7003/redis.conf
    /data/project/redis-cluster/redis-5.0.5/src/redis-server /data/project/redis-cluster/nodes/7004/redis.conf
    /data/project/redis-cluster/redis-5.0.5/src/redis-server /data/project/redis-cluster/nodes/7005/redis.conf
    ps -ef|grep redis,可以看到6个redis进程已启动:

  • 步骤5 启动集群
    使用如下命令启动集群,IP地址自行替换:
    /data/project/redis-cluster/redis-5.0.5/src/redis-cli --cluster create 192.168.56.102:7000 192.168.56.102:7001 192.168.56.102:7002 192.168.56.102:7003 192.168.56.102:7004 192.168.56.102:7005 --cluster-replicas 1

启动成功信息如下:


到此,Redis Cluster 集群搭建完成

集群信息查看

Redis5的redis-cli新增系列集群运维功能,查看命令详情:

/data/project/redis-cluster/redis-5.0.5/src/redis-cli --cluster help


命令参数具体作用可以参考官方文档,下面会基于其中一些常用命令对集群进行管理

  • 检查节点状态

    /data/project/redis-cluster/redis-5.0.5/src/redis-cli --cluster check 192.168.56.102:7000

  • 查看集群信息

    /data/project/redis-cluster/redis-5.0.5/src/redis-cli --cluster info 192.168.56.102:7000

集群扩容

集群现在有3主3从,下面新增4个节点扩容变成5主5从

  • 步骤1 启动新节点
    创建4个Redis配置文件,端口号为7006~7009,然后启动节点(参考“集群搭建”的步骤3和步骤4)
  • 步骤2 新节点加入集群
    设置4个节点分别加入已有redis集群,2个为主节点,2个为从节点
/data/project/redis-cluster/redis-5.0.5/src/redis-cli --cluster add-node 192.168.56.102:7006 192.168.56.102:7005 
/data/project/redis-cluster/redis-5.0.5/src/redis-cli --cluster add-node 192.168.56.102:7007 192.168.56.102:7005 
#24e2c是节点7006的id,代表该节点加入集群并为7006的从节点
/data/project/redis-cluster/redis-5.0.5/src/redis-cli --cluster add-node 192.168.56.102:7008 192.168.56.102:7005 --cluster-slave --cluster-master-id 24e2c369678952b07d95c0a4b49c2d7a7b2e2bf7 
#24e2c是节点7007的id,代表该节点加入集群并为7007的从节点
/data/project/redis-cluster/redis-5.0.5/src/redis-cli --cluster add-node 192.168.56.102:7009  192.168.56.102:7005 --cluster-slave --cluster-master-id ab0f74a19819a74238df7a510494e9418678cbe1

此时集群状态如下,其中主节点7006和主节点7007还没分配任何slot,在下面的步骤会进行分配:

  • 步骤3 模拟slot重新平衡分配
    基于rebalance命令,增加–cluster-simulat参数,查看会迁移哪些slots,而不会真正执行迁移操作
    /data/project/redis-cluster/redis-5.0.5/src/redis-cli --cluster rebalance 192.168.56.102:7000 --cluster-threshold 1 --cluster-use-empty-masters  --cluster-simulat
    返回以下迁移信息:
  • 步骤4 执行slot重新平衡分配
    执行rebalance命令,平衡集群节点slot数量,重新分配slot( 去掉–cluster-simulat)
    /data/project/redis-cluster/redis-5.0.5/src/redis-cli --cluster rebalance 192.168.56.102:7000 --cluster-threshold 1 --cluster-use-empty-masters

    至此,集群扩容完成,集群缩容的话,需要基于reshard将需被下线的结点中的slot移到其他结点,然后基于del-node命令删除结点

总结

至此,Redis Cluster集群介绍到这里,其实还有集群通信协议,内存,数据备份,主从复制等特性值得学习,是设计分布式系统的典范,有机会再展开介绍

参考

微博6年redis实践
https://mp.weixin.qq.com/s/dBWIHwfmrs6Tt7INw-zSyA

Redis 官网介绍cluster设计说明
https://redis.io/topics/cluster-tutorial
https://redis.io/topics/cluster-spec

redis cluster管理工具redis-trib-rb详解
http://weizijun.cn/2016/01/08/redis%20cluster管理工具redis-trib-rb详解/


 上一篇
理解分布式流量防卫兵Sentinel 理解分布式流量防卫兵Sentinel
Sentinel 承接了阿里巴巴近 10 年的双十一大促流量的核心场景 本文介绍阿里开源限流熔断方案Sentinel功能、原理、架构、快速入门以及相关框架比较 基本介绍1 名词解释 服务限流 :当系统资源不够,不足以应对大量请求,对系统按照
2019-10-27
下一篇 
理解Java并发底层之AQS实现 理解Java并发底层之AQS实现
jdk的JUC包(java.util.concurrent)提供大量Java并发工具提供使用,基本由Doug Lea编写,很多地方值得学习和借鉴,是进阶升级必经之路 本文从JUC包中常用的对象锁、并发工具的使用和功能特性入手,带着问题,由浅
2019-10-13
  目录