**概念** 什么叫做主从复制?Redis主从复制实际上就是将主Redis服务器的数据,复制到其他从Redis服务器去进行存储,默认情况下每台Redis服务器都是主节点,一个主节点可以拥有多个从节点,但是每个从节点只能设置一个主节点。数据复制是单向复制,只能从主节点复制到从节点中存储。在主节点中不需要进行特殊的配置,而只需要在从节点添加slaveof指令: * slaveof 在从节点的配置文件中通过slaveof指令可以设置该从节点拥有的主节点。 **开启主从复制方式** 在从节点中配置slaveof指令一共有三种方式: * 在redis.conf配置文件中配置:在配置文件中加入:slaveof 。 * 从节点启动命令添加slaveof参数:在reids启动命令后加上 --slaveof 。 * 从节点Redis启动成功执行slaveof命令:slaveof 。 **主从复制的作用** * 数据冗余:可以实现数据热备份,在Redis持久化的基础上进一步对数据备份进行优化。 * 故障恢复:当主节点硬盘持久化出现问题,可以快速从从节点提供服务,实现数据恢复。 * 读写分离:可以主节点负责所有写操作,从节点负责所有读操作,实现Redis读写分离提高服务器负载能力。 * 负载均衡:主从复制配合实现读写分离,可以减轻服务器负载,实现负载均衡。 * 高可用:主从复制是实现集群的基础,所以高并发下主从配置是必不可少的配置之一。 **主从复制三大阶段** 主从复制主要分为3个大阶段:准备阶段、数据同步阶段、命令传输阶段。 **准备阶段** **保存主节点信息** 从节点服务器中存在两个字段:masterhost和masterport。masterhost字段用于存储主节点的ip信息,masterport用于存储主节点的端口号信息,实际上就是我们通过slaveof指令设置的信息。 **主节点与从节点建立socket连接** 成功执行slaveof指令,从节点会每秒1次定时调用replicationCron()函数,寻找是否可以连接主节点,当发现存在新的主节点时,便通过上一步维护的ip与port尝试与该主节点建立socket连接。当主节点与从节点成功建立socket连接,从节点会建立一个ssocket套接字,专门负责接受主节点发送的复制数据命令。而主节点同时也会为该从节点创建相应的客户端状态。 **发送ping命令** 通过上一步,从节点就成功的成为主节点的一个客户端。可以通过发送ping请求进行第一次请求,第一次请求的目的不是为了复制数据,而是为了检查刚才创建的socket连接是否可用以及主节点是否可以能够正常处理请求。从节点向主节点发送ping命令一般会有三种响应结果: * 返回pong:表示socket连接可用,可以继续操作。 * 超时未返回:表示socket不可用,则从节点断开socket连接。 * 返回其他结果:代表主节点目前处于忙碌状态无法处理从节点请求,则从节点断开socket连接。 **权限验证** 如果主节点配置了requirepass参数,则表示需要权限验证,从节点必须配置masterauth参数,masterauth参数配置成与主节点requirepass参数一致,才可以通过验证。否则权限验证失败,从节点断开socket连接。 **数据同步阶段** 准备工作结束后,便可以进行数据同步。首次数据复制,主节点会将所有数据发送给子节点,也就是全量复制,所以这部分是耗时操作。非首次数据同步,则会根据主节点和从节点当前状态的不同,选择全量复制或者不分肤质。在本阶段,主节点需要主动向从节点发送请求完成复制。 **数据全量复制** 主节点收到全量复制的请求后,fork出一个后台进程,将数据库快照生成RDB文件,并且将生成过程中接受到的写请求暂时缓存,否则会影响数据一致性。然后在RDB文件生成之后将RDB文件发送给从节点,从节点先清除旧数据,然后接收RDB文件更新数据,最后主节点将缓存的写命令全部发送给从节点,从节点执行写命令,最终保持和主节点的数据一致性。 **部分复制** 因为进行全量复制要fork子进程并且进行RDB持久化会极度消耗CPU,而且发送RDB文件给从节点也会对网络带宽造成影响,所以全量复制实际效率并不高,所以可以使用部分复制对数据进行主从复制。进行部分复制时,主节点和从节点会分别维护一个offset变量来存储主节点传递给从节点的字节数,通过offset可以判断主从节点数据是否一致,若不一致可以从从节点所在的offset字节数然后在主节点的offset轻松找到缺少的数据进行部分复制。但是进行部分复制最关键的一点就是必须为非首次复制,主从节点首次复制必须为全量复制过程。 **命令传输阶段** 当主节点将当前数据同步给从节点后,复制的建立流程就完成了。只要从节点不关闭主从复制,则主节点会不断的把写命令发送给从节点,保证主从数据的一致性。命令传输阶段是异步操作,所以可能存在一定程度的延迟,无法保证数据的实时一致性。