3、zookeeper的选举----经验证符合事实，网上很多都是错误的-天翼云

3、zookeeper的选举----经验证符合事实，网上很多都是错误的

2023-07-04 07:08:30 阅读次数：425

Leader 选举是保证分布式数据一致性的关键所在。
Leader 选举分为 Zookeeper 集群初始化启动时选举和 Zookeeper 集群运行期间 Leader 重新选举两种情况。
在讲解 Leader 选举前先了解一下 Zookeeper 节点 4 种可能状态和事务ID概念。
本文是在zookeeper的部署与验证的基础上进行的，有些机器名称使用的是该篇文章的名称。

一、概念

1、Zookeeper节点状态

LOOKING：寻找 Leader 状态，处于该状态需要进入选举流程
LEADING：领导者状态，处于该状态的节点说明是角色已经是 Leader
FOLLOWING：跟随者状态，表示 Leader 已经选举出来，当前节点角色是 follower
OBSERVER：观察者状态，表明当前节点角色是 observer

2、事务ID

ZooKeeper 状态的每次变化都接收一个 ZXID（ZooKeeper 事务 id）形式的标记。ZXID 是一个 64 位的数字，由 Leader 统一分配，全局唯一，不断递增。ZXID 展示了所有的ZooKeeper 的变更顺序。每次变更会有一个唯一的 ZXID，如果 ZXID1 小于 ZXID2 说明 ZXID1 在 ZXID2 之前发生。

二、集群初始化选举

前提：server1、server2、server3三台服务器是顺序启动zookeeper的，即先启动server1，再启动server2，最后启动server3。

若进行 Leader 选举，则至少需要两台机器，这里选取 3 台机器（server1、server2、server3）组成的服务器集群为例。初始化启动期间 Leader 选举流程如下图所示。

3、zookeeper的选举----经验证符合事实，网上很多都是错误的

在集群初始化阶段，当有一台服务器 server1 启动时，其单独无法进行和完成 Leader 选举，当第二台服务器 server2 启动时，此时两台机器可以相互通信，每台机器都试图找到 Leader，于是进入 Leader 选举过程。选举过程开始，过程如下：

1、每个Server发出一个投票

由于是初始情况，server1 和server 都会将自己作为 Leader 服务器来进行投票，每次投票会包含所推举的服务器的 myid 和 ZXID，使用(myid, ZXID)来表示，此时 server1 的投票为(1, 0)，server2 的投票为(2, 0)，然后各自将这个投票发给集群中其他机器。

2、接受来自各个服务器的投票

集群的每个服务器收到投票后，首先判断该投票的有效性，如检查是否是本轮投票、是否来自 LOOKING 状态的服务器。

3、处理投票

针对每一个投票，服务器都需要将别人的投票和自己的投票进行比较，规则如下：

优先检查 ZXID。ZXID 比较大的服务器优先作为 Leader。
如果 ZXID 相同，那么就比较 myid。myid 较大的服务器作为Leader服务器。
对于 server1 而言，它的投票是(1, 0)，接收 server2 的投票为(2, 0)，首先会比较两者的 ZXID，均为 0，再比较 myid，此时 server2 的 myid 最大，于是 server2 胜。server1 更新自己的投票为(2, 0)，并将投票重新发送给 server2。

4、统计投票

每次投票后，服务器都会统计投票信息，判断是否已经有过半机器接受到相同的投票信息，对于 server1、server2 而言，都统计出集群中已经有两台机器接受了(2, 0)的投票信息，此时便认为已经选出 server2 作为Leader。

[alanchan@server2 bin]$ ./zkServer.sh status
ZooKeeper JMX enabled by default
Using config: /usr/local/bigdata/apache-zookeeper-3.7.1/bin/../conf/zoo.cfg
Client port found: 2118. Client address: localhost. Client SSL: false.
Mode: leader

[alanchan@server1 bin]$ ./zkServer.sh status
ZooKeeper JMX enabled by default
Using config: /usr/local/bigdata/apache-zookeeper-3.7.1/bin/../conf/zoo.cfg
Client port found: 2118. Client address: localhost. Client SSL: false.
Mode: follower

[alanchan@server3 bin]$ ./zkServer.sh status
ZooKeeper JMX enabled by default
Using config: /usr/local/bigdata/apache-zookeeper-3.7.1/bin/../conf/zoo.cfg
Client port found: 2118. Client address: localhost. Client SSL: false.
Mode: follower

5、改变服务器状态

一旦确定了 Leader，每个服务器就会更新自己的状态，如果是Follower，那么就变更为 FOLLOWING，如果是 Leader，就变更为 LEADING。当新的 Zookeeper 节点 server3 启动时，发现已经有 Leader 了，不再选举，直接将直接的状态从 LOOKING 改为 FOLLOWING。

三、集群重新选举

在 Zookeeper 运行期间，如果 Leader 节点挂了，那么整个 Zookeeper 集群将暂停对外服务，进入新一轮Leader选举。假设正在运行的有 server1、server2、server3 三台服务器，当前 Leader 是 server2，若某一时刻 Leader 挂了，此时便开始 Leader 选举。选举过程如下图所示。

3、zookeeper的选举----经验证符合事实，网上很多都是错误的

1、变更状态

Leader 挂后，余下的非 Observer 服务器都会讲自己的服务器状态变更为 LOOKING，然后开始进入 Leader 选举过程。

2、每个Server会发出一个投票

在运行期间，每个服务器上的 ZXID 可能不同，此时假定 server1 的 ZXID 为 124， server3 的 ZXID 为 123；在第一轮投票中， server1 和 server3 都会投自己，产生投票(1, 124)，(3, 123)，然后各自将投票发送给集群中所有机器。

3、接收来自各个服务器的投票

与启动时过程相同。

4、处理投票

与启动时过程相同，由于 server1 事务 ID 大， server1 将会成为 Leader。（如果zxid一样， server3将是leader。）

5、统计投票

与启动时过程相同。

6、改变服务器的状态

与启动时过程相同。

以上就是zookeeper的选举过程，该过程可以通过实际的操作进行验证。

活动

智算服务

应用商城

合作伙伴

开发者

支持与服务

了解天翼云

3、zookeeper的选举----经验证符合事实，网上很多都是错误的

3、zookeeper的选举----经验证符合事实，网上很多都是错误的

一、概念

1、Zookeeper节点状态

2、事务ID

二、集群初始化选举

1、每个Server发出一个投票

2、 接受来自各个服务器的投票

3、处理投票

4、统计投票

5、改变服务器状态

三、集群重新选举

1、变更状态

2、每个Server会发出一个投票

3、接收来自各个服务器的投票

4、处理投票

5、统计投票

6、改变服务器的状态

相关文章

hadoop-hdfs简介及常用命令详解（超详细）

【Hadoop】YARN多资源队列配置及使用实践

启动hadoop集群时报错ERROR: Attempting to operate on hdfs namenode as root

【配置/认证】Authentication for Hadoop（3.3.1） HTTP web-consoles : Hadoop的simple认证 不是银弹

【基础-配置文件】：hadoop配置文件作用概述ing

Podman安装部署kafka和管理界面（快速跑起来）

【dubbo】分布式和dubbo

java链接hbase数据库实例代码，包括增删改查及批量操作、范围查询等

kafka集群重启方法

zookeeper配置systemctl

作者介绍

最新文章

大数据ClickHouse进阶（十三）：ClickHouse的GROUP BY 子句

hive常用命令记录

【HBase】HBase深度解析：特性、实战应用及核心流程全景

【HBase】HBase高性能架构：如何保证大规模数据的高可用性

crontab任务以user用户执行hive -f命令不生效解决记录

Hbase安装及错误解决

热门文章

Hbase shell 常用命令

Hbase导入、导出数据到本地文件

解决Hbase报错java.lang.IllegalStateException: The procedure WAL relies on the ability to hsync for....

解决关闭hbase时stop-hbase.sh报错stopping hbasecat: /tmp/hbase-xxxx-master.pid: No such file or directory

HBase 快速入门(安装和命令操作)

hive的关系运算、逻辑预算、数学运算、数值运算、日期函数、条件函数和字符串函数的语法与使用示例详解

热门标签

相关产品

弹性云主机

天翼云电脑（公众版）

对象存储

云硬盘

随机文章

大数据ClickHouse进阶（十三）：ClickHouse的GROUP BY 子句

HBase truncate的问题导致数据写入慢

【HBase】HBase深度解析：特性、实战应用及核心流程全景

hive的关系运算、逻辑预算、数学运算、数值运算、日期函数、条件函数和字符串函数的语法与使用示例详解

【HBase】HBase高性能架构：如何保证大规模数据的高可用性

解决Hbase报错java.lang.IllegalStateException: The procedure WAL relies on the ability to hsync for....

2、接受来自各个服务器的投票

【配置/认证】Authentication for Hadoop（3.3.1） HTTP web-consoles : Hadoop的simple认证不是银弹