操作场景
一键滚动重启单个集群服务。
操作步骤
-
登录翼MR管理控制台。
-
单击“我的集群”,单击指定的集群名称,进入集群信息页面。
-
单击“翼MR Manager”tab,单击“前往翼MR Manager”。
-
进入到翼MR Manager以后,单击菜单“集群服务”,进入集群服务列表页面。
-
选择指定集群服务,单击集群服务名称进入集群服务详情页面。
-
单击“运维操作>滚动重启集群服务”,弹出确认操作弹框。
-
单击“确定”,进入到滚动重启集群服务页面,展示当前集群服务支持滚动重启的实例列表。如图所示:
-
选择指定实例分组,单击“滚动重启设置”,对默认滚动重启设置进行修改,修改完成后单击“确定”,如图所示:
-
单击“下一步”,按照实例分组顺序进行滚动重启,等待所有实例完成重启后即可。如图所示:
滚动重启参数说明
滚动重启参数说明如下表所示:
参数名称 | 描述 |
---|---|
单批实例数 | 1. 按照角色实例维度,每1个批次的并发实例数,例如HDFS-DataNode。 2. 默认为1,输入限制为int的最大值,仅支持输入正整数。 3. 当角色实例数小于并发数时,以当前已有实例数为准例如:并发数设置为2,HDFS-DataNode的实例数为3;则第一批次执行的实例数是2,第2批次执行的实例数则为1。 |
批次间隔时间 | 1.上个批次成功后与下个批次开始的间隔时间。 2. 默认30秒,取值范围1-1800,仅支持输入正整数;单位默认为:秒,不可改。举例:设置时间为600S批次间隔则表示,前1个批次运行完成后,等待600S后开始下一个批次。 |
批次等待时间 | 1. 上个批次开始后,开始下个批次的等待时间。 2. 默认30秒,取值范围1-1800,仅支持输入正整数;单位默认为:秒,不可改。举例:设置时间为600S批次等待则表示,前1个排次开始运行,等待600S后不管前一个批次是否完成运行,都开始下一个批次的运行。 |
实例容错阈值 | 1. 实例执行失败的容错次数。 2. 默认为0,输入限制为int的最大值,仅支持输入正整数例如:设置为0时,即表示任意一个角色实例的操作失败后,滚动操作终止设置为2时,即表示任意3个角色实例的操作失败后,滚动操作才会终止。 |