告警解释
HA每9秒周期性检测Manager的floatip资源。当HA连续3次检测到floatip资源异常时,产生该告警。
当HA检测到floatip资源正常后,告警恢复。
floatip资源为单主资源,一般资源异常会导致主备倒换,看到告警时,基本已经主备倒换,并在新主环境上启动新的floatip资源,告警恢复。该告警用于提示用户,Manager主备倒换的原因。
告警属性
告警ID | 告警级别 | 是否自动清除 |
---|---|---|
12072 | 重要 | 是 |
告警参数
参数名称 | 参数含义 |
---|---|
来源 | 产生告警的集群或系统名称。 |
服务名 | 产生告警的服务名称。 |
角色名 | 产生告警的角色名称。 |
主机名 | 产生告警的主机名。 |
对系统的影响
- Manager主备倒换。
- floatip进程持续重启,可能引起无法访问服务原生UI界面。
可能原因
浮动IP地址异常。
处理步骤
检查主管理节点的浮动IP地址状态
1.打开FusionInsight Manager页面,在告警列表中,单击此告警所在行的,查看该告警的主机地址及资源名称。
2.以root用户登录主管理节点。
3.执行以下命令进入“${BIGDATA_HOME}/om-server/om/sbin/”目录。
su -omm
cd ${BIGDATA_HOME}/om-server/om/sbin/
4.执行“ sh status-oms.sh ”命令,执行status-oms.sh脚本检查主Manager的浮动IP是否正常,查看回显中,主管理节点的“ResName”为“floatip”的一行,是否显示以下信息:
例如:
10-10-10-160 floatip NormalNormal Single_active
- 是,执行步骤8。
- 否,执行步骤5。
5.执行ifconfig命令检查浮动IP地址的网卡是否存在。
- 是,执行步骤8。
- 否,执行步骤6。
6.执行命令ifconfig 网卡名称 浮动IP地址 netmask 子网掩码重新配置浮动IP网卡(例如, ifconfig eth0 10.10.10.102 netmask 255.255.255.0 )。
7.等待5分钟,查看告警列表中,该告警是否已清除。
- 是,处理完毕。
- 否,执行步骤8。
收集故障信息
8.在FusionInsight Manager界面,选择“运维 > 日志 > 下载”。
9.在“服务”中勾选“Controller”和“OmmServer”,单击“确定”。
10.单击右上角的设置日志收集的“开始时间”和“结束时间”分别为告警产生时间的前后1小时,单击“下载”。
11.请联系运维人员,并发送已收集的故障日志信息。
告警清除
此告警修复后,系统会自动清除此告警,无需手工清除。
参考信息
无。