告警解释
系统按30秒周期性检测LdapServer的服务状态,当检测到两个LdapServer服务均异常时产生该告警。
当检测到一个或两个LdapServer服务恢复时告警恢复。
告警属性
告警ID | 告警级别 | 是否自动清除 |
---|---|---|
25000 | 紧急 | 是 |
告警参数
参数名称 | 参数含义 |
---|---|
来源 | 产生告警的集群名称。 |
服务名 | 产生告警的服务名称。 |
角色名 | 产生告警的角色名称。 |
主机名 | 产生告警的主机名。 |
对系统的影响
告警发生时,不能对集群中的KrbServer和LdapServer用户进行任何操作。例如,无法在FusionInsight Manager页面添加、删除或修改任何用户、用户组或角色,也无法修改用户密码。集群中原有的用户验证不受影响。
可能原因
- LdapServer服务所在节点故障。
- LdapServer进程故障。
处理步骤
检查LdapServer服务的两个SlapdServer实例所在节点是否故障
1.在FusionInsight Manager首页,选择“集群 > 待操作集群的名称 > 服务 > LdapServer > 实例”。进入LdapServer实例页面获取两个SlapdServer实例所在节点的主机名。
2.选择“运维 > 告警 > 告警”,在告警列表中查看是否有“节点故障”告警产生。
- 是,执行步骤3。
- 否,执行步骤6。
3.查看告警信息里的主机名是否和步骤1主机名一致。
- 是,执行步骤4。
- 否,执行步骤6。
4.按“ALM-12006 节点故障”提供的步骤处理该告警。
5.在告警列表中查看“LdapServer服务不可用”告警是否清除。
- 是,处理完毕。
- 否,执行步骤10。
检查LdapServer进程是否正常
6.选择“运维 > 告警 > 告警”,在告警列表中查看是否有“进程故障”告警产生。
- 是,执行步骤7。
- 否,执行步骤10。
7.查看告警信息中的服务名和主机名是否和LdapServer服务名和主机名一致。
- 是,执行步骤8。
- 否,执行步骤10。
8.按“ALM-12007 进程故障”提供的步骤处理该告警。
9.在告警列表中查看“LdapServer服务不可用”告警是否清除。
- 是,处理完毕。
- 否,执行步骤10。
收集故障信息
10.在FusionInsight Manager界面,选择“运维 > 日志 > 下载”。
11.在“服务”中勾选待操作集群的“LdapServer”。
12.单击右上角的设置日志收集的“开始时间”和“结束时间”分别为告警产生时间的前后10分钟,单击“下载”。
13.请联系运维人员,并发送已收集的故障日志信息。
告警清除
此告警修复后,系统会自动清除此告警,无需手工清除。
参考信息
无。