运行良好的RegionServer数
指标项名称: 运行良好的RegionServer数
指标项含义 :检查HBase集群中运行良好的RegionServer数。
恢复指导: 如果该指标项异常,请检查RegionServer的状态是否正常并处理,然后建议检查网络是否正常。
服务健康状态
指标项名称: 服务状态
指标项含义 :检查HBase服务状态是否正常。如果状态不正常,则认为不健康。
恢复指导: 如果该指标项异常,请检查HMaster和RegionServer的状态是否正常并先处理,然后检查ZooKeeper服务的状态是否为故障并处理。使用客户端,确认是否可以正确读取HBase表中的数据,排查读数据失败的原因。最后参见告警进行处理。
检查告警
指标项名称: 告警信息
指标项含义 :检查服务是否存在未清除的告警。如果存在,则认为不健康。
恢复指导: 如果该指标项异常,建议参见告警进行处理。