告警解释
系统每30秒周期性检测执行的HQL的Map数是否超过阈值,超过阈值发出告警。系统默认的平滑次数为3次,默认阈值为5000。
告警属性
告警ID | 告警级别 | 是否自动清除 |
---|---|---|
16009 | 重要 | 是 |
告警参数
参数名称 | 参数含义 |
---|---|
来源 | 产生告警的集群名称。 |
服务名 | 产生告警的服务名称。 |
角色名 | 产生告警的角色名称。 |
主机名 | 产生告警的主机名。 |
Trigger condition | 系统当前指标取值满足自定义的告警设置条件。 |
对系统的影响
Hive执行的HQL的Map数过高,一方面会导致HQL执行较慢,另一方面会大量占用资源。
可能原因
执行的HQL语句存在可以优化的可能。
处理步骤
检查HQL的Map个数
1.在FusionInsight Manager首页,选择“集群 > 待操作集群的名称 > 服务 > Hive > 资源”,查看“HQL的Map数”图表,找出Map数过大的HQL语句(Map数>=5000)。
2.找到对应的HQL语句,优化在监控上显示map数过大的HQL语句,再尝试执行。
3.查看本告警是否恢复。
- 是,操作结束。
- 否,执行步骤4。
收集故障信息
4.在FusionInsight Manager首页,选择“运维 > 日志 > 下载”。
5.在“服务”中勾选待操作集群的“Hive”。
6.单击右上角的设置日志收集的“开始时间”和“结束时间”,分别为告警产生时间的前后10分钟,单击“下载”。
7.请联系运维人员,并发送已收集的故障日志信息。
告警清除
此告警修复后,系统会自动清除此告警,无需手工清除。
参考信息
无。