概述
通过实例的告警管理能力,您可以对实例状态进行实时监控,并在特定指标异常时,将消息以不同形式(短信、邮件、翼连)推送到相关负责人,以便及时感知问题、处理线上故障。
管理通知对象
在配置告警规则之前,您需要先添加通知对象。通知对象包括联系人、联系人组、翼连、WebHook集成四种形式。
- 联系人:一个告警规则所通知的“个人”,通知渠道包括该“个人”的手机短信和个人邮箱。
- 联系人组:多个联系人组成的逻辑团体。若告警通知到联系人组,将会通知联系人组下的每个联系人。
- 翼连:通知到翼连群。
- WebHook集成:通过调用预先指定的地址进行告警通知。
下面以最简单的联系人为例,演示如何添加通知对象。
1.进入实例引擎控制台->告警管理->通知组页签,点击新建联系人按钮。
2.在弹出的窗口中,填写联系人的对应信息,即可完成创建。
管理告警规则
告警规则决定了一次告警发生的阈值、通知的对象和渠道,以及通知的内容。完成联系人创建后,进入实例引擎控制台->告警管理->告警规则页签,可以管理您的告警规则。
下面将演示如何创建一个“ZooKeeper引擎延迟过大”告警并使其生效,触发告警。
- 创建通知策略。进入实例引擎控制台->告警管理->通知策略页签,点击创建通知策略按钮,填写相关信息,并指定通知对象为上一步骤中创建的联系人,完成通知策略创建;
- 点击创建告警规则按钮,在弹出的窗口中填写告警相关信息。其中,通知策略指定为步骤1中创建的通知策略,告警分组选择“ZooKeeper引擎”,告警指标选择“平均延迟”,根据您的需求选择合适的判断条件,告警等级。
- 完成告警规则创建后,可在告警规则列表中查询到该条目。告警规则创建完毕后默认启用,可通过右侧操作中的停止来使该规则失效。
- 告警规则生效后,可在实例引擎控制台->告警管理->告警事件历史页签中,对告警事件的当前状态进行追踪。
设置翼连告警
除通过联系人渠道(短信、邮件)进行告警外,还可以将告警信息推送到翼连群。通过翼连群进行告警,成功率高、延迟低,推荐您使用这种方式进行告警。下面将演示如何创建一个“ZooKeeper引擎延迟过大”的翼连告警。
- 进入实例引擎控制台->告警管理->通知组页签,在页面上方选择翼连类别,点击新建翼连群按钮,在弹出的窗口中填写相关信息,主要是翼连群号。
- 在翼连创建群聊后,翼连群号可在下方位置查看并复制)。
- 按照文档管理告警规则中的操作方式,创建告警规则,方法同前文“管理告警规则”。其中,在创建通知策略时,选择翼连类别,并选中刚才所创建的通知对象,完成绑定。其他步骤同管理告警规则中的规则创建方式。
- 告警规则创建完成并生效后,当告警条件触发时,告警消息将会被推送到指定的翼连群。