告警规则详情
操作场景
查看告警规则配置信息,新增、修改、删除告警规则。
操作步骤
-
登录翼MR管理控制台。
-
单击“我的集群”,单击指定的集群名称,进入集群信息页面。
-
单击“翼MR Manager”tab,单击“前往翼MR Manager”。
-
进入到翼MR Manager以后,单击菜单“监控与告警 > 告警规则”,点击需要查看或变更的告警规则文件名,跳转至告警规则文件详情,如图所示:
-
“规则信息”一节展示所有告警规则分组,点击告警规则分组名,可展开组下告警规则。继续点击告警规则名,可展开单条告警规则的具体信息,如图所示:
-
点击告警规则组名右侧新增按钮,可新增告警规则,如图所示:
-
点击告警规则名右侧编辑按钮,可编辑告警规则信息。点击告警规则名右侧删除按钮,可删除告警规则。
-
对告警规则的编辑操作,需要点击右上角“同步”按钮,将告警配置同步到Prometheus实例并加载生效,如图所示:
说明
告警规则各字段说明如下:
规则类型:分为告警、记录两种类型。告警类型用于配置异常告警,当监控指标触发告警表达式时,触发告警。记录类型用于预聚合监控指标,依照表达式聚合计算。
持续时间:仅“告警”类型具有,当表达式成立且持续超过所设时间,告警将会触发。如果希望表达式成立后立即触发告警,可设置为0。需注意,持续时间设置过小,可能导致频繁无意义报警。
表达式:填写PromQL语法的表达式。
标签:预设字段mozi_alert_level,用于定义告警级别,四个告警级别为WARNING(警告)、ERROR(错误)、SEVERITY(严重)、DISASTER(灾难)。例如,配置标签mozi_alert_level为SEVERITY,触发告警后,在“告警历史”页面,告警的级别为“严重”。
标注:预设标注字段description,用于定义告警信息,触发告警后,在“告警历史”页面,description字段对应的信息,将显示为“告警信息”。
预设的记录类型告警规则,与系统功能相关,不建议用户自行修改。
对告警规则组、告警规则的所有新增、修改、删除操作,都需要通过“同步”按钮,同步到监控组件并生效。
可以勾选一批告警规则文件导出为压缩文件,压缩文件可再次用于告警规则导入,导入操作会直接同步到监控组件并生效,不需要额外的同步操作。需要注意,导入过程,同名告警规则文件会被覆盖。
可以勾选一批告警规则文件进行删除,删除操作会直接同步到监控组件并生效,不需要额外的同步操作。