概述
AOM提供告警降噪功能,您可以在发送告警通知前按告警降噪规则对告警进行处理,处理完成后再发送通知,避免产生告警风暴。该功能目前仅支持广州4资源池。
告警降噪功能分为分组、去重、抑制、静默四部分。
去重为内置策略,服务后台会自动检验告警内容是否一致实现去重的效果,用户无需手动创建规则。
告警降噪流程图
分组、抑制、静默需手动创建规则,创建方式见下方文档说明。
说明此模块只作用于消息通知部分,所有触发的告警和事件都可在告警、事件页面查看。
创建分组规则
使用分组规则,您可以从告警中筛选出满足条件的告警子集,然后按分组条件对告警子集分组,告警触发时同组告警会被汇聚在一起发送一条通知。
当分组条件设为“告警级别等于紧急”时,表示系统会先根据分组条件从告警中过滤出满足告警级别为紧急的告警子集,然后根据通知合并方式对告警子集合并,合并后的告警可以关联行动规则,触发告警通知。
分组流程
创建分组规则
用户最多可创建100条分组规则。
步骤 1 在左侧导航栏中选择“告警 > 告警降噪”。
步骤 2 在“分组规则”页签下单击 “创建分组规则”,设置规则名称、分组条件等信息。
创建分组规则
分组规则参数说明
类别 参数名称 说明 - 规则名称 分组规则的名称。名称只能由大小写字母、数字、下划线组成,且不能以下划线开头和结尾,最多不能超过100个字符。 描述 分组规则的描述。最多不能超过1024个字符。 告警分组规则 分组条件 根据设置的条件对告警过滤,筛选出符合分组条件的告警,并为符合分组条件的告警设置告警行动规则。
分组条件最多可设置10个并行条件,每个并行条件下最多可设置10个串行条件,每个并行条件下可设置一个或多个告警行动规则。
多个串行条件之间是“和”的关系,多个并行条件之间是“或”的关系,告警需满足其中一个并行条件下的所有的串行条件。
例如一个并行条件下设置了三个串行条件,依次为“告警级别等于紧急”、“告警级别等于重要”、“告警源等于AOM”,则告警级别为紧急和重要的AOM告警会被筛选出来,并根据设置的告警行动规则执行告警通知操作。告警合并规则 通知合并方式 根据指定字段对分组后的告警合并,合并在一组的告警会被汇聚在一起发送一条通知。
合并方式包括:
按告警源
按告警源 + 严重度
按告警源 + 所有标签首次等待 首次创建告警合并集合后,等待多久发送第一次告警通知。通常设置为秒级别的时间,便于告警合并后再发送,避免告警风暴。
取值范围:0s-10min,推荐设置为 15s。变化等待 合并集合内的告警数据发生变化后,等待多久发送告警通知。通常设置为分钟级别的时间。如果您需要尽快收到告警通知,也可设置为秒级时间。
此处的变化是指新增告警或告警状态改变。
取值范围:5s-30min,推荐设置为60s。重复等待 合并集合内的告警数据重复后,等待多久发送告警通知。通常设置为小时级别的时间。
此处的重复是指无新增告警和状态变化,仅其他属性(例如标题、内容等)改变。
取值范围:0min-15day,推荐设置为1h。
步骤 3 设置完成后,单击“立即创建”,完成分组规则创建。
更多分组规则操作
分组规则创建完成后,还可以执行相关操作。
相关操作
操作 | 说明 |
---|---|
编辑分组规则 | 单击“操作”列的“编辑”。 |
删除分组规则 | 删除单条规则:单击对应规则“操作”列的“删除”。 删除单条或多条规则:勾选对应规则前的复选框,单击“批量删除”。 |
搜索分组规则 | 在右上角的搜索框中输入规则名称关键字,单击后显示匹配对象。 |
创建抑制规则
使用抑制规则,您可以抑制或阻止与某些特定告警相关的其他告警通知。例如:当严重级别的告警产生时,可以抑制与其相关的低级别的告警。或当节点故障发生时,抑制节点上的进程或者容器的所有其他告警。
注意事项
若在发送告警通知之前抑制条件对应的源告警已恢复正常,则抑制规则失效,抑制对象(被源告警抑制的告警)将正常发送告警通知。
用户最多可创建100条抑制规则。
创建抑制规则
步骤 1 在左侧导航栏中选择“告警 > 告警降噪”。
步骤 2 在“抑制规则”页签下单击 “创建抑制规则”,设置规则名称、根源告警等信息。
创建抑制规则
设置抑制规则
类别 参数名称 说明 - 规则名称 抑制规则的名称。名称只能由大小写字母、数字、下划线组成,且不能以下划线开头和结尾,最多不能超过100个字符。 描述 抑制规则的描述。最多不能超过1024个字符。 抑制规则 根源告警 根源告警表示产生抑制的某类特定告警。
根源告警最多可设置10个并行条件,每个并行条件下最多可设置10个串行条件。多个串行条件之间是“和”的关系,多个并行条件之间是“或”的关系,告警需满足其中一个并行条件下的所有的串行条件。
若串行条件设置为“告警级别等于紧急”,则符合告警级别为紧急的告警会被筛选出来,作为根源告警。抑制告警 抑制告警表示被根源告警抑制的某类特定告警。
参数设置方式与根源告警相同。
当根源告警的串行条件设为“告警级别等于紧急”,抑制告警的串行条件设为“告警级别等于提示”时,表示当产生紧急级别的告警时,会抑制提示级别的告警。
步骤 3 设置完成后,单击“立即创建”。
抑制规则创建后,默认对所有分组后的告警生效。
更多抑制规则操作
抑制规则创建完成后,您还可以执行相关操作。
相关操作
操作 | 说明 |
---|---|
编辑抑制规则 | 单击“操作”列的“编辑”。 |
删除抑制规则 | 删除单条规则:单击对应规则“操作”列的“删除”。 删除单条或多条规则:勾选对应规则前的复选框,“批量删除”。 |
搜索抑制规则 | 在右上角的搜索框中输入规则名称关键字,单击后显示匹配对象。 |
创建静默规则
通过静默规则,您可以在指定时间段屏蔽告警通知,静默规则一旦创建完成,即刻生效。
创建静默规则
用户最多可创建100条静默规则。
步骤 1 在左侧导航栏中选择“告警 > 告警降噪”。
步骤 2 在“静默规则”页签下单击“创建静默规则”,设置规则名称、静默条件等信息。
创建静默规则
设置静默规则
类别 参数名称 说明 - 规则名称 静默规则的名称。名称只能由大小写字母、数字、下划线组成,且不能以下划线开头和结尾,最多不能超过100个字符。 描述 静默规则的描述。最多不能超过1024个字符。 静默规则 静默条件 待静默的告警通知需符合的条件,即满足该条件的告警通知均会被屏蔽。
静默条件最多可设置10个并行条件,每个并行条件下最多可设置10个串行条件。多个串行条件之间是“和”的关系,多个并行条件之间是“或”的关系,告警需满足其中一个并行条件下的所有的串行条件。
若串行条件设置为“告警级别等于紧急”,则符合告警级别为紧急的告警通知会被屏蔽。静默时间 告警通知被屏蔽的时间,包含以下两种:
固定时间:仅在指定的时间段执行屏蔽告警通知的操作。
周期时间:根据设置的时间周期循环执行屏蔽告警通知的操作。时区/语言 告警通知被屏蔽的时区/语言,默认为用户首选项配置的时区/语言,可根据需要修改。
步骤 3 设置完成后,单击“确定”。
更多静默规则操作
静默规则创建完成后,您还可以执行相关操作。
相关操作
操作 | 说明 |
---|---|
修改静默规则 | 单击“操作”列的“编辑”。 |
删除静默规则 | 删除单条规则:单击对应规则“操作”列的“删除”。 删除单条或多条规则:勾选对应规则前的复选框,单击“批量删除”。 |
搜索静默规则 | 在右上角的搜索框中输入规则名称关键字,单击后显示匹配对象。 |