操作场景
通过设置告警规则,用户可自定义监控目标与通知策略,及时了解实例的运行状况,从而起到预警作用。
设置告警规则包括设置告警规则名称、监控对象、监控指标、告警阈值、监控周期和是否发送通知等参数。本节介绍了设置告警规则的具体方法。
操作步骤
- 登录管理控制台。
- 在“服务列表”中,选择“管理与部署 > 云监控服务”。
- 在左侧导航树,选择“告警 > 告警规则”。
- 在“告警规则”页面,单击“创建告警规则”。
图1 创建告警规则
- 根据界面提示配置告警参数。
配置告警基本信息。
图2 告警规则基本信息
表1 规则基本信息
参数名称 | 描述 | 示例 |
---|---|---|
名称 | 系统会随机产生一个名称,您也可以进行修改。 | alarm-cag2 |
描述 | 告警规则描述(此参数非必填项)。 | - |
选择监控对象,配置告警范围。
表2 参数说明
参数名称 说明 示例 告警类型 告警规则适用的告警类型,可选择指标或者事件告警。 指标 资源类型 配置告警规则监控的服务名称。此处请选择“云数据库 GeminiDB”。 - 维度 用于指定告警规则对应指标的维度名称。此处请选择“InfluxDB-InfluxDB节点”。 - 监控范围 告警规则适用的资源范围。 说明选择“全部资源”时,则任何实例满足告警策略时,都会发送告警通知,同时新购资源将自动绑定到告警规则。
选择“资源分组”时,该分组下任何资源满足告警策略时,都会触发告警通知。
选择“指定资源”时,单击“选择指定资源”,勾选具体的监控对象,单击“确定”将监控对象同步到“指定资源”中。全部资源 分组 当监控范围为资源分组时需配置此参数。 -
设置告警策略。
图3 设置告警策略
表3 参数说明
参数名称 说明 示例 触发规则 根据需要可选择从关联模板、导入已有模板或自定义创建。说明当监控范围为指定资源时可选择从模板导入。 自定义创建 模板 选择需要导入的模板。该项仅为从模板导入时需要配置。 - 告警策略 触发告警规则的告警策略。您可以根据实际需求调整阈值、连续周期、告警间隔、告警级别等配置。 指标名称:告警规则对应的指标名称。
推荐设置如下常用指标:存储容量使用率用于监控GeminiDB Influx实例容量使用情况。
如果存储容量使用率>80%时,建议及时进行扩容磁盘。
CPU利用率、内存利用率用于监控GeminiDB Influx实例各节点计算资源的使用情况。
如果CPU利用率或者内存利用率>80%时,建议及时添加节点或变更实例的CPU和内存规格。
更多支持的监控指标请参见GeminiDB Influx支持的监控指标。
告警级别:根据告警的严重程度不同等级,可选择紧急、重要、次要、提示。
说明告警规则内最多可添加50条告警策略,若其中一条告警策略达到条件都会触发告警。以CPU利用率为例,如下图配置的告警策略表示:CPU利用率的原始值连续3次大于等于80%时,则每10分钟向用户发送一次重要告警。
配置告警通知信息。
图4 配置告警通知信息
表4 参数说明
参数名称 | 说明 | 示例 |
---|---|---|
发送通知 | 配置是否发送邮件、短信、HTTP和HTTPS通知用户。此处推荐您开启发送通知,当监控指标触发设定的告警策略时,云监控服务会在第一时间通过消息通知服务实时告知您云上资源异常,以免因此造成业务损失。 | 开启发送通知 |
通知方式 | 根据需要可选择通知组或主题订阅两种方式。 | - |
通知组 | 需要发送告警通知的通知组。 | - |
通知对象 | 需要发送告警通知的对象,可选择云账号联系人或主题。 云账号联系人:注册账号时的手机和邮箱。 主题:消息发布或客户端订阅通知的特定事件类型,若此处没有需要的主题,需先创建主题并订阅该主题。 |
- |
生效时间 | 该告警规则仅在生效时间内发送通知消息。如生效时间为00:00-8:00,则该告警规则仅在00:00-8:00发送通知消息。 | - |
触发条件 | 可以选择“出现告警”、“恢复正常”两种状态,作为触发告警通知的条件。 | - |
高级配置。
图5 高级配置
表5 参数说明
参数名称 | 说明 | 示例 |
---|---|---|
归属企业项目 | 告警规则所属的企业项目。只有拥有该企业项目权限的用户才可以查看和管理该告警规则。 | default |
标签 | 标签由键值对组成,用于标识云资源,可对云资源进行分类和搜索。建议在TMS中创建预定义标签。 键的长度最大128字符,值的长度最大225字符。 最多可创建20个标签。 |
- |
- 配置完成后,单击“立即创建”,完成告警规则的创建。
告警规则创建完成后,当监控指标触发设定的告警策略时,云监控服务会在第一时间通过消息通知服务实时告知您云上资源异常,以免因此造成业务损失。