应用场景
在云容器引擎服务中,资源监控已经对接了云监控服务,并能够使用云监控提供的指标告警能力。
前提条件
创建通知组
- 登陆云容器引擎控制台,点击左侧导航栏中的集群,进入集群列表页。
- 在集群列表中点击需要配置告警的集群,进入集群管理页面。
- 左侧菜单栏选择 运维管理 > 指标告警 > 通知组 进入通知组配置页面。
- 通知组支持联系人、翼连、WebHook集成三种通知对象,其中联系人支持手机号(短信)和邮箱(邮件)、翼连支持发送到翼连群、WebHook支持发送到用户指定的WebHook后端。
创建通知策略
- 登陆云容器引擎控制台,点击左侧导航栏中的集群,进入集群列表页。
- 在集群列表中点击需要配置告警的集群,进入集群管理页面。
- 左侧菜单栏选择 运维管理 > 指标告警 > 告警策略 进入通知策略配置页面,点击按钮 创建通知策略 创建通知策略。
- 通知策略可以配置通知对象、通知模板、渲染API地址、通知时段,其中通知对象为用户在通知组设置的对象,邮件、短信、翼连三种告警方式支持分别独立配置模板,一般没有特殊需求使用默认模板即可。
配置指标告警
- 登陆云容器引擎控制台,点击左侧导航栏中的集群,进入集群列表页。
- 在集群列表中点击需要配置告警的集群,进入集群管理页面。
- 左侧菜单栏选择 运维管理 > 指标告警 > 告警规则 进入告警规则页面,点击按钮 创建告警规则 创建告警规则。
- 目前共提供的告警分组有Kubernetes节点、Kubernetes负载、指标采集上报和黑盒监控,其中节点、负载和指标采集上报均为基础告警,只要安装了ccse-monitor插件即可使用,黑盒监控需要应用接入黑盒监控才可使用,可参考点这里。
- 选择告警分组和告警指标后会显示告警阈值及当前集群的指标值,部分指标可以通过告警条件调整告警阈值及判断条件;告警触发条件可以选择立即触发或告警条件持续数分钟后才触发。
- 填写告警等级和通知频率后点击保存完成告警规则创建
查看告警事件历史及告警发送历史
- 登陆云容器引擎控制台,点击左侧导航栏中的集群,进入集群列表页。
- 在集群列表中点击需要配置告警的集群,进入集群管理页面。
- 左侧菜单栏选择 运维管理 > 指标告警 > 告警事件历史 或 告警发送历史 可分别查看集群告警事件历史及告警发送历史。
- 告警事件历史页面可以查看告警事件名称、事件描述、事件数量、事件状态等信息,通过右上角事件状态筛选下拉框还可以筛选指定状态的告警事件。
- 告警发送历史页面可以查看事件告警的告警状态、通知状态等,还可以根据告警的状态、等级等进行筛选