应用场景
在云容器引擎服务中,资源监控已经对接了云监控服务,并能够使用云监控提供的指标告警能力。
前提条件
已创建集群,具体操作请参见 用户指南 > 集群 > 新建集群 章节。若已有集群,无需重复操作。
集群已安装ccse-monitor插件,可参考 用户指南 > 插件 章节
创建通知组
登陆云容器引擎控制台, 点击左侧导航栏中的集群,进入集群列表页面。
在集群列表中点击需要配置告警的集群,进入集群管理页面.
左侧菜单栏选择 运维管理 > 指标告警 > 通知组 进入通知组配置页面。
通知组支持联系人、翼连、WebHook集成三种通知对象,其中联系人支持手机号(短信)和邮箱(邮件)、翼连支持发送到翼连群、WebHook支持发送到用户指定的WebHook后端。
创建基础策略
登陆云容器引擎控制台, 点击左侧导航栏中的集群,进入集群列表页。
在集群列表中点击需要配置告警的集群,进入集群管理页面。
左侧菜单栏选择 运维管理 > 指标告警 > 告警策略 进入通知策略配置页面,点击按钮 创建通知策略 创建通知策略。
通知策略可以配置通知对象、通知模板、渲染API地址、通知时段,其中通知对象为用户在通知组设置的对象,邮件、短信、翼连三种告警方式支持分别独立配置模板,一般没有特殊需求使用默认模板即可。
配置指标告警
登陆云容器引擎控制台, 点击左侧导航栏中的集群,进入集群列表页面。
在集群列表中点击需要配置告警的集群,进入集群管理页面。
左侧菜单栏选择 运维管理 > 指标告警 > 告警规则 进入告警规则页面,点击按钮 创建告警规则 创建告警规则。
目前共提供的告警分组有Kubernetes节点、Kubernetes负载、指标采集上报和黑盒监控,其中节点、负载和指标采集上报均为基础告警,只要安装了ccse-monitor插件即可使用,黑盒监控需要应用接入黑盒监控才可使用,可参考 用户指南 > 集群可观测 > 黑盒监控 章节。
选择告警分组和告警指标后会显示告警阈值及当前集群的指标值,部分指标可以通过告警条件调整告警阈值及判断条件;告警触发条件可以选择立即触发或告警条件持续数分钟后才触发。
查看告警事件历史及告警发送历史
登陆云容器引擎控制台, 点击左侧导航栏中的集群,进入集群列表页面。
在集群列表中点击需要配置告警的集群,进入集群管理页面。
左侧菜单栏选择 运维管理 > 指标告警 > 告警事件历史 或 告警发送历史 可分别查看集群告警事件历史及告警发送历史。
告警事件历史页面可以查看告警事件名称、事件描述、事件数量、事件状态等信息,通过右上角事件状态筛选下拉框还可以筛选指定状态的告警事件。
告警发送历史页面可以查看事件告警的告警状态、通知状态等,还可以根据告警的状态、等级等进行筛选。