操作场景
场景一:数据实时分析
使用云监控数据订阅功能,将业务进行异步解耦,在不影响源库业务的情况下,实时同步监控或告警数据到客户自有分析系统中,帮助企业用户进行实时数据分析。
场景二:数据归档存储
使用云监控数据订阅功能,您可将资源监控或告警数据的增量更新数据,实时地推送到归档数据库或数据仓库。
说明
数据订阅功能当前为受限开放,如有需求可以联系客户经理为您开放此功能。
资源池下单个用户最多可创建20个数据订阅任务。
前提条件
注册天翼云账号,并完成实名认证。具体操作,请参见天翼云账号注册流程。
注意
数据订阅功能数据类型支持指标数据及告警数据,订阅方式支持分布式消息服务及API方式。
指标数据订阅支持kafka及remotewrite-api方式,告警数据订阅支持kafka及api-push方式。
分布式消息服务(kafka)需要客户提前部署资源,在云监控平台创建订阅任务时填写相关客户端配置信息。
操作步骤
- 登录控制中心。
- 在控制中心页面左上角点击,选择区域,本文我们选择华东1。
- 依次选择“管理与部署”,单击“云监控”,进入监控概览页面。
- 单击左侧“数据订阅”菜单,进入数据订阅任务列表。
- 单击“创建订阅任务”功能,进入数据订阅任务创建二级页面。
- 创建订阅任务参数配置如下:
模块 参数 参数说明 配置示例 备注 选择订阅对象
选择资源类型 选择所需订阅数据的云服务资源类型。 云主机 选择维度 用于指定告警规则对应指标的维度名称 云主机 监控对象类型 具体实例 -- 选择对象 选择资源实例对象 具体实例
配置订阅内容
选择数据类型 指标数据/告警信息 指标数据 业务发生时间 选择所需要订阅的业务数据发生时间段 00:00:00-23:59:59
定义订阅方式
订阅方式 分布式消息服务/remotewrite-API 是 类型 Kafka 地址 输入用户客户端地址 用户名 触发告警邮件的场景,可在告警及恢复时发送提醒信息。 出现告警 密码 配置告警通知的通知方式,支持邮箱及短信。 邮箱 TOPIC 指告警发生后如果未恢复正常,将重复发送告警通知次数。 不重复 订阅异常提醒 邮件/短信 邮件 告警联系组 选择数据订阅异常时,需提醒的联系组 订阅任务名称 填写自定义订阅任务名称
数据订阅格式说明
监控数据(kafka)
{
"fields": {
"cpu_user_time": 95.66
},
"from": "subscription_translate",
"tags": {
"__name__": "cpu_user_time",
"__report_by__": "harvest",
"idc": "neimengaz03",
"job": "virtual_machine",
"uuid": "test-6abf-de16-690f"
},
"timestamp": 1720401557
}
监控数据(remote-write api)
http_requests_total{method="post",code="200"} 1027
告警数据
{
"service": "ecs", //服务
"dimension": "ecs", //维度
"region_id": "test728662dd11ec810800155d307d5b", //Region Id
"idc": "neimengaz03", //资源池标识符
"key": "bac_be63d9bc2e00427094888e65d4a1bd49", //账号ID
"model_id": "test-a4f0-5e8f-909b-e5422b9df2f3", //控制台告警规则Id
"issue_id": "testc3d34f90326da5fbd44b", //IssueID, 这个字段方便问题回溯
"info_id": "testc3d34f90326da5fbd44e", //InfoID, 这个字段方便问题回溯
"name": "云主机611",
"alarm_type": "series", ////告警类型:series: 时序类监控、event: 事件类
"status": 1, //告警状态:0:告警 1: 恢复
"ctime": 1718076371, //告警首次发生时间
"resource": [{
"name": "uuid", //描述资源的lable名称
"value": "test-6abf-de16-690f-d470affabd26" //lable的值
}, {
"name": "instancename",
"value": "ecm-v6-2"
}],
"metric": "disk_read_bytes_rate", //指标名称
"name": "云主机611", //告警规则名称
"threshold": "0", //阈值
"operator": "ge", //阈值比较符
"unit": "KB/s" //单位
}
说明关于告警数据订阅全部资源的场景,涉及两个周期:
订阅服务subscription同步订阅配置的周期,预计上线配置2分钟。
数据订阅配置全部资源,也需要周期同步全量的实例资源,预计线上配置3分钟。
因此,考虑极限情况,告警订阅服务在周期1 + 周期2之后产生的告警,订阅服务才能匹配消费到。