功能说明
本章节定义了数据湖探索服务上报云监控的监控指标的命名空间,监控指标列表和维度定义,用户可以通过云监控服务提供的管理控制台或API接口来检索数据湖探索服务产生的监控指标和告警信息。
命名空间
SYS.DLI
监控指标
数据湖探索服务支持的监控指标
指标ID | 指标名称 | 指标含义 | 取值范围 | 测量对象 | 监控周期(原始指标) |
---|---|---|---|---|---|
queue_cu_num | 队列CU使用量 | 展示用户队列申请的CU数 | ≥0 | 队列 | 5分钟 |
queue_job_launching_num | 提交中作业数 | 展示用户队列中状态为提交中的作业数。 | ≥0 | 队列 | 5分钟 |
queue_job_running_num | 运行中作业数 | 展示用户队列中状态为运行中的作业数。 | ≥0 | 队列 | 5分钟 |
queue_job_succeed_num | 已完成作业数 | 展示用户队列中状态为已完成的作业数。 | ≥0 | 队列 | 5分钟 |
queue_job_failed_num | 已失败作业数 | 展示用户队列中状态为已失败的作业数。 | ≥0 | 队列 | 5分钟 |
queue_job_cancelled_num | 已取消作业数 | 展示用户队列中状态为已取消的作业数。 | ≥0 | 队列 | 5分钟 |
queue_cpu_usage | 队列CPU使用率 | 展示用户队列的CPU使用率。 | 0~100 | 队列 | 5分钟 |
queue_disk_usage | 队列磁盘使用率 | 展示用户队列的磁盘使用率。 | 0~100 | 队列 | 5分钟 |
queue_disk_used | 队列磁盘使用率最大值 | 展示用户队列的磁盘使用率的最大值。 | 0~100 | 队列 | 5分钟 |
queue_mem_usage | 队列内存使用率 | 展示用户队列的内存使用率。 | 0~100 | 队列 | 5分钟 |
queue_mem_used | 队列内存使用量 | 展示用户队列的内存使用量。 | ≥0 | 队列 | 5分钟 |
flink_read_records_per_second | Flink作业数据输入速率 | 展示用户Flink作业的数据输入速率,供监控和调试使用。 | ≥0 | Flink作业 | 10秒钟 |
flink_write_records_per_second | Flink作业数据输出速率 | 展示用户Flink作业的数据输出速率,供监控和调试使用。 | ≥0 | Flink作业 | 10秒钟 |
flink_read_records_total | Flink作业数据输入总数 | 展示用户Flink作业的数据输入总数,供监控和调试使用。 | ≥0 | Flink作业 | 10秒钟 |
flink_write_records_total | Flink作业数据输出总数 | 展示用户Flink作业的数据输出总数,供监控和调试使用。 | ≥0 | Flink作业 | 10秒钟 |
flink_read_bytes_per_second | Flink作业字节输入速率 | 展示用户Flink作业每秒输入的字节数。 | ≥0 | Flink作业 | 10秒钟 |
flink_write_bytes_per_second | Flink作业字节输出速率 | 展示用户Flink作业每秒输出的字节数。 | ≥0 | Flink作业 | 10秒钟 |
flink_read_bytes_total | Flink作业字节输入总数 | 展示用户Flink作业字节的输入总数。 | ≥0 | Flink作业 | 10秒钟 |
flink_write_bytes_total | Flink作业字节输出总数 | 展示用户Flink作业字节的输出总数。 | ≥0 | Flink作业 | 10秒钟 |
flink_cpu_usage | Flink作业CPU使用率 | 展示用户Flink作业的CPU使用率。 | 0~100 | Flink作业 | 10秒钟 |
flink_mem_usage | Flink作业内存使用率 | 展示用户Flink作业的内存使用率。 | 0~100 | Flink作业 | 10秒钟 |
flink_max_op_latency | Flink作业最大算子延迟 | 展示用户Flink作业的最大算子延迟时间,单位ms。 | ≥0 | Flink作业 | 10秒钟 |
flink_max_op_backpressure_level | Flink作业最大算子反压 | 展示用户Flink作业的最大算子反压值,数值越大,反压越严重。 0:表示OK 50:表示Low 100:表示High | 0~100 | Flink作业 | 10秒钟 |
维度
表1-2 维度
Key | Value |
---|---|
queue_id | 队列 |
flink_job_id | Flink作业 |
通过云监控服务CES查看DLI监控指标
- 在管理控制台搜索“云监控服务”。
- 进入云监控服务的控制台后,在左侧列表中,单击“数据湖探索”。
- 选择队列进行查看相关监控信息。