前提条件
请确保您的云主机上已成功安装监控Agent。具体操作,请参见安装监控Agent。
监控指标说明
安装监控Agent后,您可以查看不同分类的操作系统监控指标,采集频率均为1分钟/次。
操作系统监控指标已支持:CPU相关监控指标、内存相关监控指标、CPU负载相关监控指标、磁盘相关监控指标、磁盘I/O相关监控指标、文件系统相关监控项、网络相关监控项、GPU相关监控指标。
CPU相关监控指标
监控指标 |
监控指标名称 |
监控指标含义 |
单位 |
维度 |
监控周期 |
CPU使用率 |
cpu_util |
云主机CPU使用率。 |
% |
云主机 |
1分钟 |
用户空间CPU使用率 |
cpu_user_time |
云主机用户空间占用CPU使用率。 |
% |
云主机 |
1分钟 |
内核空间CPU使用率 |
cpu_system_time |
云主机内核空间占用CPU使用率。 |
% |
云主机 |
1分钟 |
其他CPU使用率 |
other_cpu_util |
云主机其他占用CPU使用率。 |
% |
云主机 |
1分钟 |
CPU空闲时间占比 |
cpu_idle_time |
云主机CPU空闲时间占比。 |
% |
云主机 |
1分钟 |
Nice进程CPU使用率 |
cpu_nice_time |
云主机Nice进程CPU使用率。 |
% |
云主机 |
1分钟 |
iowait状态占比 |
cpu_iowait_time |
云主机iowait状态占用CPU的比率。 |
% |
云主机 |
1分钟 |
CPU中断时间占比 |
cpu_interrupt_time |
云主机CPU处理中断用时占用CPU时间的比率 |
% |
云主机 |
1分钟 |
CPU软中断时间占比 |
cpu_softirq_time |
云主机CPU处理软中断时间占用CPU时间的比率。 |
% |
云主机 |
1分钟 |
内存相关监控指标
监控指标 |
监控指标名称 |
监控指标含义 |
单位(原始数据) |
维度 |
监控周期 |
内存使用率 |
mem_util |
云主机内存使用率。 |
% |
云主机 |
1分钟 |
可用内存 |
可用内存free_memory |
云主机可用内存。 |
byte |
云主机 |
1分钟 |
已用内存量 |
used_memory |
云主机已使用内存量。 |
byte |
云主机 |
1分钟 |
Buffers占用量 |
buffer_memory |
云主机Buffers内存量。 |
byte |
云主机 |
1分钟 |
Cached占用量 |
cache_memory |
云主机Cache内存量。 |
byte |
云主机 |
1分钟 |
CPU负载相关指标
监控指标 |
监控指标名称 |
监控指标含义 |
单位(原始数据) |
维度 |
监控周期 |
1分钟平均负载 |
mem_util |
云主机过去1分钟的系统平均负载。 |
无 |
云主机 |
1分钟 |
5分钟平均负载 |
可用内存 |
云主机过去5分钟的系统平均负载。 |
无 |
云主机 |
1分钟 |
15分钟平均负载 |
已用内存量 |
云主机过去15分钟的系统平均负载。 |
无 |
云主机 |
1分钟 |
磁盘相关指标
监控指标 |
监控指标名称 |
监控指标含义 |
单位(原始数据) |
维度 |
监控周期 |
磁盘分配率 |
disk_util_inband |
磁盘使用率。 |
% |
云主机-挂载点 |
1分钟 |
磁盘已用存储量 |
used_disk_space_on |
磁盘的已用存储空间。 |
byte |
云主机-挂载点 |
1分钟 |
磁盘剩余存储量 |
free_disk_space_on |
磁盘的剩余存储空间。 |
byte |
云主机-挂载点 |
1分钟 |
磁盘存储总量 |
total_disk_space_on |
磁盘存储总量。 |
byte |
云主机-挂载点 |
1分钟 |
磁盘I/O相关指标
监控指标 |
监控指标名称 |
监控指标含义 |
单位(原始数据) |
维度 |
监控周期 |
磁盘读速率 |
disk_read_bytes_rate |
从磁盘每秒读取的数据量。 |
KB/s |
云主机-磁盘 |
1分钟 |
磁盘读请求速率 |
disk_read_requests_rate |
从磁盘每秒读请求次数。 |
次/s |
云主机-磁盘 |
1分钟 |
磁盘写速率 |
disk_write_bytes_rate |
向磁盘每秒写入的数据量。 |
KB/s |
云主机-磁盘 |
1分钟 |
磁盘写请求速率 |
disk_write_requests_rate |
向磁盘每秒写请求次数。 |
次/s |
云主机-磁盘 |
1分钟 |
文件系统操作指标
监控指标 |
监控指标名称 |
监控指标含义 |
单位(原始数据) |
维度 |
监控周期 |
inode空间大小 |
total_inode_on |
inode空间。 |
files |
云主机-挂载点 |
1分钟 |
inode已使用空间 |
used_inode_on |
已使用的inode空间。 |
files |
云主机-挂载点 |
1分钟 |
inode已使用占比 |
pused_inode_on_percentage |
已使用的inode占比。 |
% |
云主机-挂载点 |
1分钟 |
网络相关监控指标
监控指标 |
监控指标名称 |
监控指标含义 |
单位(原始数据) |
维度 |
监控周期 |
网络流入流量的速率 |
network_incoming_bytes_rate_inband |
云主机内网每秒接收的数据量。 |
bit/s |
云主机 |
1分钟 |
网络流出流量的速率 |
network_outing_bytes_rate_inband |
云主机内网每秒发送的数据量。 |
bit/s |
云主机 |
1分钟 |
网卡包接收的速率 |
network_incoming_packets_rate_inband |
云主机内网每秒接收的数据包数量。 |
个/s |
云主机 |
1分钟 |
网卡包发送的速率 |
network_outing_packets_rate_inband |
云主机内网每秒发送的数据包数量。 |
个/s |
云主机 |
1分钟 |
接收误包率 |
network_incoming_errs_rate_inband |
云主机内网每秒接收的错误数据包数量占所接收的数据包的比率。 |
% |
云主机 |
1分钟 |
发送误包率 |
network_outing_errs_rate_inband |
云主机内网每秒发送的错误数据包数量占所接收的数据包的比率。 |
% |
云主机 |
1分钟 |
接收丢包率 |
network_incoming_drop_rate_inband |
云主机内网每秒接收并已丢弃的数据包数量占所接收的数据包的比率。 |
% |
云主机 |
1分钟 |
发送丢包率 |
network_outing_drop_rate_inband |
云主机内网每秒发送并已丢弃的数据包数量占所接收的数据包的比率。 |
% |
云主机 |
1分钟 |
TCP连接数 |
net_tcp_total |
云主机内所有状态的TCP连接总数。 |
个 |
云主机 |
1分钟 |
ESTABLISHED TCP连接数 |
net_tcp_established |
云主机内ESTABLISHED状态的TCP连接数量。 |
个 |
云主机 |
1分钟 |
SYS_SENTTCP连接数 |
net_tcp_syn_sent |
云主机内SYS_SENT状态的TCP连接数量。 |
个 |
云主机 |
1分钟 |
SYS_RECVTCP连接数 |
net_tcp_syn_recv |
云主机内SYS_RECV状态的TCP连接数量。 |
个 |
云主机 |
1分钟 |
FIN_WAIT1TCP连接数 |
net_tcp_fin_wait1 |
云主机内FIN_WAIT1状态的TCP连接数量。 |
个 |
云主机 |
1分钟 |
FIN_WAIT2TCP连接数 |
net_tcp_fin_wait2 |
云主机内FIN_WAIT2状态的TCP连接数量。 |
个 |
云主机 |
1分钟 |
TIME_WAIT TCP连接数 |
net_tcp_time_wait |
云主机内TIME_WAIT状态的TCP连接数量 |
个 |
云主机 |
1分钟 |
CLOSE TCP连接数 |
net_tcp_close |
云主机内CLOSE状态的TCP连接数量。 |
个 |
云主机 |
1分钟 |
CLOSE_WAITTCP连接数 |
net_tcp_close_wait |
云主机内CLOSE_WAIT状态的TCP连接数量。 |
个 |
云主机 |
1分钟 |
LAST_ACKTCP连接数 |
net_tcp_last_ack |
云主机内LAST_ACK状态的TCP连接数量。 |
个 |
云主机 |
1分钟 |
LISTEN TCP连接数 |
net_tcp_listen |
云主机内LISTEN状态的TCP连接数量。 |
个 |
云主机 |
1分钟 |
CLOSING TCP连接数 |
net_tcp_closing |
云主机内CLOSING状态的TCP连接数量。 |
个 |
云主机 |
1分钟 |
进程相关监控指标
监控指标 |
监控指标名称 |
监控指标含义 |
单位(原始数据) |
维度 |
监控周期 |
进程CPU使用率 |
process_cpu_used |
云主机内进程消耗的CPU百分比。 |
% |
云主机 |
1分钟 |
进程内存使用率 |
process_memory_used |
云主机内进程消耗的内存百分比。 |
% |
云主机 |
1分钟 |
打开文件数 |
open_files_num |
云主机内进程打开的文件数。 |
个 |
云主机 |
1分钟 |
运行中进程数 |
proc_num |
云主机内运行的进程数量。 |
个 |
云主机 |
1分钟 |
僵死进程数 |
zomb_num |
云主机内僵死的进程数量。 |
个 |
云主机 |
1分钟 |
睡眠进程数 |
sleep_num |
云主机内睡眠的进程数量。 |
个 |
云主机 |
1分钟 |
指定进程数量 |
process_number |
云主机内指定进程数量。 |
个 |
云主机-进程 |
1分钟 |
指定进程CPU使用率 |
process_cpu_util |
指定进程消耗的CPU百分比。 |
% |
云主机-进程 |
1分钟 |
指定进程内存使用率 |
process_mem_util |
指定进程消耗的内存百分比。 |
% |
云主机-进程 |
1分钟 |
指定进程打开文件数 |
process_open_files |
指定进程打开的文件数。 |
个 |
云主机-进程 |
1分钟 |
GPU相关监控指标
监控指标 |
监控指标名称 |
监控指标含义 |
单位(原始数据) |
维度 |
监控周期 |
显存使用率 |
memusage_on_gpu |
GPU云主机显存使用率。 |
% |
云主机-GPU |
1分钟 |
GPU使用率 |
gpuutil_on_gpu |
GPU使用率。 |
% |
云主机-GPU |
1分钟 |
显卡功率 |
npu_chip_info_power |
GPU功率。 |
W |
云主机-GPU |
1分钟 |
显卡温度 |
npu_chip_info_temperature |
GPU卡温度。 |
℃ |
云主机-GPU |
1分钟 |
显存使用量 |
npu_chip_info_used_memory |
GPU显存使用量。 |
byte |
云主机-GPU |
1分钟 |