1.CPU使用率公式
我们知道
CPU的使用率 = (所有非空闲状态CPU使用时间总和 )/(所有状态CPU时间总和)
由下列公式:
CPU使用时间总和 = 所有非空闲状态CPU使用时间总和 + 所有空闲状态CPU使用时间总和
得出:
CPU的使用率 = 1 - (所有空闲状态CPU使用时间总和 )/(所有状态CPU时间总和)
2.prometheus计算CPU使用率
CPU使用时间总和:node_cpu_seconds_total,表示各种占用的时间。
2.1 CPU使用时间5m增量值
5m增量值 = 当前采样点值 - 5m前的采样点值
输入: increase(node_cpu_seconds_total[5m])
2.2 CPU空闲使用时间5m增量值
node_cpu_seconds_total的采样数据,是基于实现序列的key/vlue格式,而key是"mode"记录了采样的是CPU的那种状态的时间(user、sys、idle等)
输入:increase(node_cpu_seconds_total{mode=“idle”}[5m])
2.3 聚合多核CPU空闲使用时间5m增量值
通过采样数据,可以看到CPU空闲使用时间5m增量值,是每个cpu和都作为一个采样值,而每个虚机\物理机,大部分是多核的,所以需要聚合所有核数的空闲时间。
输入:sum(increase(node_cpu_seconds_total{mode=“idle”}[5m]))
通过结果可以看出,sum函数是将所有CPU核数时间想加,没有按照主机进行聚合,所以这时就需要引入=by (instance)=函数,它会把sum求和到一起的数值按照指定方式进行拆分,instance代表的是机器名。如果不写by (instance)的话就需要在{}中写明需要哪个实例的数据。
输入:sum(increase(node_cpu_seconds_total{mode=“idle”}[5m])) by (instance)
2.4 聚合单个机器多核CPU总使用时间5m增量值
输入:sum(increase(node_cpu_seconds_total[5m])) by (instance)
2.5 计算平均5分钟CPU使用率
输入:1- sum(increase(node_cpu_seconds_total{mode=“idle”}[5m])) by (instance)/sum(increase(node_cpu_seconds_total[5m])) by (instance)