功能入口
- 选择目标资源池,并登录APM组件控制台。
- 在左侧导航栏中选择「应用监控」-「应用列表」。
- 在应用列表中选择您想查看的应用,点击「应用名称」打开新的应用详情链接。
- 在左侧导航栏中选择「应用详情」,您可以在应用详情页面切换至「其他基础监控」页签,在左侧关键指标中选择不同的应用实例,可查看该应用实例相应的概览信息。
功能说明
资源监控
包含对CPU、物理内存、流量的监控,是保障应用程序稳定性和可靠性的重要任务之一。
CPU
- CPU配额(CPU Quota):指为分配的CPU资源上限,单位是CPU核数。
- CPU使用量(CPU Usage):指实际使用的CPU资源量,单位是CPU核数。
需注意,使用量不能超过配额。例如,一个Pod的CPU配额为1核,表示该Pod中所有容器的CPU使用量总和不能超过1核。如果容器的CPU使用量超过了配额限制,容器将会被限制在配额范围内运行,超出部分的CPU使用量将会被抛弃。
通过观察CPU配额和CPU使用量可以合理分析CPU资源使用率,避免资源浪费和不足。
物理内存
- 内存配额(Memory Quota):指为分配的内存资源上限,通常以字节或者二进制字节(Byte、KB、MB、GB等)的形式表示。
- 内存使用量(Memory Usage):指实际使用的内存资源量,通常以字节或者二进制字节(Byte、KB、MB、GB等)的形式表示。
需注意,使用量不能超过配额。例如,一个Pod的内存配额为1GB,表示该Pod中所有容器的内存使用量总和不能超过1GB。如果容器的内存使用量超过了配额限制,容器将会被限制在配额范围内运行,超出部分的内存使用量将会被抛弃。
通过观察物理内存配额及内存使用量,可以帮助用户根据应用程序的实际内存使用情况,合理设置内存配额,以避免内存资源的浪费和不足。
网络流量
网络流量:网络数据量,单位是Byte。
- 接收字节数:也称作入站流量,是指进入的数据量。
- 发送字节数:也称作出站流量,是指发送出去的数据量。
监控网络数据量可以诊断网络性能问题、预测网络容量需求,了解网络的使用情况和资源瓶颈,及时进行网络流量控制和优化,以避免网络拥塞和数据传输失败。
网络数据包
网络数据包:通信的基本单位。它是在网络中传输的数据的载体,包含了一定的控制信息和有效载荷数据。
- 接收包数:接收包数是指网络接口(网卡)成功接收到的数据包的总数量。它表示从网络中接收到的数据包的计数。
- 接收丢包数:接收丢包数指的是在接收过程中丢失的数据包数量。这表示在数据包传输过程中,一些数据包未能成功到达目的地或未能被接收,导致丢包。
- 接收失败数:接收失败数是指在接收过程中发生的错误数量。这些错误可能与数据包传输、网络协议或硬件设备有关,例如校验错误、帧错误等。
- 发送包数:发送包数是指通过网络接口成功发送的数据包的总数量。它表示从容器pod发送到网络的数据包的计数。
- 发送丢包数:发送丢包数指的是在发送过程中丢失的数据包数量。这表示在数据包传输过程中,一些数据包未能成功到达目的地或未能被接收,导致丢包。
- 发送失败数:发送失败数是指在发送过程中发生的错误数量。这些错误可能与数据包传输、网络协议或硬件设备有关,例如校验错误、帧错误等。
监控网络数据包的数量可以帮助管理员诊断网络性能问题和瓶颈,以及进行资源分配和负载均衡的调整。例如,如果某个容器接收到的网络数据包数量过多,可能会导致容器负载过高,需要调整容器资源分配或者优化应用程序的网络使用方式。此外,对于网络数据包的监控还可以帮助管理员检测网络攻击和安全漏洞,以及进行网络流量控制和优化。
Netty内存
监控netty内存的使用情况。包括已使用直接内存和最大直接内存的变化趋势。
- 已使用直接内存:这是指Netty当前已经分配并使用的直接内存大小。直接内存(Direct Memory)是指操作系统可以直接访问的内存,这种内存通常用于网络IO操作,因为它可以减少数据在用户空间和内核空间之间的拷贝,从而提高性能。Netty通过usedDirectMemory()方法可以查询当前系统下Netty的已使用直接内存大小。
- 最大直接内存:这是指Netty配置的最大直接内存大小。如果Netty的直接内存使用超过了这个配置值,将会抛出OutOfDirectMemoryError异常。这个配置值通常在Netty启动时设置,并且可以通过配置文件进行调整。例如,如果Netty配置的最大直接内存为16M,那么当实际使用的直接内存超过16M时,就会出现内存溢出的错误。
总结来说,"已使用直接内存"反映了Netty当前正在使用的直接内存量,而"最大直接内存"则是Netty能够使用的最大直接内存量。这两个参数对于监控和优化Netty应用程序的性能至关重要。
Java方法
监控Java方法明细,表头包括。
- 类名:指定被监控方法所属的类名。
- 方法名:具体被监控方法的名称。
- 调用次数:在一定时间段内,该方法被调用的总次数。
- 错误次数:在一定时间内,该方法执行过程中发生错误的次数。
- 最大耗时(ms):该方法在一段时间内的最长执行时间,通常以毫秒(ms)为单位。
- 平均耗时(ms):该方法在一定时间内的平均执行时间,通常是所有执行时间的总和除以调用次数得出的平均值。
- 0-10ms请求数:在执行时间在0-10毫秒范围内的请求次数。
- 10-100ms请求数:在执行时间在10-100毫秒范围内的请求次数。
- 100-500ms请求数:在执行时间在100-500毫秒范围内的请求次数。
- 500-1000ms请求数:在执行时间在500-1000毫秒范围内的请求次数。
- 1-10s请求数:在执行时间在1-10秒范围内的请求次数。
- 10s以上请求数:在执行时间超过10秒的请求次数。
上述指标可以帮助监控 Java 方法的性能表现,识别潜在性能问题,并针对性地进行优化和调整,以确保应用程序的性能和稳定性。
XXL-JOB
xxl-job定时任务监控,目前仅支持查看,表头如下。
- 请求次数:指定时间段内任务被触发或执行的总次数。
- 错误次数:在相同时间段内,任务执行过程中发生错误的次数。
- 慢请求次数:代表执行时间超过设定阈值的任务执行次数。通常,慢请求指执行时间超过了预设的性能阈值,可能需要进一步优化。
- 最大响应时间(ms):表示在一定时间内任务执行的最长响应时间,通常以毫秒(ms)为单位。这个指标可以帮助发现执行时间较长的任务,有助于优化性能。
- 总响应时间(ms):是指任务执行的总响应时间的总和,表示在一段时间内所有任务执行的总体性能表现。通常也以毫秒(ms)为单位。
这些指标有助于监控 XXL-Job 任务执行的情况、性能表现和异常情况,以提供反馈和指导,帮助优化任务调度系统的性能和稳定性。
统一交互操作说明:
- 将光标移到统计图上,可以查看光标所至时间点的数据详情。
- 单击图标,可以将当前图表放大显示。