为保证弹性云主机的可靠性、可用性和可观测性,对云主机进行监控已经成为一种必要且重要的手段。天翼云控制平台提供的云主机监控功能,可方便用户更快、更直观的了解弹性云主机的运行情况、资源使用情况及其他性能指标,同时可根据实时监控情况,执行告警通知等操作,帮助客户更好的管理云主机
云主机监控分为基础监控、操作系统监控和进程监控。
- 基础监控:无需安装监控Agent就可获得的监控指标。指标采集粒度为1分钟,监控CPU使用率、内存使用率、网络IO、磁盘IO等指标。
- 操作系统监控:通过在云主机中安装Agent插件,提供更细颗粒度的监控。除CPU与内存使用率等指标外,还可以支持CPU负载、磁盘和网卡等相关指标的监控服务。
- 进程监控:通过在云主机中安装Agent插件,对主机内活跃的进程进行监控,默认监控进程数量、进程的CPU使用率,以及打开的文件数等具体信息。
说明GPU实例分为图形加速基础型(G系列)和计算加速型(P系列)两类GPU云主机实例,若要对P系列云主机进行GPU监控,需要安装Agent的同时,对应的安装GPU的驱动。