用户在日常使用中,可以在翼MR Manager管理所有组件(含角色实例)和主机的状态及指标信息:
- 状态信息,包含运行、健康及角色实例状态统计。
- 指标信息,各组件的主要监控指标项。
管理组件监控
- 在翼MR Manager页面,点击左侧菜单栏“集群服务”。
- 在集群服务列表点击任一集群进入。
- 选择“集群状态”页,展示实例分组健康状态。
状态 | 描述 |
---|---|
告警 | 集群实例服务曾出现过异常。 |
故障 | 集群实例服务产生故障。 |
正常 | 集群实例服务已启动。 |
未监控 | 集群实例未安装prometheus,服务未监控。 |
- 点击任一实例的健康状态后,跳转到角色实例页面,按实例分组显示每个实例组件角色,主机IP,主机名称,主机状态,启动状态和健康状态。
管理主机监控
- 在翼MR Manager页面,点击左侧菜单栏“主机”。
- 主机页展示主机IP、主机名称、初始化状态、主机状态、健康状态、主机标签、内存、CPU型号、主机配置、操作系统、描述等字段。
- 健康状态栏,展示主机健康状态。
状态 | 描述 |
---|---|
告警 | 集群实例服务曾出现过异常。 |
故障 | 集群实例服务产生故障。 |
正常 | 集群实例服务已启动。 |
未监控 | 集群实例未安装prometheus,服务未监控。 |
-
点击主机IP,跳转到主机状态信息栏,展示主机状态、实例列表和告警历史。
-
点击告警历史,可追溯该主机IP下的历史告警。