前提条件
已创建容器集群,具体操作请参见 用户指南 > 集群 > 新建集群 。
确保集群运行状态处于运行中。
故障诊断功能介绍
云容器引擎提供的故障诊断功能如下表所示:
诊断项 | 说明 |
Service诊断 | 诊断Service相关问题,例如Service后端就绪Pod、异常事件信息等。 |
节点诊断 | 诊断节点相关问题,例如K8s节点NotReady等。 |
Pod诊断 | 诊断K8s Pod状态异常相关的问题,例如Pod启动失败、Pod频繁重启等 。 |
Ingress诊断 | 诊断Ingress相关流量配置问题。 |
配置故障诊断
注意
使用故障诊断功能时,系统将在您的集群节点上执行数据采集程序并收集检查结果。采集的信息包括系统版本、负载、Docker、kubelet等运行状态以及系统日志中的关键错误信息。数据采集程序不会采集您的业务信息及敏感数据。
配置Service、节点、Pod、Ingress等诊断操作类似。下文以配置节点诊断为例,介绍如何配置故障诊断功能。
登陆云容器引擎控制台, 点击左侧导航栏中的集群,进入集群列表页。
在集群列表中点击需要配置故障诊断的集群,进入集群管理页面。
在集群管理页面导航栏中选择运维管理 > 故障诊断,进入故障诊断页面。
在故障诊断页面,点击节点诊断Tab页面,在选择节点面板,选择需要诊断的节点名称,点击确定按钮发起诊断。
在诊断列表页面可查看诊断进展。诊断完成后,诊断页面将显示诊断结果。
查看诊断结果
在故障诊断页面诊断列表的操作列,点击目标诊断报告对应的诊断详情,在诊断详情页面查看详细诊断结果,诊断项状态为异常时,需要确认,如果是引起集群异常的问题需要处理。
注意
根据集群配置,具体检查项可能稍有不同。实际结果请以诊断页面结果为准。