检查项内容
检查节点上是否存在不可访问的挂载点。
解决方案
问题场景:节点上存在不可访问的挂载点
节点存在不可访问的挂载点,通常是由于该节点或节点上的Pod使用了网络存储nfs(常见的nfs类型有obsfs、sfs等),且节点与远端nfs服务器断连,导致挂载点失效,所有访问该挂载点的进程均会D住卡死。
步骤 1 登录节点。
步骤 2 节点上依次执行如下命令:
df -h for dir in df -h | grep -v "Mounted on" | awk "{print \\$NF}";do cd $dir; done && echo "ok"
步骤 3 若返回ok则无问题。
否则,请另起一个终端执行如下命令,查询先前命令是否存在D状态:
ps aux | grep "D "
步骤 4 若发现进程存在D状态,则确认为该问题,目前只可以通过重置节点解决。请选择一个合适的时间重置节点后,重试升级。
说明重置节点会重置所有节点标签,可能影响工作负载调度,请在重置节点前检查并保留您手动为该节点打上的标签。