如果推理服务异常或失败,您可以在详情中查看服务实例状态,了解具体异常或者失败的原因。
查看实例监控
-
登录智能计算控制台,在左侧导航栏单击【推理】->【分布式推理】,在列表页,找到需要目标服务,在操作栏点击【详情】按钮。
-
在详情页,点击异常实例的【查看】按钮。
-
可查询实例的CPU、内存和显卡数据。
查看实例事件
-
登录智能计算控制台,在左侧导航栏单击【推理】->【分布式推理】,在列表页,找到需要目标服务,在操作栏点击【详情】按钮。
-
在详情页,点击异常实例的【查看】按钮。在详情页,切换到【事件】TAB。
-
可查询近1小时的事件。
查看实例日志
-
登录智能计算控制台,在左侧导航栏单击【推理】->【分布式推理】,在列表页,找到需要目标服务,在操作栏点击【详情】按钮。
-
在详情页,点击异常实例的【查看】按钮。在详情页,切换到【日志】TAB。
-
可查询实时日志。
手动重建实例
在定位到具体实例后,可尝试手动对实例进行单独的重启操作。进入详情页,在实例列表中,点击【重建】按钮。将删除当前实例,重新创建实例。