训练任务处于已完成状态时占用资源吗?
训练完成的任务会继续占用资源,如需释放资源请备份相关训练结果数据点击停止任务资源即可被释放。
进行多机多卡训练时,Master容器实例运行成功,但Worker容器实例一直处于Pending状态的原因是什么?
可能是由于启动命令简单引起Master容器已运行成功并退出,Worker容器初始化需要Master容器运行状态,但此时Master容器已退出。具体原因请提交工单查询。
本页目录
训练完成的任务会继续占用资源,如需释放资源请备份相关训练结果数据点击停止任务资源即可被释放。
可能是由于启动命令简单引起Master容器已运行成功并退出,Worker容器初始化需要Master容器运行状态,但此时Master容器已退出。具体原因请提交工单查询。