查看队列详情
一体化计算加速平台·异构计算可查看队列的基础信息和配置信息,有助于更全面地了解队列信息。
操作步骤
- 在队列列表页面的操作栏中单击“详情”,进入“队列详情”页面。
- 可查看队列队列名称、队列ID、队列描述、所属资源组和绑定工作空间信息和节点型号、GPU/CPU/内存的总配额、已用配额和剩余配额信息以及节点亲和性信息。
扩缩容队列
如果当前队列资源配额不满足训练任务所需额度或当前队列有闲置资源,可对队列进行扩缩容操作,提升资源的利用率。同时,支持更改节点亲和性设置。
操作步骤
- 在队列列表页面的操作栏中单击“锁定”,在锁定确认弹窗中点击“确认”。锁定后,新任务无法调度,但不影响运行中的任务。
- 在队列列表页面的操作栏中单击“扩缩容”,进入“扩缩容”页面。
- 更改队列配置信息中GPU/CPU/内存的额度,输入值需∈[当前队列已用配额,(当前队列总配额+资源组剩余量)]。
- 点击节点型号后“刷新”按钮,可刷新GPU、CPU、内存的当前队列已用/总配额、资源组剩余/总量、排队任务总需求。
- 更改GPU卡数后可点击“计算”按钮,可依据GPU输入卡数和节点型号的资源比例计算出CPU/内存参考值,参考值可修改。
- 如需更改节点亲和性设置,可增加或删除标签。
- 完成配置更改后,单击右下角“更新”即完成扩缩容队列。在“队列列表”页面可查看更新后的队列信息。
- 在队列列表页面的操作栏中单击“解锁”,该队列即可继续调度新训练任务。
删除队列
如果不再需要使用此队列,在队列已锁定+队列内GPU/CPU/内存已用配额为0+队列内无训练任务的条件下,可删除该队列。
操作步骤
- 在队列列表页面的操作栏中单击“锁定”,在锁定确认弹窗中点击“确认”。
- 在队列列表页面的操作栏中单击“删除”,在删除确认弹窗中点击“确认”,即完成删除。