云骁智算的使用流程有哪些关键步骤?
- 创建资源组:在资源组内可扩缩容节点。
- 创建队列:资源组与队列的关系为一对多,即一个资源组内可有≥1个队列。
- 检测环境与性能:检测资源组环境和硬件性能情况,为训练任务的顺利运行做准备。
- 创建自定义训练任务:关联队列后设置相关信息即可运行训练任务。
- 查看监控告警信息:支持以不同时间间隔维度检测资源和任务的运行情况,并根据系统告警信息及时调整。
具体请参见用户指南。
云骁智算使用时有什么限制?
- 建议不要自行升级节点的内核版本和操作系统版本。
- 禁止修改网络相关的配置,否则可能导致无法连接节点。
- 不支持跨AZ创建资源组。
- IB网络只支持租户级隔离,不支持子账号级隔离。
- 请勿通过其他产品控制台删除云骁智算平台为用户创建的资源,如资源组管理节点云主机ELB和VPCE。