计算资源管理
支持创建标准资源组、扩展资源组等多种算力集群模式;支持英伟达、昇腾等多种智能芯片;支持GPU云主机、GPU裸金属等灵活算力形态;支持包年包月、按量计费等多种灵活计费形式。
配套高性能网络
支持高性能RDMA网络,可提供最高单机3.2T带宽,实现超大规模、高效并行通信。
高性能存储便捷接入
支持自动连接并便捷使用包括对象存储、高性能并行文件存储在内的多种存储类型,提供百万级IOPS、亚毫秒级时延;支持丰富的大容量非结构化数据保存和分析场景。
自定义任务管理
支持用户通过队列对算力额度进行细粒度划分;支持一键配置和执行自定义任务,并查看任务运行记录。
高效调度
支持节点创建时根据底层网络拓扑,进行网络拓扑亲和性开通;支持万卡规模的异构算力调度能力;支持binpack、gang调度等多种调度策略。
AI监控与运维
支持智算场景下的多维度监控指标展示;支持一键诊断功能对节点软硬件配置、多节点一致性配置、RDMA网络性能、集合通讯库性能等进行自助诊断。