自ChatGPT发布以来,人工智能、大模型等技术和应用成为了业界热门话题,各行业的数字化转型也进一步加速推进,行业客户也开始逐步向智能化升级方向进行探索和演进,对于构建智能算力平台支撑模型训练、推理等有强烈的需求。
智算平台需要具备异构算力调度能力, 同时对于如何提升智算资源池服务器的资源利用率以及如何提升AI开发工程效率也是构建智算平台需要主要解决的问题。基于云原生技术的智算解决方案,可以很好的解决上述问题,进而催生出了云原生AI技术栈。业界云厂商纷纷推出基于容器的云原生AI解决方案和配套产品。
最近,天翼云上线了云容器引擎的智算版产品,基于云原生架构和技术,可以在云容器引擎上快速构建AI系统。支持共享GPU调度、批作业调度、拓扑感知调度等智算场景下的调度策略,提供GPU/RDMA异构资源管理和GPU资源监控基础能力,帮助客户快速构建AI模型开发、训练、评测和推理等服务。
1、产品架构:
2、主要能力:
1) 异构资源管理
2) AI任务调度
3) AI框架
3、应用场景
可以面向细分行业,比如金融、政企、交通、智慧零售、保险、科技等的AI应用场景提供服务。
金融:人脸识别、OCR
政企:AI客服
交通:智能交通、AI视频处理
智慧零售:新零售+AI
保险:人脸识别、OCR
科技:AI图像、AI文生图