天翼云“息壤”一体化智算服务体系和能力,助力数字经济向新向智发展
2024-08-30
8月28日,2024中国国际大数据产业博览会在贵州贵阳举行。会议期间,中国电信举办了以“聚数乘云 天翼赋能数字经济新生态”为主题的天翼云中国行·贵州站“数据赋能”交流活动。贵州省副省长蔡朝林、国家数据局副局长夏冰、中国电信集团有限公司副总经理唐珂出席活动。贵州省大数据发展管理局、贵州省通信管理局、贵州省工业和信息化厅、贵阳市人民政府、中国信息通信研究院云计算与大数据研究所等企事业单位代表莅临现场。会上,中国电信全国首发上线“魔乐(Modelers)开发者社区”。
Modelers开发者社区上线首发仪式
当前,人工智能已进入加快推进应用落地的关键阶段。为进一步驱动国内人工智能产业发展,加快技术创新和商业落地,中国电信联合伙伴发布魔乐(Modelers)开发者社区。作为开发者交流、学习和创新的平台,魔乐(Modelers)开发者社区集成了模型库、数据集和体验空间、开发工具链等核心组件,覆盖自然语言处理、视觉、音频等多个领域,可提供原生模型、易用开发工具、丰富的生态资源,帮助开发者获取领先的人工智能技术,打造出更有竞争力和差异化的模型及应用。天翼云通过建设社区,构建中文环境下的算力、数据、模型、应用和新CDMA服务,希望吸引全国开发者,共同繁荣国产AI生态。
会上,天翼云科技有限公司副总经理弓剑炜以“云智一体 国云助力数字经济高质量发展”为题发表演讲。弓剑炜表示,天翼云构建领先的“息壤”一体化智算服务体系和能力,全方位开放生态合作,为广大客户提供“供得上、用得起、用得好”的算力服务。“息壤”突破了多项关键技术,拥有强大的算网调度能力、高效的异构计算能力、一站式的训推服务能力,积累了丰富的落地应用案例。
天翼云科技有限公司副总经理 弓剑炜
算网调度能力方面,“息壤”在三个方面取得显著技术突破。通过算力插件和算力网关,实现了算力的统一、高效和云化接入;通过算数协同和多级算力互联调度,实现了算数网的一体化调度,数随算走,算随数动,调度区域更广,算力更泛在;借助大模型认知能力和业务调度,实现算力选择和应用部署简单化,故障自动恢复与负载均衡,使算力简便易用。
基于上述技术突破和产品化应用,“息壤”可服务于三大算力场景。一是天翼云自营公共算力服务平台,目前已接入39家算力伙伴,实现三方各类算力可调度22EFLOPS,显著扩大算力规模和品类,满足公有云客户的多元算力需求。二是帮助客户构建行业算力互联网,例如高校算力联盟等,实现行业内算力利用率的有效提升。三是帮助地方政府构建城市算力互联网,实现区域内多方算力的一体化统筹调度,助力地方经济和产业发展,目前已在贵州等多个区域成功实施。
异构计算能力方面,“息壤”具备高效的异构计算能力,能够破解大模型训练推理中面临的大算力、高性能、高稳定需求等挑战。在大算力需求方面,天翼云建设PB级并行文件存储,并组建低延时超大规模RDMA网络,通过计算、内存和通讯的多维优化,提升综合算效。在性能方面,对AI框架进行升级、存储加速,实现checkpoint文件快速保存、加载,将国产算力的综合算效提升到了行业可比水平。在稳定性方面,通过多项指标的监控分析,实现故障训前发现,有效控制大模型训练中断恢复时长,实现训练任务长期稳定、高可用运行。此外,天翼云基于国产万卡智算集群和自研智算平台,已具备支撑万亿参数基础大模型训练的能力。
训推服务能力方面,“息壤”一站式的训推服务能力,可降低大模型应用创新开发门槛。平台预置行业数据集、纳管国内外主流AI加速硬件、预置基于国产算力的多个基础大模型等全栈工具链能力,将大模型精调场景简化操作至选数据、选硬件和选模型三个步骤,简化部署、提升效率;通过自研AI框架、3D并行加速、自研训练加速库、容器调度优化等核心技术,大幅提升训练效率;通过模型量化压缩、自研推理加速算子库、自研AI推理加速框架等核心技术,显著提高推理效率;通过全链路故障检测、定位、告警,全链路日志监控与可视化、断点续训快速恢复等核心技术,实现训推过程全链路监控。
人工智能产业的发展和繁荣离不开生态沃土的“滋养”。此次会议首发上线魔乐(Modelers)开发者社区。通过社区建设,天翼云将协同伙伴聚集更多的优质中文AI资源,加速AI应用商业落地。天翼云还开放AI云电脑平台,打造AI应用中心,具备AI助手、AI空间、AI客服、AI低代码等AI创新应用,使AI应用能够更广泛地接入和使用,同时推出算数融合套餐,为用户提供更加灵活和高效的服务,全力构建开放的模型、数据、应用生态,共铸AI产业繁荣。
中国信通院云计算与大数据研究所所长何宝宏在会上介绍了云计算和大数据赋能产业发展现状及趋势。他表示,随着AI原生带来的云技术革新和大模型规模化落地,云计算技术与产业融合价值愈加凸显,各行业上云积极性持续攀升,云计算市场将迎来新一轮增长,AI加速产业格局重新洗牌。展望未来,作为数字社会底座,云计算的价值将被继续挖掘,我国也将从“数据大国”迈向“数据强国”。
中国信通院云计算与大数据研究所所长 何宝宏
人工智能已经成为数字经济发展的新引擎。作为云计算原创技术策源地、数字中国建设主力军,天翼云将不断深耕云计算领域核心技术,依托丰富的智算资源、强大的智算一体化平台能力、开放的模型应用生态和丰富的实践案例,携手广大客户与合作伙伴共同赋能千行百业数智化转型,持续为数字经济发展和数字中国建设注入澎湃动能。