全国首个国产单池万卡液冷算力集群正式启用,天翼云以科技创新加速算力普惠
2024-03-23
3月22日,中国电信宣布,天翼云上海临港国产万卡算力池正式启用,八家合作伙伴宣布将作为首批用户入驻临港国产算力池。这是国内首个投入正式运营的国产单池万卡液冷算力集群,也是业内领先的全国产化云智一体公共智算中心。通过中国电信天翼云打造的人工智能公共算力服务平台,将以公共普惠、创新领先的算力供给,算、存、运一体的综合算力服务模式,全面赋能上海千行百业,成为上海“新算力”的重要一极。
作为数字中国建设主力军、云服务国家队,中国电信天翼云积极落实国家政策要求,深耕算力基础设施建设,于今年年初在上海临港智算园区投建15000卡公共智能算力中心,这是全国规模最大的运营商级智算中心,将助推上海抢占全国算力发展制高点。经过紧张的建设,3月22日,上海临港智算园区的首个国产单池万卡液冷算力集群正式交付,并投入商业运营。此次启用的天翼云上海临港国产单池万卡液冷算力集群创新性地采用网络中置、算力分层的“魔方”型,实现了单一集群内万卡高速互联,满足万亿级参数大模型训练所需的多机多卡并行、高吞吐无损通信等需求。同时,为了实现绿色低碳的目标,全面采用融合液冷服务和IDC基础设施的新一代智算液冷DC舱,实现了数据中心的能效和智算集群的算效双提升,为“人工智能+”提供智能、弹性的绿色算力。
目前我国人工智能产业正处于高速发展阶段,此次正式运营的公共智算中心,以中国电信天翼云自研TeleCloudOS4.0为底座,承载天翼云算力分发网络平台“息壤”、智算基础设施平台“云骁”、一站式智算服务平台“慧聚”,构建算力聚合分发的新模式,实现全栈能力自主可控、安全可信,多项技术指标领先,可为大模型企业提供从算力供给、算力输送、算力调度到模型训练及推理应用的一站式服务。“慧聚”可针对大模型训练微调场景,提供训推一体化算力服务,实现万卡资源调度;“云骁”支持多款国产芯片以及上层框架,可以对万卡规模智算集群进行纳管,算力、存储、网络多层次算力加速,全方位监控、故障自动感知,实现超大规模集群长稳运行;“息壤”算力网络盘活上海区域零散的通算、智算和超算算力,目前已纳管多个算力厂商,为企业提供普惠的智算调度服务。
作为引领新一轮科技革命和产业变革的战略性技术和重要驱动力量,人工智能产业机遇正在加速涌现,算力服务对于推动产业转型升级的赋能作用日趋显著。天翼云将持续坚持科技创新,不断夯实国云智算底座,推动人工智能技术成果转化,为数字经济发展蓄能添力,助推数字中国建设。