searchusermenu
  • 发布文章
  • 消息中心
点赞
收藏
评论
分享
原创

天翼云紫金算力基础设施

2024-12-12 09:10:53
4
0

         天翼云一体化紫金算力基础设施,是围绕天翼云自主创新的紫金架构打造的软硬融合、一体化的云服务算力底座。 包含三大核心基础平台能力:
        两弹一优 AIDC:基于“两弹一优”的设计理念,定制并自研了四大AIDC 产品,包括 风冷/液冷兼容的弹性DC仓、智算/通算全栈液冷方案、高效稳定的分布式磁悬浮制冷系统、敏捷交付/高能效的一体化HVDC电源;


      基础硬件:包含天翼云自主研发的紫金山通算服务器、紫金山智算服务器,紫金湖高密存储服务器、紫金湖高性能全闪存储服务器;紫金桥白盒交换机、紫金桥可编程网关;以及紫金计算架构第二算力平面的核心“紫金DPU”,将传统计算架构下依赖CPU来处理计算、存储、网络和安全云化的算力开销卸载到完全自研的软硬结合体系中,实现对计算、网络、存储、安全等算力资源的快速云化加速,主机算力完全释放。紫金系列硬件是天翼云基于紫金计算架构体系,自研的基础设施硬件产品,覆盖了网络、计算、存储、DPU系列产品类别,包括紫金桥白盒交换机、紫金桥可编程网关、紫金山通算服务器、紫金山智算服务器、紫金湖高密存储服务器、紫金DPU等产品。
紫金系列硬件产品有3大特点:
        一、全国产化:核心产品全国产化设计,最高国产化率超过95%,实现基础硬件的自主可控,保障供应安全和业务的安全稳定。
        二、 统一基础设施硬件:全自研方案,统一软硬件架构,解决通用产品“七国八制”带来的高成本、高故障率、运营难等系列问题,实现物理基础设施的降本增效。
      三、绿色低碳:风冷、液冷定制化研发,提升算效与散热优化双管齐下,降低数据中心能耗和系统整体TCO。


       基础软件:包含自研国产服务器操作系统 CTyunOS、网络操作系统TeleNOS、分布式云操作系统TeleCloudOS 三大操作系统平台。
天翼云持续在基础软硬件领域的技术创新,已取得多项行业领先、业界首发的技术和产品突破。紫金DPU已从DPU1.0 持续快速迭代到DPU2.0/3.0版本,对外输出弹性裸金属和DPU云主机产品能力,达到业界领先的DPU IO性能,网络转发性能高达 5000w PPS,存储性能达到100W IOPS, 目前DPU合计上线已超万片;业界首家全国化自研服务器,整机核心芯片以及基础元器件全国产化,在国产化需求场景规模化上线部署,自研JDM国产化服务器已在各业务场景下累计上线近2万台,并通过电子无所政采认证测试;在网络设备方面,运营首发自研白盒交换机,以及运营商首个规模上线可编程网关,并荣获“2024网络开源创新成果奖”;

        基础软件在内核、虚拟化、安全框架等领域实现技术突破,业界领先的GPU虚拟化技术,实现兆级显存细粒度切分,支持虚拟机和容器化部署;发布业界领先的系统安全框架,首推产品级ebpf程序国密签名技术和ebpf 工具集;紫金算力底座的软硬一体融合优化和三栈合一的SF-STACK高性能存储网络,实现了央企领先的训练推理加速服务,数据写加速性能提升20倍;目前 CTyunOS 已上线超20W 套。 
业界首创的液冷弹性DC舱,PUE值小于1.12,打造成本极致、灵活弹性、绿色低碳高效智能的“翼立方”AIDC基础设施。
一体化紫金算力基础设施对外提供给“统一架构、统一底座”、“全域卸载、业务加速”、“软硬协同、极致性能”、“开放兼容、多芯算力”四大核心能力。打造全国产化、安全可靠、绿色节能的新一代紫金算力基础设施,支撑构建“2(2)+4+31+X+O”的基础设施资源布局、以及 “2+3+7+N+M”的人工智能公共算力中心布局,对内、对外提供全场景业务能力。

        目前,天翼云已成为实现软硬一体全栈自研并规模落地的运营商;具备超大规模全国产化/多元化算力供给能力;并建成国内首个单池万卡全液冷智算集群支撑AI公司大模型业务上线。
新一代紫金算力基础设施已获得多项国家级、行业权威机构颁发的认证及奖项。


        天翼云在全国范围内建立了多个智算中心,形成了强大的智能计算布局,旨在为各类企业、科研机构提供高效、安全的计算支持。我们的智算资源池不仅具备领先的算力,还采用了自主研发平台和绿色低碳的设计,能为人工智能、大数据分析等多种场景提供强有力的技术支持,帮助各行业实现数字化转型和创新。
          在这其中,北京和上海的两个万卡智算资源池是我们布局中的核心节点:
          北京万卡池总算力达3.75EFLOPS,是全国第二个实现全液冷国产化的单集群智算中心。这个中心采用自主研发的平台,确保数据安全,同时PUE低于1.2,能效非常高,非常环保。它的主要优势在于能为大规模AI和数据处理任务提供强大算力支持。
        上海万卡池拥有3.5EFLOPS的总算力,是全国第一个全液冷国产化的单集群智算中心,同样具备高效的能耗表现和自主研发平台。这个资源池服务于上海及周边地区,支持人工智能、科研创新和各类行业应用。
两大万卡池的共同特点:
         全液冷技术,这是目前最先进的冷却技术,能有效降低能耗,确保绿色低碳。
         自主研发平台,确保数据的高度安全性,特别适合有高安全需求的客户。
天翼云通过这两大核心节点,为全国用户提供强大的算力支持,无论您是从事AI研发、数据分析,还是其他高性能计算应用,天翼云都能为您提供定制化的解决方案,帮助您更好地应对业务挑战。

 

0条评论
0 / 1000
c****0
1文章数
0粉丝数
c****0
1 文章 | 0 粉丝
c****0
1文章数
0粉丝数
c****0
1 文章 | 0 粉丝
原创

天翼云紫金算力基础设施

2024-12-12 09:10:53
4
0

         天翼云一体化紫金算力基础设施,是围绕天翼云自主创新的紫金架构打造的软硬融合、一体化的云服务算力底座。 包含三大核心基础平台能力:
        两弹一优 AIDC:基于“两弹一优”的设计理念,定制并自研了四大AIDC 产品,包括 风冷/液冷兼容的弹性DC仓、智算/通算全栈液冷方案、高效稳定的分布式磁悬浮制冷系统、敏捷交付/高能效的一体化HVDC电源;


      基础硬件:包含天翼云自主研发的紫金山通算服务器、紫金山智算服务器,紫金湖高密存储服务器、紫金湖高性能全闪存储服务器;紫金桥白盒交换机、紫金桥可编程网关;以及紫金计算架构第二算力平面的核心“紫金DPU”,将传统计算架构下依赖CPU来处理计算、存储、网络和安全云化的算力开销卸载到完全自研的软硬结合体系中,实现对计算、网络、存储、安全等算力资源的快速云化加速,主机算力完全释放。紫金系列硬件是天翼云基于紫金计算架构体系,自研的基础设施硬件产品,覆盖了网络、计算、存储、DPU系列产品类别,包括紫金桥白盒交换机、紫金桥可编程网关、紫金山通算服务器、紫金山智算服务器、紫金湖高密存储服务器、紫金DPU等产品。
紫金系列硬件产品有3大特点:
        一、全国产化:核心产品全国产化设计,最高国产化率超过95%,实现基础硬件的自主可控,保障供应安全和业务的安全稳定。
        二、 统一基础设施硬件:全自研方案,统一软硬件架构,解决通用产品“七国八制”带来的高成本、高故障率、运营难等系列问题,实现物理基础设施的降本增效。
      三、绿色低碳:风冷、液冷定制化研发,提升算效与散热优化双管齐下,降低数据中心能耗和系统整体TCO。


       基础软件:包含自研国产服务器操作系统 CTyunOS、网络操作系统TeleNOS、分布式云操作系统TeleCloudOS 三大操作系统平台。
天翼云持续在基础软硬件领域的技术创新,已取得多项行业领先、业界首发的技术和产品突破。紫金DPU已从DPU1.0 持续快速迭代到DPU2.0/3.0版本,对外输出弹性裸金属和DPU云主机产品能力,达到业界领先的DPU IO性能,网络转发性能高达 5000w PPS,存储性能达到100W IOPS, 目前DPU合计上线已超万片;业界首家全国化自研服务器,整机核心芯片以及基础元器件全国产化,在国产化需求场景规模化上线部署,自研JDM国产化服务器已在各业务场景下累计上线近2万台,并通过电子无所政采认证测试;在网络设备方面,运营首发自研白盒交换机,以及运营商首个规模上线可编程网关,并荣获“2024网络开源创新成果奖”;

        基础软件在内核、虚拟化、安全框架等领域实现技术突破,业界领先的GPU虚拟化技术,实现兆级显存细粒度切分,支持虚拟机和容器化部署;发布业界领先的系统安全框架,首推产品级ebpf程序国密签名技术和ebpf 工具集;紫金算力底座的软硬一体融合优化和三栈合一的SF-STACK高性能存储网络,实现了央企领先的训练推理加速服务,数据写加速性能提升20倍;目前 CTyunOS 已上线超20W 套。 
业界首创的液冷弹性DC舱,PUE值小于1.12,打造成本极致、灵活弹性、绿色低碳高效智能的“翼立方”AIDC基础设施。
一体化紫金算力基础设施对外提供给“统一架构、统一底座”、“全域卸载、业务加速”、“软硬协同、极致性能”、“开放兼容、多芯算力”四大核心能力。打造全国产化、安全可靠、绿色节能的新一代紫金算力基础设施,支撑构建“2(2)+4+31+X+O”的基础设施资源布局、以及 “2+3+7+N+M”的人工智能公共算力中心布局,对内、对外提供全场景业务能力。

        目前,天翼云已成为实现软硬一体全栈自研并规模落地的运营商;具备超大规模全国产化/多元化算力供给能力;并建成国内首个单池万卡全液冷智算集群支撑AI公司大模型业务上线。
新一代紫金算力基础设施已获得多项国家级、行业权威机构颁发的认证及奖项。


        天翼云在全国范围内建立了多个智算中心,形成了强大的智能计算布局,旨在为各类企业、科研机构提供高效、安全的计算支持。我们的智算资源池不仅具备领先的算力,还采用了自主研发平台和绿色低碳的设计,能为人工智能、大数据分析等多种场景提供强有力的技术支持,帮助各行业实现数字化转型和创新。
          在这其中,北京和上海的两个万卡智算资源池是我们布局中的核心节点:
          北京万卡池总算力达3.75EFLOPS,是全国第二个实现全液冷国产化的单集群智算中心。这个中心采用自主研发的平台,确保数据安全,同时PUE低于1.2,能效非常高,非常环保。它的主要优势在于能为大规模AI和数据处理任务提供强大算力支持。
        上海万卡池拥有3.5EFLOPS的总算力,是全国第一个全液冷国产化的单集群智算中心,同样具备高效的能耗表现和自主研发平台。这个资源池服务于上海及周边地区,支持人工智能、科研创新和各类行业应用。
两大万卡池的共同特点:
         全液冷技术,这是目前最先进的冷却技术,能有效降低能耗,确保绿色低碳。
         自主研发平台,确保数据的高度安全性,特别适合有高安全需求的客户。
天翼云通过这两大核心节点,为全国用户提供强大的算力支持,无论您是从事AI研发、数据分析,还是其他高性能计算应用,天翼云都能为您提供定制化的解决方案,帮助您更好地应对业务挑战。

 

文章来自个人专栏
xxxx
1 文章 | 1 订阅
0条评论
0 / 1000
请输入你的评论
0
0