服务器厂商
Intel
CPU + 芯片组总线构成不同的 CPU“平台”:如已经推出 Brickland 、Grantley 、Purley Whitley、Eagle Stream、Sapphire Rapids-SP 和 Emerald Rapids-SP 等平台,截至 24 年下旬,最新一代平台为 BHS 平台。英特尔已将其下一代至强数据中心 CPU 产品线分为两类,P-Core 和E-Core。P-Core 产品将是我们多年来看到的标准 Xeon 产品。然后有了 E-Core产品,它将利用更节能的架构,预计明年将以 Sierra Forest 的形式推出第一款产品。英特尔第 4 代 Sapphire Rapids CPU 系列的后续产品是第 5 代 Xeon 系列,代号为 Emerald Rapids。Emerald Rapids-SP CPU 已经开始提供样品,并按计划于 2023 年第四季度交付。这些芯片将提供更高质量的硅,并正在进行批量验证。Emerald Rapids-SP系列的其他特点包括专注于在相同的功率范围内提高性能/瓦特,提供更高的核心密度。这些芯片将与现有的第 4 代 Eagle Stream 平台完全兼容,可以轻松从上一代平台迁移。每一代平台产品具有多个子代,视 CPU 架构、工艺、 PCIe 控制器和内存控制器的不同 而有差异:例如,自 2017 年 7 月规模商用的 Purley 平台包括SkyLake 和 CascadeLake 两代,均采用 14nm 工艺最高 28 核心,但是支持的内存通道数从 6 通道升级至 8 通道,PCIE3.0 接口数增加。不同平台的各个子代拥有多种型号 名称 2017 年 Purley 平台将产品型号命名方式由此前连续使用四代的 E7 E5 变为至强可扩展处理器( Intel XeonScalable Processor SP 系列型号按 铂金(Platinum)、金(Gold)、银(Silver)、铜(Bronze) 定义 。
从 Tick Tock 到 PAO Intel CPU 升级按照 2-3 年周期持续向前推进:2006 年, Intel 借意钟摆摆动周期提出“钟摆战略( Tick Tock Tick 年(大年)改制程 工艺 Tock 年(小年)改 架构,按照两年的周期交替推进产品升级,该模式下 Intel 成功推进了 22nm~14nm 系列芯片的迭代。2016 年, Intel 终止“ Tick Tock ”转而采用“制程 架构 优化”( PAO )战略 P(Process)年改工艺, A(Architecture) 年改架构 O(Optimization)年优化,按照三年的周期交替推进产品升级。背后原因主要在于芯片制造工艺升级的进度放缓
AMD
AMD 的服务器处理器 EPYC,中文名定为“霄龙”。AMD 的一代处理器为「那不勒斯」,代号为 Naples,二代处理器罗马,英文为 Rome,三代 EPYC 霄龙处理器代号米兰,基于 Zen3 内核和 AMD Infinity架构打造,Zen4 产品则为 Genoa(热那亚),且将使用台积电的 5nm 工艺,Zen4,Zen4c,V-cache 三种规格。AMD 将会在 Zen 4 处理器上重新设计内部的布局,采用最高 1 个 CCD 以及 1个 IOD 核心的设计,也就是说有可能 Zen4 核心数可以达到最高 96 颗,考虑 2到超线程技术,那么线程数将会达到 192 个,相比较目前的 64 颗核心的 Zen3霄龙处理器提升了 50%。当然 Zen4 势必将会采用最新的 5nm 制程工艺,从而确保功耗保持在一个稳定的状态,同时负责 I/O 传输的芯片其制程也将升级至 8nm或者 6nm,以降低运行时的功耗。Zen5 产品则为 Turin(图灵),全新的微架构,3nm 工艺节点。
Ampere
Ampere Computing(安晟培半导体)于 2018 年成立,由英特尔前总裁蕾妮·詹姆斯(Renee James)创建,是一家专注于云原生处理器的企业。Ampere 的创新点在于采用 ARM 架构和自主研发的技术,使得其芯片能够提供更高的性能和更低的能耗,从而切入数据中心市场。2020 年 3 月,正式发布 Ampere Altra 处理器,它是基于 ARM Neoverse N1架构的 SoC,提供 80 个 64 位 core,频率为 2.8GHz,采用 7nm 制程工艺。2021 年 5 月,Ampere 践行每年一款新品的承诺,发布了 128 核的 Ampere AltraMax 处理器。2021 年 8 月,Ampere 宣布收购了 AI 技术初创公司 OnSpecta,并重磅推出了 Ampere AI 和 AIO,加速 AI 服务部署。2023 年 5 月,Ampere 宣布推出全新 AmpereOne 系列处理器,该处理器拥有多达 192 个单线程 Ampere 核,内核数量为业界最高。这是第一款基于 Ampere自研核的产品,由 Ampere 自有 IP 全新打造。
鲲鹏
鲲鹏处理器是华为在 2019 年 1 月向业界发布的高性能数据中心处理器。低功耗级鲲鹏 916 处理器:采用 16nm 工艺,支持 24 个内核,主频 2.4GHz,功耗低至 75w。极致效能级鲲鹏 920-3226 和鲲鹏 920-4826 处理器:采用 7nm 工艺,支持32 和 48 个内核,主频 2.6GHz,单位功耗的计算性能表现优秀。极致性能级鲲鹏 920-6426 处理器:采用 7nm 工艺,支持 64 个内核,主频2.6GHz。
在其六大技术生态中,鲲鹏计算生态就是围绕鲲鹏 CPU 而构建的计算产业生态,在这一生态体系中,华为基于鲲鹏 920 处理器推出了 Taishan 服务器,并发布了 openEuler 操作系统、openGauss 数据库鲲鹏应用使能套件 Kunpeng BoostKit 和鲲鹏开发套件 Kunpeng DevKit,面向各行各业提供解决方案。围绕鲲鹏 CPU,华为已经构建起了包括 PC、服务器、存储设备、操作系统、中间件、虚拟化、数据库、云服务、行业应用在内的全栈 IT 基础设施、行业应用及服务。
飞腾
另一家采用 Arm 架构的国产 CPU 玩家飞腾,由中国电子信息产业集团、天津市滨海新区政府和天津先进技术研究院于 2014 年联合成立。2020 年以来,飞腾对高性能服务器 CPU、高效能桌面 CPU、高端嵌入式 CPU三条产业线进行了全面的品牌升级。高性能服务器 CPU 产品线统一以飞腾腾云 S 系列进行命名,高性能桌面 CPU产品线以飞腾腾锐 D 系列进行命名,高端嵌入式 CPU 产品线统一以飞腾腾珑 E系列进行命名。其 2020 年发布的腾云系列新一代可扩展多路服务器芯片腾云 S2500 与 FT2000+相比性能大幅提升。在整机性能方面,双路的 SPECint 分值为原来的 2 倍,四路的 SPECint 值为原来的 3.5 倍;在分布式数据库性能方面,双路服务器的tpmc 值线性提升至原来的 2 倍,四路的 tpmc 值线性提升至原来的 4 倍;在云桌面支持方面,双路服务器支持虚拟机 70 个,是原来的 2.5 倍,四路服务器支持140 个,是原来的 5 倍。
飞腾是 PKS 体系领导者。PKS 体系最早由飞腾 CPU(Phytium)和麒麟操作系统(Kylin)组成的“PK 体系”发展而来。依托飞腾全新的硬件级安全机制,以相关可信技术为支撑,PK 体系融合“S-Security”的立体防护安全链,升级为PKS 体系,并全球首创将“可信计算 3.0”技术融入到 CPU、操作系统和存储控制器中,实现底层构架的本质安全,并成为国内首个计算机软硬件基础体系标准。对比鲲鹏与飞腾的生态构建,可以发现,鲲鹏技术路线比 PKS 路线有较明显的技术和产品优势,PKS 技术路线比鲲鹏技术路线有较明显的安全优势。
海光信息
海光信息成立于 2014 年,主营产品包括 CPU 和 DPU(属于 GPGPU),营收规模和增速都位居国产 CPU 企业的前排。由于 x86 架构在服务器 CPU 的市占率超 9成,海光信息 CPU 兼容 x86 指令集,使得其具备较高的应用兼容性、较低的迁移成本,有望受益于 x86 完备的生态体系。该公司在 2021 年实现首次盈利,背靠中科曙光、AMD 两家巨头。国产高性能计算龙头企业中科曙光,是海光信息的第一大股东,也是海光信息的优质客户源。曙光服务器中应用海光产品的比例超过 30%,为海光芯片的放量打下了深厚基础。
海光信息的 x86 授权来自全球第二大 x86 处理器供应商 AMD 公司。2016 年,AMD 和海光信息合资成立了成都海光微电子技术有限公司和成都海光集成电路设计有限公司,授权海光微电子 x86 指令集和 Zen 架构,AMD 获得 2.93 亿美元的授权费。海光集成电路购买海光微电子的 IP 授权,以此为基础开发 CPU。海光集成电路与海光微电子的股权结构保证了公司在规避了英特尔的 x86 授权限制的同时,又使得海光 x86 CPU 成为内资公司开发的产品,满足了国家产业政策和创新的需求。其产品基于 AMD Zen1 架构,产品性能起点较高。对比英特尔在 2020 年(与海光 7285 同期)发布的 6 款至强铂金系列产品(能够反映英特尔 2020 年发布的主流 CPU 产品的性能),在典型场景下,海光 7285 已接近国际同类高端产品水平。
兆芯:
合资 CPU 的探路者,掌握三大核心技术,兆芯于 2013 年由台湾威盛与隶属于上海市国资委的上海联和投资公司所合资成立,威盛持股 20%,上海国资委持股 80%,总部位于上海张江,在北京、西安、济南等地设有子公司。威盛与英特尔交叉授权协议,拥有设计、生产 x86 芯片权利,技术授权来自威盛。 2020 年 10 月 26 日,威盛作价 2.57 亿美元将部分 x86 技术出售给兆芯,兆芯拥有了部分 x86 技术产权。目前兆芯同时掌握中央处理器、图形处理器、芯片组三大核心技术,具备相关 IP 自主设计研发的能力,已成功研发并量产多款通用处理器产品,形成 PC/嵌入式处理器“开先”、服务器处理器“开胜”、IO 拓展芯片/芯片组三大产品系列,产品性能不断提升,达到国际主流同等水平。其中,兆芯开先 KX-6000 系列处理器是国内率先实现主频 3.0GHz 关键突破的国产通用处理器。
龙芯中科:
龙芯中科是中国科学院计算所自主研发的通用 CPU,采用自主 LoongISA 指令系统,兼容 MIPS 指令,所有 IP 模块皆为自主设计,拥有片内安全机制、可信性高。龙芯处理器以 32 位和 64 位单核及多核 CPU/SoC 为主,主要面向高端嵌入式、个人电脑、服务器和高性能机等应用。2002 年 8 月诞生的“龙芯一号”是我国首枚拥有自主知识产权的通用高性能微处理芯片。龙芯中科从 2001 年至今共开发了 1 号、2 号、3 号三个系列处理器和龙芯桥片系列,在政企、安全、金融、能源等应用场景得到了广泛应用。其产品体系分为三大系列,龙芯 1 号系列为低功耗、低成本的专用嵌入式SoC 或 MCU 处理器,主要根据需求定制;龙芯 2 号系列为低功耗通用处理器,采用单芯片 SoC 设计,应用场景面向工业控制与终端等领域,定位可类比英特尔的凌动系列;龙芯 3 号系列为高性能通用处理器,通常集成 4 个及以上的 64 位高性能处理器核,与桥片配套使用,应用场景面向桌面和服务器等信息化领域,对标英特尔的酷睿/至强系列。
龙芯中科自主研发的 LoongArch,具有较强的扩展性和自主性。LoongArch包括基础架构部分和向量指令、虚拟化、二进制翻译等扩展部分近 2000 条指令,具有较好的扩展性。LoongArch 指令系统从整个架构的顶层规划,到各部分的功能定义,再到每条指令的编码、名称、含义,都进行了自主设计,具有充分的自主可靠性。此外,LoongArch 充分考虑兼容需求,在定义时充分考虑了 MIPS、x86、Arm、RISC-V 等主要指令系统的特征,摒弃了传统指令系统中部分不适应当前软硬件设计技术发展趋势的陈旧内容,吸纳了近年来指令系统设计领域诸多先进的技术发展成果。同原有兼容指令系统相比,LoongArch 不仅在硬件方面更易于高性能、低功耗设计,而且在软件方面更易于编译优化和操作系统、虚拟机的开发。
目前,龙芯中科已经发布了多款服务器CPU,包括龙芯3C5000、龙芯3D5000和即将发布的龙芯3C6000等。这些处理器均采用多核设计,能够满足通用计算、大型数据中心和云计算中心的计算需求。
申威
成都申威成立于 2016 年,依托国家信息安全发展战略,主要从事对申威处理器的产业化推广。申威处理器以 Alpha 指令集为基础进行拓展,高度自主可控。Alpha 指令集由美国 DEC 公司研制,主要用于 64 位的 RISC 微处理器。DEC 公司后被美国惠普收购,无锡江南计算所购买了 Alpha 指令集的所有设计资料。江南计算所基于原来的 Alpha 指令集,开发出了更多的自主知识产权的指令集,并研制了申威指令系统,推出了申威处理器。
申威处理器是在国家“核高基”重大专项支持下,由上海高性能集成电路中心研制的全国产处理器。首颗申威处理器代号“SW-1”,于 2006 年研制成功,基于 DEC 公司 Alpha 架构,采用 130nm 制程,主频为 900MHz。出于安全性能以及知识产权角度,申威在研发出第一代基于 Alpha 指令集的CPU后,将指令集替换为自研的自主可控申威64位指令集,完全区别于原有Alpha指令集。申威处理器专注于高性能计算,尤其是在服务器领域,浮点运算算力与同期外国处理器相当。申威 SW26010 是中国首个采用国产自研架构且性能强大的计算机芯片。