只要世界各地的企业以及也消耗大量服务器的政府和教育机构拥有不易移植到 Arm 或 RISC 的 X86 应用程序,最大的云将始终必须从 Intel 或 AMD 购买 X86 处理器-V 架构。
但正如 AWS 以其自主研发的 Graviton Arm 处理器所恰当地证明的那样,超大规模提供商和云构建商并未面向客户提供大量的计算能力,而且越来越多的客户不仅愿意尝试 Arm 处理器,但出于技术和经济原因,谁更喜欢它们。这意味着,经过许多供应商十多年的共同努力,尽管努力并不总是成功,Arm 终于可以在世界数据中心中获得应有的份额。
这正是安培计算早在 2018 年初就创立的理念,经过五年的漫长发展,该公司正在向市场推出基于自己的 Arm 核心设计的超密集芯片,我们将其称为 A1 和其中 192 个芯片被集成到现已发货的“Siryn”AmpereOne 处理器中的单个小芯片中,这是市场多年来一直期待的。
安培计算路线图的增强版本
正如预期的那样,Siryn 计算引擎采用小芯片设计,就像 AWS 的 Graviton3 一样,并且与 Graviton3 一样,Siryn 设计将所有核心放在一个芯片上,并将内存和 I/O 控制器放在环绕的单独芯片上它。Siryn 芯片的核心复合体采用台积电的 5 纳米工艺进行蚀刻,这是一种足够成熟的工艺,能够获得合理的产量,直至 192 个核心。也就是说,Siryn 计算引擎看起来在 160 个核心上有一个最佳点,这是 AmpereComputing 运行的一系列早期比较基准测试的水平。
从架构上来说,AWS 和 Ampere 计算在最长的运行中可能被证明是正确的。
80 核“Quicksilver”Altra 和 128 核“Mystique”Altra Max 处理器涵盖了从 32 核到 128 核的范围——实际上,一个芯片具有 32、64、72 或 80 个核心,另一个芯片具有 96、112 或 96 个核心。 128 个核心。Siryn 计算引擎的核心数量将从 136 个核心扩展到 192 个核心,时钟速度最高可达 3 GHz,与 Altra 和 Altra Max 一样。
这些内存和 I/O 芯片的确切配置也不是,但我们确实知道有些 I/O 芯片与内存芯片是分开的,因此它们可以相互独立地扩展,也可以独立于计算小芯片上的内核进行扩展。最初的 AmpereOne 芯片有 8 个 DDR5 内存通道,每个通道可支持 2 个 DIMM,运行频率为 4.8 GHz,但 Wittich 表示,在不远的将来,它将有一个具有 12 个 DDR 通道的 AmpereOne 变体,从而增加每插槽内存带宽至少 50%。跃升至 5.6 GHz DDR5 内存可能会将每插槽内存带宽提高 1.8 倍,这对某些客户来说可能很重要。DDR5内存时钟频率高达6 GHz甚至7.2 GHz,考虑一下以这种速度运行的 12 个通道对于需要内存带宽的应用程序可能会产生什么作用是很有趣的。每个插槽的内存带宽增加 2.3 倍会非常酷。
Siryn 设计中的 A1 内核混合使用了 ArmV8 和 ArmV9 指令,考虑到芯片的时序,这是有意义的。Siryn 核心是单线程的,遵循 AmpereComputing 的理念,即为其核心提供确定性性能和绝对隔离,并放弃同时多线程来实现这些目标。
每个 A1 内核都有 64 KB 的 L1 数据缓存和相当精简的 16 KB 的 L1 指令缓存。每个 A1 核心都有一个私有 2 MB L2 缓存,其容量是之前 Altra 和 Altra Max CPU 中使用的 Neoverse N1 和 N1+ 核心上的 L2 缓存的两倍。这是 384 MB 的二级缓存,相当强大。Siryn 复合体有一个额外的 64 MB 系统级缓存,正如 Wittich 所说,这并不是真正的 L3 缓存,而是一个挂在内存上的后端缓存。(这可能意味着该内存分布在内存控制器中,正如 IBM 在某些 Power 和 System z 设计中所做的那样。)
以下是 Siryn 核心中的一些其他新功能:
- 内存和 SLC QoS 执行:随着内核网格规模的增大,这一点非常重要。
- 嵌套虚拟化:这是互联网服务提供商的一项要求,他们通常希望将其云服务作为大型云之上的覆盖层来运行,并通过在虚拟机内部放置虚拟机管理程序来增强安全性,正如 Google 所言与它的谷歌云一起做。
- 细粒度电源管理:我们需要越来越多的细粒度电源管理来保持低瓦数。
- 高级下垂检测:判断您是否长时间眨眼阅读本文,而您却没有。
- 过程老化监视器:这个很简洁,是 Wittich 的工程专业。所有硅都会随着时间的推移而老化,芯片的最小电压 (Vmin) 随着时间的推移而上升,并且芯片运行的最大频率 (Fmax) 会受到影响而必须下降。但有一种方法可以给晶体管提供一点鹅汁——比如服用睾酮——这样 Fmax 就能保持不变。
- 安全虚拟化:为多租户环境中的虚拟机提供隔离的机制。
- 单密钥内存加密:对于位于边缘等地方的计算机很重要,在这些地方,企业不一定对服务器有绝对的物理控制。
- 内存标记:长期以来,这一问题一直是客户的一大需求,而且 IBM 的 Power 和 System z 处理器也很早就拥有这一功能。内存标记就像对应用程序内存位置的基于角色的访问,因此您不能通过缓冲区溢出攻击直接攻击主内存。X86 芯片目前还没有标记内存,但如果超大规模厂商和云构建商要求 AmpereComputing 添加它,那么他们就是要求 Intel 和 AMD 添加它。