searchusermenu
  • 发布文章
  • 消息中心
点赞
收藏
评论
分享

ARM Neoverse计算子系统(CSS)

2023-09-11 02:15:18
14
0

    多年来,Arm 一直在朝着将成熟的 CPU 组装在一起以供客户修改并直接推向市场的目标迈进。早在 2000 年代末,当 Arm 接管智能手机时,服务器制造商正在考虑 Arm 架构如何改进基本上处于垄断地位的 X86 架构,服务器芯片设计人员从 Arm 架构许可开始,并开始使用它。这是一种非常昂贵且耗时的创建服务器芯片的方法,尽管比从定制 ISA 开始要好,但由于大量的软件移植工作,世界无法容忍定制 ISA。

 Neoverse 不仅提供了服务器芯片核心的路线图,还提供了参考架构,用于将这些核心转变为适当的 CPU,并混合了其他 Arm 知识产权(例如片上芯片)网状互连和第三方内存、PCI-Express 控制器和以太网控制器。这些 Neoverse 设计是针对台积电的特定工艺节点量身定制的,这使得服务器芯片制造商更容易更快地采取行动。

我们从来不确定 Neoverse 是否比建筑许可证更便宜或更贵。你可以用多种不同的方式来论证它。Neoverse 完成了更多的工作,但与 Arm 架构许可证相比,自由度有限。也许更重要的是,如果 Arm 不能比开源的 RISC-V ISA 和设计更便宜,那么它可以更快。由于客户不耐烦,Arm 无论如何都必须更快。

最新 Neoverse 路线图:

 

Arm 的 CSS 知识产权包旨在加快设计速度,从时间就是金钱的意义上来说,至少可以将金钱转化为节省的时间,正如爱因斯坦所证明的那样,这就是节省的金钱和通过早期销售获得的金钱。(我们假设 CSS 的成本比常规 IP 许可更高,因为它包含更多内容,但风险要低得多,并且成本和风险的乘积(不是总和,而是乘积,因为这些是乘法效应而不是累积效应)因此较低.)

从概念上讲,CSS 包如下所示:

 

“Perseus”N2 核心网格的 CSS 实现可从 24 个核心扩展到 64 个核心,并且可以使用 UCI-Express(而非 CCIX)或专有互连将其中四个核心组合在一个封装中,以扩展到插槽中的 256 个核心。根据客户的需求提供小芯片。

考虑到许多现代处理器将执行预期的 HPC 和 AI 矢量数学,遗憾的是 V2 设计没有 CSS。也许这会发生——我们强烈鼓励这样做,当然也鼓励几年后的未来 V3 设计。目前,Arm 仅在 N2 设计中开始 CSS 工作,就在路线图的中间。

我们期待看到与 CSS N2 包相当的 V 系列和 E 系列。

0条评论
0 / 1000
infrahw
7文章数
0粉丝数
infrahw
7 文章 | 0 粉丝

ARM Neoverse计算子系统(CSS)

2023-09-11 02:15:18
14
0

    多年来,Arm 一直在朝着将成熟的 CPU 组装在一起以供客户修改并直接推向市场的目标迈进。早在 2000 年代末,当 Arm 接管智能手机时,服务器制造商正在考虑 Arm 架构如何改进基本上处于垄断地位的 X86 架构,服务器芯片设计人员从 Arm 架构许可开始,并开始使用它。这是一种非常昂贵且耗时的创建服务器芯片的方法,尽管比从定制 ISA 开始要好,但由于大量的软件移植工作,世界无法容忍定制 ISA。

 Neoverse 不仅提供了服务器芯片核心的路线图,还提供了参考架构,用于将这些核心转变为适当的 CPU,并混合了其他 Arm 知识产权(例如片上芯片)网状互连和第三方内存、PCI-Express 控制器和以太网控制器。这些 Neoverse 设计是针对台积电的特定工艺节点量身定制的,这使得服务器芯片制造商更容易更快地采取行动。

我们从来不确定 Neoverse 是否比建筑许可证更便宜或更贵。你可以用多种不同的方式来论证它。Neoverse 完成了更多的工作,但与 Arm 架构许可证相比,自由度有限。也许更重要的是,如果 Arm 不能比开源的 RISC-V ISA 和设计更便宜,那么它可以更快。由于客户不耐烦,Arm 无论如何都必须更快。

最新 Neoverse 路线图:

 

Arm 的 CSS 知识产权包旨在加快设计速度,从时间就是金钱的意义上来说,至少可以将金钱转化为节省的时间,正如爱因斯坦所证明的那样,这就是节省的金钱和通过早期销售获得的金钱。(我们假设 CSS 的成本比常规 IP 许可更高,因为它包含更多内容,但风险要低得多,并且成本和风险的乘积(不是总和,而是乘积,因为这些是乘法效应而不是累积效应)因此较低.)

从概念上讲,CSS 包如下所示:

 

“Perseus”N2 核心网格的 CSS 实现可从 24 个核心扩展到 64 个核心,并且可以使用 UCI-Express(而非 CCIX)或专有互连将其中四个核心组合在一个封装中,以扩展到插槽中的 256 个核心。根据客户的需求提供小芯片。

考虑到许多现代处理器将执行预期的 HPC 和 AI 矢量数学,遗憾的是 V2 设计没有 CSS。也许这会发生——我们强烈鼓励这样做,当然也鼓励几年后的未来 V3 设计。目前,Arm 仅在 N2 设计中开始 CSS 工作,就在路线图的中间。

我们期待看到与 CSS N2 包相当的 V 系列和 E 系列。

文章来自个人专栏
云服务器硬件基础知识
7 文章 | 1 订阅
0条评论
0 / 1000
请输入你的评论
1
0