注册 | 登录 |

为什么英伟达、AWS、阿里都喜欢 Arm 的服务器 CPU?

时间:2023-12-05人气:-


耕耘多年后,基于 Arm 架构的 CPU 在服务器市场迎来了大幅增长,被众多客户喜欢并采用。

超大规模云服务商如亚马逊云服务 ( AWS ) 、阿里巴巴、微软等自研 CPU,都选择和 Arm 合作,这是为什么?

" 答案非常简单,通过和 Arm 合作,他们能够根据自己的用例和基础设施来打造并优化解决方案。"Arm 高级副总裁兼基础设施事业部总经理 Mohamed Awad 在 2023 Arm Tech Symposia 年度技术大会上表示。

与超大规模云服务商同样喜欢 Arm 服务器 CPU 可定制化特性的还有最重要的 AI 芯片提供商之一——英伟达。

在英伟达强大的 GH200 超级芯片中,包含了 72 颗 Arm Neoverse 核心,加上英伟达的 GPU,GH200 的 AI 性能较基于 x86 架构的系统可提升 10 倍。

为了满足更多客户在基础设施建设中的定制化需求,Arm 还有两个重要举措。

为什么首选 Arm Neoverse CPU?

GH200 Grace Hopper 超级芯片平台是英伟达今年 5 月发布的产品,专为处理海量的生成式 AI 任务而设计。拥有 256 个 GH200 超级芯片的 NVIDIA DGX GH200 超级计算机,其 AI 性能提升到了惊人的 Exaflop(每秒一百万万亿次次算)级别。

如此强大的 AI 性能,关键在于系统架构的变革。

基础设施领域的传统系统架构

传统的服务器系统架构,内存通过 PCIe,连接一个通用现成的 CPU(也就是 Host CPU),负责管理多个加速器。

" 这种传统架构是过去市场上唯一可用的架构。"Mohamed Awad 指出," 这个架构的问题在于,通用现成的CPU 以及加速器之间的接口直接限制了产品最终的性能水平。因为所有的加速器都必须通过这个通用现成的 CPU 访问额外的内存,无法达到内存的一致性,加速器的性能无法被充分利用,也就无法很好地支持生成式 AI 的需求。"

面向新的应用需求,基础设施领域出现了现代化的系统架构

GH200 超级芯片改变了传统架构,通过 NVLink,让每一个 CPU 都单独和一个加速器相连,实现较强的内存一致性。其中的关键点之一就是可客制化的 CPU,为此,借助这样的架构,英伟达能够充分发挥 GPU 的效率,根据实际场景和用例实现了性能的最大化。

 
" 只有了解最终用例,并且根据使用场景针对性地设计 CPU,才能获得更好的效率,达到产品最佳的表现性能。"Mohamed Awad 进一步表示," 英伟达携手 Arm,借助了 Arm 技术带来的灵活性,设计出他们所需要的芯片以进一步优化系统,同时充分利用 Arm 强大的软件生态系统。"

接下来的问题是,英伟达提出的这种架构会成为生成式 AI 时代的主流吗?

" 现在判断一个 CPU 对一个 GPU 作为加速器是不是未来的主趋势,或唯一趋势,仍为时尚早。"Mohamed Awad 对雷峰网表示," 我们正处于计算加速的时代,在未来的架构当中,不管通过什么方式耦合,任何的通用 CPU 旁边都一定会有一个加速器。Arm 的独特之处在于,能够帮助合作伙伴从头开始、根据所需构建定制化的 CPU,做好 CPU 和加速器之间的连接。"

由于 x86 提供的是标准的 CPU 芯片,所以 GH200 超级芯片平台中 CPU 最佳的选择只有 Arm CPU,这也是 Arm Neoverse 受到欢迎的关键。

也就是说,标准化的 CPU 不能满足基础设施的定制化需求,可定制化成了 Arm 在服务器市场的杀手锏。

可定制化,Arm 在服务器市场的「杀手锏」

今年八月,Arm 推出了 Arm Neoverse 计算子系统 ( CSS ) ,促使 Arm 生态系统通过更低的成本、更少的风险以及更短的时间,打造出专用芯片。

 

Arm CSS 的第一代产品 Arm Neoverse CSS N2 集成了 Neoverse N2 平台,并通过验证配置且优化了功耗、性能与面积 ( PPA ) 。

" 通过 Neoverse CSS 能够帮助我们的合作伙伴进一步降低投资,加速整个生态系统对我们解决方案的可访问性,同时加速合作伙伴产品的上市时间。"Mohamed Awad 表示。

雷峰网了解到,有 Arm 的客户通过使用 Neoverse CSS,节省了长达 80 人 / 年的工程师时间。还有客户用了 Neoverse CSS,项目从概念到流片仅用了 13 个月。

微软近期发布的 Cobalt 100 CPU,也是基于 Neoverse CSS。

"Arm Neoverse 在中国市场,特别是基础设施领域,有很多客户,过去三、四年发展也非常强劲。"Arm 中国区业务全球副总裁邹挺说,"Arm 也积极参与数据中心、云计算等本土的生态、开源软件社区,包括龙蜥社区等,帮助这些社区能更好地融入 Arm 全球生态系统中。"

Mohamed Awad 也强调,中国是 Arm 非常重要的市场之一,中国合作伙伴基于 Arm 架构芯片的总出货量已累计达 300 亿颗,Arm 在中国有近 400 家技术授权客户,这个数字每个月还在不断攀升。

Arm 全球的生态也是满足客户差异化需求的关键所在,在 Neoverse CSS 的基础之上,Arm 推出了全面设计 ( Arm Total Design ) ,进一步结合生态系统的力量,简化定制芯片的开发流程,并且让交付变得更加容易、便捷。

 

Arm 全面设计的推出,让 ASIC 设计公司可以快速启动设计项目,并随时可将其设计方案提供给所需的客户;IP 供应商可以针对 Neoverse CSS,进行预先集成、预先验证和预先优化高级 IP;EDA 合作伙伴可以无缝支持最先进的工具和流程,简化 SoC 设计;商业固件解决方案可早于芯片流片之前便开始开发;与此同时,Neoverse CSS 的设计将经过专门优化,充分发挥领先的工艺节点的优势。

显然,在基础设施追求差异化的时代,Arm Neoverse CSS 和 Arm 全面设计是当下满足差异化需求的最佳选择。

 

还要注意到,Arm 已经转型为一家计算平台公司,如今 Arm 的全面计算解决方案 ( Arm Total Compute Solutions ) 、Arm Neoverse 平台、Arm Corstone 以及 SOAFEE 等计算平台都已经被广泛应用于移动、基础设施、物联网以及汽车等领域。

来源:雷锋网

特别声明:以上内容(如有图片或视频亦包括在内)为本平台用户上传并发布,本平台仅提供信息存储服务。


上篇:VPS性能之实用篇:探索Amazon VPS性能优势,实用场...

下篇:老薛主机完成对九零主机的整合