详细了解AMD的新型EpycRome7nm服务器CPU

2022-08-06 07:20:00戴发逸
导读 当 AMD 推出7nm 锐龙3000 系列台式机 CPU 时,他们席卷了整个领域。几十年来,AMD 第一次能够在所有主要 CPU 标准(单线程性能、多

当 AMD 推出7nm 锐龙3000 系列台式机 CPU 时,他们席卷了整个领域。几十年来,AMD 第一次能够在所有主要 CPU 标准(单线程性能、多线程性能、功率/热效率和价格)的所有产品线中达到或击败其竞争对手英特尔。一旦第三方结果证实AMD 出色的基准测试和零售交付是成功的,剩下的一个大问题是:该公司能否将其 7nm 成功故事扩展到移动和服务器 CPU?

昨天,AMD 正式推出了新的 Epyc 7002 “Rome”系列 CPU 产品线——它似乎已经相当彻底地回答了服务器一半的问题。从 Ryzen 3000 发布时在其内部生成的基准测试中广泛使用的 FUD 中了解到,这一次 AMD 确定在发布之前就为一些评测网站提供评估硬件。

故事的简短版本是,Epyc“Rome”之于服务器就像 Ryzen 3000 之于台式机——与当前的英特尔同类产品或第一代 Epyc 相比,它带来了显着改进的 IPC、更多内核和更好的热效率前辈。

表现

Rome 为每个插槽提供的 CPU 线程比英特尔的至强可扩展 CPU 多得多。它还支持更高的 DDR4 时钟速率并提供 128 个 PCIe 4.0 通道,每个通道的带宽是 PCIe 3.0 通道的两倍。这在大型数据中心环境中变得越来越重要,与原始 CPU 火力相比,大型数据中心环境经常会成为数据摄取的瓶颈。Rome 还显着改进了 Epyc 的原始 NUMA 设计,提高了效率并消除了多插槽配置中的潜在瓶颈。

虽然 Rome 在原始硬件时钟频率或单线程性能方面仍然无法击败最高端的 Xeon 部件,但它比第一代 Epyc 更接近。这主要是由于大量架构改进,如下面的 AMD 发布日幻灯片所示,每个硬件时钟周期 (IPC) 执行的指令累计增加大约 15%。

Ars 没有收到此次产品发布的硬件审查单位。因此,以下性能分析依赖于 著名的以 Linux 为重点的测试、评论和新闻网站Phoronix的 Michael Larabel 慷慨提供的Rome 基准 数据。我们将主要关注使用 Rome 的 64 核/128 线程 Epyc 7742 和 32C/64T Epyc 7502 的双路构建,与英特尔 28C/56T Xeon Platinum 8280 和 20C/40T Xeon Gold 6138 的双路构建.

在 PHPBench 和 PyBench 等单线程基准测试中,很容易看出 AMD 所承诺的 15% 的 IPC 增长以及它们的单线程性能与英特尔之间的差距正在缩小。尽管 Epyc Rome 在这里仍然输给了 Xeon Scalable,但性能增量已经从大约 50% 缩小到 20%。Xeon Scalable 在 MKL-DNN 视频编码测试中也名列前茅——这不足为奇,因为 MKL-DNN 是由英特尔开发人员编写的软件包,利用他们的 Math Kernel Library for Deep Neural Networks。

虽然很容易抱怨英特尔 CPU 在 MKL-DNN 基准测试中具有不公平的优势,但它代表了英特尔享有的那种根深蒂固的优势——而且这是一个真正的优势。工作量很大的 MKL-DNN 的人不太可能关心什么是公平的,什么是不公平的。

在供应商中立和多线程友好的工作负载(如 x265 视频和 OpenSSL)上,罗马 CPU 的性能全面优于至强。数据中心在设计上是出了名的保守,并且比小型企业或最终用户更能抵抗供应商购物——但是当英特尔的单线程性能差距减少一半时,更难忽视 AMD 越来越大的多线程性能优势。

免责声明:本文由用户上传,如有侵权请联系删除!