当前位置:首页 > 厂商动态 > 美光
[导读]美光与AMD联手为客户及数据中心平台提供一流的用户体验。双方在奥斯汀建立联合服务器实验室,以减少服务器内存验证时间,在产品验证和发布期间共同进行工作负载测试。目前美光适用于数据中心的 DDR5 内存和第四代 AMD EPYCTMTM (霄龙)处理器均已出货,我们对其进行了一些常见的高性能计算(HPC)工作负载基准测试。

美光与AMD联手为客户及数据中心平台提供一流的用户体验。双方在奥斯汀建立联合服务器实验室,以减少服务器内存验证时间,在产品验证和发布期间共同进行工作负载测试。目前美光适用于数据中心的 DDR5 内存和第四代 AMD EPYCTMTM(霄龙)处理器均已出货,我们对其进行了一些常见的高性能计算(HPC)工作负载基准测试。

长期以来,超级计算机承担着高性能计算工作负载。此类大规模的数据密集型工作负载需要运行TB 级的数据量以进行数百万个并行操作,以解决人类世界的难题,如天气和气候预测;地震建模;化学、物理和生物分析等。随着计算机架构的进步,此类工作负载往往托管在超大型“可横向扩展”的高性能服务器集群中。这些服务器集群需要集合最强大的算力、架构、内存和存储基础设施,以满足关键工作负载对可扩展性、低延迟和高性能的需求。然而随着服务器 CPU 的性能和吞吐量不断增长,DDR4 无法提供足够的内存带宽,来满足不断增长的高性能内核。

为缓解这一瓶颈,美光 DDR5 内存与采用了Zen 4 服务器架构的第四代AMD EPYC 处理器强强联合,使服务器 CPU 能够更好地匹配内存产品,满足数据密集型工作负载对性能和效率的需求。美光DDR5 内存可帮助企业从本地和云端数据中更快获取洞察。我们对最新的 AMD Zen 4 96 核CPU和美光DDR5进行了行业内高性能计算工作负载基准测试,所有结果均显示性能提升了两倍。

美光DDR5 搭配第四代 AMD EPYC 处理器,在STREAM 测试中实现内存带宽翻倍STREAM1是常见的基准测试工具,用于测量高性能计算机的内存带宽,可捕获高性能计算系统的峰值内存带宽。该工作负载使用的软件堆栈

Alma 9 Linux kernel 5.14

STREAM.f,2021 年 11 月 29 日发布版本

测试设置

DDR4 系统搭配第三代 64 核3.7 GHz AMD EPYC 处理器;DDR4 3200 MHz 系统2的 RDIMM 内存槽插满,共 64GB

DDR5 系统搭配第四代96 核3.7 GHz AMD EPYC 处理器;DDR5 4800 MHz 系统3的 RDIMM 内存槽插满,共 64GB

测试结果

DDR5 系统每插槽内存带宽翻倍,达到 378 GB/s

该结果意味着客户能运行更大规模的人工智能/机器学习(AI/ML)项目,或利用 DDR5 增加的内存带宽进行更多高性能计算。

美光 DDR5,助力天气研究和预报(WRF)4速度提升2倍此次测试使用的高性能计算工作负载代码针对天气和气候。WRF模型在一些支持高性能浮点处理、高内存带宽、低延迟网络等传统高性能计算架构中表现良好,测试对象为横向分辨率为 2.5 公里的美国大陆地区(CONUS)。该工作负载使用的软件堆栈

Alma 9 Linux kernel 5.14

WRF 2.3.5 & 4.3.3

Open MPI v4.1.1

测试设置

DDR4 系统搭配第三代64 核3.7 GHz AMD EPYC 处理器;DDR4 3200 MHz 系统2的 RDIMM 内存槽插满,共 64GB

DDR5 系统搭配第四代 96 核3.7 GHz AMD EPYC 处理器;DDR5 4800 MHz 系统3的 RDIMM 内存槽插满,共 64GB

测试结果

美光 DDR5 搭配第四代 AMD EPYC 处理器,可实现 1.3567 时间步/秒 VS DDR4 系统的2.8533 时间步/秒

速度更快意味着可使用更大的数据库或运行更多模型以进行天气预测,进而改善预测的准确度。

美光 DDR5,助力OpenFOAM5速度提升2倍OpenFOAM是一种计算流体动力学(CFD)的开源高性能计算工作负载,广泛应用于多个行业,有助于缩短开发时间并降低成本。从消费类产品设计到航空航天设计,OpenFOAM能够模拟不同应用中的物理互动,包括摩托车风挡湍流。在该模拟中,OpenFOAM能够计算摩托车和骑手周围的稳定气流。OpenFOAM能够根据用户指定的进程数进行负载均衡计算,以此将网格分解成多个部分并分配给不同的进程求解。求解完成后,再将网格和解重新组合为单个域。

该工作负载使用的软件堆栈

OpenFOAM CFD 软件(版本8),其中摩托车网格尺寸为:600 x 240 x 240

Alma 9 Linux kernel 5.14

Open MPI v4.1.1

测试设置

DDR4 系统搭配第三代64 核3.7 GHz AMD EPYC 处理器;DDR4 3200 MHz 系统2的 RDIMM 内存槽插满,共 64GB

DDR5 系统搭配第四代 96 核3.7 GHz AMD EPYC 处理器;DDR5 4800 MHz 系统3的 RDIMM 内存槽插满,共 64GB

测试结果

测试结果表明美光DDR5 产品组合将OpenFOAM性能提高了 2.4 倍。OpenFOAM为五大高性能计算软件平台之一,拥有大型开源社区。该软件广泛应用于大学和研发中心,可利用高带宽内存和拥有密集内核的高性能CPU,实现高度的并行操作。美光 DDR5 ,助力分子动力学6速度提升2倍CP2K 是一款开源量子化学工具,适用于许多应用,包括固态生物系统模拟。CP2K 能够为不同的建模方法提供通用的框架。此次测试对象为水(H2O)的密度泛函理论(DFT),模拟盒子中共包含 6,144 个原子(2,048 个水分子)。该工作负载使用的软件堆栈

H2O-DFT-LS.NREP4 及 H2O-DFT-LS

Alma 9 Linux kernel 5.14

测试设置

DDR4 系统搭配第三代64 核3.7 GHz AMD EPYC 处理器;DDR4 3200 MHz 系统2的 RDIMM 内存槽插满,共 64GB

DDR5 系统搭配第四代 96 核3.7 GHz AMD EPYC 处理器;DDR5 4800 MHz 系统3的 RDIMM 内存槽插满,共 64GB

测试结果测试结果表明美光DDR5 产品组合将分子动力学性能提高了2.1 倍。随着内核数和内存带宽增加,此类工作负载的性能也显著提升。总结目前我们只针对少量高性能计算工作负载进行了测试,因此以上只是我们的初步成果。将高性能高带宽内存与最新的服务器处理器(如第四代 AMD EPYC 处理器)相结合,可为高性能计算客户创造新的可能。我们期待更多企业数据中心和云服务商,能够在新平台上应用美光 DDR5 产品,解锁更高的性能与能效。

________________________

1 我们在 STREAM 基准测试中配置了 25 亿个向量的STREAM Benchmark——运行在一台单 AMD CPU 系统上2 AMD DDR4 系统为一台 64 核 AMD EPYC 7763处理器, DDR4-3200 MHz 的RDIMM 内存槽插满,共 64GB3 AMD DDR5 系统为一台96 核AMD EPYC 9654处理器, DDR5-4800 MHz 的RDIMM 内存槽插满,共 64GB4 横向分辨率为12.5 公里CONUS 的 WRF 在 DDR4 系统上的运行时间为 929 秒,在 DDR5 系统上的运行时间为 287 秒(均包括存储器的输入/输出时间)。该测试中 WRF 配置为 2.5 公里 CONUS,测试结果为1.3567 时间步/ 秒,相比之下DDR4 的运行时间为2.8533时间步/秒。5 针对OpenFOAM,我们运行了三种变体:5a:1004040 runtimes,DDR4 系统运行时间为 1,144 秒,DDR5 系统运行时间为 478 秒5b:1084646 runtimes,DDR4 系统运行时间为 1,633 秒,DDR5 系统运行时间为 698 秒5c:1305252 runtimes,DDR4 系统运行时间为 2,522秒,DDR5 系统运行时间为 1,091 秒6分子动力学工作负载在 DDR4 系统上的运行时间为 2,519 秒,在 DDR5 系统上的运行时间为 1,242 秒

作者:

Krishna Yalamanchi

Krishna 担任美光生态系统高级开发经理,专注于研发 DDR5 和 CXL 解决方案。他曾在英特尔 IT 部门任职,领导 SAP HANA 的迁移工作,通过与SI、OEM和云服务提供商共同搭建的合作伙伴生态系统,推出了用于SAP工作负载的第三代与第四代 Intel Xeon 处理器。

SudharshanVazhkudai

Sudharshan S. Vazhkudai博士担任美光系统架构和工作负载分析总监。他领导一支位于奥斯汀和印度海得拉巴的团队,致力于研究内存和存储(DDR、CXL、HBM 和 NVME)产品中层次结构的可组合性,并优化与数据中心工作负载相关的系统架构。


本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

LED驱动电源的输入包括高压工频交流(即市电)、低压直流、高压直流、低压高频交流(如电子变压器的输出)等。

关键字: 驱动电源

在工业自动化蓬勃发展的当下,工业电机作为核心动力设备,其驱动电源的性能直接关系到整个系统的稳定性和可靠性。其中,反电动势抑制与过流保护是驱动电源设计中至关重要的两个环节,集成化方案的设计成为提升电机驱动性能的关键。

关键字: 工业电机 驱动电源

LED 驱动电源作为 LED 照明系统的 “心脏”,其稳定性直接决定了整个照明设备的使用寿命。然而,在实际应用中,LED 驱动电源易损坏的问题却十分常见,不仅增加了维护成本,还影响了用户体验。要解决这一问题,需从设计、生...

关键字: 驱动电源 照明系统 散热

根据LED驱动电源的公式,电感内电流波动大小和电感值成反比,输出纹波和输出电容值成反比。所以加大电感值和输出电容值可以减小纹波。

关键字: LED 设计 驱动电源

电动汽车(EV)作为新能源汽车的重要代表,正逐渐成为全球汽车产业的重要发展方向。电动汽车的核心技术之一是电机驱动控制系统,而绝缘栅双极型晶体管(IGBT)作为电机驱动系统中的关键元件,其性能直接影响到电动汽车的动力性能和...

关键字: 电动汽车 新能源 驱动电源

在现代城市建设中,街道及停车场照明作为基础设施的重要组成部分,其质量和效率直接关系到城市的公共安全、居民生活质量和能源利用效率。随着科技的进步,高亮度白光发光二极管(LED)因其独特的优势逐渐取代传统光源,成为大功率区域...

关键字: 发光二极管 驱动电源 LED

LED通用照明设计工程师会遇到许多挑战,如功率密度、功率因数校正(PFC)、空间受限和可靠性等。

关键字: LED 驱动电源 功率因数校正

在LED照明技术日益普及的今天,LED驱动电源的电磁干扰(EMI)问题成为了一个不可忽视的挑战。电磁干扰不仅会影响LED灯具的正常工作,还可能对周围电子设备造成不利影响,甚至引发系统故障。因此,采取有效的硬件措施来解决L...

关键字: LED照明技术 电磁干扰 驱动电源

开关电源具有效率高的特性,而且开关电源的变压器体积比串联稳压型电源的要小得多,电源电路比较整洁,整机重量也有所下降,所以,现在的LED驱动电源

关键字: LED 驱动电源 开关电源

LED驱动电源是把电源供应转换为特定的电压电流以驱动LED发光的电压转换器,通常情况下:LED驱动电源的输入包括高压工频交流(即市电)、低压直流、高压直流、低压高频交流(如电子变压器的输出)等。

关键字: LED 隧道灯 驱动电源
关闭