当前位置:首页 > 厂商动态 > Intel
[导读]阿贡国家实验室和英特尔于近日宣布,Aurora超级计算机的 10,624 个刀片的安装已经完成,该系统将于 2023 年晚些时候上线。该机器使用数万个 Xeon Max“Sapphire Rapids”处理器,配备 HBM2E 内存以及数以万计的数据中心 GPU Max“Ponte Vecchio”计算 GPU 可实现超过 2 FP64 ExaFLOPS 的性能。

阿贡国家实验室和英特尔于近日宣布,Aurora超级计算机的 10,624 个刀片的安装已经完成,该系统将于 2023 年晚些时候上线。该机器使用数万个 Xeon Max“Sapphire Rapids”处理器,配备 HBM2E 内存以及数以万计的数据中心 GPU Max“Ponte Vecchio”计算 GPU 可实现超过 2 FP64 ExaFLOPS 的性能。

这个由HPE 制造的 Aurora 超级计算机由 166 个机架组成,每个机架有 64 个刀片,总共 10,624 个刀片。每个 Aurora 刀片均基于两个 Xeon Max CPU(具有 64 GB 封装 HBM2E 内存)以及六个 Intel Data Center Max“Ponte Vecchio”计算 GPU。这些 CPU 和 GPU 将通过定制的液体冷却系统进行冷却。

(图片来源:英特尔)

Aurora 超级计算机总共配备了 21,248 个通用 CPU,拥有超过 110 万个高性能核心、19.9 PB 的 DDR5 内存、连接到 CPU 的 1.36 PB HBM2E 内存以及 63,744 个专为大规模并行 AI 和 HPC 工作负载而设计的计算 GPU,板载 8.16 PB HBM2E 内存。这些刀片使用专为超级计算机设计的 HPE Slingshot 结构进行互连。

英特尔公司副总裁兼超级计算事业部总经理 Jeff McVeigh 表示:“Aurora 是英特尔 Max 系列 GPU 的首次部署、最大的基于 Xeon Max CPU 的系统以及全球最大的 GPU 集群。” “我们很自豪能够成为这个历史性系统的一部分,并对 Aurora 将实现的突破性人工智能、科学和工程感到兴奋。”

Aurora超级计算机采用由1024个固态存储设备组成的存储节点阵列,提供220PB的容量以及31TB/s的总带宽,这将有助于处理涉及海量数据集的工作负载,例如核聚变研究、科学工程、物理模拟、治疗研究、天气预报和其他任务。

(图片来源:阿贡国家实验室)

虽然 Aurora 刀片的安装已经完成,但超级计算机尚未通过验收测试。当它在今年晚些时候上线时,它有望达到超过 2 ExaFLOPS 的理论峰值性能,使其成为进入 Top500 列表时第一台达到这一性能水平的超级计算机。

阿贡国家实验室副实验室主任 Rick Stevens 表示:“在我们努力进行验收测试的同时,我们将使用 Aurora 来训练一些大规模的开源生成人工智能模型用于科学。” “Aurora 拥有超过 60,000 个 Intel Max GPU、非常快的 I/O 系统和全固态大容量存储系统,是训练这些模型的完美环境。”

(图片来源:阿贡国家实验室)

虽然 Aurora 超级计算机尚未通过测试,ANL 尚未向 Top500.org 提交其性能结果,但英特尔借此机会分享了其硬件相对于 AMD 和 Nvidia 的竞争解决方案的性能优势。

据英特尔称,Max 系列 GPU 的初步测试表明,它们在“现实世界的科学和工程工作负载”方面表现出色,在 OpenMC 上提供的性能是 AMD Instinct MI250X GPU 的两倍,并且几乎可以完美地跨数百个节点进行扩展。此外,英特尔表示,其英特尔至强 Max 系列 CPU 在众多实际 HPC 应用中比竞争对手的性能优势高出 40%,这些应用包括 HPCG、NEMO-GYRE、Anerlastic Wave Propagation、BlackScholes 和 OpenFOAM。

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

双方的合作促成了尖端人工智能视觉解决方案,提高了效率、连通性和成本效益

关键字: 人工智能 智能家居 机器学习

北京——2024年4月25日 我们的客户选择亚马逊云科技运行他们的关键应用程序和最敏感的数据。每天,世界上发展最快的初创公司、最大的企业和最值得信赖的政府机构都选择亚马逊云科技作为技术基础设施平台。他们之所以选择亚马逊云...

关键字: GPU 计算 生成式AI

轻量级AI定制模型助力低成本快速部署 北京2024年4月18日 /美通社/ -- 数据和人工智能(AI)领域的领先者SAS—今日在SAS Innovate大会上首次展示了一款变革性的、旨在帮助企业直面业务挑战的解决方案...

关键字: SAS AI模型 人工智能 INNOVATE

据报道,日本电信巨头软银集团将在未来两年投资1500亿日元(9.6亿美元)升级其计算设施,该计划包括大量采购英伟达GPU。

关键字: 软银 英伟达 GPU AI

四月的上海,生机盎然繁花盛开。备受瞩目的“CHINAPLAS 2024 国际橡塑展”今日拉开帷幕,将一连四天(4月23 - 26日)在国家会展中心(上海)盛装绽放。展会规模空前,展商数量历史性地攀升至4,420家,相比2...

关键字: 新能源汽车 锂电技术 人工智能

创新打造云生态,共创智慧新未来

关键字: 人工智能 云实验室

4月24日消息,特斯拉CEO马斯克在最近的财报电话会议上透露,特斯拉的Optimus人形机器人预计将在今年底前具备执行“有用的”工厂任务的能力,并有望在2025年底前推向市场。这一消息引发了业界和公众的广泛关注。

关键字: 马斯克 AI 特斯拉 GPU

眼下,人工智能不仅能辅助科学研究与艺术创作,还能实现自动驾驶、打造“无人农场”和“黑灯工厂”,成为解锁新质生产力的关键钥匙。

关键字: 人工智能 AI 无人农场

随着科技的飞速发展,人工智能已经逐渐走进我们的生活。从智能手机到自动驾驶汽车,人工智能正不断改变着我们的日常体验。然而,这只是科技革命的一个起点。

关键字: 人工智能 AI 自动驾驶
关闭