当前位置:首页 > 厂商动态 > Arm
[导读]在近期的 COMPUTEX 大会上,Supermicro 宣布推出全新服务器产品,旨在满足智能体人工智能 (Agentic AI) 时代快速增长的计算需求。该系统搭载 Arm 三月底推出的 Arm AGI CPU,能够为新一代 AI 推理及智能体工作负载提供业界领先的计算密度与能效。

在近期的 COMPUTEX 大会上,Supermicro 宣布推出全新服务器产品,旨在满足智能体人工智能 (Agentic AI) 时代快速增长的计算需求。该系统搭载 Arm 三月底推出的 Arm AGI CPU,能够为新一代 AI 推理及智能体工作负载提供业界领先的计算密度与能效。

AI 基础设施正迈入推理时代

自 2022 年底 ChatGPT 问世以来,业界对 AI 基础设施的讨论主要围绕 GPU 展开。过去几年,数据中心的扩张也主要由大规模模型训练所需的加速算力部署所驱动。然而,AI 技术格局正在快速演进。与主要聚焦于模型训练的第一阶段 AI 部署不同,智能体 AI 工作负载呈现出持续性、分布式和推理驱动的特点,这类工作负载要求系统能够大规模处理编排、检索、推理和实时决策。

这一转变正推动基础设施的新需求,其中高效的 CPU 计算在最大化整体 AI 系统性能方面发挥着基础性作用。随着工作负载从训练转向推理,并日益迈向自主化、多步骤的智能体 AI 系统,CPU 正成为现代 AI 基础设施的关键组成部分。

智能体 AI 带来了一种全新的计算特征。与传统的聊天机器人式交互不同,智能体系统可跨多个服务与模型,持续完成推理编排、内存访问、信息检索、任务规划与协同交互。这些工作流对高效通用计算、内存带宽以及 I/O 可扩展性产生了巨大需求,并需要与 GPU 加速协同配合。

为应对这一转变,Arm 推出了 Arm AGI CPU。该处理器基于多达 136 个 Arm Neoverse V3 核心打造,配备最高速率达 8,800 MT/s 的 12 通道 DDR5 内存以及 PCIe Gen6 连接,并在 300W 功耗范围内实现高性能设计,旨在为以 AI 优先的数据中心提供卓越的计算密度与能效。Arm 测算数据显示,凭借出众的单核性能、高核心密度、出色的单核内存带宽以及行业领先的能效水平,Arm AGI CPU 可实现单机架性能达到同级别 x86 平台的两倍以上。

专为下一代 AI 工作负载打造的基础设施

Supermicro 的新一代服务器及机架级产品组合,将 Arm AGI CPU 的能力进一步落地,覆盖云、企业及边缘等多元部署场景。

ARS-142TP-QNR-LCC

其中,面向超大规模、新型云 (neocloud) AI 基础设施,Supermicro 发布了液冷 Open Rack Wide (ORW) 平台——ARS-142TP-QNR-LCC。一台满配的 ORW 机架可支持多达 336 颗 Arm AGI CPU,为云规模的智能体 AI 和推理工作负载提供极高的计算密度。

ARS-242TP-QNR-LCC

而针对采用 Open Rack V3 (ORV3) 环境的客户,Supermicro 推出了液冷 2U4N ORV3 服务器——ARS-242TP-QNR-LCC,每机架可支持多达 168 颗 Arm AGI CPU,同时保障现代数据中心的部署灵活性。ORW 和 ORV3 系统预计将于 2027 年第一季度提供样品,2027 年第二季度实现量产。

ARS-212HE-FNR

除液冷解决方案外,Supermicro 还将 Arm AGI CPU 的支持扩展至风冷环境。针对功耗和空间受限的边缘部署场景,单插槽 ARS-212HE-FNR 短深度服务器为分布式 AI 推理和边缘计算应用提供了优化的平台。该系统预计于 2026 年第四季度提供样品,并于 2027 年第一季度实现量产。

面向通用计算工作负载,双插槽 2U ARS-222H-NR 服务器在标准 19 英寸外形规格下,支持最高八块 NVMe 硬盘和额外的加速器扩展。该系统广泛适用于各类数据中心工作负载,包括 Web 与应用服务、数据库与分析、虚拟化和云基础设施,以及媒体和内容处理等应用场景。

ARS-522GP-NR

与此同时,5U ARS-522GP-NR 平台面向高性能 AI 推理部署场景,支持多达八张加速卡,并配备双路 Arm AGI CPU 和高密度 NVMe 存储。这些平台预计于 2026 年第三季度提供样品,并于 2027 年第一季度实现量产。

这些平台的推出凸显了一个重要的行业转变:AI 基础设施的未来将不再仅由 GPU 性能定义。随着智能体 AI 在企业及云服务提供商中的规模化应用,融合高性能 CPU、加速器、内存带宽和高效系统设计的均衡架构将变得至关重要。

与此同时,能效和数据中心可扩展性正变得日益关键。随着企业在云、本地企业机房和边缘环境中广泛部署 AI,基础设施必须在实现更高计算密度的同时,避免功耗与散热需求无节制的攀升。而这正是基于 Arm AGI CPU 打造的平台所具备的显著优势:在提供可扩展的 AI 算力的同时,提升每瓦性能。

凭借基于 Arm AGI CPU 打造的一系列解决方案,Supermicro 正在助力客户构建适配智能体计算实际场景、深度优化的 AI 基础设施,覆盖从超大规模推理集群,到企业机房及边缘部署的广泛场景。随着行业向能够自主推理、协作与执行的 AI 系统迈进,高效 CPU 计算与加速型 AI 基础设施的结合,将成为下一代数据中心的基石。

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除( 邮箱:macysun@21ic.com )。
换一批
延伸阅读

泰瑞达的UltraFLEXplus平台搭配东京电子的探针技术,为先进2.5D/3D封装产品提供高效的已知合格芯片筛选解决方案。

关键字: 探针 AI 数据中心

Jun. 17, 2026 ---- 根据TrendForce集邦咨询最新MLCC产业研究,随着全球云端服务供应商(CSP)AI军备竞赛持续升温,自研ASIC加速器平台大量采用小尺寸、高容值、耐高温的高端特规MLCC,需...

关键字: ASIC加速器 钽电容 AI

(2026年6月16日,西安)2026年6月16-17日,以“纵横智绘·万象共生”为主题的“2026浩辰软件产品创新峰会”在西安举办。浩辰软件首次系统性发布AI战略与产品矩阵,除了优势产品浩辰CAD 2027、浩辰BIM...

关键字: AI 工业软件 CAD

当我们今天谈论RISC-V在中国的发展,从服务器芯片到边缘MCU,从开源社区到工业量产,很难不提到一个名字——兆易创新GD32VF103。作为全球首款量产的基于RISC-V架构的通用32位微控制器,它在2019年发布时就...

关键字: MCU CPU

作为国内应用最广泛的开源物联网实时操作系统,RT-Thread凭借体积小、实时性强、资源占用低的优势,已经成为中小微嵌入式设备开发的首选RTOS。而线程作为RT-Thread中最基础的调度单元,其调度与管理机制直接决定了...

关键字: RT-Thread CPU

在这个项目中,我使用Seeed Studio XIAO ESP32S3 Sense和Xiaozhi固件,制作了一个可穿戴的AI吊坠。该设备将语音交互、摄像头支持、音频播放、RGB灯光以及Wi-Fi连接功能集成于紧凑的可穿...

关键字: RGB Wi-Fi AI ESP32S3

北京2026年6月16日 /美通社/ -- 2026年6月12日,2026 IAI传鉴国际创意节于北京开幕。进入AI时代,技术正在重构内容,本届盛会以"聚势新增长"为主题,探寻不确定性时代中确定的路径,见证不同力量如何汇...

关键字: AI MDASH IP 小红书

广州2026年6月15日 /美通社/ -- 全球瞩目的顶级足球盛事火热开赛,赛场之上,球员们奋力冲刺、灵活转身、全力破门,不断挑战运动极限。而这份追求极致的竞技精神,也和一台好车的内核不谋而合。借着这场全民狂欢,中国汽车...

关键字: 广汽 AC AI IO

——AI时代,组织重构,比技术竞赛更紧迫 北京2026年6月15日 /美通社/ -- 近期,在第28届北京科博会上,IBM咨询大中华区合伙人、战略与转型咨询部总经理董海军发表演讲,就企业当前 AI 转型的现象与困境、背...

关键字: IBM AI BSP AGENT

——循证医学与生成式AI深度融合,重塑临床决策支持新标杆 北京2026年6月15日 /美通社/ -- 6月5日-7日,第20届中国医院院长年会在厦门圆满举行。威科医学公益支持"AI聚力专科业务新效能 赋能学科...

关键字: EXPERT TE AI 智能化
关闭