当前位置:首页 > 厂商动态 > NVIDIA
[导读]NVIDIA Vera CPU 为大规模数据处理、AI 训练和智能体式推理提供最高性能与能效

新闻摘要:

· NVIDIA Vera CPU 较传统 CPU 在效率上提升 2 倍,速度提升 50%。

· 与 NVIDIA 合作部署 Vera CPU 的客户包括阿里巴巴、字节跳动、Meta、Oracle Cloud Infrastructure、CoreWeave、Lambda、Nebius 和 Nscale。

· 已采用 Vera CPU 的制造商合作伙伴包括戴尔科技、HPE、联想和 Supermicro,以及华硕、Compal、Foxconn、技嘉、Pegatron、Quanta Cloud Technology(QCT)、Wistron 和 Wiwynn。

加利福尼亚州圣何塞 —— GTC —— 太平洋时间 2026 年 3 月 16 日 —— NVIDIA 今日发布 NVIDIA Vera CPU,这是全球首款专为代理式 AI 与强化学习时代打造的处理器,其效率是传统机架级 CPU 的 2 倍,速度提升 50%

随着推理和代理式 AI 的发展,规模、性能和成本越来越取决于支撑模型的基础设施,这些模型负责规划任务、运行工具、与数据交互、运行代码并验证结果。

NVIDIA Vera CPU 基于 NVIDIA Grace™ CPU 的成功经验打造而成,助力各行业、各种规模的组织都能构建 AI 工厂,大规模释放代理式 AI 的潜力。凭借卓越的单线程性能和每核心带宽,Vera 重新定义了 CPU。它能提供更高的 AI 吞吐量、响应速度和效率,从而支持大规模 AI 服务,例如编程助手以及面向消费者和企业的智能体应用。

与 NVIDIA 合作部署 Vera 的头部超大规模企业包括阿里巴巴、CoreWeave、Meta 和 Oracle Cloud Infrastructur,以及戴尔科技、HPE、联想和 Supermicro 等全球系统制造商。这一广泛采用使 Vera 成为面向开发者、初创公司、公共和私营机构及企业最重视的 AI 工作负载的新型 CPU 标准,有助于让更多人平等地使用 AI 并加速创新。

NVIDIA 创始人兼首席执行官黄仁勋表示:“AI 正迈向一个转折点,Vera 应势而来。随着智能变得具有能动性——能够推理并采取行动——重心就转移到了编排这些工作的系统。CPU 不再只是支持模型,而是开始驱动模型。凭借突破性的性能与能效,Vera 助力 AI 系统实现更快的运算速度和更广的扩展能力。”

为各类数据中心提供灵活配置

NVIDIA 发布了全新的 Vera CPU 机架,集成了 256 个液冷 Vera CPU,能够持续支持超过 22,500 个并发的 CPU 环境,每个环境均可以全性能独立运行。AI 工厂可在单个机架内快速部署并扩展至数万个并发实例和智能体工具。

全新的 Vera 机架采用 NVIDIA MGX™ 模块化参考架构,并获得了全球 80 家生态合作伙伴的支持。

作为 NVIDIA Vera Rubin NVL72 平台的一部分,Vera CPU 还可通过 NVIDIA NVLink™-C2C 互连技术与 NVIDIA GPU 配对,提供高达 1.8 TB / s 的相干带宽,是 PCIe Gen 6 带宽的 7 倍,从而实现 CPU 与 GPU 之间的高速数据共享。此外,NVIDIA 还推出了新的参考设计:将 Vera 用作 NVIDIA HGX™ Rubin NVL8 系统的主机 CPU,负责协调 GPU 加速工作负载的数据搬运和系统控制。

Vera 系统的合作伙伴正推出支持双路和单路 CPU 服务器配置,非常适合强化学习、智能体式推理、数据处理、系统编排、存储管理、云应用以及高性能计算等场景。

在所有配置中,Vera 系统均与 NVIDIA ConnectX® SuperNIC 网卡和 NVIDIA BlueField®-4 DPU 集成,以实现加速网络、存储和安全性能,这些对代理式 AI 至关重要。这使客户能够针对其特定工作负载进行优化,同时在整个 NVIDIA 平台上保持统一的软件堆栈。

专为智能体扩展而设计

通过结合高性能、高能效的 CPU 核心、高带宽内存子系统以及第二代 NVIDIA 可扩展一致性互连架构(NVIDIA Scalable Coherency Fabric),Vera 能够在代理式 AI 与强化学习常见的极端利用率环境下,实现更快速的智能体响应。

Vera 搭载 88 个由 NVIDIA 专门设计的 Olympus 核心,可为涉及编译器、运行时引擎、分析流水线、智能体工具和编排服务的工作负载提供高性能支持。每个核心可通过 NVIDIA Spatial Multithreading 技术同时运行两个任务,以提供一致且可预测的性能,非常适合需要同时处理多项作业的多租户 AI 工厂。

为进一步提升能效,Vera 引入了 NVIDIA 第二代低功耗内存子系统,采用 LPDDR5X 内存,可提供高达 1.2 TB / s 的带宽。与通用 CPU 相比,其带宽提升了 2 倍,而功耗仅为其一半。

广泛的生态系统支持

AI 原生软件开发领域的创新企业 Cursor 正采用 NVIDIA Vera,以提升其 AI 编程智能体的性能。

Cursor 联合创始人兼首席执行官 Michael Truell 表示:“我们很高兴能使用 NVIDIA Vera CPU 来提升整体吞吐量和效率,从而为我们的客户提供更快速、响应更灵敏的编程智能体体验。”

领先的流数据与 AI 平台 Redpanda 正在采用 Vera,以显著提升系统性能。

Redpanda 创始人兼首席执行官 Alex Gallego 表示:“Redpanda 最近测试了运行 Apache Kafka 兼容工作负载的 NVIDIA Vera,发现其性能远超我们此前测试过的其他系统,延迟最高可降低至原来约 18%。Vera 代表了 CPU 架构发展的新方向,每颗核心拥有更大内存和更低单核成本,使我们的客户能够将实时流媒体工作负载扩展到前所未有的规模,并解锁全新的 AI 与智能体应用。”

计划部署 Vera CPU 的国家级实验室包括 Leibniz Supercomputing Centre、Los Alamos National Laboratory、National Energy Research Scientific Computing Center(隶属于 Lawrence Berkeley National Laboratory)和 Texas Advanced Computing Center(TACC)。

TACC 高性能计算总监 John Cazes 表示:“在 TACC,我们最近测试了 NVIDIA Vera CPU 平台,准备在即将推出的 Horizon 系统中进行部署。在运行六个科学应用时,早期结果令人瞩目。Vera 在单核性能和内存带宽方面的表现,代表着科学计算迈出了一大步。我们期待在今年晚些时候,为 Horizon 的 CPU 用户提供基于 Vera 的节点。”

计划部署 Vera CPU 的领先云服务提供商包括阿里巴巴、字节跳动、Cloudflare、CoreWeave、Crusoe、Lambda、Nebius、Nscale、Oracle Cloud Infrastructure、Together.AI 和 Vultr。

采用 Vera CPU 的领先基础设施提供商包括 Aivres、ASRock Rack、华硕、Compal、思科、戴尔、Foxconn、技嘉、HPE、Hyve、Inventec、联想、MiTAC、MSI、Pegatron、Quanta Cloud Technology(QCT)、Supermicro、Wistron 和 Wiwynn。

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

加利福尼亚州圣何塞 —— GTC —— 太平洋时间 2026 年 3 月 16 日 ——NVIDIA 今日宣布推出 NVIDIA Vera Rubin DSX AI Factory 参考设计,这是一份用于构建协同设计的...

关键字: 数字孪生 AI 自动化

加利福尼亚州圣何塞 —— GTC —— 太平洋时间 2026 年 3 月 16 日 ——NVIDIA 今日宣布推出 NVIDIA BlueField-4® STX 模块化参考架构,该架构可助力企业、云计算及 AI 服务商...

关键字: 存储 云计算 AI

近日,国产笔记本品牌驰为(CHUWI)深陷“CPU造假”风波——继其CoreBook X机型被曝用老款锐龙5 5500U冒充新款7430U之后,另一款CoreBook Plus也以完全相同的手法翻车了。

关键字: CPU

2026年开年,是德科技以Infiniium XR8新一代示波器平台的重磅发布,为AI基础设施建设浪潮再添注脚。

关键字: 是德科技 Keysight Infiniium XR8 示波器 AI

上海2026年3月13日 /美通社/ -- 3月12日,全球三大家电与消费电子展之一——中国家电及消费电子博览会(AWE)在上海启幕。本届展会以"AI科技、慧享未来"为主题,集中呈现AI领域前沿技术突破,拓展人-车-家-...

关键字: AI LAN AC POLAR

西班牙巴塞罗那2026年3月13日 /美通社/ -- 在MWC 2026期间,GlobalData首席分析师Andy Hicks发布了《Reinventing Voice: A Converged, AI-Enabled...

关键字: GLOBAL AI AN 网络

2026 年采埃孚售后中国商用车 UPTIME 共创大会汇聚全国近200家经销商、维修厂及合作伙伴。 采埃孚售后重申 "安全、省钱、时效" 为核心的UPTIME价值主张,通过持续扩展的产品组合、电动化赋能能...

关键字: TI AI 智能体 新能源

全场景适配多平台,海内外差异化布局,海外API支持按次调用更灵活 上海2026年3月13日 /美通社/ -- 全球领先的 AI 及 AR 美妆时尚科技提供商玩美移动(纽交所代码:PERF)宣布,旗下核心 AI 皮肤分析...

关键字: 移动 AI API 数字化

患者从100名到600名:为了帮助受痤疮困扰的患者,Pierre Fabre Laboratories旗下领先品牌Avène,正通过人工智能(AI)的数据增强技术,强化其临床...

关键字: LAB PI FAB AI
关闭