当前位置:首页 > 厂商动态 > NVIDIA
[导读]加利福尼亚州圣何塞 —— GTC —— 太平洋时间 2026 年 3 月 16 日 ——NVIDIA 今日宣布推出 NVIDIA BlueField-4® STX 模块化参考架构,该架构可助力企业、云计算及 AI 服务商轻松部署加速存储基础设施,以满足代理式 AI 所需的长上下文推理能力。

新闻摘要:

• 全新 NVIDIA STX 参考架构可提升高达 5 倍的 Token 吞吐量,能效提升高达 4 倍,数据摄取速度提升 2 倍。

• 率先将 STX 用于上下文记忆存储的厂商包括 CoreWeave、Crusoe、IREN、Lambda、Mistral AI、Nebius、Oracle Cloud Infrastructure(OCI)和 Vultr。

• 多家存储厂商与制造合作伙伴正在基于 NVIDIA 模块化参考设计来构建基础设施,以推进代理式 AI 的发展,包括 AIC、Cloudian、DDN、戴尔科技、Everpure、Hitachi Vantara、HPE、IBM、MinIO、NetApp、Nutanix、Supermicro、Quanta Cloud Technology(QCT)、VAST Data 和 WEKA。

加利福尼亚州圣何塞 —— GTC —— 太平洋时间 2026 年 3 月 16 日 ——NVIDIA 今日宣布推出 NVIDIA BlueField-4® STX 模块化参考架构,该架构可助力企业、云计算及 AI 服务商轻松部署加速存储基础设施,以满足代理式 AI 所需的长上下文推理能力。

传统数据中心提供大容量通用存储,但难以满足与跨多步骤、多工具和多轮会话的 AI 智能体无缝交互所需的响应速度。代理式 AI 需要实时访问数据和上下文工作记忆,以确保对话和多任务的快捷性和连贯性。随着上下文规模的不断扩大,传统存储和数据路径可能会降低 AI 推理的速度,并降低 GPU 利用率。

NVIDIA STX 助力存储厂商构建数据就近并可大规模访问的基础设施,从而使代理式 AI 工厂能够在推理、训练和分析方面提供更高的吞吐量和响应速度。

首个机架级部署方案集成了全新的 NVIDIA CMX™ 上下文记忆存储平台。通过引入高性能的上下文层来扩展 GPU 内存,从而实现可扩展的推理和代理式系统。与传统存储相比,每秒可处理的 Token 提升高达 5 倍。

NVIDIA 创始人兼首席执行官黄仁勋表示:“代理式 AI 正在重新定义软件的能力,必须重塑其背后的计算基础设施才能跟上这一步伐。能够基于海量上下文进行推理并持续学习的 AI 系统,需要新的存储方案。NVIDIA STX 重新定义了存储堆栈,为 AI 原生基础设施提供了模块化基础,确保 AI 工厂始终保持峰值性能高效运行。”

STX 由 NVIDIA Vera Rubin 平台提供加速,集成了针对存储进行优化的全新 NVIDIA BlueField-4 处理器。该处理器将 NVIDIA Vera CPU、NVIDIA ConnectX® -9 SuperNIC 相结合,并配合 NVIDIA Spectrum-X™ 以太网网络、NVIDIA DOCA™ 以及 NVIDIA AI Enterprise 软件共同运行。

与传统 CPU 架构相比,STX 架构的能效提升高达 4 倍,从而实现高性能存储,并且在处理企业级 AI 数据时,每秒可处理的内存页数提升 2 倍。

众多存储厂商合作伙伴正在基于 NVIDIA STX 共同设计新一代 AI 基础架构,包括 Cloudian、DDN、戴尔科技、Everpure、Hitachi Vantara、HPE、IBM、MinIO、NetApp、Nutanix、VAST Data 和 WEKA。

正在构建基于 STX 系统的制造合作伙伴包括 AIC、Supermicro 和 Quanta Cloud Technology(QCT)。

计划采用 STX 进行上下文记忆存储的主要 AI 实验室和云服务提供商包括 CoreWeave、Crusoe、IREN、Lambda、Mistral AI、Nebius、OCI 和 Vultr。

基于 STX 的平台将于今年下半年由合作伙伴推出。

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

2026年开年,是德科技以Infiniium XR8新一代示波器平台的重磅发布,为AI基础设施建设浪潮再添注脚。

关键字: 是德科技 Keysight Infiniium XR8 示波器 AI

上海2026年3月13日 /美通社/ -- 3月12日,全球三大家电与消费电子展之一——中国家电及消费电子博览会(AWE)在上海启幕。本届展会以"AI科技、慧享未来"为主题,集中呈现AI领域前沿技术突破,拓展人-车-家-...

关键字: AI LAN AC POLAR

西班牙巴塞罗那2026年3月13日 /美通社/ -- 在MWC 2026期间,GlobalData首席分析师Andy Hicks发布了《Reinventing Voice: A Converged, AI-Enabled...

关键字: GLOBAL AI AN 网络

2026 年采埃孚售后中国商用车 UPTIME 共创大会汇聚全国近200家经销商、维修厂及合作伙伴。 采埃孚售后重申 "安全、省钱、时效" 为核心的UPTIME价值主张,通过持续扩展的产品组合、电动化赋能能...

关键字: TI AI 智能体 新能源

全场景适配多平台,海内外差异化布局,海外API支持按次调用更灵活 上海2026年3月13日 /美通社/ -- 全球领先的 AI 及 AR 美妆时尚科技提供商玩美移动(纽交所代码:PERF)宣布,旗下核心 AI 皮肤分析...

关键字: 移动 AI API 数字化

患者从100名到600名:为了帮助受痤疮困扰的患者,Pierre Fabre Laboratories旗下领先品牌Avène,正通过人工智能(AI)的数据增强技术,强化其临床...

关键字: LAB PI FAB AI

西班牙巴塞罗那2026年3月12日 /美通社/ -- 在2026年巴塞罗那通信展期间,在由GSMA主办的5G Futures Summit上,GSMA发布了《Gigauplink, Deterministic Laten...

关键字: GSMA AI 网络 TE

上海2026年3月11日 /美通社/ -- 3月11日,在embedded world 2026期间,移远通信宣布,正式发布基于MediaTek平台G520芯片的新一代支持A...

关键字: AI 移远通信 智能化 Wi-Fi

315曝光有人通过 GEO 手段给 AI 大模型“投毒”背后,当下超 10 亿人正将人工智能作为全新的信息来源和认知指引,这场全球范围的人类实验中,AI 正深刻影响着我们的想法、信念与观点。

关键字: AI 人工智能
关闭