当前位置:首页 > 厂商动态 > NVIDIA
[导读]在迄今为止最大规模的 GTC 大会上,NVIDIA 创始人兼首席执行官黄仁勋带来 NVIDIA Blackwell、NIM 微服务、Omniverse Cloud API 等发布。

生成式 AI 有望彻底改变它所触及的每一个行业 —— 掌握技术是迎接挑战的关键。

NVIDIA 创始人兼首席执行官黄仁勋发布了全新的 Blackwell 计算平台,并概述了计算能力的提升可为软件、服务、机器人技术、医疗技术等各个方面带来的重大进步。

“加速计算已到达临界点,通用计算已失去动力,”黄仁勋在硅谷巨大的 SAP 中心体育馆对其主题演讲观众说道。GTC 现场聚集了超过 11,000 名与会者,在线观众数以万计。

“我们需要一种全新的计算方式 —— 由此我们才可以继续扩展,继续降低计算成本,并在保证可持续性的同时继续进行越来越多的计算。与通用计算相比,加速计算使每个行业都可以大幅提速。”

黄仁勋站在网球场大小的 40 英尺高 8K 屏幕前,向挤满了首席执行官、开发者、AI 爱好者和企业家的人群发表演讲。

为了推动世界 AI 基础设施实现大规模升级的目标,黄仁勋发布了 NVIDIA Blackwell 平台,该平台具有对万亿参数大语言模型进行实时生成的能力。

黄仁勋介绍了 NVIDIA 推理微服务,即 NVIDIA NIM。这是一种全新的软件打包和交付方式,能够将开发者与数亿个 GPU 连接起来,以部署各种定制 AI。

黄仁勋还介绍了 Omniverse Cloud API,它可以提供先进的模拟能力,将 AI 引入物理世界。

演讲的尾声,黄仁勋进行了精彩演示,讲解了与一些大型企业的合作伙伴关系生态,还详细介绍了超过二十项发布来阐述其愿景,以此为 GTC 2024 的重磅发布画上了圆满的句号。

GTC 大会已经开展了 15 年,从最初在一个本地酒店宴客厅举办,到现在发展成了全球最重要的 AI 大会。本次大会是近五年来首次恢复线下。

今年的大会包含超过 900 场会议,其中包括由黄仁勋主持的有关 Transformer 的专家讨论会,期间将与首批开发该技术的八位先驱们对话。此外,还有超过 300 个展示和 20 多个技术研讨会。

GTC 是一个几乎涉及所有领域的 AI 盛会。在开场致辞中,全球领先的 AI 艺术家 Refik Anadol 带来了惊艳的表演,展示了一座巨大的实时 AI 数据雕塑,屏幕上呈现着绿色、蓝色、黄色和红色的波动状旋涡,翻腾,交织和散落。

黄仁勋在演讲开始时解释说,多模态 AI 的崛起——能够处理由不同模型负责的多样化数据类型——赋予了 AI 更大的适应性和能力。通过增加参数,这些模型可以处理更复杂的分析任务。

但这也意味着对计算能力的需求显著上升。随着这些协作、多模态系统变得更加复杂(参数多达万亿),对先进计算基础设施的需求也随之增加。

“我们需要更大的模型,”黄仁勋表示,“我们将使用多模态数据来训练它,而不仅仅是互联网上的文本。我们将使用文本和图像、图形和图表来训练它,就像我们从电视中学习一样,它也需要从海量视频中学习。”

新一代加速计算

黄仁勋说:“我们需要更大的 GPU”。 Blackwell 平台就是为了应对这一挑战而构建的。他从口袋里掏出一块 Blackwell 芯片,将它与 Hopper 芯片并排举起,后者显得小了一些。

新架构以一位加州大学伯克利分校的数学家 David Harold Blackwell 而命名。他专门研究博弈论和统计学,也是第一位入选美国国家科学院的黑人学者。新架构超越了两年前推出的 NVIDIA Hopper 架构。

Blackwell 在单芯片训练方面的 FP8 性能是其上一代架构的 2.5 倍,在推理方面的 FP4 性能是其上一代架构的 5 倍。它具有第五代 NVLink 互连,速度是 Hopper 的两倍,并且可扩展至 576 个 GPU。

NVIDIA GB200 Grace Blackwell 超级芯片通过 900GB/s 超低功耗的 NVLink 芯片间互连,将两个 Blackwell NVIDIA B200 Tensor Core GPU 连接到 NVIDIA Grace CPU。

黄仁勋举起一块带有系统的电路板说道:“这台计算机是同类计算机中的第一台,能够在这么小的空间容纳如此多的计算量。由于它的内存是连贯的,感觉就像一个幸福的大家庭一起开发一个应用程序。”

为了获得最高的 AI 性能,基于 GB200 的系统可以与今日发布的 NVIDIA Quantum-X800 InfiniBand 和 Spectrum-X800 以太网平台连接,这些平台可提供速度高达 800Gb/s 的高级网络。

“这样我们可以大量地节省能源、网络带宽量和时间。”黄仁勋表示,“未来将是可生成的,这就是为什么这是一个全新的行业。我们的计算方式有本质差异,所以 NVIDIA 为生成式 AI 时代打造了一款全新处理器。”

为了扩大 Blackwell 的规模,NVIDIA 构建了一款名为 NVLink Switch 的新芯片。每个芯片可以以每秒 1.8 TB 的速度连接四个 NVLink,并通过减少网络内流量来消除流量拥塞。

NVIDIA Switch 和 GB200 是黄仁勋所称的 “一个巨型 GPU” ,也是 NVIDIA GB200 NVL72 的关键组件。NVIDIA GB200 NVL72 是一种多节点、液冷、机架级系统,利用 Blackwell 为万亿参数模型提供强力计算,在单个机架中可实现 720 petaflops 的 AI 训练性能和 1.4 exaflops 的 AI 推理性能。

该机器包含 600,000 个零件,重 3,000 磅。黄仁勋在介绍此台机器时说道:“此时此刻,地球上也许只有三台百亿亿次浮点运算机器。而这是一个单一机架中的1个百亿亿次浮点运算 AI 系统。”

此外,NVIDIA 还推出了更强大的新一代 AI 超级计算机 —— 由 NVIDIA GB200 Grace Blackwell 超级芯片提供支持的 NVIDIA DGX SuperPOD,可用于处理万亿参数模型,并具有持续的正常运行时间,以实现超大规模生成式 AI 训练和推理工作负载。

全新 DGX SuperPOD 采用新型高效液冷机架规模架构,采用 NVIDIA DG GB200 系统构建,可在 FP4 精度下提供 11.5 exaflops 的 AI 超级计算能力和 240 TB 的快速内存,并可通过额外的机架进行扩展。

“未来,数据中心将成为 AI 工厂”,黄仁勋说,“AI 工厂的使命是创造收入,同时也创造智能。”

Blackwell 已经受到了各行各业的欢迎,并获得多个行业领导者的支持,其中包括Alphabet 及 Google的首席执行官 Sundar Pichai,Amazon 首席执行官 Andy Jassy,Dell 首席执行官 Michael Dell, Google DeepMind 首席执行官 Demis Hassabis,Meta 首席执行官 Mark Zuckerberg,Microsoft 首席执行官 Satya Nadella,OpenAI 首席执行官 Sam Altman,Oracle 董事长 Larry Ellison和Tesla和xAI 首席执行官Elon Musk。

Blackwell 正在被全球各大云服务提供商、领先的 AI 公司、系统和服务器供应商,以及世界各地的区域云服务提供商和电信公司所采用。

“整个行业都在为 Blackwell 做准备”,黄仁勋表示。

创造软件的新方式

黄仁勋表示,生成式 AI 改变了应用程序的编写方式。

他解释说,未来的公司会将精力放在组装 AI 模型,赋予它们任务,给出工作产品示例,审查计划和中间结果,而不是编写软件。

NVIDIA NIM 软件包是根据 NVIDIA 的加速计算库和生成式 AI 模型构建的。

“未来我们如何构建软件?你不太可能从头开始编写,也不太可能写一大堆 Python 代码或类似的东西,” 黄仁勋说,“很可能你只需要组建一支 AI 团队就够了。”

这些微服务支持行业标准 API,易于连接,可在 NVIDIA 庞大的 CUDA 安装基础上工作,针对新 GPU 进行重新优化,并不断扫描安全漏洞和威胁。

黄仁勋表示,客户可以使用现成的 NIM 微服务,或者 NVIDIA 可以为之构建专属的AI 和 AI 助手,为特定公司所需的模型专业技能提供专门训练,以助力您创建宝贵的新服务。

“企业IT行业正坐在一座‘金矿’上,”黄仁勋说道, “他们拥有多年来创建的所有这些令人惊叹的工具(和数据)。如果他们能把这个‘金矿’变成 AI 助手,就能给用户提供更多可能。”

领先的科技公司已经开始行动。黄仁勋详细介绍了 NVIDIA 如何帮助 Cohesity、NetApp、SAP、ServiceNow 和 Snowflake 构建 AI 助手和虚拟助理。各行各业也在纷纷加入行列。

在电信领域,黄仁勋宣布推出 NVIDIA 6G 研究云,这是一个由 AI 和 Omniverse 支持的生成平台,旨在推动下一个通信时代的发展。它采用 NVIDIA 的 Sionna 神经无线电框架、NVIDIA Aerial CUDA 加速无线电接入网络和 NVIDIA Aerial Omniverse Digital Twin for 6G 构建。

在半导体设计和制造领域,黄仁勋宣布,NVIDIA 正在与 TSMC 和 Synopsys 合作,将其突破性的计算光刻平台 cuLitho 投入生产。该平台将把半导体制造中计算最密集的工作负载加速 40-60 倍。

黄仁勋还宣布了 NVIDIA 地球气候数字孪生。该云平台现已推出,可实现交互式高分辨率模拟,以加速气候和天气预报。

黄仁勋表示,AI 的最大影响将体现在医疗领域,NVIDIA 已经涉足成像系统、基因测序仪器,并与领先的手术机器人公司合作。

NVIDIA 正在推出一种新型生物学软件。 NVIDIA 今天发布了二十多个新的微服务,使全球医疗企业能够在任何地方、任何云上利用生成式 AI 的最新进展。这些微服务可提供先进的成像、自然语言和语音识别,以及数字生物学生成、预测和模拟功能。

Omniverse 将 AI 引入物理世界

下一波 AI 浪潮将是 AI 对物理世界的学习,黄仁勋说道。

黄仁勋表示:“我们需要一个模拟引擎,来以数字方式为机器人呈现世界,这样机器人就有了一个学习如何成为机器人的‘健身房’,我们称这个虚拟世界为 Omniverse。”

因此,NVIDIA 宣布将以 API 形式提供 NVIDIA Omniverse Cloud,从而将全球领先的工业数字孪生应用和工作流创建平台的覆盖范围扩展到整个软件制造商生态系统。

借助五个全新 Omniverse Cloud 应用编程接口(API),开发者能够轻松地将 Omniverse 的核心技术直接集成到现有的数字孪生设计与自动化软件应用中,或是集成到用于测试和验证机器人或自动驾驶汽车等自主机器的仿真工作流中。

为了展示其工作原理,黄仁勋分享了一个机器人仓库的演示——使用多摄像头感知和追踪,看顾工人并协调机器人叉车,在整个机器人堆栈运行的情况下,这些叉车能够实现自动驾驶。

黄仁勋还宣布,NVIDIA 将把 Omniverse 引入 Apple Vision Pro 中,通过新的 Omniverse Cloud API,开发者可以将交互式工业数字孪生流式传输到 VR 头显中。

一些全球大型工业软件制造商正在采用 Omniverse Cloud API,包括 Ansys、Cadence、达索系统旗下 3DEXCITE 品牌、Hexagon、微软、罗克韦尔自动化、西门子和 Trimble 等。

机器人技术

黄仁勋表示:“所有会动的东西都可能成为机器人,汽车行业将是其中的一个重要部分,NVIDIA 的计算平台已经应用在乘用车、卡车、配送机器人和自动驾驶出租车中。”

黄仁勋宣布,世界上最大的自动驾驶汽车公司比亚迪已选择 NVIDIA 的下一代计算平台用于其自动驾驶汽车,在 DRIVE Thor 上构建其下一代电动汽车车队。

为了帮助机器人更好地感知所处环境,黄仁勋还发布了 Isaac Perceptor 软件开发工具包,该工具包具有最先进的多摄像头视觉里程计、3D 重建和占用地图,以及深度感知功能。

为了使机械臂更具适应性,NVIDIA 宣布推出 Isaac Manipulator —— 一个先进的机械臂感知、路径规划和运动学控制库。

最后,黄仁勋宣布了 Project GR00T,这是一个为人形机器人设计的通用基础模型,旨在进一步推动 NVIDIA 在机器人技术和具身智能方面的突破性工作。

为了支持这一努力,黄仁勋推出了一款用于人形机器人的新型计算机 Jetson Thor,它基于 NVIDIA Thor 系统级芯片,并对 NVIDIA Isaac 机器人平台进行了重大升级。

演讲接近尾声之时,黄仁勋展示了来自迪士尼研究院的一对由 NVIDIA 驱动的小型机器人

黄仁勋表示:“计算机图形学、物理学和AI 是 NVIDIA 的灵魂所在,生成式 AI 时代一切改变都有可能发生。”

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

Remi Pi采用瑞萨RZ/G2L作为核心处理器,该处理器搭载双核Cortex-A55@1.2GHz+Cortex-M33@200MHz处理器,其内部集成高性能3D加速引擎Mail-G31 GPU(500MHz)和视频处...

关键字: 瑞米派 处理器

业内消息,近日高通公司宣布推出针对桌面平台的全新骁龙 X Plus 处理器。

关键字: 高通 骁龙 X Plus 处理器

TDK 株式会社(东京证券交易所代码:6762)隆重宣布其具有片上处理能力的 InvenSense SmartSonic™ICU-10201 超声波飞行时间 (ToF) 传感器全面上市。该传感器可助力实现高性能和低功耗的...

关键字: 飞行传感器 物联网 机器人

近日,米尔电子推出米尔基于NXP i.MX 93系列产品-MYC-LMX9X核心板及开发板。NXP i.MX 9系列在i.MX 6和i.MX 8系列产品市场验证的基础上,继承了前代产品的优点的同时,进一步提升了性能、资源...

关键字: 核心板 开发板 处理器

ST4E1240 是意法半导体新系列收发器芯片的首款产品,为现代高性能工业应用提供强大而可靠的 RS-485信号传输解决方案。新收发器支持的数据速率远高于原有的RS-485 标准,可以延长电缆长度实现多点连接,总线上的收...

关键字: 工业自动化 智能建筑 机器人

机器人技术将与移动互联网、物联网、大数据、云计算、人工智能等新一代数字技术进一步融合,特别是5G技术将使工业机器人成为工业智能制造体系的一部分,通过实时传输数据提高效率。

关键字: 机器人 医疗机器人 互联网

这项民意调查使业界有助于了解工业5.0是否准备就绪

关键字: 工业5.0 工业4.0 机器人

在科技迅猛发展的今天,履带机器人在诸多领域展现出了广泛的应用前景,从现代农业的采摘、喷药,到消防领域的救援,再到现代化防疫中的喷雾消毒,甚至是复杂地形的运输任务,它们都能出色地完成任务。而驱动这些履带机器人的核心部件,便...

关键字: 履带机器人 机器人 电机

今天,小编将在这篇文章中为大家带来机器人的有关报道,通过阅读这篇文章,大家可以对它具备清晰的认识,主要内容如下。

关键字: 机器人 机器人学

2024年4月18日,重庆——今日,英特尔AI教育峰会暨OPS2.0全球发布活动在第83届中国教育装备展示会期间顺利举行。峰会现场,英特尔携手视源股份、德晟达等合作伙伴正式发布新一代开放式可插拔标准——OPS 2.0,并...

关键字: OPS 2.0 显卡 处理器
关闭