当前位置:首页 > 厂商动态 > 厂商文章
[导读]Cadence、Dropbox、SAP、ServiceNow 率先使用 NVIDIA NeMo Retriever 优化语义检索,实现准确的 AI 推理

亚马逊云科技 re:Invent — 太平洋时间 2023 年 11 月 28 日 — NVIDIA 今日宣布推出一项生成式 AI 微服务,支持企业将自定义大语言模型与企业数据相连接,使其 AI 应用能够提供高度准确的响应。

NVIDIA NeMo™ Retriever 是 NVIDIA NeMo(一个用于构建、自定义和部署生成式 AI 模型的框架和工具系列)的一项全新服务,通过企业级检索增强生成(RAG)功能,帮助组织加强其生成式 AI 应用。

作为一项语义检索微服务,NeMo Retriever 借助经 NVIDIA 优化的算法,帮助生成式 AI 应用作出更加准确的回答。使用该微服务的开发者,可以将其 AI 应用与位于各个云和数据中心的业务数据相连通。该服务为 AI 代工添加了 NVIDIA 优化的 RAG 功能,并被整合到亚马逊云科技 Marketplace 上的 NVIDIA AI Enterprise 软件平台中。

Cadence、Dropbox、SAP 和 ServiceNow 等公司已率先与 NVIDIA 合作,将生产就绪型 RAG 功能整合至其自定义生成式 AI 应用和服务中。

NVIDIA 创始人兼首席执行官黄仁勋表示:“具有 RAG 功能的生成式 AI 应用是企业的下一个杀手级应用。借助 NVIDIA NeMo Retriever,开发者可以创建自定义生成式 AI 聊天机器人、AI 助手和摘要工具。它们能够访问企业的业务数据,通过准确且有价值的生成式 AI 智能来提高生产力。”

全球头部企业借助 NeMo Retriever 提高大语言模型(LLM)准确性

电子系统设计领导厂商 Cadence 为超大规模计算、5G 通信、汽车、移动、航空航天、消费和医疗市场的企业提供服务。该公司正与 NVIDIA 合作,为工业电子设计领域的生成式 AI 应用开发 RAG 功能。

Cadence 总裁兼首席执行官 Anirudh Devgan 表示:“生成式 AI 引入了创新方法来满足客户需求,比如能在设计流程早期发现潜在缺陷的工具等。我们的研究人员正在与 NVIDIA 合作,使用 NeMo Retriever 进一步提高生成式 AI 应用的准确性和相关性,以便发现问题,并帮助客户更快地将优质产品推向市场。”

破解精确的生成式 AI 应用的“密码”

与开源 RAG 工具套件不同,NeMo Retriever 是通过具有商业可行性的模型、API 稳定性、安全补丁和企业级支持,来为生产就绪型生成式 AI 赋能。

经 NVIDIA 优化的算法使 Retriever 的嵌入模型能够产出准确性最高的结果。经过优化的嵌入模型能够捕捉单词之间的关系,使 LLM 能够处理和分析文本数据。

企业可以使用 NeMo Retriever 将 LLM 连接到多个数据源和知识库,这样用户就可以轻松地与数据交互,并通过简单的对话指令获得准确且最新的答案。通过使用由 Retriever 驱动的应用,企业可以使用户安全地访问多种数据格式的信息,如文本、PDF、图像和视频等。

借助 NeMo Retriever,企业能够以更少的训练获得更准确的结果,加快产品上市时间,并减少生成式 AI 应用开发产生的能耗。

通过 NVIDIA AI Enterprise 实现可靠、简单且安全的部署

企业可以在几乎任何数据中心或云端的 NVIDIA 加速计算上部署由 NeMo Retriever 驱动的应用,以便在推理过程中运行。NVIDIA AI Enterprise 可支持通过 NVIDIA Triton 推理服务器™、NVIDIA TensorRT™、NVIDIA TensorRT-LLM 及其他 NVIDIA AI 软件进行加速的高性能推理。

供应情况

开发者可以注册并抢先体验 NVIDIA NeMo Retriever。

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

北京——2024年4月17日 亚马逊云科技宣布,在Amazon Bedrock上正式推出来自Anthropic的Claude 3 Opus模型,该模型是Claude 3家族中最智能的模型,在高度复杂的任务上表现卓越,并拥...

关键字: AI驱动 大语言模型 生成式AI

2024年3月20日,深圳 —— 今日,以“存储周期·激发潜能”为主题的中国闪存市场峰会在深圳拉开帷幕。Solidigm携多元创新技术和丰富产品组合亮相,Solidigm亚太区销售副总裁倪锦峰登台发表了题为《夯实存力基础...

关键字: AI 存储 大语言模型

西门子今日宣布将进一步深化与英伟达的合作,此次合作将英伟达 Omniverse Cloud APIs 的沉浸式可视化功能引入西门子 Xcelerator,推动以人工智能(AI)驱动的数字孪生技术的应用,持续构建工业元宇宙...

关键字: 生成式 AI 元宇宙 人工智能

在迄今为止最大规模的 GTC 大会上,NVIDIA 创始人兼首席执行官黄仁勋带来 NVIDIA Blackwell、NIM 微服务、Omniverse Cloud API 等发布。

关键字: 机器人 生成式 AI 处理器

基于先进的 NVIDIA 网络、NVIDIA 全栈 AI 软件和存储技术,可将集群中 Grace Blackwell 超级芯片的数量扩展至数万个,通过 NVIDIA NVLink可将多达 576 块 Blackwell...

关键字: 生成式 AI 超级计算 GPU

美国加利福尼亚州圣何塞 —— GTC —— 太平洋时间 2024 年 3 月 18 日 —— NVIDIA 于今日推出数十项企业级生成式 AI 微服务,企业可以利用这些微服务在自己的平台上创建和部署定制应用,同时保留对知...

关键字: AI 模型 生成式 AI 服务器

NVIDIA cuLitho 可将半导体制造中高度计算密集型的工作负载加快 40-60 倍,并为业界带来全新的生成式 AI 算法

关键字: 生成式 AI 半导体 GPU

Isaac 机器人平台现可为开发者提供全新的机器人训练仿真器、Jetson Thor 机器人计算机、生成式 AI 基础模型和由 CUDA 加速的感知和操作库

关键字: 机器人 生成式 AI SoC

全新 NVIDIA NIM 和 GPU 加速的微服务专为生物、化学、影像和医疗数据开发,并在 NVIDIA DGX 云中运行

关键字: 生成式 AI GPU 数字医疗

美国加利福尼亚州圣何塞 —— GTC —— 太平洋时间 2024 年 3 月 18 日 —— NVIDIA 于今日宣布推出 NVIDIA Blackwell 平台以赋能计算新时代。该平台可使世界各地的机构都能够在万亿参数...

关键字: 生成式 AI 大语言模型 计算
关闭