当前位置:首页 > 芯闻号 > 美通社全球TMT
[导读]新闻要点: 新一代IBM Telum II 处理器和 IBM Spyre 加速器可解锁更多企业级 AI 能力,包括大语言模型和生成式 AI 先进的 I/O 技术实现并简化可扩展的 I/O 子系统,进一步降低能耗和数据中心占地面积 北京2024年8月29日 /美通...

新闻要点:

  • 新一代IBM Telum II 处理器和 IBM Spyre 加速器可解锁更多企业级 AI 能力,包括大语言模型和生成式 AI
  • 先进的 I/O 技术实现并简化可扩展的 I/O 子系统,进一步降低能耗和数据中心占地面积

北京2024年8月29日 /美通社/ -- 近日,IBM(纽约证券交易所:IBM)在 Hot Chips 2024大会上公布了即将推出的 IBM Telum® II 处理器和 IBM Spyre™ 加速器的架构细节。这些新技术旨在大幅扩展下一代 IBM Z 大型主机系统的处理能力,通过新的 AI 集成方法,加速企业对传统 AI 模型和大语言 AI 模型的协同使用。

IBM 推出全新Telum处理器,依托新一代 IBM Z 大型主机加速 AI 应用

IBM 推出全新Telum处理器,依托新一代 IBM Z 大型主机加速 AI 应用

随着基于大语言模型的 AI 项目从概念验证阶段进入生产阶段,企业对高能效、高安全性和高度可扩展解决方案的需求日益迫切。摩根士丹利最近发布的一份研究报告预测,在未来几年,生成式 AI 的电力需求将以每年 75% 的速度激增,其 2026 年的能耗或将与西班牙 2022 年的全年能耗相当。许多 IBM 客户表示,支持适当规模的基础模型和针对 AI 工作负载的混合架构越来越重要。

此次IBM发布的主要创新技术包括:

  • IBM Telum II 处理器:这一全新芯片将搭载于下一代 IBM Z 系列主机,与第一代 Telum 芯片相比,其频率和内存容量均有提升,高速缓存提升40%;集成 AI 加速器内核和数据处理单元 (DPU) 的性能也得到改善。IBM Telum II处理器将支持大语言模型驱动的企业计算解决方案,满足金融等行业的复杂交易需求。
  • IO 加速单元:Telum II 处理器芯片上的全新数据处理单元 (DPU) 旨在加速大型主机上用于联网和数据存储的复杂 IO 协议,可简化系统操作,提高关键组件性能。
  • IBM Spyre加速器:可提供额外的AI计算能力,与 Telum II 处理器相得益彰。Telum II 和 Spyre 芯片共同构成了一个可扩展的架构,可支持AI集成建模方法,即将多个机器学习或深度学习的AI模型与基于编码器的大语言模型相结合。通过利用每个模型架构的优势,AI集成的方法可以生成比单个模型更准确、更稳健的结果。Spyre 加速器芯片在 Hot Chips 2024 大会期间进行了预览,并将作为Telum II 处理器的附加选件提供。每个加速器芯片均与IBM 研究院合作开发,通过一个 75 瓦 PCIe 适配器连接。与其他 PCIe 卡一样,Spyre 加速器可根据客户需求进行扩展。

IBM主机和 LinuxONE 产品管理副总裁 Tina Tarquinio 表示:"得益于IBM强大的多代并行的开发路线图,我们得以在保持技术领先的同时,满足企业不断升级的 AI 需求。Telum II 处理器和 Spyre 加速器旨在提供安全、节能、高性能的企业计算解决方案。这些多年研发的创新成果将被引入下一代 IBM Z 平台,帮助客户大规模利用大语言模型和生成式 AI技术。"

Telum II 处理器和 IBM Spyre 加速器将由 IBM 的长期合作伙伴三星晶圆代工(Samsung Foundry)生产,采用其高性能、高能效的 5 纳米工艺节点。二者将共同支持企业的先进AI 用例,释放业务价值,从而创造新的竞争优势。利用AI集成的方法,客户可以更快、更准确地获得预测结果。适用的生成式 AI用例包括:

  • 保险理赔欺诈检测:通过AI集成方法将大语言模型与传统神经网络相结合,以提高性能和准确性,增强对保险理赔欺诈的检测。
  • 反洗钱高级监测:对可疑金融活动进行高级检测,支持遵守监管要求并降低金融犯罪风险。
  • AI 助手:加速应用生命周期、知识和专业技能的传授、代码解释和转换等。

规格和性能指标

  • Telum II 处理器:配备八个运行频率达 5.5GHz的高性能内核,每个内核配备 36MB二级高速缓存,片上高速缓存容量增加 40%(总容量达 360MB)。每个处理器抽屉的虚拟 L4 高速缓存为 2.88GB,相比上一代增加 40%。集成的 AI 加速器可实现低延迟、高吞吐量的交易中 AI 推理,例如增强金融交易期间的欺诈检测,并且每块芯片的计算能力是上一代的四倍。

    Telum II 芯片中集成了最新的 I/O 加速单元 DPU。在设计上,其I/O 密度提高 50%,可大幅提高数据处理能力,进一步提高 IBM Z 的整体效率和可扩展性,使其成为处理大规模AI工作负载和数据密集型应用的不二之选。 

  • Spyre 加速器:这是一款专为复杂 AI 模型和生成式 AI 用例提供可扩展功能的企业级加速器。它有高达 1TB 的内存,可在普通 IO 抽屉的八块卡上串联工作,以支持大型主机的整体 AI 工作负载,同时每块卡的功耗不超过 75W。每块芯片由 32 个计算内核组成,支持 int4、int8、fp8 和 fp16 数据类型,适用于低延迟和高吞吐量的 AI 应用。

产品时间表
作为 IBM 下一代 IBM Z 和 IBM LinuxONE 平台的中央处理器,Telum II 处理器预计在 2025 年向 IBM Z 和 LinuxONE 客户提供。IBM Spyre 加速器仍在技术预览阶段,预计也将于 2025 年推出。

关于 IBM 未来方向和意向的声明可能会随时更改或撤销,恕不另行通知。

访问下方链接了解更多:

关于IBM

IBM 是全球领先的混合云、人工智能及企业服务提供商,帮助超过 175 个国家和地区的客户,从其拥有的数据中获取商业洞察,简化业务流程,降低成本,并获得行业竞争优势。金融服务、电信和医疗健康等关键基础设施领域的超过 4000 家政府和企业实体依靠 IBM 混合云平台和红帽 OpenShift 快速、高效、安全地实现数字化转型。IBM 在人工智能、量子计算、行业云解决方案和企业服务方面的突破性创新为我们的客户提供了开放和灵活的选择。对企业诚信、透明治理、社会责任、包容文化和服务精神的长期承诺是 IBM 业务发展的基石。

 

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

LED驱动电源的输入包括高压工频交流(即市电)、低压直流、高压直流、低压高频交流(如电子变压器的输出)等。

关键字: 驱动电源

在工业自动化蓬勃发展的当下,工业电机作为核心动力设备,其驱动电源的性能直接关系到整个系统的稳定性和可靠性。其中,反电动势抑制与过流保护是驱动电源设计中至关重要的两个环节,集成化方案的设计成为提升电机驱动性能的关键。

关键字: 工业电机 驱动电源

LED 驱动电源作为 LED 照明系统的 “心脏”,其稳定性直接决定了整个照明设备的使用寿命。然而,在实际应用中,LED 驱动电源易损坏的问题却十分常见,不仅增加了维护成本,还影响了用户体验。要解决这一问题,需从设计、生...

关键字: 驱动电源 照明系统 散热

根据LED驱动电源的公式,电感内电流波动大小和电感值成反比,输出纹波和输出电容值成反比。所以加大电感值和输出电容值可以减小纹波。

关键字: LED 设计 驱动电源

电动汽车(EV)作为新能源汽车的重要代表,正逐渐成为全球汽车产业的重要发展方向。电动汽车的核心技术之一是电机驱动控制系统,而绝缘栅双极型晶体管(IGBT)作为电机驱动系统中的关键元件,其性能直接影响到电动汽车的动力性能和...

关键字: 电动汽车 新能源 驱动电源

在现代城市建设中,街道及停车场照明作为基础设施的重要组成部分,其质量和效率直接关系到城市的公共安全、居民生活质量和能源利用效率。随着科技的进步,高亮度白光发光二极管(LED)因其独特的优势逐渐取代传统光源,成为大功率区域...

关键字: 发光二极管 驱动电源 LED

LED通用照明设计工程师会遇到许多挑战,如功率密度、功率因数校正(PFC)、空间受限和可靠性等。

关键字: LED 驱动电源 功率因数校正

在LED照明技术日益普及的今天,LED驱动电源的电磁干扰(EMI)问题成为了一个不可忽视的挑战。电磁干扰不仅会影响LED灯具的正常工作,还可能对周围电子设备造成不利影响,甚至引发系统故障。因此,采取有效的硬件措施来解决L...

关键字: LED照明技术 电磁干扰 驱动电源

开关电源具有效率高的特性,而且开关电源的变压器体积比串联稳压型电源的要小得多,电源电路比较整洁,整机重量也有所下降,所以,现在的LED驱动电源

关键字: LED 驱动电源 开关电源

LED驱动电源是把电源供应转换为特定的电压电流以驱动LED发光的电压转换器,通常情况下:LED驱动电源的输入包括高压工频交流(即市电)、低压直流、高压直流、低压高频交流(如电子变压器的输出)等。

关键字: LED 隧道灯 驱动电源
关闭