人工智能时代的芯片新思维:Arm构筑AI新根基
扫描二维码
随时随地手机看文章
人工智能(AI)正在全方位改变我们的生活,从智能音箱到智能汽车,每一项AI应用的背后,都离不开强大芯片的默默支撑与高效运转。然而,随着AI计算需求暴增,芯片设计正面临巨大挑战:如何在性能、能效和安全之间找到平衡,同时精准契合客户的定制需求并快速推向市场?领先的计算平台公司Arm近期发布了《芯片新思维:人工智能时代的新根基》行业报告。从AI芯片设计的趋势和挑战,到Arm的技术创新,再到安全防御和生态系统的构筑,Arm解决方案工程部执行副总裁Kevork Kechichian围绕该报告与媒体分享了AI时代芯片设计的新方向。
报告指出,通过摩尔定律实现半导体缩放的传统方法已达到物理与经济的极限,产业正转向创新的替代方案,如定制芯片、计算子系统 (CSS) 以及芯粒 (chiplet),以持续提升性能与能效。如何应对AI时代的芯片设计难题?芯片设计的未来是什么?且看Arm的洞察与解析。
一、AI推动芯片革新,聚焦能效与可持续性
想象一下,训练一个AI模型需要消耗相当于几百户家庭一年的电量——这就是AI计算的现实。随着AI应用从云端走向手机、汽车等边缘设备,芯片设计正迎来大变革。
该报告指出,步入AI时代,定制芯片正在被全行业广泛采用,芯粒技术也在加速崛起。同时,行业协作越来越紧密。芯片设计不再是单打独斗,IP提供商、晶圆代工厂、封装厂都在联手创新。这种“团队作战”让芯片开发更快、更高效,通过标准化接口让不同模块无缝连接。
但AI芯片设计并非一片坦途。AI工作负载的计算需求极大,需要大量电力与能源资源来支持其运行。一大挑战是如何实现算力和能效的平衡。对此,Kevork表示,首先需要从最底层出发,从晶体管层开始,与晶圆代工厂紧密合作,确保晶体管在功耗和性能方面实现优化,无论是动态功耗还是漏电功耗;再来是架构层面,对CPU以及各类处理引擎的指令集进行针对性优化;然后向上进入整个结构中的更高层级,从系统级芯片(SoC)设计、封装到数据中心等方面进行优化。在此过程中,关键要点在于对数据及其传输过程的保护,降低在内存之间传输数据所消耗的电力;最后,在支撑大型数据中心运行的软件层,实现智能负载均衡,即针对AI的不同方面进行处理上的优化,并合理分配工作负载,尽可能减少不同节点之间的数据传输。
此外,定制芯片的开发成本非常高。开发一颗新芯片需要大量人力和计算资源。而且,客户希望芯片尽快上市,开发团队也面临着产品上市时间的压力。如何能够有效降低开发投入并加快产品上市时间?Kevork分享到,最基础的方法就是从平台的角度出发,识别可复用的模块与资源,并确保定制工作是在已有基础上进行,无需一切从零开始。
AI推理在设备端的加速落地也为行业带来了新挑战,比如如何在智能手机、物联网等端侧设备上实现高性能、高能效的计算。Kevork强调,AI推理运算需要独特的技术开发路径——从计算子系统到SoC框架的专用架构设计,再到实现这一切的软件体系。主要的架构差异在于对带宽和数据传输的关注,这些系统需要针对推理工作负载和高带宽进行优化,以满足不断增长的需求。
关于在云端进行模型训练与在边缘设备上运行推理的趋势,Kevork表示,一旦模型在云端利用海量数据集完成训练,就可以进行优化,使其能够运行在较小的服务器,甚至是边缘设备上,从而提升数据传输效率和整体性能。
二、应对AI时代芯片设计挑战的 “组合拳”
Arm作为计算平台的领头羊,拿出了一套应对AI时代下芯片设计挑战的“组合拳”。
持续发展计算子系统 (CSS)
Arm Neoverse CSS 经过验证的核心计算功能以及灵活的内存与 I/O 接口配置,加快了产品上市进程,带来显著的优势。它在确保软件一致性的同时,为 SoC 设计人员提供了灵活性,使其能够基于 CSS 周围新增定制子系统,以打造差异化的解决方案。微软、智原科技和 Rebellions 等公司展示了 CSS 如何实现定制芯片的快速开发,同时保留了系统级优化的灵活性。这种方法不仅降低了开发门槛,还让芯片和软件更兼容,帮客户在竞争激烈的市场中抢占先机。
聚焦异构计算
基于 Arm 架构的 CPU 正成为GPU 和 TPU 等 AI 加速器的理想搭档——既能高效管理数据流和通用计算任务,又能应对工作流程中遇到的瓶颈。Kevork表示,该范式中的 CPU、GPU 和 TPU 能够支持不同的工作负载。上述所有处理器都可以作为 AI 推理的处理引擎,被部署到 Arm 合作伙伴所开发的 SoC 中。
与此同时,大型 AI 模型的训练通常依赖高性能 GPU,而 Arm 的高能效处理器则非常适合在端侧和数据中心执行推理任务。而在可扩展性方面,Arm 架构支持 CPU、GPU 与专用加速器的无缝集成,这对于打造优化的 AI 系统至关重要。
推进芯粒技术的标准化
先进的封装技术和工艺推动了芯粒的发展。这些技术允许多个半导体晶粒的堆叠和互连,在提升性能和能效的同时,开创了现代芯片设计的可能性,如晶粒间接口以及新的 2.5D 和 3D 封装解决方案。理想情况下,芯片厂商无需重新设计一款芯片,只需添加更多芯粒以增加算力和性能,甚至可以升级现有芯粒,从而更快地将新产品推向市场。与此同时,生产更小的芯片还有助于提高良率,并减少制造过程中的浪费。
但芯粒也有难题:不同模块之间该怎么通信?Arm的答案是标准化。Arm 推出的芯粒系统架构 (Chiplet System Architecture, CSA),旨在对各个芯粒之间及在整个系统内的通信方式等多个方面实现标准化。此外,Arm 携手合作伙伴共同推动 AMBA CHI 芯片到芯片互连协议等倡议的落地实施,确保来自不同供应商的不同芯粒通过一个统一的接口协议来确保芯粒之间的互操作性。
Kevork强调,过去标准化常被视为放弃自身的 IP 或竞争优势。但如今,鉴于系统的高度复杂性以及合作模式的演变,标准化变得尤为重要——所有参与方都将从中获得多重益处。
三、加强应对AI时代的安全威胁
安全威胁随着 AI 技术的发展也在同步演进,其中 AI 驱动的网络攻击为各行各业带来新的挑战。报告指出,当前行业面临的安全挑战不仅在于防御已知威胁,还在于打造出强大的安全功能,以适应并抵御日益复杂的 AI 驱动型攻击,同时保持系统的性能和可靠性。
当谈及如何确保芯片在复杂多变的网络环境中的安全性时,Kevork 表示,Arm 正在通过构建多层级的软硬件防护体系,提升防御能力。比如,Arm 在芯片中直接集成加密技术,并结合经 AI 强化的安全监测系统,使现代 SoC 架构能够抵御传统攻击与新兴的威胁。
事实上,AI 本身也正日益成为抵御安全攻击的有力助手。通过基于网络的监测与先进的代码分析,AI 驱动的技术能够以人类难以企及的速度和规模识别可疑行为,并发现潜在漏洞。Arm 正在最大限度地发挥这一优势。
此外,快速发展的定制芯片在显著提升性能优化的同时,对安全性提出了更高要求。Arm 推出的 PSA Certified 已成为安全芯片设计领域的黄金标准。通过对安全启动、加密服务以及更新协议等方面制定全面的要求,PSA Certified为芯片制造商提供了清晰的路线图,使其能将安全机制深植于定制芯片解决方案的基础架构中。作为对PSA Certified的补充,物联网平台安全评估标准 (SESIP) 为定制芯片的安全评估提供了结构化的方法。该标准深入剖析多个关键安全领域,涵盖从安全初始化流程到敏感数据彻底清除的全过程,确保定制芯片在整个运行生命周期内始终保持其完整性与安全性。
写在最后
AI时代,芯片设计就像一场高难度的平衡游戏:性能要强、能耗要低、安全要牢、开发要快。就像Kevork所说的,“计算的未来,尤其是AI的未来,取决于我们能否持续突破芯片技术的极限。”随着新工艺节点需要更紧密的合作,芯片设计与制造之间的传统界限正在逐渐消失。新的时代需要具备创造力、系统级思维,以及对能效的不懈追求。
此外,Arm强大的生态系统让行业上下游拧成一股绳,共同推动AI技术落地。“Arm深知高效且可扩展的计算架构在释放 AI 潜能中的关键作用。通过与半导体生态系统中的合作伙伴持续协作,我们致力于应对能效、安全性和性能等根本性挑战,定义计算的未来。”Kevork总结道。