当前位置:首页 > 原创 > 刘岩轩
[导读]光线追踪是指在模拟场景中对若干条模拟光线进行单独追踪,模拟光线其与场景中物体、物体表面材质的交互,从而达到全局照明场景中更真实的渲染效果。相比传统的光栅化渲染的方式,光线追踪虽然效果更好但同时对于计算资源的需求更高,传统软件实现方式并不能大规模普及开来

光线追踪是指在模拟场景中对若干条模拟光线进行单独追踪,模拟光线其与场景中物体、物体表面材质的交互,从而达到全局照明场景中更真实的渲染效果。相比传统的光栅化渲染的方式,光线追踪虽然效果更好但同时对于计算资源的需求更高,传统软件实现方式并不能大规模普及开来。英伟达在2018年推出了通过硬件加速来实现实时光线追踪的桌面级GPU,这可以看作是GPU领域的一次重大突破。而今时隔3年之后,Imagination推出了全新的移动GPU平台——C系列,通过全新的“光子”架构让光线追踪进入到了移动端,成为GPU史上又一次的重大迈进。
GPU重大突破:“光子”架构实现移动端光线追踪
图:Imagination提供的是否开启实时光线追踪的效果对比*

克服光线追踪进入移动端的难点

由于光线追踪对于计算资源有着很高的要求,而移动端又非常注重功耗的表现,所以光线追踪功耗表现是其进入移动端的第一难题。据Imagination技术前瞻副总裁Kristof Beets分享,移动端面临的限制很多,一方面核心的数量没有办法无限叠加,发热和功耗都会成为很大的问题。Imagination新推出的具有光线追踪功能的C系列GPU IP,它有专门的硬件部分把光线追踪相关的计算分流到光线追踪的硬件上,来实现光线追踪的效果。其中包括光线的反射、阴影、全局照明和环境光的遮蔽。总体上可以达到整个显示效果的极大提升,同时保留原来非常低的功耗和效率。

Imagination将新的光线追踪架构命名为“光子”。据Imagination中国区战略市场与生态副总时昕博士分享,“去创造一个新的宇宙,大家第一个想到的概念是什么?我想到上帝说的一句话“要有光”。我们要创造一个全新的虚拟世界,我们第一个需要的东西也是光,所以我们把新的光线追踪的架构命名为光子。”新的“光子”GPU架构这个专门用来进行光线追踪处理的硬件单元叫做RAC(光线加速集群),通过该硬件的加速可以实现传统 方式数倍的提升,各项性能几乎都能提高50%。以32位的CXTRT3举例:每秒钟可以计算13亿条光线的折射、反射,每秒算力达到1.5T,48G像素/s、纹理运算1.3G/s、48GBoxTest;如果做AI定点运算每秒可以达到6TOPS。
GPU重大突破:“光子”架构实现移动端光线追踪
在场景的渲染上,越真实的体验需要调度越多的硬件资源。根据不同的渲染等级,RAC中的不同硬件加速模块会相应的被调用,把光线遍历、追踪和监控算法通过专用的硬件来实现。当全局光照打开,数亿条光线打到物体上,将会产生非常大的计算量。Imagination会将数亿条光线通过分组的形式来进行计算,从而提高计算的效率。分组计算后的结果通过一致性检测硬件来进行簇化,将画面提升到最佳。
GPU重大突破:“光子”架构实现移动端光线追踪
将全新的RAC与之前B系列中的USC、TPU等放在一起,就可以组成一个具备光线追踪能力的移动GPU。据悉,CXT支持多核架构来实现更高的性能表现,例如4核架构最多可以达到7.8G Ray/s,同时还可以选择用专门神经网络加速器单元去做降噪的处理,将更多的资源去做图形相关的渲染计算。此外Imagination也开发了相应的软件工具,开发者可以查看每秒的光线数,测试的负载等;另外还有一个为内容开发者提供的软件开发套件,功能类似于跑在PowerVR上模拟出的效果。
GPU重大突破:“光子”架构实现移动端光线追踪

光线追踪的大规模应用之路

光线追踪的思路很早就已经出现,但受制于计算资源的需求较大,一直没能得到很大规模应用。而且在前期碎片化问题严重,一些方案均来自自有API或软件方案,这意味着内容开发者并不难在后台大量应用这些技术。专用的硬件加速的出现使其成为了可能,英伟达的硬件加速光线追踪桌面级GPU的发布是一个节点,让硬件方案进入市场并得到认可。而今Imagination的光线追踪移动GPU的发布,是一个更为重要的节点,带来了光追的大规模应用爆发的可能。

为了进一步推进光追的普及,Imagination率先提出了一个光追的分级体系,如下图所示:0级为传统方案,可能是在图形工作站上进行几个小时的画面渲染,可能也会有一些专业的非标准化的硬件来加速。1级是后来业界在将光追算法向GPU上逐渐迁移,将CPU版本软件转换成GPU的版本,借助GPU的并行计算能力来获得数量级加速。2级中出现了更多细致的光线处理的新的方式,3级中出现了硬件BVH处理能力。据时昕博士分享,目前行业中即使是PC上的光追,大概就在2、3级的水平。第4级别是当前Imagination所发布的新产品可以达到的,这是全球第一次达到该级别的硬件处理能力。第5级上会进一步将会更多计算工作负荷从原来的GPU的渲染器或着色器中分离出来,转移到专门的硬件上去加速,从而省下更多的GPU资源来做其他动态渲染,这样可以在性能提升的同时降低功耗。
GPU重大突破:“光子”架构实现移动端光线追踪
其实Imagination已经具备直接推出L5级别光追方案的能力,但由于现在市场并不成熟所以并没有推出。Kristof表示,没有选择现阶段推出L5级产品主要为了市场平衡考虑,Imagination跟市面上的光线追踪开发者有过沟通,如果现在推出市场上唯一的L5等级光线追踪硬件设备,因为市场没有准备所以不会有太多开发者来开发相应的应用。所以Imagaination决定先推出L4级别的CXT产品来培育市场,让游戏3D引擎、游戏开发者进入到生态中,再慢慢把光线追踪市场做大。在标准方面,现在市场上已经出现了一些光线追踪技术趋向于标准化、统一化的趋势。时昕表示,处理器的成功离不开整个生态,包括接口,包括编程的模式、工具等等。整个光追生态其中一个重要因素——API标准已经成型,包括Vulkan都有相关的标准出来,Imagination的硬件提供了可能性,上层内容开发者和工具开发者,也会遵循同样的光线追踪标准,相信很快会有很多丰富的内容出现。Imagination也积极与微软等合作伙伴进行密切的沟通,在此基础上继续提升GPU架构追求更好的PPA表现。

###

据悉诸多客户已经获得了最新CXT的IP授权,按照正常的产品研发周期推算,消费者有望在2023年在移动设备上体验到硬件光线追踪方案。


声明:该篇文章为本站原创,未经授权不予转载,侵权必究。
换一批
延伸阅读

北京——2024年4月25日 我们的客户选择亚马逊云科技运行他们的关键应用程序和最敏感的数据。每天,世界上发展最快的初创公司、最大的企业和最值得信赖的政府机构都选择亚马逊云科技作为技术基础设施平台。他们之所以选择亚马逊云...

关键字: GPU 计算 生成式AI

据报道,日本电信巨头软银集团将在未来两年投资1500亿日元(9.6亿美元)升级其计算设施,该计划包括大量采购英伟达GPU。

关键字: 软银 英伟达 GPU AI

4月24日消息,特斯拉CEO马斯克在最近的财报电话会议上透露,特斯拉的Optimus人形机器人预计将在今年底前具备执行“有用的”工厂任务的能力,并有望在2025年底前推向市场。这一消息引发了业界和公众的广泛关注。

关键字: 马斯克 AI 特斯拉 GPU

近日媒体Business Insider透露称,微软目前正在疯狂囤货GPU,目标在2024年12月前达到180万片。微软本次采购的 GPU 主要来自英伟达公司,不过微软也计划采购 AMD 等其它公司的 GPU 进行扩充。

关键字: 微软 GPU

Apr. 16, 2024 ---- NVIDIA新一代平台Blackwell,包含B系列GPU及整合NVIDIA自家Grace Arm CPU的GB200等。TrendForce集邦咨询指出,GB200的前一代为GH2...

关键字: CPU GPU

联发科官方近日宣布,天玑开发者大会(MDDC 2024)将于5月7日在深圳隆重开幕。此次大会以“AI予万物”为核心议题,旨在汇聚全球开发者智慧,共同探讨AI技术在多元领域的应用前景与发展动向。届时,众多行业领袖与资深专家...

关键字: 生成式AI GPU 天玑

4月9日消息,据媒体报道,马斯克最近表示,首艘无人驾驶的星舰将会在五年内登陆火星,或将在接下来的七年内实现第一批人类登陆火星。

关键字: 马斯克 AI 特斯拉 GPU

3月20日消息,全球最强AI芯片GB200横空出世,使得这届GTC 2024大会热度空前,也让英伟达创始人兼CEO黄仁勋再一次成为全球焦点人物。

关键字: 英伟达 GPU 芯片

The Weather Company 和台湾气象部门成为首批采用全新 Earth-2 云 API 的机构,使用 AI 加速全球气候和天气高分辨率模拟和可视化,突破性地实现 2 公里尺度

关键字: AI 数字孪生 GPU

3月19日消息,在英伟达年度 GTC 开发者大会上,黄仁勋宣布推出推出了Project GR00T人型机器人项目,其中就包括全球首款人型机器人基础模型。

关键字: 英伟达 GPU 芯片
关闭
关闭