当前位置:首页 > 原创 > 刘岩轩
[导读]光线追踪是指在模拟场景中对若干条模拟光线进行单独追踪,模拟光线其与场景中物体、物体表面材质的交互,从而达到全局照明场景中更真实的渲染效果。相比传统的光栅化渲染的方式,光线追踪虽然效果更好但同时对于计算资源的需求更高,传统软件实现方式并不能大规模普及开来

光线追踪是指在模拟场景中对若干条模拟光线进行单独追踪,模拟光线其与场景中物体、物体表面材质的交互,从而达到全局照明场景中更真实的渲染效果。相比传统的光栅化渲染的方式,光线追踪虽然效果更好但同时对于计算资源的需求更高,传统软件实现方式并不能大规模普及开来。英伟达在2018年推出了通过硬件加速来实现实时光线追踪的桌面级GPU,这可以看作是GPU领域的一次重大突破。而今时隔3年之后,Imagination推出了全新的移动GPU平台——C系列,通过全新的“光子”架构让光线追踪进入到了移动端,成为GPU史上又一次的重大迈进。
GPU重大突破:“光子”架构实现移动端光线追踪
图:Imagination提供的是否开启实时光线追踪的效果对比*

克服光线追踪进入移动端的难点

由于光线追踪对于计算资源有着很高的要求,而移动端又非常注重功耗的表现,所以光线追踪功耗表现是其进入移动端的第一难题。据Imagination技术前瞻副总裁Kristof Beets分享,移动端面临的限制很多,一方面核心的数量没有办法无限叠加,发热和功耗都会成为很大的问题。Imagination新推出的具有光线追踪功能的C系列GPU IP,它有专门的硬件部分把光线追踪相关的计算分流到光线追踪的硬件上,来实现光线追踪的效果。其中包括光线的反射、阴影、全局照明和环境光的遮蔽。总体上可以达到整个显示效果的极大提升,同时保留原来非常低的功耗和效率。

Imagination将新的光线追踪架构命名为“光子”。据Imagination中国区战略市场与生态副总时昕博士分享,“去创造一个新的宇宙,大家第一个想到的概念是什么?我想到上帝说的一句话“要有光”。我们要创造一个全新的虚拟世界,我们第一个需要的东西也是光,所以我们把新的光线追踪的架构命名为光子。”新的“光子”GPU架构这个专门用来进行光线追踪处理的硬件单元叫做RAC(光线加速集群),通过该硬件的加速可以实现传统 方式数倍的提升,各项性能几乎都能提高50%。以32位的CXTRT3举例:每秒钟可以计算13亿条光线的折射、反射,每秒算力达到1.5T,48G像素/s、纹理运算1.3G/s、48GBoxTest;如果做AI定点运算每秒可以达到6TOPS。
GPU重大突破:“光子”架构实现移动端光线追踪
在场景的渲染上,越真实的体验需要调度越多的硬件资源。根据不同的渲染等级,RAC中的不同硬件加速模块会相应的被调用,把光线遍历、追踪和监控算法通过专用的硬件来实现。当全局光照打开,数亿条光线打到物体上,将会产生非常大的计算量。Imagination会将数亿条光线通过分组的形式来进行计算,从而提高计算的效率。分组计算后的结果通过一致性检测硬件来进行簇化,将画面提升到最佳。
GPU重大突破:“光子”架构实现移动端光线追踪
将全新的RAC与之前B系列中的USC、TPU等放在一起,就可以组成一个具备光线追踪能力的移动GPU。据悉,CXT支持多核架构来实现更高的性能表现,例如4核架构最多可以达到7.8G Ray/s,同时还可以选择用专门神经网络加速器单元去做降噪的处理,将更多的资源去做图形相关的渲染计算。此外Imagination也开发了相应的软件工具,开发者可以查看每秒的光线数,测试的负载等;另外还有一个为内容开发者提供的软件开发套件,功能类似于跑在PowerVR上模拟出的效果。
GPU重大突破:“光子”架构实现移动端光线追踪

光线追踪的大规模应用之路

光线追踪的思路很早就已经出现,但受制于计算资源的需求较大,一直没能得到很大规模应用。而且在前期碎片化问题严重,一些方案均来自自有API或软件方案,这意味着内容开发者并不难在后台大量应用这些技术。专用的硬件加速的出现使其成为了可能,英伟达的硬件加速光线追踪桌面级GPU的发布是一个节点,让硬件方案进入市场并得到认可。而今Imagination的光线追踪移动GPU的发布,是一个更为重要的节点,带来了光追的大规模应用爆发的可能。

为了进一步推进光追的普及,Imagination率先提出了一个光追的分级体系,如下图所示:0级为传统方案,可能是在图形工作站上进行几个小时的画面渲染,可能也会有一些专业的非标准化的硬件来加速。1级是后来业界在将光追算法向GPU上逐渐迁移,将CPU版本软件转换成GPU的版本,借助GPU的并行计算能力来获得数量级加速。2级中出现了更多细致的光线处理的新的方式,3级中出现了硬件BVH处理能力。据时昕博士分享,目前行业中即使是PC上的光追,大概就在2、3级的水平。第4级别是当前Imagination所发布的新产品可以达到的,这是全球第一次达到该级别的硬件处理能力。第5级上会进一步将会更多计算工作负荷从原来的GPU的渲染器或着色器中分离出来,转移到专门的硬件上去加速,从而省下更多的GPU资源来做其他动态渲染,这样可以在性能提升的同时降低功耗。
GPU重大突破:“光子”架构实现移动端光线追踪
其实Imagination已经具备直接推出L5级别光追方案的能力,但由于现在市场并不成熟所以并没有推出。Kristof表示,没有选择现阶段推出L5级产品主要为了市场平衡考虑,Imagination跟市面上的光线追踪开发者有过沟通,如果现在推出市场上唯一的L5等级光线追踪硬件设备,因为市场没有准备所以不会有太多开发者来开发相应的应用。所以Imagaination决定先推出L4级别的CXT产品来培育市场,让游戏3D引擎、游戏开发者进入到生态中,再慢慢把光线追踪市场做大。在标准方面,现在市场上已经出现了一些光线追踪技术趋向于标准化、统一化的趋势。时昕表示,处理器的成功离不开整个生态,包括接口,包括编程的模式、工具等等。整个光追生态其中一个重要因素——API标准已经成型,包括Vulkan都有相关的标准出来,Imagination的硬件提供了可能性,上层内容开发者和工具开发者,也会遵循同样的光线追踪标准,相信很快会有很多丰富的内容出现。Imagination也积极与微软等合作伙伴进行密切的沟通,在此基础上继续提升GPU架构追求更好的PPA表现。

###

据悉诸多客户已经获得了最新CXT的IP授权,按照正常的产品研发周期推算,消费者有望在2023年在移动设备上体验到硬件光线追踪方案。


声明:该篇文章为本站原创,未经授权不予转载,侵权必究。
换一批
延伸阅读

今日,荣耀X40 GT首发上市开售,起价2099元,优惠100元后到手1999元起。据荣耀官方消息,荣耀X40 GT今日首发就摘得京东、天猫安卓手机销量&销售额双冠军。作为一款游戏手机,荣耀X40 GT展现什么叫...

关键字: 荣耀 GPU LCD TURBO

最近华为Mate 50系列和苹果iPhone 14系列都比较火,二者各有各的优点,不过没有麒麟芯成了华为Mate 50系列永远的痛,其采用的骁龙8+芯片性能虽然不错,但是和苹果A16相比,还是具有一定的差距,而且没有了自...

关键字: 国产 GPU 芯片

最近为什么越来越多的研究开始利用FPGA作为CNN加速器?FPGA与CNN的相遇究竟能带来什么神奇效果呢?原来,FPGA拥有大量的可编程逻辑资源,相对于GPU,它的可重构性以及高功耗能效比的优点,是GPU无法比拟的;同时...

关键字: FPGA 可编程逻辑资源 GPU

(全球TMT2022年9月26日讯)台湾服务器制造公司英业达推出Rhyperior,这款强力的GPU加速器系统能满足数字时代现代企业的一切需求,特别是严重依赖人工智能(AI)和机器学习(ML)的企业。 功能强大...

关键字: 加速器 GPU RIO NVIDIA

Imagination 联合百度飞桨创建Model Zoo开源机器学习模型库“硬件生态共创计划”成果为人工智能开发者和 SoC 设计者提供增强支持

关键字: Imagination 百度飞桨

传全球GPU龙头英伟达(NVIDIA)为了满足大陆客户激增的需求,近期对台积电下了“超级急件(super hot runs)”订单,计划在美国管制其A100/H100 GPU产品销往大陆的缓冲期之内完成更多的交付。

关键字: NVIDIA 台积电 GPU

国产GPU厂商天数智芯公布了国内首个通用计算应用开发及评测平台DeepSpark,以及旗下首款7nm制程的云端推理通用GPU芯片“智铠100”。

关键字: 天数智芯 GPU NVIDIA 7nm

Rhyperior是一种高效的理想系统,可显著提高现代工作负载的性能。 台北2022年9月26日 /美通社/ -- 台湾服务器制造领先公司英业达(TPE: 2356)推出Rhyperior,这款强力的GPU加速器系统能...

关键字: 加速器 GPU RIO AI

(全球TMT2022年9月26日讯)埃森哲最新财务报告显示, 埃森哲2022财年(截至2022年8月31日)全球营业收入达到616亿美元,以美元和当地货币计,创纪录地分别同比增长22%和26%;营业利润率达15.2%,...

关键字: MCS 华为 ENGINE GPU

AMD方面:1、暂停所有数据中心GPU 卡MI100和MI200对对中国区的发货;2、统计中国区 Ml 100已发货量;3、统计中国区MI 200已发货客户清单和发货明细。AMD中国分析,可能是美国政府要限制对中国区高性...

关键字: GPU AMD NVIDIA

刘岩轩

539 篇文章

关注

发布文章

编辑精选

技术子站

关闭