先进汽车 GPU 的高速和高效开发将加速智能驾驶的更广泛普及
扫描二维码
随时随地手机看文章
中国汽车工业在继续保持全球产量第一的同时,也在加速电气化进程,智能化也在不断推进。图形处理器(GPU)已经成为智能驾驶和新一代座舱中,被用以实现先进驾驶辅助(ADAS)或者自动驾驶(AD),或者处理更多的屏显、实现人机互动和汽车与环境互动的核心处理器件之一,基于 GPU 开发的智驾芯片和智能座舱芯片具有广阔的前景。
作为世界第四大芯片 IP 公司,Imagination 在全球汽车 GPU IP 市场一直处于领先地位,并专为汽车市场开发了 XS 系列 GPU,该系列最新的 DXS 是一款可扩展、灵活的 GPU IP,专为处理驾驶舱、信息娱乐和高级驾驶辅助系统中的图形和计算工作负载而打造。
该处理器仅以单核 1.5TFLOPS 的处理能力在计算性能方面引领行业同侪,而且还引入多项创新实现了分布式安全性,消除了芯片设计公司以往为实现 ASIL-B 等级功能安全而产生的额外开销。目前,采用这种创新的、低成本的分布式安全机制 DXS GPU 已通过了 ASIL-B 汽车功能安全性认证。
除了算力和分布式安全等硬件方面的创新,Imagination 还为 DXS 系列 GPU 配置了全面的计算库和工具链,期望在提升开发效率和充分释放 DXS GPU 的性能方面,进一步加速智能驾驶芯片的设计和普及。
Imagination 提供的一系列底层计算库都经过深度软件调优。全新计算库和人工智能工具包,可帮助软件开发人员实现高达 80% 的 GPU 利用率。这也将加速常见计算工作负载的处理,如计算机视觉和 ADAS 系统感知数据的预处理和后处理。傅里叶变换加速库(imgFFT)在智能驾驶领域是处理传感器数据的得力助手。智能汽车搭载的雷达、摄像头等传感器会生成海量数据,imgFFT 能快速将时域数据转换到频域。例如,毫米波雷达不断发射和接收电磁波,产生的时域信号经 imgFFT 处理后,车辆可清晰分辨出周边物体的速度、距离等信息。在图像识别方面,摄像头拍摄的图像数据,通过 imgFFT 频域数据分析提取,可突出图像中的边缘、纹理等关键特征,使图像识别算法能更精准地识别道路标志、车道线以及其他车辆,帮助车辆提前做出反应,极大地提升了自动驾驶系统的环境感知能力和安全性。
线性代数库(imgBLAS)为智能驾驶中的复杂运算提供了高效支持。在路径规划算法里,imgBLAS 的矩阵运算能力发挥着关键作用。当车辆规划行驶路线时,要综合考虑地图数据、实时路况、自身位置等信息,这些都以矩阵形式呈现。借助 imgBLAS 的矩阵乘法、加法等优化函数,车辆能快速计算出不同路径的成本和可行性,找到最优行驶路径。在机器学习模型训练中,imgBLAS 同样不可或缺。像训练用于预测交通流量的模型时,涉及大量数据的矩阵运算,imgBLAS 能大幅提升运算速度,缩短模型训练时间,使模型更快适应路况变化,为自动驾驶决策提供更准确的依据。
神经网络库(imgNN)是推动自动驾驶技术智能化的核心力量。在自动驾驶系统的深度学习模型中,imgNN 为模型的训练和推理提供了有力支持。在训练阶段,imgNN 优化了模型参数更新的计算过程,加速了模型的收敛速度,使模型能够更快地学习到图像中各类物体的特征。在实际驾驶中,模型进入推理阶段,imgNN 能够高效处理摄像头传来的图像数据,迅速识别出车辆、行人、障碍物等目标,并准确判断其位置和运动状态,帮助车辆及时做出制动、避让等决策,使得自动驾驶系统的反应更加灵敏、决策更加精确,有力地推动了自动驾驶技术从理论走向实际应用。
Imagination 还将其开发库与 oneAPI Toolkit、TensorGraph Reference Kit 进行对接和优化,无论开发者在何种架构、平台上开发,或是使用开源框架,都能无缝使用这些库,极大地提升了开发环境选择的灵活性。
Imagination 致力于解决 GPU 开发的局限性问题,为开发者们提供了一套全面且极具创新性的解决方案。这一方案不仅打破了硬件厂商的壁垒,还极大地提升了开发效率,让开发者能够专注于算法优化和应用创新,从而在激烈的技术竞争中占据优势。
UXL 基金会,即 Unified Acceleration Foundation,是在当前全球 GPU 开发格局下应运而生的重要组织,其愿景是打破少数厂商利用其软件平台与 GPU 硬件构建的封闭生态系统带来的限制,使全球开发者可以不依赖某一特定软件平台进行 AI 和其他应用程序开发,从而解决其他硬件厂商的 GPU 在软件开发后适配上面临的诸多困难。UXL 基金会的目标是构建一个开源项目,打造一套能驱动多种 GPU 等加速器芯片的软件和工具,使开发者的代码能在任何机器上运行,而无需考虑具体使用何种芯片和硬件,以此推动建立开放标准的生态系统,打破硬件与软件之间的壁垒,统一异构计算生态。它基于 oneAPI 来提供跨平台编程接口和工具,如 oneDPL、oneDNN 等,以促进软件快速移植和开发效率。
目前,Imagination 及其客户和合作伙伴通过 oneAPI,携手解决了软件开发移植过程中遇到的许多问题,不仅有效地支持了开发者提升开发效率,还可加速软件移植和实现无形资产的全面复用。
Imagination 的 PVRTune 工具为开发者提供了精确的性能分析支持。该工具专门针对包括新推出的 DXS GPU 在内的 PowerVR 器件进行硬件级别的性能深度剖析。利用 PVRTune,开发者能够实时监控 GPU 负载、内存带宽等关键性能指标。在识别问题后,能够迅速定位性能瓶颈,优化代码结构,从而显著提升应用的运行效率。PVRTune 还支持多线程调试,协助开发者均衡各线程负载,预防资源冲突。通过其直观的可视化界面,开发者可以清晰地查看性能数据,并精确调整参数,进一步优化应用性能,确保即便在复杂场景中也能保持高效运行。
该参考计算和 AI 工具包已在客户和合作伙伴的项目开发中实现了许多成功范例。例如,澎峰科技基于 Imagination 的计算库构建 AI 解决方案,借助参考工具包,在 Imagination GPU 上运行各类人工智能应用,其中大语言推理引擎 PerfXLM 相较于 CPU 方案,性能提升高达 100%,且移植耗时极短。
目前,已有领先汽车芯片企业购买了 Imagination 的 DXS 系列汽车 GPU IP 的授权,预计在不久的将来,业界将看到采用 DXS GPU IP 开发的高算力、具有功能安全性的智驾芯片。这些智驾芯片除了充分发挥 Imagination 独特的 PowerVR GPU 架构、在行业内领先的 HyperLane 硬件隔离技术等创新,也为最终应用的开发者提供了从生态系统、底层库、性能分析工具到参考工具包的全方位支持,有效解决了传统开发环境的局限性问题。从而推动开发者发挥 GPU 技术在更灵活、更通用和生命周期更长等方面的优势,助力智驾芯片开发者快速实现高质量创新。