RISC-V CPU进入CUDA,还需要解决哪些挑战?
扫描二维码
随时随地手机看文章
现在CUDA只在x86和Arm架构CPU上得以部署,但英伟达正在将其移植到RISC-V架构的CPU上。
“其实我们不在乎CPU具体是什么。无论是x86、Arm或者是RISC-V,我们其实都能够兼容这些。”英伟达副总裁 Frans Sijstermanns在第五届RISC-V中国峰会上谈到。
推进CUDA向RISC-V CPU移植
英伟达与RISC-V的渊源由来已久。2017年首届RISC-V工作坊由上海交通大学与英伟达联合主办,这次工作坊也是全球第六届RISC-V研讨会,主题聚焦于在微控制器(MCU)中嵌入RISC-V。当时尚未有RISC-V产品发布,但英伟达已看到其潜力。八年后,英伟达在集成MCU产品中已出货超过10亿颗RISC-V芯片,取得了显著成功。
Frans Sijstermanns介绍了英伟达将并行计算平台CUDA移植到RISC-V架构的进展。CUDA作为C和C++语言的扩展,传统上在x86和Arm平台上运行。英伟达现正积极将CUDA扩展至RISC-V,旨在充分发挥其作为关键应用处理器的潜力。
CUDA包括两个主要组成部分:工具箱(Toolkit)和驱动程序。CUDA工具箱类似编译器,目前正进行RISC-V的移植工作,以实现编译和运行。
Frans Sijstermanns通过图表展示了完整应用运行时环境,包括应用软件、第三方软件和PyTorch等操作系统。核心组件如CUDA KMD(内核模式驱动)和CUDA UMD(用户模式驱动)正在适配RISC-V。此外,第三方和应用软件也需进行移植以确保兼容性。
Frans Sijstermanns强调了CUDA库在各行业中的重要性。例如,英伟达的FT库可加速推理,其他库则支持数据分析和芯片制造。英伟达在过去20年中开发了900多个库,旨在通过RISC-V落地这些资源,加速行业创新和技术迭代。这些库对推动不同领域的技术发展至关重要。
RISC-V CPU进入CUDA,还需要解决哪些挑战?
Frans Sijstermanns指出,RISC-V生态系统近年来取得长足进展。自2022年以来,至2025年已有至少10项新规范获得批准,其中包括关键的RVA23和服务器系统芯片(SoC)标准。RISC-V国际基金会官网列出了75个已在RISC-V上运行的软件包,包括Linux、工具链、数据库和虚拟机。然而,这些软件包仍需进一步优化和补丁支持。
虽然已经有了很大的推进,然而,将RISC-V CPU引入CUDA仍存在一些挑战:规格方面,服务器平台规格、性能事件、内存标记、机密虚拟机和矩阵尚在开发中;软件方面,优化、成熟度及更高层次的应用堆栈有待改进;主机CPU方面,缺乏RVA23合规主机CPU、AIA中断、IOMMU、虚拟机监控器及单核性能仍需提升。一旦生态系统成熟,标准CUDA发布将支持符合RISC-V服务器平台规格和Linux操作系统的环境。
确保CUDA在RISC-V上的板卡可用性和兼容性是当下的首要任务。例如,英伟达已使用阿里巴巴的C920处理器,但其尚未符合RVA23或新批准的SoC标准。统一的虚拟内存对于实现CPU与GPU之间的数据共享和一致性至关重要。Frans Sijstermanns强调需改进虚拟内存管理和板卡设计,以全面支持RVA23规范。
英伟达正与生态系统合作伙伴密切合作,优化CUDA以适配RISC-V,目标是发布符合服务器平台规范和Linux RISC-V标准的标准化版本。这需要解决系统级问题并确保强大的CPU开发。Frans Sijstermanns鼓励RISC-V社区持续协作,共同推动这些进展。
Frans Sijstermanns总结道,英伟达致力于加速计算,强调对x86、Arm和RISC-V等CPU架构的兼容性。CUDA与RISC-V服务器的整合,结合英伟达的通信处理器,旨在提供全面的硬件解决方案。从软件到硬件的过渡需要与生态系统伙伴的广泛协作以及强大的主机CPU支持。