当前位置:首页 > 嵌入式 > 嵌入式分享

NVIDIA是GPU加速领域最强平台之一,近日了发布全新的CUDA 11版本工具包,特别为新诞生的安培架构进行了优化。

CUDA 11完全支持在安培新架构上进行开发,包括A100 GPU,以及基于它的DGX A100、HGX A100等多路系统,并支持安培架构的第三代Tensor张量核心,可针对不同数据类型加速混合精度矩阵计算,比如TF32、Bfloat16。

其他新技能:

- 多实例GPU虚拟化和GPU分区,提升GPU利用率

- 优化库性能,包括线性代数、快速傅里叶变换(FFT)、矩阵乘法、JPEG解码等等

- 改进编程与API,包括任务图表、异步数据转移、精细同步、二级缓存驻留管理等等

- 增强Nsight开发工具集,包括跟踪、编译、调试分析

- 完整支持各种主要CPU架构,包括x86、ARM64、Power

- CUDA C++改进编译器性能和稳定性、支持新的主编译器和语言标准(包括C++17)、支持Parallel C++ STL

想要这款工具包的可以下载去用了。

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除( 邮箱:macysun@21ic.com )。
换一批
延伸阅读
关闭