[导读]〇、本文写作背景大约2年前,在腾讯内网,笔者和很多同事讨论了GPU虚拟化的现状和问题。从那以后,出现了一些新的研究方向,并且,有些业界变化,可能会彻底颠覆掉原来的一些论断。但这里并不是要重新介绍完整的GPU虚拟化的方案谱系。而是,我们将聚焦在英伟达GPUCUDA计算领域,介绍下我...
〇、本文写作背景
大约 2 年前,在腾讯内网,笔者和很多同事讨论了 GPU 虚拟化的现状和问题。从那以后,出现了一些新的研究方向,并且,有些业界变化,可能会彻底颠覆掉原来的一些论断。但这里并不是要重新介绍完整的 GPU 虚拟化的方案谱系。而是,我们将聚焦在英伟达 GPU CUDA 计算领域,介绍下我们最新的技术突破 qGPU,以及它的意义究竟是什么。关于 GPU 虚拟化的历史性介绍,我将直接摘抄当时的讨论。这也不是一篇介绍 TKE qGPU 产品特性的文章。而是,我们将潜入到前所未有的深度,去探索 GPU 调度和 QoS 的本质。本文也不是巨细靡遗的系统性探索,但你可以在这里看到别处不曾出现过的知识。本文涉及对一些厂商的推测性技术介绍,不保证准确性。一、术语介绍
GPU ————— Graphics Processing Unit,显卡CUDA ———— Compute Unified Device Architecture,英伟达 2006 年推出的计算 APIVT/VT-x/VT-d — Intel Virtualization Technology。-x 表示 x86 CPU,-d 表示 Device。SVM ————— AMD Secure Virtual Machine。AMD 的等价于 Intel VT-x 的技术。EPT ————— Extended Page Table,Intel 的 CPU 虚拟化中的页表虚拟化硬件支持。NPT ————— Nested Page Table,AMD 的等价于 Intel EPT 的技术。SR-IOV ——— Single Root I/O Virtualization。PCI-SIG 2007 年推出的 PCIe 虚拟化技术。PF ————— Physical Function,亦即物理卡VF ————— Virtual Function,亦即 SR-IOV 的虚拟 PCIe 设备MMIO ——— Memory Mapped I/O。设备上的寄存器或存储,CPU 以内存读写指令来访问。CSR ———— Control
本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除( 邮箱:macysun@21ic.com )。