当前位置:首页 > 付斌
[导读]那么这款产品能够成为如此强大的“性能怪兽”,背后究竟有什么秘密?

上周,赛灵思宣布了业界首款“一体化SmartNIC平台”,是一款基于FPGA技术完成“网络”、“存储”和“计算加速”功能完美融合的单颗器件。短短一周时间,赛灵思宣布再次宣布发布Versal ACAP产品组合第三个产品Versal Premium。

这款新产品性能究竟有多强?直接先上对比,在图像分类上,Versal Premium(VP1802)分别是NVIDIA Tesla V100和Tesla V4的1.6倍和2.3倍;在对象检测上,分别是Tesla V100和Tesla V4的4.6倍和7.7倍;在异常检测上,能够比第二代Intel Xeon强65倍。


1Versal PremiumVP1802)在同等算法下的表现

在多太比特 ( Multi-Terabit ) 吞吐量上,与上一代产品对比吞吐量提升了5倍。

2:业界领先的多太比特 ( Multi-Terabit ) 吞吐量( 对比 ASSP

对比前一代FPGA,在布置800GDCI(数据中心互联)上,Versal Premium能够降低50%以上的功耗,占板空间也只有一半,并且还拥有2倍的带宽。

3:低于 100 瓦功耗提供单芯片 800G DCI (数据中心互联)吞吐量

在Block RAM 和 Ultra-RAM方面,Versal Premium能够提供123TB/s片上存储器带宽,而这是英伟达的9倍到25倍。

4Versal Premium ACAP 解锁了 GPU 无法企及的性能

那么这款产品能够成为如此强大的“性能怪兽”,背后究竟有什么秘密?

 

这么“能打”的产品,此前已有两款

 

需要注意的是,与“一体化SmartNIC平台”相同,Versal ACAP也是平台产品之一。赛灵思大中华区销售副总裁唐晓蕾(MariaTang)表示,赛灵思自六七年前开始,就已从器件逐渐转型到平台。围绕着FPGA技术,赛灵思瞄准了“数据中心优先”、“加速核心市场发展”和“驱动自适应计算”,ACAP(英文Adaptive Computing AccelerationPlatform,自适应计算加速平台)则属于“驱动自适应计算”中一环。

而据Victor Peng之前的发言来看,作为可以让FPGA和CPU、GPU相提并论并在性能远超二者的产品,ACAP是自赛灵思公司发明FPGA以来最卓著的工程成就。

在解释这款产品之前,还是先要强调ACAP(自适应计算加速平台)这一概念,赛灵思高端 ACAP 与 FPGA 高级产品线经理MikeThompson告诉记者,ACAP的计算加速首先通过标量引擎实现,包括ARM、应用处理器和实时处理器,而自适应引擎的核心便是可编程逻辑器件FPGA,另外还配备智能引擎,目前配备的是DSP。值得一提的是,在ACAP的平台上还会将会有AI引擎进行支持。

Versal则是承载这一切的平台,它由软件可编程的芯片基础设施组成,带有预置的连接,当启动时就可与系统和主机交谈。平台配备专门的接口,诸如PCle、DDR4和以太网。另外,平台还配备平台管理控制器,主要在软件和嵌入式层面进行管理。

Mike强调,Versal ACAP最大的差异化特点便是NoC(片上可编程网络),利用这项技术可实现引擎之间用户逻辑器件和连接界面间实现多束通道,无需额外资源,使用这项技术可以突破高性能、高带宽设计路径的瓶颈。另外,Versal产品组合还基于台积电(TSMC)的7 nm FinFET工艺技术。

5:自适应加速平台的构成(Versal Prime

自2018年赛灵思提出VersalACAP概念以来,于去年年终出货Versal AI Core和VersalPrime两款产品,而在此前Versal Premium也曾多次被提及,“千呼万唤始出来”,如今Versal Premium的终于展现在眼前。

另据Mike介绍,Versal AICore和Versal Prime现在已有几百家客户,反响非常好,而且在支持下许多客户也希望赛灵思能够加速生产,Versal AI Core大概能够提速2个季度,在今年的时候就能够生产。

6Versal ACAP系列产品目前已拥有三款产品

 

为什么说Versal Premium是最强7nm云端芯片

 

从数据上来说,这款产品与14nm/16nm FPGA 的带宽与计算密度比较,拥有3 倍带宽打造最快速、最安全的网络;拥有2 倍计算密度的灵活应变加速;具有高度集成的硬件/软件平台,提高生产力。

而Versal Premium这款产品最为独到之处在于:拥有最先进的112Gb/s PAM4收发器、600G 以太网硬核和600G Interlaken 连接、400G 高速加密以及内置 DMA、同时支持CCIX 和 CXL 支持的 PCIe Gen5。这意味着,这款产品除了Versal ACAP拥有平台一贯的NoC(片上可编程网络)和台积电(TSMC)的7 nm FinFET工艺技术,还将拥有极大的性能功耗和安全上的提升。

7:拥有独特功能Versal Premium

在以太网、Interlaken和加密核心的逻辑密度上,Versal Premium相当于22个16nm的FPGA,这使得开发者能够专注于差异化设计上,而无需分散精力在基础架构的连接上;另外,异构集成也使得Versal Premium能够超越摩尔定律限制,同时帮助客户大大资本支出(CAPEX)和运营成本(OPEX)。

8:网络 IP 集成提供了等效 22 FPGA 的逻辑密度

值得一提的是,Virtex UltraScale VU9P其中三分之一或20万个LUT用于基础设施连接,而Versal使用的是硬核,所以在基础设施上消耗的通用逻辑资源为0。

9:集成外壳释放更多逻辑用于定制

目前行业普遍使用的4 x 25G(100G)和8 x 50G(100G)的光通信,未来将4 x 100G(400G)和8 x100G(800G)的光通信时代。得益于112Gb/sPAM4收发器,Versal Premium能够实现9Tb/s可扩展、灵活应变的带宽。拥有如此强大的收发器好处便是可以自如应对单通道100G光通信和800G基础设施发展。

Mike为记者介绍表示,在面向安全网络的专用连接IP中,共有5Tb/s的可扩展以太网通量,1.8Tb/s的现用Interlaken连接,1.6Tb/s的加密线路速率吞吐量。对于客户来说,预构建连接能够实现最快投入市场并提供 ASIC 级功耗/性能。