当前位置:首页 > 厂商动态 > Achronix半导体
[导读]Achronix 最新基于台积电(TSMC)的7nm FinFET工艺的Speedster7t FPGA器件包含了革命性的新型二维片上网络(2D NoC)。2D NoC如同在FPGA可编程逻辑结构上运行的高速公路网络一样,为FPGA外部高速接口和内部可编程逻辑的数据传输提供了超高带宽。

1. 概述

Achronix 最新基于台积电(TSMC)的7nm FinFET工艺的Speedster7t FPGA器件包含了革命性的新型二维片上网络(2D NoC)。2D NoC如同在FPGA可编程逻辑结构上运行的高速公路网络一样,为FPGA外部高速接口和内部可编程逻辑的数据传输提供了超高带宽。

如图1所示。

图1 Speedster 7t FPGA结构图

2. 2D NoC给Speedster 7t FPGA带来的优势

日益增长的数据加速需求对硬件平台提出了越来越高的要求,FPGA作为一种可编程可定制化的高性能硬件发挥着越来越重要的作用。近年来高端FPGA用了越来越多的Hard IP去提升FPGA外围的数据传输带宽以及存储器带宽。但是在逻辑阵列密度不断提升的同时,通信性能的提升并没有那么明显,所以FPGA内部数据的交换越来越成为数据传输的瓶颈。

Achronix将此挑战视为一个开发全新架构的机会,以消除传统FPGA的设计挑战并提高系统性能。Achronix的解决方案是在传统FPGA布线结构之上,创新地使用了革命性的二维(2D)高速片上网络(NoC)。Speedster7t NoC连接到所有片上高速接口:400G以太网、PCIe Gen5、GDDR6和DDR4 / 5的多个端口。

3. 2D NoC的性能

Speedster 7t FPGA上的二维片上网络(2D NoC)不是由可编程逻辑搭建,而是固化的ASIC逻辑实现,固定运行频率为2GHz,NoC使用一系列高速的行和列网络通路在整个FPGA内部分发数据,从而在整个FPGA结构中以水平和垂直方式分发数据流量。NoC中的每一行或每一列都有两个256位的、单向的、行业标准的AXI通道,可以在每个方向上以512 Gbps(256bit x 2GHz)的传输带宽运行。总带宽高达27Tbps。

图2 Speedster 7t FPGA NoC 和 接入点NAP

在Speedster 7t的二维片上网络中,每个交叉节点都有两个网络接入点(NAP),如图2所示,一个是master,一个是slave。整个器件总共有160个这样的接入点,这样可以保证无论逻辑放置在器件的任何地方,工具都能找到最近的NAP,使之走上二维片上网络。数据在二维片上网络上传输也会有延迟,数据没经过一个网格的长度,延时会增加2~3个时钟周期,也就是1~1.5ns(时钟固定为2GHz,所以一个周期为0.5ns)。

由此可见,二维片上网络给高端FPGA带了巨大的性能优势,但是如何高效的利用这种优势给自己的应用带来实质性的性能提升至关重要。

4. 如何更高效地规划2D NoC的性能—可视化的NoC性能分析

Achronix在新版ACE工具中提供一个可视化的NoC性能分析工具,只用导入simulation的log文件就可以直观的看到在不同的时间片,NoC上面的带宽占用情况,以便于设计者能更好地规划NAP的位置,均衡NoC的带宽利用,使其工作地更为高效。

工具使用起来非常简单,在ACE工具中点击图标,就可以进入NoC Performance View的页面,在这个页面中点击Browse,导入仿真的log文件。

图3导入仿真log文件

在NoC Performance View页面的右边有一个选项列表,可以显示不同条件下NoC占用情况。第一个选项是选择显示的协议,Flit还是AXI。第二个选项是选择显示哪种AXI Type。第三个选项是选择显示模式,Throughput模式还是Blockage模式。

图4 NoC Performance View选项

在Throughput模式下,绿色代表高吞吐量,浅蓝色代表中等吞吐量,深蓝色代表低吞吐量,如图5所示。

图5 NoC Performance View的throughput模式

在Blockage模式下,红色代表拥塞程度最高,黄色代表拥塞程度中等,绿色代表拥塞程度低。如图6所示。

图5 NoC Performance View的Blockage模式

在图中用鼠标悬停在有颜色的部分,在悬浮的窗口中会显示图中对应的具体的log文件中的信息,包括时间点以及哪条会话。

图6鼠标悬浮显示

所以通过NoC Performance View的工具,我们可以很直观的看到二维片上网络的使用情况,哪里利用率比较高,哪里利用率比较低,根据这个工具我们可以更容易的为逻辑指定更适合接入点NAP去接入到而且片上网络,从而使二维片上网络更高效的运行。

后面我们会继续深入了解Speedster 7t FPGA各种特性,并且会用一些例子来说明如何更高效的利用这些特性,敬请期待。

参考文献:

Achronix网站

使用带有片上高速网络的FPGA的八大好处(WP020)


本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

Bluespec支持加速器功能的RISC-V处理器将Achronix的FPGA转化为可编程SoC

关键字: RISC-V处理器 FPGA SoC

为无处不在的端侧设备插上AI的翅膀,AMD发布第二代Versal™ 自适应 SoC

关键字: AMD FPGA 自适应SoC AI 边缘计算

Pmod接口可以说是数字电路板的连接革命。随着科技的飞速发展,数字电路板间的通信与连接技术也在不断创新和进步。Pmod接口,作为一种新兴的数字接口标准,正逐渐成为数字电路板间通信的桥梁,为电子设备的连接和通信带来了革命性...

关键字: pmod接口 FPGA 数字电路板

近日举办的GTC大会把人工智能/机器学习(AI/ML)领域中的算力比拼又带到了一个新的高度,这不只是说明了通用图形处理器(GPGPU)时代的来临,而是包括GPU、FPGA和NPU等一众数据处理加速器时代的来临,就像GPU...

关键字: FPGA AI 图形处理器

加利福尼亚州 坎贝尔 – 2024 年 3月 13 日 – Arteris, Inc.(纳斯达克股票代码:AIP)是一家领先的系统 IP 供应商,致力于加速片上系统(SoC)创建。Arteris今天宣布立即推出最新版本...

关键字: 硬件加速器 片上网络 SoC

当我们提到成本优化型FPGA,往往与简化逻辑资源、有限I/O和较低制造工艺联系在一起。诚然,在成本受限的系统设计中,对于价格、功耗和尺寸的要求更为敏感;但随着一系列创新应用的发展、随着边缘AI的深化,成本优化型FPGA也...

关键字: AMD FPGA Spartan 边缘计算

全球领先的高性能现场可编程门阵列(FPGA)和嵌入式FPGA(eFPGA)半导体知识产权(IP)提供商Achronix Semiconductor公司宣布,该公司参加了由私募股权和风险投资公司Baird Capital举...

关键字: FPGA 智能汽车 eFPGA

全新 FPGA 能为嵌入式视觉、医疗、工业互联、机器人与视频应用提供高数量 I/O、功率效率以及卓越的安全功能

关键字: FPGA 嵌入式视觉 机器人

Altera致力于为客户提供端到端的FPGA、易于使用的AI、软件和弹性供应链。

关键字: FPGA AI

在半导体领域,大部分对于AI的关注都集中在GPU或专用AI加速器芯片(如NPU和TPU)上。但事实证明,有相当多的组件可以直接影响甚至运行AI工作负载。FPGA就是其中之一。

关键字: FPGA AI 半导体
关闭
关闭