当前位置:首页 > 厂商动态 > AMD
[导读]对于大规模数据处理,最佳性能不仅取决于原始计算能力,还取决于高存储器带宽。 因此,全新 AMD Alveo™ V80 计算加速卡专为具有大型数据集的内存受限型应用而设计,这些应用需要 FPGA 硬件灵活应变能力以实现工作负载优化。Alveo V80 加速卡现已量产出货,其能提供较之上一代加速卡至高 2 倍的带宽与计算密度1,并为使用 AMD Vivado™ 设计套件的 FPGA 设计人员提供简化的开发流程。

对于大规模数据处理,最佳性能不仅取决于原始计算能力,还取决于高存储器带宽。 因此,全新 AMD Alveo™ V80 计算加速卡专为具有大型数据集的内存受限型应用而设计,这些应用需要 FPGA 硬件灵活应变能力以实现工作负载优化。Alveo V80 加速卡现已量产出货,其能提供较之上一代加速卡至高 2 倍的带宽与计算密度1,并为使用 AMD Vivado™ 设计套件的 FPGA 设计人员提供简化的开发流程。

图1:Alveo V80 计算加速卡

这款全新加速卡采用全高、3/4 长( FH¾L )尺寸规格,由 AMD Versal™ HBM 自适应 SoC 提供支持,具备 2,600,000 个 LUT 逻辑单元的 FPGA 架构、10,848 个 DSP 计算逻辑片以及 820 GB/s 的存储器带宽,从而助力克服性能瓶颈。

与前代产品 AMD Alveo U55C 计算加速卡相比,Alveo V80 的逻辑密度至高翻倍、存储器带宽至高翻倍且网络带宽可高至 4 倍1,可以实现强大的计算集群,同时还能优化卡、服务器数量以及机架空间。

面向大型数据集和内存密集型工作负载专属打造的网络附接加速卡

Alveo V80 卡的硬件灵活性允许跨不同的自定义工作负载进行广泛应用。作为一款 4x200G 网络附接加速卡,该卡可以实时处理大量传入数据,避开 GPU 遇到的 PCIe® 连接限制。


图 2:大规模加速计算密集型内存受限工作负载

Alveo V80 加速卡可通过以太网扩展到数百个节点实现计算集群,非常适合一系列高性能计算应用,包括基因组测序、分子动力学和传感器处理。 在网络安全方面,内置 400G 加密引擎和 600G 以太网硬块,加之 FPGA 的硬件灵活性,令 Alveo V80 加速器适用于线速数据包检测和 AI 支持的异常检测。

该加速卡还非常适合计算存储和数据分析,能够在同一张卡上集成压缩和查询加速,从而增加有效存储容量,同时更快获得洞察。此外,它还适合于各种金融科技应用,包括策略回测、期权定价以及金融建模与仿真。

案例:天体物理学计算飞跃

联邦科学与工业研究组织( CSIRO )是澳大利亚的国立研究组织,其参与建造了世界上最大的射电天文学天线阵列,该天线阵列目前包含 420 张 Alveo U55C 加速器卡用于处理无线电波,以研究早期宇宙并探索星系演化。

CSIRO计划借助 Alveo V80 加速卡缩减占板面积与成本,并将所需加速卡的数量精简多达 66%,同时应对来自望远镜 131,000 个天线的新信号处理任务。考虑到卡、服务器、机架空间和功耗的潜在减少,每卡算力的跃升预计可带来至高 20% 总拥有成本( TCO )下降2。

CSIRO 空间与天文学部研究工程师 Grant Hampson 表示:“我们起初采用 Alveo 产品线是因为它能够实时处理大量传感器数据。对于我们的下一代波束成形器和相关器来说,降低总拥有成本势在必行。 Alveo V80 加速卡是对上一代 Alveo U55C 卡的技术阶跃提升,以经济高效的占板面积提供了紧凑、节能的解决方案2。”


图 3:AMD Alveo V80 加速卡实现的预估传感器处理和 TCO 节省2(参见尾注 ALV-162)

为 FPGA 设计人员简化开发

Alveo V80 加速卡经由 Alveo Versal 示例设计( AVED )完全可为传统硬件开发人员使用,现已在 GitHub 上提供。AVED 利用传统 FPGA 和 RTL 流程简化了硬件启动,并且基于常见的 Vivado 工具流程。示例设计采用在 AMD Versal 自适应 SoC 上实现并专门针对 Alveo V80 加速器卡的预构建子系统,提供了高效的起点。

在系统层面,Alveo V80 计算加速卡简化了系统集成并提供了快速的量产路径。通过使用预先验证的部署卡,设计团队可以避开 PCB 集成、库存管理和产品生命周期管理任务。

现已出货

Alveo V80 已投入量产,现可从 AMD 和授权经销商处购买。


1:基于截至 2024 年 4 月公开发布的 AMD Alveo 产品选型指南中发布的规格。(ALV-13)。

2:基于 CSIRO 在 2023 年 10 月进行的独立“早期试用体验”性能和成本分析估算,比较了 420 张 Alveo U55C 加速卡的现有实施与 140 张 AMD Alveo V80 加速卡的预期实施。预计总拥有成本以三年期计算,包括电力和冷却运营支出的预计成本。所有性能和成本节省声明均为 CSIRO 提供的估算值,未经 AMD 验证。性能和成本效益受各种假设和变量影响,且可能基于系统配置和其他因素而发生变化。 结果仅针对 CSIRO,可能不具典型性。有关更多详细信息,请参见图 (3) (ALV-16)。

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

UART(Universal Asynchronous Receiver/Transmitter)是一种通信协议,用于在电子设备之间传输数据。它是一种串行通信协议,意味着数据位按顺序一个接一个地传输。

关键字: FPGA UART串口通信

Bourns® TLVR1005T 和 TLVR1105T 系列采用双绕组结构和低感值设计,可提供快速瞬态响应,并可依据 CPU、FPGA 和 ASIC 负载要求进行延展

关键字: 数据驱动 电感器 FPGA

8b10b编码作为数字通信领域中的一项重要线路编码方案,其核心理念在于将每8位数据映射到10位编码中。这个映射过程严格按照特定规则进行,旨在保证编码中的电平转换足够,以维持信号的直流平衡,并提供足够的时钟信息,使接收端能...

关键字: FPGA 8b/10b编码 IC设计

在FPGA和IC设计领域,经常会面临一个挑战:多个端口同时竞争一个端口的数据。在这种情况下,采用RR调度策略可能是一种解决方案。

关键字: FPGA 嵌入式系统 IC设计

2024 年5月13日 – 专注于推动行业创新的知名新品引入 (NPI) 代理商™贸泽电子 (Mouser Electronics) 是英特尔®产品的全球授权代理商。英特尔®宣布正式成立Altera™,作为其独立运营的全...

关键字: FPGA 人工智能 以太网

Bluespec支持加速器功能的RISC-V处理器将Achronix的FPGA转化为可编程SoC

关键字: RISC-V处理器 FPGA SoC

为无处不在的端侧设备插上AI的翅膀,AMD发布第二代Versal™ 自适应 SoC

关键字: AMD FPGA 自适应SoC AI 边缘计算

Pmod接口可以说是数字电路板的连接革命。随着科技的飞速发展,数字电路板间的通信与连接技术也在不断创新和进步。Pmod接口,作为一种新兴的数字接口标准,正逐渐成为数字电路板间通信的桥梁,为电子设备的连接和通信带来了革命性...

关键字: pmod接口 FPGA 数字电路板

近日举办的GTC大会把人工智能/机器学习(AI/ML)领域中的算力比拼又带到了一个新的高度,这不只是说明了通用图形处理器(GPGPU)时代的来临,而是包括GPU、FPGA和NPU等一众数据处理加速器时代的来临,就像GPU...

关键字: FPGA AI 图形处理器
关闭