借助全新 AMD Alveo™ V80 计算加速卡释放计算能力

[导读]对于大规模数据处理，最佳性能不仅取决于原始计算能力，还取决于高存储器带宽。因此，全新 AMD Alveo™ V80 计算加速卡专为具有大型数据集的内存受限型应用而设计，这些应用需要 FPGA 硬件灵活应变能力以实现工作负载优化。Alveo V80 加速卡现已量产出货，其能提供较之上一代加速卡至高 2 倍的带宽与计算密度1，并为使用 AMD Vivado™ 设计套件的 FPGA 设计人员提供简化的开发流程。

对于大规模数据处理，最佳性能不仅取决于原始计算能力，还取决于高存储器带宽。因此，全新 AMD Alveo™ V80 计算加速卡专为具有大型数据集的内存受限型应用而设计，这些应用需要 FPGA 硬件灵活应变能力以实现工作负载优化。Alveo V80 加速卡现已量产出货，其能提供较之上一代加速卡至高 2 倍的带宽与计算密度1，并为使用 AMD Vivado™ 设计套件的 FPGA 设计人员提供简化的开发流程。

图1：Alveo V80 计算加速卡

这款全新加速卡采用全高、3/4 长（ FH¾L ）尺寸规格，由 AMD Versal™ HBM 自适应 SoC 提供支持，具备 2,600,000 个 LUT 逻辑单元的 FPGA 架构、10,848 个 DSP 计算逻辑片以及 820 GB/s 的存储器带宽，从而助力克服性能瓶颈。

与前代产品 AMD Alveo U55C 计算加速卡相比，Alveo V80 的逻辑密度至高翻倍、存储器带宽至高翻倍且网络带宽可高至 4 倍1，可以实现强大的计算集群，同时还能优化卡、服务器数量以及机架空间。

面向大型数据集和内存密集型工作负载专属打造的网络附接加速卡

Alveo V80 卡的硬件灵活性允许跨不同的自定义工作负载进行广泛应用。作为一款 4x200G 网络附接加速卡，该卡可以实时处理大量传入数据，避开 GPU 遇到的 PCIe® 连接限制。

图 2：大规模加速计算密集型内存受限工作负载

Alveo V80 加速卡可通过以太网扩展到数百个节点实现计算集群，非常适合一系列高性能计算应用，包括基因组测序、分子动力学和传感器处理。在网络安全方面，内置 400G 加密引擎和 600G 以太网硬块，加之 FPGA 的硬件灵活性，令 Alveo V80 加速器适用于线速数据包检测和 AI 支持的异常检测。

该加速卡还非常适合计算存储和数据分析，能够在同一张卡上集成压缩和查询加速，从而增加有效存储容量，同时更快获得洞察。此外，它还适合于各种金融科技应用，包括策略回测、期权定价以及金融建模与仿真。

案例：天体物理学计算飞跃

联邦科学与工业研究组织（ CSIRO ）是澳大利亚的国立研究组织，其参与建造了世界上最大的射电天文学天线阵列，该天线阵列目前包含 420 张 Alveo U55C 加速器卡用于处理无线电波，以研究早期宇宙并探索星系演化。

CSIRO计划借助 Alveo V80 加速卡缩减占板面积与成本，并将所需加速卡的数量精简多达 66%，同时应对来自望远镜 131,000 个天线的新信号处理任务。考虑到卡、服务器、机架空间和功耗的潜在减少，每卡算力的跃升预计可带来至高 20% 总拥有成本（ TCO ）下降2。

CSIRO 空间与天文学部研究工程师 Grant Hampson 表示：“我们起初采用 Alveo 产品线是因为它能够实时处理大量传感器数据。对于我们的下一代波束成形器和相关器来说，降低总拥有成本势在必行。 Alveo V80 加速卡是对上一代 Alveo U55C 卡的技术阶跃提升，以经济高效的占板面积提供了紧凑、节能的解决方案2。”

图 3：AMD Alveo V80 加速卡实现的预估传感器处理和 TCO 节省2（参见尾注 ALV-162）

为 FPGA 设计人员简化开发

Alveo V80 加速卡经由 Alveo Versal 示例设计（ AVED ）完全可为传统硬件开发人员使用，现已在 GitHub 上提供。AVED 利用传统 FPGA 和 RTL 流程简化了硬件启动，并且基于常见的 Vivado 工具流程。示例设计采用在 AMD Versal 自适应 SoC 上实现并专门针对 Alveo V80 加速器卡的预构建子系统，提供了高效的起点。

在系统层面，Alveo V80 计算加速卡简化了系统集成并提供了快速的量产路径。通过使用预先验证的部署卡，设计团队可以避开 PCB 集成、库存管理和产品生命周期管理任务。

现已出货

Alveo V80 已投入量产，现可从 AMD 和授权经销商处购买。

1：基于截至 2024 年 4 月公开发布的 AMD Alveo 产品选型指南中发布的规格。(ALV-13)。

2：基于 CSIRO 在 2023 年 10 月进行的独立“早期试用体验”性能和成本分析估算，比较了 420 张 Alveo U55C 加速卡的现有实施与 140 张 AMD Alveo V80 加速卡的预期实施。预计总拥有成本以三年期计算，包括电力和冷却运营支出的预计成本。所有性能和成本节省声明均为 CSIRO 提供的估算值，未经 AMD 验证。性能和成本效益受各种假设和变量影响，且可能基于系统配置和其他因素而发生变化。结果仅针对 CSIRO，可能不具典型性。有关更多详细信息，请参见图 (3) (ALV-16)。