当前位置:首页 > EDA > 电子设计自动化
[导读] 近来,Altera公司推出业界首款浮点FPGA,它集成了硬核IEEE754兼容浮点运算功能,提高了DSP性能、设计人员的效能和逻辑效率。据悉,硬核浮点DSP模块集成在Altera20nmArria10FPGA和SoC中,以及14nmStratix10FPGA和SoC

 近来,Altera公司推出业界首款浮点FPGA,它集成了硬核IEEE754兼容浮点运算功能,提高了DSP性能、设计人员的效能和逻辑效率。据悉,硬核浮点DSP模块集成在Altera20nmArria10FPGA和SoC中,以及14nmStratix10FPGA和SoC中。该新功能支持设计人员以相同的定点性能和效率在浮点中实现其算法,且不会对功耗、面积或者密度产生任何影响,也不会损失定点特性或功能。用户可以使用Altera的FPGA和SoC来满足大计算量应用需求,例如应用在高性能计算(HPC)、雷达、科学和医疗成像等领域。

精度可调DSP体系结构

“出色的性能归功于我们创新的精度可调DSP体系结构(图)。”Altera公司首席DSP产品规划经理MichaelParker表示,“该技术在每一DSP模块中包含了一个高精度加法器和单精度乘法器。这些硬核DSP模块中内置了数千个浮点运算器,在20nm系列中,Arria10FPGA性能从140GigaFLOPS(GFLOPS)提升至1.5TeraFLOPS(TFLOPS);Altera的14nmStratix10FPGA系列将使用相同的体系结构,性能扩展到10TFLOPS。这是单个器件有史以来最高的性能指标。”

图:具有硬核浮点DSP模块的首款FPGA

该浮点计算单元与现有精度可调定点模式实现了无缝集成。设计人员可以在其设计中使用所有定点DSP处理特性,还可以根据需要将全部设计或者部分设计更新到单精度浮点。IEEE754浮点所有复数都位于DSP模块的硬核逻辑中,不占用可编程逻辑,即使是100%使用了DSP模块,浮点也支持定点设计中相似的时钟速率。

大幅缩短开发时间

MichaelParker称,自然支持浮点功能对于设计人员在FPGA中实现复杂的高性能算法非常重要。构建系统之前,在浮点中完成所有算法开发和仿真。完成算法后,通常还需要6~12个月的时间在定点实现中进行分析、转换并验证浮点算法。这一过程需要克服以下三个问题:(1)必须手动将浮点设计转换为定点,这需要工程师非常有经验,而且其实现的精度没有仿真高;(2)如果以后对算法进行任何修改,还需要再次进行手动转换,而且优化系统中定点算法的任何步骤都不会反映在仿真中;(3)如果系统集成和测试过程中出现问题,要隔离问题会非常困难。

使用Altera浮点FPGA能够帮助设计人员克服上述问题,它们可以将DSP设计直接转译成浮点硬件,而不是转换为定点,从而大幅缩短了时序收敛和验证时间。相比之前的系列,硬核浮点DSP模块能够缩短近12个月的开发时间。

将与GPGPU展开竞争

据Altera方面透露,与Altera浮点FPGA竞争的并非FPGA,而是GPGPU(GENERAL.html"target="_blank">GeneralPurposeGPU,即通用图形处理单元,它不是简单的图形引擎,而是通用计算加速器)。MichaelParker表示,这是因为其他FPGA供应商提供的“软核”浮点使用逻辑来实现复数浮点电路的效率不高,还不具竞争力。

FPGA和GPGPU都可以使用OpenCL进行设计,但它们在算法实现上有很大的不同。GPGPU使用并行处理器体系结构,并行运行数千个浮点乘加小单元。算法被分成数万个线程,数据准备好后,映射到计算单元中。

Altera浮点FPGA在高性能计算方面具有突出优势。首先,由于其流水线逻辑体系结构,数据流的处理延时要比GPGPU低得多;其次,FPGA的GFLOPS/W性能要优于GPGPU,这也意味着对于所要求的功率预算,FPGA完成的计算量一般要多于GPGPU;第三,FPGA具有很好的通用性和广泛的连通性,能够直接放在数据通路中处理通过的数据。Altera还专门增加了数据流至其OpenCL工具的选项,以符合OpenCL供应

商的扩展要求。

Altera公司软件和DSP产品市场经理AlbertChang介绍,2014年下半年,Altera将提供面向Arria10器件中硬核浮点DSP模块的浮点设计流程,包括演示和基准测试。在此之前,用户可以采用Arria10FPGA开始设计,使用软件浮点技术来实现浮点功能,在得到设计流程支持后,软件工具会自动(一次重新编译)将浮点算法无缝映射到硬核浮点运算中,而不必使用软核逻辑。

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

近日,美国参议院公布了一项引人注目的国防政策方案,其中包含的“2025年国家人工智能保障准入和创新法案”(简称GAIN AI法案)再次在全球科技领域掀起波澜。

关键字: AI GPU

9 月 5 日,一则关于英伟达的商业动态引发行业关注。这家 AI 芯片巨头斥资 15 亿美元,从人工智能小型云服务提供商 Lambda 手中,租用了搭载自家 GPU 芯片的服务器。

关键字: 英伟达 GPU 服务器 AI芯片

9月4日消息,国产GPU正在井喷式爆发,现在又一家国产厂商宣布了新的成果。

关键字: GPU 5nm

上海2025年8月26日 /美通社/ -- 奥特斯亮相在深圳会展中心(福田)举办的第22届深圳国际电子展(ELEXCON 2025)。奥特斯展示了其在高性能半导体封装载板、高密度互连印制电路板及系统级封装模块方面的最新创...

关键字: 电子 高性能计算 半导体封装 封装技术

在当今数字化时代,人工智能(AI)和高性能计算(HPC)的迅猛发展对 GPU 芯片的性能提出了极高要求。随着 GPU 计算密度和功耗的不断攀升,散热问题成为了制约其性能发挥的关键因素。传统的风冷方案已难以满足日益增长的散...

关键字: 人工智能 高性能计算 芯片

Cadence 全新 Palladium Dynamic Power Analysis 应用程序助力 AI/ML 芯片和系统设计工程师打造高能效设计,缩短产品上市时间

关键字: AI ML GPU

随着在线会议、直播和游戏语音交流的普及,高质量的音频输入设备变得越来越重要。为此,边缘AI和智能音频专家XMOS携手其全球首家增值分销商飞腾云科技,利用其集边缘AI、DSP、MCU和灵活I/O于一颗芯片的xcore处理器...

关键字: AI DSP MCU

从画质优化 (NSS) 到帧率提升 (NFRU) 和光线追踪(NSSD),Arm 计划覆盖移动端图形处理的多个维度,推动边缘 AI 图形革命。而未来通过持续的技术迭代,Arm也将保持在移动计算领域的技术领先,满足手游、A...

关键字: ARM 神经图形技术 GPU AI ML

在数字化浪潮席卷全球的今天,FPGA技术正成为驱动创新的核心引擎。2025年8月21日,深圳将迎来一场聚焦FPGA技术与产业应用的盛会——2025安路科技FPGA技术沙龙。本次沙龙以“定制未来 共建生态”为主题,汇聚行业...

关键字: FPGA 核心板 开发板

Arm 控股有限公司(纳斯达克股票代码:ARM,以下简称 “Arm”)今日在 SIGGRAPH 上,发布 Arm 神经技术 (Arm Neural Technology),该技术为业界首创,并将专用神经加速器引入 202...

关键字: 人工智能 GPU 神经加速器
关闭