当前位置:首页 > 嵌入式 > 嵌入式硬件
[导读]信号处理是连接现实世界和数字运算世界的桥梁。随着用数字信号处理实现的算法变得日益复杂,对这些算法的性能要求呈指数上升。针对成本敏感的大批量设备,比如蜂窝电话、机顶盒和电脑图形卡等,这一要求正在大力推动非常特殊的特殊应用标准产品(ASSP)的开发。然而对许多其它设备来说,实现高性能数字信号处理的唯一选择是通用数字信号处理器(DSP)以及最新的现场可编程门阵列(FPGA)。

信号处理是连接现实世界和数字运算世界的桥梁。随着用数字信号处理实现的算法变得日益复杂,对这些算法的性能要求呈指数上升。针对成本敏感的大批量设备,比如蜂窝电话、机顶盒和电脑图形卡等,这一要求正在大力推动非常特殊的特殊应用标准产品(ASSP)的开发。然而对许多其它设备来说,实现高性能数字信号处理的唯一选择是通用数字信号处理器(DSP)以及最新的现场可编程门阵列(FPGA)。

这些设备中有许多是采用DSP实现的。虽然DSP可以通过软件进行编程,但DSP硬件架构很不灵活。DSP的性能受很多固定硬件架构的限制,如总线性能瓶颈、固定数量的乘法累加(MAC)模块、固定存储器、固定硬件加速模块和固定数据带宽等。因此DSP的这种固定硬件架构对于许多要求定制DSP功能实现的应用来说并不适用。

FPGA可以为实现传统DSP应用提供可重配置解决方案,并能比DSP提供更高的吞吐量和原始数据处理能力。由于FPGA的硬件是可配置的,因此它能在提供完整的硬件定制功能的同时实现各种DSP应用。用FPGA实现的DSP系统可以具有定制的架构、定制的总线结构、定制的存储器、定制的硬件加速模块和可变数量的MAC模块。

自从新千年伊始,FPGA就已经拥有了专用数字信号处理(DSP)功能。过去六年来,FPGA提供的DSP性能已经提高了16倍之多,达到每秒500千兆次乘法-累加操作(GMACS)。在相同时期内,数字信号处理器的性能只从1.6GMACS提高到了目前的8GMACS。许多设备只需要少量的DSP性能,相当于类似Altera公司Cyclone II的FPGA提供的性能。不过,对于要求许多数字信号处理器的高性能设备来说,单个Altera Stratix III FPGA也能替代这些处理器,从而不仅能够提供超过等效的DSP性能,还能显著地减少系统功耗、以及电路板面积和成本。

对高性能DSP需求的关键驱动力来自无线通信基础设施、视频广播设备、医疗成像和军事应用。FPGA已经成为能够满足这些要求的首选可编程DSP平台。

第三代通信基站平台是需要使用大量DSP的系统之一,它包括了一块射频卡和一块通道卡以及两个主处理区。第三代无线通信产品大部分是宽带产品,因此其射频元件通常工作在线性范围之外。先进的算法有助于满足远高于传统数字信号处理器能力的处理要求。无线基础设施中的主要设备现主要依靠FPGA实现射频线性化处理。



图1:近年来FPGA与DSP性能的演变情况。

FPGA成为首选处理平台的另外一个领域是WiMAX基带处理设备,它所采用的正交频分复用(OFDM)技术的巨大运算要求只能用特殊应用集成电路(ASIC)或FPGA才能满足。由于ASIC太贵,开发风险很大,因此FPGA成为了WiMAX市场的赢家。

使FPGA成为DSP领域理想解决方案的关键性能是什么?大量的乘法器、高的片上存储器带宽、大量I/O带宽以及由于可编程逻辑带来的独特且完全灵活的FPGA架构都确保了没有其它可编程技术可以提供相同的DSP性能。与其它半导体解决方案相比,FPGA可以在更低的功耗下提供最高性能的可编程DSP功能,同时还能降低系统成本和减小电路板面积。

系统设计师可以用一片或几片FPGA开发出一块原本要数十块DSP和可能多块电路板才能实现的电路板。因为FPGA支持在相同封装内的纵向移植,因此可以在无需多电路板设计的条件下很容易将单板和系统设计从低端功能升级到最高功能。这种灵活性是很大的优势,因为它能减小产品线工程设计和验证成本。



图2. 第三代通信基站处理架构方框图。

FPGA DSP有哪些新功能呢?随着Stratix III FPGA系列器件的推出,DSP功能也有了新的发展,比如密度翻倍、性能显著提升、功耗显著降低,I/O性能也得到了增强,DSP模块有了重大创新。

增加DSP模块中的片上乘法器数量(最多是896个18×18乘法器)是重大的创举。它允许在更少的硅片面积中封装更多的乘法器,同时能降低功耗。DSP模块通常是针对性能、灵活性和低功率做过优化的硬模块。DSP硅模块有两种物理约束:外设数量和使用面积大小。

DSP模块的外围有144根输入线和144根输出线,还有一些控制信号。DSP模块的面积可以实现4个18×18的乘法器以及相应总的输入输出信号。对DSP模块如何发展的芯片级和系统级研究的依据是那些特殊应用需求以及向65nm工艺技术转移所产生的后果。

在芯片级,改变外设与DSP模块面积的比例可以形成更多的I/O或更多的模块级逻辑。在系统级,对DSP算法的调查表明乘法器逻辑的主要使用者是滤波和变换算法,它们都依赖于乘法累加操作来满足大部分处理要求。在需要时通过优化DSP模块的内核面积可以增加一倍的乘法累加操作次数,从而降低相对于总体运算的外围I/O要求。通过在一个DSP模块中完成更多的DSP算法,总的芯片效率就能有显著的提高。

带8个18×18乘法器和相关寄存器、累加器以及取舍电路的DSP模块如图3所示。乘法器的使用限制于DSP模块的输出线,而非逻辑面积。与竞争性架构相比,这种架构可以使硅片效率约提高50%。



图3:Stratix III DSP模块架构。

模块的总体DSP功能减少了使用乘法累加操作的标准算法,如有限脉冲响应(FIR)滤波器或复杂乘法器,同时由于不需要使用可编程逻辑矩阵而减少了总体功率和资源消耗。当乘法累加操作作为算法的一部分被包含时,可以极大地增加18×18乘法器的数量。

对许多系统架构来说,FPGA的一个突出优点是封装的纵向移植性。纵向移植可以使单块电路板设计无需重做就能支持灵活的处理性能和成本。系统架构师可以运用这一功能开发出具有各种价位和性能的产品,却不会显著影响开发成本或库存。另外,随着Altera’s HardCopy结构化ASIC的推出,当需要考虑大批量和高性价比结构时可以获得额外的性价比。

无线基础架构应用是如何运用这种灵活性的一个很好例子。在灵活的通道单元盘中使用的FPGA支持各种标准,通过纵向移植还能支持各种通道密度。一个基站可以被配置为最少的通道数,也可以使用相同的基础架构对通道进行大扩容,只需改变专门的FPGA选择。在许多发展中国家,注意力往往放在更灵活、可升级和业务丰富的设备上,这些设备就需要FPGA的这种灵活性。在这些对价格特别敏感的地区,同一产品中非常标准化的功能可以使用HardCopy结构化ASIC以更低的成本来实现。采用这种解决方案的供应商将拥有强大的技术优势,无需增加工程成本就能提高业务的灵活性。

FPGA的I/O带宽比DSP的带宽要大得多。I/O带宽是满足系统处理要求的关键要素,而带宽又受数据输入输出以及片外数据存储器的影响。在对存储器有很高要求的应用场合,Stratix III存储器接口支持400MHz的DDR3存储器,这个外部存储器带宽要比目前最先进的DSP高16倍。

因为系统级开发工具可以帮助系统架构师实现灵活性、可发展性、可维修性和高性能信号处理及控制架构,因此FPGA在过去几年中发展非常迅速。这些工具包括DSP系统建模工具、系统综合工具、控制处理IP、自动的C语言到硬件加速和DSP优化的应用IP。设计师利用这些工具可以快速建立真正得到优化以满足系统要求的高性能架构。在纵向移植和HardCopy结构化ASIC的支持下,系统架构师可以根据产品线要求实现可扩展性能,实现各种产品以满足不同市场要求,同时实现实质性的生产效益。

目前已经有完整开发FPGA中架构所必需的工具和IP,但系统架构中为何需要标准的第三方处理器还有其它原因。当第三方处理器与FPGA一起使用时,它能通过一种被称为FPGA协处理的架构技术显著地提高系统性能,同时降低系统成本、功耗和电路板面积。在FPGA协处理过程中,FPGA可以从第三方处理器卸载处理任务繁重的算法。许多系统使用控制处理器、数字信号处理器和一个或多个FPGA(在FPGA中执行主要的处理负载),其中控制和DSP用于满足传统软件、操作系统要求或针对最终应用(如Windows GUI控制)的处理适用性。

高性能系统的核心信号处理将越来越多地转向FPGA。FPGA可以提供其他任何半导体器件无法提供的最高的可编程DSP性能,在加上纵向移植以及面向低成本器件的HardCopy技术,目前没有那种比此更灵活的系统架构解决方案能更好地满足性能、低功耗、低成本和产品广度及寿命要求。


作者:Paul Ekas

高级产品经理

Altera公司

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

随着在线会议、直播和游戏语音交流的普及,高质量的音频输入设备变得越来越重要。为此,边缘AI和智能音频专家XMOS携手其全球首家增值分销商飞腾云科技,利用其集边缘AI、DSP、MCU和灵活I/O于一颗芯片的xcore处理器...

关键字: AI DSP MCU

在数字化浪潮席卷全球的今天,FPGA技术正成为驱动创新的核心引擎。2025年8月21日,深圳将迎来一场聚焦FPGA技术与产业应用的盛会——2025安路科技FPGA技术沙龙。本次沙龙以“定制未来 共建生态”为主题,汇聚行业...

关键字: FPGA 核心板 开发板

在现代电子系统中,现场可编程门阵列(FPGA)凭借其开发时间短、成本效益高以及灵活的现场重配置与升级等诸多优点,被广泛应用于各种产品领域。从通信设备到工业控制,从汽车电子到航空航天,FPGA 的身影无处不在。为了充分发挥...

关键字: 可编程门阵列 FPGA 数字电源

2025年8月4日 – 提供超丰富半导体和电子元器件™的业界知名新品引入 (NPI) 代理商贸泽电子 (Mouser Electronics) 即日起开售Altera®的Agilex™ 3 FPGA C系列开发套件。此开...

关键字: FPGA 边缘计算 嵌入式应用

内窥镜泛指经自然腔道或人工孔道进入体内,并对体内器官或结构进行直接观察和对疾病进行诊断的医疗设备,一般由光学镜头、冷光源、光导纤维、图像传感器以及机械装置等构成。文章介绍了一款基于两片图像传感器和FPGA组成的微型3D内...

关键字: 微创 3D内窥镜 OV6946 FPGA

运用单片机和FPGA芯片作为主控制器件 , 单片机接收从PC机上传过来的显示内容和显示控制命令 , 通过命令解释和数据转换 , 生成LED显示屏所需要的数据信号和同步的控制信号— 数据、时钟、行同步和面同步 。FPGA芯...

关键字: 单片机 FPGA LED显示屏

多DSP集群的实时信号处理系统,通信拓扑的优化直接决定任务调度效率与系统吞吐量。RapidIO与SRIO作为嵌入式领域的主流互连协议,其带宽利用率差异与QoS配置策略对集群性能的影响尤为显著。以无线基站、雷达阵列等典型应...

关键字: DSP 通信拓扑优化

随着5G网络普及与物联网设备爆发式增长,边缘计算正从概念验证走向规模化部署。据IDC预测,2025年全球边缘数据量将占总体数据量的50%,这对边缘节点的实时处理能力提出严苛要求。在此背景下,AI加速器的DSP化趋势与可重...

关键字: AI加速器 DSP

在工业控制领域,数字信号处理器(DSP)的性能直接决定了系统的实时控制能力和可靠性。德州仪器(TI)的C2000系列芯片凭借其卓越的采样、控制和功率管理能力,长期以来在全球工业控制市场占据绝对领导地位,广泛应用于能源、电...

关键字: TI C2000 DSP 格见半导体 芯来 RISC-V 工控

2025年7月16日 – 专注于引入新品的全球电子元器件和工业自动化产品授权代理商贸泽电子 (Mouser Electronics) 持续供货Texas Instruments (TI) 的新产品和解决方案。作为一家授权...

关键字: 线性稳压器 栅极驱动器 DSP
关闭