当前位置:首页 > 嵌入式 > 嵌入式硬件
[导读]在空间太阳望远镜的在轨高速数据处理中,运算时间是影响系统性能的重要环节之一。利用FPGA丰富的逻辑单元实现快速傅里叶变换(FFT),解决 了在轨实时大数据量图像处理与航天级DSP运算速度不足之间的矛盾;利用溢出监测移位结构解决了定点运算的动态范围问题。经过实验验证,各项指标均达到了设计要求。

空间太阳望远镜项目是我国太阳物理学家为了实现对太阳的高分辨率观测而提出的科学计划。它可以得到空间分辨率为0.1"的向量磁图和0.5"的X射线图像,实现这样高的观测精度的前提就是采用高精度的姿态控制系统和高精度的相关跟踪系统。从整个系统来看,相关运算所需的时间成为限制系统性能能否提高的一个重要环节。

目前,国际国内相关计算比较通用的实现方法有两种:用高速DSP或者专用(FFT)处理芯片。用DSP完成相关计算(关键是FFT)受到航天级DSP性能的限制,现有的航天级DSP(如ADSP21020)计算一个32×32点8bit的二维FFT所用时间需要1.5ms以上,远远不能满足系统设计要求;而现有的FFT处理芯片在处理速度、系统兼容性、抗辐射能力等方面不能满足空间太阳望远镜所提出的要求。

为克服这一矛盾,本文利用FPGA资源丰富、易于实现并行流水的特点设计专用的FFT处理芯片来完成复杂的、大量的数据处理;并通过在运算中作溢出监测来保证定点运算的精度,从而大大缩短系统的响应时间,将极大地提高空间太阳望远镜的在轨实时图像处理能力;同时由于FPGA具有抗辐射能力,可以提高系统的可靠性,其在航天遥测遥感和星载高速数据处理等方面将有广泛的应用前景。

1 算法构成

1.1 FFT算法选择

提高FFT速度的两个主要途径是采用流水结构和并行运算[1]。采用高基数结构也可以提高速度,只是用FPGA实现时必须综合考虑系统要求、结构特点及片内资源。针对本系统自身特点,这里按时间抽选算法进行分析。由于32不满足N=4m,所以32点FFT算法不能采用基-4 FFT运算。当详细分析基-2蝶形图时,有些蝶形运算并不需要做乘法,例如等[2];对于32点DIT-FFT,一共80个蝶形运算,这种结构就有46个,极大地降低了运算复杂度。在一维FFT计算效率提高的基础上对二维FFT采用最常用的行列算法[3],综合各项指标本系统采用基-2 DIT行列算法。

1.2 算术运算方案

本系统是针对32×32点16bit的二维图像进行快速傅里叶变换(FFT),设计要求运算在0.5ms之内完成,所以采用定点运算更符合系统对时间的要求。对于定点运算,必须用定比例的方法防止溢出,即必须解决动态范围问题。下面对其进行理论分析:

若{x(n)}是-N点序列,其DFT为{X(K)},由Parseval定理得[4]:

由式(1)可知变换结果的均方值是输入序列均方值的N倍。考虑基-2算法的第m级蝶形运算,用Xm(i)、Xm(j)表示原来的复数,则新的一对复数Xm+1(i)、Xm+1(j)为:

Xm+1(i)=Xm(i)+Xm(j)×W (2)

Xm+1(j)=Xm(i)-Xm(j)×W

其中,W为旋转因子。首先,考虑复数的均方程根值。由(2)式可得:

因此,从均方根意义上看,数据(实数或复数)复级都增加(2的平方根)倍。其次,再考虑复数的最大模。由(2)式可以证明[5]。

max{|Xm(i)|,|Xm(j)|}≤max{|Xm+1(i)|,|Xm+1(j)|}≤2max{|Xm(i)|,|Xm(j)|}

因此,复数数组的最大模是非减的。所以,对于DITFFT,其每一级的蝶形运算之后数值都会增加1+(2的平方根)≈2.414倍。在每一次运算完成之后,须将结果右移2bits以满足要求。

2 系统实现

系统原理如图1所示,整个FFT运算处理单元分为三部分:存储单元(两个输入/运算存储器、一个输出存储器及旋转因子存储器)、蝶形运算单元、地址产生器。

2.1 存储器

本系统实时接收前端CCD相机的图像。为保证CCD相机采集图像的准确率,图像的每一行、每一帧之间都必须有一定的时间间隔,故采用两个存储单元作为输入数据和中间数据的暂存单元(如图1所示),以节省时间实现实时处理。当系统工作时,将图像存入存储器、计算上一次采集的图像、将存储器中的结果输出,这三个工作同时进行,用简单的流水方式减少存储数据所需的时间。旋转因子则预先存储在器件的内置ROM中。根据级数不同选用不同的因子。

2.2 蝶形运算单元

一个基-2蝶形运算由一个复乘和两个复加(减)组成,采用完全并行运算,进一步分解为四个实数乘法,六个实数加(减)法,分三级并行完成,加上前后输入输出的数据锁存,共需要6个时钟周期。32点的FFT需要16×5=80个基-2的蝶形运算,一幅图像一共是32行32列,不考虑不需要做乘法的蝶形运算,一路串行共需要6×80×32×2=30720个时钟周期,采用频率为10MHz的时钟,即为3ms。对于蝶形运算的第一、第二级都可以由不带乘法器的蝶形结构来实现同步并行运算,每一个蝶形运算加上前后的数据锁存仅需4个时钟周期即可完成;对于第三、第四、第五级,由于带乘法器不带乘法器的两种蝶形运算结构同时存在,必须加入等待时间才可以实现严格同步。同时由于各级计算时间不同,所以不能实现深度流水。因此,采用多路并行及部分流水,在时间上即可满足系统要求。

上面讨论了当运算从一级转到另一级时,序列中数值的幅度一般会增大。因而,运算方法是在内循环中作溢出监测。如果没有溢出,则计算照常进行;若有溢出,则把产生溢出的数据右移,一直到没有溢出为止。记录下移位的次数(0、1或2),并把整个序列右移同样位数,移位总数进行累计,累计数的负值作为2的幂,由此得出最终序列的总的比例因子。比例因子s由下式定义[6][7]:

这里bi为比例参数。

k=0,1,2,…,N-1 (6)

根据公式(6),FFT的最终结果要除以比例因子。式中x(n)为原始数据,X(k)为除以比例因子之前的结果,X‘(k)为最终结果,1/s为比例因子的倒数。

如图2所示,对于一个基-2蝶形单元,当从存储器中读取的Bbit输入数据进入蝶形运算单元PE1后,经过乘法运算(MU1)乘以旋转因子,数据变为(B+Bω)bit,然后作加(减)法,得到蝶形运算结果(B+Bω+1)bit。为防止溢出,进行移位操作。M1、M2为比例选择器,根据不同的级数,选择不同的比例因子。最后,输出数据再放回到存储器中。

3 FPGA器件选择

本设计采用XILINX公司的VERIEX系列XCV300-4HQ240芯片。该芯片有丰富的可配置逻辑模块CLBs(Configurable Logic Blocks)、大量的触发器以及内置的不占系统资源的块RAM。系统最大工作频率可达200MHz,兼容多种接口标准,有相应的航天级产品,是目前市场上为数不多的能达到此项要求的高性能可编程逻辑器件。 VERTEX系列器件的一个显著特点是内置的延迟锁相环DLL(Delay-Locked Loop),它可以减少时钟传输的衰减,每一个DLL可以驱动两个全局时钟信号。DLL可以倍频,或者1.5、2、2.5、3、4、5、8以及16分频。VERTEX系列器件内部的4-输入查找表LUTs(Look-Up Tables)也具有多种功能:可以作为16 ×1bit的同步RAM,而且一个块(Slice)中的两个LUTs可以组合成一个16×2bit或者一个32×1bit的同步RAM或者一个16×1bit的同步多口RAM。另外,LUTs还可作为一个16bit的移位寄存器使用,该寄存器用来获取高速或者突发数据非常理想,特别适用于数字图像处理中的数据存储[8]。

本设计充分利用了VERTEX器件的LUTs替代触发器和基本门电路搭建乘法器和加法器这两个显著的结构特点,节省大量触发器资源,避免了缺少触发器而LUTs大量剩余的尴尬;增加了器件利用率、布通率,降低布线延迟。由于本系统最终用于空间太阳望远镜,所以板上时钟频率不可超过20MHz。但基于地面测试的需要,特利用DLL对外部时钟信号进行了倍频,以提高芯片内部的运行速度。

本设计利用FPGA易于实现并行运算的特点实现专用的FFT处理芯片,解决了在轨实时大数据量图像处理与航天级DSP运算速度不足之间的矛盾,提高了系统实时处理能力。两维FFT不到400μs即可完成,高于航天级DSP(ADSP21020)1.5ms的处理速度。对太阳米粒组织图像进行处理(实验数据如表1所示),结果显示数据误差都在1%左右。这样的误差满足空间太阳望远镜中的相关摆镜的系统要求。实验证明用高性能FPGA实现空间化的FFT处理芯片是完全可行的。

表1 实验数据

序 号原始数据浮点数据定点数据误差%序 号原始数据浮点数据定点数据误差%1-327684201044193280.181719072504851201.432-327681542981550080.461818704594360161.233721697679983040.641918796944596001.644148001062241066880.44201915226885272001.1751608093313937600.48211630431028312320.6661984076389768000.54221475233592336000.0272310465472656720.68231457638986391680.47820000604403606720.45241520058786591360.6091910469973704000.6125816039973704000.61102337658786591360.6026704860403607360.55112012838986391040.30271438465472659200.68121868833592336000.02281158476389768000.54131968031028312320.66291147293313937600.48141953626885272001.1730114561062241067520.501519680944596001.64311176097679983040.641618720594360161.2332114881542981549440.42

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

LED驱动电源的输入包括高压工频交流(即市电)、低压直流、高压直流、低压高频交流(如电子变压器的输出)等。

关键字: 驱动电源

在工业自动化蓬勃发展的当下,工业电机作为核心动力设备,其驱动电源的性能直接关系到整个系统的稳定性和可靠性。其中,反电动势抑制与过流保护是驱动电源设计中至关重要的两个环节,集成化方案的设计成为提升电机驱动性能的关键。

关键字: 工业电机 驱动电源

LED 驱动电源作为 LED 照明系统的 “心脏”,其稳定性直接决定了整个照明设备的使用寿命。然而,在实际应用中,LED 驱动电源易损坏的问题却十分常见,不仅增加了维护成本,还影响了用户体验。要解决这一问题,需从设计、生...

关键字: 驱动电源 照明系统 散热

根据LED驱动电源的公式,电感内电流波动大小和电感值成反比,输出纹波和输出电容值成反比。所以加大电感值和输出电容值可以减小纹波。

关键字: LED 设计 驱动电源

电动汽车(EV)作为新能源汽车的重要代表,正逐渐成为全球汽车产业的重要发展方向。电动汽车的核心技术之一是电机驱动控制系统,而绝缘栅双极型晶体管(IGBT)作为电机驱动系统中的关键元件,其性能直接影响到电动汽车的动力性能和...

关键字: 电动汽车 新能源 驱动电源

在现代城市建设中,街道及停车场照明作为基础设施的重要组成部分,其质量和效率直接关系到城市的公共安全、居民生活质量和能源利用效率。随着科技的进步,高亮度白光发光二极管(LED)因其独特的优势逐渐取代传统光源,成为大功率区域...

关键字: 发光二极管 驱动电源 LED

LED通用照明设计工程师会遇到许多挑战,如功率密度、功率因数校正(PFC)、空间受限和可靠性等。

关键字: LED 驱动电源 功率因数校正

在LED照明技术日益普及的今天,LED驱动电源的电磁干扰(EMI)问题成为了一个不可忽视的挑战。电磁干扰不仅会影响LED灯具的正常工作,还可能对周围电子设备造成不利影响,甚至引发系统故障。因此,采取有效的硬件措施来解决L...

关键字: LED照明技术 电磁干扰 驱动电源

开关电源具有效率高的特性,而且开关电源的变压器体积比串联稳压型电源的要小得多,电源电路比较整洁,整机重量也有所下降,所以,现在的LED驱动电源

关键字: LED 驱动电源 开关电源

LED驱动电源是把电源供应转换为特定的电压电流以驱动LED发光的电压转换器,通常情况下:LED驱动电源的输入包括高压工频交流(即市电)、低压直流、高压直流、低压高频交流(如电子变压器的输出)等。

关键字: LED 隧道灯 驱动电源
关闭