当前位置:首页 > 嵌入式 > 嵌入式硬件
[导读]JPEG2000压缩标准与JPEG相比有更高的压缩效率,尽管如此,它在执行时间上还存在一些问题。为缩短执行时间,必须对小波变换编码进行优化。小波提升方案与传统的卷积滤波相比需要更小。

JPEG2000压缩标准与JPEG相比有更高的压缩效率,尽管如此,它在执行时间上还存在一些问题。为缩短执行时间,必须对小波变换编码进行优化。小波提升方案与传统的卷积滤波相比需要更小的内存和计算量。可是,提升方案在执行垂直小波滤滤时仍存在严重的缓存失败问题。

Meerwald曾经提出过行扩展和聚合的方法,Chatterjee和Brooks也提出了条采集和递归数据设计来改善提升方案的缓存处理。尽管这些方法可以降低缓存挫败率,却不能完全消除缓存失败问题。缓存失败问题在一个内存有限的嵌入式系统中变得较为突出,尤其是在DSP中更为严重。为解决这一问题,笔者提出了一种新的方法与DSP相匹配。

主要方法

图1是该方法的内存结构图。它由一个有两个64字节块联合的16KB数据缓冲存储器L1、直接映射到SRAM上的数据存储器L2、直接映射到DRAM上的外部存储器和一个DMA控制器组成。

通常,为执行提升方案,图像的行先在水平方向滤波,然后经水平滤波的图像再进行垂直滤波。提出的新方法采用一个改进的按块执行的提升方案,块大小与L1缓存中的块大小相同。图1描述了该方法。在小波提升变换开始前,在输入图像内存中块1的数据已通过DMA传输到L2,然后L2中块1的第一行被取到L1缓存中在水平方向提升。以相同方式对块1下面的行进行处理。注意在块1的最后一行滤波后,L1缓存中包含输入图像内存中块1的数据;其次,块1的垂直方向的滤波在L1缓存中完成。这样,垂直提升就不需要取数据,因为L1缓存包含块1的数据。因此,块1在水平和垂直方向的滤波只在CPU需要下一水平行时才可能有缓存失败。这就是笔者提出的方法有显著性能的原因所在。

块1完成滤波后,块2被取到L1缓存的1路中;然后,块2的滤波完成后,块3被从L2取到L1的0路中。同时,0路中滤波过的块1一行一行移到L2。因2描述了滤波过的块1的移动,每个子带分别称为LL、LH、HL和HH,已经由小波提升算法形成。每个子带中的数据从L2通过DMA传送到输出图像内存中的恰当位置。

L2与外部存储器之间的数据传递是独立于L1与L2间的数据传递进行的。这意味着通过DMA的块复制不影响CPU的运转。因此,通过小波提升序列的重新排序和控制DMA,在没有额外CPU负载的情况下增大了缓存成功率。

该方法完全去除了缓存失败的问题,但还存在一个问题,因为小滤波在边界需要一些邻近块的系数才能获得正确的滤波结果。而这一方法中,垂直提升处理与这一问题不相关,因为垂直的两个邻近块总是同时装载于L1缓存中。但对于水平提升处理,笔者用下面的方法来解决:区1和区3都取到滤波器区域1,如图3所示。对于滤波器区2,区2和区3都是必需的。然而,当达到改进性能时,重叠处理的开销是可忽略的。
仿真结果

为检验所提出方法的效率,在TMS320C6416 DSP上用Jasper1.700.2版进行了仿真。所有数据都对灰度图像的第一级分解并且所有图像的宽度2倍放大。


其中,在水平滤波上产生的缓存失败是由块重叠引起的。然而,在垂直滤波中,算法完全去除了缓存失败,因此,算法减少了98%的缓存失败率。

对于所有的图像大小,在水平滤波上都没有改进,但是所有三种方法在垂直滤波中,行扩展、聚合及两种方法的联合处理时间减少分别为78%、88%和90%;条采集、递归数据设计与两种方法结合的处理时间减少分别为73%、66%和82%。笔者提出的方法在垂直滤波中减少处理时间为98%。注意,水平滤波的速度与垂直滤波基本相同。这意味着笔者提出的算法在垂直滤波中消除了最多的缓存失败。

笔者已经验证了JPEG 2000的小波提升算法的性能及其在存储系统中的执行。实验结果表明提出的方法与现有的快速方法相比要快2~3.5倍。

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

随着在线会议、直播和游戏语音交流的普及,高质量的音频输入设备变得越来越重要。为此,边缘AI和智能音频专家XMOS携手其全球首家增值分销商飞腾云科技,利用其集边缘AI、DSP、MCU和灵活I/O于一颗芯片的xcore处理器...

关键字: AI DSP MCU

在可持续能源蓬勃发展的当下,如何高效获取、存储并利用能源,已成为全球科技创新的核心议题。随着全球气候变化和能源需求增长的双重压力,清洁能源的高效利用正成为全球关注的焦点。而在新能源时代,能量收集与存储技术的重要性愈加凸显...

关键字: 新能源 能量 存储技术

多DSP集群的实时信号处理系统,通信拓扑的优化直接决定任务调度效率与系统吞吐量。RapidIO与SRIO作为嵌入式领域的主流互连协议,其带宽利用率差异与QoS配置策略对集群性能的影响尤为显著。以无线基站、雷达阵列等典型应...

关键字: DSP 通信拓扑优化

随着5G网络普及与物联网设备爆发式增长,边缘计算正从概念验证走向规模化部署。据IDC预测,2025年全球边缘数据量将占总体数据量的50%,这对边缘节点的实时处理能力提出严苛要求。在此背景下,AI加速器的DSP化趋势与可重...

关键字: AI加速器 DSP

在工业控制领域,数字信号处理器(DSP)的性能直接决定了系统的实时控制能力和可靠性。德州仪器(TI)的C2000系列芯片凭借其卓越的采样、控制和功率管理能力,长期以来在全球工业控制市场占据绝对领导地位,广泛应用于能源、电...

关键字: TI C2000 DSP 格见半导体 芯来 RISC-V 工控

2025年7月16日 – 专注于引入新品的全球电子元器件和工业自动化产品授权代理商贸泽电子 (Mouser Electronics) 持续供货Texas Instruments (TI) 的新产品和解决方案。作为一家授权...

关键字: 线性稳压器 栅极驱动器 DSP

在当今数字化浪潮的推动下,数据流量呈爆炸式增长,数据中心、5G通信网络以及云计算等领域对高速光通信的需求愈发迫切。800G光模块作为高速光通信的关键组件,其性能直接影响着整个通信系统的传输效率和可靠性。数字信号处理(DS...

关键字: 800G DSP PAM4均衡算法

上海 2025年6月20日 /美通社/ -- 6月18日,上海世界移动通信大会(MWC 2025)在上海新国际博览中心盛大启幕。德明利以"智存无界,全栈智能&qu...

关键字: 嵌入式 AI 全栈 存储技术

以氢燃料电池空压机为研究对象 ,开发超高速永磁同步电机控制器 ,采用传统的IGBT主功率器件 ,且为两电平主回 路结构形式 ,通过改进的V/F控制算法 ,完成了控制器的设计。搭建了试验平台进行测试 ,结果表明 ,控制器能...

关键字: 超高速永磁同步电机 V/F控制 DSP

台北 2025年5月23日 /美通社/ -- 2025年5月20日至23日,全球科技盛会COMPUTEX台北国际电脑展顺利举办,德明利以"智存无界,全栈智能&qu...

关键字: 存储技术 全栈 TE COMPUT
关闭