当前位置:首页 > 消费电子 > 消费电子
[导读]分析了JPEG标准的压缩/解压缩算法,以VLSI方式实现了基于JPEG标准的解码流程,在关键模块——Huffman解码、IDCT上进行了算法级、结构级和电路级等层次的综合考虑,使其有更好的功耗代价,使其能够在图像传感器上得到应用。通过测试平台对其VLSI进行了RTL级和门级的仿真。结果表明,功能符合需求。

目前,我国正在筹备物联网的建设,这对于传感器技术的发展以及数字图像传感器瞬时产生的海量数据为实时通信系统的存储容量、传输带宽和功耗提出了挑战。在医疗、遥感图像通信等对恢复图像质量要求高的领域,对低功耗、具有良好压缩/解压缩性能及实时处理能力的图像编/解码器的需求也变得日益迫切。JPEG静态图像压缩/解压缩标准,具有优良的压缩/解压缩性能,而且要求低存储量和相对较低的复杂度使其很适合于硬件实现。
    为了实现数据的实时处理和低功耗应用,本文提出了一种带有时钟管理机制的并行、全流水结构的JPEG解码器实现方案。
1 JPEG解码算法
    JPEG(Joint Photographic Experts Group)是一种适用范围很广的静态图像数据压缩标准。JPEG压缩是一种有损压缩,它利用了人的视觉系统特性,使用量化和无损压缩编码相结合的方式去掉视觉的冗余信息和数据本身的冗余信息。JPEG解码器包括:霍夫曼(Huffman)解码、反量化(IQ)IDCT变换。在JPEG中,对于图像的解码是分块进行的。整个图像被划分为若干个8×8的数据块(MCU),每1个块对应于原图像的1个8×8的像素阵列。各行的编解码顺序从上到下,行内的编解码顺序从左到右[1]。
2 并行Huffman解码器
    Huffman编码后代码的长度不一致,如果解码器用串行技术实现,由于其代码长度不一致,解1个码字所需的周期数也不一样。对于实时系统,串行技术的效率比较低。另外,如果数据在传播过程中被噪声中断,整组数据就变得没有价值了。针对这两方面的问题,本文提出如下的解决方案。如图1所示为Huffman解码的主要元件和算法流程。


    算法流程:从输入端获取32位的压缩图像数据,分析输入的数据流,判断出码长,把输入的数据移位,同时从输入端补充新的数据。输入的数据通过Huffman表翻译成原始数据,提取出数据流中嵌入的符号位,经过一系列的除法、减法运算后得到编码前的频率数据,与之前得到的符号位合并后输送到输出缓存。
    本文采用的算法灵活地利用了Huffman表的特点,消除了算法中的乘法运算,完成码长的判断只需要1个周期。把码表的数据按照码长分类从小到大排列,再把码长相同的数据按照码字的大小从小到大排列。每张表按照排列后的顺序把码字对应的解码结果DR(Decoding Results)存入到ROM中。这样既有利于查表,需要的ROM也是最小的,符合低功耗要求。查表的地址发生器由“长度匹配”模块传递到的码长得到1个基地址,码长从输入数据中截取连续的几个与码长相同位数的bit作为偏移地址,2个地址相加就是DR保存的地址[2]。
    因关键bit出现的位置都是在码字的最后几位,因此根据码长将输入数据进行移位,使关键bit的最后1位出现在第n位,移位的结果只输出第n位以前的几个bit,这样的电路只需要1个只受码长控制的桶形移位寄存器。另外,再为每张表产生1个1串0加上1串1的地址修正串,有几个关键bit就有几个1,这部分电路逻辑简单且占用的电路不多。用这个地址修正串和桶形移位寄存器的输出做一个“与”逻辑运算,得到的就是正确的偏移地址。由于Huffman表需要的最长bit是9位,码长最大为19位,所以本文设计了1个19位输入、9位输出的桶形移位寄存器。改进后的电路面积缩小到改进前的50%左右。
3 IDCT处理器
    逆向离散余弦变换IDCT(Inverse Discrete Cosine Transform)电路的总体实现框图和其中的2D IDCT框图如图2所示。DCT系数经过反量化和反扫描电路处理后输入到IDCT的缓存器,由全局控制电路控制输入到2D IDCT单元及将最终变换好的数据送到输出缓存器中,发送Ready信号到运动补偿单元,通知该单元可以读出IDCT数据。2D IDCT单元进行2次1D IDCT运算,首先进行基于行的1D IDCT,然后将第1次IDCT的中间结果经转置存储器进行转置处理和缓存,再进行基于列的1D IDCT变换,得到最终的IDCT变换结果[3]。


    IDCT设计中使用了零值判断逻辑电路、门控时钟、并行流水线等技术,使得整个电路在满足处理速度和精度要求的基础上大大降低了功耗。
3.1 零值判断逻辑电路
    在整个图像解码过程中,每8×8个数据块中有约90%的数据的DCT系数为零,对这些零值进行IDCT变换并无意义。因此,本设计添加了零值判断逻辑来消除不必要的乘法运算。零值判断逻辑电路由8×8累加器阵列、零值判断逻辑模块和复选器MUX构成。通过零值逻辑模块判断,当操作数不全为零时,使能信号变成高电平,将操作数取到寄存器中,然后再进行乘法运算。如果操作数全为零,则封锁累加阵列,直接通过MUX输出0。零值判断逻辑能有效地降低功耗,且电路简单,面积与延迟时间几乎可以忽略不计。
3.2 基于锁存器的门控时钟
    通过控制电路的输入时钟可以使得一部分电路降低工作频率或者停止工作,从而降低整个电路的功耗。2D DCT/IDCT的电路主要由3部分组成:1D DCT/IDCT单元、转置存储器、输入输出处理单元。
    转置存储器部分只有在每次1D DCT/IDCT处理的最后才进行更新,而输入输出处理单元只有在数据输入输出的时候才工作。因此,控制这几部分电路的输入时钟,使其在大多数时间停止工作即可以有效地降低功耗。设计结果表明,在面积仅增加2%的情况下系统功耗可降低13%。
    基于锁存器的门控时钟可以实现上述功能,它具有不需要数据选择器、面积较小、可以减小时钟网络上电容、减少门控寄存器的内部功耗等优点。锁存器门控时钟电路及时序如图3所示。


3.3 并行流水线
    本设计使用加法和移位运算代替IDCT快速算法中的浮点乘法运算单元,用高度并行流水线VLSI结构加快数据处理速度,其处理数据的时间不到串行结构的1/5。因此,时钟频率可以相应地降低到串行结构的1/5左右,从而降低系统的功耗。例如,使用2个16×8的乘法器同时并行计算高位部分和低位部分,分别得到高位部分积和低位部分积,然后进行移位相加。实现电路运算时实现时间重叠、资源重复使用和资源共享,提高了系统的并行性,以此提高了乘法电路的运行速度和效率。
4 仿真和综合结果
    本文选用1幅1 920×1 080大小的JPEG图像,Modelsim进行RTL级仿真后的波形如图4所示。图中JPEG_DATA是码流数据,OutR、OutG、OutB是解码仿真结果[4]。在100 MHz的频率下对解码核心模块进行综合[5],结果如表1所示。


    本文有别于以往用软件实现JPEG解码,而是在用硬件实现JPEG解码的同时,改进硬件结构,通过多种易于操作的方法来降低硬件解码能耗。通过EDA工具验证,完全可以满足JPEG图像硬件解码的要求。

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

流水账式的推文比较乱,不够系统,也形成不了好的宣传效应,所以我整理了一个硬件基础知识框架,后面推文会围绕这个展开,中间也会穿插一些项目和实际应用例程。

关键字: 硬件 项目 例程

在阈值电压或低于阈值电压时,EPAD MOSFET 在称为亚阈值区域的工作区域中表现出关断特性。这是 EPAD MOSFET 传导通道根据施加的栅极电压快速关闭的区域。由栅电极上的栅电压引起的沟道呈指数下降,因此导致漏极...

关键字: 超低压 MOSFET 低功耗设计

ALD1148xx/ALD1149xx 产品是耗尽型 EPAD MOSFET,当栅极偏置电压为 0.0V 时,它们是常开器件。耗尽模式阈值电压处于 MOSFET 器件关断的负电压。提供负阈值,例如 –0.40V、-1.3...

关键字: 超低压 MOSFET 低功耗设计

寻求在电路设计中实现更低的工作电压和更低的功耗水平是一种趋势,这给电气工程师带来了艰巨的挑战,因为他们遇到了基本半导体器件特性对他们施加的限制。长期以来,工程师们一直将这些特性视为基本特性,并可能阻止他们最大限度地扩大可...

关键字: 超低压 MOSFET 低功耗设计

Linux内核是从V2.6开始引入设备树的概念,其起源于OF:OpenFirmware, 用于描述一个硬件平台的硬件资源信息,这些信息包括:CPU的数量和类别、内存基地址和大小、总线和桥、外设连接、中断控制器和中断使用情...

关键字: Linux内核 硬件 CPU

珀金埃尔默日前推出Cellaca PLX图像式细胞分析系统,这是业界第一款能让研究人员在单个自动化工作流中实现对细胞样本多个关键质量属性进行分析和评估的台式平台,包括对细胞性质、质量和数量的分析评估。拥有尖端技术的Cel...

关键字: AC EXCEL 硬件 自动化

上周说开始盘三极管,周末我专门花时间去研究了小伙伴的留言,又去翻了模电的书,目的是寻找好的切入点。去翻课本,发现课本上总是会从三极管的发展历程讲起,谈谈三极管的物理构成,分析内部载流子的传输过程,电流的分配关系等等。这些...

关键字: 三极管 内部载流子 硬件

据相关消息报道,爱立信近日表示,自从俄乌冲突发生以来,爱立信方面只向俄罗斯提供软件和技术支持,已经停止了向移动运营商出售任何电信硬件设备的渠道和业务。

关键字: 爱立信 俄罗斯 硬件

有人问我射频怎么学?能不能速成?老实说我这水平也只是刚入门,5G/4G/V2X/毫米波雷达/相控阵等等我都没有设计过,仅仅是对PA,LNA,混频器,滤波器,单芯片收发(零中频/低中频),超外差架构等等有一些对应的项目设计...

关键字: 射频 硬件

近日,随着万众瞩目的苹果秋季发布会告一段落,几款新产品也进入大众视野。这一届新产品虽在软件上令人耳目一新,但硬件上却无太大更新。不过在硬件的布置方面,苹果仍有值得一提的动作,比如被嵌入到AirPods Pro耳机盒中的U...

关键字: 苹果 硬件 U1芯片

消费电子

96007 篇文章

关注

发布文章

编辑精选

技术子站

关闭