当前位置:首页 > 嵌入式 > 嵌入式硬件
[导读]摘要:降低多媒体算法的复杂性和存储器需求对于存储器资源和运算能力都很有限的嵌入式设备是十分重要的。在极低码率应用时,JPEG存在严重的方块效应,JPEG2000具有极高的运算

摘要:降低多媒体算法的复杂性和存储器需求对于存储器资源和运算能力都很有限的嵌入式设备是十分重要的。在极低码率应用时,JPEG存在严重的方块效应,JPEG2000具有极高的运算复杂性和存储器需求。分析了H.264 INTRA帧编码的运算复杂性和存储器需求,并提出了一种减小运算复杂性的有效方法。结果显示,H.264 INTRA帧编码具有极低的运算量和存储器需求,非常适合嵌入式设备的静止图像编码。   关键词:静止图像编码 H.264 JPEG2000 零块检测 嵌入式多媒体设备的静止图像编码有着广泛的应用,如照片的拍摄与传输。设备处理的图像越来越大,存储容量和传能力都相当有?因而静止图像编解码要求具有较低的运算复杂性、较少的存储器需求和极好的压缩性能。目前已经制定的静止图像压缩标准主要有JPEG和JPEG2000。JPEG标准在中高速率上压缩效果较好, 对于细节分量多的灰度图像, 当编码压缩率低于每像素0.25比特时,视觉失真大,重构图像存在严重的方块效应,不能很好地适应网络传输图像的需要。JPEG2000为了降低运算中的存储器需求,使用分块技术,对每个小块进行处理,但采用较小的块在低码率时存在与JPEG一样的方块效应。因而JPEG2000 在低比特率应用时, 建议不分块或者分成较大的块,以保证良好的率失真性能, 但运算复杂性和存储器需求都极高。

  视频编码新标准H.264代表着继MPEG1/2和MPEG4后的第三代视频编码标准。H.264比以前的标准提供了更高的编码增益。H.264的 INTRA帧编码算法充分利用图像中的空间相关和变换域的相关性,提供了极高的编码增益,可以用来对静止图像进行编码。在文献[1]中H.264采用 JM73代码,JPEG2000 采用Jasper 1.700.5,对标准静止测试图像和视频序列进行测试。测试结果表明:与JPEG2000相比,H.264 INTRA帧具有更高的客观质量和主观质量,但译码器的运算复杂性却比JPEG2000低50%左右。在嵌入式设备上,多媒体应用的实时性不仅取决于算法的运算次数,还取决于可得到的存储器带宽。CPU的工作频率越来越高,存储器的频率却增加缓慢,很多算法的瓶颈在于数据输入输出。有效减小算法的存储器需求,减少中间结果的存储需求,可缩减片外存储器访问次数,提高应用的实时性能。下面主要讨论降低H.264 INTRA帧编码的运算复杂性和存储器需求的方法。 图2 1 减少运算复杂性   H.264 INTRA帧具有比JPEG2000更高的客观质量,这主要是由于INTRA帧采用的多种帧内预测模式较好地去掉了空间冗余。对于平滑的背景区域采用 16%26;#215;16大小的粗糙预测,共有4种可能的预测方向。对于快速变化的图像区域,采用4%26;#215;4的块,共有9种预测模式。在预测后,对残差信号进行整型变换消除频谱相关性。高效的去方块效应滤波器改善了图像的信噪比和主观质量。图1是H.264编码器的结构流程图。从图1可以看出,在整帧图像的熵编码后,对逆整型变换后的重建数据进行去方块效应,去方块效应后的重建图像数据用作下一帧预测图像的编码,或者用于编码同时显示重建图像。编码器的作用主要是压缩原始数据产生输出码流,若不需要在本地编码器中显示重建图像(例如卫星照片的拍摄),则编码器中的整帧图像的去方块效应可以省去,节省大约30%的运算。宏块的帧内预测包含9种4%26;#215;4模式和4种16%26;#215;16模式如图2。INTRA 16%26;#215;16 预测仅仅采用左边16个像素和上边16个像素作参考;INTRA 4%26;#215;4 预测仅仅采用左边4个像素和上边9个像素作参考,因而在逆整型变换和重建(逆变换结果与预测值相加)时,仅仅需要计算16%26;#215;16宏块的第 16行与第16列像素、4%26;#215;4块的第4行与第4列像素,没有必要计算所有的像素。对于16%26;#215;16的块,减少224个重建像素的计算。对于4%26;#215;4的块,减少8个重建像素的计算。整型变换、量化、逆量化、扫描以及逆变换消耗比较多的编码时间,可利用在模式选择时计算的绝对差值和(SAD),提前判断整型变换后量化系数全0块,从而省去全0块的整型变换、量化、逆量化、扫描以及逆变换这一系列操作。若SAD小于某个门限T,各个变换系数绝对值小于量化步长(Qstep),该块为0块。实验中取T等于3Qstep,获得了较高的检测率和较低的检测差错率。 H.264 采用整型变换,为简化门限的推导,其中的整型变换与4%26;#215;4的离散余弦变换(DCT)相差较小,DCT变换为:

在INTRA帧量化中,即

,所有变换系数量化为0。由于该式是量化系数全为零的充分条件,而不是必要条件。实验结果显示,使用该门限检测出零块的正确性为100%,大量的量化系数为全零块却检测不出来。为了大幅提高零块检出率,增大该门限T为3Qstep,测量miss.qcf 20帧编码的平均情况,测试结果见表1。从表1可以看出,零块检测率随着量化索引增大而增大,可能将部分非零块检测成零块,但这对信噪比影响不大。 表1 不同量化索引的零块检出率 量化索引零块检出率(%) 检出错误率(%) 平均信噪比降低(dB) 20 23 1 0.00 24 68 1 0.00 26 83 2 0.02 28 85 1 0.05 30 87 2 0.08 32 90 2 0.16 2 缩减存储器需求   减少运算中的存储器需求对于嵌入式设备十分重要。宏块编码的过程包含预测、模式选择、变换量化扫描、逆量化等。从图2可以看出,在 INTRA16%26;#215;16的4种预测模式中,只使用上边和左边的各16个像素作为预测参考,在INTRA 4%26;#215;4 的9种预测模式中,仅使用左边4个像素和上边9个像素作为预测参考,因而重建图像并不需要整帧存储,只需存储这几个参考点就可以了。假设宏块编码按照从左到右、从上到下顺序进行,则水平方向的像素需要存储一整行。

[!--empirenews.page--]

在INTRA 4%26;#215;4模式编码时,由于相邻的4%26;#215;4块模式高度相关,采用相邻块的预测模式预测当前块的最可能模式,同样只需要存储上边一行4%26;#215;4和左边一个4%26;#215;4块的编码模式(如图3)。在对量化后变字长编码(VLC)系数的个数进行编码时,需要利用相邻两块的非零系数个数对该块进行预测,也只需要存储上边一行4%26;#215;4和左边一个4%26;#215;4块的编码模式的非零系数个数,如图 3。在对整帧图像的数据比特串(SODB)添加原始字节序列载荷(RBSP)结尾比特(RBSP trailing bits,添加一比特的"1"和若干比特"0",以便字节对齐)后,再检查RBSP 中是否存在连续的三字节"00000000 00000000 000000xx";若存在这种连续的三字节码,在第三字节前插入一字节的"0%26;#215;03",以免与起始码竞争,形成EBSP码流,这需要将近两倍的整帧图像码流大小。为了减小存储器需求,在每个宏块编码结束后即检查该宏块SODB中的起始码竞争问题,并保留SODB最后两字节的零字节个数, 以便与下一宏块的SODB的开始字节形成连续的起始码竞争检测;对一帧图像的最后一个宏块,先添加结尾停止比特,再检测起始码竞争。采用这种方法产生 H.264 附录B中的字节流时,存储器需求从两帧码流大小缩小到两个宏块码流大小。通过对码流输出过程的改进,使INTRA帧编码需要的存储器大小不随图像大小的增加而增加,这时编码过程中的存储器不超过9K个整数。对于基于片上存储器的多媒体处理器,存储器需求的减少可以大量缩减中间结果的片外片上转移,减小数据转移的负担,提高程序的运行速度。   采用H.264 INTRA帧对静止图像进行编码时,在编码器端不需要显示本地重建图像,可省掉去方块效应滤波器;利用模式选择时计算的绝对差值和,可提前判断量化后全零系数块,节省大量的计算。分阶段地对各个宏块的码流插入竞争阻止字节(emulation prevention byte),以保证原始字节序列载荷中不含起始码,有效减少存储器的需求。运算复杂性和存储器需求极低的H.264 INTRA编码模式,可代替JPEG2000,用于嵌入式设备的静止图像编码

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

无论您是在研究如何使用 10GigE 还是寻求所需考虑事项的建议,本文均提供有实践,帮助确保单相机 10GigE 视觉系统设置顺利并拥有良好性能。 我们列出了主机系统配置、布线和相机设置的实践。

关键字: 视觉系统 CPU 存储器

存储器是计算机系统中的关键组件,负责存储程序指令和数据,是实现计算和信息处理的基础。根据其工作原理、存储容量、访问速度、稳定性以及持久性等诸多特性,存储器可以被细分为多个类别。本篇文章将详细介绍存储器的主要分类,并探讨各...

关键字: 存储器 RAM

Apr. 03, 2024 ---- 4月3日7时58分在台湾花莲县海域(北纬23.81度,东经121.74度)发生7.3级地震,震源深度12千米。根据全球市场研究机构TrendForce集邦咨询于第一时间调查各厂受损及...

关键字: 存储器 晶圆代工

2024年3月26日,中国-- 服务多重电子应用领域、全球排名前列的半导体公司意法半导体(STMicroelectronics,简称ST;纽约证券交易所代码:STM)发布了一项基于 18 纳米全耗尽绝缘体上硅(FD-SO...

关键字: 处理器 微控制器 存储器

该产品线提供了并行SRAM的低成本替代方案,容量高达 4 Mb,具有143 MHz SPI/SQI™通信功能

关键字: SRAM 存储器 MCU

【2024年1月15日,德国慕尼黑讯】卫星上的边缘计算和推理可实现近乎实时的数据分析和决策制定。随着联网设备的数量及其产生的数据量不断增长,这一点变得愈发重要。为满足太空应用中的这些高性能计算需求,英飞凌科技股份公司(F...

关键字: 存储器 嵌入式 边缘计算

可编程逻辑控制器(PLC,Programmable Logic Controller)是一种专为工业环境设计的数字电子系统。它使用可编程的存储器,内部存储程序,执行逻辑运算、顺序控制、定时、计数和算术操作等面向用户的指令...

关键字: 可编程逻辑控制器 数字电子系统 存储器

Jan. 11, 2024 ---- 根据TrendForce集邦咨询表示,全球受高通胀冲击,2023年笔电市场需求欲振乏力,全年出货量仅1.66亿台,年减10.8%,但衰退幅度较2022年收敛。

关键字: AI 笔电 存储器

可编程逻辑控制器(PLC)是一种工业自动化控制装置,它采用可编程的存储器来存储指令,执行逻辑运算、顺序控制、计数、定时和算术操作等面向用户的指令,并通过模拟或数字输入/输出控制各种类型的机械或生产过程。PLC的基本原理可...

关键字: 可编程逻辑控制器 自动化 存储器

Jan. 8, 2024 ---- TrendForce集邦咨询表示,2024年第一季DRAM合约价季涨幅约13~18%,其中Mobile DRAM持续领涨。目前观察,由于2024全年需求展望仍不明朗,故原厂认为持续性减...

关键字: DRAM 存储器 智能手机
关闭
关闭