当前位置:首页 > 工业控制 > 工业控制
[导读]摘 要: 为充分利用码本的级间相关性,提出了一种联合码本优化多级矢量量化(JCO-MSVQ)码本设计方法。每次迭代时,先将训练矢量对码字进行聚类,再对各级码本进行联合优化,利用条件期望逐级更新码本。实验数据表明,

摘 要: 为充分利用码本的级间相关性,提出了一种联合码本优化多级矢量量化(JCO-MSVQ)码本设计方法。每次迭代时,先将训练矢量对码字进行聚类,再对各级码本进行联合优化,利用条件期望逐级更新码本。实验数据表明,该算法在设计10维线谱频率(LSF)参数量化码本时,较随机松弛算法(SR)码本有更小的平均量化畸变。23比特/帧LSF参数量化器平均对数谱失真为0.87dB,达到了透明量化要求。
  关键词: 多级矢量量化 线谱频率 加权对数谱失真 透明量化


  矢量量化(Vector Quantization)是一种极其重要的信号压缩方法,广泛应用于语音、图像信号压缩等领域。信息论的一个分支——“率-畸变理论”指出,无论对于何种信息源,即使是无记忆的信息源(即各个采样信号之间互相统计独立),矢量量化总是优于标量量化,且矢量维数越大优度越高。因此,目前国内外对于矢量量化技术的研究非常广泛而深入。平衡考虑量化效果和运算复杂度,多级矢量量化(MSVQ)提供了一个很好的折衷办法。
  线性预测编码(LPC)参数能很好地表征语音信号的短时谱包络信息,在各种LPC参数中,线谱频率(LSF)[1]较其它参数能更有效地表达LPC信息。K.K.Paliwal和B.S.Atal仔细研究了用24~26个比特量化一个10阶LSF参数的方法,提出了分裂矢量量化(Split Vector Quantization)和多级矢量量化MSVQ(Multistage Vector Quantization)两种方案,并且试验得到了用25比特的2级MSVQ能取得较好的量化效果(平均失真1dB,2~4dB概率小于2%,大于4dB为0)。
  MSVQ算法有效减小了码本容量,但如果在量化比特有限的情况下,想取得透明的量化效果,必须解决两个问题:(1)怎样搜索码本得到最佳匹配索引;(2)怎样设计码本。在算法设计中这两个问题必须统一考虑。对前一个问题,为了方便一般采用序列搜索算法,依次搜索得到各级的最佳匹配矢量。在码本设计中,更多的也是分级依次进行码本训练,割裂了各级码本之间的相关性。本文将着重研究多级矢量量化的联合优化码本设计问题。
1 问题分析
  传统的MSVQ算法在LSF参数码本设计时采用一种连续(stage-by-stage)的设计方法,第k级码本只与前面的第1至第(k-1)级码本有关,而不考虑后续各级码本,即将后续各级码本内容视为0。在量化时,同样只在本级寻找1个最佳匹配矢量,然后得到余量矢量送入下一级量化。量化过程可以用式(1)表示,假设有2级码本,需要找出各级码本索引:
  
  在序列搜索算法中,搜索yi时,假设zj为0,搜索zj时yi已经固定。这样的搜索算法显然是一种次优的搜索算法,解决这个问题的方法是全搜索[3]。全搜索是最优的搜索算法,但是其计算复杂度却是难以承受的。例如,一个25比特2级码本(13-12结构),其全搜索复杂度是上述连续搜索的2000倍以上。M进制搜索[4]折衷解决了这个问题。在运算量大大减小的情况下,取得了逼近全搜索的量化效果。
  在码本设计中,无论是经典的GLA算法还是改进的模拟退火(SA)算法,码本设计都是逐级连续进行的。利用各级码本之间的相关性优化码本设计,可以较明显地改善MSVQ的量化效果。在应用联合码本设计方法量化音频DCT系数时,已经取得了大约0.4 dB的SNR改善[5]。本文在量化LSF参数时,对比300步的SR算法,得到了大约0.05dB、约1bit的加权对数谱失真(WLSD)[6]的改进效果。
2 算法说明
2.1 失真距离量度
  对一个MSVQ码本,为方便考虑假设共有2级码本。LSF参数为10维矢量。对LSF参数而言,其敏感矩阵(sensitivity matrix)是对角阵,因此可以用加权最小均方误差(WMSE)代替加权对数谱失真(WLSD)作为失真量度[6]。量化失真
  
  r的经验值一般为0.15。
2.2 理论推导
  对一个训练矢量集X和两级码本Y、Z,可以对X中每个矢量进行2级全搜索,得到最佳索引值对(i,j)。根据i和j的不同可以对X中每个矢量进行聚类。假设S为对第一级码字形成的聚类,Si为所有X中第一级量化索引为i的训练矢量集合。同样假设R为第二级码字聚类,可知,{S1,S2,…,SK1}和{R1,R2,…,RK2}均是同一X集合的不同划分。对于X∈Si,平均量化失真为:
  
  可以令v=E{x-U|x∈Si},则第三项为0。第二项恒为非负,所以
  
  通过多次迭代,可以得到联合优化的最优码本。
2.3 算法描述
  (1)设置初始码本,读入训练矢量文件,并对其进行两级码本全搜索,得到针对两级码本的聚类{S1,S2,…,SK1}和{R1,R2,…,RK2}。假设训练矢量个数为num,对所有训练矢量计算此时的量化失真之和,失真测度采用WLSD距离。设置迭代最大步数N,设置初始步数n=0;
  (2)n=n+1,利用式(9)更新第一级码本;
  (3)重新对训练矢量集进行全搜索,得到新的索引值对(i, j),然后利用式(10)更新第二级码本;
  (4)再次对训练矢量集进行量化搜索,得到新的索引值对(i, j),并重新计算量化总畸变Dn
  (5)判断n=N?若n<N,跳转至(2)继续进行迭代;若n=N,结束迭代,保存更新后的码字至码本文件。
2.4 算法的进一步优化
  上述联合优化MSVQ算法中,很重要的一步就是对训练矢量进行聚类,使每个训练矢量得到一个最匹配的索引值对(i, j)。(i, j)应当是通过全搜索得到的全局最佳匹配矢量。在不需要在线更新码本的情况下,全搜索是可以采用的。然而如果在矢量维数较高时,想减小码本训练的运算量,也可以采用M进制序列搜索的方法。取M=8在实验中得到了很好的效果。这样即可得到一个性能近似的简化版JCO-MSVQ码本设计方法。
  另外,在码本设计中,可能出现聚类中无训练矢量,即出现空聚类的情况。这时可以删除该空聚类,并将包含训练矢量最多的那个聚类抖动成两个聚类。这样可以获得更小的联合量化误差,如图1所示。


3 实验结果和分析
  实际应用中,码本训练采用107 MB的语音文件,得到342302帧LSF参数(10维)和加权系数,训练矢量集足够大。在实际的2kbps语音编码算法中,对LSF参数进行3级矢量量化,比特分配为9/8/6,共23bits。利用联合优化码本生成算法进行300步迭代,与SR算法的第三级300步迭代结果进行比较,得到训练码本总畸变数据,如图2所示。


  可以看到,同样步数的JCO-MSVQ算法较SR算法能取得更小的量化畸变。SR算法经过一定步数的迭代,基本没有下探的空间。而JCO-MSVQ算法则能继续优化码本,获得更好的量化效果。并且,与SR算法不同,JCO-MSVQ算法中量化畸变是单调递减的,因在训练过程中每一步都是最优的(简化算法中是多进制搜索,因而是次优的)。
  统计量化谱失真,联合码本优化MSVQ比其他的MSVQ有明显的改善。在同一个LSF量化器中分别采用23bits SR码本(码本1)、24bits SR码本(码本2)和23bits联合优化码本(码本3),测试语音为一个3.5MB的语音文件,既有男声也有女声,共11348帧LSF参数。统计量化谱失真得到表1所示数据。
  从表1数据可以看到,同是23bits的量化,联合码本设计MSVQ与应用SR算法生成码本的MSVQ相比较,有大约1个比特的改善,接近于应用SR算法24bits量化的效果。甚至优于文献[2]中MSVQ算法的26bits量化(平均谱失真0.93dB)。平均谱失真为0.87dB,大于4dB的谱失真统计为0,达到了透明量化的要求。


  本文研究结果已经成功应用于1/2kbps可变速率声码器项目中。

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

许多工业系统旨在满足特定的 UL(保险商实验室)或 IEC(国际电工委员会)安全标准,通常最终目标是获得 UL 认证。作为此过程的一部分,许多设计必须符合 UL 或 IEC(或两者)概述的一组非常具体的要求。例如,在欧洲...

关键字: LPC 低功耗电路

本文来源:由半导体行业观察编译自网络近日,全球开放硬件标准组织RISC-VInternational宣布,RISC-V成员已经批准了15项新规范(代表40多个扩展),用于免费开放的RISC-V指令集架构(ISA)。最值得...

关键字: RISC-V VECTOR 数据中心 虚拟机

随着科技的进步,双核逐渐被淘汰已是时间上的问题,四核乃至八核心CPU也已不再是什么新奇的事物,不过在微控制器领域,双核却是个十分新颖的东西。

关键字: 双核 LPC 开发板 XPRESS

CAN总线以其设计独特、成本低、可靠性高、实时性和抗干扰能力强等特点,在汽车工业、机械工业、纺织工业、机器人、数控机床、医疗器械等领域得到了广泛的应用。从高速网络到

关键字: CAN LPC CAN控制器 路由

安立公司为 MN4765B 系列 O/E 校准模块推出两个选件,旨在针对光电组件(如调制器、光接收器和集成光收发模块)的特性提供高精度、高灵活性且具有成本效益的测量解决方案。有了这些新选件,MN4765B 即可与...

关键字: VECTOR 双波长 ST RS

21ic讯,未来的智能交通系统会采用IEEE 802.11p的无线标准,作为“车辆—车辆”、“车辆—路侧”(V2I)的通讯方式,通过这些方式,车...

关键字: 车联网 COM VECTOR 测试方案

21ic讯 2015年9月17日,致力于亚太地区市场的领先半导体元器件分销商—大联大控股宣布,其旗下品佳推出NXP JN5168+LPC3240智能网关解决方案。 图示1-大联大品佳代理的NXP的JN5...

关键字: NXP 智能网关 LPC 品佳集团

本设计以控制能力突出,外设接口丰富,运算速度快的ARM芯片LPC1788作为控制、数据处理核心,使用了位于AHB总线上能进行快速访问的多个GPIO口以扩展定制的宽温液晶屏,对各

关键字: LPC 芯片技术 系列芯片 ARM内核

摘要:随着煤矿自动化、智慧矿山的快速发展,工作面支架电液控系统的功能也更加复杂。为了满足支架电液控系统在实时姿态控制、数据传输以及与工作面采煤机、刮板机、视频监控等系统联动方面的要求,本文基于LPC4320异

关键字: LPC 双核处理器 数据传输 人机交互

早期单片机应用软件开发完成以后,是通过相应的编程器将程序烧写入单片机的ROM或EPROM里,这样每一次擦写程序都需要将芯片从电路板上拆卸下来,不利于研制开发,对于日后的产品软件升级也非常不方便。随着新一代单片

关键字: 远程通信 ISP LPC 下位机

工业控制

13478 篇文章

关注

发布文章

编辑精选

技术子站

关闭