当前位置:首页 > 嵌入式 > 嵌入式教程


1 引言

从20世纪50年代开始对语音识别的研究开始,经过几十年的发展已经达到一定的高度,有的已经从实验室走向市场,如一些玩具、某些部门密码语音输入等。

随着DSP和专用集成电路技术的发展,快速傅立叶变换以及近来嵌入式操作系统的研究,使得特定人识别尤其是计算量小的特定人识别成为可能。因此,对特定人语音识别技术在汽车控制上的应用的研究是很有前途的。

2 特定人语音识别的方法

目前,常用的说话人识别方法有模板匹配法、统计建模法、联接主义法(即人工神经网络实现)。考虑到数据量、实时性以及识别率的问题,笔者采用基于矢量量化和隐马尔可夫模型(HMM)相结合的方法。

说话人识别的系统主要由语音特征矢量提取单元(前端处理)、训练单元、识别单元和后处理单元组成,其系统构成如图1所示。

图1 系统构成

由上图也可以看出,每个司机在购买车后必须将自己的语音输入系统,也就是训练过程,当然最好是在安静、次数达到一定的数目。从此在以后驾驶过程中就可以利用这个系统了。

所谓预处理是指对语音信号的特殊处理:预加重,分帧处理。预加重的目的是提升高频部分,使信号的频谱变得平坦,以便于进行频谱分析或声道参数分析。用具有 6dB/倍频程的提升高频特性的预加重数字滤波器实现。虽然语音信号是非平稳时变的,但是可以认为是局部短时平稳。故语音信号分析常分段或分帧来处理。

2.1 语音特征矢量提取单元

说话人识别系统设计中的根本问题是如何从语音信号中提取表征人的基本特征。即语音特征矢量的提取是整个说话人识别系统的基础,对说话人识别的错误拒绝率和错误接受率有着极其重要的影响。同语音识别不同,说话人识别利用的是语音信号中的说话人信息,而不考虑语音中的字词意思,它强调说话人的个性。因此,单一的语音特征矢量很难提高识别率。该系统在说话人的识别中采用倒谱系数加基因周期参数,而在对控制命令的语音识别中仅采用倒谱系数。其中,常用的倒谱系数有2 种,即LPC(线性预测系数)和倒谱参数(LPCC),一种是基于Mel刻度的MFLL(频率倒谱系数)参数(Mel频率谱系数)。

对于LPCC参数的提取, 可先采用Durbin递推算法、格型算法或者Schur递推算法来求LPC系数,然后求LPC参数。设第l帧语音的LPC系数为αn,则LPCC的参数为


1<n≤p
其中p为LPCC系数的阶数,k为LPCC系数的递推次数。
进一步的研究发现,引入一阶和二阶差分倒谱可以提高识别率。
对于MPCC参数的提取,若根据Mel曲线将语音信号频谱分为K个频带,每个频带的能量为θ(Mk),则 MFCC参数为
1<n≤p
通过对LPCC和MFCC参数对识别率影响的实验比较,笔者选取LPCC参数及其一阶和二阶差分倒谱稀疏作为特征参数。

基音周期估计的方法很多,主要有基于求短时自相关函数的算法、基于求短时平均幅度差函数(AMDF)的算法、基于同态信号处理和线性预测编码的算法。笔者仅介绍基于求短时自相关函数的算法。

设Sw(n)是一段加窗语音信号,它的非零区间为0<n≤n-1。Sw(n)的自相关函数称为语音信号的S(n)的短时自相关函数,用Rw(l)表示,即
Rw(l)=

可知短时自相关函数在Rw(0)处最大,且在基音周期的各个整数倍点上有很大的峰值,选择合适的窗函数(窗长为40ms的Hamming窗)与滤波器(带宽为60~900Hz的带通滤波器)后,只要找到自相关函数的第一最大峰值点的位置并计算它与零点的距离,便能估计出基音周期。

2.2 训练单元

训练单元的功能是把事先收集到的语音利用一定的算法为每一个待识别的说话人训练出与之相匹配的参数。针对说话人识别在汽车应用中的不同的要求,训练单元也分为2部分:对说话人识别的训练和对待识别词的训练。

对于说话人识别部分的训练, 针对说话人的特征进行训练,为每个合法用户建立一套或多套HMM模型,同时采用基于矢量量化(VQ)的方法,为每个合法用户建立VQ码本。VQ码本的设计采用LBG算法,初始码本的设置采用分裂法初始码本。

第2 部分针对控制命令中用到的每个孤立的词条建立多个训练样本,或称为词条样本,估计出该词条的HMM参数(一套或多套)。对一个HMM过程的完整的描述包括:2个模型参数N和M,3组概率度量A,B和π。为了方便起见,通常采用如下方式表示一个完整的模型:λ=(N,M,π,A,B),或者简写为:λ= (π,A,B)。而对于每一个词条V的模型参数,V=1~V,可以用Baum-Welch重估算法。

2.3 识别单元

识别单元的功能是利用经训练已经获得的HMM模型参数 和测得的说话人的基音周期在一定的判决条件下辨认出待识别的说话人并估计出待识别的控制命令词串。针对HMM模型参数通常采用的判决条件是最大后验概率,用Viterbi算法实现。

2.4 后处理单元

充分利用每个说话人的声道参数和词条中各状态持续时间的概率分布来改进系统的识别率。

3 系统的实现

由于汽车的控制命令是有限的词条和数字串的组合, 对这些语音命令的识别属于特定人小词汇量的连接词的识别以及与文本有关的说话人确认,不论是从目前的DSP运算速度还是存储空间来说,实时实现这些语音命令的识别都是完全可能的。

识别系统组成框图如图所示:在此系统中,对运算能力和存储单元要求非常高的语音识别部分完全由DSP完成。

框图中识别系统的功能是完成语音的输入、A/D转换及识别,系统中核心部分采用TMS320VC5410。其原因是它的运算速度和存储空间都能满足要求,同时它的一些并行运算硬件结构也非常适合语音识别的各种算法,程序和已经脱机训练好的HMM参数表及相应的词典存放在程序存储器中,数据存储器存放识别过程中的中间计算数据。A/D芯片采用TLC320AD50C, 里面含有A/D、D/A以及低通滤波器和采样保持电路。模拟语音信号的输入主要是通过传声器,保证语音门禁的安全性,转换后的数字语音数据以同步串行通信方式传送给DSP。如图2。

图2 识别系统的组成框图

4 结束语

语音控制汽车是未来的一种趋势。目前,将语音技术应用于汽车的产品只有在一些玩具中用到,由此可想利用语音技术进行汽车控制这一领域蕴涵着相当大的潜在市场。

而且,说话人识别技术已经发展到可以应用到实际的阶段了,但目前对说话人识别的应用并不是很多。笔者尝试提出一种比较容易实现的方案,将说话人识别技术应用到实际中。但在实际应用中,说话人识别系统都面临一个共同的问题,即无法区分一个发音是现场发音还是录音回放。针对该现象,笔者提出的说话人识别系统可以有效地防止这种情况发生。具体实现说话人识别系统时,可采用随机或其它方法来生成提示文本。如随机的数字串,以使假冒者无法事先录音,增加驾驶的安全性。


本文来源:PLC&FA 作者:张志刚 陈昌巨

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

5月15日消息,今日,百度发布公告表示,文心大模型日均处理Tokens文本已达2490亿。

关键字: 百度 汽车 新能源

2023/24 财年收入降至 15.50 亿欧元(上一年同期:17.91 亿欧元) 调整后息税折旧摊销前利润率为 24.8% 居林和莱奥本的半导体封装载板生产将于 2024/25 财年末开始 2024/...

关键字: BSP 半导体封装 印制电路板 汽车

大象汽车北美公司与加拿大最大的上装厂及经销商ITD工业公司签署加拿大独家经销合作备忘录。 双方将探索在加拿大市场提供组装制造服务的合资企业。 香港2024年5月8日 /美通社/ -- 5月8日,全球领先的...

关键字: 汽车 电动 新能源 氢燃料电池

汽车公司 Automobili Pininfarina 策划了一项独特的 Battista 委托计划,以此向1955 年 Lancia Florida,一辆由 Battista 'Pinin' Farina 设计和喜爱的...

关键字: BAT INA 汽车 TI

上海2024年4月17日 /美通社/ -- 当自然故土与科技绿洲激情碰撞,未来将迸发怎样的色彩?橙色,诞生自旭日光辉与苍茫大地,它是熊熊燃烧的炽火,也是浮想联翩的异次元,唤醒了我们对世界的无尽绮想,象征着人类、自然、科技...

关键字: 汽车 中国汽车 汽车产业 灯光

2024 年 4 月 24 日,中国上海——数字成像雷达芯片技术头部企业 Uhnder 宣布推出全新成像雷达解决方案 S81。S81 是一款高度集成的单芯片解决方案,支持多达 96 个 MIMO 通道,且基于领先的数字编...

关键字: Uhnder 汽车 4D 数字成像 雷达芯片

汽车电气化推动了电子保险丝“eFuse”取代机械继电器和熔断器,以实现更紧凑、更高效的解决方案。NIV3071 eFuse 可保护下游电路免受过流、过温和接地短路事件的影响,并可通过开漏 FAULT 引脚提供故障指示器。...

关键字: 汽车 电气化 电子保险丝

德国埃朗根2024年4月16日 /美通社/ -- Elektrobit 今日宣布推出 EB zoneo GatewayCore——首款支持、配置和集成现代微控制器新一代硬件加速器的软件产品,可应用于先进的汽车电子/电气架...

关键字: 汽车 软件 硬件加速 通信网络

业内消息,近日网传有理想汽车员工透露公司即将裁员,有一张截图内容显示目前公司状态是:“新offer全部暂停审批;17岗以上会有少量股票,但可能与绩效等考评挂钩,低绩效无法套现;全部预算缩减30%以上,目前人员架构按照年销...

关键字: offer 裁员 汽车 理想汽车

随着电力电子技术的快速发展,NC稳压电源作为重要的电力供应设备,在各个领域得到了广泛应用。然而,在实际使用过程中,NC稳压电源三相不平衡问题时常出现,这不仅影响了电源的稳定性和可靠性,还可能对用电设备造成损害。因此,研究...

关键字: 电力电子 汽车 电力系统
关闭
关闭