当前位置:首页 > 物联网 > 智能应用
[导读]本文中,小编将对语音识别技术予以介绍,如果你想对它的详细情况有所认识,或者想要增进对它的了解程度,不妨请看以下内容哦。

本文中,小编将对语音识别技术予以介绍,如果你想对它的详细情况有所认识,或者想要增进对它的了解程度,不妨请看以下内容哦。

一、语音识别技术的发展

(一)国外研究

从开始研究语音识别技术至今,语音识别技术的发展已经有半个多世纪的历史。语音识别技术研究的开端,是Davis等人研究的Audry系统,它是当时第一个可以获取几个英文字母的系统。到了20世纪60年代,伴随计算机技术的发展,语音识别技术也得以进步,动态规划和线性预测分析技术解决了语音识别中最为重要的问题——语音信号产生的模型问题;70年代,语音识别技术有了重大突破,动态时间规整技术(DTW)基本成熟,使语音变得可以等长,另外,矢量量化(VQ)和隐马尔科夫模型理论(HMM)也不断完善,为之后语音识别的发展做了铺垫;80年代对语音识别的研究更为彻底,各种语音识别算法被提出,其中的突出成就包括HMM模型人工神经网络(ANN);进入90年代后,语音识别技术开始应用于全球市场,许多著名科技互联网公司, 如IBM,Apple等,都为语音识别技术的开发和研究投入巨资;到了 21 世纪,语音识别技术研究重点转变为即兴口语和自然对话以及多种语种的同声翻译。

(二)国内研究

国内关于语音识别技术的研究与探索从20 世纪80 年代开始,取得了许多成果并且发展飞速。例如:清华大学研发的语音识别技术以1183 个单音节作为识别基元,并对其音节进行分解,最后进行识别,使三字词和四字词的准确率高达98%;中科院采用连续密度的HMM,整个系统的识别率达到89.5%,声调和词语的识别率分别是 99.5%和95%。目 前,我国的语音识别技术已经和国际上的超级大国实力相当, 其综合错误率可控制在10%以内。

清华大学电子工程系语音技术与专用芯片设计课题组,研发的非特定人汉语数码串连续语音识别系统的识别精度,达到94.8%(不定长数字串)和96.8%(定长数字串)。在有5%的拒识率情况下,系统识别率可以达到96.9%(不定长数字串)和98.7%(定长数字串),这是目前国际最好的识别结果之一,其性能已经接近实用水平。研发的5000词邮包校核非特定人连续语音识别系统的识别率达到98.73%,前三选识别率达99.96%;并且可以识别普通话与四川话两种语言,达到实用要求。

中科院自动化所及其所属模式科技(Pattek)公司2002年发布了他们共同推出的面向不同计算平台和应用的“天语”中文语音系列产品——PattekASR,结束了中文语音识别产品自1998年以来一直由国外公司垄断的历史。

2018年,科大讯飞提出深度全序列卷积神经网络(DFCNN),使用大量的卷积直接对整句语音信号进行建模。同年,阿里提出LFR-DFSMN模型,将低帧率算法和DFSMN算法进行融合,语音识别错误率相比上一代技术降低20%,解码速度提升3倍。2019年,百度提出了流式多级的截断注意力模型SMLTA,该模型在LSTM和CTC的基础上引入了注意力机制来获取更大范围和更有层次的上下文信息。在线语音识别率上,该模型比百度上一代DeepPeak2模型提升相对15%的性能。 2021年,科大讯飞提出“语音识别方法及系统”专利,通过“静态+动态”网络空间实时融合路径解码寻优算法解决了面向多领域、多用户、多场景下识别效果差、反应速度慢、系统构建时间长等技术问题,显著地提升了语音识别效果。

二、语音识别技术的挑战

1.噪音干扰:现实环境中的噪音是影响语音识别准确性的重要因素。许多语音识别系统在安静的环境下表现良好,但在嘈杂环境中性能下降严重。为解决这个问题,研究人员正尝试开发出更具鲁棒性的语音识别算法,以提高在嘈杂环境中的性能。

2.口音和语速差异:不同地区的人有不同的口音和语速,这增加了语音识别的难度。系统需要对各种口音和语速进行训练,以保证对不同用户的语音都能进行准确识别。此外,一些研究人员正尝试利用无监督学习技术来提高语音识别系统的性能。

3.隐私和安全:随着语音识别技术的广泛应用,隐私保护问题变得越来越重要。用户担心他们的语音数据会被滥用或泄露,因此需要有效的隐私保护策略来消除用户的顾虑。

三、语音识别技术的机遇

1.智能助手:语音识别技术是智能助手的的关键技术之一。智能助手能够理解用户的声音指令,并执行相应的操作,如播放音乐、发送信息、查询天气等。随着人工智能技术的不断发展,智能助手的应用场景也将越来越广泛。

2.智能家居:语音识别技术还可以应用于智能家居领域,例如智能音响、智能电视等。用户可以通过语音指令控制家电的开关、调节音量等。这种技术为用户提供了更加便利的生活方式,同时也为智能家居产业带来了新的发展机遇。

3.医疗领域:在医疗领域,语音识别技术被广泛应用于疾病诊断、药物推荐等。医生可以通过语音输入患者的症状和病史,从而更准确地诊断病情并开具处方。此外,语音识别技术还可以用于远程医疗和健康监测等方面,为医疗行业带来了新的发展机遇。

经由小编的介绍,不知道你对语音识别技术是否充满了兴趣?如果你想对它有更多的了解,不妨尝试度娘更多信息或者在我们的网站里进行搜索哦。

声明:该篇文章为本站原创,未经授权不予转载,侵权必究。
换一批
延伸阅读

LED驱动电源的输入包括高压工频交流(即市电)、低压直流、高压直流、低压高频交流(如电子变压器的输出)等。

关键字: 驱动电源

在工业自动化蓬勃发展的当下,工业电机作为核心动力设备,其驱动电源的性能直接关系到整个系统的稳定性和可靠性。其中,反电动势抑制与过流保护是驱动电源设计中至关重要的两个环节,集成化方案的设计成为提升电机驱动性能的关键。

关键字: 工业电机 驱动电源

LED 驱动电源作为 LED 照明系统的 “心脏”,其稳定性直接决定了整个照明设备的使用寿命。然而,在实际应用中,LED 驱动电源易损坏的问题却十分常见,不仅增加了维护成本,还影响了用户体验。要解决这一问题,需从设计、生...

关键字: 驱动电源 照明系统 散热

根据LED驱动电源的公式,电感内电流波动大小和电感值成反比,输出纹波和输出电容值成反比。所以加大电感值和输出电容值可以减小纹波。

关键字: LED 设计 驱动电源

电动汽车(EV)作为新能源汽车的重要代表,正逐渐成为全球汽车产业的重要发展方向。电动汽车的核心技术之一是电机驱动控制系统,而绝缘栅双极型晶体管(IGBT)作为电机驱动系统中的关键元件,其性能直接影响到电动汽车的动力性能和...

关键字: 电动汽车 新能源 驱动电源

在现代城市建设中,街道及停车场照明作为基础设施的重要组成部分,其质量和效率直接关系到城市的公共安全、居民生活质量和能源利用效率。随着科技的进步,高亮度白光发光二极管(LED)因其独特的优势逐渐取代传统光源,成为大功率区域...

关键字: 发光二极管 驱动电源 LED

LED通用照明设计工程师会遇到许多挑战,如功率密度、功率因数校正(PFC)、空间受限和可靠性等。

关键字: LED 驱动电源 功率因数校正

在LED照明技术日益普及的今天,LED驱动电源的电磁干扰(EMI)问题成为了一个不可忽视的挑战。电磁干扰不仅会影响LED灯具的正常工作,还可能对周围电子设备造成不利影响,甚至引发系统故障。因此,采取有效的硬件措施来解决L...

关键字: LED照明技术 电磁干扰 驱动电源

开关电源具有效率高的特性,而且开关电源的变压器体积比串联稳压型电源的要小得多,电源电路比较整洁,整机重量也有所下降,所以,现在的LED驱动电源

关键字: LED 驱动电源 开关电源

LED驱动电源是把电源供应转换为特定的电压电流以驱动LED发光的电压转换器,通常情况下:LED驱动电源的输入包括高压工频交流(即市电)、低压直流、高压直流、低压高频交流(如电子变压器的输出)等。

关键字: LED 隧道灯 驱动电源
关闭