当前位置:首页 > 物联网 > 智能应用
[导读]本文中,小编将对语音识别技术予以介绍,如果你想对它的详细情况有所认识,或者想要增进对它的了解程度,不妨请看以下内容哦。

本文中,小编将对语音识别技术予以介绍,如果你想对它的详细情况有所认识,或者想要增进对它的了解程度,不妨请看以下内容哦。

一、语音识别技术的发展

(一)国外研究

从开始研究语音识别技术至今,语音识别技术的发展已经有半个多世纪的历史。语音识别技术研究的开端,是Davis等人研究的Audry系统,它是当时第一个可以获取几个英文字母的系统。到了20世纪60年代,伴随计算机技术的发展,语音识别技术也得以进步,动态规划和线性预测分析技术解决了语音识别中最为重要的问题——语音信号产生的模型问题;70年代,语音识别技术有了重大突破,动态时间规整技术(DTW)基本成熟,使语音变得可以等长,另外,矢量量化(VQ)和隐马尔科夫模型理论(HMM)也不断完善,为之后语音识别的发展做了铺垫;80年代对语音识别的研究更为彻底,各种语音识别算法被提出,其中的突出成就包括HMM模型人工神经网络(ANN);进入90年代后,语音识别技术开始应用于全球市场,许多著名科技互联网公司, 如IBM,Apple等,都为语音识别技术的开发和研究投入巨资;到了 21 世纪,语音识别技术研究重点转变为即兴口语和自然对话以及多种语种的同声翻译。

(二)国内研究

国内关于语音识别技术的研究与探索从20 世纪80 年代开始,取得了许多成果并且发展飞速。例如:清华大学研发的语音识别技术以1183 个单音节作为识别基元,并对其音节进行分解,最后进行识别,使三字词和四字词的准确率高达98%;中科院采用连续密度的HMM,整个系统的识别率达到89.5%,声调和词语的识别率分别是 99.5%和95%。目 前,我国的语音识别技术已经和国际上的超级大国实力相当, 其综合错误率可控制在10%以内。

清华大学电子工程系语音技术与专用芯片设计课题组,研发的非特定人汉语数码串连续语音识别系统的识别精度,达到94.8%(不定长数字串)和96.8%(定长数字串)。在有5%的拒识率情况下,系统识别率可以达到96.9%(不定长数字串)和98.7%(定长数字串),这是目前国际最好的识别结果之一,其性能已经接近实用水平。研发的5000词邮包校核非特定人连续语音识别系统的识别率达到98.73%,前三选识别率达99.96%;并且可以识别普通话与四川话两种语言,达到实用要求。

中科院自动化所及其所属模式科技(Pattek)公司2002年发布了他们共同推出的面向不同计算平台和应用的“天语”中文语音系列产品——PattekASR,结束了中文语音识别产品自1998年以来一直由国外公司垄断的历史。

2018年,科大讯飞提出深度全序列卷积神经网络(DFCNN),使用大量的卷积直接对整句语音信号进行建模。同年,阿里提出LFR-DFSMN模型,将低帧率算法和DFSMN算法进行融合,语音识别错误率相比上一代技术降低20%,解码速度提升3倍。2019年,百度提出了流式多级的截断注意力模型SMLTA,该模型在LSTM和CTC的基础上引入了注意力机制来获取更大范围和更有层次的上下文信息。在线语音识别率上,该模型比百度上一代DeepPeak2模型提升相对15%的性能。 2021年,科大讯飞提出“语音识别方法及系统”专利,通过“静态+动态”网络空间实时融合路径解码寻优算法解决了面向多领域、多用户、多场景下识别效果差、反应速度慢、系统构建时间长等技术问题,显著地提升了语音识别效果。

二、语音识别技术的挑战

1.噪音干扰:现实环境中的噪音是影响语音识别准确性的重要因素。许多语音识别系统在安静的环境下表现良好,但在嘈杂环境中性能下降严重。为解决这个问题,研究人员正尝试开发出更具鲁棒性的语音识别算法,以提高在嘈杂环境中的性能。

2.口音和语速差异:不同地区的人有不同的口音和语速,这增加了语音识别的难度。系统需要对各种口音和语速进行训练,以保证对不同用户的语音都能进行准确识别。此外,一些研究人员正尝试利用无监督学习技术来提高语音识别系统的性能。

3.隐私和安全:随着语音识别技术的广泛应用,隐私保护问题变得越来越重要。用户担心他们的语音数据会被滥用或泄露,因此需要有效的隐私保护策略来消除用户的顾虑。

三、语音识别技术的机遇

1.智能助手:语音识别技术是智能助手的的关键技术之一。智能助手能够理解用户的声音指令,并执行相应的操作,如播放音乐、发送信息、查询天气等。随着人工智能技术的不断发展,智能助手的应用场景也将越来越广泛。

2.智能家居:语音识别技术还可以应用于智能家居领域,例如智能音响、智能电视等。用户可以通过语音指令控制家电的开关、调节音量等。这种技术为用户提供了更加便利的生活方式,同时也为智能家居产业带来了新的发展机遇。

3.医疗领域:在医疗领域,语音识别技术被广泛应用于疾病诊断、药物推荐等。医生可以通过语音输入患者的症状和病史,从而更准确地诊断病情并开具处方。此外,语音识别技术还可以用于远程医疗和健康监测等方面,为医疗行业带来了新的发展机遇。

经由小编的介绍,不知道你对语音识别技术是否充满了兴趣?如果你想对它有更多的了解,不妨尝试度娘更多信息或者在我们的网站里进行搜索哦。

声明:该篇文章为本站原创,未经授权不予转载,侵权必究。
换一批
延伸阅读

双方的合作促成了尖端人工智能视觉解决方案,提高了效率、连通性和成本效益

关键字: 人工智能 智能家居 机器学习

轻量级AI定制模型助力低成本快速部署 北京2024年4月18日 /美通社/ -- 数据和人工智能(AI)领域的领先者SAS—今日在SAS Innovate大会上首次展示了一款变革性的、旨在帮助企业直面业务挑战的解决方案...

关键字: SAS AI模型 人工智能 INNOVATE

四月的上海,生机盎然繁花盛开。备受瞩目的“CHINAPLAS 2024 国际橡塑展”今日拉开帷幕,将一连四天(4月23 - 26日)在国家会展中心(上海)盛装绽放。展会规模空前,展商数量历史性地攀升至4,420家,相比2...

关键字: 新能源汽车 锂电技术 人工智能

创新打造云生态,共创智慧新未来

关键字: 人工智能 云实验室

眼下,人工智能不仅能辅助科学研究与艺术创作,还能实现自动驾驶、打造“无人农场”和“黑灯工厂”,成为解锁新质生产力的关键钥匙。

关键字: 人工智能 AI 无人农场

随着科技的飞速发展,人工智能已经逐渐走进我们的生活。从智能手机到自动驾驶汽车,人工智能正不断改变着我们的日常体验。然而,这只是科技革命的一个起点。

关键字: 人工智能 AI 自动驾驶

在人工智能的快速发展中,加强AI监管与推动AI技术的进步同等重要。从技术角度来看,可以通过可解释AI等技术手段增强AI的可信度。

关键字: 人工智能 AI 增强AI

上海2024年4月22日 /美通社/ -- 近日,全球领先人力资源咨询与解决方案提供商德科集团(The Adecco Group)发布《AI大变革中,全球商业领袖的前进之路(Leading Through the Gre...

关键字: AI 人工智能 Gen AI

随着科技的快速发展,人脸识别技术已经广泛应用于各个领域,如手机解锁、支付验证、门禁系统等。然而,有时我们可能会遇到人脸识别一直失败的情况,这不仅影响了用户体验,还可能引发安全隐患。本文将深入探讨人脸识别失败的原因,并提供...

关键字: 人脸识别 人工智能
关闭