当前位置:首页 > 消费电子 > 音视频及家电
[导读] (文章来源:最极客)        语音识别技术,也被称为自动语音识别(ASR)。其目标是将人类语音中的词汇内容转换为计算机可读的数据,如字符序列或二进制编码等。不过,早在计算机发明之前,人

(文章来源:最极客)
       语音识别技术,也被称为自动语音识别(ASR)。其目标是将人类语音中的词汇内容转换为计算机可读的数据,如字符序列或二进制编码等。不过,早在计算机发明之前,人类就已经开始了对语音识别技术的研究,早期的声码器即可看作是语音识别及合成的雏形。1920年代生产的“Radio Rex”玩具狗可能是最早的语音识别器。只要呼唤这只狗的名字,他就会从底座上弹出来。

1952年,贝尔研究所的Davis等人开发了Audrey语音识别系统,成为世界上首个能够识别10个英文数字发音的实验系统。其识别方法主要是追踪语音中的共振峰,该系统的准确率为98%。到1950年代末,College of London(伦敦学院)将语法概率加入语音识别中。

1960年,英国的Denes等人研究成功了第一个计算机语音识别系统,同时人工神经网络被引入语音识别。70年代后,语音识别在孤立词及小词汇量的识别方面取得了实质性进展。到了80年代,研究重点转向大词汇量、非特定人连续语音识别。与此同时,语音识别的研究思路由传统的基于标准模板匹配的技术转为基于HMM(统计模型)的技术,并再次提出将神经网络技术引入语音识别领域的技术思路。

1981年,日本在第五代计算机计划中提出了关于语音识别输入-输出自然语言的目标。尽管没有按照预期实现,但关于语音识别技术的研究有了大幅度的提升和进展。1987年开始,日本又出台了高级人机口语接口和自动电话翻译系统的项目。进入90年代以后,在语音识别的系统框架方面并没有什么重大突破。但是,在语音识别技术的应用及产品化方面出现了很大的进展。

中国的语音识别发展研究起始于1958年,由中国科学院声学所利用电子管电路识别10个元音。1973年,中国科学院声学所开始了对计算机语音识别的研究。由于当时被条件所限,中国语音识别研究工作一直处于缓慢发展的状态。

1986年3月,中国高科技发展计划(863计划)启动,因为语音识别是智能计算机系统研究的一个重要组成部分,故而被专门列为研究课题。在863计划的支撑下,中国开始了有组织的语音识别技术的研究。由此,中国语音识别技术进入了一个前所未有的发展阶段。

2006年深度学习兴起,2009年深度学习首次在语音识别任务中取得成功,基于深度学习的语音识别取得了很大的突破。在技术方面,语音识别从最初的前馈全连接神经网络,到之后的递归神经网络,到长短时记忆模型,再到当前包含数十层结构的深层全卷积神经网络。网络结构愈加复杂,但也越来越能够契合语音的特性从而实现建模,相应的效果也愈发显著。

当下,基于深度学习的语音识别系统已经通过海量的用户大数据训练得到了一个通用的识别系统,在日常场合已经能够实现应用。技术的成熟以及广阔的前景使得许多互联网公司也纷纷入局语音识别领域。

去年12月,阿里巴巴宣布为上海全部地铁站的售票机安装语音识别技术,用以验证上班族的身份。科大讯飞也在安徽为医疗信息提供语音签名服务,同时为警方提供语音识别服务。此外,百度、腾讯也分别在语音识别领域有所动作。由此可见,语音识别技术很可能成为继人脸识别技术后的下一个生物识别的主流方式,并逐渐受到广泛的关注和消费级的应用。但在发展过程中,仍然不可避免地会遭遇一些瓶颈。

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

LED驱动电源的输入包括高压工频交流(即市电)、低压直流、高压直流、低压高频交流(如电子变压器的输出)等。

关键字: 驱动电源

在工业自动化蓬勃发展的当下,工业电机作为核心动力设备,其驱动电源的性能直接关系到整个系统的稳定性和可靠性。其中,反电动势抑制与过流保护是驱动电源设计中至关重要的两个环节,集成化方案的设计成为提升电机驱动性能的关键。

关键字: 工业电机 驱动电源

LED 驱动电源作为 LED 照明系统的 “心脏”,其稳定性直接决定了整个照明设备的使用寿命。然而,在实际应用中,LED 驱动电源易损坏的问题却十分常见,不仅增加了维护成本,还影响了用户体验。要解决这一问题,需从设计、生...

关键字: 驱动电源 照明系统 散热

根据LED驱动电源的公式,电感内电流波动大小和电感值成反比,输出纹波和输出电容值成反比。所以加大电感值和输出电容值可以减小纹波。

关键字: LED 设计 驱动电源

电动汽车(EV)作为新能源汽车的重要代表,正逐渐成为全球汽车产业的重要发展方向。电动汽车的核心技术之一是电机驱动控制系统,而绝缘栅双极型晶体管(IGBT)作为电机驱动系统中的关键元件,其性能直接影响到电动汽车的动力性能和...

关键字: 电动汽车 新能源 驱动电源

在现代城市建设中,街道及停车场照明作为基础设施的重要组成部分,其质量和效率直接关系到城市的公共安全、居民生活质量和能源利用效率。随着科技的进步,高亮度白光发光二极管(LED)因其独特的优势逐渐取代传统光源,成为大功率区域...

关键字: 发光二极管 驱动电源 LED

LED通用照明设计工程师会遇到许多挑战,如功率密度、功率因数校正(PFC)、空间受限和可靠性等。

关键字: LED 驱动电源 功率因数校正

在LED照明技术日益普及的今天,LED驱动电源的电磁干扰(EMI)问题成为了一个不可忽视的挑战。电磁干扰不仅会影响LED灯具的正常工作,还可能对周围电子设备造成不利影响,甚至引发系统故障。因此,采取有效的硬件措施来解决L...

关键字: LED照明技术 电磁干扰 驱动电源

开关电源具有效率高的特性,而且开关电源的变压器体积比串联稳压型电源的要小得多,电源电路比较整洁,整机重量也有所下降,所以,现在的LED驱动电源

关键字: LED 驱动电源 开关电源

LED驱动电源是把电源供应转换为特定的电压电流以驱动LED发光的电压转换器,通常情况下:LED驱动电源的输入包括高压工频交流(即市电)、低压直流、高压直流、低压高频交流(如电子变压器的输出)等。

关键字: LED 隧道灯 驱动电源
关闭