当前位置:首页 > 智能硬件 > 人工智能AI
[导读]      自20世纪80年代以来,语音识别技术的研究取得了许多突破性进展,特别是基于隐马尔可夫模型(HMM)的语音识别技术,目前已趋成熟,成为语音识别的主流。然而基本型的HMM模型也存在

  
   自20世纪80年代以来,语音识别技术的研究取得了许多突破性进展,特别是基于隐马尔可夫模型(HMM)的语音识别技术,目前已趋成熟,成为语音识别的主流。然而基本型的HMM模型也存在一些固有缺陷,这些缺陷除体现在状态的持续时间没有直接在模型参数中反映出来外,还表现在:

  (1)采用状态输出独立假设,每个时刻的输出仅与所处的状态有关,而与以前的输出没有关系,然而实际语音信号却有很强的时间相关性,这就影响了HMM模型描述语音信号帧间相关性的能力。

  (2)连续HMM模型假定状态输出概率密度函数为混合高斯分布函数,而实际的语音信号分布是非常复杂的,很难用简单的高斯分布的组合形式来表征。为了弥补这些缺陷,许多改进的方法被提出来。

  语音识别技术是近年来高速发展的一项技术,由于其重要的理论价值与广阔的应用前景,受到人们的广泛重视。语音是一个复杂的非线性过程,基于线性系统理论的语音识别方法的局限性越来越凸显。近年来,随着人工神经网络、模糊逻辑、粒子群优化算法等非线性理论研究和应用的逐渐深入,这些理论已经开始独立或者相互交叉应用到语音识别领域中。

  语言是人类获取信息的主要来源之一,不仅是人类与外界交流信息最方便、最有效、最自然的手段,而且也是人与机器之间进行通信的重要工具。无论是人与人之间还是人与之间的语言通信,语音信号处理,特别是语音信号数字处理,都具有特别重要的作用。

  随着计算机技术的快速发展,用现代手段研究语音信号处理技术,使得人们能更加有效的产生、传输、存储和获得语音信息,这对于促进社会的发展具有十分重要的意义

  数字语音信号处理,包括三方面内容,即语音信号的数字表示法,语音信号数字处理理论的各种方法和技术及数字语音处理理论和技术在各领域中的实际应用。

  模糊神经网络在语音识别中的应用

  神经网络是在现代科学研究成果的基础上提出来模拟人脑结构机制的一门新兴科学,它不是人脑真实的全面描述,而是这类生物神经网络的抽象、模拟和简化,其目的在于探索人脑的信息加工、存储和搜索机制,从而为人工智能和信息处理等学科的研究开辟新途径。人工神经网络就是采用物理可实现的系统来模拟人脑神经细胞的结构和功能的系统。它是由很多处理单元有机地连接起来进行并行的工作,它的处理单元虽十分简单,但其工作却是“集体”进行的,它的信息传播、存储方式与神经网络相似,它没有运算器、存储器、控制器等这些现代计算机的基本单元,而是相同的简单处理器的组合,其信息处理是存储在处理单元的连接上

  模糊逻辑是模仿人脑的不确定性概念判断、推理思维方式,对于模型未知或不能确定的描述系统,以及非线性、大滞后的控制对象,应用模糊集合和模糊规则进行推理,表达过渡性界限或定性知识经验,模拟人脑方式,实行模糊综合判断,推理解决常规方法难于对付的规则型模糊信息问题。模糊逻辑善于表达界限不清晰的定性知识与经验,它借助于隶属度函数概念,区分模糊集合,处理模糊关系,模拟人脑实施规则型推理,解决因“排中律”的逻辑破缺产生的种种不确定问题。

  随着模糊信息处理技术和神经网络技术研究的不断深入,将模糊技术与神经网络技术进行有机结合,从而构造出一种可“自动”处理模糊信息的神经网络或自适应模糊系统,以成为模糊技术与神经网络技术深入研究和发展的一种必然趋势。神经网络技术和模糊技术各自有自己的优点,前者以生物神经网络为模拟基础,试图在模拟推理及自动学习方面向前发展一步,使人工智能更接近人脑的自组织和并行处理功能,它在模式识别、聚类分析和专家等多方面己显示了新的前景和新的思路。后者以模糊逻辑为基础,抓住了人类思维的模糊性特点,以模仿人的模糊综合判断推理来处理常规的方法难以解决的模糊信息处理的难题。而将模糊技术和神经网络技术相结合,可以有效的发挥各自的优势并弥补不足。模糊技术的特长在于拓展神经网络处理信息的范围和能力,使其不仅能处理精确的信息也能处理模糊信息和其他不精确的信息,不仅能够实现精确的联想及映射,还可以实现不精确的联想和映射,特别是模糊联想和模糊映射仁。

  语音识别在实现过程中通常涉及多种因素,需要同时考虑。由于计算量很大,再加上语音信号的随机性,以及我们对人类听觉机理了解甚浅,因此,目前机器自动识别语音的能力要比人类差得多,尤其是对非特定人的连续语音识别更是如此。用模糊神经网络模型作为分类器或聚类器,发展出一些新的语音识别方法。

  由于模糊神经网络不仅具有模糊系统中的知识抽取和表达能力,适合于表达模糊或定性的知识,能够运用类似人的思维模式来进行推理,也拥有神经网络有并行计算、分布式信息存储、容错能力强以及具备自适应学习功能的一系列能力。将模糊神经网络模型用于语音识别系统,该系统具有以下特点:。

  1、能够尽量多的利用了样本集中的有用信息以实现多因素综合评定,发挥神经网络的优势。

  2、能够很好的引入领域专家的经验知识,利用模糊规则来指导网络的训练,使网络的训练能够更符合人的推理习惯。

  3、对输入、输出形式进行特殊的模糊化处理后,可以用有限样本集含有的信息比较好的、近似真实分布的反映原有知识

  传统的语音识别和采用模糊神经网络的语音识别是有区别的。在传统的语音识别方法中,模式匹配法是在对语音做过预处理之后,通过特征参数的提取及模式匹配完成识别。由于语音信号的高度多变性,输入模式要与标准模式完全匹配是几乎不可能的。因此,识别时要预先制定好计算输入的语音特征模式与各特征模式的类似或距离的规则,距离最小者就是最类似的模式。而句法模式识别法当认为输入的位置模式属于某个对象时,就要检查一下输入模式与识别对象的结构,当与对象模式结构相同或在某范围内结构一致时,则判定该未知模式就是识别对象的语音。模糊神经网络的语音识别方法与传统方法的差异在于提取了语音的特征参数后,不像传统方法那样有输入模式与标准模式的比较匹配,而是靠模糊神经网络根据专家知识或者先验知识,先对输入特征数据进行模糊化产生对不同规则的隶属度,然后根据标准来调节网络中大量的连接权对输入模式进行非线性运算,产生最大兴奋的输入点就代表了输入模式对应的分类。

  模糊控制于20世纪六十年代萌芽于美国,七十年代诞生于欧洲,八十年代当西方人不太喜欢“模糊理论”时,它却在日本发展并广泛用于家电的自动控制,九十年代与神经网络以来,才得到全球的广泛认可并成为智能系统的一个重要分支。虽然模糊神经网络的研究没有神经网络长,但由于它结合了模糊控制和神经网络的优点,现在以广泛的用于各个领域。目前模糊神经网络在语音信号处理中的应用研究十分活跃,其中以在语音识别方面的应用已经取得较大的进步。同神经网络相似,模糊神经也主要是从听觉神经模型中得到启发,以便构成一些具有类似能力的人工系统,使它们在解决语音信号处理(特别是识别)问题时能得到较好的性能。研究模糊神经网络以探索人的听觉神经机理,改进现有语音语音识别系统的性能,是当前语音识别研究的一个重要方向。

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

本文中,小编将对语音识别技术予以介绍,如果你想对语音识别技术的详细情况有所认识,或者想要增进对它的了解程度,不妨请看以下内容哦。

关键字: 语音识别 语音识别技术

在这篇文章中,小编将为大家带来语音识别技术的相关报道。如果你对本文即将要讲解的内容存在一定兴趣,不妨继续往下阅读哦。

关键字: 语音识别 语音识别技术

今天,小编将在这篇文章中为大家带来语音识别的有关报道,通过阅读这篇文章,大家可以对语音识别具备清晰的认识,主要内容如下。

关键字: 语音识别 智能家居

语音识别技术将是下述内容的主要介绍对象,通过这篇文章,小编希望大家可以对语音识别技术的相关情况以及信息有所认识和了解,详细内容如下。

关键字: 语音识别 芯片

在这篇文章中,小编将对语音识别模块的相关内容和情况加以介绍以帮助大家增进对语音识别模块的了解程度,和小编一起来阅读以下内容吧。

关键字: 语音识别 语音识别模块

一直以来,语音识别都是大家的关注焦点之一。因此针对大家的兴趣点所在,小编将为大家带来语音识别的相关介绍,详细内容请看下文。

关键字: 语音识别 智能家居 智能客服 人工智能

在下述的内容中,小编将会对语音识别技术的相关消息予以报道,如果语音识别技术是您想要了解的焦点之一,不妨和小编共同阅读这篇文章哦。

关键字: 语音识别 语音识别技术

以下内容中,小编将对语音识别模块的相关内容进行着重介绍和阐述,希望本文能帮您增进对语音识别模块的了解,和小编一起来看看吧。

关键字: 语音识别 语音识别模块

本文中,小编将对语音识别技术予以介绍,如果你想对它的详细情况有所认识,或者想要增进对它的了解程度,不妨请看以下内容哦。

关键字: 语音识别 智能家居 物联网

在这篇文章中,小编将为大家带来汽车语音识别控制系统怎么用的相关报道。如果你对本文即将要讲解的内容存在一定兴趣,不妨继续往下阅读哦。

关键字: 语音识别 语音识别控制系统 语音导航
关闭
关闭