当前位置:首页 > 消费电子 > 音视频及家电
[导读] 据 Loup Ventures 不久前发布的2019年语音助理智商测试的结果,通过对每个人工智能系统的800个相同问题的测试,谷歌助手再次引领了这一潮流,与去年一样,100%完全理解了被问到的问

据 Loup Ventures 不久前发布的2019年语音助理智商测试的结果,通过对每个人工智能系统的800个相同问题的测试,谷歌助手再次引领了这一潮流,与去年一样,100%完全理解了被问到的问题,并正确回答了其中的92.9%,比去年的85.5%的正确率要高。

相比之下,苹果的Siri在理解水平和正确回答水平这两方面的能力也都有提升,从去年的99%理解水平上升到今年的99.8%,同时在正确回答水平方面,从78.5%上升到2019年的83.1%。尽管亚马逊的Alexa再次位居第三,但今年也算是取得了重大进展,理解了99.9%的问题,并正确回答了79.8%的问题,比去年的Siri表现要好。近日,据外媒报道,亚马逊通过人工智能将实时语音识别错误率降低了6.2%,可以算是一个不小的进步。

据了解,自动语音识别系统是将语音转换为文本,如Alexa的核心系统,其中一个组件是一个模型,它预测哪个单词将出现在一系列单词之后。它们通常是基于n-gram语言模型,这意味着它们可以算出给定过去n-1个单词的下一个单词出现的概率。

N-Gram是基于一个假设:第n个词出现与前n-1个词相关,而与其他任何词不相关。(这也是隐马尔可夫当中的假设)整个句子出现的概率就等于各个词出现的概率乘积,各个词的概率可以通过语料中统计计算得到。但是,像递归神经网络这样的体系结构就比较难以融入实时系统,由于其学习长期依赖关系的能力,通常被用于语音识别,并且常常难以从多个语料库中获取数据。

这就是为什么亚马逊Alexa科研人员要研究能使得这种人工智能模型在语音识别中更实用的技术的原因。在奥地利格拉茨举行的2019年Interspeech会议上,计划发表的一篇博客和论文《ASR的可伸缩多语料库神经语言模型》中,声称他们可以将单词识别错误率比基线降低6.2%。

神经语言模型(NLM)在自动语音识别(ASR)和其他任务中的表现优于传统的N-gram语言模型。然而,要在实际的大规模ASR系统中使用NLM,还需要解决一些挑战。在一些解决方案中,从异源语料库中训练NLM,限制潜伏期影响和处理二次通过重测器中的个性化偏差。

研究人员通过建立领域内和领域外训练数据集的传统模型来解决数据稀缺的问题,这些模型是线性组合的,他们给每个语料库分配了一个分数来衡量其与域内数据的相关性,这决定了为补充数据集选择样本的可能性。

然后他们应用了迁移学习transfer learning,即机器学习的一种,就是把为任务 A 开发的模型作为初始点,重新使用在为任务 B 开发模型的过程中。迁移学习是通过从已学习的相关任务中转移知识来改进学习的新任务,虽然大多数机器学习算法都是为了解决单个任务而设计的,但是促进迁移学习的算法的开发是机器学习人员持续关注的话题。迁移学习对人类来说很常见,例如,我们可能会发现学习识别苹果可能有助于识别梨,或者学习弹奏电子琴可能有助于学习钢琴。

接下来,研究人员将数据通过一个带有n-gram语言模型的语音识别器传递,以使用人工智能模型来改进其预测。为了将传统模型拒绝人工智能模型考虑的假设的风险降到最低,他们使用人工智能模型生成合成数据,为一次通过模型提供训练数据。

训练数据中的样本是成对的词汇,而不是单个词汇,这是一个称为噪声对比估计的方案的一部分,其中一个成对词汇是真正的目标,而另一个词汇是随机选择的。该模型的任务是通过直接估计目标词汇的概率来学习区分。

最后,研究人员量化了人工智能模型的权重,以进一步提高其效率。量化考虑特定变量可以接受的全部值范围,并将其拆分为固定数量的间隔,这样一个间隔内的所有值都近似于一个数字。据研究人员透露,由于量化,人工智能模型在50%的情况下使得语音处理时间增加不超过65毫秒,在90%的情况下增加不超过285毫秒。

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

LED驱动电源的输入包括高压工频交流(即市电)、低压直流、高压直流、低压高频交流(如电子变压器的输出)等。

关键字: 驱动电源

在工业自动化蓬勃发展的当下,工业电机作为核心动力设备,其驱动电源的性能直接关系到整个系统的稳定性和可靠性。其中,反电动势抑制与过流保护是驱动电源设计中至关重要的两个环节,集成化方案的设计成为提升电机驱动性能的关键。

关键字: 工业电机 驱动电源

LED 驱动电源作为 LED 照明系统的 “心脏”,其稳定性直接决定了整个照明设备的使用寿命。然而,在实际应用中,LED 驱动电源易损坏的问题却十分常见,不仅增加了维护成本,还影响了用户体验。要解决这一问题,需从设计、生...

关键字: 驱动电源 照明系统 散热

根据LED驱动电源的公式,电感内电流波动大小和电感值成反比,输出纹波和输出电容值成反比。所以加大电感值和输出电容值可以减小纹波。

关键字: LED 设计 驱动电源

电动汽车(EV)作为新能源汽车的重要代表,正逐渐成为全球汽车产业的重要发展方向。电动汽车的核心技术之一是电机驱动控制系统,而绝缘栅双极型晶体管(IGBT)作为电机驱动系统中的关键元件,其性能直接影响到电动汽车的动力性能和...

关键字: 电动汽车 新能源 驱动电源

在现代城市建设中,街道及停车场照明作为基础设施的重要组成部分,其质量和效率直接关系到城市的公共安全、居民生活质量和能源利用效率。随着科技的进步,高亮度白光发光二极管(LED)因其独特的优势逐渐取代传统光源,成为大功率区域...

关键字: 发光二极管 驱动电源 LED

LED通用照明设计工程师会遇到许多挑战,如功率密度、功率因数校正(PFC)、空间受限和可靠性等。

关键字: LED 驱动电源 功率因数校正

在LED照明技术日益普及的今天,LED驱动电源的电磁干扰(EMI)问题成为了一个不可忽视的挑战。电磁干扰不仅会影响LED灯具的正常工作,还可能对周围电子设备造成不利影响,甚至引发系统故障。因此,采取有效的硬件措施来解决L...

关键字: LED照明技术 电磁干扰 驱动电源

开关电源具有效率高的特性,而且开关电源的变压器体积比串联稳压型电源的要小得多,电源电路比较整洁,整机重量也有所下降,所以,现在的LED驱动电源

关键字: LED 驱动电源 开关电源

LED驱动电源是把电源供应转换为特定的电压电流以驱动LED发光的电压转换器,通常情况下:LED驱动电源的输入包括高压工频交流(即市电)、低压直流、高压直流、低压高频交流(如电子变压器的输出)等。

关键字: LED 隧道灯 驱动电源
关闭