当前位置:首页 > 智能硬件 > 人工智能AI
[导读] 自然语言处理一直是人工智能发展道路上面临的巨大挑战。此前,大多数研究都是让机器学习模型在大量已标记数据集上进行训练的。最近,百度研究院人员提出了一种全新的方法,研究人员让人工

自然语言处理一直是人工智能发展道路上面临的巨大挑战。此前,大多数研究都是让机器学习模型在大量已标记数据集上进行训练的。最近,百度研究院人员提出了一种全新的方法,研究人员让人工智能系统通过与「教师」的口语对话来学习自然语言和知识。这种类似婴儿学习语言过程的方法展现出了很大的潜力。机器之心对该文及其研究论文摘要进行了编译,原文链接见文末。

四月上旬,百度研究团队通过由虚拟教师(a virtual teacher)发出自然语言指令,成功地教会了人工智能代理(agent)在迷宫中导航(参阅:用自然语言教育人工智能:百度新算法发展出 zero-shot 学习能力)。今天,百度研究团队又很高兴地宣布,通过与虚拟老师之间的交互,其人工智能代理成功地学会了说话。

说话,以及其他人类基本能力,在创建通用人工智能的道路上不可或缺。尽管今天与机器进行简单的交谈很常见,但是百度研究团队教机器说话的方法与传统方法大不相同。

百度的人工智能代理以一种类似于婴儿互动的方式学习说话。相反,传统方法依赖于有监督训练,使用包含大量预搜集训练集的静态语料库,难以捕捉到语言学习过程中的动态交互属性。结果,通过传统方法训练的系统主要反映了数据集中的行为,适应性和泛化能力有限。百度的人工智能代理通过交互学习说话,旨在获取语言学习与理解能力而不仅仅是捕捉到数据之中的统计模式。

当一个婴儿学习说话时,他与人产生交互,并通过模仿和反馈进行学习。婴儿最初通过模仿其会话者来产生言语行为,掌握字句生成的技巧。婴儿也会向其父母发出声音,并根据父母的纠正和鼓励调节其言语行为。

研究概述

百度研究人员提出了一种基于自然语言学习的交互式方法,其中人工智能代理通过与虚拟教师(教授者)交互、获得反馈来学习自然语言,从而学习和提高自然语言技能以达到参与对话的程度。在这里,没有带标签数据形式的监督学习来引导学习者;取而代之的是,系统必须通过不断尝试说来学习说话,而教授者会提供口头反馈(如是/否)和非口头反馈(如点头/微笑)。

下图显示了训练中几种不同形式的对话。在一开始,代理只能生成无意义的句子,它只能在纯粹对话中提升自己的技能。而到了最后,代理可以正确运用自然语言回答教授者提出的问题。

另一方面的实验进一步证明了新方法具备学习自然语言的能力。研究人员证明训练后的人工智能代理可以回答由已知知识或问题中的概念组成,但经过重组后形成的全新问题。例如,在训练中,「avocado,east」组合从未出现在问答中;而 orange 仅被描述过,从未被教授者问到过。而在测试中,代理可以回答有关在「east」的「avocado」的问题,或有关「orange」的问题,如上图所示。

百度的研究人员表示,他们会在未来进一步增加语言学习环境的复杂性,以训练出更为复杂的语言行为。另外,他们还计划探索机器学习系统的知识建模与快速学习,让人工智能代理能够与人类进行自然交互,并让它可以从物理世界中进行有效的学习。

论文:Listen, Interact and Talk: Learning to Speak via InteracTIon

论文链接:https://arxiv.org/abs/1705.09906

摘要:人工智能的一个长期目标是构建一种可与人类进行自然语言交互的代理。然而,目前的大部分自然语言学习的研究都依赖大量带注释标签的数据集以进行训练,这导致人工智能代理的任务变成了外部数据集的统计学抓取。由于训练数据本质上是由标注者对知识进行的静态表述,人工智能代理经过学习后的适应性和拓展性受到了限制。此外,这种训练方法与人类学习自然语言的过程非常不同,后者是一个交流的过程,通过说话和获得反馈来进行。

在本论文中,我们提出了一种交互形式的自然语言学习方法。其中,人工智能代理通过与教授者(teacher)用自然语言互相交流,从而在谈话中学习和提高语言技能。为了达成这个目标,我们构建了一个包含模仿和强化学习方法的模型,用以比较句子和教授者的反馈。我们进行了实验,证明了这种方法的有效性。

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

5月15日消息,今日,百度发布公告表示,文心大模型日均处理Tokens文本已达2490亿。

关键字: 百度 汽车 新能源

提高车辆导航、车身电子设备和自动驾驶系统的定位准确度和可靠性

关键字: 自动驾驶 机器学习 导航

近日,字节跳动发布《企业纪律与职业道德委员会通报(2024年2号)》,因涉嫌构成刑事犯罪、违反廉洁诚信制度、违反利益冲突制度、违反信息安全制度四项原因辞退员工61人。近年来,多家互联网公司密集进行内部反腐整顿,包括腾讯、...

关键字: 互联网 字节跳动 辞退 腾讯 百度

业界应如何看待边缘人工智能?ST授权合作伙伴 MathWorks 公司的合作伙伴团队与ST 共同讨论了对边缘机器学习的看法,并与 STM32 社区分享了他们的设计经验。

关键字: AI 机器学习 处理器

双方的合作促成了尖端人工智能视觉解决方案,提高了效率、连通性和成本效益

关键字: 人工智能 智能家居 机器学习

【2024年4月24日,德国慕尼黑讯】英飞凌科技股份公司(FSE代码:IFX / OTCQX代码:IFNNY)发布全新PSOC™ Edge微控制器(MCU)系列的详细信息,该系列产品的设计针对机器学习(ML)应用进行了优...

关键字: 物联网 机器学习 MCU

TDK株式会社(东京证券交易所代码:6762)新近推出InvenSense SmartEdgeMLTM解决方案,这是一种先进的边缘机器学习解决方案,为用户提供了在可穿戴设备、可听戴设备、增强现实眼镜、物联网 (IoT)...

关键字: 机器学习 物联网 传感器

北京——2024年4月19日 亚马逊云科技宣布,Meta刚刚发布的两款Llama 3基础模型Llama 3 8B和Llama 3 70B现已在Amazon SageMaker JumpStart中提供。这两款模型是一系列...

关键字: 机器学习 基础模型

2024年4月18日 – 提供超丰富半导体和电子元器件™的业界知名新品引入 (NPI) 代理商贸泽电子 (Mouser Electronics) 很荣幸地宣布与Edge Impulse建立新的全球合作关系。Edge Im...

关键字: 机器学习 MCU CPU

北京——2024年4月18日 西门子中国和亚马逊云科技双方高层在西门子中国北京总部会晤,双方宣布签署战略合作协议,共同成立“联合创新团队”。基于亚马逊云科技在生成式AI领域的领先技术和服务,并结合西门子在工业领域的深厚积...

关键字: 生成式AI 机器学习 大数据
关闭
关闭