当前位置:首页 > 智能硬件 > 人工智能AI
[导读]   神经网络的真实原理到底是什么?神经网络语言处理工作原理又是如何?据悉有研究人员已经寻到了更好的解释。   神经网络通过分析大量的训练数据来学习并执行任务,这是近期人工智能领

  神经网络的真实原理到底是什么?神经网络语言处理工作原理又是如何?据悉有研究人员已经寻到了更好的解释。

  神经网络通过分析大量的训练数据来学习并执行任务,这是近期人工智能领域最令人印象深刻的进展,包括语音识别和自动翻译系统。

  然而,在训练过程中,神经网络以甚至其创造者都无法解释的方式来不断调整其内部设置。计算机科学最近的许多工作都聚焦于千方百计的弄清楚神经网络的工作原理。

  在最近的几篇论文,来自麻省理工学院计算机科学人工智能实验室(CSAIL)和卡塔尔计算研究所的研究人员已经使用了新开发的解释技术,来分析神经网络做机器翻译和语音识别的训练过程,该新技术已被应用于其他领域。

  他们对神经网络的工作原理有了基本认知。例如,这些系统似乎专注于较低级别的任务,如声音识别或部分语音识别,然后再转到更高级别的任务,如转录或语义解释。

  但是研究人员也发现了翻译网络处理数据类型的一个惊人的遗漏,他们指出纠正这种遗漏会提高网络的性能。这种改进是适度的,但它指出了对神经网络的分析可能有助于提高人工智能系统的准确性。

  “从历史角度看,在机器翻译里,有一个具有不同层次的金字塔,” CSAIL一位高级研究科学家说。这位科学家在是麻省理工学院电气工程和计算机科学的毕业生,曾参与Yonatan Belinkov项目。”在最低层有文字,表层形式,金字塔的顶层是一种语际表示,在做语法和语义时会达到不同的层次。这是一个非常抽象的概念,意思是你在金字塔中爬得越高,就越容易翻译成一种新的语言,然后你就再往下走。所以Yonata所做的部分工作是找出在神经网络中这种概念的会是什么样的编码。”

  近期在国际自然语言处理联合会议上发表了两篇论文。Belinkov是第一作者,Glass是资深作者。另一篇,Belinkov是一个联合作者。

  他们都是来自卡塔尔计算研究所的研究人员,包括Lluís Màrquez,Hassan Sajjad,Nadir Durrani,Fahim Dalvi和Stephan Vogel。Belinkov和格拉斯是分析的语音识别系统的唯一作者。这篇文章是Belinkov上周神经信息处理会议上提出的。

  分层处理

  神经网络之所以得名,是因为它们大致接近人脑的结构。通常,它们被分层,每个层由许多简单的处理单元节点组成,每个节点都连接到上面和下面的层中的几个节点。数据被送入最低层,其节点处理它并将其传递给下一层。层之间的连接具有不同的“权重”,它决定了任何一个节点的输出转化到到下一个节点的计算量是多少。

  在训练过程中,节点之间的权重不断调整。在网络被训练后,它的创建者可以确定所有连接的权重,但有成千上万个甚至多个节点,甚至它们之间有更多的连接,推断出这些权重编码的算法几乎是不可能的。

  麻省理工和卡塔尔计算研究所研究人员的技术包括训练一个神经网络和使用它的每一层的输出,通过个别的培训案例,培养其他的神经网络来执行特定的任务。这使他们能够确定每个层优化的任务是什么。

  在语音识别网络的案例中,Belinkov和Glass使用的单个层输出训练系统识别“语音”,区别于口语的发音单元。例如,“T”的发音在“Tea”“Tree”和“But”,是不同的,但语音识别系统已经把他们都用字母“T”转录。事实上,Belinkov和Glass发现,低层次的网络比高层次网络语言识别能力更强。在那里,可能区别是不重要的。

  同样的,Glass, Belinkov和他们卡塔尔计算研究所的同事于去年夏天在语言协会年度大会上发布的文章表明,机器翻译网络的低层善于识别词类和形态,比如时态、数字和共轭。

  语义理解

  但是在新的论文中,他们表明网络的更高层次在语义标注方面更好。Belinkov解释说,一部分语音标签,能认识到“herself”是一个代词,但这个代词的语义的意义,在句子“she bought the book herself”和“she herself bought the book”是不同的。语义标注会分配不同的标签,给这两句话中的“herself“,就像一个机器翻译系统可能在一个给定的目标语言为它们找到不同的翻译。

  最好的机器翻译系统使用所谓的编码解码模式,和麻省理工和卡塔尔计算研究所研究人员的神经网络一样。在这样的系统中,源语言中的输入经过几个被称为编码器的网络层来产生一个向量,一组数字代表某种输入的语义内容。该向量通过多个网络层的解码器来产生目标语言中的译文。

  虽然编码器和解码器在一起训练,但它们可以被认为是独立的网络。研究人员发现,奇怪的是,编码器的低层善于区分形态,但解码器的更高层不是。所以Belinkov和卡塔尔计算研究所研究人员在训练网络时,不仅仅根据翻译的准确性,也根据目标语言中的形态分析来判定性能。从本质上讲,他们迫使解码器更好地区分形态。

  使用这种技术,他们培训网络将英语翻译成德语,发现其精度提高3%。这不是一个革命性的进步,但这表明,探寻神经网络的本质可能不仅仅是一项学术活动。

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

May 31, 2024 ---- 据TrendForce集邦咨询研究,受到供应商减产影响,自2023年第四季起涌进的大容量订单需求尚未被完全满足,加上其它终端产品欲凭借建置低价库存的采购策略而扩大订单,同时,AI服务器...

关键字: AI 服务器 SSD

【2024 年 5月 31 日,中国上海讯】近期,不论是高阶电竞或是AI应用的发展,对于系统运算能力和性能的要求都在不断提升,因此,对电源的高转换效率与散热已成为未来市场的刚性需求。全球散热及电源解决方案品牌酷冷至尊(上...

关键字: 功率电源 半导体 AI

● Arm® 终端计算子系统(CSS)作为新的计算解决方案,结合了Armv9架构的优势,以及基于三纳米工艺节点,经过验证和证实为生产就绪的新Arm CPU和GPU实现,可赋能芯片合作伙伴快速创新,并加快产品上市进程。 ●...

关键字: AI 人工智能

5月31日消息,据媒体报道,OpenAI的CEO山姆·奥特曼(Sam Altman)正计划对公司进行重大重组,旨在将OpenAI转型为一家营利性企业。

关键字: 奥特曼 AI

科技体验中心由英特尔中国与金隅环贸合作打造,提供了一站式的展示、体验和交流平台。中心占地面积1500平方米,全面展示了英特尔推动计算创新的历史以及在中国的发展历程。同时,中心还通过一个个模拟实际场景的应用,呈现英特尔推动...

关键字: 计算 数字化 AI

May 29, 2024 ---- 根据TrendForce集邦咨询研究,受惠于AI 服务器自二月起扩大采用Enterprise SSD,大容量订单开始涌现,以及PC、智能手机客户为因应价格上涨,持续提高库存水位,带动2...

关键字: AI 服务器 NAND Flash

5月29日,中科可控AI工作站系列新品首发亮相,双“国芯”配置,推动全场景智慧再升级!

关键字: AI

近日,马斯克谈到了旗下AI初创公司xAI的聊天机器人Grok,声称要将其打造成“又严谨、又追求真理、又是最风趣”的AI聊天机器人,不过他承认,Grok在与OpenAI和Google竞争之前,还需要迎头赶上,马斯克也补充说...

关键字: 马斯克 Grok ChatGPT AI xAI

2024年5月25日,上海市欧美同学会长宁分会与曼彻斯特大学中国中心以"智能向善 AI for good"为主题,联合举办了"第二届人工智能论坛"。人工智能领域的企业家和专家学者发表主题演讲及参与圆桌论坛,逾百余位海归学...

关键字: 人工智能 AI 大语言模型

人工智能(AI)在处理大量资料时,其实相当耗能,供电已是未来左右AI发展的重要关键之一,不过,摩根大通发布研究报告指出,AI 数据中心巨量水消耗问题相对被忽视,2030 年每天用水量可能达到 4.5 亿加仑。

关键字: AI 数据中心
关闭
关闭