当前位置:首页 > 芯闻号 > 充电吧
[导读]5月8日消息,近期,Google翻译悄然升级了其翻译内核。据Google官方提供的数据显示,Google翻译搭载的Google的神经机器翻译(GNMT:Google Neural Machine Tr

5月8日消息,近期,Google翻译悄然升级了其翻译内核。据Google官方提供的数据显示,Google翻译搭载的Google的神经机器翻译(GNMT:Google Neural Machine Translation)系统使用了当前最先进的训练技术,因而提升了机器翻译水平,将翻译误差再度降低了55%-85%。

▲Google展示的翻译模型质量

十多年前,Google发布了Google翻译,早年基于短语的统计机器翻译,会将输入句子分解成词和短语,然后对它们进行独立翻译。这种翻译方式的劣势非常明显:句子中原本完整的信息被碎片化,无法连贯地进行表达。而这种现象在英中互译的情况下显得尤其明显。

而Google神经机器翻译则将输入的句子作为一个整体翻译。

以中英翻译为例,Google神经机器翻译首先将这句中文的词编码成一个向量列表,其中每个向量都表示了到目前为止所有被读取到的词的含义(编码器“Encoder”)。读取完整个句子,解码器就开始工作——一次生成英语句子的一个词(解码器“Decoder”)。

▲上图展示了Google神经机器翻译的中英翻译原理

为了在每一步都生成翻译正确的词,解码器重点注意了与生成英语词最相关编码的中文向量的权重分布。

在被首次提出时,神经机器翻译系统在中等规模的数据集上就与基于短语的翻译系统水平相当。

现在,Google方面表示,通过让神经机器翻译战胜在非常大型的数据集上工作的许多挑战,打造了在速度和准确度上都更好翻译的系统。

目前,Google神经机器翻译系统已投入到了中文-英语的翻译中。现在,移动版和网页版的Google翻译的中英翻译已完全使用神经机器翻译——每天大约1800万条翻译。

有经过大型数据集考验的Google神经机器翻译系统加持,最新的Google翻译效果究竟如何呢?

我们做了一个简单的比较测试。当然,还是在中英翻译场景下。

测试场景:PC端 Google翻译网页版

随机选择了一则英文消息,原文如下:

Since COVID-19 began, we’ve heard from our retail and brand manufacturing partners that they’re hungry for more insights on how consumer interests are changing, given fluctuations in consumer demand. We see these changes reflected in how people are searching on Google. Last month, there were spikes in search interest for household supplies and jigsaw puzzles as people spent more time at home. This month we’ve seen surging interest for sewing machines and baking materials in the U.S., and tetherball sets and chalk in the United Kingdom and Australia.

Businesses are using a variety of resources to understand changing consumer interests—including Google Trends, social listening, surveys, and their own data—in order to help make decisions on the fly. But if they don’t know what to look for, there isn’t an easy way to understand which product categories are gaining in popularity, and might pose an opportunity.

That’s why we’re launching a rising retail categories tool on Think with Google. It surfaces fast-growing, product-related categories in Google Search, the locations where they’re growing, and the queries associated with them. This is the first time we’ve provided this type of insight on the product categories that people are searching for.

旧版Google翻译给出的英译中结果:

升级后Google翻译给出的英译中新结果,红色标记字部分为与旧翻译结果的不同地方。新版翻译具体如下:

对比两段翻译结果,可以看出区别还挺大的。整体而言,新版翻译结果中标红文字的表述明显更符合汉语的语法和表述习惯。

另外,最后一段的翻译结果优化则更为明显,对Google产品名称“Think with Google”进行了准确识别,避免了乱翻译的尴尬。

确实更智能啦!

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

在这篇文章中,小编将为大家带来Linux内核的相关报道。如果你对本文即将要讲解的内容存在一定兴趣,不妨继续往下阅读哦。

关键字: 嵌入式 Linux 内核

欧莱雅中国旗下上海美次方投资有限公司达成首次开放式创新投资 法国克里希2023年9月22日 /美通社/ -- 欧莱雅集团宣布对中国创新型生物科技公司杉海创新进行少数股权投资,以建立长期合作伙伴关系,共同开发新...

关键字: AN BSP DEVELOPMENT FOR

轻薄实力! 深圳2023年9月22日 /美通社/ -- 9月20日,由中国电子信息产业发展研究院主办的2023琴珠澳集成电路产业促进峰会暨第十八届"中国...

关键字: FOR PCIE SSD 中国芯

与全球一线标准治疗方案泰瑞沙单药治疗相比,联合疗法降低疾病进展风险38% 新加坡2023年9月12日 /美通社/ -- III 期临床研究FLAURA2的阳性结果显示,在局部晚期(IIIB-IIIC 期)或转移性(IV...

关键字: BSP AI FOR SMALL

(全球TMT2023年9月8日讯)亚马逊云科技日前在一年一度的存储服务创新日上宣布推出诸多亚马逊云科技存储服务的新功能,其中重点包括为支持人工智能/机器学习、大数据分析等数据密集型工作负载进一步提升Amazon Ela...

关键字: 亚马逊 FOR IC Windows

北京2023年9月8日 /美通社/ -- 亚马逊云科技日前在一年一度的存储服务创新日上宣布推出诸多亚马逊云科技存储服务的新功能,其中重点包括为支持人工智能/机器学习、大数据分析等数据密集型工作负载进一步提升Amazon...

关键字: 亚马逊 人工智能 机器学习 FOR

作者:Rohit Badlaney,IBM Cloud 产品和行业平台总经理 北京2023年8月31日 /美通社/ -- 企业已经广泛采用混合云来实现敏捷性,并推动数字化转...

关键字: IBM VMWARE BSP FOR

智造加速器 创见你所想 上海2023年8月29日 /美通社/ -- 2023年8月29日,为期三天的深圳国际增材制造、粉末冶金与先进陶瓷展览会(Formnext+PM South China)拉开帷幕,本次展会延聚焦增...

关键字: CHINA FOR 泰科 NEX

向中国游戏公司介绍"Team NAVER"技术和内容应用方案 韩国首尔2023年8月21日 /美通社/ -- 韩国互联网公司NAVER向海外游戏公司介绍"Team NAVER"的...

关键字: CHINA FOR MARKET TE

北京2023年8月18日 /美通社/ -- 早在16世纪,近代人体解剖学创始人安德烈·维萨里在其著作《人体结构》中首次描述了人体的骨骼、肌肉、血管和神经的自然形态和分布。这一伟大成果使维萨里成为与哥白尼并列...

关键字: 亚马逊 FOR BSP NETAPP
关闭
关闭