好消息,好消息……
9月27日,谷歌发布新版谷歌翻译(Google Translate)。据称,在人机翻译对比试验中,新版谷歌翻译的准确度已经直逼人工翻译。
看来广大翻译的福音要来了。外媒也非常激动!
来看美国著名财经网站Quartz的一则标题:
别急,还有更好的消息!
新版Google Translate首先瞄准的是中译英(Chinese to English),未来将陆续应用于其他语种的互译。
文刀忍不住要赞美一下谷歌:真是敢为天下先,勇气可嘉!
当然,谷歌并非天真地认为中译英简单,恰恰相反。谷歌项目团队在公告中说,中译英是“出了名的难”(notoriously difficult)。
那么,新版谷歌翻译底气何在?与旧版究竟有何不同?
我们首先看看旧版谷歌翻译的工作原理。旧版谷歌翻译的核心算法是“基于短语的机器翻译”(PBMT-Phrase-Based Machine Translation)。
简单来说,就是先将一个句子分解为更小的单元—-词或短语,然后在数据库(词典)中寻找对应的译法。这种算法的缺陷是,对分解后单元的翻译是独立进行的,无法顾及语篇,也就是我们常说的“没有语篇意识”。
新版谷歌翻译采用的算法是“谷歌神经机器翻译”(GNMT:Google Neural Machine Translation)。
与PBMT不同的是,新算法将句子视为一个整体,经过编码、再解码的过程,完成一个句子的翻译。
首先,将一个句子编码成一个【向量】列表,每个【向量】指向一个字的含义,读取整个句子后,再进行解码。为了确保翻译准确谷歌翻译,解码时会考虑每个编码向量的权重,找到最相关(most relevant)的中文含义,然后确定译法。
比如,这句“知 识 就 是 力 量”
谷歌项目团队介绍,新的算法大大提高了翻译准确度,相比旧版而言,错误率下降55%-85%。
谷歌还举了几个中翻英的例子:
英文从左至右,依次是旧版、新版和人工翻译的结果。
从谷歌给出的例子来看,新版确实比旧版准确多了,稍加修改即可与人工翻译媲美。
文刀君忍不住要亲手试验一下,随手输了一句中文。
可结果差点亮瞎眼睛!
“女子无才便是德” 翻译成“Women without virtue is Germany”。
各位慢慢品吧~~
再来一句有文化的。虽然已经预感到机器翻译不可能把这句词翻译地怎么样,但没想到翻译得这么不知所云。
其实,同样的句子,百度翻译表现更差!
对比一下,真的还不如谷歌翻译。
这两个例子提醒我们三点:
一、中译英真的很难!(notoriously difficult)
二、中文博大精深谷歌翻译,有时候人脑翻译尚须仔细揣摩中文的意思,何况机器?不可夸大机器翻译的作用,有时候它只会添乱。
常常听到这样的感慨,中国的文学经典向外推介,最难的就是翻译!翻译文学经典,需要以大宗匠精神,认真对待每一个词、每一个句子。这必然是一项耗时又耗神的工作。
试想一下,如果把《道德经》直接塞进谷歌翻译,出来的会是什么鬼东西?何况,还有文化上的差异,有些东西如果原汁原味地翻译成英文,爽的只是那些会英文的中国人罢了,外国读者可能根本看不懂。就像金墉的武侠小说,也只有华人世界真的懂、真的喜爱,虽然也有英文版,但由于文化差异太大,影响实在有限。
三、虽然新版谷歌翻译的确取得了可喜的进步,但是千万不能过度依赖机器翻译,否则一不小心就被坑!
其实,谷歌项目团队对新版谷歌翻译的表现也不敢托大,他们在公告中这样说:
机器翻译尚远不如人意。“谷歌神经机器翻译”仍会犯一些人脑翻译不会犯的严重错误,比如漏译、误译,以及不考虑语篇只片面地翻译句子。
我们应该为谷歌改进机器翻译质量的努力点赞,但同时切不可盲目依赖它,尤其那些会一点英文但欠缺翻译经验的人。
微信ID:外宣微记
微眼看世界
限时特惠:本站每日持续更新海量设计资源,一年会员只需29.9元,全站资源免费下载
站长微信:ziyuanshu688