特稿 >

行业洞察 >

前几日刷屏号称强过谷歌翻译的DeepL,经实测的结果是......

前几日刷屏号称强过谷歌翻译的DeepL,经实测的结果是......

Xtecher原创 丨 行业洞察

9511
1376

2017-09-09

           微信图片_20170823095134.jpg

作者 | Yiqin Fu



最近一个德国的 AI 创业公司 DeepL 很火。他们说自己的机器翻译在盲测中秒杀竞品。DeepL 支持“英德法西意荷波”七种语言,汉、日、俄仍在开发中。


我不是深度学习/NLP 专家,只是作为语言和文学爱好者比较好奇现在机器翻译的水平。如果机器翻译能完全替代人类翻译,一定是先从英-法,英-德,英-西这几种组合开始的。所以这里我们测试机器的西班牙语—英语翻译,分别比较西语原文、DeepL、谷歌和专业译者(如果有)。


原材料是我提前选好的。按照我设想的难度从低到高分别是:


  • 阿根廷央行行长讲稿(2017)

  • 西班牙一反对党党首对首相的质询(2016)

  • 智利小说家波拉尼奥的短篇《克拉拉》选段(1997)

  • 哥伦比亚小说家马尔克斯的长篇《百年孤独》选段(1967)

  • 西班牙小说家塞万提斯的长篇《堂吉诃德》选段(1615)


阿根廷央行行长讲稿(2017)


技术官员讲话不省略单词、不开玩笑,主要使用专业名词,因此翻译起来相对容易。


下图中,从左至右依次为原文、DeepL 翻译、谷歌翻译。红色表示翻译内容有误,蓝色表示翻译准确,但英文表达略别扭。


1.2.jpg


可以看出,DeepL 翻译几乎完美。除了第一句读起来有些拗口,其他不仅正确而且流畅。谷歌翻译把一些主语不同的从句拼在了一起(后面会展开讨论),导致有两处的意思都翻译错了。


西班牙反对党 Podemos 党首对首相的质询(2016)


政客讲话情感更激烈、使用的习语更多,不过句式还是简单为主。


下图中,从左至右仍然是原文、DeepL 翻译、谷歌翻译。


1.3.jpg


可以看出,DeepL 无论是正确率还是流畅度都胜过谷歌。DeepL 和谷歌都出错的地方(红色)是把“您...”翻译成了“他...”——这是因为西班牙语里经常会省略做主格的代词(他/她/它/您/他们/您们),所以在只有动词的情况下(“ta 吃了晚饭”),只能通过上下文辨别这个 ta 到底是谁。这篇讲稿是对首相的当面质询,几乎所有的句子主语都是“您”,但是机器无法判别。


总体来看,谷歌出的错更多一些,有一处还把 “A 对 B 做了某事”翻译成了 “B 对 A”。DeepL 的翻译更符合原文,且一个不懂西语的人读两段英文翻译,还是更容易理解 DeepL 的。


智利小说家波拉尼奥的短篇《克拉拉》选段(1997)


文学作品的翻译难度明显提高,因为句子开始变长、变复杂,习语、省略开始增多。我选的这一段是《克拉拉》的开头,虽然是文学作品,但内容也像是生活口语中会说的话。下图从左至右依次为西语原文、DeepL 翻译、谷歌翻译、人工翻译。人工翻译的作者为 Chris Andrews,是第一个把波拉尼奥介绍给英文世界的译者。


1.4.jpg


可以看出,错误和不流畅的地方明显比前两篇增多。主要问题还是主格代词省略的时候,“他”错写成了“它”,“她”错写成了“它”……多数情况下,我们光看机器翻译,其实也能从上下文分析出这个 ta 指的到底是谁。但小说里有一段是天使(“他”)和主人公喜欢的女孩(“她”)同时出现在主人公的梦里,这个时候翻译错“他”和“她”是非常影响理解的。


总体来看,DeepL 遇到主语省略的时候,处理的还是比谷歌好——DeepL 只会弄错 ta 究竟是哪个 ta,而谷歌有时候会莫名其妙地把两个主语不同的从句拼接在一起,改变原意。


比如这个从句(注意加粗的词):


西语原文:después Clara volvió a su ciudad en el sur de España (estaba de vacaciones en Barcelona)

人工英译:then Clara returned to the city where she lived, in the south of Spain (she’d beenon vacation in Barcelona)

人工中译:然后克拉拉回到了她居住的西班牙南部城市(之前在巴塞罗那度假)

DeepL:then Clara returned to her city in the south of Spain (it was on vacation in

Barcelona)

谷歌:then Clara returned to her city in southern Spain was on vacation in

Barcelona)


谷歌不知道“在度假”修饰的是谁,结果就直接翻译成“西班牙在度假”了。


另外,DeepL 把习语和生僻词翻译得更好:


  1. 西语 presentar a un concurso de belleza 意为“参加选美”,谷歌译做 present to a beauty pageant,完全是字面翻译,而 DeepL 知道这是“参加选美”的意思,译做 take part in a beauty pageant

  2. 西语 cursilería,表示“用烂了的、老套的”,谷歌不知道怎么翻译,DeepL 准确翻译成 corny


这一关,DeepL 完胜谷歌。但是让一个不懂西语的人只看 DeepL 翻译,还是会因为“他”“她”弄错的问题而一头雾水。撇开句意,就美感来说,DeepL 已经读不出“机器感”了。谷歌的翻译因为好几处不通,所以明显能看出是机器作品。它们俩比人工翻译还是差了不少。人工翻译朗读出来韵律感更强,从第一句就能感受到。


哥伦比亚小说家马尔克斯的长篇《百年孤独》选段(1967)


我刻意选了小说结尾处对话多的一段,希望更多的省略和口语会提高难度。下图从左至右依次为西语原文、DeepL 翻译、谷歌翻译、人工翻译。人工翻译的作者为 Gregory Rabassa,曾获美国国家图书奖。


1.5.jpg


可以看出,DeepL 还是略胜一筹,但仍和人工译者差距较大。


最多的问题还是出在主语省略时的“他”“她”“它”。另外,间接宾语好像也是翻译难点:


西语原文:la gente tenía la costumbre de ponerles a los hijos los nombres de las calles

人工英译:people had the custom of naming their children after streets

DeepL:people used to name the streets after their children

谷歌:people had the habit of putting their names on the streets


西语的 poner A B 有“根据 B 命名 A” 的意思,谷歌只是字面翻译成了 put A on B(“把 A 放在 B 上面”),而 DeepL 知道这个词组但弄反了 A 和 B 的关系,译做“根据 A 命名 B”。我不太清楚为什么 DeepL 会弄反,因为这个“谓语+宾语+宾语”的格式还是很标准的。


时态上,DeepL 和谷歌都很精准,把所有的虚拟语气都翻译了出来("it would be"),这在技术上实现起来非常简单,因为原文总有唯一的正确翻译。但人工翻译的时候为了让句子更流畅,很多直接译成了一般现在时("it is")。在原文里,虚拟语气和一般现在时在意思上没有区别,而人工翻译选的一般现在时,读起来更顺。


西班牙小说家塞万提斯的长篇《堂吉诃德》选段(1615)


《堂吉诃德》因为写作年代早,所以翻译难度应该很大。任何机器翻译用到的训练数据应该也不包括这个年代的材料。我还特意选了结尾的一首诗,加大难度。翻译结果因为惨不忍睹,所以就没有标注红色蓝色了:(最右一列人工翻译的作者是 John Ormsby)


1.6.jpg


可以看出,DeepL 一开始就弄反了句意。两个机器进入诗歌以后就完全不知道在说什么了。人工译文因为要模仿原文的押韵,所以没有逐字翻译,意思和原文不完全贴合。当然,从英语角度来说,肯定是流畅和美的。


总结


句子没有省略、词汇没有习语的文章(例如政府公文、产品说明书、严肃演讲),机器已经能近乎完美地进行西语-英语翻译了。译文不仅准确且流畅,很多时候你可能都猜不到它出自机器之手。


而对于日常对话、艺术作品,机器在西语-英语翻译的时候还是不知道怎么处理代词省略的情况。我非常好奇技术上应该如何解决主语省略这个问题,因为同样是西语的 “is having dinner"(“está cenando”),有的语境下,正确翻译是“他在吃晚饭”,有的语境下又是“她”、“它”或者“您”。而透露出究竟是哪个 ta 的“上下文”可能和这个句子隔了好几行,且“上下文”里也有男有女有动物。在原文完全一样、而正确翻译不同的情况下,究竟怎么让机器学习“上下文”呢?


中文里也有同样的问题,可能比西语还更严重。比如《围城》开头的这一段:


一天,他到柏林图书馆中国书编目室去看一位德国朋友,瞧见地板上()一大堆民国初年上海出的期刊,《东方杂志》、《小说月报》、《大中华》、《妇女杂志》全有。信手着一张中英文对照的广告,美国纽约什么“克莱登法商专门学校函授班”,将来毕业给予相当于学士、硕士或博士之证书,章程函索,通讯处()纽约第几街几号几之几,方鸿渐心里一运,事隔二十多年,这学校不知是否存在,反正封信问问,不多少钱。那登广告的人,原个骗子,因为中国人不来上当,改行不干了,人也早了。


加粗部分和我添了括号的动词,都“缺”主语。读者很容易判断“将来毕业”的“毕业”讲的是方鸿渐,紧接着的“给予...证书”讲的是克莱登大学。但是应该如何训练机器呢?希望 NLP 专业人士可以写文章讲解一下,满足群众的好奇心哪!网上搜索找到了这方面的文献(https://link.springer.com/article/10.1007/s10590-016-9184-9),但毕竟不是专业人士,还是期待科普文章。


上面这段《围城》,因为 DeepL 不支持中文,所以我们只能看谷歌翻译。如你所见,除了一些固定搭配谷歌不“认识”之外,最大的问题就是主格代词省略了。


One day, he went to the Berlin Library Chinese book catalog room to see a German friend, see a lot of the first year of the Republic of Shanghai out of the journal, "Oriental magazine", "Novel Monthly", "Greater China", "Women Magazine "all have. I would like to write a letter in the future, to give the equivalent of a bachelor, master or doctor of the certificate, the letter of the letter is sent to the letter, the Department of New York, the number of New York, the United States and the United States How many times the school, I do not know whether there is any school, anyway, to ask the letter to ask, how much money. That advertised people, was originally a liar, Because the Chinese people do not come up, diverted to quit, people have died early.


作者:Yiqin Fu

原文标题:测试一个号称强过谷歌翻译的创业公司产品 DeepL

地址:https://zhuanlan.zhihu.com/p/28995486



打开微信“扫一扫”,打开网页后点击屏幕右上角分享按钮

账号登录

重置密码

还没有账号?立即注册>

账号注册

已有账号?立即登录>注册企业会员

重置密码

返回

绑定手机