往返翻译|「谷歌翻译20个微笑的肚子」
相信一定有老师或学习博主这样建议过你——「学过的东西,要用自己的话归纳一遍」。通过总结和表述,在很大程度上可以考察对新知的理解程度。
那么,如果用同样的方法来考验机翻呢?翻译软件可能会给你千奇百怪的结果,一些耳熟能详的机翻笑话就由此而生,比如全网破圈的「谷歌翻译20次」。
本文令人迷惑的标题正是用此法炮制的产物
。将「为什么机翻20次会有这么多梗?」输入到谷歌翻译译成英文,再把得到的结果译回中文,如此循环往复,会得到「为什么谷歌翻译20次会这么好笑呢?」——可以说机翻「理解归纳」得还不错。
但一旦输入「谷歌翻译20次会笑破小光的肚皮」,机翻数次后的结果,便变成了「谷歌翻译20个微笑的肚子」,这种难以理解又让人迷惑的结果。
对于这种「怪」现象,评论区网友们的反应除了「哈哈哈哈哈哈哈」,还有对机翻吐槽的声音。有人会挑战机器翻译的准确度,还有人会质疑翻译的真实性,纳闷为什么会和原文相差甚远。
那么,机翻究竟如何理解人类的语言?机翻输出的结果又历经了怎样的过程?机翻在处理信息中到底够不够「努力」呢?
随着现代科技愈加发达,机器翻译更为频密地参与进生活之中,由于翻译而引起的笑话变得愈发司空见惯。想要理解多次回环翻译为何会如何好笑,就要从了解「单次翻译」
开始。
无论是单纯的机器,或是人借助机器进行翻译,面对具有文化背景的俗语和典故,或是语法成分复杂、高度依赖语境的语言表达,为异国语言匹配合适的表达都十分具有挑战性。
究其根本,语言之间的差距可谓天差地别。不同语言的构词造句方法不同,繁复冗长的从句,S-V-O系统的多种排列更平添了翻译所用的反应时间;另外,每种语言的词义各不相同,一词多义、一义多词让恰当精准的表意已经足够困难,更遑论翻译要扣钱的谐音梗们了。
越是原本属于各种语言的「个性」,到了翻译的时候越是难以处理,像是属于这门语言桀骜难驯的「脾气」。类似于「一把把把把把住了」这种「故意」为了刁难外语学习者而生的语句,就需要凭借丰富的文化功底和创意思路来解决,许多真人翻译看了都要挠挠头,对于机器翻译就更是难上加难。
凡是翻译,皆离不开「信、达、雅」三条准则。仅仅是最基本的「信」,就会因为上文中原因而产生种种错漏,而在此之上的「达」和「雅」,对翻译者的修炼内功则提出了更高的要求。
归根结底,翻译是一种「二次创作」,翻译侧重点的些许不同,会导致翻译结果出现或大或小的偏差。
就如下图中日译中的矩阵,不同译法或多或少地强化了原文中的某些含义,与此同时,淡化了或者直接忽略了另外一些含义。译者在翻译时往往会结合语境添加不同的倾向与考量,从而得到彼此之间大相径庭的翻译结果。
大概正是因为以上因素的存在,所以即便机翻越来越强大,运用越来越普遍,但一旦原文结构变得复杂,或是添加了一部分「弦外之音」,机翻就会输出「不像人话」的结果。
而以这样的译文基础,回环译回原文本的语言,就是一个「叠buff」的过程。每一次翻译,都经历了原文中部分信息脱落,翻译中创作出新信息的过程,次数越来越多,结果就越来越偏离最初的语义。
正所谓,失之毫厘,差之千里,关关迷惑关关难过。如「传声筒游戏」一般,每一次语言间互译(解读)和原意的失之毫厘,最后就会导致和原文本意思的差之千里。
数学考试中,我们经常通过逆运算来进行验算,同理,把文本译到另一种语言中,再逆向翻译回来有时也用来检验翻译的精确度。
这种操作也被叫做back translation,即「反向翻译」,或reverse translation,即「逆向翻译」或「回译」。
一般来讲,对于关键的、高风险的内容,人们会倾向用「回译」进行验证,用来避免因翻译的错误而导致的重大损失。
「回译」最经常出现的情景是在医学领域,例如试验前的知情同意表,伦理委员会往往就会要求做一个「回译」来规避理解偏差造成的风险。除此之外,食品科学、出口产品、金融报告、科学材料等,也常常用「回译」给翻译上好第二重「保险」。
在文学中,「回译」还有想不到的趣事妙用。桂冠诗人约翰·德莱顿(John Dryden)是17世纪文学巨擘之一,为了让自己的写作足够简洁优美,他会将自己的写作译至拉丁语,再严格地对照拉丁语译回英语。
村上春树《且听风吟》的第一稿是用日语写成的,自觉不够满意便全部推翻,改用英文写作,再回译为日语,其中有些词无法准确表达,他就用自己更为简明可驾驭的词来表述,他也因此逐渐形成了属于自己的语言风格。
只不过,相比于数学中可以为结果的正误一锤定音的逆运算,「回译」仅仅可以用做大致的检查,存在着相当大的误差空间。
「回译」并不能检验表达的质量,对于语言流畅度、辞藻的美感等都无能为力;相比于单次翻译,耗时整整翻倍的「回译」可能还会更贵和更慢,成本陡增让人望而却步。
另外,它通常也无法体现翻译中的「弦外之音」,有时虽然翻译出了文本的字面意思,但是内涵的偏差,会导致翻译结果更迷惑人,以至于被读者所误解,比如——
无论如何,通过「回译」给出反向翻译,可以帮助不懂原语言的读者多了一分对结果的掌控,以降低离谱翻译带来的风险。在翻译的无数种未知结果中,向原文的含义尽可能靠近。
但在某些特殊情况中,「回译」也会成为翻译的唯一解——即对于那些原文消失、而译文传世的文本。这种将译本翻译回原语言勉力再现原文的现象在人类文化史上屡见不鲜。
阿巴斯王朝时,阿拉伯人展开了轰轰烈烈的翻译运动,将古希腊、波斯、印度等汗牛充栋的典籍译为阿拉伯语,并在公元830年建立了全国最高学术机构「智慧宫」。彼时,欧洲陷于中世纪的黑暗时代,文化科学等经典被天主教会列为禁书,许多珍贵书稿在浩劫中离散。
到了公元十五世纪,欧洲人收复了阿拉伯在欧洲的版图,兼而发现了阿拉伯语书书写的经典,就将这些书「回译」为拉丁语,其中不乏哲学、科学著作,后来成为了文艺复兴运动的思想滥觞之一。
再如,扬·波托茨基匿名写就的《萨拉戈萨手稿》,在成书过程中散失了一部分原稿,幸而,这部分缺失在波兰语译本被发现。于是,这块缺失的拼图从波兰语再次译回了法语,整本书才得以以这种方式「补齐」。
在原文经历危难时,译文挺身而出,虽不能百分之百复刻原文的精髓,却始终是及时雨与安全线一样的存在。
介绍了「回译」,那让我们再次回到文章开头的例子当中,这种在机翻中多次回译的操作,也被称为「round-trip translation」(「往返翻译」或「往复翻译」,目前未见权威译法,为笔者翻译),差不多也就是「反复横跳着翻译」的意思。
这种往返翻译在娱乐场景中颇为常见,无论古今中外都喜欢这种超越国界的语言游戏。
美国科幻作家菲利普·K·迪克在1969年发表的小说《Galactic Pot-Healer》(“星际瓢盆治愈者”,未见权威翻译)中,故事的主人公就喜欢这种游戏——给出机翻多遍的结果,让其他人来猜原文。
到了现在,信息技术的发展让往返机翻变得更加容易,有热心网友专门搭建起了专门的网站,用来直接输出往返翻译的结果,而免去了复制粘贴之扰。
在社交媒体上,往返翻译则变成了一种颇受欢迎的花活儿。以「20次谷歌翻译」为题的视频在小破站中逐渐衍生出了一个稳定的创作者圈子。
在国外亦然,油管频道Twisted Translations在八年前发布第一首通过机翻而来的翻唱《Let it Go》——在机器往返翻译后成为了《Give up》。频道博主用声音、手势、表情等的演绎,加之精准恰当的配图,生动且严谨地表演出了机翻带出的所有笑点,成为了一时爆款,同一系列视频的浏览量也经常在一百万左右。
但是,往返翻译也有更严肃的用途。与回译的用途类似,往返翻译被一些人用来检验机翻结果的质量,即往复翻译的结果越像原文,机器翻译的质量和准确度就越高,其质量就越好。
然而,有相关研究人员表示,使用BLEU90(Bilingual Evaluation Understudy,机器翻译译文的自动评估指标)和F-Score等自动评估方法并没有发现往返翻译的结果与翻译的精确度有任何必然联系。
放下争论,还有人试图给这个方法找到其他严肃的归宿——不用它检验机翻软件了,而是用来评估一段文本在多大程度上适合机翻。一段文本在机器往复翻译后越能保持原样,它就越适合机翻,研究人员则通过不断调试原文本提炼出机翻擅长处理的文本特征。
这种检测的意义则在于,我们可以预测原文本在机器翻译后的准确度,从而在机翻前对原文本进行简化处理,帮助机器翻译得更好,最大程度上节约人力成本,提高机翻的利用效率。
在往返翻译的过程中,似乎看到了人和机器在翻译这件事上的某种统一——机翻不仅为我们带来快乐,与此同时,在人类语言始终保持多样与丰富的基础上,我们也在让机器更多理解人类的语言,让巴别塔下的分歧减少,让你我之间沟通更畅。
所以,在你再次看到「谷歌翻译20遍」的时候,除了一如既往的折服于up主的整活儿功力,会不会产生更多的新想法呢?
本文 zblog模板 原创,转载保留链接!网址:http://fsxxzx.com/post/2359.html
1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。