徐 行
(南京郵電大學(xué),江蘇南京 210023)
機器翻譯就是利用計算機把一種語言(源語言,source language)翻譯成另外一種語言 (目標語言,target language),實現(xiàn)各種自然語言之間的自動轉(zhuǎn)換,是人工智能和自然語言處理領(lǐng)域的重要研究方向之一。雖然機器翻譯已經(jīng)發(fā)展多年,但現(xiàn)實中仍存在許多問題。我國學(xué)者馮志偉先生提出:“從已經(jīng)推出的實用化MT系統(tǒng)的譯文質(zhì)量來看,還不十分令人滿意,對于一些稍長的句子,或結(jié)構(gòu)稍復(fù)雜的句子,譯文質(zhì)量就不能令人滿意,有時簡直不可卒讀?!倍?,“計算機翻譯不適用于文學(xué)性很強或文化味很濃的文本,而適用于科普文獻,金融商業(yè)交易,行政管理備忘錄,法律文件,說明書,農(nóng)業(yè)及醫(yī)學(xué)材料,工業(yè)專利,宣傳冊,報紙報道等[1]?!?/p>
因此,本文以谷歌與有道翻譯關(guān)于Gone with the wind的譯文為例,分析MT的錯譯類型,并進行兩種翻譯引擎之間的對比。
本次研究中使用的語料為Gone with the wind第一章的部分節(jié)選以及谷歌翻譯和有道翻譯對應(yīng)的中文譯文,對比的人工譯文為上海文藝出版社的陳良廷譯本——《亂世佳人》。在對機器譯文和人工譯文展開全面的平行對比中,對機器譯文出現(xiàn)的各種錯誤根據(jù)前人總結(jié)的機器譯文錯誤類型(表1)加以標注,并對錯誤的發(fā)生頻率進行統(tǒng)計,得到圖1所示的谷歌與有道譯文錯誤率和圖2所示的谷歌與有道譯文三大類型錯誤率。其中錯誤譯文指機器譯文中至少包含表1所列錯誤類型中的一種錯誤,錯誤率為出現(xiàn)錯誤的機器譯文總句數(shù)/機器譯文總句數(shù)*100%。對同一句子中多次出現(xiàn)的同一類型機器譯文錯誤(如詞匯詞性錯誤),只進行一次標注和統(tǒng)計。下文將對譯文對比中觀察到的部分機器譯文錯誤現(xiàn)象加以對比描述。
表1
圖1
圖2
詞匯是組成句子的最基本要素,所以也是衡量機器翻譯質(zhì)量的關(guān)鍵。由圖2可以看出,谷歌與有道翻譯在詞匯錯譯所占比例較大,且谷歌遠遠高于有道翻譯。在對譯文進行對比分析的過程中,發(fā)現(xiàn)在二級錯誤中,詞匯詞性錯譯、詞匯漏譯和詞匯形容詞錯譯所占比重較大。下面將進行舉例說明。
(1)But it was an arresting face, pointed of chin, square of jaw.
有道:但這是一張引人注目的臉,尖下巴,方下巴。
谷歌: 但這是一張令人震驚的臉,指向下巴,下巴直角。
人工:不過這張臉還是挺引人注目,尖尖的下巴頦兒,方方的牙床骨兒。
首先,關(guān)于“arresting”,牛津詞典的解釋是“very attractive”,而谷歌卻翻譯成“令人震驚的”,不禁讓讀者對女主人公的外貌產(chǎn)生極大的誤解。而“pointed”和“square”在原文中是作為形容詞來修飾后面的名詞的,谷歌卻分別作為動詞和名詞來翻譯。關(guān)于“chin”和“jaw”的區(qū)別,“chin”的柯林斯詞典中的解釋為“the part of your face that is below your mouth and above your neck”,而對“jaw”的一種解釋為“A person’s or animal’s jaws are the two bones in their head which their teeth are attached to”。 但是兩種翻譯引擎都簡單地翻譯成了“下巴”。
(2)...their bodies clothed in identical blue coats and mustard-colored breeches, they were as much alike as two bolls of cotton.
有道:身上穿著一模一樣的藍色外套和墨綠色的馬褲,像兩團棉花。
谷歌:他們的身體穿著相同的藍色外套和芥末色的馬褲,十分相似作為兩個棉鈴。
人工:身穿一模一樣的藍上衣,一模一樣的芥末色馬褲,哥兒倆活像兩個一模一樣的棉桃。
這里原文之所以將兩個人比作棉桃,是為了強調(diào)他們作為穿著一樣的衣服的孿生兄弟是多么的相似,而有道的譯文只翻譯出了棉花,卻漏譯了他們的相似,谷歌就直接字字對應(yīng)地翻譯,將應(yīng)理解成“像”、“如同”的“as”,翻譯成了“作為”,產(chǎn)生了歧義。另外,谷歌將“bodies”直接譯成“身體”,讀來十分生硬。
(3)The boys looked uncomfortable,recalling their mother's conduct three months ago when they had come home, by request, from the University of Virginia.
有道:兩個孩子看上去很不自在,回想起三個月前他們應(yīng)弗吉尼亞大學(xué)的要求回家時母親的舉動。
谷歌:這些男孩看上去不舒服,回想起三個月前他們應(yīng)弗吉尼亞大學(xué)的要求回家時母親的行為。
人工:哥兒倆想起三個月前他們從弗吉尼亞大學(xué)被請回家時他們母親的管教方式,臉色頓時不大自在。
這里的“uncomfortable”應(yīng)該理解為“anxious,embarrassed or afraid and unable to relax”,有道翻譯比較符合,而谷歌卻按“not feeling physically relaxed”理解,翻譯成了“不舒服”,與原文不符。而且谷歌對“the boys”的處理也沒有聯(lián)系上文的語境,有道處理地較為恰當(dāng)。
另外,關(guān)于對人名、地名等專有名詞的處理,有道大多數(shù)翻譯恰當(dāng),而谷歌常常不譯或者錯譯。對一些指代詞的處理,谷歌往往無法結(jié)合語境,例如“poor Cracker neighbors”中的“Cracker”應(yīng)理解為“an offensive word for a poor white person with little education from the southern US”,有道翻譯成“窮鄰居”較為符合,而谷歌翻譯成“貧窮的餅干小鄰居”,令人啼笑皆非。
英語具有“形合”的特征,句法是其“形合”實現(xiàn)的重要方式,是組織零散詞匯構(gòu)成句子的手段,嚴重的句法錯誤可能使整個句子變得凌亂不堪,不知所云。由圖2可以看出,無論是谷歌還是有道翻譯,在句法錯譯都占了較大的比例[4]。在分析對比的過程中,發(fā)現(xiàn)二級錯誤中的句法動詞短語和介詞短語錯譯出現(xiàn)較為頻繁,下面將舉例分析。
(4)He'll never get finished at this rate.
有道:照這樣下去,他永遠也完不成。
谷歌:他永遠不會以這樣的速度完成任務(wù)。
人工:這樣的話他可休想畢業(yè)了。
這句話在原文中是說因為兩兄弟總是被學(xué)校開除,連累他們的哥哥也不能呆在學(xué)校,因此完不成學(xué)業(yè)。介詞短語“at this rate”是“照此情形”、“如此下去”的意思,谷歌卻將“rate”直接翻譯成了“速度”。有道翻譯雖然較為符合,但“完不成”后面的賓語卻沒有表達完整。
(5)“Not going to be any war! ” cried the twins indignantly, as though they had been defrauded.
有道:“不會有戰(zhàn)爭!”孿生兄弟憤怒地喊道,仿佛他們被騙了似的。
谷歌:“不會發(fā)生任何戰(zhàn)爭!”這對雙胞胎怒不可遏地哭了起來,好像他們已經(jīng)被騙了一樣。
人工:“什么仗也不會打!”哥兒倆憤憤地喊道,仿佛他們上了當(dāng)似的。
在原文中只是三個朋友因為對戰(zhàn)爭的看法不同發(fā)生了一點爭吵,沒有到“憤怒”或“怒不可遏”的程度,用“憤憤地”更能表達出兩兄弟雖然不滿但是為了不讓女主人公生氣只得停止討論戰(zhàn)爭的心情?!癱ry”在這里是“to shout loudly”,谷歌譯成“哭”,脫離了原文的意思。
(6)She was hot-tempered and easily plagued by the frequent scrapes of her four sons, and while no one was permitted to whip a horse or a slave, she felt that a lick now and then didn't do the boys any harm.
有道:她脾氣暴躁,四個兒子經(jīng)常用鞭子抽打她,這使她很難受。雖然家里不許任何人抽打馬或奴隸,但她覺得偶爾打一下對孩子們并沒有什么害處。
谷歌:她脾氣暴躁,容易被四個兒子的經(jīng)常擦傷所困擾,雖然沒有人被允許鞭打馬匹或奴隸,但她感到時不時舔舔?qū)δ泻]有任何傷害。
人工:她是個火爆性子,動不動就給這四個經(jīng)常惹是生非的兒子煩死,盡管她不準誰鞭打奴隸和馬,可她覺得時常抽孩子幾下對他們倒沒害處。
“scrape”在這里是名詞,表示“(old-fashioned)a difficult situation that you have caused yourself”,同義詞有“predicament”,“trouble”,“difficulty”等,而兩種翻譯引擎分別理解成了“用鞭子抽打”和“擦傷”,嚴重曲解了原意。而“l(fā)ick”一詞除了“舔”的意思之外,在柯林斯詞典中還解釋為“If you lick someone or something, you easily defeat them in a fight or competition.” 同義詞有“beat”,“defeat”,“overcome”等,而谷歌的翻譯與原文的語境嚴重不符。
本次語料庫數(shù)據(jù)統(tǒng)計得出的圖1顯示,與谷歌翻譯相比,有道翻譯的準確譯文比例較高,錯誤譯文比例較低;圖2顯示,在詞匯錯譯、句法錯譯和其他類型中,谷歌錯誤率高于有道翻譯[5]。另外,在對譯文二級錯誤進行對比分析時,發(fā)現(xiàn)有道翻譯整體譯文質(zhì)量高于谷歌翻譯。谷歌偏向于字對字的直譯,而有道翻譯有時可以轉(zhuǎn)換句式,不囿于原有的英文句式。并且對于人名、地名等專有名詞的翻譯,有道翻譯更加靈活準確,而谷歌翻譯對一些習(xí)語的處理也比較生硬,建議谷歌翻譯借助自身的搜索引擎在互聯(lián)網(wǎng)中搜索相關(guān)的信息作為翻譯的參考。當(dāng)然,有道翻譯也存在著許多的問題,在結(jié)合語境、加大自身語料庫建設(shè)方面還有進一步完善的空間。針對谷歌和有道翻譯存在的問題,筆者認為可以從以下方面改進翻譯引擎質(zhì)量:進一步加大自身語料庫建設(shè),可以通過開放性輸入平臺的方式最大程度收集雙語固定表達形式及對應(yīng)意思,以盡可能多的識別習(xí)語、慣用語等;借助互聯(lián)網(wǎng)對需要進行翻譯的語句進行模糊匹配搜索,找出其他網(wǎng)頁或者數(shù)據(jù)庫中的關(guān)聯(lián)信息,作為翻譯的參考;通過海量分析識別具有類型化和高重復(fù)性特征的錯誤,在下一次錯誤觸發(fā)時進行準確糾錯[6]。
最后,作為語言學(xué)習(xí)者,我們不能過度依賴翻譯工具,而應(yīng)將自己扎實的語言能力作為基礎(chǔ),正確使用翻譯軟件,找準翻譯技巧,提高翻譯效率,讓工具真正為我們的語言學(xué)習(xí)服務(wù)。