白一博
(北京外國語大學 英語學院,北京 100089)
在人類發(fā)展史中,科學技術(shù)的作用是無與倫比的。馬克思主義生產(chǎn)力學說明確指出,科學技術(shù)是第一生產(chǎn)力[1]。在當前的翻譯行業(yè)中,機器翻譯的蓬勃發(fā)展深刻改變了我們目前的翻譯方式。作為人工翻譯的替代品,機器翻譯軟件在許多翻譯實踐中都發(fā)揮著重要作用,大大提升了翻譯工作的效率。
機器翻譯,又稱計算機翻譯,是指利用計算機將一種語言符號轉(zhuǎn)換成另一種語言符號。機器翻譯這一概念起源于20世紀30年代,在近一個世紀的發(fā)展過程中主要經(jīng)歷了四個發(fā)展階段:基于規(guī)則的機器翻譯、基于統(tǒng)計的機器翻譯、基于實例的機器翻譯和基于不同方法應用的機器翻譯[2]。而在目前的基于不同方法應用的機器翻譯階段,機器翻譯軟件和工具可以分析前三種翻譯方式的優(yōu)缺點,之后綜合運用多種方式對文本進行翻譯。
機器翻譯領(lǐng)域的一大特征是與新興科技的緊密結(jié)合。例如,許多機器翻譯軟件可以利用互聯(lián)網(wǎng),獲取相關(guān)的語言資源實現(xiàn)在線同步翻譯[3];云計算、機器學習、大數(shù)據(jù)等技術(shù)在提升機器翻譯質(zhì)量的同時,也整合了翻譯市場、人才、數(shù)據(jù)等資源,逐漸實現(xiàn)了“語言服務的規(guī)?;腿蚧盵3]。
為了探討機器翻譯與人工翻譯的優(yōu)劣,本人作了以下語料的對比研究。
選用作者于2019年翻譯的文章《When the American “Bull” Breaks into the china shop of “16+1 Cooperation”》(1)https://china-cee.eu/wp-content/uploads/2019/04/Working_paper-201902-Feng-Zhongping-Chen-Xin-Xu-Gang.pdf.作為例文(當時作者為北外英語學院翻譯系大四學生)。選用這篇文章的原因有三點:第一,本文原文《當美國“大象”闖入“16+1合作”的“瓷器店”》刊載于2019年第六期的《世界知識》中,因此原文質(zhì)量是有保證的。第二,這篇譯文發(fā)表于中國-中東歐研究院官網(wǎng),因此譯文質(zhì)量也是有保證的。第三,作者在翻譯原文時在讀大四,北京外國語大學(北外)是教育部直屬、首批“211工程”高校、“985”優(yōu)勢學科創(chuàng)新平臺高校、首批“雙一流”建設(shè)高校(2)https://www.bfsu.edu.cn/overview.。自20世紀50年代開始就開始開設(shè)翻譯課程,并分別于1993年和2001年開始設(shè)置本科階段的筆譯和口譯方向。2007年在英語學院下設(shè)翻譯系,開始在全國范圍內(nèi)招收翻譯專業(yè)本科生[4]。英語學院翻譯系的課程設(shè)置包括四個方面,即“外語技能、母語修養(yǎng)、翻譯實踐和學科素養(yǎng)”[4]。翻譯專業(yè)課程基本都設(shè)置在本科前三年,因此,這段時間的譯文較能體現(xiàn)翻譯系本科學生的翻譯水平。
百度翻譯是百度公司于2011年6月推出的基于互聯(lián)網(wǎng)大數(shù)據(jù)的機器翻譯系統(tǒng)。它支持包括漢語、英語、日語、德語等200多個語言互譯,是國內(nèi)市場份額第一的翻譯類產(chǎn)品。除了使用量最大的百度翻譯網(wǎng)頁版,它還擁有APP,小程序等多種產(chǎn)品形態(tài),可以為用戶提供文檔、網(wǎng)頁、圖片、拍照、語音等多模態(tài)的翻譯功能。除了機器翻譯功能,百度翻譯還可以提供離線的牛津和科林斯詞典,方便客戶查閱單詞(3)https://baike.baidu.com/item/%E7%99%BE%E5%BA%A6%E7%BF%BB%E8%AF%91.。
百度翻譯屬于人工神經(jīng)網(wǎng)絡系統(tǒng),通過擁有海量結(jié)點的深度神經(jīng)網(wǎng)絡,使計算機先自動學習語料庫中的翻譯知識,再自動理解語言和生成譯文[3]。
本文選擇網(wǎng)頁版的百度翻譯來測評機器翻譯軟件的漢譯英譯文質(zhì)量。原因有三點:第一,百度翻譯在國內(nèi)所占的市場份額最大,擁有較大的客戶群體,說明其經(jīng)過了多次實踐檢驗。第二,網(wǎng)頁版無需下載,且翻譯文本的功能和其他版本相同,使用較為便捷。第三,作者在翻譯實踐中曾使用過不同的機器翻譯軟件,百度翻譯給作者的體驗最好。
從上文的選擇材料理由可知,本文的人工翻譯譯文質(zhì)量是具有一定保證的,因此,在此次對比分析中,筆者以人工翻譯譯文為基準,從內(nèi)容是否完整正確、邏輯是否流暢和語言是否規(guī)范三個角度來進行質(zhì)量對比。
此部分的ST為原文,TT為人工翻譯譯文,MTTT為百度翻譯譯文。
【ST1】當美國“大象”闖入“16+1合作”的“瓷器店”
【TT1】When the American “Bull” Breaks into the china shop of “16+1 Cooperation”
【MTTT1】When American “elephant” breaks into “16 + 1 cooperation” porcelain shop
我們可以看出,百度翻譯對原文的處理過于直譯,而且沒有識別出“大象闖入瓷器店”這里的文化內(nèi)涵。這一短語起源是1816年阿美士德(Amherst)奉命出使中國,代表英國政府與清政府進行貿(mào)易洽談,但最終因叩頭行禮問題未能達成貿(mào)易約定。英國媒體于是創(chuàng)作了一篇名為A Bull in a China Shop的漫畫,諷刺阿美士德把出訪搞得一團糟。此處的“Bull”既指粗魯?shù)墓#种赣?約翰牛是英國的形象化、人格化代表),而“China”既指易碎的瓷器,又指中國。后來,這句短語被用來形容舉止粗魯,搞砸一切的人。
顯然,百度翻譯在此處未能識別原文的文化意向,譯文出現(xiàn)了偏差。其原因是,人工神經(jīng)網(wǎng)絡并未能識別出此處“大象”與英文“bull”意象的對等關(guān)系。在人工神經(jīng)網(wǎng)絡在語料庫學習過程中,也鮮見“美國‘大象’”或“American bull”的搭配,因為正如上文所言,俚語“bull”所指的是英國。可見,人工神經(jīng)網(wǎng)絡在此處的學習和處理存在不足。
【ST2】我刊邀請了三位專家就此進行了交流與討論。(4)這一句在《世界知識》上刊載的原文是沒有的,但客戶給譯者的原文中確實包含這一句。
【TT2】We invited three experts to discuss and exchange ideas on this issue.
【MTTT2】We invited three experts to exchange views on this issue.
原文中的“交流與討論”其實是中文中的習慣搭配,表達的意思就是交換意見。我們可以看到此處人工翻譯和百度翻譯都把握了原句含義,但不同的是,百度翻譯更加簡潔,因為“exchange views”就包含了”discuss”的過程,所以此處筆者認為百度翻譯更勝一籌。筆者猜測,百度翻譯在這一部分更加出色的原因是:這句話在很多采訪或新聞稿中頻繁出現(xiàn),因此具有大量的雙語語料對照,而百度翻譯的產(chǎn)品介紹也指出,軟件會先學習語料庫,之后再匹配對照給出譯文。而人工翻譯查閱對照語料庫的能力則是相對較弱的。
【ST3】從蓬佩奧的行程安排和種種表態(tài)來看,美國“重返”中東歐的意圖是很明顯的
【TT3】We could tell from Pompeo’s visiting schedule and opinions that the US has an obvious
intention to“back” to Central and Eastern Europe
【MTTT3】 Judging from pompeo’s itinerary and various statements,the intention of the United States to “return” to central and Eastern Europe is obvious
通過語法分析我們可以看到,百度翻譯的譯文出現(xiàn)了主語和伴隨狀語主語不一致的情況,“the intention”并不是“judging from”的主語,因此在語言和邏輯方面是較為混亂的,但意思的傳達方面整體還是清楚的。作者推測,百度翻譯在這一例中出現(xiàn)語法錯誤的原因和上一例中翻譯出色的原因其實是一致的,都是基于對語料庫的分析給出的譯文,但這一句的問題就出在了關(guān)系從句和主句之間的逗號上。筆者認為,百度翻譯的句段劃分是以標點符號為界,逗號分隔開的兩個小句也會被處理成兩個句段,之后分別在語料庫中進行分析處理,這就引發(fā)了語法錯誤。為了驗證這一猜想,譯者將原文逗號刪去,重新使用百度翻譯,此次的結(jié)果為“Judging from pompeo's itinerary and various statements,it is obvious that the United States intends to ‘return’ to central and Eastern Europe”。雖然這一結(jié)果的邏輯主語仍是錯誤的,但我們可以看到后半句采用了形式主語,這和保留逗號時給出的譯文結(jié)構(gòu)是有明顯差異的,所以作者認為上文的猜想是部分正確的。現(xiàn)在幾乎可以確定百度翻譯以逗號為句段的最小拆分符號,但此句機器翻譯錯誤的根本原因還是在于不能像人工一樣確定“judging from”的主語,因為原文中這個邏輯主語是省略掉的。
【ST4】2月17日為科索沃單方面宣布獨立紀念日
【TT4】Kosovo unilaterally announced February 17th as its Independence Day
【MTTT4】February 17 is the anniversary of Kosovo’s unilateral declaration of independence
這一句話的人工翻譯和百度翻譯譯文在邏輯和表達方面都是通順的,唯一的區(qū)別為傳遞的內(nèi)容有細微的差別。作者初譯這段文章時,給出的譯文和百度翻譯譯文是幾乎一致的,但后來經(jīng)過查證相關(guān)資料和獨立思考后將譯文改成了TT4的形式。改動的原因是,作者敏銳地意識到科索沃是一個主權(quán)存在爭議的地區(qū)。塞爾維亞認為科索沃是其境內(nèi)一個高度自治的自治區(qū),但科索沃卻宣稱自己是一個獨立的國家。兩方在國際上都有許多的支持者,而中國政府的立場是支持塞爾維亞對科索沃地區(qū)享有主權(quán),因此在翻譯這句的時候需要格外注意政治立場的問題。雖然原文提到了“單方面宣布”,但百度翻譯譯文中的“unilateral declaration of independence”會給讀者帶來一種既成事實的感覺,這其實是不符合中方立場的。因此,作者經(jīng)過分析資料以及詢問相關(guān)領(lǐng)域研究人員后,決定將譯文改成TT4的形式,只表明2月17日是其所謂的“Independence Day”,但絲毫不涉及科索沃是否是獨立的國家。綜上,百度翻譯此處對原文的把握是沒有問題的,但是卻反應了機器翻譯無法考慮政治立場、意識形態(tài)對語言表達的影響,在這一點上人工翻譯是要遠遠優(yōu)于機器翻譯的。
【ST5】美國承諾,若馬其頓方面做出讓步,將盡快幫助其實現(xiàn)入約
【TT5】 The US promised to help Macedonia join the NATO as soon as possible if it made concessions
【MTTT5】The United States promised that if the Macedonian side made concessions,it would help it implement the treaty as soon as possible
這一句話里存在著一個縮寫,“入約”是加入北約的簡稱。因此,在翻譯這段話的時候,只有意識到這個問題才能做到準確地傳達內(nèi)容。從兩篇譯文中我們可以看到,人工翻譯可以聯(lián)系上下文從而判斷出這里“入約”的真實含義,并闡明“join the NATO”的實際內(nèi)容。而機器翻譯也準確把握了“入約”中暗含的條約信息,并準確表達出了這一點,從這個角度來看,機器翻譯是比較成功的。但可惜的是,機器翻譯未能進一步聯(lián)系上下文分析出這里的條約指的就是北約。結(jié)合MTTT2來看,機器翻譯在將譯文聯(lián)系語料庫方面是非常出色的,但機器翻譯卻不能很好地聯(lián)系上下文,作者認為,這是機器翻譯缺乏邏輯分析能力的體現(xiàn)。
【ST6】我們知道,冷戰(zhàn)時期歐洲分為西歐和東歐,這些概念有很強的政治色彩。
【TT6】It is widely acknowledged that,the division of Europe into Eastern and Western Europe in the Cold War was very political.
【MTTT6】We know that during the cold war,Europe was divided into Western Europe and Eastern Europe,and these concepts had a strong political color.
作者認為,這句話暴露了機器翻譯的兩個不足之處。首先,百度翻譯給出的譯文過于直譯,“政治色彩”其實是在突出上文“西歐”和“東歐”并非是按照地理因素來劃分的,而是純粹出于政治考慮,基于不同的意識形態(tài)做出的劃分,因此,“色彩”這一詞語其實是沒有實際意義的,翻譯出來“political”即可。第二,這一段翻譯還暴露出了機器翻譯在句段整合方面還有待提高。原文中的“這些概念”實際就是指代的上文中“西歐”和“東歐”,因此完全可以處理成先行詞的形式,將兩句話合并為一個主句加從句的英文表達形式。
縱觀百度翻譯的譯文可以發(fā)現(xiàn),機器翻譯給出的定語從句是較少的,而且在表達方面也并不理想。但其他從句的效果,比如條件狀語從句,還是可圈可點的。單從邏輯上來看,MTTT5對狀語從句的把握是非常成功的。我們不禁會問,為什么機器翻譯處理不同從句的效果差別如此顯著呢?作者猜測,這與英漢表達習慣有關(guān)。前文提到了機器翻譯會根據(jù)標點符號來劃分句段,這其實就會打亂各個小句之間的邏輯聯(lián)系。而中文的條件狀語從句是有邏輯結(jié)構(gòu)連接的,比如ST5中的“若……將……”結(jié)構(gòu),機器翻譯在識別到這個信息后,就會自然采用從句形式;但中文中缺乏定語從句,盡管某些短句可以發(fā)揮定語從句的作用,但沒有明確的先行詞和關(guān)系代詞,所以,機器翻譯系統(tǒng)無法意識到某處可以使用定語從句來連接兩個短句。
【ST7】由于地理上不接壤,也不存在歷史遺留問題,且與中國有著傳統(tǒng)交往和友誼,中東歐國家總體對華友好,積極參與“16+1合作”和“一帶一路”建設(shè)。
【TT7】Central and Eastern European countries are generally friendly to China and actively participate in the "16+1 Cooperation " and "the Belt and Road Initiative ",for we are geographically far and have no problems left by history and they have traditional friendship with China.
【MTTT7】China is one belt,one road and the other is the “16+1 cooperation” and “one belt and one road” construction.
我們可以看到,MTTT7在內(nèi)容,邏輯和表達方面都與原文大相徑庭,錯得十分離譜。但仔細閱讀ST7就會發(fā)現(xiàn),這句話其實包含了前文提到過的許多翻譯難點(針對機器翻譯而言):逗號將句子拆分為許多句段、主語缺失、雖然有邏輯結(jié)構(gòu),但較為松散……作者認為,百度翻譯對這句話的翻譯情況一定程度上印證了上文作者詳述的猜想。
內(nèi)容方面,除了個別極端情況,百度翻譯譯文可以和北外翻譯系大四學生一樣,完整傳達原文內(nèi)容,不會漏掉重要信息,但不能分析出原文所蘊含的文化和意識形態(tài)色彩,不能體現(xiàn)翻譯客戶想要凸顯的特定立場。邏輯方面,百度翻譯可以較為準確地翻譯出有明顯邏輯結(jié)構(gòu)的句子,但如果句子之間邏輯關(guān)系是隱藏的或邏輯結(jié)構(gòu)較長,則翻譯結(jié)果就明顯不如北外翻譯系大四學生。表達方面,在邏輯通順的情況下,百度翻譯的英文表達還是十分流暢的,和學生不分高下,在某些常用的固定表達方面,百度翻譯的表達比學生的表達更加簡潔明了,可見其在利用語料庫方面具有重大優(yōu)勢。
機器翻譯可以極大提升譯者的翻譯速度,但其缺點也是相當明顯的。想要充分發(fā)揮機器翻譯的優(yōu)點,同時盡力避免機器翻譯的不足之處,就必須通過比較機器翻譯和人工翻譯,從機器翻譯工作原理的角度剖析譯文的不同,使不同翻譯方式各展所長,絕不能脫離翻譯實踐空談機器翻譯的特性,因為一切翻譯工具最終都是要經(jīng)過實踐的檢驗。
由于篇幅和精力所限,作者只分析了七個具有代表性的譯例,沒有做到全文對照分析,但作者認為分析部分的邏輯對該領(lǐng)域的研究還是具有價值的。作者將機器翻譯的錯誤譯文和其工作原理相結(jié)合,做出合理推斷,總結(jié)機器翻譯出現(xiàn)錯誤的原因,整個分析過程具有可借鑒性。但翻譯作為一個交叉學科,其機器(機輔)翻譯領(lǐng)域與計算機專業(yè)具有高度重合性,因此未來研究者可以從計算機專業(yè)角度來分析本文中提出的猜想是否合理,并且通過修改代碼讓機器翻譯更加智能。我們要充分發(fā)揮主觀能動性,做科技的主人,不斷改進機器翻譯工作方式,提升其譯文質(zhì)量,并積極開辟新的翻譯實踐模式。