廉 潔楊 帆
(1.太原理工大學(xué),山西 太原 030024;2.賽鼎工程有限公司,山西 太原 030032)
自第一次工業(yè)革命起,機(jī)器取代人力似乎成為各行各業(yè)的必然趨勢。人類邁入信息時代后,所謂“取代”不僅限于機(jī)械性勞動,而是慢慢延伸至思維領(lǐng)域,人們的勞動模式也開始隨之改變。以往譯者作為橋梁和紐帶的角色從未受到過挑戰(zhàn),而今,各類翻譯軟件、語音翻譯器的出現(xiàn)讓一部分譯者陷入自我懷疑的怪圈,就目前機(jī)器翻譯的發(fā)展情況而言,譯者的作用雖然略有削弱,但仍無可替代。然而,譯者也應(yīng)緊跟時代步伐,借助前沿工具十分有必要。本文通過回溯機(jī)器翻譯的發(fā)展歷程、工作原理、研究現(xiàn)狀,探究機(jī)器翻譯目前所適用的文本類型以及當(dāng)前應(yīng)用最廣的機(jī)器翻譯軟件“谷歌翻譯”的英漢互譯水平,從而加深譯者對當(dāng)前技術(shù)框架下機(jī)器翻譯的缺陷與不足的認(rèn)識,以便在譯后編輯環(huán)節(jié)提出有針對性的解決方案,同時提升譯者自身的譯后編輯能力。另外,筆者認(rèn)為,當(dāng)前譯員的培養(yǎng)要著眼于未來市場的翻譯需求。本文的最后部分對譯者的譯后編輯能力構(gòu)成進(jìn)行了綜述概括,對譯后編輯與傳統(tǒng)翻譯模式進(jìn)行了系統(tǒng)區(qū)分,以期為譯者能力培養(yǎng)提供方向性參考。
機(jī)器翻譯的發(fā)展是一個波折前進(jìn)的過程,很多學(xué)者對于機(jī)器翻譯的發(fā)展歷程都進(jìn)行了不同的階段劃分,但總體來說可以將其分為提出、低谷、回暖三個階段,而在這三個階段中又包括不同的發(fā)展時期。
20世紀(jì)40年代至50年代(提出與初步試驗(yàn)時期):1946年,電子計(jì)算機(jī)問世,英國工程師Booth和美國工程師Weaver首次提出利用計(jì)算機(jī)進(jìn)行翻譯,開始了機(jī)器翻譯的可能性研究。1954年,美國Georgetown University使用IBM-701電子計(jì)算機(jī)進(jìn)行了第一次機(jī)器翻譯實(shí)驗(yàn),而且在這一時期,美國多所大學(xué)已經(jīng)開始了機(jī)器翻譯研究。
20世紀(jì)50年代至80年代(限于語法分析的翻譯時期與重新修訂語言理論時期):1957年,Chomsky的著作Syntactic Structure為當(dāng)時的機(jī)器翻譯研究提供了語言學(xué)理論基礎(chǔ)。但自1966年美國政府資助的語言自動處理咨詢委員會發(fā)布報(bào)告指出人工翻譯速度更快、準(zhǔn)確性更高且成本更低,機(jī)器翻譯在未來若干年內(nèi)發(fā)展前景無法預(yù)測。此后,政府開始大量削減研究經(jīng)費(fèi),機(jī)器翻譯研究跌入低谷階段,但始終沒有終止,出現(xiàn)了如SYSTRAN的第一代機(jī)器翻譯系統(tǒng)。1971年Terry Winograd證實(shí)了機(jī)器對于原文的理解處理不僅與語法結(jié)構(gòu)有關(guān),更與語境有較大關(guān)聯(lián),需要聯(lián)系更多語言以外的外部知識才能達(dá)到較好的翻譯效果,提出了語義語法、詞典功能語法等理論,為下一個階段的研究做了鋪墊。
20世紀(jì)80年代至今(對語言環(huán)境的挑戰(zhàn)時期及互聯(lián)網(wǎng)翻譯技術(shù)時期):高質(zhì)量的機(jī)器翻譯一定是基于對源語言語義的充分理解,而做到所謂充分理解,不僅要求機(jī)器能夠具備相應(yīng)的語法結(jié)構(gòu)知識,而且要具備一定的語境分析與聯(lián)想能力,內(nèi)容涉及語言學(xué)、計(jì)算機(jī)科學(xué)、人工智能等多個領(lǐng)域。21世紀(jì)互聯(lián)網(wǎng)的快速發(fā)展也推動了新時代的機(jī)器翻譯研究,基于統(tǒng)計(jì)、基于實(shí)例等新的機(jī)器翻譯方法也都是在這一時期出現(xiàn)的。2016年,谷歌公司發(fā)布谷歌神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯系統(tǒng),首次將整個輸入句子視作翻譯的基本單元,準(zhǔn)確度較以往機(jī)器翻譯系統(tǒng)有了大幅度提升。如今,神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯系統(tǒng)已經(jīng)克服了超大型數(shù)據(jù)集上的許多挑戰(zhàn),在翻譯速度和準(zhǔn)確度上都有著顯著飛躍。
谷歌神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯系統(tǒng)目前已被全球用戶與研究者們廣泛接受,與傳統(tǒng)的基于統(tǒng)計(jì)的機(jī)器翻譯系統(tǒng)相比,谷歌神經(jīng)翻譯系統(tǒng)在生成譯文的每個部分時都會在整個原文的基礎(chǔ)上進(jìn)行以句子為單位的對照參考,因此譯文更加自然。但在日常應(yīng)用中,就英漢互譯而言,谷歌翻譯的英譯漢準(zhǔn)確率要相對高于其漢譯英準(zhǔn)確率,而從文本類型來看,谷歌翻譯對于非文學(xué)類文本的翻譯效果要遠(yuǎn)優(yōu)于其對于文學(xué)文本的處理效果。
由德國翻譯家Katharine Reiss提出的文本類型理論劃分了三種文本類型:信息型、表情型、操作型,不同的文本類型有著不同的翻譯要求,因此機(jī)器翻譯在處理不同文本類型時應(yīng)采取相應(yīng)機(jī)制才能達(dá)到較為理想的翻譯效果。表1對不同文本類型及其特點(diǎn)進(jìn)行了簡要概括。
綜合表1,筆者根據(jù)國內(nèi)幾位學(xué)者,如孫瑾、葉子南、包凱等對機(jī)器翻譯的研究,對谷歌翻譯在三種文本類型中的翻譯效果進(jìn)行了總結(jié),結(jié)論顯示:
表1 文本類型及其特點(diǎn)
對于信息型本,谷歌翻譯的句子雖然生硬,但已基本明晰其大意,與信息型文本忠于原文、簡潔明了的翻譯標(biāo)準(zhǔn)已基本接近。但谷歌翻譯中,英譯漢的效果明顯優(yōu)于漢譯英,這主要是由于漢語與英文的語法結(jié)構(gòu)相差甚遠(yuǎn),語料輸入不足,機(jī)器無法進(jìn)行充分學(xué)習(xí),然而隨著語料庫的擴(kuò)大及語法識別技術(shù)的進(jìn)步,信息型文本的英漢互譯結(jié)果將會越來越完善,有著較高的實(shí)用性。同時,利用谷歌翻譯處理信息類文本還具有一定優(yōu)勢,就時效性而言,機(jī)器翻譯能夠幫助譯者節(jié)省重復(fù)句型句式的翻譯時間,縮短部分術(shù)語的查找時間,在保證準(zhǔn)確的前提下很大程度上可以提升翻譯效率。
對于表情型文本,即文學(xué)作品來說,首先機(jī)器翻譯只具備字面理解并處理的功能,甚至對于某些不符合日常表達(dá)習(xí)慣的文學(xué)性特殊表達(dá)不具備識別和理解能力,更無法準(zhǔn)確地將原文的情感和深層含義通過譯文展現(xiàn)出來;其次文學(xué)翻譯的主觀色彩是機(jī)器翻譯系統(tǒng)所極度缺乏的一項(xiàng)重要模塊,一旦無法在語料庫中找到與原文相匹配的語料,機(jī)器就只能進(jìn)行字面翻譯,導(dǎo)致情感表達(dá)的缺失。因此,無論是英譯還是漢譯,機(jī)器翻譯目前對于文學(xué)類文本的適用性較低,甚至無法達(dá)到參考效果。
最后,對于操作型文本,該文本的特點(diǎn)介于信息型和表情型之間,既強(qiáng)調(diào)內(nèi)容也注重感染力,在傳遞信息的同時,追求譯文的獨(dú)創(chuàng)性。而目前的機(jī)器翻譯只是基于語法規(guī)則和語料庫所建立的語言轉(zhuǎn)換程序,在情感表達(dá)方面無法實(shí)現(xiàn)源語與目的語的動態(tài)對等。因此,對于操作型文本的英漢互譯,機(jī)器翻譯目前還未能達(dá)到適用標(biāo)準(zhǔn)。
由上述結(jié)論可見,當(dāng)前技術(shù)框架下的機(jī)器翻譯雖然一直在進(jìn)步,但始終無法涉足帶有主觀性元素或表情性元素的文本類型。而對于信息型文本,機(jī)器翻譯結(jié)果只能達(dá)到參考級別,譯文仍需要通過人工譯員來進(jìn)行修改完善才能最終成稿。因此,在機(jī)器翻譯完全成熟之前,“機(jī)器翻譯+譯后編輯”這種新興翻譯模式將成為提高翻譯時效性的一個必要環(huán)節(jié)和促進(jìn)機(jī)器翻譯走向成熟的必然選擇。
根據(jù)ISO/DIS 17100:2013標(biāo)準(zhǔn)所給出的定義,譯后編輯(Post-editing)是“檢查和修正機(jī)器翻譯的輸出”的一個環(huán)節(jié)。由于機(jī)器翻譯技術(shù)尚未完善,機(jī)器翻譯質(zhì)量暫時無法達(dá)到職業(yè)譯者的翻譯水準(zhǔn),而為實(shí)現(xiàn)翻譯效率與翻譯質(zhì)量的平衡把控,將機(jī)器翻譯技術(shù)與人工翻譯結(jié)合并發(fā)揮二者的一體化優(yōu)勢成為翻譯服務(wù)行業(yè)的一種新興翻譯模式。
卡門森斯咨詢公司于2010年發(fā)布的語言服務(wù)行業(yè)報(bào)告指出,42%的語言服務(wù)提供商已經(jīng)向客戶提供機(jī)器翻譯的譯后編輯服務(wù)。無論機(jī)器翻譯技術(shù)多么先進(jìn),也很難實(shí)現(xiàn)“全自動高質(zhì)量”的翻譯,必須有人工的譯后參與。顯而易見,譯后編輯在平衡機(jī)器翻譯質(zhì)量方面已經(jīng)成為市場需求的一部分,并且需求比重正在上升。
譯后編輯的研究緊隨機(jī)器翻譯的發(fā)展,國外學(xué)者對于譯后編輯的研究始于20世紀(jì)80年代,主要研究方向集中在譯后編輯概述與評估、機(jī)器翻譯錯誤識別、譯后編輯工具研發(fā)、譯后編輯能力與譯后編輯者的培養(yǎng)等方面。ISO 18587草案標(biāo)準(zhǔn)將譯后編輯分為三個階段:準(zhǔn)備階段、譯后編輯階段、后處理階段,并對從事譯后編輯人員的技能和能力進(jìn)行了描述。草案還將譯后編輯分為兩個級別:light post-editing以及full post-editing。其中,light post-editing指的是盡量保證機(jī)器譯文的風(fēng)格,僅對錯誤句子進(jìn)行修改,也就是所謂的“輕處理”;而full post-editing則是加入了更多人為干預(yù)的因素,保證譯文在語言、語法、風(fēng)格各方面都與原文達(dá)到動態(tài)對等。國內(nèi)學(xué)者崔啟亮提出了“狹義譯后編輯”和“廣義譯后編輯的概念”,前者指的是對機(jī)器翻譯結(jié)果直接進(jìn)行的譯后編輯,而后者指的是對來自模糊匹配、記憶庫等各種翻譯語料庫管理系統(tǒng)的翻譯結(jié)果進(jìn)行的譯后編輯。隨著機(jī)器翻譯的進(jìn)步,單純基于語法層面的機(jī)器翻譯已經(jīng)逐步淘汰,因此,譯后編輯的研究重點(diǎn)已經(jīng)轉(zhuǎn)向廣義譯后編輯。
當(dāng)前機(jī)器翻譯可能出現(xiàn)的錯誤主要是來自語料庫中語料模糊匹配度不高或計(jì)算機(jī)本身對語言信息加工不當(dāng)。谷歌神經(jīng)翻譯上線之前,傳統(tǒng)機(jī)器翻譯主要以短語為基本單位進(jìn)行翻譯,然后根據(jù)語法理論對整個句子進(jìn)行重新排序。傳統(tǒng)機(jī)器翻譯可能出現(xiàn)的錯誤類型包括:術(shù)語誤譯、形式錯誤(大小寫)、格式錯誤(字體字號)、順序錯誤、欠譯、過譯、多譯、漏譯、冗余、詞性錯誤、從句邏輯關(guān)系錯誤、受到源語句型結(jié)構(gòu)束縛,共12種錯誤類型。
谷歌神經(jīng)翻譯的推出在一定程度上降低了機(jī)器翻譯的錯誤率,但大多數(shù)錯誤類型仍然存在,隨著語料庫的擴(kuò)展和匹配檢索系統(tǒng)的完善,以上錯誤類型中,術(shù)語誤譯、格式及形式錯誤、詞性錯誤的發(fā)生率明顯下降。除從句邏輯關(guān)系錯誤、受到源語句型束縛兩種錯誤類型以外,其他錯誤類型均可根據(jù)具體情況采用light post-editing的譯后編輯模式。以英漢互譯為例,兩種語言語法和構(gòu)成差異較大,在轉(zhuǎn)換過程中難免出現(xiàn)邏輯混亂、束縛表達(dá)等不當(dāng)甚至錯誤情況,因此,譯者需要對這兩種譯后編輯錯誤類型進(jìn)行full post-editing,必要情況下進(jìn)行適當(dāng)改譯,保證原文意圖的有效傳達(dá)。
翻譯服務(wù)市場上對于譯后編輯所產(chǎn)出的譯文要求大多情況下只需達(dá)到參考級別,因此,讀者可以理解即可,表達(dá)上允許適當(dāng)?shù)纳脖磉_(dá)以提高效率。在編輯時,譯者需要掌握機(jī)器翻譯的特點(diǎn)及工作原理,根據(jù)客戶需求,對機(jī)器譯文進(jìn)行不同程度的編輯。對于一詞多義、語序不當(dāng)、表達(dá)不暢等情況,譯者需要具備一定的編輯技巧,在考慮語篇聯(lián)系的情況下適度編輯,而不是完全按照第一譯者的想法進(jìn)行翻譯。譯后編輯不同于一手翻譯,譯者在進(jìn)行編輯時不僅要考慮全文的語篇聯(lián)系,還要考慮機(jī)器翻譯的語言風(fēng)格,這就需要譯者接受相應(yīng)的定制訓(xùn)練以強(qiáng)化譯后編輯能力。
譯后編輯作為翻譯領(lǐng)域人機(jī)交互的一種呈現(xiàn)形式,對于譯者能力的要求不同于傳統(tǒng)翻譯模式。國內(nèi)的機(jī)器譯后編輯研究還處于新興階段,而對于譯者譯后能力培養(yǎng)與提升的研究也是鳳毛麟角,只引起了少數(shù)學(xué)者的重視。而基于傳統(tǒng)翻譯能力之上的譯后編輯能力很有可能成為未來譯者的必備技能之一,也是職業(yè)譯者競爭力的體現(xiàn)。
譯者在執(zhí)行譯后編輯任務(wù)前不僅要具備進(jìn)行傳統(tǒng)模式翻譯的能力,還要具有針對性地去了解機(jī)器翻譯,相關(guān)機(jī)制及工具。根據(jù)馮全功對于譯后編輯培養(yǎng)的研究,譯后編輯能力主要是編輯能力與翻譯能力的綜合,具體又包括除譯者基本能力(雙語運(yùn)用能力、專業(yè)知識認(rèn)知能力、查閱搜索及工具運(yùn)用能力等)以外的機(jī)器翻譯機(jī)制認(rèn)知能力、術(shù)語管理能力、譯前編輯能力、基本編程能力、語言學(xué)知識能力、宏命令使用能力、詞典編制能力等。Rico & Torrejón認(rèn)為譯者譯后編輯能力可劃分為三大范疇:語言能力、工具能力、核心能力,其中核心能力指譯者的“生理/心理能力”和“策略能力”,涉及譯者對于主體性問題的處理,如對于機(jī)器質(zhì)量譯文的容忍、滿足客戶需求、克服譯后編輯中出現(xiàn)的不確定性、對機(jī)器翻譯風(fēng)格的遵循與舍棄等。另外,不同程度的譯后編輯對于譯者能力的側(cè)重也各不相同,light post-editing側(cè)重于譯者的工具能力,而full post-editing要求更為全面,譯者在進(jìn)行full postediting時不僅要發(fā)揮過硬的語言能力,還要合理安排時間,注重排版和符號運(yùn)用等細(xì)節(jié),積累術(shù)語并且對譯后編輯的所謂“倫理”有一定的認(rèn)同。
如何培養(yǎng)譯者的譯后編輯能力目前受到了國內(nèi)學(xué)界與翻譯行業(yè)的初步重視,無論對于譯者的自我學(xué)習(xí)還是全國高校翻譯教育來說,都需要將譯后編輯能力培養(yǎng)提上日程。國內(nèi)外學(xué)者,如O'Brien、劉群、馮全功等已經(jīng)在這一方面進(jìn)行了相關(guān)研究,且國內(nèi)高校,如香港中文大學(xué)等也有過相關(guān)實(shí)踐經(jīng)驗(yàn)。其中,馮全功參考國內(nèi)外譯后編輯能力培養(yǎng)研究,對國內(nèi)高校翻譯教育,尤其是MTI專業(yè)課程設(shè)置,就加入譯后編輯元素提出了若干意見。
譯后編輯代表著未來翻譯服務(wù)行業(yè)的趨勢走向,進(jìn)行譯后編輯能力的培養(yǎng)與自我塑造對于譯者也是順應(yīng)未來行業(yè)要求的重要環(huán)節(jié)。而譯后編輯構(gòu)成復(fù)雜,與傳統(tǒng)翻譯模式大相徑庭,需要譯者更新翻譯意識,主動學(xué)習(xí)使用相應(yīng)工具,學(xué)習(xí)相應(yīng)技術(shù)才能緊跟行業(yè)發(fā)展的潮流,提升自身綜合職業(yè)競爭力。
信息化時代給人們帶來了海量信息和數(shù)據(jù),傳統(tǒng)翻譯模式對于源語言的處理效率已經(jīng)顯得越發(fā)力不從心,而機(jī)器翻譯與人工譯后編輯這種新型人機(jī)交互模式的出現(xiàn)必然引起翻譯行業(yè)的一輪革新。無論作為譯者還是翻譯研究人員,把握當(dāng)前趨勢,合理轉(zhuǎn)變思維,接納新生事物都十分必要。但是,目前國內(nèi)對于機(jī)器翻譯和譯后編輯的研究剛剛興起,相關(guān)技術(shù)發(fā)展也尚未成熟,還需要進(jìn)行長時間的理論和實(shí)踐研究。筆者從機(jī)器翻譯、譯后編輯及譯后編輯能力培養(yǎng)與提升三個方面,就幾位具有代表性的國內(nèi)外學(xué)者所做研究進(jìn)行了綜述,希望能夠?yàn)樵摲矫嫜芯刻峁┫鄳?yīng)參考,促進(jìn)“機(jī)器翻譯+譯后編輯”翻譯模式的進(jìn)一步發(fā)展。