【摘要】使用YiCAT翻譯平臺(tái)中的機(jī)器翻譯引擎將《神經(jīng)機(jī)器翻譯》第一章的第一部分譯成漢語(yǔ),以此翻譯結(jié)果為研究對(duì)象,總結(jié)出現(xiàn)頻率較高的機(jī)器翻譯錯(cuò)誤類(lèi)型,如在詞匯層面的術(shù)語(yǔ)翻譯錯(cuò)誤、多義詞誤譯、詞性錯(cuò)譯,句法層面的語(yǔ)序錯(cuò)誤、從句錯(cuò)譯、欠譯,篇章層面的缺少銜接和邏輯混亂問(wèn)題,并在此基礎(chǔ)上提出改進(jìn)方法,對(duì)機(jī)器翻譯錯(cuò)誤提出解決對(duì)策,以期為今后學(xué)術(shù)文本機(jī)器翻譯譯后編輯研究提供借鑒。
【關(guān)鍵詞】學(xué)術(shù)文本;機(jī)器翻譯;錯(cuò)誤探析;譯后編輯
【中圖分類(lèi)號(hào)】H315? ? ? ? ? ? 【文獻(xiàn)標(biāo)識(shí)碼】A? ? ? ? ? ?【文章編號(hào)】2096-8264(2023)15-0113-03
【DOI】10.20024/j.cnki.CN42-1911/I.2023.15.036
近年來(lái),隨著大數(shù)據(jù)、人工智能等技術(shù)的發(fā)展,機(jī)器翻譯逐漸成為關(guān)注的焦點(diǎn)。機(jī)器翻譯是“使用計(jì)算機(jī)系統(tǒng)將文本或語(yǔ)音從一種自然語(yǔ)言自動(dòng)翻譯為另一種語(yǔ)言”[1]。但機(jī)器翻譯的質(zhì)量無(wú)法讓人滿(mǎn)意,且在垂直領(lǐng)域僅依靠機(jī)器翻譯難以產(chǎn)出高質(zhì)量譯文,因而譯后編輯環(huán)節(jié)必不可少[2]。本文選取的原文本屬于學(xué)術(shù)文本,學(xué)術(shù)著作屬于科學(xué)語(yǔ)言,它的功能是記錄科學(xué)活動(dòng)和學(xué)術(shù)思想,科學(xué)活動(dòng)和學(xué)術(shù)思想的顯著特點(diǎn)是概括性和抽象性,因此,相對(duì)于其他文本來(lái)說(shuō),學(xué)術(shù)著作的翻譯在學(xué)術(shù)性方面提出了很高的要求[3]。近幾年機(jī)器翻譯越來(lái)越多地參與到學(xué)術(shù)文本的翻譯過(guò)程中,相關(guān)研究也逐漸增多。因此運(yùn)用計(jì)算機(jī)輔助翻譯是翻譯學(xué)術(shù)文本的一大趨勢(shì)。筆者借助YiCAT翻譯平臺(tái),采用Tencent TranSmart交互式機(jī)器翻譯,以學(xué)術(shù)文本的機(jī)器翻譯譯文為例,總結(jié)學(xué)術(shù)文本機(jī)器翻譯結(jié)果的高頻錯(cuò)誤,分析譯文存在的問(wèn)題并提出解決辦法。
一、文獻(xiàn)綜述
國(guó)外對(duì)機(jī)器翻譯質(zhì)量研究已經(jīng)有60多年的歷史,例如:Garcia的Translating by post-editing:is it the way forward?Fiederer R和OBrien S的Quality and machine translation: A realistic objective。國(guó)外學(xué)者對(duì)譯后編輯的研究有近20多年的歷史,主要針對(duì)英德、英法互譯等。
國(guó)內(nèi)對(duì)該領(lǐng)域的研究也取得了一定的進(jìn)展,例如:崔啟亮、馮全功的《譯后編輯研究:焦點(diǎn)透析與發(fā)展趨勢(shì)》總結(jié)了譯后編輯的研究現(xiàn)狀,預(yù)測(cè)其趨勢(shì),為學(xué)界提供參考,但是,譯后編輯在具體領(lǐng)域的應(yīng)用研究鮮有談及[4],且機(jī)器翻譯系統(tǒng)對(duì)不同文本給出的譯文質(zhì)量也存在差異。比較典型的研究有羅季美和李梅的《機(jī)器翻譯譯文錯(cuò)誤分析》,李梅和朱錫明的《英漢機(jī)譯錯(cuò)誤分類(lèi)及數(shù)據(jù)統(tǒng)計(jì)分析》對(duì)汽車(chē)技術(shù)文獻(xiàn)的英漢機(jī)器翻譯錯(cuò)誤進(jìn)行歸類(lèi)分析。
從上述研究分析可以看出,目前對(duì)機(jī)器翻譯學(xué)術(shù)文本的錯(cuò)誤研究相對(duì)較少,本文將在對(duì)相關(guān)錯(cuò)誤類(lèi)型進(jìn)行分析的基礎(chǔ)上,提出相應(yīng)的解決辦法,以期提高學(xué)術(shù)文本譯后編輯的質(zhì)量。
二、理論基礎(chǔ):譯后編輯
譯后編輯是“檢查和修正機(jī)器翻譯的輸出”[1],是指根據(jù)特定的目的對(duì)機(jī)器翻譯的原始產(chǎn)出進(jìn)行加工與修改的過(guò)程,包括更改翻譯(語(yǔ)言)錯(cuò)誤、提高機(jī)譯產(chǎn)出的準(zhǔn)確性與可讀性等[5]。就目前機(jī)器翻譯技術(shù)來(lái)說(shuō),自動(dòng)翻譯生成的譯文質(zhì)量對(duì)于參照原文進(jìn)行理解一般還可以做到,但是還難以達(dá)到直接輸出譯文稿而無(wú)需人工潤(rùn)色的質(zhì)量,所以后編輯處理在很多情況下必須使用[6]。
三、機(jī)器翻譯錯(cuò)誤類(lèi)型及分析
本章著重分析使用YiCAT翻譯工具過(guò)程中遇到的機(jī)器翻譯錯(cuò)誤,主要從詞匯、句法、語(yǔ)篇這三個(gè)層面闡述。
(一)詞匯層面
1. 術(shù)語(yǔ)翻譯錯(cuò)誤
例1原文:Fluency also involves picking the right content words when there are several possible synonyms available.
機(jī)器譯文:流利還包括在有幾個(gè)可能的同義詞可用時(shí)選擇正確的內(nèi)容詞。
譯后編輯:流暢性還包括在有很多同義詞的情況下選擇正確的實(shí)詞。
分析:學(xué)術(shù)文本中的術(shù)語(yǔ)較多,語(yǔ)義豐富,涉及的領(lǐng)域?qū)I(yè)性較強(qiáng),某些詞匯既可以作為一般詞匯又可以作為術(shù)語(yǔ),而機(jī)器翻譯系統(tǒng)有時(shí)難以辨別一般詞匯和專(zhuān)業(yè)詞匯?!癱ontent words”這個(gè)術(shù)語(yǔ)翻譯錯(cuò)誤,機(jī)器翻譯沒(méi)有采用通用譯法,機(jī)器譯文不符合英文表達(dá)習(xí)慣,通過(guò)查詢(xún)術(shù)語(yǔ)在線(xiàn)網(wǎng)(http://www.termonline.cn),確定將該術(shù)語(yǔ)譯為“實(shí)詞”,符合學(xué)術(shù)文本中術(shù)語(yǔ)翻譯的準(zhǔn)確性。
2. 多義詞誤譯
例2原文:Four score and seven years is not just any way to say 87 years.
機(jī)器譯文:四分七年不是隨便說(shuō)的87年。
譯后編輯:八十七年不是隨便說(shuō)的87年。
分析:同一個(gè)單詞或短語(yǔ)經(jīng)常有多種理解,多義詞識(shí)別是自然語(yǔ)言處理中一個(gè)較難解決的問(wèn)題。這里score不表示“分?jǐn)?shù)”,而是“二十”的意思。譯員在處理一詞多義的問(wèn)題時(shí)會(huì)根據(jù)上下文或具體語(yǔ)境選擇恰當(dāng)?shù)暮x,而機(jī)器翻譯系統(tǒng)目前雖然具備一定的語(yǔ)境處理能力,但此例的語(yǔ)境有些難處理,原因在于score作為“分?jǐn)?shù)”義與years都是名詞,且前面都有數(shù)詞,很容易理解為兩個(gè)并列的名詞結(jié)構(gòu),score作為分?jǐn)?shù)義,前面也多跟數(shù)詞,對(duì)于機(jī)器翻譯來(lái)說(shuō)很難辨認(rèn),如此機(jī)器處理起來(lái)困難很大。由于計(jì)算機(jī)自身存在局限性,不能像人腦一樣靈活思考,在結(jié)合具體語(yǔ)境對(duì)文章進(jìn)行分析的能力上還不足,往往會(huì)選用出現(xiàn)次數(shù)最多的那個(gè)單詞意思,不能選擇恰當(dāng)?shù)谋磉_(dá),容易出錯(cuò)。
3. 詞性錯(cuò)譯
例3原文:There is an extensive proliferation of tool kits available for research, development,and deployment of neural machine translation systems.
機(jī)器譯文:可用于神經(jīng)機(jī)器翻譯系統(tǒng)的研究、開(kāi)發(fā)和部署的工具包廣泛擴(kuò)散。
譯后編輯:有大量的工具包可用于神經(jīng)機(jī)器翻譯系統(tǒng)的研究、開(kāi)發(fā)和部署。
分析:在英譯漢的過(guò)程中,我們一般會(huì)遵循漢語(yǔ)動(dòng)詞優(yōu)勢(shì),將英語(yǔ)中的名詞或名詞詞組譯為漢語(yǔ)中的動(dòng)詞,但這要視情況而定,在翻譯某些詞匯時(shí)須保留其本來(lái)的詞性。此例中,proliferation作為名詞有“擴(kuò)散、激增、大量的事物”等含義,在短語(yǔ)a proliferation of中意為“大量的”,而機(jī)器在處理該情況時(shí)無(wú)法辨別,從而錯(cuò)譯。此處仍需將proliferation看作名詞短語(yǔ)中的一部分,不改變?cè)~性來(lái)翻譯。
(二)句法層面
1. 語(yǔ)序錯(cuò)誤
例4原文:The data- driven methods that I discuss in this book are not able to match this performance.Yet.
機(jī)器譯文:我在本書(shū)中討論的數(shù)據(jù)驅(qū)動(dòng)方法無(wú)法達(dá)到這種性能。還沒(méi)有。
譯后編輯:但是,我在本書(shū)中討論的數(shù)據(jù)驅(qū)動(dòng)方法無(wú)法達(dá)到這種性能。
分析:可以看出機(jī)器譯文在語(yǔ)序安排上出了問(wèn)題,不能使上下文合理銜接。Yet單獨(dú)成句放在句尾,表轉(zhuǎn)折,意為“但是”,然而英語(yǔ)和漢語(yǔ)的表達(dá)方式不同,漢語(yǔ)主要通過(guò)詞序反映詞義,根據(jù)漢語(yǔ)的邏輯思維和表達(dá)習(xí)慣,“但是”往往位于小句句首,此處需根據(jù)句子結(jié)構(gòu)和內(nèi)容,在形式上調(diào)整語(yǔ)序,作出變通,將Yet置于前面翻譯,從而體現(xiàn)本句的邏輯層次,以符合漢語(yǔ)的行文表達(dá)習(xí)慣。
2. 從句錯(cuò)譯
例5原文:Anybody who can read this book will be able to build a machine translation system that is comparable to the state of the art.
機(jī)器譯文:任何人誰(shuí)可以閱讀這本書(shū)將能夠創(chuàng)建一個(gè)機(jī)器翻譯系統(tǒng),可以與現(xiàn)有技術(shù)相媲美。
譯后編輯:任何讀過(guò)這本書(shū)的人都將能夠建立一個(gè)機(jī)器翻譯系統(tǒng),可以與現(xiàn)有技術(shù)相媲美。
分析:機(jī)器譯文的前半部分有誤,機(jī)器翻譯系統(tǒng)沒(méi)有結(jié)合從句中的成分對(duì)應(yīng)分析,只是按照原文順序,逐個(gè)將單詞的含義翻譯出來(lái),沒(méi)有考慮到這是定語(yǔ)從句,未注意到定語(yǔ)從句和所修飾詞“anybody”的關(guān)系密切,導(dǎo)致譯文松散。此處應(yīng)該將“who”作為定語(yǔ)從句的引導(dǎo)詞,修飾前面的“anybody”,不必譯出具體含義。雖然機(jī)器翻譯系統(tǒng)多數(shù)情況下可以識(shí)別定語(yǔ)從句進(jìn)行轉(zhuǎn)換,但有時(shí)還會(huì)出錯(cuò),說(shuō)明機(jī)器翻譯系統(tǒng)存在不穩(wěn)定性仍需改進(jìn)。
3. 欠譯
例6原文:But there is more going on here.
機(jī)器譯文:但這里還有更多的事情。
譯后編輯:但對(duì)于這個(gè)問(wèn)題還有很多需要闡述的內(nèi)容。
分析:由于英漢語(yǔ)言表達(dá)的差異,翻譯時(shí)容易出現(xiàn)語(yǔ)義空缺,機(jī)器翻譯系統(tǒng)沒(méi)有擺脫原文的句法結(jié)構(gòu),僅逐字一對(duì)一地翻譯,使得譯文表達(dá)不通順,脫離語(yǔ)境。另外原文屬于學(xué)術(shù)文本,語(yǔ)言凝練,但機(jī)器譯文不符合學(xué)術(shù)文本的規(guī)范,不切合學(xué)術(shù)文本的語(yǔ)體,沒(méi)有傳達(dá)出原文的基本信息,未表達(dá)出作者要繼續(xù)解釋說(shuō)明的意思。通過(guò)聯(lián)系上下文,可以發(fā)現(xiàn)本句有承上啟下的作用,是要對(duì)上文內(nèi)容作補(bǔ)充,因此不能只翻譯字面意思,而應(yīng)將語(yǔ)義具體化,將作者想要說(shuō)明的關(guān)鍵內(nèi)容表達(dá)出來(lái),使譯文具有可讀性,讓讀者清楚地理解原文含義。
(三)語(yǔ)篇層面
1. 缺少銜接
例7原文:The biggest obstacle to data-driven methods is sparsity.And it is worse than you may think.
機(jī)器譯文:數(shù)據(jù)驅(qū)動(dòng)方法最大的障礙是稀疏性。比你想象的還要糟糕。
譯后編輯:數(shù)據(jù)驅(qū)動(dòng)方法最大的障礙是稀疏性,這比你想象的還要糟糕。
分析:原文中And表示遞進(jìn)關(guān)系,是表達(dá)邏輯關(guān)系的手段,機(jī)器譯文漏譯and和it,使譯文中前后兩句的銜接顯得生硬,譯后編輯運(yùn)用指示的方法,用“這”表示前面提及的事情,使語(yǔ)篇連貫。
2. 邏輯混亂
例8原文:So,a professional translator may decide to render this as the popular German news weekly Der Spiegel reported.
機(jī)器譯文:因此,一個(gè)專(zhuān)業(yè)的翻譯可能會(huì)決定翻譯這一點(diǎn),因?yàn)槭軞g迎的德國(guó)新聞周刊《明鏡周刊》報(bào)道。
譯后編輯:因此,一個(gè)專(zhuān)業(yè)譯員可能會(huì)決定按照德國(guó)著名新聞周刊《明鏡周刊》報(bào)道的那樣,將其譯為《紐約時(shí)報(bào)》,而非美國(guó)報(bào)紙《紐約時(shí)報(bào)》。
分析:語(yǔ)言的邏輯缺層是指不符合常規(guī)邏輯推理的語(yǔ)言表達(dá),即在行文中沒(méi)有形成完整的邏輯鏈[7]。此處機(jī)器翻譯系統(tǒng)沒(méi)有正確理解as的含義,擾亂邏輯層次,從而造成整句邏輯關(guān)系混亂,難以理解。這里as意為“按照……的方式”。機(jī)器譯文具有模糊性,讀者可能不清楚是按照《明鏡周刊》報(bào)道的要求來(lái)翻譯還是按照?qǐng)?bào)道風(fēng)格來(lái)翻譯,具有歧義,結(jié)合上文提到的“據(jù)《明鏡周刊》報(bào)道,直譯可能會(huì)使美國(guó)讀者對(duì)原文的可靠性產(chǎn)生懷疑”,為避免歧義,筆者做出修改,采用釋義的方式來(lái)翻譯。
四、未來(lái)建議
(一)優(yōu)化機(jī)器翻譯系統(tǒng)
在未來(lái),機(jī)器翻譯系統(tǒng)應(yīng)努力朝向結(jié)合語(yǔ)境分析原文的方向發(fā)展,逐步解決機(jī)器翻譯中的文化干擾問(wèn)題,盡量擴(kuò)大機(jī)器翻譯系統(tǒng)所用的雙語(yǔ)數(shù)據(jù)資源,小牛翻譯創(chuàng)始人朱靖波表示要從少量數(shù)據(jù)中提高機(jī)器學(xué)習(xí)的泛化能力,解決數(shù)據(jù)稀缺的問(wèn)題;從數(shù)據(jù)驅(qū)動(dòng)擴(kuò)展到知識(shí)驅(qū)動(dòng)。
(二)實(shí)現(xiàn)人機(jī)結(jié)合
雖然機(jī)器翻譯技術(shù)已經(jīng)向各個(gè)領(lǐng)域逐步深入,節(jié)省了人力和時(shí)間,但是其譯文質(zhì)量仍有待提高,機(jī)器翻譯并不能完全替代人工翻譯,理想的做法是實(shí)現(xiàn)人機(jī)結(jié)合。首先,譯前編輯不可忽視,對(duì)提高譯文質(zhì)量發(fā)揮著重要的作用。譯前編輯是對(duì)句式、標(biāo)點(diǎn)、詞匯等作出適當(dāng)調(diào)整,旨在盡可能降低機(jī)譯的錯(cuò)誤譯文,提高機(jī)器譯文準(zhǔn)確度,其主要手段是:拆分長(zhǎng)句、調(diào)整語(yǔ)序、代詞替換、消除歧義、增刪句子成分、同義詞替換等[8],使機(jī)器翻譯系統(tǒng)更好地識(shí)別和理解源語(yǔ)的含義。
再使用機(jī)器系統(tǒng)處理基本的工作,使譯員對(duì)原文本的大意有基本的了解,再譯后編輯,修改錯(cuò)誤,逐步分析,進(jìn)行譯文的完善工作,提高譯文質(zhì)量和工作效率。另外,建立并不斷擴(kuò)充術(shù)語(yǔ)庫(kù)及語(yǔ)料庫(kù),豐富語(yǔ)料資源,以提高匹配度。如此,將譯前和譯后的工作相結(jié)合,發(fā)揮機(jī)器翻譯和人工翻譯各自的優(yōu)勢(shì),取長(zhǎng)補(bǔ)短,減輕工作量,提高譯文質(zhì)量。
(三)提高譯員素養(yǎng),重視語(yǔ)言學(xué)研究
譯員要有準(zhǔn)確、快速發(fā)現(xiàn)機(jī)器翻譯錯(cuò)誤的能力,并能有針對(duì)性地提出修改建議。充分掌握源語(yǔ)和目標(biāo)語(yǔ),具備雙語(yǔ)能力和轉(zhuǎn)換文本的能力,實(shí)現(xiàn)英漢雙語(yǔ)熟練轉(zhuǎn)換。除了具備外語(yǔ)能力,對(duì)其他領(lǐng)域的專(zhuān)業(yè)知識(shí)也要有所涉獵。要重視對(duì)計(jì)算機(jī)語(yǔ)言學(xué)領(lǐng)域的研究,只依靠技術(shù)完善并不能從根本上解決機(jī)器翻譯錯(cuò)誤的問(wèn)題,但在實(shí)際的研究過(guò)程中,人們的關(guān)注點(diǎn)往往在計(jì)算機(jī)性能創(chuàng)新和優(yōu)化方面,從而忽視了計(jì)算機(jī)語(yǔ)言學(xué)方面的相關(guān)問(wèn)題[9]。加大對(duì)語(yǔ)言學(xué)和翻譯學(xué)方面的研究,培育語(yǔ)言學(xué)方面的人才,通過(guò)各方面人才的努力,推進(jìn)翻譯工作。
五、結(jié)語(yǔ)
綜上所述,本文對(duì)學(xué)術(shù)文本的機(jī)器翻譯英譯漢文本進(jìn)行分析,總結(jié)錯(cuò)誤類(lèi)型,并認(rèn)識(shí)到隨著市場(chǎng)需求的增加,翻譯技術(shù)的進(jìn)步,機(jī)器翻譯的譯后編輯在語(yǔ)言服務(wù)實(shí)踐中發(fā)揮著越發(fā)重要的作用,為了發(fā)揮機(jī)器翻譯的高效率,人工翻譯的高質(zhì)量,應(yīng)該將機(jī)器翻譯、人工譯后編輯結(jié)合起來(lái),而這將會(huì)是未來(lái)翻譯發(fā)展的一大趨勢(shì)。為此,我們需要不斷總結(jié)機(jī)器翻譯錯(cuò)誤,加強(qiáng)譯后編輯領(lǐng)域的研究和應(yīng)用,合理選擇譯后編輯策略,不斷改進(jìn)譯后編輯工作。相信日后機(jī)器翻譯技術(shù)會(huì)繼續(xù)發(fā)展完善,譯文準(zhǔn)確度會(huì)日益提高。
參考文獻(xiàn):
[1]崔啟亮.論機(jī)器翻譯的譯后編輯[J].中國(guó)翻譯,
2014,35(06):68-73.
[2]郭望皓,胡富茂.神經(jīng)機(jī)器翻譯譯文評(píng)測(cè)及譯后編輯研究[J].北京第二外國(guó)語(yǔ)學(xué)院學(xué)報(bào),2021,(05).
[3]劉英.英語(yǔ)學(xué)術(shù)著作的漢譯策略[J].中國(guó)科技翻譯,2014,(02):8-11.
[4]馮全功,崔啟亮.譯后編輯研究:焦點(diǎn)透析與發(fā)展趨勢(shì)[J].上海翻譯,2016,(06):67-74.
[5]吳萍.外宣翻譯的譯后編輯[J].海外英語(yǔ),2018,(13):133-134.
[6]趙鐵軍等.機(jī)器翻譯原理[M].哈爾濱:哈爾濱工業(yè)大學(xué)出版社,2000:9-10.
[7]吳迪龍.科技英語(yǔ)文章中的邏輯偏移及其漢譯處理[J].中國(guó)科技翻譯,2015,(4):1-4.
[8]馮全功,李嘉偉.新聞翻譯的譯后編輯模式研究[J].外語(yǔ)電化教學(xué),2016,(06):74-79.
[9]安帥飛,邵楨貽.漢英小說(shuō)體機(jī)器翻譯評(píng)測(cè)分析[J].文學(xué)教育(上),2019,(07):136-137.
作者簡(jiǎn)介:
謝曉璐,女,山東煙臺(tái)人,青島大學(xué)外語(yǔ)學(xué)院在讀碩士研究生,研究方向:英語(yǔ)筆譯。