任繼超 于艷英
摘?要:在線翻譯平臺(tái)為譯者帶來(lái)了極大的便利性和快捷性,因此其功能的進(jìn)一步完善成為翻譯實(shí)踐者關(guān)注和研究的對(duì)象。如今機(jī)器翻譯軟件無(wú)論在可涉及的文本類型、翻譯速度及準(zhǔn)確度等方面較以前都有了長(zhǎng)足的發(fā)展和進(jìn)步,但在具體文本翻譯中,仍有一定的局限,甚至?xí)霈F(xiàn)各種失誤或錯(cuò)誤,尤其是在漢英翻譯過(guò)程中。鑒于此,文章從《石油工業(yè)概論》書中選取了部分中文石油化工語(yǔ)料,借助有道在線翻譯軟件,對(duì)其進(jìn)行漢英翻譯,統(tǒng)計(jì)其中出現(xiàn)的錯(cuò)誤類型,并對(duì)譯文從詞匯、句法等方面做了進(jìn)一步分析。通過(guò)此過(guò)程,作者期望發(fā)現(xiàn)和總結(jié)現(xiàn)有在線翻譯軟件在處理科技類文本漢英翻譯時(shí)常見的錯(cuò)誤類型以及錯(cuò)誤產(chǎn)生的原因,并基于此提出改進(jìn)的方向和措施,從而對(duì)后續(xù)譯者和翻譯軟件設(shè)計(jì)者有所啟發(fā)。
關(guān)鍵詞:石油化工文本;機(jī)器翻譯;機(jī)譯錯(cuò)誤;錯(cuò)誤分析
中圖分類號(hào):F74?????文獻(xiàn)標(biāo)識(shí)碼:A??????doi:10.19311/j.cnki.16723198.2023.05.023
0?引言
隨著各種機(jī)器翻譯技術(shù)的方法的不斷演進(jìn),從啟蒙嘗試,到基于規(guī)則、基于實(shí)例的方法,再到基于語(yǔ)料庫(kù)的統(tǒng)計(jì)方法,直到當(dāng)前的神經(jīng)網(wǎng)絡(luò)方法,機(jī)器翻譯質(zhì)量不斷提升,應(yīng)用前景不斷擴(kuò)大。隨著該領(lǐng)域技術(shù)的發(fā)展,出現(xiàn)了越來(lái)越多功能強(qiáng)大的在線翻譯平臺(tái),如百度翻譯、必應(yīng)翻譯、谷歌翻譯、有道翻譯等,其中有道翻譯所占據(jù)的市場(chǎng)份額最為龐大。雖然機(jī)器翻譯理論以及相關(guān)研究取得了不小進(jìn)展,但“翻譯本身的復(fù)雜性”“自然語(yǔ)言的復(fù)雜性”和“機(jī)器自身的局限性”使得譯者不得不對(duì)譯文進(jìn)行后期的人工修改即譯后編輯。本文以當(dāng)前占市場(chǎng)份額最大的主流在線翻譯平臺(tái)有道翻譯為翻譯工具,以石油化工類文本漢譯英譯文為研究對(duì)象,分析梳理譯文中典型錯(cuò)誤類型,探究錯(cuò)誤產(chǎn)生原因,并基于此提出譯后編輯的建議及軟件完善的方向,以期為從事相關(guān)領(lǐng)域的譯者和翻譯軟件的研發(fā)者提供一些借鑒和啟發(fā)。
1?機(jī)器譯文錯(cuò)誤研究現(xiàn)狀
目前,即便機(jī)器翻譯在技術(shù)上取得了較大的進(jìn)步,但仍有很多錯(cuò)誤出現(xiàn)在機(jī)器譯文當(dāng)中。有學(xué)者對(duì)近40年來(lái)發(fā)表的涉及機(jī)器翻譯錯(cuò)誤類型的論文進(jìn)行了定量分析,將錯(cuò)誤類型按出現(xiàn)頻次做了如下歸類:詞匯層面(術(shù)語(yǔ)、詞義等);句法層面(時(shí)態(tài)、語(yǔ)態(tài)等);語(yǔ)篇層面(語(yǔ)境、母語(yǔ)習(xí)慣表達(dá)偏差等)及其他錯(cuò)誤(原文錯(cuò)誤、格式偏差等)。羅季美、李梅以課題組的形式,對(duì)汽車操作手冊(cè)的人工譯文和機(jī)器譯文進(jìn)行抽樣對(duì)比,并將錯(cuò)誤進(jìn)行標(biāo)注統(tǒng)計(jì),其研究結(jié)果發(fā)現(xiàn):詞匯錯(cuò)譯高達(dá)84.13%,句法42.45%,符號(hào)4.95%。其中,詞匯錯(cuò)譯率中最高的是術(shù)語(yǔ)錯(cuò)譯,占詞匯錯(cuò)譯的78.85%;句法錯(cuò)譯率最高的是詞序錯(cuò)誤,占29.35%。陳勝、田傳茂在對(duì)石油地質(zhì)類文本進(jìn)行了機(jī)器翻譯譯后編輯之后指出:譯文錯(cuò)誤主要反映在詞義、詞性、詞序、句子結(jié)構(gòu)、斷句、名詞語(yǔ)法標(biāo)記、搭配、標(biāo)點(diǎn)符號(hào)、字母大小寫、信息完整性等方面。到目前為止,大多數(shù)譯后編輯研究的數(shù)據(jù)及結(jié)論都是基于英譯漢文本資料,本文將采用逆向研究的方法,探究機(jī)器翻譯漢譯英過(guò)程中易產(chǎn)生的錯(cuò)誤類型及原因。
2?石油化工文本錯(cuò)誤類型統(tǒng)計(jì)
本次研究使用的線上翻譯平臺(tái)為有道翻譯,選取的中文文本來(lái)自《石油工業(yè)概論》。在機(jī)器翻譯之后,將錯(cuò)誤類型按詞匯、句法和其它這三個(gè)錯(cuò)誤類型的基礎(chǔ)上,進(jìn)一步進(jìn)行細(xì)分匯總?cè)绫?。
由表1我們可以看出,在使用有道翻譯對(duì)石油化工文本進(jìn)行漢譯英時(shí),從詞匯層面上來(lái)看,錯(cuò)誤大多集中于對(duì)該領(lǐng)域內(nèi)術(shù)語(yǔ)、準(zhǔn)術(shù)語(yǔ)的翻譯;句法層面的錯(cuò)誤集中于錯(cuò)誤的處理句子成分;而在其他層面,格式上的轉(zhuǎn)化出現(xiàn)錯(cuò)誤較多。下文將以案例形式進(jìn)行譯后編輯并梳理分析。
3?漢譯英譯文錯(cuò)誤分析
根據(jù)上述統(tǒng)計(jì)結(jié)果,從實(shí)例出發(fā),進(jìn)一步分析錯(cuò)誤產(chǎn)生的原因,并進(jìn)行譯后編輯。
3.1?術(shù)語(yǔ)、準(zhǔn)術(shù)語(yǔ)翻譯錯(cuò)誤
現(xiàn)行基于大數(shù)據(jù)語(yǔ)料庫(kù)和深度學(xué)習(xí)機(jī)制的機(jī)器翻譯平臺(tái),其大數(shù)據(jù)語(yǔ)料庫(kù)的語(yǔ)料量、擴(kuò)充速度和自我更新能力是影響翻譯功能的重要指標(biāo)項(xiàng)。上述語(yǔ)料庫(kù)的語(yǔ)料量不足或功能缺陷,會(huì)導(dǎo)致譯文質(zhì)量的下降或顯著的翻譯錯(cuò)誤?[6?]。機(jī)器翻譯只能依據(jù)其先確定詞和詞組的意思,再按語(yǔ)法規(guī)則形成句子的翻譯順序進(jìn)行翻譯,致使生成句子中的詞匯未結(jié)合相關(guān)上下文語(yǔ)境。
例1?塊錐入度
有道譯文:piece?of?cone?into?the?degrees
譯后編輯:block?cone?penetration
“塊錐入度”是石油化工術(shù)語(yǔ),指的是硬度足以保持其形狀的潤(rùn)滑脂在25℃時(shí),測(cè)得潤(rùn)滑脂的錐入度。因?yàn)楹笈_(tái)語(yǔ)料庫(kù)并未包含此術(shù)語(yǔ),翻譯之后得到偏離原意的結(jié)果。
3.2?詞性錯(cuò)誤
例2?視密度
有道譯文:depending?on?the?density
譯后編輯:observed?density
該此例中,同樣是由于后臺(tái)語(yǔ)料庫(kù)未包含足夠多該領(lǐng)域術(shù)語(yǔ),翻譯引擎依據(jù)自身語(yǔ)法規(guī)則進(jìn)行翻譯,將“視”理解為動(dòng)詞,錯(cuò)誤的用“取決”來(lái)進(jìn)行翻譯。而這里的“視”實(shí)際上是形容詞,表示“可視”“可以觀察到”的意思,用來(lái)修飾密度。
3.3?漢英句式轉(zhuǎn)換錯(cuò)誤
相比較漢語(yǔ),英文更注重結(jié)構(gòu)上的完整性,漢語(yǔ)中可以省略的部分,在對(duì)應(yīng)英文中,需要根據(jù)英文語(yǔ)法及表達(dá)習(xí)慣進(jìn)行增補(bǔ)。
例3?地下信息是分不同階段收集的。在鉆進(jìn)過(guò)程中,同時(shí)收集巖心和中途試井、泥漿測(cè)井的數(shù)據(jù)。
有道譯文:Underground?information?is?collected?in?different?stages.?During?drilling,?data?were?collected?from?both?core?and?in-course?tests,?as?well?as?mud?logs.
譯后編輯:Underground?information?is?collected?at?different?stages.?While?people?drilling,?data?were?collected?from?both?core?and?in-course?tests,?as?well?as?mud?logs.
原漢語(yǔ)句子中是可以省略主語(yǔ)的,因?yàn)橹髡Z(yǔ)是人。而現(xiàn)在機(jī)器譯文句子當(dāng)中,整句話的主語(yǔ)只能是與主句一致的“data”,句子變得邏輯不通。按英語(yǔ)語(yǔ)法,現(xiàn)在分詞或過(guò)去分詞短語(yǔ),其主語(yǔ)要和主句的主語(yǔ)保持一致,否則不能省略。
3.4?句子成分處理錯(cuò)誤
漢語(yǔ)中一些詞既可以作為動(dòng)詞也可以作為介詞,而機(jī)器翻譯往往不能正確識(shí)別其詞性,而將真正的謂語(yǔ)翻譯成句子的其他成分,使譯文無(wú)法傳達(dá)正確的原文信息。
例4?連續(xù)油管用一個(gè)長(zhǎng)長(zhǎng)的可彎曲鉆桿代替?zhèn)鹘y(tǒng)僵硬的需要不斷接單根的鉆桿。
有道譯文:Coiled?tubing?uses?a?long,?bendable?drill?pipe?instead?of?the?traditional?rigid?drill?pipe?that?requires?continuous?connection.
譯后編輯:?Coiled-tubing?technologies?replace?the?traditional?rigid,?jointed?drill?pipe?with?a?long,?flexible?coiled?pipe?string.
例句中的“用……替代”中的“用”英語(yǔ)語(yǔ)法本來(lái)應(yīng)用作狀語(yǔ),“替代”才是本句當(dāng)中的謂語(yǔ),而機(jī)器翻譯將第一個(gè)出現(xiàn)的動(dòng)詞“用”作為謂語(yǔ),而將本來(lái)的謂語(yǔ)變成了介詞短語(yǔ)。
3.5?漏譯
通過(guò)翻譯實(shí)踐發(fā)現(xiàn),使用機(jī)器翻譯進(jìn)行段落翻譯時(shí)經(jīng)常出現(xiàn)漏譯,一次性輸入翻譯引擎中的文本越長(zhǎng),漏譯出現(xiàn)的頻率越大。
例5?一旦降低到泡點(diǎn)壓力,溶解氣開始從油中溢出,逸出的氣有很大的壓縮膨脹性,因此由生產(chǎn)導(dǎo)致的壓力下降將減弱。
有道譯文:Once?the?bubble?pressure?is?reduced,?the?dissolved?gas?begins?to?escape?from?the?oil,?and?the?escaping?gas?has?a?great?deal?of?compressibility?and?expansibility,?so?the?pressure?drop?caused?by?production?will?be?reduced.
譯后編輯:?Once?the?bubble?point?is?reached,?the?dissolved?gas?begins?to?escape?from?the?oil,?and?the?escaping?gas?has?a?great?deal?of?compressibility?and?expansibility,?so?the?pressure?drop?caused?by?production?will?be?reduced.
該例中,機(jī)器翻譯將“降低到”中的“到”字省略,直接按“降低”進(jìn)行翻譯,造成與原文意思上的出入。原文“泡點(diǎn)壓力”是最終要降低到的一個(gè)值,而不是這種壓力本身要降低。
3.6?漢英格式轉(zhuǎn)換不當(dāng)
符號(hào)是科技類文體傳遞信息的重要載體,合理的轉(zhuǎn)換是確保譯文質(zhì)量的前提。機(jī)器翻譯未能根據(jù)英漢習(xí)慣和表達(dá)上的差異,進(jìn)行相對(duì)應(yīng)的格式轉(zhuǎn)換。
例6?《石油工業(yè)概論》
有道譯文:Introduction?to?the?Petroleum?Industry
譯后編輯:Introduction?to?the?Petroleum?Industry
在使用常見的標(biāo)點(diǎn)符號(hào)時(shí),英文和中文是存在差異的,如句號(hào)、頓號(hào)(表示并列時(shí),中文使用頓號(hào),英文使用逗號(hào))、省略號(hào)(中文居中六個(gè)點(diǎn),英文在下方三個(gè)點(diǎn))以及書名號(hào)等符號(hào)的使用。句號(hào)和頓號(hào)機(jī)器翻譯一般可以轉(zhuǎn)化,而對(duì)于書名號(hào)這種需要對(duì)字體進(jìn)行格式上進(jìn)行的處理(斜體),翻譯引擎往往不能識(shí)別轉(zhuǎn)化。
4?漢英機(jī)器翻譯平臺(tái)目前的缺陷
(1)準(zhǔn)確性不夠。無(wú)論是詞匯,還是句法,在線翻譯平臺(tái)在處理文本時(shí)都會(huì)出現(xiàn)問(wèn)題,特別是存在較多專業(yè)術(shù)語(yǔ)以及長(zhǎng)難句時(shí),錯(cuò)誤更容易出現(xiàn)。
(2)專業(yè)性不足。翻譯專業(yè)性的文本,特別是科技類文本往往需要后臺(tái)專業(yè)詞庫(kù)的支持,當(dāng)后臺(tái)詞庫(kù)中未涉及所翻譯文本領(lǐng)域的語(yǔ)料,所翻譯的譯文必然達(dá)不到要求。
(3)技術(shù)性的局限。在線翻譯平臺(tái)對(duì)一次所翻譯文本的字?jǐn)?shù)有一定限度的要求,如處理大型翻譯任務(wù),還需要譯者提前進(jìn)行文本的切分,且在字?jǐn)?shù)限度內(nèi)的文本,翻譯質(zhì)量也會(huì)隨著一次所輸入文本量的增加而降低。
5?善譯后編輯的方法與建議
通過(guò)本次機(jī)器翻譯譯后編輯實(shí)踐,為譯者和在線翻譯平臺(tái)分別提出提升譯后編輯質(zhì)量和效率的建議:
5.1?譯者
(1)熟悉相關(guān)領(lǐng)域的專業(yè)原理。在對(duì)某領(lǐng)域?qū)I(yè)文本進(jìn)行翻譯時(shí),需要在掌握源語(yǔ)和目的語(yǔ)的基礎(chǔ)上,對(duì)該領(lǐng)域還需要有一定程度的了解。譯者在現(xiàn)實(shí)中面對(duì)不同領(lǐng)域的翻譯任務(wù)時(shí),可以在翻譯前請(qǐng)教擅長(zhǎng)相關(guān)領(lǐng)域的譯者,或自行上網(wǎng)了解涉及所翻譯領(lǐng)域的基本原理、專業(yè)術(shù)語(yǔ)、最新發(fā)展趨勢(shì)等。
(2)了解常見的錯(cuò)誤類型。機(jī)器翻譯錯(cuò)誤存在一定的規(guī)律性、系統(tǒng)性問(wèn)題,可以有針對(duì)性地進(jìn)行檢查,提高工作效率。
(3)進(jìn)行系統(tǒng)的譯前編輯。譯前編輯方法經(jīng)實(shí)踐驗(yàn)證,多在了解雙語(yǔ)差異對(duì)比的基礎(chǔ)上在錄入原文前,對(duì)譯文進(jìn)行適當(dāng)處理,減少軟件對(duì)于原文理解的偏差。
5.2?在線翻譯平臺(tái)
(1)需要進(jìn)一步拓展其后臺(tái)專業(yè)詞庫(kù),可以按不同領(lǐng)域進(jìn)行劃分,避免一些縮略語(yǔ)以及不同學(xué)科之間存在交叉的術(shù)語(yǔ)發(fā)生混淆,以提升專業(yè)術(shù)語(yǔ)翻譯的準(zhǔn)確度。
(2)在不影響翻譯正確率的前提下,拓展后臺(tái)所能翻譯文本字符數(shù)的容量,最好可以推出直接對(duì)文件整體翻譯的功能,后臺(tái)系統(tǒng)可以自主對(duì)文檔進(jìn)行切分與合并。
(3)設(shè)立譯文打分機(jī)制,也就是用戶反饋機(jī)制。在用戶使用翻譯平臺(tái)后,對(duì)生成的譯文質(zhì)量進(jìn)行打分,用戶可根據(jù)實(shí)際使用時(shí)的體驗(yàn)提出意見,平臺(tái)可收集并作為進(jìn)一步完善功能的參考。
6?結(jié)語(yǔ)
各種在線翻譯平臺(tái)的涌現(xiàn)和不斷完善,不僅給普通人的生活帶來(lái)了巨大的便利,也給翻譯從業(yè)者的工作帶來(lái)了相當(dāng)大的變化。機(jī)器翻譯不但極大地提高了翻譯工作的效率,同時(shí)憑借其龐大的后臺(tái)語(yǔ)料庫(kù)和其不斷自身學(xué)習(xí)、不斷迭代的能力,也進(jìn)一步拓寬了譯者的翻譯領(lǐng)域和工作邊界。但是,相較于人工智能目前的發(fā)展水平,人類語(yǔ)言的復(fù)雜性和模糊性,加之人類思維的多維性就注定了借助人工智能的機(jī)器翻譯目前的局限性。本文以有道在線翻譯軟件為工具,對(duì)石油科技文本進(jìn)行了漢譯英翻譯,分析梳理了譯本中常見的錯(cuò)誤類型,并在此基礎(chǔ)上分析總結(jié)了錯(cuò)誤產(chǎn)生的深層原因,以期為從事相關(guān)領(lǐng)域翻譯的從業(yè)者和從事翻譯軟件的研發(fā)者提供一些借鑒和啟發(fā)。
參考文獻(xiàn)
[1?]李沐,劉樹杰,張東東,等.機(jī)器翻譯?[M?].北京:高等教育出版社,2018:5153.
[2?]張政.機(jī)器翻譯難點(diǎn)所在?[J?].外語(yǔ)研究,2005,(05):5962.
[3?]朱慧芬,趙錦文,諸逸飛.在線機(jī)器翻譯的譯后編輯原則研究——以“八八戰(zhàn)略”為例?[J?].中國(guó)科技翻譯,2020,33(02):2427.
[4?]羅季美,李梅.機(jī)器翻譯譯文錯(cuò)誤分析?[J?].中國(guó)翻譯,2012,(5):8489.
[5?]陳勝,田傳茂.在線翻譯平臺(tái)漢英翻譯的問(wèn)題及譯后編輯——以石油地質(zhì)文獻(xiàn)為例?[J?].中國(guó)科技翻譯,2021,34(01):3134+49.
[6?]蔡欣潔,文炳.漢譯英機(jī)器翻譯錯(cuò)誤類型統(tǒng)計(jì)分析——以外宣文本漢譯英為例?[J?].浙江理工大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版),2021,46(02):162169.
[7?]黃越悅.淺談機(jī)器翻譯中譯前編輯的應(yīng)用?[J?].湖北函授大學(xué)學(xué)報(bào),2017,30(03):175176+179.