[摘 要] 近年來,人工智能與深度學(xué)習(xí)技術(shù)迅猛發(fā)展,機(jī)器翻譯步入新的階段——基于神經(jīng)網(wǎng)絡(luò)的機(jī)器翻譯。相比之前的機(jī)器翻譯,神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯在翻譯效率與質(zhì)量上有所提高,但是仍面臨著許多挑戰(zhàn),其中一個挑戰(zhàn)是神經(jīng)機(jī)器翻譯在與訓(xùn)練語料類型相同的文本中能達(dá)到良好的翻譯效果,但是一旦跨出該文本類型,翻譯性能就會急劇下降。據(jù)此,對目前的主流神經(jīng)機(jī)器翻譯引擎在地方志《祁東縣志(1986—2005)》中的翻譯進(jìn)行質(zhì)量評估,旨在通過對比各神經(jīng)機(jī)器翻譯在地方志《祁東縣志(1986—2005)》中的可用性,優(yōu)選出適用于地方志文本的神經(jīng)機(jī)器翻譯系統(tǒng),以此為機(jī)器翻譯譯后編輯工作者在機(jī)器翻譯引擎的選擇上提供參考建議,提高機(jī)器翻譯譯后編輯的效率,同時也為神經(jīng)機(jī)器翻譯系統(tǒng)的設(shè)計提供優(yōu)化方向。
[關(guān) 鍵 詞] 機(jī)器翻譯;翻譯質(zhì)量;《祁東縣志(1986—2005)》
一、機(jī)器翻譯質(zhì)量研究現(xiàn)狀
就國內(nèi)而言,筆者在CNKI中國知網(wǎng)——中國標(biāo)準(zhǔn)全文數(shù)據(jù)庫中分別以“機(jī)器翻譯質(zhì)量評估”“機(jī)器翻譯質(zhì)量評測”“機(jī)器翻譯質(zhì)量評價”“機(jī)器翻譯質(zhì)量估計”為主題進(jìn)行了4次高級檢索,共得到與本項(xiàng)目研究相關(guān)的文章38篇:中文期刊文獻(xiàn)17篇,外文期刊文獻(xiàn)3篇,碩士論文18篇。在這38篇相關(guān)研究中,有人對機(jī)器翻譯質(zhì)量評估方法進(jìn)行研究,例如,鐘文康等人提出了一種基于蛻變測試的多粒度測試框架,用于在沒有參考譯文的情況下評估神經(jīng)機(jī)器翻譯系統(tǒng)的翻譯質(zhì)量(鐘文康等,2021:1051-1066);王青和馬蕭嘗試提出一種漸進(jìn)式的機(jī)器翻譯質(zhì)量評估方法:通過借助統(tǒng)計方法、余弦相似度和文本情感分析等技術(shù),從詞匯、句子、語義和語用的宏觀層面探討機(jī)器譯文的忠實(shí)度和準(zhǔn)確性,以及從詞頻統(tǒng)計、詞語搭配、平均句長、句法分析、文本相似度、主題詞、文本情感狀態(tài)和情感傾向的微觀層面考察機(jī)器譯文的實(shí)際翻譯情況(王青、馬蕭,2020:144-151);樊宇昕等人發(fā)現(xiàn)了一種基于FrameNet和雙層優(yōu)化的譯文質(zhì)量量化評判模式(樊宇昕、安中華,2019:101-105)。有人對機(jī)器翻譯質(zhì)量評估進(jìn)行整體性研究,如馬鳴皓簡要介紹了現(xiàn)有的機(jī)器翻譯質(zhì)量評估方法(馬鳴皓,2019:76-78);秦穎則著重對機(jī)器翻譯質(zhì)量的自動化評估方法進(jìn)行了介紹(秦穎,2015:326-335)。還有人對機(jī)器翻譯在特定文本中的質(zhì)量進(jìn)行評估,比如,梁本彬和李天云以自己參加的翻譯實(shí)踐項(xiàng)目為例,展示了谷歌神經(jīng)機(jī)器翻譯在人文社科圖書翻譯方面的表現(xiàn)(梁本彬、李天云,2021:63-68);肖維青和高佳輝以TED演講為素材,對比評估了“網(wǎng)易見外”自動生成英譯中字幕與網(wǎng)易公開課字幕的質(zhì)量(肖維青、高佳輝,2020:95-105);吉奕衛(wèi)對比評估了谷歌翻譯和有道翻譯的漢語被動語態(tài)翻譯質(zhì)量(吉奕衛(wèi),2019:55-57)。此類研究涉及的文本主要有政府白皮書、財經(jīng)新聞、《經(jīng)濟(jì)學(xué)人》、《紐約時報》,所選取的研究角度有詞匯和句法錯誤分析、語內(nèi)和語外錯誤分析、機(jī)器翻譯和人工526c0101754b374b09661c4685120cbaae4e595b952129bb8f1740a9af538d1b翻譯對比錯誤分析以及基于神經(jīng)網(wǎng)絡(luò)的機(jī)器翻譯質(zhì)量分析。從研究層次來看,因?yàn)闄C(jī)器翻譯質(zhì)量評估其本身具有跨學(xué)科特征,研究集中在信息科技、哲學(xué)與人文社科、基礎(chǔ)科學(xué)三大學(xué)科。
就國外而言,有一些研究主要針對研究者自身的母語,分析英語到其母語的機(jī)器翻譯質(zhì)量評估。Wojak與Gralinski利用基于網(wǎng)絡(luò)的人工平臺對波蘭語與英語雙語譯文產(chǎn)出進(jìn)行評估(Wojak,Gralinski,2010:547-551)。Bentivogli等人在2015年國際口語翻譯系統(tǒng)評測大賽(IWSLT)中對神經(jīng)網(wǎng)絡(luò)與基于短語的機(jī)器翻譯進(jìn)行英語與德語的翻譯評測,指出神經(jīng)網(wǎng)絡(luò)模型對于翻譯中動詞的重新排列有更高的靈敏度(Bentivogli,et al,2016:257-267)。Koehn與Knowles曾針對利用神經(jīng)網(wǎng)絡(luò)英語到西語的翻譯系統(tǒng)進(jìn)行研究并評測,他們使用了法律、醫(yī)藥等專業(yè)語料進(jìn)行訓(xùn)練,測試結(jié)果顯示只有語料規(guī)模達(dá)到1500萬字以上,才能得到一個性能較好的神經(jīng)網(wǎng)絡(luò)翻譯模型(Koehn,Knowles,2017:28-39)。Toral等人對于羅曼語系、斯拉夫語系等語系中的9種語言進(jìn)行英語到該語言的翻譯質(zhì)量評估(Toral,2017:1063-1073)。盡管已有多項(xiàng)研究對基于神經(jīng)網(wǎng)絡(luò)的機(jī)器翻譯質(zhì)量進(jìn)行測評,但是其測評主要集中在同一個或者相鄰的語系之間,缺少英漢之間的機(jī)器翻譯質(zhì)量評估。
二、地方志機(jī)器翻譯質(zhì)量對比的材料和方法
本研究主要對比地方志文本在不同機(jī)器翻譯引擎中的翻譯質(zhì)量,此過程主要包括兩個步驟:一是將地方志文本輸入不同的機(jī)器翻譯引擎,得到用于對比這些機(jī)器翻譯質(zhì)量的材料,即不同的機(jī)器譯文;二是用人工評估方法對機(jī)器譯文的質(zhì)量進(jìn)行對比評估。
(一)機(jī)器翻譯質(zhì)量對比的材料
本研究選用地方志《祁東縣志(1986—2005)》作為原文本?!镀顤|縣志(1986—2005)》由祁東縣志編纂委員會編輯、方志出版社出版,記述湖南省祁東縣1986—2005年這一歷史階段的自然、政治、經(jīng)濟(jì)、文化、社會等方面的發(fā)展面貌,體裁以記述體為主,語言客觀平實(shí)。將原文本輸入7個主流的機(jī)器翻譯引擎:搜狗翻譯、谷歌翻譯、有道翻譯、微軟翻譯、百度翻譯、騰訊翻譯君、DeepL翻譯,得到本研究用于機(jī)器翻譯質(zhì)量對比的材料,即七篇機(jī)器譯文。
(二)機(jī)器翻譯質(zhì)量對比的方法
本研究采用人工評估的方法對比各機(jī)器譯文的質(zhì)量,其中人工評估方法選用的評估標(biāo)準(zhǔn)是目前廣泛使用的DQF動態(tài)質(zhì)量評估框架,具體的操作流程如下:
第一,選擇測試文本,即在本報告節(jié)選的《祁東縣志(1986—2005)》第十六篇第一章文化事業(yè)的第一節(jié)至第四節(jié)中選擇用于測試機(jī)器翻譯引擎質(zhì)量的文本。測試文本既要具備原文本的特點(diǎn),保證測試結(jié)果的可用性;又不能太長,保護(hù)測試過程的高效性。因此,本報告選擇第三節(jié)的第一段作為測試文本,該段落主要介紹祁東縣祁劇演出的演職員隊伍,段落長度為254個漢字。測試文本標(biāo)記為ST’,如圖1所示。
第二,輸出評測譯文,即依次將測試文本ST’輸入搜狗翻譯、谷歌翻譯、有道翻譯、微軟翻譯、百度翻譯、騰訊翻譯君、DeepL翻譯中,輸出這7個機(jī)器翻譯引擎所對應(yīng)的7個版本的譯文,分別記為TT1、TT2、TT3、TT4、TT5、TT6、TT7。
第三,對機(jī)器翻譯譯文進(jìn)行翻譯質(zhì)量評估,即評估人員對機(jī)器譯文TT1、TT2、TT3、TT4、TT5、TT6、TT7的質(zhì)量進(jìn)行評估。此次評估的評估者是8名來自湖南師范大學(xué)外國語學(xué)院MTI專業(yè)的研三學(xué)生,評估者均已通過CATTI英語筆譯二級考試,具備優(yōu)秀的翻譯能力,且上過計算機(jī)輔助翻譯課,了解機(jī)器翻譯相關(guān)知識。8位評估者分別編號為P1、P2、P3、P4、P5、P6、P7、P8。此次評估的評估標(biāo)準(zhǔn)是翻譯自動化用戶協(xié)會(TAUS)推出的DQF動態(tài)質(zhì)量評估框架,DQF動態(tài)質(zhì)量評估框架對機(jī)器翻譯質(zhì)量給出了兩個評估屬性:準(zhǔn)確度和流暢度。準(zhǔn)確度指原文本的意義在目標(biāo)譯文中的表達(dá)程度;流暢度指譯文的語法、拼寫、通用術(shù)語和名稱能被母語者接受并理解的程度(TAUS,2015: 12)。8位評估者對機(jī)器譯文的流暢度和準(zhǔn)確度進(jìn)行打分,流暢度和準(zhǔn)確度的分?jǐn)?shù)設(shè)置均為1-5分,1分表示譯文非常不流暢、準(zhǔn)確度很低,5分表示譯文十分流暢、準(zhǔn)確度很高。據(jù)此,將評估者Pn(n=1, 2, 3, 4, 5, 6, 7, 8)給ST’的機(jī)器翻譯譯文TT1~TT7的流暢度分?jǐn)?shù)記作Fn1、Fn2、Fn3、Fn4、Fn5、Fn6、Fn7,將評估者Pn(n=1, 2, 3, 4, 5, 6, 7, 8)給ST’的機(jī)器翻譯譯文TT1~TT7的準(zhǔn)確度分?jǐn)?shù)記作An1、An2、An3、An4、An5、An6、An7。
三、地方志機(jī)器翻譯質(zhì)量對比的結(jié)果分析
8位評估者給7個機(jī)器翻譯譯文的流暢度評分情況如表1所示,準(zhǔn)確度評分情況如表2所示。
那么Fn1、Fn2、Fn3、Fn4、Fn5、Fn6、Fn7(n=1, 2, 3,4, 5, 6, 7, 8)就分別為搜狗翻譯、谷歌翻譯、有道翻譯、微軟翻譯、百度翻譯、騰訊翻譯君、DeepL翻譯在ST’中的翻譯流暢度。同樣地,An1、An2、An3、An4、An5、An6、An7(n=1, 2, 3, 4, 5, 6, 7, 8)就分別為搜狗翻譯、谷歌翻譯、有道翻譯、微軟翻譯、百度翻譯、騰訊翻譯君、DeepL翻譯在ST’中的翻譯準(zhǔn)確度。7個機(jī)器翻譯引擎在ST’中的翻譯流暢度和準(zhǔn)確度情況如圖2所示。
由圖2可以看出,在流暢度方面,TT2是7個機(jī)器譯文中最流暢的,而TT7和TT3的流暢度相對較低,剩余4個機(jī)器譯文TT1、TT4、TT5、TT6的流暢度相差不大。在準(zhǔn)確度方面,TT2和TT5的準(zhǔn)確度相同,而TT7和TT3的準(zhǔn)確度相對較低,其他3個機(jī)器譯文的準(zhǔn)確度沒有表現(xiàn)出明顯的差異。綜上所述,從流暢度和準(zhǔn)確度兩方面來看,TT2是7個機(jī)器譯文中表現(xiàn)最好的。因此,在搜狗翻譯、谷歌翻譯、有道翻譯、微軟翻譯、百度翻譯、騰訊翻譯君、DeepL翻譯這7個機(jī)器翻譯引擎中,輸出TT2的谷歌翻譯是最適合《祁東縣志(1986—2005)》的機(jī)器翻譯引擎,所以本報告選擇谷歌翻譯作為此次翻譯任務(wù)的機(jī)器翻譯引擎。
四、結(jié)論
從基于規(guī)則到基于實(shí)例、基于統(tǒng)計,再到基于神經(jīng)網(wǎng)絡(luò),機(jī)器翻譯確已取得較大進(jìn)步,在翻譯方面的表現(xiàn)可圈可點(diǎn)。在此次翻譯實(shí)踐中,報告者采用“機(jī)器翻譯+譯后編輯”的模式翻譯《祁東縣志(1986—2005)》,首先報告者以DQF動態(tài)質(zhì)量評估框架為評價標(biāo)準(zhǔn),對比七個主流的機(jī)器翻譯引擎:搜狗翻譯、谷歌翻譯、有道翻譯、微軟翻譯、百度翻譯、騰訊翻譯君、DeepL翻譯在《祁東縣志(1986—2005)》中的譯文質(zhì)量,最終以譯文準(zhǔn)確度和流暢度都相對較高的谷歌翻譯引擎為工具,對《祁東縣志(1986—2005)》第十六篇第一章的第一至四節(jié)進(jìn)行機(jī)器預(yù)翻譯,并在機(jī)器譯文的基礎(chǔ)上進(jìn)行人工編輯,最終翻譯定稿。作為業(yè)內(nèi)領(lǐng)先的線上翻譯平臺之一,在此次翻譯實(shí)踐中,谷歌翻譯在通用專有名詞與簡單句的處理上表現(xiàn)良好,報告者可直接采用機(jī)器譯文或僅進(jìn)行簡單的譯后編輯即可,有效提高了筆者的翻譯效率,節(jié)約了時間成本。
近年來,人工智能與機(jī)器翻譯技術(shù)迅猛發(fā)展,機(jī)器翻譯的應(yīng)用率呈大幅增長趨勢。盡管機(jī)器翻譯的表現(xiàn)愈來愈佳,但機(jī)器始終無法代替人腦。因而,人機(jī)結(jié)合的翻譯模式才能最大限度地發(fā)揮兩者的優(yōu)勢,實(shí)現(xiàn)效率與質(zhì)量的平衡。目前,越來越多的人采用“機(jī)器翻譯+譯后編輯”的翻譯模式。在信息井噴、翻譯需求劇增的大環(huán)境下,譯者有必要掌握靈活運(yùn)用翻譯工具的能力,提高信息檢索與譯后編輯的能力,以適應(yīng)時代所需。
參考文獻(xiàn):
[1]陳明瑤,邱輝. 從語篇的銜接與連貫論《中國的環(huán)境保護(hù)》(白皮書)的英譯[J]. 上海翻譯,2009(1):20-24.
[2]崔啟亮. 論機(jī)器翻譯的譯后編輯[J]. 中國翻譯, 2014,35(6):68-73.
[3]馮全功,崔啟亮. 譯后編輯研究:焦點(diǎn)透析與發(fā)展趨勢[J]. 上海翻譯,2016(6):67-74,89,94.
[4]方夢之. 應(yīng)用翻譯研究:原理、策略與技巧[M]. 上海:上海外語教育出版社,2013:184.
[5]黃國文. 語篇分析概要[M]. 長沙: 湖南教育出版社, 1988:11.
[6]黃河燕, 陳肇雄. 一種智能譯后編輯器的設(shè)計及其實(shí)現(xiàn)算法[J]. 軟件學(xué)報,1995(3):129-135.
[7]李梅, 朱錫明. 譯后編輯自動化的英漢機(jī)器翻譯新探索[J]. 中國翻譯,2013,34(4):83-87.
[8]李運(yùn)興. 英漢語篇翻譯[M]. 北京: 清華大學(xué)出版社, 2011.
[9]羅季美,李梅. 機(jī)器翻譯譯文錯誤分析[J]. 中國翻譯,2012,33(5):84-89.
作者單位:湖南師范大學(xué)外國語學(xué)院