趙足娥 吳年利 李培隆
摘? 要: 論文、學(xué)術(shù)著作中外文資料比例越來越大,學(xué)習(xí)先進(jìn)的技術(shù)知識(shí)需要更高的英語(yǔ)水平。而人工翻譯成本高、效率低,已經(jīng)無法適應(yīng)發(fā)展需求,于是需要在科技英語(yǔ)的輔助系統(tǒng)上尋求突破口。Trados作為現(xiàn)今主流輔助翻譯軟件,可大幅度提高翻譯效率和質(zhì)量,同時(shí)降低翻譯成本。文中基于Trados系統(tǒng)研究一種適應(yīng)科技英語(yǔ)特性的高效輔助系統(tǒng)設(shè)計(jì),提出翻譯記憶模型,采用精準(zhǔn)對(duì)齊的方式實(shí)現(xiàn)記憶庫(kù)查詢與校驗(yàn)操作。同時(shí)建立相似度規(guī)劃算法,以“編輯距離”估算語(yǔ)言模糊匹配,實(shí)現(xiàn)更貼近語(yǔ)境語(yǔ)義的翻譯效果。最后進(jìn)行語(yǔ)料翻譯測(cè)試,其數(shù)據(jù)結(jié)果表明,該種基于Trados平臺(tái)開發(fā)的輔助翻譯系統(tǒng)在科技英語(yǔ)翻譯方面,詞法準(zhǔn)確率與專業(yè)性均較高。
關(guān)鍵詞: Trados平臺(tái); 輔助翻譯; 系統(tǒng)設(shè)計(jì); 科技英語(yǔ); 翻譯記憶模型; 翻譯測(cè)試
Abstract: Due to the increasing proportion of foreign language materials in papers and academic works, learning advanced technical knowledge requires a higher level of English. In allusion to the manual translation can no longer meet the development needs on account of the high cost and low efficiency, a breakthrough in the auxiliary system of the scientific English need to be found. As the mainstream assistive translation software, Trados can greatly improve translation efficiency and quality while reducing translation costs. A design of the efficient auxiliary system adapted to the features of scientific English is studied based on the Trados system. The translation memory model is proposed, and the memory query and verify operation are achieved by means of the precise alignment method. The similarity programming algorithm is established, and the language fuzzy matching is estimated by "editing distance", so as to achieve the translation effect that is closer to the context semantics. The translation test of corpus was conducted. The data results show that the auxiliary translation system developed based on the Trados platform has a higher lexical accuracy and professionalism in the translation of scientific English.
Keywords: Trados platform; aided translation; system design; scientific English; translation memory model; translation test
0? 引? 言
隨著世界一體化發(fā)展趨勢(shì),各國(guó)交流日益密切,學(xué)術(shù)圈子已經(jīng)覆蓋到全球各國(guó)。而科技英語(yǔ)作為學(xué)術(shù)通用語(yǔ)言,其翻譯質(zhì)量決定著學(xué)術(shù)思想、成果的傳遞效率。傳統(tǒng)的純?nèi)斯しg成本代價(jià)過高且效率低,無法滿足日益增長(zhǎng)的翻譯需求[1]。再加上萬物互聯(lián)時(shí)代下,人工智能大數(shù)據(jù)的蓬勃發(fā)展,計(jì)算機(jī)翻譯已然成為發(fā)展的必然趨勢(shì),也是翻譯效率提升的突破口。為此,人們對(duì)現(xiàn)行的輔助翻譯系統(tǒng)提出了新的需求。
現(xiàn)今,國(guó)內(nèi)主流輔助翻譯軟件有SDL Trados,DAVU,CAT等,其中Trados市場(chǎng)占有率最高[2],達(dá)到78%。另外,Trados充分利用了“翻譯記憶”的理念,將翻譯過的文本儲(chǔ)存到記憶庫(kù)中,遇到類似的文本便可綜合以前的翻譯結(jié)果,從而得到更加精準(zhǔn),且貼合語(yǔ)義的翻譯結(jié)果。結(jié)合計(jì)算機(jī)強(qiáng)大的儲(chǔ)存與檢索能力,其記憶庫(kù)的樣本可以無限增長(zhǎng),從而實(shí)現(xiàn)類學(xué)習(xí)模型的翻譯質(zhì)量提升[3]。本文基于Trados這一良好的系統(tǒng)平臺(tái),進(jìn)一步開發(fā)符合科技英語(yǔ)特性的輔助系統(tǒng),來尋求更高效、高質(zhì)的論文翻譯方法。
1? 系統(tǒng)關(guān)鍵模塊分析
1.1? 翻譯記憶庫(kù)
記憶數(shù)據(jù)庫(kù)負(fù)責(zé)對(duì)已翻譯、待翻譯的文本進(jìn)行儲(chǔ)存記憶或再提取,是系統(tǒng)的核心模塊,也是系統(tǒng)實(shí)現(xiàn)更高翻譯質(zhì)量的分析依據(jù)。其按照類別又可細(xì)分為句料庫(kù)和術(shù)語(yǔ)庫(kù)。每次翻譯流程中,相似度計(jì)算、內(nèi)容檢索、譯文翻譯和修正均要圍繞著翻譯記憶庫(kù)實(shí)現(xiàn)[4]。可以說記憶庫(kù)的數(shù)據(jù)管理、分類方式是系統(tǒng)性能的直接關(guān)聯(lián)因素,需要合理規(guī)劃。本文依據(jù)科技英語(yǔ)句式分布和詞匯頻率特性,設(shè)計(jì)一種根據(jù)句子級(jí)別對(duì)齊的分類方式。記憶庫(kù)結(jié)構(gòu)設(shè)計(jì)如表1所示。
此外,本模塊還需完成相應(yīng)的信息檢索、添加、增刪等操作。同時(shí),數(shù)據(jù)庫(kù)需要?jiǎng)討B(tài)更新、實(shí)時(shí)提取,以保持較高的文本活性。
1.2? 翻譯檢索模塊
翻譯檢索模塊是為了簡(jiǎn)化翻譯匹配流程,提升翻譯質(zhì)量和速度的參考模塊。具體流程為,首先,從記憶庫(kù)中檢索得到歷史文本,通過相似度匹配翻譯句式。檢索得到的實(shí)例越貼合待翻譯句子,則前期的句式與詞法翻譯過程將得到更大程度的簡(jiǎn)化。
檢索機(jī)制的核心在于相似度匹配算法,本文采用“最短編輯距離”來估算并劃分相似程度[5]。由于科技英語(yǔ)具備用詞精準(zhǔn)、規(guī)范術(shù)語(yǔ)、措辭正式、科學(xué)嚴(yán)謹(jǐn)、邏輯性以及專業(yè)性強(qiáng)的特點(diǎn),且部分語(yǔ)句還具有獨(dú)特的詞匯體系和句法特征。因此,詞匯量大、句段間關(guān)系復(fù)雜、知識(shí)高度細(xì)化、層次清晰、關(guān)系緊密。這也使得對(duì)翻譯的精準(zhǔn)度和語(yǔ)境語(yǔ)義貼合度要求極高,否則將無法精確解析句子表達(dá)的含義。以此為前提,本輔助翻譯系統(tǒng)在檢索匹配模塊句子時(shí),采用模糊匹配算法,通過相似度提高準(zhǔn)確性。如,A,B兩句子間的相似度計(jì)算公式為:
式中:A代表目標(biāo)翻譯句子;B代表記憶庫(kù)歷史參考翻譯。
1.3? 翻譯編輯環(huán)境
翻譯編輯環(huán)境為系統(tǒng)的前端部分,主要提供給翻譯人員內(nèi)部數(shù)據(jù)記憶庫(kù)的入口和過濾器操作,對(duì)應(yīng)格式文件的錄入與系統(tǒng)自動(dòng)的句段分割、句法分析等。也可以稱之為系統(tǒng)預(yù)編譯或預(yù)處理模塊,其功能旨在提供前期的準(zhǔn)備工作,簡(jiǎn)化人工校驗(yàn)的流程[6]。此外,在系統(tǒng)編輯環(huán)境下,可一鍵實(shí)現(xiàn)模糊匹配篩選。通過二分法查找已有詞匯,自動(dòng)匹配相似句子或短語(yǔ),插入譯文提供給翻譯人員。經(jīng)人工修正后,可導(dǎo)出為源文檔格式譯文。
2? 系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)
2.1? 系統(tǒng)流程設(shè)計(jì)
系統(tǒng)整體采用C#實(shí)現(xiàn),數(shù)據(jù)存儲(chǔ)于SQL Server中,運(yùn)行主界面由Bootstrap和Jquery搭建可視區(qū)域[7]。根據(jù)功能劃分為三部分,分別為左上的記憶庫(kù)動(dòng)態(tài)匹配句段、右上的參考詞匯表和下部的輔助參考譯文。這一部分可直接編輯修改譯文,或添加新的翻譯段落。此外,系統(tǒng)支持記憶庫(kù)的句段查詢和詞匯表查詢,從而省去了再通過其他途徑查詢術(shù)語(yǔ)詞匯的過程。系統(tǒng)整體風(fēng)格簡(jiǎn)易,使用功能明確。
目標(biāo)翻譯文本錄入系統(tǒng)后,其翻譯流程如圖1所示。
待譯文本通過系統(tǒng)識(shí)別,確定文本類型后,經(jīng)由預(yù)處理模塊詞法解析和預(yù)編譯后產(chǎn)出第一次翻譯樣例。原文與翻譯文本句子對(duì)齊存儲(chǔ)方式為:XML語(yǔ)言編碼,以“翻譯單元”形式存儲(chǔ),文本和翻譯待定項(xiàng)逐一對(duì)應(yīng),通過ID標(biāo)記進(jìn)行描述[8]。此外,可調(diào)用Trados檢索模塊和記憶庫(kù),自動(dòng)建立語(yǔ)料信息資源庫(kù),再引用Trados自帶的術(shù)語(yǔ)庫(kù)進(jìn)行功能管理,從而可進(jìn)一步提高產(chǎn)出效率和匹配精準(zhǔn)度[9]。
2.2? 測(cè)試用例分析
本文從1 000份的語(yǔ)料中隨機(jī)抽取了多份語(yǔ)料文獻(xiàn),文章類型涵蓋了大部分的科技英語(yǔ)形式,并將其分為3大類。其中測(cè)試集1為旅游、財(cái)經(jīng)類內(nèi)容,測(cè)試集2為科技類內(nèi)容,測(cè)試集3為娛樂類內(nèi)容,每個(gè)測(cè)試集隨機(jī)選取6份不同數(shù)量的語(yǔ)料文件進(jìn)行測(cè)試。此外,討論內(nèi)容也選取不同方向,力求進(jìn)行一次全面測(cè)試。對(duì)語(yǔ)料進(jìn)行過濾分類后,通過輔助翻譯系統(tǒng)進(jìn)行語(yǔ)段詞法解析。直接收集分類結(jié)果,統(tǒng)計(jì)準(zhǔn)確率、精確率、語(yǔ)境貼合度等評(píng)價(jià)指標(biāo)[10],其結(jié)果匯總?cè)绫?所示。
從表中可知,分類準(zhǔn)確率最高可達(dá)90%左右,且詞法精確率有83%。各分支類型中較為生僻的旅游、財(cái)經(jīng)平均翻譯精準(zhǔn)度最低,但仍有80%的詞法精準(zhǔn)率。由此反映出,本文所提出的基于Trados平臺(tái)開發(fā)適用于科技英語(yǔ)領(lǐng)域的輔助翻譯系統(tǒng)具備較好的適用度及可擴(kuò)展性。其只要將記憶庫(kù)中的參考譯文進(jìn)行再豐富,并加強(qiáng)生僻冷門術(shù)語(yǔ)和學(xué)科的詞法引用,翻譯的精準(zhǔn)度將會(huì)大幅提升,達(dá)到學(xué)術(shù)級(jí)要求。
3? 結(jié)? 語(yǔ)
本文提出一種搭建在Trados輔助翻譯系統(tǒng)平臺(tái)上的、適應(yīng)科技英語(yǔ)特性的語(yǔ)料翻譯系統(tǒng)。系統(tǒng)旨在實(shí)現(xiàn)對(duì)學(xué)術(shù)性、專業(yè)性、精準(zhǔn)率要求均較高的學(xué)術(shù)論文或?qū)W術(shù)著作的高質(zhì)輔助翻譯。尤其對(duì)于歷史記憶語(yǔ)段豐富的詞法結(jié)構(gòu),可保證絕對(duì)準(zhǔn)確的翻譯和語(yǔ)境貼合度,大幅減少了人工成本投入。文中從系統(tǒng)的核心模塊分析,關(guān)鍵技術(shù)討論著手,細(xì)致說明了系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)過程。最終以實(shí)例數(shù)據(jù)結(jié)果表明,本系統(tǒng)具備較高的輔助翻譯質(zhì)量和準(zhǔn)確率,可充分滿足學(xué)術(shù)專業(yè)文獻(xiàn)的翻譯需求,且具備良好的擴(kuò)展與二次開發(fā)性。
參考文獻(xiàn)
[1] 錢多秀.計(jì)算機(jī)輔助翻譯[M].北京:外語(yǔ)教學(xué)與研究出版社,2011.
[2] 李丹,許霄羽,楊悅.基于語(yǔ)義網(wǎng)技術(shù)的網(wǎng)絡(luò)機(jī)器翻譯研究[J].現(xiàn)代電子技術(shù),2011,34(4):107?109.
[3] 李長(zhǎng)栓.非文學(xué)翻譯[M].北京:外語(yǔ)教學(xué)與研究出版社,2009.
[4] 宋淑彩,龐慧,丁學(xué)鈞.GA?SVM算法在文本分類中的應(yīng)用研究[J].計(jì)算機(jī)仿真,2011,28(1):222?225.
[5] 諶婉瑩.TRADOS翻譯軟件運(yùn)用中術(shù)語(yǔ)收詞問題研究[D].重慶:重慶大學(xué),2016.
[6] 郭轉(zhuǎn)輝.TRADOS翻譯科技英語(yǔ)的譯文質(zhì)量測(cè)評(píng)[D].重慶:重慶大學(xué),2011.
[7] 李偉.Trados輔助翻譯軟件在科技英語(yǔ)翻譯中的應(yīng)用[D].武漢:華中師范大學(xué),2012.
[8] 王曉鳳,張建偉.科技詞匯的范疇化動(dòng)因及其語(yǔ)義認(rèn)知與翻譯[J].中國(guó)科技翻譯,2011,24(4):1?4.
[9] 閆冰.TRADOS在促進(jìn)譯者快速學(xué)習(xí)和提高翻譯產(chǎn)出效率方面的積極作用[D].上海:上海外國(guó)語(yǔ)大學(xué),2012.
[10] 吳承鳳,劉濤.機(jī)器翻譯中的多模糊語(yǔ)義自動(dòng)判斷方法研究[J].現(xiàn)代電子技術(shù),2017,40(14):75?77.
[11] 于佳弘,莊天賜,昌雨葒.淺談Trados輔助翻譯軟件和語(yǔ)料庫(kù)在公開課英文字幕翻譯中的應(yīng)用[J].知識(shí)經(jīng)濟(jì),2019(36):103.