廉勇
承德石油高等??茖W(xué)校
計(jì)算機(jī)輔助翻譯核心技術(shù)現(xiàn)狀簡析
廉勇
承德石油高等專科學(xué)校
本文通過對翻譯記憶技術(shù)實(shí)質(zhì)和現(xiàn)狀分析得出了阻礙其發(fā)展的三種矛盾和緩解方式,指出了計(jì)算機(jī)輔助翻譯未來發(fā)展的方向。
翻譯記憶 數(shù)據(jù)庫模型 引用模型 三種矛盾 緩解方式
計(jì)算機(jī)輔助翻譯系統(tǒng)的核心是“翻譯記憶”技術(shù),它的發(fā)展及重大突破無疑會引領(lǐng)計(jì)算機(jī)輔助翻譯技術(shù)的革命,使其跨入新的時(shí)代。
“翻譯記憶”技術(shù),是將已翻譯過的源語與目標(biāo)語對照的文本存入記憶庫中,可再利用于翻譯新的源語文本。然而現(xiàn)實(shí)中的翻譯活動種類繁多,層次多樣,變化多端,重復(fù)性較少,只有在某些專門的領(lǐng)域中,才有一定的文本重復(fù)率,翻譯記憶功能才能有效發(fā)揮。由于語言有無限生成能力,即便是翻譯記憶庫的內(nèi)容再多,模糊搜索的能力再強(qiáng),仍然無法保證在進(jìn)行新的翻譯工作時(shí)總能從翻譯記憶庫中調(diào)取語料供譯者參考。
通過對可獲得的計(jì)算機(jī)輔助翻譯系統(tǒng)軟件進(jìn)行歷時(shí)與共時(shí)的研究,不難發(fā)現(xiàn),雖然現(xiàn)在的計(jì)算機(jī)輔助翻譯系統(tǒng)軟件對翻譯的輔助功能不斷增強(qiáng),讓翻譯的分工越來越細(xì),越來越精,團(tuán)隊(duì)協(xié)作性也越來越強(qiáng),較過去增加了諸如對齊、項(xiàng)目流程管理、質(zhì)量保證和術(shù)語提取等多種強(qiáng)大的功能組件與工具,CAT評價(jià)標(biāo)準(zhǔn)、翻譯項(xiàng)目科學(xué)化管理、校對系統(tǒng)等也有長足進(jìn)步,但是其核心的翻譯記憶技術(shù)卻尚未取得突破性的進(jìn)展,其檢索能力并沒有實(shí)現(xiàn)質(zhì)的飛躍,從而阻止了計(jì)算機(jī)輔助翻譯技術(shù)實(shí)現(xiàn)革命性的突破。以下筆者結(jié)合蘇明陽的觀點(diǎn)和翻譯記憶技術(shù)發(fā)展的現(xiàn)狀對這方面進(jìn)行了簡析(蘇明陽:2007)。
“引用模型”和“數(shù)據(jù)庫模型”的翻譯記憶研究沒有實(shí)質(zhì)性進(jìn)展?,F(xiàn)代研究表明,兩種模型各有優(yōu)勢和不足。它們各自的不足中,有的擁有一定的互補(bǔ)性,如原文和譯文的完整性在數(shù)據(jù)庫模型下被打破并拆散,而在引用模型下文本的完整性卻可以得到留存;而有的缺憾則是兩種模型都無法解決的。如在對語塊或亞句段單位的檢索中,數(shù)據(jù)庫模型下的翻譯記憶系統(tǒng)是以句段為檢索單位的,檢索無法深入到句段以下的層次如亞句段單位,尤其是在漢英互譯中,由于英語和漢語隸屬于截然不同的語系(英語屬于印歐語系,漢語屬于漢藏語系),英語注重形合,漢語注重意合,在譯文中往往英語的一句話會被譯成多句漢語,而漢語的一個短語或成語也會被譯成一句或多句英語。而引用翻譯記憶數(shù)據(jù)存儲方式下檢索雖不受翻譯單元的局限,產(chǎn)生的無用信息卻相對較多(Gow 2003:38),從而大大降低了翻譯的效率。兩者都沒有在深層檢索上實(shí)現(xiàn)實(shí)質(zhì)性突破。
雖然研究人員試圖以語言學(xué)為突破口,通過增強(qiáng)語言檢索技術(shù)來發(fā)展第二代翻譯記憶技術(shù),從而實(shí)現(xiàn)計(jì)算機(jī)輔助翻譯技術(shù)的實(shí)質(zhì)性突破,但是因?yàn)橐韵聝蓚€原因,翻譯記憶數(shù)據(jù)在數(shù)據(jù)庫中仍然僵硬死板,未得到充分而有效的利用,從而限制了對翻譯記憶從廣度和深度的多角度靈活應(yīng)用:其一,以語言學(xué)為突破口的檢索技術(shù)提升極其依賴特定語言的語言學(xué)知識與資源,從而建庫難度極大;其二,當(dāng)前的翻譯記憶語料絕大部分沒有語言學(xué)上的標(biāo)記,TMX作為翻譯記憶數(shù)據(jù)儲存交換標(biāo)準(zhǔn),雖是以數(shù)據(jù)庫模型為基礎(chǔ),但它也未針對此方面的問題進(jìn)行擴(kuò)展或規(guī)定。
通過以上的分析不難得出翻譯記憶的發(fā)展因語言的重復(fù)而奏效與語言無限生成之間的矛盾,兩種翻譯記憶數(shù)據(jù)存儲模型雖然功能互補(bǔ)但卻無法完全兼容的矛盾以及記憶數(shù)據(jù)的僵硬死板與語言靈活多變之間的矛盾,這三種矛盾未能有效解決是構(gòu)成計(jì)算機(jī)輔助翻譯技術(shù)未取得突破性、革命性進(jìn)展的的主因。所以,計(jì)算機(jī)輔助翻譯技術(shù)的發(fā)展必然要盡可能克服這三種矛盾且另辟蹊徑:
(1)翻譯記憶語料資源的“中央”化趨勢與分布式云端翻譯記憶庫和術(shù)語庫的產(chǎn)生密切相關(guān),這兩種趨勢的形成與中央服務(wù)器的超大型數(shù)據(jù)庫的建立,知識產(chǎn)權(quán)的保護(hù),分布式技術(shù)以及云計(jì)算技術(shù)的發(fā)展息息相關(guān),在一定程度上會緩解第一個矛盾,使得個人應(yīng)用翻譯記憶庫時(shí)不再為“無限生成的語言”發(fā)愁,因?yàn)橹醒霐?shù)據(jù)庫已經(jīng)最大限度的通過“大數(shù)據(jù)”涵蓋了“無限生成的語言”并且通過“云端”與用戶互動共享(通過協(xié)議,用戶的優(yōu)質(zhì)語言素材也可隨時(shí)通過“云端”被中央數(shù)據(jù)庫吸納以供其他用戶參考使用)。
(2)隨著人工智能和云計(jì)算技術(shù)的突飛猛進(jìn),深層檢索分析技術(shù)、語音智能識別技術(shù)等,自然使得翻譯記憶向開發(fā)翻譯記憶的語料深層檢索和翻譯記憶庫從筆譯服務(wù)走向口譯服務(wù)發(fā)展,使得計(jì)算機(jī)輔助翻譯系統(tǒng)向著智能化與自適應(yīng)方向發(fā)展,在一定程度上會緩解第二個矛盾,使研究人員將翻譯記憶技術(shù)研究的突破口從語言學(xué)轉(zhuǎn)向人工智能,讓人工智能技術(shù)的深入和普及帶動兩種翻譯記憶數(shù)據(jù)存儲模型的自我完善和突破,從而推動新模型的產(chǎn)生和CAT軟件的全方面智能化提升。
(3)MT與CAT歷時(shí)與共時(shí)的承前啟后、相互獨(dú)立、相輔相成的關(guān)系自然也決定了機(jī)器翻譯與翻譯記憶的共時(shí)性發(fā)展趨勢,高質(zhì)量的并可作為語料庫的翻譯記憶系統(tǒng)自然也可以應(yīng)用于基于統(tǒng)計(jì)與實(shí)例的機(jī)器翻譯系統(tǒng),所以第三個矛盾也會在一定程度上得到緩解,因?yàn)闄C(jī)器翻譯相對僵硬死板,而計(jì)算機(jī)輔助翻譯因?yàn)橐匀藶橹黧w所以靈活多變,再加上人工智能和云計(jì)算技術(shù)的突飛猛進(jìn)趨勢更使緩解這一矛盾如虎添翼。
[1]象群網(wǎng)論壇 http://www.xiangqun.net/forum
[2]蘇明陽. 2007.翻譯記憶系統(tǒng)的現(xiàn)狀及其啟示. 外語研究
[3]Gow, Francie. 2003. Metrics for Evaluating Translation Memory Software[D]. University of Ottawa, 34-38
本文系2015年承德市科學(xué)技術(shù)研究與發(fā)展計(jì)劃項(xiàng)目《基于Trados翻譯平臺的承德市旅游文化翻譯項(xiàng)目集約增效管理研究》的部分研究成果,項(xiàng)目編號:20153020。
廉勇(1980-),承德石油高等??茖W(xué)校英語教師,中國科學(xué)技術(shù)大學(xué)碩士研究生,從事英語翻譯、教學(xué)與研究工作。