陸芙蓉,呂 樂(lè)
(上海理工大學(xué) 上海 200090)
機(jī)器翻譯軟件的適用性與局限性分析
陸芙蓉,呂 樂(lè)
(上海理工大學(xué) 上海 200090)
本文介紹了機(jī)器翻譯軟件的原理,敘述了翻譯軟件的誕生背景以及發(fā)展至今的技術(shù)狀況。隨著各種新技術(shù)的發(fā)展,機(jī)器翻譯軟件不僅在日常工作生活中得到了廣泛應(yīng)用,也極大拓展了翻譯的應(yīng)用形式。分析了機(jī)器翻譯軟件在不同需求下的適用性和局限性,并對(duì)其發(fā)展前景進(jìn)行展望。
機(jī)器翻譯軟件;適用性;局限性
機(jī)器翻譯是利用計(jì)算機(jī)技術(shù)智能化地把一種語(yǔ)言轉(zhuǎn)換成另一種語(yǔ)言的過(guò)程。1954年IBM公司首次完成了俄英雙語(yǔ)機(jī)器翻譯的實(shí)驗(yàn)。隨后,很多國(guó)家,如前蘇聯(lián)、英國(guó)、日本、中國(guó)等也相繼進(jìn)行了機(jī)器翻譯試驗(yàn)。如今,市場(chǎng)上已出現(xiàn)了多種基于不同原理的機(jī)器翻譯軟件。
很多學(xué)者都對(duì)機(jī)器翻譯的技術(shù)原理進(jìn)行了分類,總體可以將機(jī)器翻譯系統(tǒng)從方法上大致分為四類:基于規(guī)則的機(jī)器翻譯、基于實(shí)例的機(jī)器翻譯、基于統(tǒng)計(jì)的機(jī)器翻譯和混合式機(jī)器翻譯。基于不同原理的翻譯軟件各有所長(zhǎng),譯者可根據(jù)不同的翻譯需求合理選取這些機(jī)器翻譯軟件。
基于規(guī)則是通過(guò)語(yǔ)法、語(yǔ)義等語(yǔ)言習(xí)慣約定一種規(guī)則,通過(guò)對(duì)源語(yǔ)言語(yǔ)句的此法、語(yǔ)義、語(yǔ)法和句法進(jìn)行判斷分析,按照一定的規(guī)則重新排列組合,生成目標(biāo)語(yǔ)言?;谝?guī)則的機(jī)器翻譯系統(tǒng)擅長(zhǎng)于翻譯符合規(guī)則的內(nèi)容,翻譯的質(zhì)量較高,然而有效規(guī)則的形成過(guò)程通常具有很高難度。而基于實(shí)例的機(jī)器翻譯的本質(zhì)是“以翻譯實(shí)例為基礎(chǔ),基于相似原理的機(jī)器翻譯”,這種實(shí)例既可以是不加修飾的翻譯原型,也可以是一種經(jīng)過(guò)加工的翻譯實(shí)例?;诮y(tǒng)計(jì)的機(jī)器翻譯技術(shù)本質(zhì)上也是一種基于語(yǔ)料庫(kù)的翻譯技術(shù),它可以將語(yǔ)料庫(kù)中的實(shí)例抽象成一種統(tǒng)計(jì)模型,翻譯過(guò)程即為對(duì)這種統(tǒng)計(jì)模型的重新解碼?;诮y(tǒng)計(jì)的機(jī)器翻譯系統(tǒng)具有通用性,自動(dòng)從語(yǔ)料庫(kù)中學(xué)習(xí)語(yǔ)言知識(shí),這種翻譯技術(shù)通過(guò)概率統(tǒng)計(jì)的理論建立包含各種句型的雙語(yǔ)對(duì)照資料庫(kù),并在翻譯過(guò)程中不斷完善、優(yōu)化、修改這個(gè)資料數(shù)據(jù)庫(kù),在翻譯時(shí),軟件自動(dòng)從這個(gè)數(shù)據(jù)庫(kù)中提取相似的例句、短語(yǔ)等,并模仿該句型實(shí)現(xiàn)源語(yǔ)言和目標(biāo)語(yǔ)言的轉(zhuǎn)換。
目前的商業(yè)化機(jī)器翻譯軟件,多數(shù)采用了多種翻譯技術(shù)混合的模式。從最初的簡(jiǎn)單規(guī)則,到如今千變?nèi)f化的復(fù)雜規(guī)則,依靠長(zhǎng)期翻譯訓(xùn)練中積累的大量語(yǔ)料庫(kù)和在長(zhǎng)期翻譯實(shí)踐中通過(guò)譯者的反饋和測(cè)試不斷優(yōu)化的語(yǔ)料庫(kù),很多翻譯軟件已具有較高的翻譯成功率,被廣泛應(yīng)用于文件瀏覽、信息查閱、數(shù)據(jù)檢索等方面。
機(jī)器翻譯系統(tǒng)的評(píng)價(jià)主要有七大因素:譯文的質(zhì)量、應(yīng)用效率、工作方式、使用環(huán)境、維護(hù)性和擴(kuò)展性、機(jī)器翻譯系統(tǒng)性能價(jià)格比、魯棒性(robustness)。其中譯文的質(zhì)量是最主要的考量因素。
在科技文翻譯中,羅季美等人以汽車技術(shù)科技文獻(xiàn)的翻譯為例,統(tǒng)計(jì)得出各種句法錯(cuò)譯發(fā)生的概率,如圖1所示。事實(shí)上,半個(gè)世紀(jì)以來(lái)的機(jī)器翻譯研究在句法處理上已經(jīng)取得了很大的成就,機(jī)器對(duì)被動(dòng)語(yǔ)態(tài)、大部分主要時(shí)態(tài)及某些特殊句型等的處理都達(dá)到了相當(dāng)高的準(zhǔn)確率(10.3%)。而該統(tǒng)計(jì)的錯(cuò)誤率也從側(cè)面反映出語(yǔ)言的千變?nèi)f化對(duì)機(jī)器翻譯的巨大考驗(yàn),在機(jī)器翻譯軟件中為每一種語(yǔ)句應(yīng)用的特例都制定規(guī)則是不現(xiàn)實(shí)的,而長(zhǎng)期的機(jī)器翻譯應(yīng)用和人工比對(duì)修改也是機(jī)器翻譯不斷進(jìn)步的必不可少階段,從而逐步更合理限定詞匯處理范疇,提高機(jī)器翻譯的準(zhǔn)確率和效率。
圖1 句法錯(cuò)譯發(fā)生率
機(jī)器翻譯軟件的優(yōu)勢(shì)在于翻譯速度快、運(yùn)用范圍廣、成本低和無(wú)需專業(yè)譯員等;局限性在于機(jī)器翻譯的譯文比較粗糙、文體風(fēng)格難以掌控以及語(yǔ)言表達(dá)不夠地道等。翻譯標(biāo)準(zhǔn)的差異及機(jī)器翻譯軟件的原理決定了機(jī)器翻譯非文學(xué)材料的適用性比文學(xué)材料要強(qiáng)。一般情況下,翻譯界都認(rèn)為科技翻譯易于文學(xué)翻譯。理論上,若輸入計(jì)算機(jī)中的規(guī)則和語(yǔ)言材料越多,翻譯的質(zhì)量就越高。如果把人類所有的語(yǔ)言規(guī)則和語(yǔ)言現(xiàn)象都輸入計(jì)算機(jī)中,那么機(jī)器翻譯完全可以取代人工翻譯。但是語(yǔ)言的應(yīng)用千變?nèi)f化,尤其在文學(xué)作品中,語(yǔ)言的多樣性使得語(yǔ)義規(guī)則多到無(wú)法估量,而即使建立了非常龐大的語(yǔ)料庫(kù),也不可能完全涵蓋語(yǔ)言的所有用法,更別提語(yǔ)言中的文采、多義化表達(dá)等文學(xué)作品特有的性質(zhì),使得機(jī)器翻譯軟件在有較高需求的文學(xué)翻譯中幾乎不可能代替人工翻譯。
而在翻譯要求相對(duì)較低的其他場(chǎng)合,有效的機(jī)器翻譯可節(jié)省大量的資料閱讀時(shí)間,極大地提高了工作效率。然而,如何建立一個(gè)有效的翻譯規(guī)則,并逐步完善翻譯語(yǔ)料庫(kù),是翻譯工作者和計(jì)算機(jī)軟件開發(fā)者面臨的共同難題。
根據(jù)日常生活中大量瀏覽性閱讀需求,機(jī)器翻譯軟件在多個(gè)層面開發(fā)了相應(yīng)的應(yīng)用功能,如在線翻譯、網(wǎng)頁(yè)自動(dòng)翻譯、圖片翻譯、語(yǔ)音翻譯等。從使用者的角度來(lái)看,用戶在打開外語(yǔ)網(wǎng)頁(yè)時(shí),可以選擇“翻譯該網(wǎng)頁(yè)”功能,直接將原
網(wǎng)頁(yè)文字翻譯成另一種文字,這種功能的實(shí)現(xiàn)并非來(lái)自于原網(wǎng)站服務(wù)器中的數(shù)據(jù),而是一種基于網(wǎng)頁(yè)應(yīng)用層面的機(jī)器翻譯技術(shù)。當(dāng)今,機(jī)器翻譯軟件還可以借助OCR(屏幕識(shí)別技術(shù))翻譯出非文本格式的圖片文件,甚至還可以借助于語(yǔ)音識(shí)別技術(shù),識(shí)別出用戶所講的內(nèi)容,并迅速翻譯成另一種語(yǔ)言。
可以預(yù)見(jiàn)的是,機(jī)器翻譯技術(shù)將來(lái)還會(huì)與更多技術(shù)相結(jié)合,進(jìn)一步豐富其在日常生活、工作中的需求。同時(shí),機(jī)器翻譯技術(shù)也將這種理念運(yùn)用在了更復(fù)雜的未知語(yǔ)言探索中。
機(jī)器翻譯經(jīng)過(guò)長(zhǎng)達(dá)半個(gè)世紀(jì)的發(fā)展,如今已成為人們?nèi)粘9ぷ魃钪胁豢苫蛉钡姆g技術(shù)工具。語(yǔ)言既是一種建立在一定規(guī)則基礎(chǔ)上的表達(dá)方式,也具有千變?nèi)f化無(wú)法捉摸的特點(diǎn),這使得機(jī)器翻譯軟件不僅需要制定一定的規(guī)則,也需要在投入運(yùn)用的過(guò)程中,不斷改善技術(shù),并和語(yǔ)言學(xué)知識(shí)相結(jié)合,提高機(jī)器翻譯的譯文的準(zhǔn)確性和翻譯效率,降低人工譯員譯后編輯的勞動(dòng)量。如今的商業(yè)化機(jī)器翻譯軟件經(jīng)過(guò)幾十年的發(fā)展,已經(jīng)在很多場(chǎng)合證明了其適用性。同時(shí),由于語(yǔ)言的多樣性和隨機(jī)性,目前的機(jī)器翻譯軟件尚無(wú)法完全替代人工翻譯,具有一定的局限性,尤其在要求較高的翻譯場(chǎng)合,仍非常依賴于人工翻譯。
隨著大數(shù)據(jù)技術(shù)在各行各業(yè)的不斷滲透,以及人工智能技術(shù)的起步,未來(lái)機(jī)器翻譯軟件勢(shì)必會(huì)更加智能,借助于各種現(xiàn)代化應(yīng)用型技術(shù),一方面可以更輕松完成日常翻譯工作;另一方面,甚至可以通過(guò)人工智能技術(shù),進(jìn)行自我學(xué)習(xí)和感知,逐步涉足更復(fù)雜、更多變的翻譯工作。
[1]羅季美,李梅.機(jī)器翻譯譯文錯(cuò)誤分析[J].中國(guó)翻譯,2012(5).
[2]王內(nèi).文學(xué)材料與非文學(xué)材料機(jī)器翻譯適用性比較研究[D].湖南師范大學(xué),2012.
[3]馮志偉,徐波,孫茂松.機(jī)器翻譯的現(xiàn)狀和問(wèn)題[M].北京:科學(xué)出版社,2003.
[4]胡清平.機(jī)器翻譯中的受控語(yǔ)言[J].中國(guó)科技翻譯, 2005(8).
[5]Arnold D. & Lee H Machine Translation: Special Issue on Evaluation of MT system[A]. In Arnold D. & Louisa S. Evaluation: An Assessment[C]. Dordrehct: Kluwer Academic Publishers, 1993.
[6]Peter F. Brown, John Cocke, Stephen A. Della Pietra, Vincent J. Della Petra, Fredrick Jelinek, John D. Lafferty, R obert L. Mercer, and Paul S. R oossin.A Statistical Approach to Machine Translation [J]. Computational Linguistics. 1990,16(2): 79-85.
[7]劉劍.超文本語(yǔ)境下的翻譯形態(tài)變化研究[D].華東師范大學(xué),2014.
[8]王海峰,吳華,劉占一.互聯(lián)網(wǎng)機(jī)器翻譯[J].中文信息學(xué)報(bào),2011(11).
TP391.2
A
1007-0125(2016)12-0270-02