李哲
內(nèi)容摘要:本文緊密結(jié)合俄語界對平行語料庫的需求,概述了國內(nèi)外平行語料庫的發(fā)展現(xiàn)狀,論證了俄漢-漢俄平行語料庫的應(yīng)用價(jià)值,闡釋了現(xiàn)存平行語料庫的普遍問題以及從中得到的啟示。在平行語料庫建設(shè)和研究蓬勃發(fā)展的當(dāng)今世界,我國俄語界不應(yīng)再止步不前,各學(xué)科之間應(yīng)該加強(qiáng)合作,充分借鑒國內(nèi)外成熟平行語料庫的建設(shè)經(jīng)驗(yàn),加快、加強(qiáng)俄漢-漢俄平行語料庫的建設(shè)與研制刻不容緩、勢在必行。
關(guān)鍵詞:俄漢-漢俄平行語料庫 建設(shè)與研制 應(yīng)用價(jià)值 意義
一.引言
平行語料庫是指兩種或多種語言在段落、句子甚至單詞短語層面上實(shí)現(xiàn)同步對譯的互動語料庫。近三十年來,隨著語料庫創(chuàng)建和應(yīng)用的不斷發(fā)展,平行語料庫也展現(xiàn)出廣闊的應(yīng)用前景,已成為語料庫研究的一個(gè)重點(diǎn)。
近年來,世界各國都投入了大量的人力、物力和財(cái)力用于平行語料庫的建設(shè)。其中,在歐美,平行語料庫已建成有十多個(gè),涉及近20個(gè)語種;在中國,雙語平行語料庫的發(fā)展勢頭也非常迅猛,但主要以漢英平行語料庫為主。俄漢一漢俄平行語料庫的建設(shè)依然是個(gè)空白,雖然國內(nèi)有些學(xué)者已經(jīng)在自建小型的俄漢平行語料庫,但都未開放。
二.國內(nèi)外平行語料庫發(fā)展現(xiàn)狀
平行語料庫的構(gòu)建與應(yīng)用研究從20世紀(jì)90年代就已經(jīng)開始。世界上第一個(gè)雙語語料庫——加拿大議會會議錄英-法平行語料庫(the Canadian Hansard Cor-pus)于90年代初在加拿大建成。另外,如蘭卡斯特大學(xué)早期創(chuàng)建的I-TU/Crater平行庫、歐洲委員會聯(lián)合中心的JRC-ACQUIS多語種平行語料庫、PAROLE語料庫等,這些語料庫基本上都是文本來源單,標(biāo)注也簡單的歐洲語言專用語料庫。
除此之外,比較大規(guī)模的、具有代表性的平行語料庫還包括克姆尼茨英-德翻譯語料庫(Chem-nitz E-G Translation Corpus)、德英文學(xué)文本平行語料庫(Ger-man-English Parallel Corpus of Literary Translation,GEPCOLT)、英語一挪威語平行語料庫(Eng-lish-Norweigian Parallel Corpus,ENPC)等。
在國內(nèi),雙語平行語料庫的建設(shè)研究起步相對較晚,但近10年來也取得了很大的進(jìn)展,其中最值得一提的是北京外國語大學(xué)中國外語教育研究中心王克非主持和研制的北外“通用漢英對應(yīng)語料庫”,該語料庫是目前世界上規(guī)模最大的雙語平行語料庫,容量約為3000萬字詞。
專門用途語料庫的建設(shè)也獲得了一定的關(guān)注,如上海交通大學(xué)的莎士比亞戲劇英漢平行語料庫、燕山大學(xué)的《紅樓夢》譯本平行語料庫、哈爾濱工業(yè)大學(xué)計(jì)算機(jī)學(xué)院語言技術(shù)研究中心面向奧運(yùn)的漢英日三語語料庫、內(nèi)蒙古大學(xué)建立的漢蒙對照政府文獻(xiàn)語料庫等。
涉及俄語的平行語料庫主要有俄語國家語料庫(Национапъныйкорпусрусскогоязыкл-НКРЯ)的平行文本語料庫(Корпуспараллельныхтекстов)模塊,收錄有俄英、英俄、德俄、烏俄、俄烏5個(gè)文本對庫,總量約為2400萬詞次。
相比之下,俄漢一漢俄平行語料庫的建設(shè)與研究還很滯后。雖然國內(nèi)有些學(xué)者已經(jīng)開始嘗試構(gòu)建俄漢雙語平行語料庫,比如崔衛(wèi)和張嵐目前已設(shè)計(jì)研制好的俄漢翻譯語料庫中的子庫——軍事外宣漢俄翻譯子庫(崔衛(wèi)等2014:1)、劉淼和邵青創(chuàng)建的基于契科夫小說的俄漢文學(xué)翻譯語料庫(劉淼等2016:1)、解放軍外國語學(xué)院碩士研究生創(chuàng)建的俄漢新聞句庫等。但是這些語料庫大都沒有實(shí)現(xiàn)對外開放,數(shù)量太少,而且也尚待完善。因此,緊密結(jié)合實(shí)際需求,借鑒其他語種平行語料庫的建設(shè)經(jīng)驗(yàn),將認(rèn)識不深、技術(shù)不硬、資源不足等問題徹底解決,進(jìn)行俄漢領(lǐng)域平行語料庫的建設(shè)與研制是當(dāng)務(wù)之急。
三.俄漢-漢俄平行語料庫建設(shè)的應(yīng)用價(jià)值和意義
平行語料庫的建設(shè)和研究代表了當(dāng)今基于語料庫方法進(jìn)行語言對比研究、翻譯研究和外語教學(xué)研究的發(fā)展趨勢。加強(qiáng)俄漢一漢俄平行語料庫的構(gòu)建與研究,也必定會促進(jìn)俄漢語言對比研究和翻譯研究的發(fā)展,改進(jìn)俄語教學(xué),提高翻譯質(zhì)量,改進(jìn)俄漢雙語詞典的編纂,促進(jìn)俄漢雙語信息檢索和機(jī)器翻譯的開發(fā)。
1.俄漢-漢俄平行語料庫與語言對比研究
平行語料庫承載著相互對應(yīng)的兩種語言,與語言對比研究有著天然的聯(lián)系,成為語言對比研究中的默認(rèn)數(shù)據(jù)源。(王克非2012:23)基于語料庫的方法是俄漢對比中最常用的定量統(tǒng)計(jì)方法,它一般是根據(jù)語料實(shí)例觀察,提出假設(shè),然后由研究者以對應(yīng)語料庫為數(shù)據(jù)源對假設(shè)進(jìn)行驗(yàn)證。(崔衛(wèi)等2014:5)平行語料庫可以為俄漢對比提供更多的可能性,讓我們發(fā)現(xiàn)很多以前在語言對比認(rèn)識上的錯(cuò)誤,甚至獲得新的發(fā)現(xiàn)。
2.俄漢-漢俄平行語料庫與俄語教學(xué)
基于語料庫的教學(xué)方法可以提高俄語教學(xué)的有效性。通過利用平行語料庫及其相關(guān)檢索工具,對特定的語料進(jìn)行分析,可以有效地引領(lǐng)學(xué)生對同義詞進(jìn)行真實(shí)準(zhǔn)確的辨析、了解詞語真正的含義、學(xué)習(xí)詞語的搭配和短語結(jié)構(gòu)以及了解文章的結(jié)構(gòu)、表達(dá)、語境和修辭信息等。特別是在翻譯課教學(xué)中,平行語料庫更是不可替代的參考工具或工作平臺。首先,利用平行語料庫便于查找特定表達(dá)方式的譯法,使術(shù)語和短語的翻譯更加準(zhǔn)確、地道。其次,它還有豐富的譯例,可以提供多個(gè)翻譯參考,使翻譯文本更加真實(shí)、更加豐富。
3.俄漢-漢俄平行語料庫與詞典編纂
在詞典編纂領(lǐng)域使用語料庫被視為詞典編纂手段的一次革命,而平行語料庫在雙語詞典編纂中的作用更是不可估量的:平行語料庫中的兩種語言互為對應(yīng),記載著兩種語言中的對應(yīng)詞和對應(yīng)單位(王克非2012:23),不僅可以提供最可靠的數(shù)據(jù)來源,而且還可以幫助詞典編纂者對詞進(jìn)行義項(xiàng)分析、排序、提供例句、發(fā)現(xiàn)新詞義等。而俄漢-漢俄平行語料庫的建設(shè)也必定會為俄漢雙語詞典的編纂帶來革命性的突破。
4.俄漢-漢俄平行語料庫與翻譯研究
語料庫研究方法在翻譯領(lǐng)域的應(yīng)用使得一門新的交叉學(xué)科——語料庫翻譯學(xué)誕生,而雙語語料庫則是該學(xué)科的基礎(chǔ)?;诙頋h一漢俄平行語料庫,人們可以研究俄漢語翻譯語言特征、翻譯文體、作家語言翻譯特點(diǎn)、特定結(jié)構(gòu)或表達(dá)方式在對應(yīng)語言中的體現(xiàn)以及譯者的翻譯策略和方法。除此之外,平行語料庫對于機(jī)器翻譯也極為重要。對齊的平行語料庫能為基于例句和統(tǒng)計(jì)的機(jī)器翻譯提供實(shí)證模型,同時(shí)也可以為基于規(guī)則的機(jī)器翻譯提供驗(yàn)證,為機(jī)助翻譯提供大量翻譯記憶。(王克非2012:23)我國的科大訊飛公司已經(jīng)根據(jù)語音語料庫和海量語料庫資源開發(fā)出了國內(nèi)首款智能便攜翻譯機(jī)。由此可見,平行語料庫在機(jī)器翻譯方面的應(yīng)用價(jià)值不可估量。
四.現(xiàn)存平行語料庫的普遍問題及對俄漢-俄漢平行語料庫的啟示
1.平行語料庫建設(shè)各自為政導(dǎo)致重復(fù)建設(shè)問題嚴(yán)重
盡管國內(nèi)外現(xiàn)有的雙語平行語料庫各自己具備一定的規(guī)模,但大都各自為政,缺乏一定的綜合性,而且重復(fù)建設(shè)問題嚴(yán)重。以國內(nèi)的《紅樓夢》漢英平行語料庫為例,比較有代表性的至少就有三個(gè)。(崔衛(wèi)等2014:1)語料庫的建設(shè)本身就是一項(xiàng)既費(fèi)時(shí)又費(fèi)力的工作,重復(fù)建設(shè)只會造成力量的分散,限制語料庫的規(guī)模和加工深度。
有鑒于此,在俄漢-漢俄平行語料庫的建設(shè)中,筆者認(rèn)為初始階段不應(yīng)求大求全,可以選擇核心語料庫的一個(gè)具體方面為起點(diǎn),各研制團(tuán)隊(duì)之間加強(qiáng)交流溝通,分工合作,最后對現(xiàn)有資源進(jìn)行整合,實(shí)現(xiàn)共享。
2.平行語料庫的研究切入點(diǎn)不足,專門語料庫類型單一
平行語料庫不僅可用于跨語際的語言轉(zhuǎn)換研究,還可進(jìn)行不同翻譯方向上譯出與譯入文本的類比研究,以及翻譯語言與非翻譯語言的類比研究等。但目前此類研究主要局限于文學(xué)作品領(lǐng)域,對于非文學(xué)文本類似考察并不多見,這與專門語料庫類型單一的問題不無關(guān)系。目前國際上大多語料庫還僅限于文學(xué)和非文學(xué)兩種,而且非文學(xué)文本中的新聞、財(cái)經(jīng)、法律、醫(yī)藥等文類細(xì)化遠(yuǎn)遠(yuǎn)不夠。
因此俄漢-漢俄平行語料庫的創(chuàng)建既要不斷拓展文本類型,又要進(jìn)一步發(fā)掘新的研究對象,比如對不同文本類型翻譯策略的對比研究以及在歷時(shí)的角度下考察翻譯語言或翻譯給原創(chuàng)語言帶來的變化等。
其它如平行語料庫深加工程度不夠、相關(guān)技術(shù)開發(fā)不足等問題也是一直以來亟待解決的難題,這就更要求相關(guān)學(xué)科之間加強(qiáng)溝通與合作。語言研究者和翻譯研究者可以為計(jì)算機(jī)專業(yè)人士提供新的研究課題,反過來,計(jì)算機(jī)專業(yè)人士又能為語言研究者和翻譯研究者提供研究手段的支持,二者相互促進(jìn),共同發(fā)展。結(jié)語
平行語料庫作為語料庫的一種具體類型,是重要的語言資源,它的建設(shè)與使用也是今后語料庫翻譯學(xué)以及機(jī)器翻譯取得新突破的硬件基礎(chǔ),雙語平行語料庫在語言學(xué)研究中的潛力還有待于進(jìn)一步開發(fā)。因此,如何更好地構(gòu)建俄漢一漢俄平行語料庫也自然成為俄語界學(xué)者勢在必行的研究課題。同時(shí),進(jìn)一步注重各研制團(tuán)隊(duì)之間的合作,建設(shè)超大規(guī)模、綜合性、多用途的國家級語料庫也成為平行語料庫發(fā)展的新趨勢。