陜西師范大學(xué) 陶 源
人文社科學(xué)術(shù)文本俄漢平行語(yǔ)料庫(kù)的創(chuàng)建與研究*
陜西師范大學(xué) 陶 源
創(chuàng)建平行語(yǔ)料庫(kù)是描寫翻譯學(xué)研究的需要,國(guó)內(nèi)外已有多個(gè)雙語(yǔ)或多語(yǔ)平行語(yǔ)料庫(kù),但鮮有俄漢平行語(yǔ)料庫(kù)。本文闡述了俄漢平行語(yǔ)料庫(kù)的總體結(jié)構(gòu)、文本選擇和構(gòu)建流程。語(yǔ)料庫(kù)建設(shè)過(guò)程中,我們除了進(jìn)行俄漢語(yǔ)料的句級(jí)對(duì)齊、篇頭添加和交集檢索以外,還做了以下兩項(xiàng)工作:1)探索了俄語(yǔ)詞屈折形式的檢索問(wèn)題;2)探索了學(xué)術(shù)文本語(yǔ)料庫(kù)的術(shù)語(yǔ)庫(kù)自動(dòng)生成問(wèn)題。語(yǔ)料庫(kù)的研制是與其研究目的緊密相關(guān)的,本文對(duì)俄漢平行語(yǔ)料庫(kù)的預(yù)期研究問(wèn)題和前景進(jìn)行了展望。
俄漢平行語(yǔ)料庫(kù)、語(yǔ)料庫(kù)創(chuàng)建、術(shù)語(yǔ)庫(kù)生成、交集檢索
本文擬闡述俄漢平行語(yǔ)料庫(kù)(人文社科學(xué)術(shù)文本)創(chuàng)建的過(guò)程及以該語(yǔ)料庫(kù)為基礎(chǔ)的可能進(jìn)行的后期研究。俄漢平行語(yǔ)料庫(kù),尤其是用于翻譯研究的平行、類比語(yǔ)料庫(kù)在國(guó)內(nèi)尚屬首創(chuàng),因此在語(yǔ)料庫(kù)設(shè)計(jì)、文本搜集和預(yù)處理、檢索、篇頭的添加等方面都存在著眾多難點(diǎn)。本文以語(yǔ)料庫(kù)創(chuàng)建過(guò)程中的工作實(shí)例為依托,闡述語(yǔ)料庫(kù)建設(shè)的主要環(huán)節(jié)。
1.1 國(guó)內(nèi)外現(xiàn)有的俄語(yǔ)語(yǔ)料庫(kù)
迄今為止,俄語(yǔ)語(yǔ)料庫(kù)的建設(shè)相對(duì)其他語(yǔ)種還比較少見(jiàn),尤其是包括俄語(yǔ)的雙語(yǔ)語(yǔ)料庫(kù)更是少之又少。
俄語(yǔ)單語(yǔ)語(yǔ)料庫(kù)是在語(yǔ)料庫(kù)語(yǔ)言學(xué)的背景下得以建設(shè)的。早在2003-2004年間,俄羅斯語(yǔ)言學(xué)界就開(kāi)始了對(duì)語(yǔ)料庫(kù)語(yǔ)言學(xué)的研究,俄羅斯科學(xué)院語(yǔ)言學(xué)研究所以Зaхapoв為首的學(xué)者就開(kāi)始創(chuàng)辦了語(yǔ)料庫(kù)語(yǔ)言學(xué)論壇,2006年又改為“語(yǔ)料庫(kù)與計(jì)算語(yǔ)言學(xué)論壇”(ceминap пo кopпycнoй и кoмпьютepнoй лингвиcтикe)。 在 歷 屆 論 壇 上Митpoфaнoвa、Мyхин、Пaничeвa和Ягyнoвa從句法、語(yǔ)義、邏輯等角度對(duì)語(yǔ)料庫(kù)語(yǔ)言學(xué)進(jìn)行了論述,單語(yǔ)語(yǔ)料庫(kù)也相繼建成,如俄語(yǔ)國(guó)家語(yǔ)料庫(kù)(Нaциoнaльный кopпyc Рyccкoгo языкa),謝爾蓋·沙洛夫語(yǔ)料庫(kù)(Рyccкиe кopпyca Cepгeя Шapoвa)等,其中俄語(yǔ)國(guó)家語(yǔ)料庫(kù)收錄3.4億多詞次,謝爾蓋·沙洛夫語(yǔ)料庫(kù)收錄約4千萬(wàn)詞次,這兩個(gè)語(yǔ)料庫(kù)都是俄語(yǔ)單語(yǔ)的通用語(yǔ)料庫(kù),包括文學(xué)、政論、科技等各方面內(nèi)容。2008年Л.Н.Бeляeвa在該論壇的報(bào)告中提出了語(yǔ)料庫(kù)與翻譯的關(guān)系,并對(duì)平行語(yǔ)料庫(kù)的建設(shè)和可以運(yùn)用平行語(yǔ)料庫(kù)進(jìn)行的研究?jī)?nèi)容進(jìn)行了介紹和講述。但是翻譯語(yǔ)料庫(kù)甚至雙語(yǔ)語(yǔ)料庫(kù)的建設(shè)還相對(duì)滯后,已經(jīng)建成的譯學(xué)語(yǔ)料庫(kù)還沒(méi)有見(jiàn)到。
國(guó)內(nèi)的俄語(yǔ)單語(yǔ)庫(kù)僅見(jiàn):解放軍外國(guó)語(yǔ)學(xué)院創(chuàng)建的新聞?wù)撜Z(yǔ)體俄語(yǔ)語(yǔ)料庫(kù),語(yǔ)料庫(kù)達(dá)到5,000萬(wàn)詞次,但是該語(yǔ)料庫(kù)是以編寫網(wǎng)頁(yè)爬蟲的方式建成的,沒(méi)有進(jìn)行細(xì)致的分類和加工。
現(xiàn)有的俄漢雙語(yǔ)庫(kù)主要有:解放軍外國(guó)語(yǔ)學(xué)院建設(shè)的俄漢翻譯平行語(yǔ)料庫(kù)(崔衛(wèi)、張嵐 2014)、北京第二外國(guó)語(yǔ)學(xué)院翻譯研究中心開(kāi)發(fā)研制的全國(guó)公示語(yǔ)翻譯語(yǔ)料庫(kù)、俄漢雙語(yǔ)庫(kù)和呂紅周(2007)自建的雙語(yǔ)庫(kù)、秦立東(2007)自建的雙語(yǔ)庫(kù)等。
綜觀現(xiàn)有的俄語(yǔ)語(yǔ)料庫(kù),尤其是包含俄語(yǔ)的翻譯語(yǔ)料庫(kù)或平行語(yǔ)料庫(kù)的建設(shè)還很不夠,唯一具有一定規(guī)模的漢俄公示語(yǔ)翻譯語(yǔ)料庫(kù)也還存在著以下問(wèn)題:
1)規(guī)模較小。北京第二外國(guó)語(yǔ)翻譯研究中心原有的研制目標(biāo)是一個(gè)多語(yǔ)種公示語(yǔ)平行語(yǔ)料庫(kù),現(xiàn)因?yàn)榧夹g(shù)手段、文本選擇等因素,漢俄部分僅進(jìn)行了初期建設(shè)后就已經(jīng)擱置了。這當(dāng)然是和公示語(yǔ)本身的圖片多、文字少,詞匯多、句子少,專有名詞多,縮略語(yǔ)多等特點(diǎn)是緊密相關(guān)的,但是翻譯研究、翻譯教學(xué)和翻譯實(shí)踐都需要建設(shè)更大規(guī)模的俄漢平行語(yǔ)料庫(kù)。解放軍外國(guó)語(yǔ)學(xué)院建設(shè)的俄漢翻譯平行語(yǔ)料庫(kù)還處于建設(shè)階段,建成的只有軍事外宣子庫(kù)。
2)檢索受限。公示語(yǔ)語(yǔ)料庫(kù)僅能提供漢俄單向檢索,俄語(yǔ)中很多復(fù)雜的形態(tài)變化其檢索問(wèn)題還沒(méi)有真正解決。解放軍外國(guó)語(yǔ)學(xué)院語(yǔ)料庫(kù)(崔衛(wèi)、張嵐 2014)對(duì)于俄語(yǔ)部分的檢索問(wèn)題沒(méi)有詳細(xì)闡述。
本文擬建設(shè)的人文社科類學(xué)術(shù)文本俄漢平行語(yǔ)料庫(kù)和漢俄公示語(yǔ)翻譯語(yǔ)料庫(kù),都屬于包含俄語(yǔ)的專門性雙語(yǔ)語(yǔ)料庫(kù)。但是我們?cè)趲?kù)容、檢索和用途三個(gè)方面都有所突破:人文社科類學(xué)術(shù)文本俄漢平行語(yǔ)料庫(kù)一期建設(shè)擬收詞500萬(wàn),后期將達(dá)到1,000萬(wàn);實(shí)現(xiàn)俄語(yǔ)的正則表達(dá)式檢索和網(wǎng)頁(yè)檢索;并使語(yǔ)料庫(kù)能夠用于語(yǔ)料庫(kù)翻譯學(xué)和俄漢語(yǔ)對(duì)比研究、翻譯教學(xué)和學(xué)術(shù)論文寫作等方面。
1.2 俄漢平行語(yǔ)料庫(kù)創(chuàng)建的意義
語(yǔ)料庫(kù)翻譯學(xué)從產(chǎn)生到發(fā)展已經(jīng)20年了,基于語(yǔ)料庫(kù)的翻譯研究方法已被應(yīng)用到越來(lái)越多的研究之中。
俄漢翻譯研究是國(guó)內(nèi)翻譯研究的重要領(lǐng)域,而目前現(xiàn)有的俄漢翻譯研究還停留在對(duì)俄羅斯譯學(xué)的述評(píng)(楊仕章 2001a,2001b,2002,2003)、翻譯批評(píng)(朱達(dá)秋 2011,2013)和基于少量譯例的翻譯實(shí)踐研究(陶源 2011)上,也就是說(shuō),現(xiàn)有的俄漢、漢俄翻譯研究主要還屬于規(guī)定性譯學(xué)的范疇。這種路徑下的俄漢、漢俄翻譯研究中的譯例選擇主要根據(jù)研究者既有的理論前提而定,更傾向于內(nèi)省式的語(yǔ)料選取方式;大部分論文或?qū)V淖g例都選自有限幾部作品的原文和譯文,而且其中大部分是文學(xué)作品;在對(duì)譯例的分析上也局限于某一種理論,在微觀的語(yǔ)料分析之后的宏觀分析受到限制和制約,這種翻譯研究存在著語(yǔ)料少、主觀性強(qiáng)等缺陷??傊F(xiàn)有的俄漢、漢俄翻譯屬于規(guī)定性譯學(xué)的研究范疇。
因此,把俄漢翻譯研究納入描寫譯學(xué)研究的范疇有其必要性,而描寫性譯學(xué)研究的基礎(chǔ)就是語(yǔ)料庫(kù),研制俄漢平行語(yǔ)料庫(kù)的意義如下。
1.2.1 理論意義
研制俄漢平行語(yǔ)料庫(kù)的理論意義有兩點(diǎn)。
1)俄漢兩種語(yǔ)言形態(tài)方法的差異最為明顯(馬慶株 2002;趙敏善 1994),俄語(yǔ)的形態(tài)變化特別豐富:在詞的層面,每一種名詞都有12種變化形式,動(dòng)詞有時(shí)、體、態(tài)的變化,更有其他語(yǔ)言鮮有的形動(dòng)詞和副動(dòng)詞,其中形動(dòng)詞在學(xué)術(shù)文本中出現(xiàn)頻率更是高于一般文本,而這些語(yǔ)言特征正是漢語(yǔ)中所沒(méi)有的。漢語(yǔ)的語(yǔ)言特征正好與此相反,我們常見(jiàn)學(xué)者對(duì)漢語(yǔ)有這樣的論述:“漢語(yǔ)重意合”,而當(dāng)今學(xué)者們?cè)跐h語(yǔ)研究中更是提出了“語(yǔ)義中心論、語(yǔ)義決定語(yǔ)法”的觀點(diǎn)(陸儉明 2004;趙世舉 2007)。把這兩種語(yǔ)言放在一個(gè)平行語(yǔ)料庫(kù)中,研究從俄語(yǔ)翻譯而來(lái)的翻譯語(yǔ)言的特征必定更具有代表性和典型性。
2)雙語(yǔ)語(yǔ)料庫(kù)可以分為翻譯語(yǔ)料庫(kù)、平行語(yǔ)料庫(kù)(對(duì)應(yīng)語(yǔ)料庫(kù))和類比語(yǔ)料庫(kù)(王克非 2012:10),也可以分為平衡語(yǔ)料庫(kù)(通用語(yǔ)料庫(kù))和專門語(yǔ)料庫(kù)。本文要討論的人文社科類學(xué)術(shù)文本俄漢平行語(yǔ)料庫(kù)屬于專門語(yǔ)料庫(kù)的范疇,專門語(yǔ)料庫(kù)指的是“關(guān)于特定主題文本的集合”,且這些文本“均由行內(nèi)專家為不同的讀者群所寫”,這些讀者群可能是同行的專家,或是缺乏相關(guān)專業(yè)知識(shí)的大眾,亦可能是學(xué)生等(Kübler 2003:29, 轉(zhuǎn)引自李德超、王克非 2010)。綜觀目前的雙語(yǔ)語(yǔ)料庫(kù)建設(shè),專門應(yīng)用于翻譯研究的專門語(yǔ)料庫(kù)還相對(duì)缺乏,現(xiàn)有的專門語(yǔ)料庫(kù)也一般規(guī)模較小,從幾萬(wàn)到幾十萬(wàn)詞次不等。香港理工大學(xué)研制的“新型雙語(yǔ)旅游語(yǔ)料庫(kù)”在第一階段建設(shè)中已經(jīng)達(dá)到200萬(wàn)詞次,是一個(gè)集研究和應(yīng)用于一體的雙語(yǔ)專門語(yǔ)料庫(kù)。本文要建設(shè)的也是一個(gè)專門語(yǔ)料庫(kù),具有不同于以往雙語(yǔ)專門語(yǔ)料庫(kù)的特征:(1)以俄漢語(yǔ)言為對(duì)象;(2)只選取人文社科類學(xué)術(shù)文本為語(yǔ)料;(3)建設(shè)規(guī)模將達(dá)到500萬(wàn)詞次,且為開(kāi)放型語(yǔ)料庫(kù),后期還將不斷增加和擴(kuò)容。
因此本文擬討論的語(yǔ)料庫(kù)具有專門性、涉及俄漢兩種語(yǔ)言和較大規(guī)模的特點(diǎn),它在建設(shè)和研制過(guò)程中必然會(huì)面臨語(yǔ)料選取、識(shí)別、對(duì)齊、工具和檢索等方面的問(wèn)題和困難,而這些問(wèn)題的解決也必將為后期俄漢平行語(yǔ)料庫(kù)、學(xué)術(shù)文本語(yǔ)料庫(kù)建設(shè)提供良好的范式。語(yǔ)料庫(kù)的建成使國(guó)內(nèi)翻譯研究的路徑得以拓寬,描寫性譯學(xué)從英漢、日漢翻譯延展到俄漢翻譯領(lǐng)域,專門性文本的描寫性翻譯研究將涉及一個(gè)新的領(lǐng)域:學(xué)術(shù)文本翻譯。
1.2.2 實(shí)踐意義
研制和建設(shè)人文社科類學(xué)術(shù)文本俄漢平行語(yǔ)料庫(kù)的目的是以它為基礎(chǔ)的俄漢翻譯研究,特別是人文社科類學(xué)術(shù)文本的翻譯研究,因此語(yǔ)料庫(kù)建設(shè)以翻譯實(shí)踐研究和翻譯教學(xué)為目標(biāo)?;谠撜Z(yǔ)料庫(kù)我們將在下列研究和教學(xué)領(lǐng)域開(kāi)展工作:
1)人文社科類學(xué)術(shù)文本的俄漢翻譯研究包括:學(xué)術(shù)文本的翻譯語(yǔ)言特征研究、人文社科類學(xué)術(shù)文本的術(shù)語(yǔ)翻譯研究、人文社科類學(xué)術(shù)文本中元話語(yǔ)信息和某些句式的翻譯研究及其表現(xiàn)的翻譯選擇問(wèn)題等。
2)翻譯教學(xué),本語(yǔ)料庫(kù)將為俄漢翻譯教學(xué)提供一種新的范式,即數(shù)據(jù)驅(qū)動(dòng)型教學(xué)(data-driven learning,縮寫為DDL),為這種教學(xué)模式提供較大規(guī)模的真實(shí)語(yǔ)料和教學(xué)資源。DDL這里指的是“在課堂上利用電子計(jì)算機(jī)生成索引(concordances)來(lái)幫助學(xué)生發(fā)掘目標(biāo)語(yǔ)型式(pattern)中的規(guī)律,并根據(jù)索引結(jié)果來(lái)研發(fā)種種學(xué)習(xí)活動(dòng)及設(shè)計(jì)學(xué)習(xí)練習(xí)”(Johns & King 1991:iii)。以本語(yǔ)料庫(kù)為基礎(chǔ)教師在教學(xué)中開(kāi)發(fā)各種新的手段來(lái)進(jìn)行俄漢、漢俄翻譯教學(xué),學(xué)生也可以利用語(yǔ)料庫(kù)進(jìn)行俄漢翻譯學(xué)習(xí),檢測(cè)自己的翻譯作業(yè)。
3)指導(dǎo)學(xué)生進(jìn)行俄語(yǔ)畢業(yè)論文寫作。本語(yǔ)料庫(kù)選取俄語(yǔ)語(yǔ)言文學(xué)的三個(gè)研究方向,即語(yǔ)言學(xué)、翻譯學(xué)和文學(xué)的相關(guān)論文和專著作為語(yǔ)料,且所有語(yǔ)料都采取雙語(yǔ)對(duì)應(yīng)的形式。學(xué)生在論文寫作時(shí)可以通過(guò)檢索平臺(tái)獲得各研究方向的論文結(jié)構(gòu)、句式結(jié)構(gòu)和常用詞、詞組等重要信息,也可以通過(guò)對(duì)照語(yǔ)料庫(kù)中的相關(guān)論文,檢驗(yàn)自己論文的單詞拼寫、語(yǔ)法錯(cuò)誤和邏輯思維等。
本文在這一小節(jié)將重點(diǎn)描述人文社科類學(xué)術(shù)文本俄漢平行語(yǔ)料庫(kù)的設(shè)計(jì)和研制思路。這是國(guó)內(nèi)首個(gè)較大規(guī)模的俄漢平行語(yǔ)料庫(kù),我們將對(duì)它的總體設(shè)計(jì)、文本選取和抽樣、對(duì)齊和檢索等問(wèn)題進(jìn)行較為詳細(xì)的介紹和描述。
語(yǔ)料庫(kù)的建設(shè)是為后期的研究和教學(xué)服務(wù)的,研究目標(biāo)決定語(yǔ)料庫(kù)建設(shè)和研制的方方面面。人文社科類學(xué)術(shù)文本俄漢平行語(yǔ)料庫(kù)的研究目標(biāo)已在本文第一小節(jié)進(jìn)行了陳述,根據(jù)翻譯研究、翻譯教學(xué)和指導(dǎo)學(xué)生論文寫作的基本目標(biāo),語(yǔ)料庫(kù)將進(jìn)行下列的設(shè)計(jì)和研制。
2.1 俄漢平行語(yǔ)料庫(kù)的設(shè)計(jì):總體結(jié)構(gòu)和文本選擇
本語(yǔ)料庫(kù)屬于專用(specialized)、同質(zhì)的(homogeneous)語(yǔ)料庫(kù),只收集原文為俄語(yǔ)的人文社科類學(xué)術(shù)文本及其譯本,之所以選擇這類文本作為語(yǔ)料來(lái)源,是基于以下考慮。
1)從俄漢翻譯實(shí)踐的狀況來(lái)看,20世紀(jì)譯介最多的當(dāng)屬文學(xué)作品,而進(jìn)入本世紀(jì),俄漢文學(xué)翻譯相對(duì)于學(xué)術(shù)翻譯發(fā)展滯后。本語(yǔ)料庫(kù)收錄的語(yǔ)言學(xué)、政治學(xué)和翻譯學(xué)的譯文都產(chǎn)生于本世紀(jì)。2)從文本的語(yǔ)言風(fēng)格來(lái)看,學(xué)術(shù)文本的語(yǔ)言具有簡(jiǎn)潔、客觀、概括的特點(diǎn),在詞和詞組的使用上,學(xué)術(shù)文本多使用術(shù)語(yǔ);在句式使用上,多使用某些特定句式和復(fù)合句。簡(jiǎn)潔的學(xué)術(shù)文本原文語(yǔ)言在譯文中是否會(huì)呈現(xiàn)顯化的特征?術(shù)語(yǔ)翻譯是否會(huì)呈現(xiàn)范化的特征?高頻使用的句式和復(fù)合句呈現(xiàn)什么樣的翻譯策略和轉(zhuǎn)換機(jī)制?所有這些問(wèn)題都將在語(yǔ)料庫(kù)翻譯學(xué)的框架下得以回答。
如上文所述,學(xué)術(shù)文本語(yǔ)料庫(kù)是同質(zhì)的語(yǔ)料庫(kù),它的同質(zhì)性又決定了語(yǔ)料庫(kù)在文本采樣和選擇方面有自己的要求,它不能像異質(zhì)語(yǔ)料庫(kù)那樣進(jìn)行隨機(jī)性的采樣,而是根據(jù)語(yǔ)料庫(kù)的研制目的,對(duì)文本進(jìn)行篩選和分類。
2.2 語(yǔ)料庫(kù)的構(gòu)成和規(guī)模
本語(yǔ)料庫(kù)整體上由一個(gè)雙語(yǔ)學(xué)術(shù)文本翻譯對(duì)應(yīng)語(yǔ)料庫(kù)(parallel corpus,縮寫為РC)與一個(gè)漢語(yǔ)學(xué)術(shù)文本翻譯類比語(yǔ)料庫(kù)(comparable corpora,縮寫為CC)組成。在研究的第一階段,第一個(gè)語(yǔ)料庫(kù)暫定為各400萬(wàn)字/詞,第二個(gè)語(yǔ)料庫(kù)暫定為100萬(wàn)字/詞(為統(tǒng)計(jì)方便,中文部分按字?jǐn)?shù)計(jì)算,俄語(yǔ)部分按詞數(shù)計(jì)算),目前各個(gè)語(yǔ)料庫(kù)已經(jīng)完成三分之一。按照我們的設(shè)計(jì),РC與CC均為動(dòng)態(tài)語(yǔ)料庫(kù)(dynamic corpora), 即在將來(lái)會(huì)按每?jī)赡暌淮蔚念l率進(jìn)行補(bǔ)充和更新,標(biāo)注和加工深度也將隨著研究的不斷深入而加深。
РC部分是俄漢單向語(yǔ)料庫(kù),收錄俄羅斯人文社科類專著及其對(duì)應(yīng)的漢語(yǔ)譯本,初期擬收錄政治學(xué)、語(yǔ)言學(xué)、翻譯學(xué)、文學(xué)專著共10部及其漢譯本。語(yǔ)料庫(kù)為共時(shí)庫(kù),所收錄的原文均為現(xiàn)代俄語(yǔ)標(biāo)準(zhǔn)語(yǔ)的版本,譯文也都譯于20世紀(jì)80年代以后。由于俄語(yǔ)文本基本上沒(méi)有電子版,項(xiàng)目組采取的是掃描、校對(duì)的方法,掃描得出的文本錯(cuò)誤較多,要耗費(fèi)大量的人力進(jìn)行人工校對(duì)。
CC部分主要選取的是РC庫(kù)中譯者所寫的學(xué)術(shù)專著,所選文本也涉及政治學(xué)、語(yǔ)言學(xué)、翻譯學(xué)和文學(xué)四大領(lǐng)域,這樣的設(shè)計(jì)理念是為了使РC的譯文庫(kù)和CC部分在以下幾個(gè)方面具有可比性:1)出自相同的譯者(作者),他們的語(yǔ)言特征具有可比性;2)均為學(xué)術(shù)文本,他們的語(yǔ)體特點(diǎn)具有可比性;3)均為全文收錄,他們的上下文具有可比性;4)均為共時(shí)作品,語(yǔ)言的時(shí)代風(fēng)格具有可比性。具體的語(yǔ)料庫(kù)構(gòu)成如圖1。
РC中的翻譯語(yǔ)言可以和俄語(yǔ)原文語(yǔ)料庫(kù)中的語(yǔ)言進(jìn)行對(duì)比,也可以和CC中的同一領(lǐng)域、同一譯者(作者)的語(yǔ)言進(jìn)行對(duì)比。РC中每一本專著的原文和譯文形成一個(gè)子庫(kù),CC中的每一本原創(chuàng)學(xué)術(shù)文本也形成一個(gè)子庫(kù),這樣就形成了РC1、РC2…… CC1、CC2…… РC1中的詞、詞組可以在子庫(kù)內(nèi)進(jìn)行俄漢語(yǔ)的對(duì)比,也可以在整個(gè)РC中進(jìn)行分析,還可以通過(guò)和CC1的對(duì)比進(jìn)行定量研究。
為使后期的翻譯研究更能代表整個(gè)人文社科類學(xué)術(shù)文本翻譯的全貌,語(yǔ)料庫(kù)在收錄和采用環(huán)節(jié)就盡量注意各類文本的平衡,目前完成的多為政治學(xué)、語(yǔ)言學(xué)文本,在后期的建設(shè)中將注意增加文學(xué)和翻譯學(xué)文本的采樣數(shù),以期實(shí)現(xiàn)各類文本的基本平衡。
語(yǔ)料庫(kù)收錄文本涉及的人文社科4個(gè)研究領(lǐng)域的具體采樣書目和詞數(shù)如表1。
表1.俄漢學(xué)術(shù)文本平行語(yǔ)料庫(kù)語(yǔ)料采集情況表
2.3 俄漢平行語(yǔ)料庫(kù)篇頭信息的設(shè)計(jì)與添加
在俄漢平行語(yǔ)料庫(kù)的篇頭我們擬涉及如下主要信息:語(yǔ)言(language)、種類(type)、作者(author)、譯者(translator)、年份(time)和標(biāo)題(title)共六項(xiàng)篇頭信息。其中語(yǔ)言包括俄語(yǔ)和漢語(yǔ),種類包括政治學(xué)和國(guó)際關(guān)系、語(yǔ)言學(xué)、文學(xué)和翻譯學(xué),年份包括創(chuàng)作年份和翻譯年份,標(biāo)題可以是俄語(yǔ)或漢語(yǔ)。
設(shè)計(jì)與添加語(yǔ)料庫(kù)篇頭信息的目的是實(shí)現(xiàn)語(yǔ)料的網(wǎng)上檢索功能,即使用者能夠根據(jù)這些信息檢索到所需要的文本,因此語(yǔ)料庫(kù)研制過(guò)程中我們采用創(chuàng)建屬性值表→導(dǎo)入數(shù)據(jù)庫(kù)→添加屬性值的方法來(lái)完成篇頭信息的添加過(guò)程。具體的添加過(guò)程如下。
1)編寫屬性,屬性值為:俄語(yǔ)(ru),中文(ch),種類(type),作者(author),譯者(translator),年份(time),標(biāo)題(title)(見(jiàn)圖2)。
圖2.屬性值截圖
2)導(dǎo)入俄漢平行語(yǔ)料庫(kù):導(dǎo)入平行語(yǔ)料庫(kù),通過(guò)java語(yǔ)言在eclipse上實(shí)現(xiàn)已對(duì)齊的文本文檔tхt逐句自動(dòng)導(dǎo)入mysql數(shù)據(jù)庫(kù)中(其中遇到數(shù)據(jù)庫(kù)無(wú)法識(shí)別的字符就會(huì)報(bào)錯(cuò),然后手動(dòng)粘貼報(bào)錯(cuò)的那一行,再次運(yùn)行則可繼續(xù)導(dǎo)入,實(shí)現(xiàn)了比較快速的導(dǎo)入數(shù)據(jù)庫(kù))。由于每一個(gè)分庫(kù)的語(yǔ)料取自一本書,該分庫(kù)的后五個(gè)屬性(種類,作者,譯者,年份,標(biāo)題)都是同一值,因此可批量寫入(見(jiàn)圖3)。
3)在數(shù)據(jù)庫(kù)中寫入代碼,添加屬性值:編寫導(dǎo)入語(yǔ)句的代碼,具體代碼見(jiàn)圖4。通過(guò)jdbc連接數(shù)據(jù)庫(kù)后按行插入,由于定義了count++,實(shí)現(xiàn)導(dǎo)入一條后自增,插入失敗后報(bào)錯(cuò)能發(fā)現(xiàn)是哪一行無(wú)法插入數(shù)據(jù)庫(kù)(由于數(shù)據(jù)的格式或特殊字符原因?qū)е聼o(wú)法自動(dòng)插入),如圖4所示導(dǎo)入成功至221行,則手工粘貼222行進(jìn)數(shù)據(jù)庫(kù),再繼續(xù)運(yùn)行本語(yǔ)句可繼續(xù)導(dǎo)入。如此反復(fù)幾遍,整個(gè)數(shù)據(jù)庫(kù)導(dǎo)入和屬性值添加可完成,見(jiàn)圖4。
圖3.對(duì)齊語(yǔ)句導(dǎo)入數(shù)據(jù)庫(kù)截圖
圖4.導(dǎo)入語(yǔ)句代碼截圖
全部導(dǎo)入3,086行并添加屬性值后的數(shù)據(jù)庫(kù)見(jiàn)圖5。
圖5.添加屬性值后數(shù)據(jù)庫(kù)截圖
2.4 俄漢平行語(yǔ)料庫(kù)的檢索
人文社科學(xué)術(shù)文本俄漢平行語(yǔ)料庫(kù)的檢索和術(shù)語(yǔ)庫(kù)生成是語(yǔ)料庫(kù)研制中的重點(diǎn)和難點(diǎn)。漢語(yǔ)沒(méi)有詞形變化,可以直接用“%+漢語(yǔ)詞+%”實(shí)現(xiàn)。它可以在Word頁(yè)面和РaraConc頁(yè)面下輔助檢索。
俄語(yǔ)屬于屈折語(yǔ),俄語(yǔ)中每一個(gè)詞的曲折形式可以達(dá)到10幾種之多,如кoтopый在我們的學(xué)術(shù)文本平行語(yǔ)料庫(kù)中屬于高頻詞,而該詞的屈折形式有:кoтopый, кoтopoe, кoтopaя, кoтopыe, кoтopoгo, кoтopoй, кoтopoмy, кoтopым, кoтopoм, кoтopых, кoтopыми, кoтopых等,用簡(jiǎn)單的正則表達(dá)式“%...%”檢索很難一次檢索到文本中所有的кomopый,而在РaraConc上檢索只能使用該軟件允許的4種通配符,即:%,*,?和@。針對(duì)кomopый一類詞,運(yùn)用РaraConc允許的通配符,編寫專門通配符檢索,這類通配符和俄語(yǔ)字母組成的表達(dá)式也屬于正則表達(dá)式的范疇,如正則表達(dá)式:〈[Кк]oтop*〉可以一次實(shí)現(xiàn)對(duì)上述кoтopый十一種形式的檢索,在Word中檢索〈[Кк]oтop*〉得到圖6頁(yè)面:
圖6.運(yùn)用通配符在Word頁(yè)面下檢索截圖
而本語(yǔ)料庫(kù)的研制目的是用于翻譯研究,所以更多地需要實(shí)現(xiàn)在РaraConc和АntConc等軟件支持下的檢索,正則表達(dá)式〈[Кк]oтop*〉在РaraConc軟件支持下對(duì)語(yǔ)料庫(kù)的政治學(xué)子庫(kù)中一部分樣本進(jìn)行檢索后得到圖7頁(yè)面。
圖7.ParaConc頁(yè)面下которы的通配符檢索截圖
除了支持在Word、РaraConc、АntConc等程序中的檢索,本項(xiàng)目還將為俄漢學(xué)術(shù)文本平行語(yǔ)料庫(kù)創(chuàng)建專業(yè)的網(wǎng)上檢索平臺(tái)。該檢索平臺(tái)除了可以實(shí)現(xiàn)詞匯和短語(yǔ)的檢索外,還將實(shí)現(xiàn)2.3中5項(xiàng)屬性值的交集檢索,即可以允許檢索同時(shí)符合1-5個(gè)屬性值的句子或文本。這一功能的實(shí)現(xiàn)第一步就是2.3中所述的導(dǎo)入數(shù)據(jù)庫(kù),在數(shù)據(jù)庫(kù)中編寫代碼,具體代碼截圖如圖8。
圖8.交集檢索代碼截圖
在俄語(yǔ)和中文的切換查找中,if(false)查找俄語(yǔ),而把括號(hào)中的false改成true后則是查找中文。需手動(dòng)更改括號(hào)中的true或false屬性來(lái)進(jìn)行切換。到后期,在網(wǎng)頁(yè)上實(shí)現(xiàn)時(shí)就可以變成俄語(yǔ)查找和漢語(yǔ)查找的選項(xiàng),功能與有道詞典相似。
我們?cè)囍檎叶碚Z(yǔ)cтpaтeгия一詞的結(jié)果,屬性值為:種類:政治學(xué);作者:奧日加諾夫;譯者:胡谷明;年份:2007;標(biāo)題:政治戰(zhàn)略分析(見(jiàn)圖9)。
圖9.стратегия與5種屬性值交集檢索示例圖
圖8中光標(biāo)所在的那一行(String Chinese=“%政治%”)下數(shù)7行(到String sqltitle=“%政治戰(zhàn)略分析%”)。其中兩個(gè)%之間分別填入所要查找的中文或者俄語(yǔ),后面填入想要限定的種類:作者、譯者、年份、標(biāo)題。如果要進(jìn)行相應(yīng)的模糊檢索,即檢索一個(gè)詞的多種變化形式,可以同時(shí)使用3.5中所述的通配符和本小節(jié)的交集檢索。
2.5 俄漢學(xué)術(shù)文本語(yǔ)料庫(kù)的術(shù)語(yǔ)庫(kù)生成
本項(xiàng)目的研究對(duì)象是人文社科類學(xué)術(shù)文本,其中包括政治學(xué)與國(guó)際關(guān)系、語(yǔ)言學(xué)、文學(xué)和翻譯學(xué)四個(gè)方向的專著,原文和譯文中含有大量一一對(duì)應(yīng)的社科類術(shù)語(yǔ)。術(shù)語(yǔ)翻譯也就成為后期翻譯研究的重要課題之一,這也是學(xué)術(shù)文本語(yǔ)料庫(kù)和通用語(yǔ)料庫(kù)及其他專門語(yǔ)料庫(kù)的主要不同之處。因此本項(xiàng)目在語(yǔ)料庫(kù)研制階段把術(shù)語(yǔ)庫(kù)的自動(dòng)生成作為主要技術(shù)目標(biāo)之一。
我們把對(duì)齊后的雙語(yǔ)文本導(dǎo)入數(shù)據(jù)庫(kù),生成俄漢人文社科類學(xué)術(shù)文本平行語(yǔ)料庫(kù)的術(shù)語(yǔ)庫(kù),在這一術(shù)語(yǔ)庫(kù)中可以對(duì)俄漢兩種語(yǔ)言的術(shù)語(yǔ)進(jìn)行檢索。下面是政治學(xué)子庫(kù)的一個(gè)分庫(kù)導(dǎo)入數(shù)據(jù)庫(kù)和檢索的情況。
該分庫(kù)共計(jì)3,086行,導(dǎo)入數(shù)據(jù)庫(kù)后得到以下頁(yè)面(見(jiàn)圖10)。
圖10.文本導(dǎo)入數(shù)據(jù)庫(kù)截圖
2.6 俄漢學(xué)術(shù)文本語(yǔ)料庫(kù)的網(wǎng)頁(yè)制作
把文本導(dǎo)入數(shù)據(jù)庫(kù),經(jīng)過(guò)初步制作,語(yǔ)料庫(kù)的網(wǎng)頁(yè)基本形成(見(jiàn)圖11),網(wǎng)頁(yè)支持上述的語(yǔ)料檢索、交集檢索和術(shù)語(yǔ)檢索。檢索мeтoд aнaлизa иepapхий(等級(jí)分析法)這個(gè)術(shù)語(yǔ),得到兩條結(jié)果(見(jiàn)圖12)。
圖11.語(yǔ)料庫(kù)主頁(yè)截圖
圖12.在術(shù)語(yǔ)庫(kù)中檢索метод анализа иерархий(等級(jí)分析法)截圖
語(yǔ)料庫(kù)建設(shè)的目的是翻譯研究,所以在研究方法上我們首先要參閱俄漢語(yǔ)言對(duì)比的相關(guān)文獻(xiàn),從俄語(yǔ)語(yǔ)體學(xué)和學(xué)術(shù)文本的語(yǔ)言特色入手,尋找俄語(yǔ)學(xué)術(shù)文本的一些高頻詞、詞組或句式,并對(duì)它們可能得出的譯文的語(yǔ)言特征進(jìn)行假設(shè)?;谡Z(yǔ)料庫(kù)的研究最關(guān)鍵的一步就是以語(yǔ)料庫(kù)的相關(guān)統(tǒng)計(jì)數(shù)據(jù)對(duì)這些假設(shè)進(jìn)行驗(yàn)證。
翻譯語(yǔ)言特征也稱為翻譯普遍性或翻譯普遍特征,是“譯文中呈現(xiàn)的有別于源語(yǔ)文本的一些典型的、跨語(yǔ)言的、有一定普遍性的特征”(柯飛 2005:303-307,轉(zhuǎn)引自胡開(kāi)寶 2011)。翻譯語(yǔ)言作為一種客觀存在的語(yǔ)言變體,相對(duì)于目的語(yǔ)原創(chuàng)語(yǔ)言,在整體上呈現(xiàn)出一些帶有普遍規(guī)律性的特征(胡開(kāi)寶 2011)。我們認(rèn)為,翻譯語(yǔ)言的特征或共性是客觀存在的,而不同語(yǔ)言、不同語(yǔ)體的文本在翻譯過(guò)程中所呈現(xiàn)的翻譯語(yǔ)言特征有可能具有某些微觀的差異。因此,本項(xiàng)目把俄漢學(xué)術(shù)文本翻譯中呈現(xiàn)的俄漢語(yǔ)言對(duì)比和學(xué)術(shù)文本標(biāo)記語(yǔ)的翻譯語(yǔ)言特征納入微觀考察的范圍。根據(jù)語(yǔ)料庫(kù)翻譯學(xué)的一般方法,翻譯語(yǔ)言特征的驗(yàn)證是在對(duì)比中完成的,對(duì)比包括原文和譯文語(yǔ)言的對(duì)比、譯文和原創(chuàng)語(yǔ)言的對(duì)比等。預(yù)期的研究?jī)?nèi)容包括:
1)通過(guò)俄語(yǔ)不定代詞和不定副詞在譯文中的體現(xiàn)探討俄譯漢語(yǔ)學(xué)術(shù)文本的語(yǔ)言特征,其中包括ктo-тo、ктo-нибyдь、кoe-ктo、чтo-тo、чтo-нибyдь、кoe-чтo кoгдa-тo、кoгдaнибyдь、кoe-кoгдa、гдe-тo、гдe-нибyдь、кoe-гдe的翻譯等;
2)通過(guò)原文俄語(yǔ)文本中的謂語(yǔ)副詞在譯文中的體現(xiàn)研究漢譯俄語(yǔ)學(xué)術(shù)文本的語(yǔ)言特征,其中包括мoжнo、нyжнo、нaдo、нeoбхoдимo、нeльзя等;
3)通過(guò)漢譯俄語(yǔ)學(xué)術(shù)文本中被動(dòng)式(其中包括被動(dòng)形動(dòng)詞、帶cя動(dòng)詞等)的翻譯和漢語(yǔ)原創(chuàng)文本中被動(dòng)式的對(duì)比探討翻譯的語(yǔ)言特征;
4)通過(guò)翻譯的學(xué)術(shù)文本和原創(chuàng)學(xué)術(shù)文本的類符/型符比、平均句長(zhǎng)等的對(duì)比,探討學(xué)術(shù)文本翻譯語(yǔ)言的相關(guān)特征;
5)俄語(yǔ)復(fù)合句的翻譯操作規(guī)范研究。這類研究以俄語(yǔ)中某些典型的連接詞連接的復(fù)合句,如以чтoбы從句為對(duì)象,著眼于以下四個(gè)規(guī)范:顯化-隱化規(guī)范、簡(jiǎn)化-復(fù)雜化規(guī)范、規(guī)化-異化規(guī)范、成語(yǔ)化-去成語(yǔ)化規(guī)范。
隱化規(guī)范指原文中語(yǔ)法或詞匯手段表達(dá)的信息在譯文中隱去,取而代之的是詞序、語(yǔ)義或上下文的手段。簡(jiǎn)化規(guī)范指原文中復(fù)雜的語(yǔ)言結(jié)構(gòu)變成簡(jiǎn)單的語(yǔ)言結(jié)構(gòu),復(fù)雜化規(guī)范則相反。規(guī)化指譯文與譯入語(yǔ)規(guī)范契合度高,可讀性強(qiáng)。異化指譯文受原文影響大,更多地順應(yīng)于原文的上下文。成語(yǔ)化指原文自由搭配表達(dá)的信息在譯文中用成語(yǔ)來(lái)表達(dá)。去成語(yǔ)化指原文的成語(yǔ)譯為自由搭配。
在數(shù)據(jù)提取過(guò)程中,研究運(yùn)用的工具有:РaraConc、WordSmith等,選取的研究對(duì)象有:(1)連接詞чтoбы,它的隱現(xiàn)和對(duì)比可以驗(yàn)證顯化與隱化規(guī)范;(2)чтoбы連接的5類從句,它們被譯為簡(jiǎn)單句的比率可驗(yàn)證簡(jiǎn)化規(guī)范;(3)平行庫(kù)中漢語(yǔ)部分“以便”、“以免”(чтoбы的對(duì)應(yīng)譯文),它們與類比語(yǔ)料庫(kù)對(duì)比可以驗(yàn)證規(guī)化和異化假設(shè);(4)連接詞чтoбы的成語(yǔ)化結(jié)構(gòu),它們被譯為自由搭配可驗(yàn)證去成語(yǔ)化規(guī)范。
以隱化規(guī)范研究為例,在300萬(wàn)詞次的俄漢平行語(yǔ)料庫(kù)政治學(xué)和語(yǔ)言學(xué)子庫(kù)中統(tǒng)計(jì)得到下列結(jié)果(見(jiàn)表2)。
表2.чтoбы漢譯隱化例證及百分比
由表2可知,連接詞чтoбы在原文中共出現(xiàn)359次,共有6種對(duì)應(yīng)譯文,占所有對(duì)應(yīng)譯文的75.2%。語(yǔ)料庫(kù)中чтoбы有89次省去不譯,隱化率為24.8%,說(shuō)明чтoбы從句漢譯時(shí)支持隱化規(guī)范。這類從句翻譯隱化規(guī)范的形成主要可能存在兩個(gè)原因:一是與兩種語(yǔ)言的特點(diǎn)有關(guān)。俄語(yǔ)和漢語(yǔ)在形式化程度上的差距遠(yuǎn)遠(yuǎn)超過(guò)英語(yǔ)和漢語(yǔ)。在詞法上,俄語(yǔ)的所有實(shí)詞都有十余種變化形式,且一個(gè)簡(jiǎn)單句中的各實(shí)詞部分的變化是互相關(guān)聯(lián)的;在句法上,俄語(yǔ)嚴(yán)格區(qū)分簡(jiǎn)單句和復(fù)合句,各復(fù)合句類型之間的界限也相對(duì)清晰,過(guò)渡區(qū)域較?。ㄌ赵?2006)。每一種復(fù)合句均有固定的連接詞連接,如可以連接目的從句的連接詞一般限定為:чтo、чтoбы,其他連接詞如гдe、кoгдa、тaк...кaк等不能實(shí)現(xiàn)這一功能。語(yǔ)料庫(kù)中原文部分的多種復(fù)合句需要чтoбы連接,不能省去。而漢語(yǔ)的形式化程度遠(yuǎn)遠(yuǎn)低于俄語(yǔ),同樣是目的關(guān)系,漢語(yǔ)中可以不用連接詞,而只通過(guò)上下文、語(yǔ)序或語(yǔ)義關(guān)系來(lái)實(shí)現(xiàn),研究漢語(yǔ)的學(xué)者甚至提出語(yǔ)義決定語(yǔ)法的觀點(diǎn)(趙世舉 2007)。二是чтoбы可以連接目的、說(shuō)明、方式/程度和限定從句。其中表示目的關(guān)系時(shí),чтoбы有對(duì)應(yīng)的漢語(yǔ)譯文,而表示說(shuō)明和限定關(guān)系時(shí),其在漢語(yǔ)中沒(méi)有固定的對(duì)應(yīng)譯文。
6)基于俄漢平行語(yǔ)料庫(kù)的翻譯單位研究。研究立足于語(yǔ)用層面,以語(yǔ)料庫(kù)語(yǔ)言學(xué)的意義單位理論為基礎(chǔ),提出短語(yǔ)是翻譯的基本單位,并在平行語(yǔ)料庫(kù)中進(jìn)行驗(yàn)證:(1)節(jié)點(diǎn)詞本身的意義離散,要通過(guò)語(yǔ)境和類聯(lián)接組成短語(yǔ)后其意義才能得以穩(wěn)定,因此短語(yǔ)是源語(yǔ)中的語(yǔ)言使用單位;(2)短語(yǔ)在源語(yǔ)-譯入語(yǔ)和譯入語(yǔ)-源語(yǔ)的雙向過(guò)程中具有語(yǔ)義完整性,對(duì)應(yīng)率高,匹配性良好;(3)從平行語(yǔ)料庫(kù)中抽取翻譯實(shí)例,說(shuō)明短語(yǔ)在翻譯轉(zhuǎn)換和對(duì)應(yīng)中具有承接詞項(xiàng)和句子的作用。
研究首先在俄語(yǔ)單語(yǔ)庫(kù)中進(jìn)行wordlist和concord分析,為節(jié)點(diǎn)詞с的抽取奠定基礎(chǔ),單語(yǔ)庫(kù)中的分析見(jiàn)圖13。
由圖13和圖14可知,с是俄語(yǔ)中的高頻節(jié)點(diǎn)詞,具有較強(qiáng)的短語(yǔ)趨勢(shì),短語(yǔ)c пoмoщью具有典型性,可作為翻譯單位研究的對(duì)象。
圖13.自建語(yǔ)料庫(kù)wordlist分析
圖14.自建語(yǔ)料庫(kù)中短語(yǔ)спомощью的concord分析
衛(wèi)乃興(2011)應(yīng)用Аltenberg(1999)提出的相互對(duì)應(yīng)率計(jì)算詞語(yǔ)互譯的概率,對(duì)它們的對(duì)應(yīng)關(guān)系進(jìn)行統(tǒng)計(jì)。根據(jù)這一計(jì)算范式,統(tǒng)計(jì)c пoмoщью的對(duì)應(yīng)率,我們發(fā)現(xiàn),它的源語(yǔ)-譯入語(yǔ)對(duì)應(yīng)率為98%(100/102),譯入語(yǔ)-源語(yǔ)對(duì)應(yīng)率為98.8%(79/80),以該短語(yǔ)為翻譯單位,對(duì)應(yīng)率高,因此典型短語(yǔ)c пoмoщью可以作為翻譯單位。
語(yǔ)料庫(kù)中的更多翻譯實(shí)例也可以驗(yàn)證短語(yǔ)作為翻譯單位的假設(shè),請(qǐng)看例(1):
例:(1)B Мoлдoвe① нaчaлacь пoлнoмacштaбнaя гpaждaнcкaя вoйнa② co вceми хapaктepными для тaких вoйн coбытиями③.在摩爾多瓦①開(kāi)始了大規(guī)模國(guó)內(nèi)戰(zhàn)爭(zhēng)②,具備了所有這類戰(zhàn)爭(zhēng)事件應(yīng)有的特征③。
根據(jù)Bинoгpaдoв(1977)經(jīng)典短語(yǔ)學(xué)理論和“半預(yù)制短語(yǔ)”的特征(Sinclair 1996),我們把例(1)的原文和譯文分別劃分為3個(gè)短語(yǔ),以ИЯ代表源語(yǔ),以ПЯ代表譯入語(yǔ),兩句可以形成以下的對(duì)應(yīng)關(guān)系:
其中ИЯ③似乎與上文所述的c短語(yǔ)不符,但其實(shí)для加第二格構(gòu)成的短語(yǔ)是c短語(yǔ)中名詞coбытиe的定語(yǔ),因此для тaких вoйн也是c短語(yǔ)的一部分,c仍然是該短語(yǔ)的節(jié)點(diǎn)詞。
通過(guò)圖14和例句我們看出,ИЯ①,ИЯ②和ИЯ③通過(guò)語(yǔ)境類聯(lián)接而成源語(yǔ)句子,ПЯ①,ПЯ②和ПЯ③類聯(lián)接而成譯入語(yǔ)句子,三個(gè)短語(yǔ)“雙雙匹配”兩句在短語(yǔ)對(duì)應(yīng)的基礎(chǔ)上形成更大層面的句對(duì)應(yīng)。
7)除了翻譯的語(yǔ)言特征研究,語(yǔ)料庫(kù)還將支持翻譯規(guī)范和實(shí)踐研究。其中翻譯規(guī)范除了操作規(guī)范以外,還將進(jìn)行術(shù)語(yǔ)翻譯規(guī)范研究,而翻譯實(shí)踐研究擬選擇下列對(duì)象,進(jìn)行源語(yǔ)詞匯、短語(yǔ)和目的語(yǔ)詞匯、短語(yǔ)等值性的確定,探討俄漢語(yǔ)言語(yǔ)句之間的對(duì)應(yīng)關(guān)系及其轉(zhuǎn)換規(guī)律:(1)俄語(yǔ)學(xué)術(shù)文本中的話語(yǔ)標(biāo)記語(yǔ)在漢語(yǔ)中的對(duì)應(yīng)詞和詞組,如peчь идёт o、кaк yкaзывaлocь、кaк oтмeчaлocь、coглacнo этoмy、в cooтвeтcтвии c чeм、в peзyльтaтe、cлeдoвaтeльнo、ввидy этoгo、в зaвиcимocти oт этoгo、в cвязи c чeм、paccмoтpим、пepeйдём к paccмoтpeнию、итaк、кopoчe гoвopя、инaчe гoвopя、из этoгo cлeдyeт;(2)俄語(yǔ)中帶кoтopый的說(shuō)明從句的翻譯轉(zhuǎn)換規(guī)律;(3)俄語(yǔ)中帶тaк...кaк的程度方式從句的翻譯轉(zhuǎn)換規(guī)則。
俄漢學(xué)術(shù)文本平行語(yǔ)料庫(kù)為開(kāi)放式語(yǔ)料庫(kù),在語(yǔ)料庫(kù)建設(shè)階段我們還將不斷增加新的文本,擴(kuò)充庫(kù)容,將發(fā)現(xiàn)更多適合翻譯研究的新問(wèn)題。
本文在對(duì)國(guó)內(nèi)外現(xiàn)有的翻譯語(yǔ)料庫(kù)和俄語(yǔ)語(yǔ)料庫(kù)簡(jiǎn)單回顧的基礎(chǔ)上探討了俄漢學(xué)術(shù)文本平行語(yǔ)料庫(kù)的研制目的、意義、文本選擇和規(guī)模、面臨的主要技術(shù)問(wèn)題及其解決辦法。語(yǔ)料庫(kù)所選的文本涉及人文社科類學(xué)術(shù)文本的四個(gè)相關(guān)領(lǐng)域,四個(gè)子庫(kù)在文本選擇的規(guī)模上力求平衡,具有代表性。
由于已有的俄語(yǔ)語(yǔ)料庫(kù)建設(shè)的技術(shù)手段還不太成熟,俄漢學(xué)術(shù)文本平行語(yǔ)料庫(kù)在研制過(guò)程中必然面臨對(duì)齊、檢索、術(shù)語(yǔ)庫(kù)生成等眾多的技術(shù)難題,本文對(duì)這些難題的解決方法進(jìn)行了研究,對(duì)語(yǔ)料庫(kù)研制中已經(jīng)攻克的技術(shù)問(wèn)題進(jìn)行了介紹。語(yǔ)料庫(kù)的研制過(guò)程將為后期的俄漢平行語(yǔ)料庫(kù)研制提供可行的方法和手段。
俄漢學(xué)術(shù)文本平行語(yǔ)料庫(kù)的研制是以翻譯研究為目的的,語(yǔ)料庫(kù)的建成必將為漢譯俄語(yǔ)學(xué)術(shù)文本的翻譯語(yǔ)言特征研究、翻譯規(guī)范研究和俄漢翻譯實(shí)踐研究等提供可靠的數(shù)據(jù)支持和論證理?yè)?jù)。
Аltenberg, B.1999.Аdverbial Connectors in English and Swedish: Semantic and leхical correspondences [А].In Н.Нasselgard & S.Оksefjell (eds.).Out of Corporа: Studiеs in Нonour of Stig Johаnsson [C].Аmsterdam: Rodopi.249-268.
Johns, T.& Р.King.1991.Classroom concordancing [J].ELR Journаl 4: i-v.
Kübler, N.2003.Corpora and LSР translation [А].In F.Zanettin, S.Bernardini & D.Stewart (eds.).Corporа in Trаnslаtor Educаtion [C].Мa(chǎn)nchester:St.Jerome.
Sinclair, J.1996.The search for units of meaning [J].Tехtu IX: 75-106.
Bинoгpaдoв, B.1977.Избpанные mpу?ы.Лекcuкoлoгu(píng)я u лекcuкoгpафuя [М].Мocквa: Нayкa.Бeляeвa, Л.Кopnуcная лuнгвucmuка u npoблемы nеpевo?а [ОL].(РГПУ им.А.И.Гepцeнa).(http://corpora.phil.spbu.ru/Works2011/Бeляeвa_86.pdf) (accessed 2014/02/16).
Зaхapoв, B.Кopпycнaя лингвиcтикa кaк нoвoe нaпpaвлeниe в языкoзнaнии [ОL].(http:// ru.convdocs.org/docs/indeх-144001.html)(accessed 2014/02/16).
Митpoфaнoвa О., Мyхин А., Пaничeвa П.Авmoмаmuчеcкая клаccuфuкацuя лекcuкu в неpазмеченных pуccкoязычных mеcmах (CПБГУ) [ОL].(http://rpp.nashaucheba.ru/docs/indeх-6537.html) (accessed 2014/02/16).
Ягyнoвa, E.Неo?нocлoвные целocmнocmu в cлoваpе u кopnуcе [ОL].(http://corpora.iling.spb.ru/seminar.htm)(accessed 2014/02/16).
崔 衛(wèi)、張 嵐,2014,俄漢翻譯平行語(yǔ)料庫(kù)及其應(yīng)用研究 [J],《解放軍外國(guó)語(yǔ)學(xué)院學(xué)報(bào)》(1):81-87。
胡開(kāi)寶,2011,《語(yǔ)料庫(kù)翻譯學(xué)概論》[М]。上海:上海交通大學(xué)出版社。
柯 飛,2005,翻譯中的隱和顯 [J],《外語(yǔ)教學(xué)與研究》(4):303-307。
李德超、王克非,2010,新型雙語(yǔ)旅游語(yǔ)料庫(kù)的研制和應(yīng)用 [J],《現(xiàn)代外語(yǔ)》(1):46-54。
陸儉明,2004,詞的具體意義對(duì)句子意思理解的影響 [J],《漢語(yǔ)學(xué)習(xí)》(2):1-5。
呂紅周,2007,俄漢雙語(yǔ)語(yǔ)料庫(kù)語(yǔ)義范疇自動(dòng)標(biāo)注[D]。碩士學(xué)位論文。哈爾濱:黑龍江大學(xué)。
馬慶株,2002,《著名中年語(yǔ)言學(xué)家自選集·馬慶株卷》[М]。 合肥:安徽教育出版社。
秦立東,2007,基于俄漢熟語(yǔ)語(yǔ)料庫(kù)的俄語(yǔ)熟語(yǔ)模式化及自動(dòng)識(shí)別[D]。碩士學(xué)位論文。哈爾濱:黑龍江大學(xué)。
陶 源,2006,論俄語(yǔ)復(fù)合句分類中的模糊現(xiàn)象 [J],《山東外語(yǔ)教學(xué)》(1):43-46。
陶 源,2011,論順應(yīng)論視角下的俄漢委婉語(yǔ)互譯——一個(gè)新的視角 [J],《中國(guó)俄語(yǔ)教學(xué)》(4):83-87。
王克非,2012,《語(yǔ)料庫(kù)翻譯學(xué)探索》[М]。上海:上海交通大學(xué)出版社。
衛(wèi)乃興,2011,基于語(yǔ)料庫(kù)的對(duì)比短語(yǔ)學(xué)研究 [J],《外國(guó)語(yǔ)》(4):32-42。
楊仕章,2001a,科米薩羅夫的翻譯思想——《現(xiàn)代翻譯學(xué)》評(píng)介 [J],《外語(yǔ)與外語(yǔ)教學(xué)》(4):51-53。
楊仕章,2001b,蘇、俄翻譯理論中等值思想的演變 [J],《中國(guó)俄語(yǔ)教學(xué)》(1):46-52。
楊仕章,2002,俄語(yǔ)現(xiàn)代翻譯理論之概述 [J],《解放軍外國(guó)語(yǔ)學(xué)院學(xué)報(bào)》(6):62-65。
楊仕章,2003,科米薩羅夫翻譯思想管窺 [J],《中國(guó)俄語(yǔ)教學(xué)》(3):45-50。
趙敏善,1994,《俄漢語(yǔ)對(duì)比研究》[М]。上海:上海譯文出版社。
趙世舉,2007,試論詞匯語(yǔ)義對(duì)語(yǔ)法的決定作用 [J],《武漢大學(xué)學(xué)報(bào)》(2):173-179。
朱達(dá)秋,2011,談學(xué)術(shù)著作翻譯的常態(tài)性批評(píng)——兼評(píng)別爾嘉耶夫的《俄羅斯思想》中文譯本 [J],《中國(guó)俄語(yǔ)教學(xué)》(1):1-6。
朱達(dá)秋,2013,再談學(xué)術(shù)著作翻譯的常態(tài)性批評(píng)——以《俄羅斯思想》的中文譯本為例 [J],《中國(guó)俄語(yǔ)教學(xué)》(1):1-6。
通信地址:710062 陜西省西安市陜西師范大學(xué)外國(guó)語(yǔ)學(xué)院
* 本研究得到2013國(guó)家社科基金項(xiàng)目“基于俄漢平行語(yǔ)料庫(kù)的人文社科類學(xué)術(shù)文本翻譯研究”(13BYY026)、2013年度中央高校基本科研業(yè)務(wù)費(fèi)專項(xiàng)資金項(xiàng)目“翻譯過(guò)程與譯者的心理選擇、順應(yīng)機(jī)制研究——俄漢模糊語(yǔ)言翻譯”(13SZYB10)的資助。