余 軍,王朝暉
(廈門理工學(xué)院外語系,福建廈門 361024)
世界遺產(chǎn)雙語語料庫的研制與應(yīng)用
——以福建為例
余 軍,王朝暉
(廈門理工學(xué)院外語系,福建廈門 361024)
目前國內(nèi)外尚無以大陸地區(qū)漢譯英旅游文本為對(duì)象的旅游翻譯語料庫,國內(nèi)對(duì)世界遺產(chǎn)旅游翻譯的研究也寥寥無幾。研制以國內(nèi)世界遺產(chǎn)旅游翻譯為研究對(duì)象的大型雙語旅游語料庫,有助于推動(dòng)基于實(shí)證語料的旅游翻譯研究的發(fā)展。以福建為例,從語料庫的構(gòu)成、語料來源、語料標(biāo)注、語料檢索等方面介紹世界遺產(chǎn)雙語語料庫的研制方法,并探討其在旅游語言及旅游翻譯的特征研究、世界遺產(chǎn)旅游翻譯的質(zhì)量評(píng)估、世界遺產(chǎn)旅游翻譯模式、計(jì)算機(jī)輔助旅游翻譯教學(xué)模式等方面的應(yīng)用。
世界遺產(chǎn)雙語語料庫;研制;應(yīng)用
近20年來,基于語料庫的翻譯研究日趨增多,構(gòu)建的語料庫主要分為譯文語料庫、類比語料庫和雙語對(duì)應(yīng)語料庫三類[1]46。上述三種語料庫,多數(shù)以文學(xué)文本為主,或是以收納百科文本為特色,而結(jié)合地域特點(diǎn)的或針對(duì)某一文類而專門研制的雙語專門語料庫則較為少見[1]46。目前,國內(nèi)外較具規(guī)模的雙語專門語料庫很少,就旅游文本而言,國外的旅游專門語料庫主要有三個(gè),分別為芬蘭、英國和日本學(xué)者研制的,其共同特點(diǎn)是都屬于容量小于100萬詞的小規(guī)模語料庫。而國內(nèi)大陸地區(qū)除中科院研制的旅游咨詢口語對(duì)話語料庫和旅館預(yù)定口語對(duì)話語料庫外,尚無專門研發(fā)的旅游語料庫,香港地區(qū)則僅有香港理工大學(xué)中文及雙語學(xué)系研制的新型雙語旅游語料庫,是香港以至全國第一個(gè)較大容量的英漢/漢英旅游語料庫,該語料庫由一個(gè)雙語旅游翻譯對(duì)應(yīng)語料庫與一個(gè)雙語旅游翻譯類比語料庫組成,語料規(guī)模為各100萬字/詞[1]48。前者目前收錄香港地區(qū)的英譯漢和漢譯英的旅游翻譯文本,后者主要收錄以香港地區(qū)為主的兩岸三地非翻譯的中文和英文旅游原生性文本。
目前國內(nèi)外尚無以大陸地區(qū)漢譯英旅游文本為對(duì)象的旅游翻譯語料庫;而國內(nèi)的旅游翻譯研究仍較多地局限于以旅游翻譯實(shí)踐詮釋國外某些翻譯理論,對(duì)旅游翻譯理論和實(shí)踐有實(shí)際指導(dǎo)意義的成果為數(shù)較少。旅游翻譯的研究應(yīng)以文化交流和傳播為目的,進(jìn)行基于雙語語料庫的實(shí)證研究,李德超博士和王克非教授在這一方面已經(jīng)為研究者提供了成功的范例,先后在《中國翻譯》、《外語電化教學(xué)》等期刊上發(fā)表了兩篇基于語料庫的旅游翻譯研究論文[2~3],其語料庫的研究方法和視角令人耳目一新。
盡管如此,香港雙語旅游語料庫目前規(guī)模還比較小(約200萬字/詞),翻譯語料來源目前僅限于香港地區(qū)。旅游翻譯研究要取得新的突破,有必要研制一個(gè)規(guī)模更大的雙語旅游語料庫。目前,國內(nèi)旅游景點(diǎn)眾多,而最能代表中華文化和自然風(fēng)光的莫過于世界文化和自然遺產(chǎn),因此,研制大型雙語旅游語料庫以推動(dòng)旅游翻譯研究,首選對(duì)象是世界遺產(chǎn)的旅游翻譯。
目前國內(nèi)對(duì)世界遺產(chǎn)旅游翻譯的研究并不多見,僅有數(shù)篇論文和一部專著。其中,張美芳教授的《文化途徑看澳門——淺談澳門世界遺產(chǎn)景點(diǎn)譯名》一文[4],考察了澳門歷史城區(qū)景點(diǎn)名稱的翻譯,并討論了導(dǎo)致不同譯名的可能成因;劉秀芝和李紅霞合著的《北京世界文化遺產(chǎn)人文景觀介紹翻譯研究》一書[5],是首部有關(guān)世界遺產(chǎn)旅游翻譯的專著,利用大量實(shí)例說明如何具體處理景觀名稱及景觀介紹翻譯過程中所遇到的各種現(xiàn)象和問題。這些研究為世界遺產(chǎn)旅游翻譯進(jìn)行了有益的探索,但都限于某一地域,難以反映國內(nèi)世界遺產(chǎn)旅游翻譯的全貌。
筆者認(rèn)為,收集覆蓋國內(nèi)40個(gè)世界遺產(chǎn)的旅游翻譯文本及英語國家世界遺產(chǎn)的原生性英文文本,研制以國內(nèi)世界遺產(chǎn)旅游翻譯為研究對(duì)象的大型雙語旅游語料庫,以世界遺產(chǎn)旅游翻譯為研究對(duì)象,以英語國家世界遺產(chǎn)原生性英文文本為“平行文本”,充分利用語料庫存儲(chǔ)數(shù)據(jù)大、計(jì)算機(jī)運(yùn)行速度快、語料庫工具能對(duì)大量數(shù)據(jù)進(jìn)行分析的諸多優(yōu)勢(shì),采用比較翻譯的研究方法,從定性與定量的角度研究中國世界遺產(chǎn)旅游翻譯,在翻譯技巧運(yùn)用、語言選擇與文化內(nèi)容處理等方面系統(tǒng)地對(duì)國內(nèi)40個(gè)世界遺產(chǎn)的旅游翻譯進(jìn)行比較分析,全面、準(zhǔn)確地描述國內(nèi)各個(gè)世界遺產(chǎn)旅游翻譯的長短優(yōu)劣與異同得失之處,揭示世界遺產(chǎn)旅游翻譯中的隱性規(guī)律,建立基于實(shí)證語料的世界遺產(chǎn)旅游翻譯理論及應(yīng)用體系,為世界遺產(chǎn)旅游翻譯評(píng)價(jià)提供一個(gè)可檢驗(yàn)的標(biāo)準(zhǔn),為我國的世界遺產(chǎn)旅游翻譯研究和教學(xué)實(shí)踐提供參考,將極大地推動(dòng)基于實(shí)證語料的旅游翻譯研究的發(fā)展。目前,筆者正以福建土樓、武夷山為研究對(duì)象,進(jìn)行世界遺產(chǎn)雙語語料庫的研制,并擬在此基礎(chǔ)上,將該語料庫擴(kuò)容至包括國內(nèi)40個(gè)世界遺產(chǎn)的大型雙語語料庫。下面簡(jiǎn)要介紹該語料庫的研制方式及應(yīng)用。
目前筆者研制的世界遺產(chǎn)雙語語料庫僅包含福建土樓和武夷山兩個(gè)世界遺產(chǎn),庫容在100萬字/詞左右,擴(kuò)容至包括國內(nèi)40個(gè)世界遺產(chǎn)后,規(guī)模應(yīng)在2 000萬字/詞左右,而且將保持動(dòng)態(tài)更新。
1.建庫類型。參照語料庫,即英語國家(如美國、英國等)世界遺產(chǎn)原生性英文語料庫,與雙語對(duì)應(yīng)語料文本進(jìn)行“平行文本”比較,研制漢英對(duì)應(yīng)語料庫,即世界遺產(chǎn)漢英對(duì)應(yīng)語料庫。
2.語料來源。全部語料限定在與世界遺產(chǎn)相關(guān)的范圍,如景觀介紹、景點(diǎn)酒店介紹、景點(diǎn)中英文招牌、民俗風(fēng)情、歷史文化、飲食文化、物產(chǎn)資源、人名地名等;語料來源主要包括正式出版物(圖書、音像制品等),非出版物(網(wǎng)頁、各類旅游宣傳材料,如酒店介紹、旅行社傳單、景點(diǎn)有關(guān)部門免費(fèi)發(fā)放的旅游小冊(cè)子等),及景點(diǎn)標(biāo)牌上的介紹文字和公示語等。
3.語料庫標(biāo)注。對(duì)全部語料進(jìn)行文本頭及詞性標(biāo)注;抽取部分典型漢英對(duì)應(yīng)語料進(jìn)行錯(cuò)誤標(biāo)注。制定標(biāo)注規(guī)范,包括錯(cuò)誤標(biāo)注分類、標(biāo)注賦碼、標(biāo)注流程,并實(shí)施嚴(yán)格的標(biāo)注質(zhì)量監(jiān)控。
4.建庫路線圖。語料搜集(實(shí)地考察、圖書資料購買、網(wǎng)絡(luò)資源等)→語料加工(文字識(shí)別、校對(duì))→建庫(編制文本頭各項(xiàng)信息填寫要求;利用WinAlign制作雙語對(duì)齊語料)→語料庫標(biāo)注(ICTCLAS2008及Claws分詞軟件自動(dòng)標(biāo)注;設(shè)計(jì)錯(cuò)誤標(biāo)注賦碼,人工標(biāo)注)。
世界遺產(chǎn)語料庫的參照語料庫可使用 Wordsmith、Antconc及PowerGrep等軟件檢索,雙語對(duì)應(yīng)語料庫具備兩種形式,一種是單文本形式,文本中每行都包括原文及譯文,原文及譯文之間用tab符分隔。單文本形式的雙語語料庫可用PowerGrep及賈云龍的檢索工具檢索。檢索示例如圖1和圖2:
另一種是雙文本形式,即原文及譯文各一個(gè)文本,兩者的總行數(shù)一樣,原文及譯文在各自文本中的行數(shù)一致,從而形成平行對(duì)應(yīng)關(guān)系,可使用著名的雙語語料庫檢索軟件Paraconc檢索。雙文本形式的雙語對(duì)應(yīng)語料庫采用中科院的ICTCLAS 2008對(duì)漢語原文進(jìn)行分詞,并人工校對(duì),分詞后方可在Paraconc中檢索。
除可使用上述軟件對(duì)語料庫進(jìn)行本地檢索之外,還可編制網(wǎng)頁檢索程序,對(duì)世界遺產(chǎn)語料庫進(jìn)行在線檢索,檢索程序可以實(shí)現(xiàn)多種檢索方式,如關(guān)鍵詞檢索,正則表達(dá)式檢索等。
目前國內(nèi)有關(guān)世界遺產(chǎn)旅游翻譯的研究很少,語料庫技術(shù)在世界遺產(chǎn)旅游翻譯研究中的應(yīng)用則更是寥寥無幾。研制大型世界遺產(chǎn)語料庫,有助于進(jìn)行如下幾個(gè)方面的研究:
1.旅游語言及旅游翻譯特點(diǎn)的研究。在比較分析世界遺產(chǎn)漢英對(duì)應(yīng)語料庫及參照語料庫的基礎(chǔ)上,研究旅游翻譯在詞匯、修辭、語篇等語言層面的特點(diǎn),以及旅游翻譯與普通翻譯的不同之處。
2.世界遺產(chǎn)旅游翻譯質(zhì)量評(píng)估。通過研制世界遺產(chǎn)雙語語料庫,獲取充分的世界遺產(chǎn)雙語對(duì)應(yīng)實(shí)證語料,利用檢索軟件的檢索統(tǒng)計(jì)功能,以英語國家世界遺產(chǎn)原生性英文文本為“平行文本”,對(duì)國內(nèi)現(xiàn)有的世界遺產(chǎn)的翻譯質(zhì)量進(jìn)行評(píng)估,揭示國內(nèi)世界遺產(chǎn)旅游翻譯現(xiàn)狀及目前存在的問題(如譯名不統(tǒng)一的問題,世界自然遺產(chǎn)武夷山在國內(nèi)就有“Wuyishan Mountains”、“Wuyi Moutain”、“Wuyi Mountains”、“Wuyishan Mountain”、“Wuyi Mount”、“Mount Wuyi”等多種譯名,極其混亂),在比較分析大量真實(shí)語料的基礎(chǔ)上構(gòu)建世界遺產(chǎn)旅游翻譯質(zhì)量評(píng)價(jià)體系。
3.構(gòu)建基于語料庫及計(jì)算機(jī)輔助翻譯技術(shù)的世界遺產(chǎn)旅游翻譯模式。對(duì)所研制的漢英對(duì)應(yīng)語料庫進(jìn)行審校,一是審核漢語原文及譯文,對(duì)存在錯(cuò)誤的譯文進(jìn)行修訂,將經(jīng)審核修訂后正確無誤的雙語語料轉(zhuǎn)換為計(jì)算機(jī)輔助翻譯軟件記憶庫;二是從大量語料中提取出旅游術(shù)語,如景點(diǎn)名稱、地名、人名等,并統(tǒng)一譯名,建立計(jì)算機(jī)輔助翻譯術(shù)語庫。在國內(nèi)世界遺產(chǎn)旅游翻譯記憶庫及術(shù)語庫的基礎(chǔ)上,利用計(jì)算機(jī)輔助翻譯軟件(如SDL Trados、Déjà vu x和國產(chǎn)的雪人免費(fèi)翻譯軟件),進(jìn)行計(jì)算機(jī)輔助旅游翻譯實(shí)踐的探索,構(gòu)建基于語料庫及計(jì)算機(jī)輔助翻譯技術(shù)的世界遺產(chǎn)旅游翻譯模式。
4.探討語料驅(qū)動(dòng)(corpus-driven)的計(jì)算機(jī)輔助旅游翻譯教學(xué)模式。利用世界遺產(chǎn)雙語語料庫,建立語料驅(qū)動(dòng)的計(jì)算機(jī)輔助旅游翻譯教學(xué)模式,研究語料庫與計(jì)算機(jī)輔助翻譯技術(shù)在微觀翻譯教學(xué)環(huán)節(jié)的具體應(yīng)用。有關(guān)語料庫技術(shù)在翻譯微觀教學(xué)環(huán)節(jié)的應(yīng)用,筆者曾在《中國翻譯》上發(fā)表論文對(duì)此予以闡述[6]。
5.探討翻譯研究如何服務(wù)于中國文化產(chǎn)業(yè)發(fā)展和民族文化傳播。在上述研究的基礎(chǔ)上,探討如何促進(jìn)中國文化產(chǎn)業(yè)發(fā)展和華夏文化傳播。例如,通過研制世界遺產(chǎn)雙語語料庫,為研究者和翻譯工作者提供參考語料;構(gòu)建計(jì)算機(jī)輔助旅游翻譯術(shù)語庫,推動(dòng)譯名統(tǒng)一。
通過研制大型雙語語料庫的方式呈現(xiàn)中國世界遺產(chǎn)旅游翻譯的真實(shí)全貌,以標(biāo)注的方式對(duì)雙語語料庫進(jìn)行深加工,采用比較翻譯的研究方法,通過構(gòu)建以功能對(duì)等[7]、目的論[8]、平行文本比較為基礎(chǔ)的分析模型,研究世界遺產(chǎn)翻譯,考察目前旅游翻譯的現(xiàn)狀,揭示旅游文本及旅游翻譯的隱性規(guī)律;在深入加工的語料的基礎(chǔ)上,制作計(jì)算機(jī)輔助翻譯記憶庫及術(shù)語庫,開展基于語料庫及計(jì)算機(jī)輔助翻譯技術(shù)的旅游翻譯教學(xué),促進(jìn)旅游翻譯教學(xué)與研究;通過大型雙語語料庫、翻譯記憶庫及術(shù)語庫的研制與應(yīng)用,改變旅游翻譯現(xiàn)狀。該大型世界遺產(chǎn)語料庫的研制及推廣應(yīng)用,將有利于促進(jìn)旅游文化產(chǎn)業(yè)發(fā)展和民族文化傳播。
[1]李德超,王克非.新型雙語旅游語料庫的研制和應(yīng)用[J].現(xiàn)代外語,2010,(1):46 -54.
[2]李德超,王克非.平行文本比較模式與旅游文本的英譯[J].中國翻譯,2009,(4):54 -58.
[3]李德超,王克非.基于雙語旅游語料庫的DDL翻譯教學(xué)[J].外語電化教學(xué),2011,(1):20 -26.
[4]張美芳.文化途徑看澳門——淺談澳門世界遺產(chǎn)景點(diǎn)譯名[J].上海翻譯,2009,(2):29 -33.
[5]劉秀芝,李紅霞.北京世界文化遺產(chǎn)人文景觀介紹翻譯研究[M].北京:光明日?qǐng)?bào)出版社,2008.
[6]余軍,王朝暉.基于比較翻譯教學(xué)法的教學(xué)型語料庫構(gòu)建與應(yīng)用[J].中國翻譯,2010,(5):57-62.
[7]Nida Eugene A.Taber C.R.The theory and Practice of Translation[M].Leiden:E.J.Brill,1969.
[8]Nord Christiane.Translating as a Purposeful Activity:Fuctionalish Approaches Explained[M].Shanghai:Shanghai Foreign Language Education Press,2001.
The Construction and Application of the Parallel Corpus of China’s World Heritages
YU Jun,WANG Zhao-hui
(Faculty of International Languages,Xiamen University of Technology,Xiamen 361024,China)
At present there is no Chinese-English parallel corpus of tourism texts of the Chinese mainland,and the study on tourism translation of China's world heritages is rare.The construction of a large parallel corpus of China's world heritages helps to promote corpus-based tourism translation studies in China.This thesis,taking world heritages in Fujian as an example,discusses the construction of the Parallel Corpus of China's World Heritages,including the corpus structure,text sources,corpus annotation and search.The corpus can be applied to fields such as the study of linguistic features of tourism texts,original and translated,the quality assessment of and the model for tourism translation of China's world heritages,and computer aided teaching modes of tourism translation.
Parallel Corpus of China's World Heritages;construction;application
H315.9
A
1001-7836(2012)11-0134-03
10.3969/j.issn.1001 -7836.2012.11.053
2012-05-02
福建省社會(huì)科學(xué)規(guī)劃項(xiàng)目(2011B244)及福建省教育廳A類人文社科研究項(xiàng)目(JA11246S)的階段性成果
余軍(1973-),男,江西靖安人,講師,碩士,從事英漢語比較與翻譯、語料庫翻譯學(xué)的研究;王朝暉(1971-),女,吉林公主嶺人,副教授,博士,從事跨文化翻譯、語料庫翻譯學(xué)的研究。