劉嘉茜
摘要本文將以語料庫翻譯學(xué)為指導(dǎo),探討以陶瓷為核心的英漢雙語平行語料庫的創(chuàng)建與應(yīng)用,詳細(xì)闡述語料庫的整體設(shè)計(jì)思路與具體研制步驟,以及語料庫在陶瓷語言特點(diǎn)研究、課堂教學(xué)、陶瓷術(shù)語庫構(gòu)建等方面的實(shí)際應(yīng)用。希望通過這種新的研究范式,提升陶瓷翻譯的質(zhì)量及效率,推動(dòng)陶瓷文化的國際傳播。
關(guān)鍵詞 ?陶瓷;平行語料庫;雙語
0引言
中國因陶瓷而聞名,在中國文化史上,陶瓷是一種獨(dú)特而重要的載體,然而許多中國陶瓷中的基本概念,在不同文化背景下有著不同的理解,這導(dǎo)致陶瓷英譯存在一定困難。例如,“青”為陶瓷典籍的核心概念之一,關(guān)于“青”的表達(dá)有青綠、粉青、霽青、青瓷、青花、青白、頭青等等,英譯時(shí)應(yīng)需根據(jù)語境和陶瓷專業(yè)知識,具體辨析“青”的內(nèi)涵和用法,采取相應(yīng)的翻譯策略。近年來,國內(nèi)外關(guān)于雙語語料庫尤其是平行語料庫的創(chuàng)建與應(yīng)用研究蓬勃發(fā)展,但迄今為止,專門為陶瓷翻譯研究而創(chuàng)建的平行語料庫寥寥可數(shù),陶瓷英漢雙語平行語料庫(以下簡稱陶瓷語料庫)不僅能用于陶瓷語言研究,還能在翻譯中幫助譯者“理解和掌握同一領(lǐng)域中不同語言的常用術(shù)語、慣用表達(dá)式、文章語氣及典型的語篇結(jié)構(gòu),避免在專業(yè)翻譯中經(jīng)常出現(xiàn)的語言‘不自然或‘形似而神不似的現(xiàn)象”。此外,陶瓷語料庫還將為課堂教學(xué)、詞典編纂、術(shù)語庫構(gòu)建提供平臺,具有廣闊的應(yīng)用前景。
1陶瓷語料庫構(gòu)建的必要性
目前陶瓷翻譯研究中主要存在以下問題:(1)術(shù)語的一詞多譯,如“三彩”可譯為“Sancai”“Tricolor”“tri-color”“Three-color”“tri-colored glazed”等。術(shù)語譯文的不統(tǒng)一將增大外國讀者的閱讀難度,也不利于中國陶瓷文化的傳播;(2)專業(yè)知識匱乏,如“雞首壺”譯為“chicken-head-shaped ewer”,但“雞首壺”并不是整個(gè)壺(ewer)像雞首,只是壺嘴(spout)像雞首而已,應(yīng)改譯為“Celadon ewer with chicken-head-shaped spout”。陶瓷文本的英譯需要譯者具備充分的陶瓷專業(yè)知識,原文與譯文的機(jī)械對等可能導(dǎo)致歧義;(3)中西方文化差異,如龍是陶瓷上常見的裝飾紋樣,但中西方文化中的龍是完全不同的。在西方文化中,龍是代表貪婪與破壞的邪惡象征。而在中國文化中,龍被認(rèn)為是創(chuàng)造世界的四大神獸之一。在封建時(shí)代,龍也被看作是帝王的象征,因此將龍直譯為“dragon”是不準(zhǔn)確的,也會(huì)造成歧義,不妨音譯為“Long”,“這一處理在最大程度上保留了中國特色術(shù)語概念的原生性”。
陶瓷語料庫的構(gòu)建將為解決上述問題提供很好的參照。首先,通過創(chuàng)建陶瓷語料庫獲得較為完善和齊全的陶瓷雙語語料,可以在比較并分析大量語料的基礎(chǔ)上構(gòu)建陶瓷術(shù)語庫,解決陶瓷術(shù)語譯名不統(tǒng)一、亂譯、錯(cuò)譯的問題;其次,平行語料庫中的兩種語言互為對應(yīng),記載著兩種語言中的對應(yīng)詞和對應(yīng)單位,成為詞典編纂者最可靠的數(shù)據(jù)來源;再者,在輔助教學(xué)方面,平行語料庫也能為課堂提供豐富的案例與上下文語境,通過對語料的加工還能夠提供詞匯的搭配情況、頻率、反向檢索等數(shù)據(jù)。綜上,創(chuàng)建關(guān)于陶瓷語料庫可以極大提高陶瓷類文本的翻譯效率,并且有雙向的中英文語料作為參照,譯文能做到準(zhǔn)確傳達(dá)原文信息的同時(shí),可讀性也大大增強(qiáng)。
2陶瓷語料庫的設(shè)計(jì)與構(gòu)建
2.1語料庫的設(shè)計(jì)
語料庫的整體設(shè)計(jì)是語料庫研究和應(yīng)用的關(guān)鍵,Sinclair認(rèn)為語料庫如何選材、如何架構(gòu)往往決定了語料庫的后續(xù)發(fā)展,甚至決定了能獲取什么樣的研究成果。就性質(zhì)而言,陶瓷語料庫屬于專用(specialized)、同質(zhì)的(homogeneous)語料庫,只收集與陶瓷相關(guān)的中英文原生性的文本及其譯文。不同于通用型語料庫,專用語料庫通常是為滿足使用者特定的研究需求而創(chuàng)建的。陶瓷語料庫的研究用途主要有兩點(diǎn):一是陶瓷翻譯研究,二是陶瓷語言研究。其中,針對翻譯研究而采集的語料為雙向(bi-directional)的平行語料,即英譯漢的語料和漢譯英的語料。針對語言研究所收集的類比語料則分為英語原創(chuàng)語言、英語翻譯語言、漢語原創(chuàng)語言、漢語翻譯語言四類。將平行語料與類比語料相結(jié)合,能在語料庫的翻譯研究中發(fā)揮更大的增效作用。
2.2語料收集與降噪
原始語料的選擇是語料庫建設(shè)過程中的一個(gè)重要問題,我們結(jié)合陶瓷語料庫的研制目的,制訂出以下幾條標(biāo)準(zhǔn):(1)類型豐富,為適用于不同類型的陶瓷翻譯研究,我們將盡可能采集多樣化的語料,包含陶瓷的典籍、通用書籍、圖冊、手冊等,本研究旨在盡可能覆蓋陶瓷文本的全部類型,但并不單純追求語料庫規(guī)模的龐大。(2)學(xué)術(shù)性高,文本撰寫者須為國內(nèi)外陶瓷學(xué)界的著名學(xué)者,且英漢均為已出版的書籍。(3)時(shí)間分布合理,為便于開展歷時(shí)的語言變化研究及語言與翻譯的關(guān)系研究,我們也將注意語料的出版時(shí)間。(4)雙向語料,中英文互譯的雙向語料可實(shí)現(xiàn)原文與譯文的比較,也可實(shí)現(xiàn)譯文與非譯文的比較,能夠最大限度地利用語料庫。鑒于以上標(biāo)準(zhǔn),我們首批采集的語料約48萬字、詞,其中英語語料274 447詞,漢語語料210 372字,時(shí)間跨度為1897-2011年。
語料的具體收集步驟如下:首先,對紙質(zhì)文本進(jìn)行掃描,并使用OCR文字識別軟件導(dǎo)出成可編輯的Word格式文本。將文本中配圖及圖注單獨(dú)編號存儲(chǔ)后,清洗掉無關(guān)的、錯(cuò)誤的信息及符號,再使用Word軟件中的“查找-替換”功能,對多余空格、段落空行、軟回車或硬回車等進(jìn)行降噪,盡量消除文本噪音,才能滿足精確檢索的要求。由于文本類型眾多,我們要求語料文本格式一致、文件名規(guī)范,將原文與譯文使用同一文件名存儲(chǔ),但使用不同前綴,例如:ch-中國外銷瓷、en-中國外銷瓷。此外,單詞拼寫錯(cuò)誤須人工校對,校對無誤后存儲(chǔ)為純文本(plain text)格式,也就是后綴為“.txt”的記事本文件,這是語料最常用也最簡便的存儲(chǔ)方式,幾乎所有檢索軟件都能加載并讀取此類文本數(shù)據(jù)。
2.3語料的分詞與標(biāo)注
為便于后期進(jìn)行更深層次的研究,我們將對中英文語料分詞及標(biāo)注。中文語料使用中科院研發(fā)的軟件ICTLAS進(jìn)行分詞和標(biāo)注,英文語料使用軟件CLAWS進(jìn)行標(biāo)注。通過檢索標(biāo)注后的文本,可以對文本進(jìn)行詞匯層面或句子層面的考察。例如,計(jì)算詞匯密度即實(shí)詞與總詞數(shù)比值的百分比。在句子層面,通過檢索特定的正則表達(dá)式(regular expression)可專門研究某一特定句型在陶瓷文本中的使用,這些檢索結(jié)果不僅能夠幫助我們分析陶瓷文本中專有的語言特點(diǎn),也能為英漢陶瓷文本對比提供數(shù)據(jù)。
當(dāng)我們使用一個(gè)語料樣本時(shí),我們需要知道與這個(gè)樣本相關(guān)的作者、出版時(shí)間、標(biāo)題等數(shù)據(jù),這類信息稱為篇頭(HEAD)。陶瓷語料庫的篇頭元信息包含:中英文標(biāo)題、作者、譯者、翻譯方向、年代、出版信息、文本字?jǐn)?shù)。
2.4語料的對齊
語料的對齊一般分為:段對齊、句對齊和段對齊下的句對齊。由于本語料庫的研究目的之一為陶瓷翻譯研究,因此采用句級對齊。使用對齊軟件對所有中英文語料進(jìn)行對齊,但由于英漢語言的差異,實(shí)際翻譯中可能出現(xiàn)一對一、一對多、多對一、多對多等情況。因此,在完成機(jī)器對齊后仍須人工校對,圖1為已對齊的中英文語料。對齊后的語料有兩種存儲(chǔ)方式:純文本格式與TMX格式。純文本格式最大的好處是占用空間小、存取方便,而且?guī)缀跛胁僮飨到y(tǒng)都能處理。TMX格式可直接在翻譯輔助平臺上直接作為平行語料庫供查詢和檢索。
3陶瓷語料庫的應(yīng)用
3.1陶瓷語言特點(diǎn)研究
根據(jù)已建成的陶瓷語料庫,可以通過檢索和分析
來研究陶瓷文本語言本身的特點(diǎn),例如高頻詞,高頻詞是指在某一文本中出現(xiàn)頻率特別高的詞語,可通過該詞在全文中所占百分比或該詞在詞頻中所處的前后位置來確定。我們使用軟件AntConc分別統(tǒng)計(jì)英語和漢語中出現(xiàn)頻率最高的前十五個(gè)詞語,如表1所示。
根據(jù)表1得出結(jié)論如下:(1)虛詞的頻率遠(yuǎn)高于實(shí)詞,這一點(diǎn)無論在英語還是漢語中都是一樣的,所不同的是虛詞的種類。(2)所屬關(guān)系的表達(dá)方式,漢語詞語中出現(xiàn)頻率最高的是“的”,“的”常用來表達(dá)代詞或名詞的屬格關(guān)系(如“我的”“瓷器的”),而在英語中除了通過代詞屬格的變化(如you和your),還可以通過名詞之間加of的形式來表達(dá),所以of也是英語中出現(xiàn)頻率第二高的單詞。(3)介詞的差異,漢語中的“在”與“上”“中”搭配使用適用于多種場合,但英語中的介詞一般都有較特定的用法。(4)漢語高頻詞中,“釉”“窯”“瓷器”“紋”“器”都是與陶瓷密切相關(guān)的詞語,具有明顯的陶瓷文本特點(diǎn)。但英語中前十五個(gè)高頻詞并沒有明顯具有陶瓷特色的詞語。除高頻詞外,我們還能研究陶瓷文本在語篇、修辭、詞匯、常用術(shù)語、慣用表達(dá)式等方面與普通語言不同的特點(diǎn)。
3.2輔助課堂教學(xué)
傳統(tǒng)的翻譯教學(xué)課堂是以“教師+教材”為中心,而將陶瓷語料庫應(yīng)用于課堂教學(xué)進(jìn)行數(shù)據(jù)驅(qū)動(dòng)式學(xué)習(xí)(data-driven learning,簡稱DDL),實(shí)現(xiàn)以“學(xué)生+案例”為中心的翻譯教學(xué)。陶瓷語料庫將為陶瓷翻譯教學(xué)提供大量英漢對齊的電子文本,并“輔以計(jì)算機(jī)統(tǒng)計(jì)手段”,通過“觀摩、對比、分析、借鑒的方式”來培養(yǎng)學(xué)生的翻譯意識。例如,使用中國傳媒大學(xué)研發(fā)的檢索軟件CUC_ParaConc,以“瓷”為關(guān)鍵詞對已完成對齊的文本進(jìn)行檢索,共檢索到3 901處,其中porcelain826處、wares738處、ware411處、ceramics388處、ceramic164處。語料庫可以對某一檢索詞或術(shù)語提供豐富的雙語對譯案例,幫助學(xué)生進(jìn)行對比分析,提高學(xué)生翻譯的意識和應(yīng)變能力。雙語平行語料庫在翻譯教學(xué)中的作用是教科書所不能替代的,并且具有廣闊的使用前景與潛在的開發(fā)價(jià)值。
3.3建立陶瓷術(shù)語庫
作為中國特色傳統(tǒng)術(shù)語之一,陶瓷術(shù)語“源自中華民族發(fā)展的不同歷史時(shí)期,涉及科技、人文及社會(huì)實(shí)踐等諸多領(lǐng)域”。作為陶瓷文化的核心,術(shù)語的應(yīng)用與傳播具有“重復(fù)性”特征,對其進(jìn)行“統(tǒng)一規(guī)定”非常必要,因此我們將在已建成的語料庫基礎(chǔ)上制作陶瓷術(shù)語庫。在SDL MultiTerm Extract中導(dǎo)入已對齊的翻譯記憶庫,點(diǎn)擊Term Properties框?qū)πg(shù)語進(jìn)行依次修改和篩選,確認(rèn)無誤后保存。確認(rèn)和添加完所有的術(shù)語對后將術(shù)語庫導(dǎo)出。目前,我們已構(gòu)建了陶瓷款識術(shù)語庫,其中收集了400對款識及其譯文,并標(biāo)注款識的類型、翻譯方法等信息。
話語傳播,術(shù)語先行。中國特色術(shù)語翻譯標(biāo)準(zhǔn)化是中國特色話語有效對外傳播的前提與基礎(chǔ)。伴隨著陶瓷語料庫的不斷更新,我們也將不斷完善陶瓷術(shù)語庫,為陶瓷術(shù)語的統(tǒng)一提供標(biāo)準(zhǔn),增強(qiáng)陶瓷文化對外傳播的科學(xué)性和嚴(yán)謹(jǐn)性。
4結(jié)語
本文主要探討了陶瓷英漢雙語平行語料庫的具體構(gòu)建步驟,并對中英文陶瓷語言特點(diǎn)、課堂教學(xué)應(yīng)用以及陶瓷術(shù)語庫構(gòu)建做了詳細(xì)闡述。在未來的研究中,我們會(huì)將平行語料與計(jì)算機(jī)輔助翻譯記憶庫結(jié)合,進(jìn)一步提升陶瓷翻譯的質(zhì)量及效率,以促進(jìn)陶瓷文化的傳播。目前陶瓷語料庫只是初步建成,后期也會(huì)將語言種類擴(kuò)展,補(bǔ)充其他語種的語料,將其構(gòu)建成以中文為核心的多語言陶瓷語料庫。希望通過翻譯這一媒介,能夠?qū)⒅袊善鞯妮x煌成就弘揚(yáng)世界,也能向世界展示中國形象,促進(jìn)文明交流互鑒,提高國際話語權(quán)。
參考文獻(xiàn)
[1]盧軍羽.中國陶瓷典籍中“青”的內(nèi)涵源流及英譯[J].中國翻譯,2016,37(04):105-109.
[2]李德超,王克非.新型雙語旅游語料庫的研制和應(yīng)用[J].現(xiàn)代外語,2010,33(01):46-54.
[3]陳蓉.從術(shù)語庫到語料庫——陶瓷術(shù)語“三彩”的譯名研究[J].陶瓷研究,2021,36(04):4-7.
[4]歐飛兵.陶瓷文化術(shù)語對外傳播及翻譯標(biāo)準(zhǔn)化[J].景德鎮(zhèn)學(xué)院學(xué)報(bào),2022,37(05):114-118.
[5]魏向清,楊平.中國特色話語對外傳播與術(shù)語翻譯標(biāo)準(zhǔn)化[J].中國翻譯,2019,40(01):91-97.
[6]王克非.中國英漢平行語料庫的設(shè)計(jì)與研制[J].中國外語,2012,9(06):23-27.
[7]Sinclair,John. Council of Europe Multilingual Lexicography Project [R].Report submitted to the Council of Europe under contract no.57/89,1991.
[8]黃昌寧.語料庫語言學(xué)[M].北京:商務(wù)印書館,2002.
[9]秦洪武.雙語語料庫的研制與應(yīng)用[M].北京:外語教學(xué)與研究出版社,2021.
[10]王朝暉,余軍.韓素音國際翻譯大賽語料庫構(gòu)建及翻譯教學(xué)應(yīng)用[J].中國翻譯,2019,40(05):72-79.
[11]馮慶華.思維模式下的譯文詞匯[M].上海:上海外語教育出版社,2012.
[12]王克非.語料庫翻譯學(xué)探索[M].上海:上海交通大學(xué)出版社,2012.