丁 峻
(天津科技大學 外國語學院英語系, 天津 300222)
基于語料庫的The Bridges of Madison County兩個中譯本研究
丁 峻
(天津科技大學 外國語學院英語系, 天津 300222)
美國作家羅伯特·詹姆斯·沃勒的代表作The Bridges of Madison County是20世紀最有深度和影響力的小說之一。中文譯本中以大陸梅嘉的《廊橋遺夢》和臺灣吳美真的《麥迪遜之橋》最為流行。采用語料庫的研究方法,將梅嘉譯本和吳美真譯本與沃勒的小說原著建成一個小型雙語語料庫,從詞匯和句法兩個層面對譯本進行分析。
語料庫;翻譯;詞匯特征;句法特征
傳統(tǒng)的譯本研究側重對譯本的語法、詞匯、修辭或文體進行范文詳解。雖然傳統(tǒng)的譯本研究比較具體、細致,但很難進行宏觀和多層面的描寫分析,所得出的結論往往有一些主觀和片面,缺乏統(tǒng)計數據的支持。本文將沃勒(Robert James Waller)的小說The Bridges of Madison County、大陸梅嘉的《廊橋遺夢》譯本和臺灣吳美真的《麥迪遜之橋》譯本建成一個小型雙語平行語料庫,從詞匯和句法兩個層面進行譯本對比分析。詞匯方面主要從類符形符比、詞匯密度、高頻詞的詞頻分布和成語的使用五方面來分析。句法方面主要從平均句長和文本對話中語氣詞的使用進行分析。除了進行兩個譯本與原著、兩個譯本之間的對比外,還將譯本與漢語原創(chuàng)小說文本進行比較。研究采用語料庫的研究方法,應用語料庫工具,如WordSm ith 4.0,ParaConc 269, UltraEdit等,將定量和定性研究相結合,對兩個譯本進行比較分析。
本研究使用的小型雙語平行語料庫是由陳建生教授主持的天津市“十一五”社科研究規(guī)劃項目“小規(guī)模英漢雙語語料庫的建設與應用研究”中的一部分。漢語原創(chuàng)文本出自蘭卡斯特現代漢語語料庫(LCMC),它是2003年由Tony McEnery和肖忠華建立,容量為100萬詞,包括15種文體,收錄的樣本為500篇字數約為2 000詞(3 200個漢字)的從1989到1993年中國大陸的出版物。本文使用LCMC中小說部分的語料(以下簡稱LCMC(W)),與梅、吳譯本進行比較研究。這與傳統(tǒng)意義的對比翻譯研究有顯著的區(qū)別,不僅限于原文與譯文的比較。
類符形符比(TTR)指的是文本中類符(type)和形符(token)的比率,它可以在一定程度上反映語料用詞的變化和豐富程度。Baker(1995)指出,TTR的比率越高,該文本所使用的不同詞匯越多。通過這一比率可以比較不同語料詞匯變化的大小。但如果語料庫的容量越大,類符形符比就會越小,不同容量的語料庫就不具有可比性。語言學家一般用標準類符形符比(STTR)來衡量語料庫詞匯的變化,即每1 000個形符計算一次類符形符比,再求平均值。表1是用WordSmith 4.0分別統(tǒng)計的三個語料的類符、形符、類符形符比和標準類符形符比。
表1 三個語料的類符形符比
從表1的統(tǒng)計數據可以看出,梅、吳譯本、LCMC(W)和原著的形符分別為38 497、39 065、171 670和36 864。由于四個語料的容量有一些差異,我們采用標準類符形符比進行比較。梅、吳譯本的STTR分別為48.57和46.66,前者比后者高1.91%,也就是說,梅譯本中的不同詞匯量比吳譯本要高。雖然吳譯本比梅譯本多568個形符,但梅譯本的詞匯變化還是比吳譯本更豐富、更多樣。比如,梅譯本將carefully譯為“小心翼翼”、“小心”、“仔細”和 “好好”,而吳譯本僅用了“小心翼翼”。
和 LCMC(W) 中 的 STTR 44.02相 比,梅譯本和吳譯本分別比其多4.55和2.64。Laviosa(2002)認為,在來自多種英語源語的可比語料庫中,翻譯文本的詞匯范圍比非翻譯文本的詞匯范圍窄。Laviosa發(fā)現這一現象與源語的類型無關,即無論譯文譯自何種語言,都有這種簡略化的趨勢。和Laviosa的預測相反,梅譯本和吳譯本在用詞的豐富程度上都高于漢語原創(chuàng)小說。從某種程度上講,梅譯本和吳譯本屬于個案。Laviosa的觀點反映的是譯本總體的簡化趨勢。差異的產生可能受語料庫工具的精度和LCMC(W)取樣范圍的影響。
和原文本相比,梅譯本和吳譯本分別多1 663和2 201個形符。譯本比原著長是因為要把原著中隱含的意思表達清楚(Nida &Taber, 2004)。吳譯本共加注22次,而梅譯本只有4次。例如:
(1)He liked other words, such as “distant,”“woodsmoke,” “highway,” “ancient,”“passage,”“voyageur,” an “India” for how they sounded, how they taste and what they conjured up in his mind.
吳譯本: 他也喜歡其他字,例如 distant,woodsmoke,highway, ancient,passage,voyageur和India(意思分別是遙遠、林煙、公路、古代、航海、樵夫和印度),他喜愛這些字聽起來和嘗起來的感覺,以及它們在心中喚起的事物。
吳譯本不但將原作者使用的詞列舉出來,還分別把這些詞以加注的形式翻譯出來。加注的翻譯形式可以使譯文更清楚易懂,這也是吳譯本在三個語料中最長的原因之一。
英語在臺灣比大陸更普及,吳譯本常常直接使用原文而不加翻譯和標注。吳譯本盡量保留原文的表達特點,以便將源語文化原汁原味地呈現給目的語,有外顯化的趨向。而梅譯本中無此現象,它的目標讀者是對美國文化不太了解的大陸讀者。梅譯本運用流暢、清晰的表達盡量消除原文的異域感。兩個譯本采用了不同的翻譯策略。
Baker(1995: 236-237)認為,比較譯文和原文的TTR可以看出翻譯過程中詞匯的簡略化。兩個中譯本的STTR都高于原著從某種程度上說明兩個譯本的獨特性。兩位譯者都是非常優(yōu)秀和經驗豐富的翻譯家,不僅精通英語,漢語也有很深的造詣。在翻譯過程中,她們都努力使譯文更流暢,使讀者讀起來更賞心悅目,符合目的語的規(guī)范。就類符形符比而言,梅譯本和吳譯本仍屬于小說文本,它們的STTR高于非小說文本。與其他翻譯小說不同的是,它們的STTR高于原著,說明兩個譯本用了更多的詞匯,且詞匯更富于變化。吳譯本比梅譯本的詞匯變化要少,選詞范圍更窄。
詞匯密度是指一個文本中實義詞占總詞數的比例。通常詞匯密度越高,文本的實詞比例越大,信息量也越大,難度也隨之增大。詞匯密度的統(tǒng)計根據Ure (1971)和Stubbs(1986)提出的計算方法:詞匯密度= (實詞數/總詞數)× 100%。Stubbs把英語的實詞分成四個詞類:名詞、動詞、形容詞和副詞。漢語的詞類分為實詞和虛詞。本文綜合王力的《中國現代語法》和呂叔湘、朱德熙的 《語法修辭講話》中對詞類的分類,將名詞、動詞、形容詞和數量詞劃分為實詞。語料庫中使用詞性賦碼進行詞性標注。
表2 三個語料的詞匯密度
從表2可以看出,梅、吳譯本和原著的詞匯密度分別為54.64%,53.59%和49.97%,兩個譯本的詞匯密度分別高出4.67%和3.62%。詞匯密度一般在60%~70%為高密度,40%~50%為低密度。兩個譯本的詞匯密度介于高低密度之間。與原著相比,譯本中使用了更多的實詞,而原著更多地使用了功能詞。梅、吳譯本和原著中的介詞分別為1 702,1 784和3 973個,連詞分別為844,1 274和1 961個。因為漢語與英語的差異,漢語傾向意合,而英語傾向形合,英語要借助功能詞,如介詞或連詞來傳達意義,這也是原著中的介詞和連詞遠遠高于譯本的原因。實詞多而虛詞少是兩個譯本的特點。梅、吳譯本的詞匯密度非常接近,梅譯本只比吳譯本高1.05%,所以閱讀起來要比吳譯本稍難。
兩個譯本的詞匯密度要低于LCMC(W)的59.15%(胡顯耀, 2007:217)。這進一步驗證了Laviosa(2002:60-62)的觀點,即翻譯文本實詞與語法功能詞的比率低于非翻譯文本(詞匯密度更低)。兩個譯本密度降低的原因之一是名詞數量的減少。名詞的比例在梅、吳譯本和LCMC(W)中分別為18.91%,18.97%和23.26%(胡顯耀,2007:217)。名詞的密度是衡量文本復雜程度的一種方法,密度越低名詞使用越少,文本越簡化,更易于讀者理解和接受。這符合Baker(1996:176-177)提出的在翻譯文本中譯者無意識地簡化語言或信息的翻譯普遍性之一。
詞頻列表是根據類符頻率的高低列出的類符表,它可以準確、快速地顯示出類符的分布情況。表3是通過WordSmith統(tǒng)計的詞頻由高到低兩個譯本類符的頻率及其在總詞頻數中所占的百分比。LCMC(W)的詞頻數是參考胡顯耀(2007)的統(tǒng)計結果。
表3 兩個本和LCMC(W)詞頻表前10位的詞
8一620 1.61著399 1.02在2 329 1.36 9不406 1.05了387 0.99她1 732 1.01 10著400 1.04不383 0.98你1 718 1.00
表3中梅、吳譯本前10位的高頻詞在LCMC(W)中幾乎也是高頻詞。表示所屬關系的“的”在三個語料中都居第一位,分別占5.78%,6.80%和6.75%,其中吳譯本的使用頻率最高。兩個譯本中有8個高頻詞的比率都高于LCMC(W),說明和非翻譯文本相比,兩個譯本傾向重復使用更多的高頻詞。從某種程度上說,這也反映出譯者有盡量使用更符合目的語規(guī)范詞的傾向,但過多地使用高頻詞會使譯文有簡略化的傾向,這種翻譯策略會降低譯本的信息量和難度。兩個譯本中人稱代詞“他”、“她”、“我”位居高頻詞的前五位,第三人稱單數“他”更是位列第二,比率分別為3.03%和3.61%。但在LCMC (W) 中,排前4位的高頻詞沒有人稱代詞,“他”位列第六。由此可見,譯本中代詞的使用和非翻譯小說文本存在一定的差異,譯者和漢語原創(chuàng)作者相比,更傾向使用代詞,這也體現了譯文明朗化和簡略化的特征。
為了進一步比較兩個譯本的用詞情況,我們以每100詞為單位計算出它們的詞頻分布。梅譯本中使用一次的詞為2 917個,占總詞量的7.6%,使用兩次的占2.4%,三次的占1.2%;吳譯本中使用一次的詞為2 523個,占總詞量的6.5%,使用兩次的占2%,三次的占1.1%。從表4中10個等級來看,在不同的詞頻階段,梅譯本使用的高頻詞數量比吳譯本要少,總體要比吳譯本少5%,不僅數量相對少,而且頻率相對較低,即重復的詞較少,這表明梅譯本比吳譯本要相對難懂。詞頻的分布不僅反映了譯本的簡略化,也反映了譯者傾向重復使用更多高頻詞。
成語、四字詞或習語在漢語中很常用。在忠實于內容和風格的前提下,譯文使用這樣的表達可以更生動有力。借助語料庫工具Concord,通過檢索譯本中成語和習語的賦碼/i和/l,統(tǒng)計出梅譯本共用成語和習詞289次,吳譯本148次。梅譯本更接近漢語讀者的審美要求和標準,成語或習語的使用使譯文更流暢、生動。兩個譯本有意識地使用成語或習語體現了譯本規(guī)范化的傾向,即向文本讀者易于接受的表達方式靠近。這樣可以使譯本可讀性更強,更符合譯語表達習慣,更為大家所熟悉,組織結構更加連貫(Baker,1998:290)。
表4 兩個譯本中高頻詞的詞頻分布
句子的定義通常分為兩種:一是從功能上講,是否表達了完整的意思;二是從形式上看,標點符號通常作為劃分句子或分句的標志。本研究中將句法結構分為兩個層面:句子層面,即以句號、問號和感嘆號結尾;分句層面,即以逗號、分號、頓號、冒號、破折號結尾。
Butler (1985:21)根據句子的長度將句子分為三類:短句(1~9詞)、中句(10~25詞)和長句(超過25詞)。沃勒原著的平均句長是12.46,屬于中等長度的句子,接近短句,分句長度屬于短句范疇。梅、吳譯本的平均句長分別為15.97和14.47,也屬于中等長度的句子,分句長度分別為6.71和6.19,屬短句。和原著相比,梅、吳譯本的句子更長,平均分別長3.51和2.01詞。譯者為了使譯文更清楚明白,常常要采取一些翻譯策略提高譯文的明朗化程度,如增加解釋性的句子、修飾語、定語或連接詞,有時還要添加一些相關信息和背景材料,這無形中加長了句子的長度。但兩個譯本的平均句長要小于LCMC(W)的 16.68。這符合 Laviosa(2002:60-62)提出的簡略化理論,即翻譯文本的句子平均長度要比非翻譯譯本的短。數據再次印證了簡略化是翻譯文本的特征之一。和吳譯本相比,梅譯本的平均句長更接近漢語原創(chuàng)小說文本,這表明梅譯本更接近漢語表達的規(guī)范。
表5 三個語料的平均句長
梅譯本的形符數比吳譯本少568個,但句子平均卻比吳譯本長1.5詞。梅、吳譯本除使用分譯方法各112和104次外,還使用合譯方法各479和201次。為了使譯文讀起來更自然、連貫,更符合漢語的表達習慣,梅譯本有時改變了原著中的句子結構或表達順序,這也是它的句子要比吳譯本長的原因之一。例如:
(2)There are songs that come free from the blue-eyed grass, from the dust of a thousand country roads.
梅譯本: 從開滿蝴蝶花的草叢中, 從 千百條鄉(xiāng)間道路的塵埃中 , 常有關不住 的歌聲飛出來。
吳譯本: 有些歌悠然自在地從鳶尾草, 從千條鄉(xiāng)村道路的灰塵中傳來。
這是小說的第一句,兩位譯者可以說都譯出了句子的韻味和意境。吳譯本共用了17個詞,是完全按照句子結構順序的直譯。梅譯本共用24個詞,為了更接近和符合漢語讀者的表達習慣,將狀語放在了句子開頭,譯文讀起來更自然順暢。
現代漢語可以用各種語氣詞表示不同的語氣。語氣詞在現代漢語口語里運用得很普遍。語氣詞本身并沒有意義,常附著在句尾,表明說話人的態(tài)度。根據語氣的不同,句末語氣詞可以分為四類:(1)表示陳述語氣的語氣詞,如“吧”、“呢”、“啊”、“啦”等 ;(2)表示疑問語氣的語氣詞,如“嗎”、“呢”、“吧”、“啊”等;(3)表示祈使語氣的語氣詞,如“吧”、“啊”等;(4)表示感嘆語氣的語氣詞,如“啊”等。在文學作品中,研究對話是分析人物思想最有效的手段之一。對話在形式和內容上都不同于非對話句子。譯者要將英語對話翻譯成漢語,就要考慮對話的語言特征。語氣詞的使用可以作為研究翻譯文本句法特征的一個方法。
表6 兩個譯本中的語氣詞
總體來看,梅譯本比吳譯本使用語氣詞更頻繁,分別為92次和65次。兩個譯本在語氣詞的使用上有一些差異,比如,“呢”、“吧”、“嗎”和“啊”的使用在兩個譯本中就相對懸殊,這種差異反映了譯者的選詞傾向。梅譯本中使用“呢”、“吧”和“嗎”分別為10,32和38次,而吳譯本則分別為2,17和22次。但吳譯本使用“啊”的次數遠高于梅譯本。梅譯本使用“啦”和“哦”各2和4次,而吳譯本沒有涉及。吳譯本使用“喔”和“哩”各1和3次,而梅譯本沒有使用。兩個譯本選擇語氣詞的傾向反映了不同方言區(qū)的特點,梅譯本使用的是大陸普通話,而吳譯本使用的是臺灣國語,兩種譯本顯示出同一種語言的地域化差異。根據統(tǒng)計,梅譯本比吳譯本更多地使用了句尾語氣詞,也就是用于連接語篇的標志詞。梅譯本更注重語篇的銜接,譯者盡量用更多的語氣詞使譯文更符合、更貼近漢語的表達習慣和形式。
就詞匯層面而言,兩個譯本的標準形符類符比要高于原著和漢語原創(chuàng)小說文本,反映出兩個譯本用詞的豐富性和多樣性。兩個譯本的詞匯密度高于原著,也就是實詞的比例高于原著,但低于漢語原創(chuàng)小說文本,這印證了Laviosa的理論。兩個譯本高頻詞的使用比例遠遠高于漢語原創(chuàng)小說文本和高頻詞的詞頻分布都說明了譯本的用詞傾向。就句法層面而言,兩個譯本的句子比原著長,但比漢語原創(chuàng)小說文本要短。兩個譯本中語氣詞的使用也反映了譯者不同的翻譯風格。兩個譯本傾向使用更多的詞匯,特別是實詞,重復使用一定數量的常用詞等特征反映了Baker提出的翻譯簡化和常規(guī)的操作規(guī)范。
通過基于語料庫的研究可以看出,梅、吳譯本存在一定的差異。梅譯本在用詞的豐富性、實詞的比例等方面都高于吳譯本,語氣詞和成語的大量使用表明梅譯本更偏重漢語的表達習慣。清晰、流暢的翻譯風格減少了目標語的異域感,盡可能使用符合漢語的表達習慣。吳譯本則更忠實于原文,無論從詞匯密度還是標準形符類符比上看,都更接近原文,更忠實地再現了原文的意境,整個譯文有外顯化的傾向。
[1] Baker, M. Corpora in Translation Studies: An Overview and Suggestions for Future Research [J].Target, 1995, 7 (2):223-243.
[2] Baker, M.Routledge Encyclopedia of Translation Studies[M]. London : Routledge, 1998.
[3] Butler, C.Statistics in Linguistics[M]. Oxford: Basil Blackwell, 1985.
[4] Laviosa, S.Corpus-based Translation Studies: Theory, Findings, Applications[M]. Amsterdam: Rodopi, 2002.
[5] Nida, E. A. & C. R. Taber.The Theory and Practice of Translation[M]. 上海:上海外語教育出版社, 2004.
[6] Stubbs, M. Lexical Density: A Technique and Some Findings [A].In M. Coulthard (ed.)Talking about Text: Studies Presented to David Brazil on His Retirement,Discourse Analysis Monograph (13)[C]. Birmingham: English Language Research, University of Birmingham, 1986. 27-42.
[7] Ure, J. Lexical Density and Register Differentiation[A]. In G. Perren & J. L. M. Trim (eds.)Applications of Linguistics[C].Cambridge: Cambridge University Press, 1971. 443-452.
[8] Waller, R. J.The Bridges of Madison County[M]. 北京:外文出版社, 1996.
[9]胡顯耀.基于語料庫的漢語翻譯小說詞語特征研究[J]. 外語教學與研究,2007,(3).
[10]梅嘉.廊橋遺夢[M]. 北京:人民文學出版社,2004.
[11]吳美真.麥迪遜之橋[M].臺北:時報文化,1993.
The Bridges of Madison Countyby American w riter Robert James Waller is considered one of the most profound and powerful novels in the 20th century. The two most popular Chinese versions areLang Qiao Yi Mengby Mei Jia in mainland China andMai Di Xun Zhi Qiaoby Wu Meizhen in Taiwan. From a corpus-based approach, this paper builds a small-scale parallel corpus of two Chinese versions and the original to make a lexical and syntactic analysis on the Chinese versions.
corpus; translation; lexical features; syntactic features
H 315.9 < class="emphasis_bold">文獻標識碼:A文章編號:
1008-665X(2011)01-0044-06
2010-06-28
丁峻(1971-),女,副教授,研究方向:語料庫語言學、文體學