余惠蘭
(泉州信息工程學(xué)院,福建 泉州 362000)
作為一部中國經(jīng)典文學(xué)杰作,《紅樓夢》的國際傳播價值經(jīng)久不衰,其外文譯本多達十幾種。而其英譯版本,當數(shù)楊憲益、霍克斯二位的譯本最負盛名。歷年來,諸多學(xué)者從語用學(xué)、術(shù)語學(xué)、文學(xué)翻譯批評等視角對二者譯本進行比較研究,領(lǐng)略二者各自獨特的翻譯風(fēng)采。本文擬基于語料庫,以《紅樓夢》中的人物判詞為原始文本,比較二者譯本的英譯語言特征,從另一個視角窺探經(jīng)典譯作的可借鑒之處。
語料庫語言學(xué)研究語言意義,其研究的主要對象是文本[1]。因此,我們首先從楊憲益和霍克斯的英譯本中提取這14首判詞的英譯文,建成兩個微型語料庫,分別命名為Corpus of Yang′s Version和Corpus of Hawks′ Version,縮寫為CYV和CHV。然后利用英國利物浦大學(xué)Mike Scott開發(fā)研制、牛津大學(xué)出版社出版的單語語料庫工具WordSmith5.0,分別統(tǒng)計出兩個微型語料庫的庫容量(size)、類符(token)、形符(type)、類符/形符比(TTR)、單詞的頻率(frequency)等,再將英譯文拷貝到英國蘭開斯特語料庫建設(shè)的在線賦碼網(wǎng)站進行詞性賦碼,便于研究時利用賦碼檢索,統(tǒng)計出譯文用詞的詞匯密度和詞性分布,該賦碼網(wǎng)站的網(wǎng)址為http://ucrel-api.lancaster.ac.uk。統(tǒng)計譯文用詞的詞性分布時,我們使用的語料庫檢索軟件是日本早稻田大學(xué)科學(xué)工程學(xué)院科學(xué)工程英語教育中心Laurance Anthony博士開發(fā)的AntCon.3.2.1w。討論詞頻概貌時,我們使用了新西蘭學(xué)者P. Nation和A. Coxhead設(shè)計的軟件RANGE。該應(yīng)用軟件Range以詞頻分析為基礎(chǔ),使用頻率較高的版本自帶三個底詞詞表。前兩個詞表包含出現(xiàn)頻率最高的2000詞取自于Michael West在1953年編輯出版的《通用英語詞表》(A General Service List of English Words)。第三個詞表包含的單詞取自于Coxhead(2000)的“學(xué)術(shù)英語詞表”(Academic Word List)。
我們利用Word Smith 5.0中的Word List功能,對兩個語料庫進行了數(shù)據(jù)統(tǒng)計,摘取了詞符、類符/形符比、類符和平均詞長等主要數(shù)據(jù)(見表1)。
表1 兩個語料庫的基本數(shù)據(jù)
從表1我們可以看出,在四項基礎(chǔ)數(shù)據(jù)方面,兩個譯本幾乎沒有差別。英譯這14首判詞時,楊譯本使用了466個形符,比霍譯本多2個;如果我們不重復(fù)計算形符數(shù),只統(tǒng)計類符,楊譯本比霍譯本多出7個。在形符/類符比或形次比方面,楊譯本比霍譯本高出1.38個百分點。結(jié)合現(xiàn)有學(xué)者的研究,我們不難發(fā)現(xiàn),兩個譯本的形符/類符比均高于一般文獻的形符/類符比。例如,桂詩春先生自建英語學(xué)科語料庫,探討英語語言學(xué)的語體時,發(fā)現(xiàn)英語語言學(xué)學(xué)科的形符/類符比為40.64[2];呂榮等研究許淵沖翻譯宋詞的語言特征時,發(fā)現(xiàn)譯文的形符/類符比為49.96,英語本族語原創(chuàng)詩歌的形符/類符比為50.64[3];高博&陳建生利用語料庫,以《詩經(jīng)》英譯本為例,探討了中國古典詩詞譯本中的翻譯共性,發(fā)現(xiàn)《詩經(jīng)》翻譯譯本的形符/類符比為42.06,與其對應(yīng)的參照語料庫,即Whitman, Keats, Yeats, Byron等英美著名詩人的英語原創(chuàng)詩歌,它的形符/類符比為47.70[4];形符/類符比反映的是文本信息的承載量;魏黎研究了《醉翁亭記》的6個英譯本,結(jié)果顯示,它們的形符/類符比分別為52.99、45.50、49.27、52.34、51.69和48.71[5];理雅各(James Legge)、高本漢(Bernhard Karlgren)、彭馬田(Martin Palmer)和杜瑞清先后翻譯過我國上古歷史文獻和部分追述古代事跡的《尚書》,葛厚偉以這四個英譯本為基礎(chǔ),利用語料庫語言學(xué)研究方法,探討了這些英譯本的詞匯特征,發(fā)現(xiàn)它們的形符/類符比分別為38.5、36.89、38.64和41.88[6]。形符即單詞,一個文本中它可以反復(fù)計算,出現(xiàn)一次,計為一個形符;而類符指不重復(fù)計算的形符數(shù),即不重復(fù)計算的形符數(shù),一個文本中重復(fù)出現(xiàn)的形符只作一個類符。形符和類符之間的比值,是衡量譯者在譯文中使用不同單詞的比重,反映的是詞匯的寬度,即詞匯的重復(fù)率越低,形符和類符之間的比值越大。換個角度來說,比值越大,說明譯者駕馭詞匯的能力越強。在平均詞長方面,楊譯本比霍譯本高出0.02。呂榮等基于語料庫的研究顯示,許淵沖英譯宋詞時,英譯文的平均詞長是3.96,與之對比的本族語原創(chuàng)詩歌的平均詞長是4.04。理雅各(James Legge)、高本漢(Bernhard Karlgren)、彭馬田(Martin Palmer)和杜瑞清等英譯版《尚書》,譯本的平均詞長分別為4.41、4.40、4.30和4.72。英語文本的平均詞長大約為4。如果遠高于4,就意味著文本的語言比較復(fù)雜深奧[7]。上表的數(shù)據(jù)顯示,楊譯本的平均詞長為4.29,霍譯本的平均詞長為4.31。由此可見,兩個譯本的語言均較為復(fù)雜,而霍譯本略甚。
詞匯密度(lexical density)指實詞(lexical words/ content words)在研究文本中的比重,常見的詞匯密度計算辦法是Ure(1971)和Halliday主張的按照實詞和總詞數(shù)的百分比來計算,即研究中所建語料庫里實詞的形符數(shù)與該語料庫總形符數(shù)之間的百分比。英語中的實詞由名詞、動詞、形容詞和副詞構(gòu)成,它們都有信息負載量,能夠向讀者傳遞出具體的、有意義的信息,而虛詞包括代詞、連詞、介詞、冠詞等。兩個小型語料庫的實詞分布和詞匯密度(見表2)。
表2 兩個譯本的詞匯密度
在基于語料庫的研究中,我們常常將某個詞在兩個語料庫中檢索到的頻率,參照兩個語料庫的容量,通過卡方檢驗進行對比,以此確定兩個學(xué)習(xí)者群體在使用這些單詞時是否存在顯著差異。從表2我們可以看出,楊譯本和霍譯本在名詞、動詞、形容詞和副詞這四類實詞中,盡管使用的頻次有細微差異,但卡方檢驗顯示,兩個譯本的實詞分布沒有明顯差異。只是與霍譯本相比,楊譯本在名詞方面存在少用情況,而在其余三類詞均存在超用情況。就詞匯密度而言,判詞這兩個譯本的詞匯密度相當,但高出類似文本的詞匯密度。葛厚偉研究《尚書》的四個譯本時,發(fā)現(xiàn)它們的詞匯密度分別是51.73、55.49、54.53和52.87;楊廷君、張建理的研究發(fā)現(xiàn),中國優(yōu)秀博士論文英文摘要的詞匯密度是53.14,與其對應(yīng)的母語者博士論文英文摘要的詞匯密度是55.74;魏黎研究《醉翁亭記》的六個英譯本語言特征,結(jié)果顯示,它們的詞匯密度分別為51.67、55.29、53.28、56.01、55.41和55.08。詞匯密度反映了文本信息的承載量。詞匯密度越大,實詞數(shù)量就越多,文本信息量越大,閱讀難度相應(yīng)增加;反之,則越低[8]。上表數(shù)據(jù)顯示,楊譯本的詞匯密度為61.37,霍譯本的詞匯密度為60.34,均超過60??梢妰蓚€譯本的信息承載量大,閱讀難度較高,而楊譯本更甚。
詞頻,即單詞在某一文本中出現(xiàn)的頻率,對語料庫研究至關(guān)重要。我們建設(shè)語料庫,開展語言研究,在很大程度上歸結(jié)于頻率間的對比。語料庫內(nèi)部詞匯或短語的比較和兩個或多個語料間的比較,最終往往以檢索到的頻率進行比較。而高頻詞是語料庫中出現(xiàn)頻率較高的單詞。高頻詞與語體風(fēng)格密切相關(guān),其在不同語體中頻率上的差異可以作為我們判斷不同文體的重要標志。通過高頻詞,我們可以關(guān)注語言共性。下面我們通過表3討論兩個譯本中的高頻詞。
表3 兩個譯本前20位高頻詞對比
表3是我們利用Wordsmith統(tǒng)計出來的詞頻和詞頻比例。分析兩個譯本各自的20個高頻詞,我們發(fā)現(xiàn)楊霍兩位譯者在用詞習(xí)慣方面存在不同程度的區(qū)別。具體如下:
兩個譯本的高頻詞中同時包括10個單詞,說明兩位譯者用詞的傾同性較高。這10個單詞是:the, a, and, to, of, in, by, when, must和her;卡方檢驗顯示,兩個譯本使用這10個詞時,沒有出現(xiàn)明顯的差異;
1.兩個譯本排在首位的高頻詞都是定冠詞the,楊譯本的頻率為23,霍譯本為21;
2.兩個譯本這20個高頻詞的總頻次很接近,楊譯本合計164次,霍譯本合計160次;頻次的遞減幅度非常接近。楊譯本有5個單詞的使用頻次在13次及以上,而霍譯本只有4個單詞的出現(xiàn)頻率超過13次;兩個譯本的第20個高頻詞均只出現(xiàn)3次;
3.兩個譯本的高頻詞主要是虛詞,雖有名詞、動詞和形容詞,但它們占的比例很小。楊譯本的這20個高頻詞涉及7個詞類:動詞(be, is和must)、代詞(she, her和this)、介詞(to, in, of, by, for和from)、形容詞(sweet)、名詞(spring)、連詞(and, but和when)、冠詞(the和a),另外一個單詞as跨兩個詞類:連詞(3次)和介詞(1次);霍譯本的這20個單詞涉及7個詞類:介詞(of, in, with, by和to)、動詞(must, was, shall, born, came)、冠詞(the和a)、連詞(when和and)、副詞(yet)、代詞(you, your和her),另一個單詞end,2次用作動詞,1次用作名詞。從詞類數(shù)量可以看出,兩個譯本的高頻詞中,介詞最多。
4.兩個譯本的這40個高頻詞均只有1個音節(jié);楊譯本這20個單詞的平均字母數(shù)只有2.95,霍譯本的為3.10;
5.在人稱代詞方面,兩個譯本的高頻詞均有人稱單詞her,但頻率差異很大。楊譯本使用了21次,而霍譯本只使用了5次;但霍譯本使用了your(15次)和you(10次)。顯然,楊譯本采用的是第三人稱的視角來敘述人物故事,而霍譯本講述人物的生平故事時采用的是第二人稱[9]。上述差異說明兩位譯者選取了不同的人稱視角指代主人公,其情感傾向有所不同。
詞是一個具有形式與意義雙重特征的語言單位。我們在日常語言交際中,接觸的是詞的形式,聯(lián)想的是詞的意義。用索緒爾的話說,詞的形式是能指,詞的意義是所指[10]。詞匯的使用絕不僅僅是單個詞匯的問題,詞匯是與語法、句法相對而言的。我們要使用語言,根據(jù)語法規(guī)則從大腦提取詞匯時,有諸多因素影響我們的提取速度,如詞頻(frequency)、詞匯歧義(lexical ambiguity)、詞素結(jié)構(gòu)(morphological complexity)、詞匯性(lexicality)。詞頻是詞匯認知中的一個重要變量。提取總量多、頻率高的詞匯逐漸發(fā)展成為自主詞匯;提取少、頻率低的單詞則構(gòu)成聯(lián)想詞匯。研究表明,高頻詞認知的閾限低,容易被激活,檢索起來快,所需時間短;而低頻詞的認知閾限高,激活需要更多的時間和信息[11]。那么,《紅樓夢》這14首判詞英譯本所用單詞的詞頻如何呢?我們利用語料庫分析工具Range統(tǒng)計了兩個譯本的單詞詞級(見表4)。
表4 兩個判詞英譯本的詞頻概貌
表4中,“詞頻”一欄的0-1000表示使用頻率最高的1000個詞族,1001-2000表示使用頻率次高的1000個詞族,Academic是學(xué)術(shù)詞匯,內(nèi)含570個詞族。從表4可以看出,軟件Range統(tǒng)計數(shù)據(jù)顯示,兩個譯本的形符分別為:楊譯本295個,霍譯本296個。但這兩個譯本的形符在詞表中的分布有差異。楊譯本有形符295個,出現(xiàn)在三個詞匯表的數(shù)量分別是183(62%)、31(10.50%)和2(0.7%),三個詞匯表中出現(xiàn)的形符共計216個(22.90%),沒有出現(xiàn)在詞匯表中的形符為79(27.10%);而霍譯本中,形符為296個,出現(xiàn)在三個詞匯表中的數(shù)據(jù)分別為184(64.8%)、37(13%)和2(0.7%),三個詞匯表中的數(shù)據(jù)合計為296(79.4%),沒有出現(xiàn)在詞匯表中的形符為61(20.6%)。簡單地從數(shù)據(jù)來看,霍譯本在三個詞表中的單詞比楊譯本多出6.5個百分點。這樣的形符分布有統(tǒng)計學(xué)意義上的差異嗎?卡法檢驗結(jié)果顯示,在形符分布上,三個詞表的P值分別為0.289、0.448和0.997,均大于0.05,說明盡管霍譯本譯文的單詞比楊譯本的單詞稍微簡單,但它們在詞匯表上的分布沒有明顯差異。我們使用同樣的方法,檢測了類符和詞族的卡方值,得到的結(jié)果與形符一樣,兩個譯本之間差別細小,均沒有達到統(tǒng)計學(xué)上的差異,即無統(tǒng)計學(xué)顯著性差異。上表數(shù)據(jù)顯示,楊霍譯本所呈現(xiàn)的譯作水平相當。
翻譯是指人或機器將源語文化信息變化為目的語以求信息量相似的思維活動和語際活動[12]。譯者從一個既定的框架出發(fā),該框架由原文作者從自己已有的部分原型場景庫提取而來?;谠摽蚣?,譯者首先作為讀者根據(jù)自己經(jīng)驗和內(nèi)在知識建立自己的場景,并以非母語講話者的身份,激活不同于原文作者意圖或目標語言講話者的場景?!都t樓夢》英譯全譯本中,楊憲益先生與其夫人戴乃迭合譯的楊譯本和牛津大學(xué)中文系教授、著名漢學(xué)家霍克斯與其女婿閔福德合譯的霍譯本,是當今世上好評如潮的兩個譯本。
本文利用語料庫語言學(xué)研究方法,從形/次比、詞匯密度、高頻詞和詞匯概貌等方面對比分析了楊譯本和霍譯本的語言特征。研究發(fā)現(xiàn),兩個譯本的形/次比均明顯高于《尚書》、宋詞等英譯文,閱讀難度較大;兩個譯本的詞匯密度相當,均超過60。兩個譯本雖然在動詞、形容詞、副詞、名詞這些實詞應(yīng)用方面存在頻率上的差異,但這些差異均無統(tǒng)計學(xué)上顯著性差異特征;譯文的高頻詞分析顯示,在20個高頻詞中,兩個譯本有10個高頻詞相同??ǚ綑z驗顯示,這10個共同用高頻詞的使用頻率沒有統(tǒng)計學(xué)上的顯著差異,但在人稱使用方面,楊譯本采用了第三人稱視角來敘述人物故事,而霍譯本講述人物的生平故事時采用的是第二人稱;詞頻概貌統(tǒng)計結(jié)果顯示,霍譯本的用詞比楊譯本稍微簡單,在三個詞表內(nèi)的百分比高出楊譯本6.5個百分點,但沒有達到統(tǒng)計學(xué)上的差異性?;谡Z料庫的英譯文本語言特征比較,數(shù)據(jù)量化、維度多重、可操作性強,不失為一種具有借鑒意義的研究視角。