□孫 娟
基于語料庫的“Life”語義韻對(duì)比研究——以小說《德伯家的苔絲》為例
□孫 娟
本文分別采用數(shù)據(jù)驅(qū)動(dòng)方法和基于數(shù)據(jù)的方法,對(duì)托馬斯·哈代《德伯家的苔絲》中的“l(fā)ife”一詞進(jìn)行分析與研究,并與LOB語料庫進(jìn)行對(duì)比。首先通過AntConc 3.2.1w軟件進(jìn)行檢索,利用Collocates功能分別從自建的Tess語料庫與LOB語料庫中篩選出MI值大于等于3.0的“l(fā)ife”顯著性搭配詞,在此基礎(chǔ)上進(jìn)行語義韻對(duì)比分析;同時(shí)采用基于數(shù)據(jù)的方法,建立類鏈接,對(duì)“l(fā)ife”在這兩個(gè)語料庫中的語義韻進(jìn)行對(duì)比研究。在這兩種研究方法下,文章得出了一致性的研究結(jié)果,即在LOB語料庫中“l(fā)ife”一詞多為中性含義,而在Tess語料庫中,“l(fā)ife”多呈現(xiàn)消極意義。這種顯著性差異說明,在小說中,作者托馬斯·哈代借助了詞匯手段著墨苔絲的悲慘命運(yùn)以及她落魄無助的生活,增添了整個(gè)故事的悲劇色彩,為故事情節(jié)的展開埋下了伏筆。
語料庫 life 語義韻 德伯家的苔絲
語料庫研究表明,詞項(xiàng)的搭配行為顯示出一定的語義趨向:一定的詞項(xiàng)會(huì)習(xí)慣性地吸引某一類具有相同語義特點(diǎn)的詞項(xiàng),構(gòu)成搭配。由于這些具有相同語義特點(diǎn)的詞項(xiàng)與關(guān)鍵詞項(xiàng)在文本中高頻共現(xiàn),后者就被“傳染”上了有關(guān)的語義特點(diǎn),使語境內(nèi)彌漫著某種語義氛圍。這就是語義韻(semantic prosody)[1][2]。語義韻是語料庫語言學(xué)迄今為止發(fā)現(xiàn)的重要語言運(yùn)作機(jī)制之一[3],它可以大體分為積極語義韻(positive prosody)、消極語義韻(negative prosody)和中性語義韻(neutral prosody)三種。如果節(jié)點(diǎn)詞吸引的詞項(xiàng)幾乎都有積極涵義,那么該詞具有積極語義韻。相反,如果節(jié)點(diǎn)詞吸引的詞項(xiàng)幾乎都有消極涵義,那么該詞具有消極語義韻。如果節(jié)點(diǎn)詞吸引的詞項(xiàng)中,一些有積極涵義,一些有消極涵義,那么該詞具有中性語義韻[4]。
將語料庫應(yīng)用于文學(xué)作品也是語料庫研究的一個(gè)熱點(diǎn)。根據(jù)文學(xué)文本情節(jié)復(fù)雜的特點(diǎn),語料庫檢索工具可以對(duì)其主題、人物和情節(jié)發(fā)展等進(jìn)行趨于理性的加工、分析和統(tǒng)計(jì),從巨量的文字庫中提取出骨架,再結(jié)合文義,進(jìn)而從一個(gè)全新的角度對(duì)文學(xué)文本進(jìn)行研究。托馬斯·哈代的《德伯家的苔絲》是一部非常經(jīng)典的悲劇作品,講述了出生于沒落貴族家庭的女主人公苔絲最終沒能逃脫悲慘的命運(yùn)而死于絞刑的故事。她的一生充滿了悲劇色彩,因此本文從文本中提取“l(fā)ife”一詞,結(jié)合語料庫對(duì)其進(jìn)行語義韻分析,并與LOB語料庫進(jìn)行對(duì)比,通過對(duì)比差異深入分析哈代為渲染主題而采用的技巧。下面首先簡要介紹語義韻研究的一般方法。
衛(wèi)乃興(2001)對(duì)語義韻的一般研究方法進(jìn)行了歸納與總結(jié)。他認(rèn)為,語義韻的研究主要有三種方法:1.建立并參照類聯(lián)接,用基于數(shù)據(jù)的方法(data-based approach)研究;2.計(jì)算節(jié)點(diǎn)詞的搭配詞,用數(shù)據(jù)驅(qū)動(dòng)的方法(data-driven approach)研究;3.用基于數(shù)據(jù)與數(shù)據(jù)驅(qū)動(dòng)相結(jié)合的方法研究。
(一)建立類聯(lián)接,基于數(shù)據(jù)來概括和描述的語義韻
類聯(lián)接是詞語搭配研究中的一個(gè)重要概念,指語法范疇間的結(jié)合。類聯(lián)接不是與詞語搭配平行的抽象表述,而是高一級(jí)的抽象[5]。Mitchell[6]認(rèn)為,類聯(lián)接是關(guān)于詞語組合類別的抽象表述,搭配則是類聯(lián)接的具體實(shí)現(xiàn)。換言之,類聯(lián)接是一種句法結(jié)構(gòu),是從文本中概括或抽象出來的用句法范疇表述的搭配類,用來描述詞語的典型語法功能。一個(gè)類聯(lián)接代表了一個(gè)搭配類(collocational class),類聯(lián)接建立后,便可以觀察、概括和描述關(guān)鍵詞的語義韻。
(二)計(jì)算搭配詞,用數(shù)據(jù)驅(qū)動(dòng)方法研究語義韻
這種方法主要是利用軟件,對(duì)語料進(jìn)行自動(dòng)檢索,并對(duì)搭配進(jìn)行計(jì)算和統(tǒng)計(jì)測(cè)量。目前使用的統(tǒng)計(jì)手段主要有Z值、T值或MI值,以檢驗(yàn)搭配詞與節(jié)點(diǎn)詞共現(xiàn)的顯著程度。當(dāng)Z和T值達(dá)到2.0,或MI值達(dá)到3.0時(shí),搭配詞可以視為顯著搭配詞。所謂節(jié)點(diǎn)詞(node word),即研究人員要在語料中檢查其搭配行為的關(guān)鍵詞。跨距(Span)是由節(jié)點(diǎn)詞左右詞項(xiàng)構(gòu)成的語境,以詞形為單位計(jì)算,不包括標(biāo)點(diǎn)符號(hào)。一般來說,將跨距界定為-4/+4或-5/+5是最適宜的[7]。所有落入跨距的詞項(xiàng)都視作節(jié)點(diǎn)詞的搭配詞(collocates)。這種研究方法的特點(diǎn)是:研究者頭腦中沒有太多先入為主的觀念,而是由數(shù)據(jù)引導(dǎo)進(jìn)行研究和描述,人為因素較少,主要靠自動(dòng)化程序進(jìn)行檢索、提取和統(tǒng)計(jì)測(cè)量。
(三)基于數(shù)據(jù)與數(shù)據(jù)驅(qū)動(dòng)相結(jié)合,建立語義韻結(jié)構(gòu)
這是一種比較折中的方法,是將上述兩種方法結(jié)合起來使用。一般做法是:先從語料庫隨機(jī)抽取一定數(shù)量的索引,然后界定跨距、提取搭配詞、建立和參照類聯(lián)接、檢查和概括搭配詞的語義特點(diǎn),最后建立節(jié)點(diǎn)詞的語義韻結(jié)構(gòu)。
本研究以自建的托馬斯·哈代《德伯家的苔絲》語料庫和LOB語料庫為基礎(chǔ)。自建Tess語料庫庫容量約為30萬詞。LOB語料庫建于上世紀(jì)70年代初,由英國Lancaster大學(xué)和挪威Oslo大學(xué)以及Bergen大學(xué)建成,庫容量約為100萬詞次。
本研究首先采用數(shù)據(jù)驅(qū)動(dòng)的方法,主要通過AntConc 3.2.1w軟件進(jìn)行檢索,利用Collocates計(jì)算“l(fā)ife”的搭配詞的MI值。當(dāng)MI≥3.0時(shí),表明該詞與節(jié)點(diǎn)詞之間有較強(qiáng)的搭配力(Church & Hanks,1990;Hunston,2002;Stubbs,1995)。因此,本文用跨距為±4,相互信息值MI≥3.0的標(biāo)準(zhǔn)分別提取自建Tess語料庫和LOB語料庫中“l(fā)ife”的搭配詞。在此基礎(chǔ)上,對(duì)“l(fā)ife”在兩個(gè)語料庫中搭配詞的語義內(nèi)涵進(jìn)行對(duì)比分析,以此來考察哈代的寫作手法。為了研究結(jié)果的準(zhǔn)確性以及權(quán)威性,本文同時(shí)采用了基于數(shù)據(jù)的方法,即利用AntConc軟件中的Concordance功能,分別提取“l(fā)ife”的索引行,然后建立類聯(lián)接,進(jìn)行語義韻分析。
(一)基于數(shù)據(jù)驅(qū)動(dòng)的方法
本文利用Collocates統(tǒng)計(jì)出在自建語料庫(Tess)中,“l(fā)ife”搭配詞的MI值≥3.0的共計(jì)417例,節(jié)點(diǎn)詞“l(fā)ife”所吸引的顯著性搭配詞主要有“Modern,impractical,crisis,brokenly,unreasonable,destroy,burden,wasted,universe,rough”等,在此只列舉具有典型代表性的幾例。本文以同樣的方法提取了從LOB語料庫中所檢索到的符合要求的“l(fā)ife”顯著搭配詞。如表1所示:
表1:“l(fā)ife”的顯著搭配詞統(tǒng)計(jì)數(shù)據(jù)
通過觀察表格不難發(fā)現(xiàn),“l(fā)ife”的顯著性搭配詞無論是在自建語料庫(Tess)中,還是在LOB語料庫中,都呈現(xiàn)較高的MI值,說明節(jié)點(diǎn)詞“l(fā)ife”具有較強(qiáng)的語義選擇趨向,吸引它們相互聚集。在Tess語料庫中,這些搭配詞有如下特點(diǎn):“impractical,crisis,brokenly,unreasonable,destroy,burden,wasted,rough”這8例均呈現(xiàn)出明顯的消極性語義,“modern”和“universe”呈現(xiàn)出中性語義內(nèi)涵。這說明在Tess中,和“l(fā)ife”搭配的詞多是表現(xiàn)悲觀的生活態(tài)度和消極情緒的詞語。而在LOB語料庫中:“single,uneventful,antecedent,everyday,the,tranquil,inner”這7例呈現(xiàn)中性語義,“comfortable”呈現(xiàn)出明顯的積極語義,“dully”呈現(xiàn)出明顯的消極語義。對(duì)比表明,LOB語料庫與Tess語料庫在“l(fā)ife”的搭配詞方面表現(xiàn)出了明顯的差異性,在LOB語料庫中,“l(fā)ife”的搭配詞多呈現(xiàn)中性意義,而在Tess語料庫中卻多呈現(xiàn)出消極語義。通過搭配詞的語義差別對(duì)比可以推測(cè)出,在《德伯家的苔絲》這部小說當(dāng)中,作者托馬斯·哈代為了渲染整個(gè)故事的悲劇色彩,特別是為了著墨苔絲的悲慘命運(yùn)以及她落魄無助的生活,運(yùn)用了悲劇化搭配詞的寫作手法來實(shí)現(xiàn)理想的情感目的。
(二)基于數(shù)據(jù)的方法
通過AntConc的Concordance檢索發(fā)現(xiàn),“Life”一詞在自建語料庫(Tess)中共有131條索引,其中有1條索引重復(fù),剔除重復(fù)的1條后,剩下有效索引130條。在LOB語料庫中,檢索到711條索引,本文采用系統(tǒng)隨機(jī)抽樣法,即每隔四行取一次的方法抽取了共計(jì)142條有效索引。限于篇幅,現(xiàn)僅將兩個(gè)語料庫中的前10條索引顯示如表2和表3。
表2:自建語料庫(Tess)中的前10條索引
表3:LOB語料庫中抽樣后的前10個(gè)索引
本文對(duì)在這兩個(gè)語料庫中所提取的索引分別進(jìn)行了歸納和總結(jié),并建立了類聯(lián)接,在此基礎(chǔ)上分析“l(fā)ife”的語義韻。表4為Tess語料庫中“l(fā)ife”的相關(guān)類聯(lián)接及語義韻,表5為LOB語料庫中“l(fā)ife”的相關(guān)類聯(lián)接及語義韻。
表4:Tess語料庫中“l(fā)ife”的相關(guān)類聯(lián)接及語義韻
表5:LOB語料庫中“l(fā)ife”的相關(guān)類聯(lián)接及語義韻
PRON+N 39(27.46%) 11(36.67%) 21(25.00%) 7(25.00%)V+N+PREP 15(10.56%) 2(6.67%) 11(13.10%) 2(7.14%)總數(shù) 142(100%) 30(21.12%) 84(59.15%) 28(19.72%)
對(duì)比表4和表5可以發(fā)現(xiàn),“l(fā)ife”的類聯(lián)接與語義韻在Tess語料庫與LOB語料庫中既有相似之處,也存在差異性。通過觀察得知:“l(fā)ife”的類聯(lián)接形式在這兩個(gè)語料庫中存在很大的共性,都包含六種類聯(lián)接,即N+N,PREP+N,DT+N+PREP,ADJ+N,PRON+N,V+N+PREP。每個(gè)類聯(lián)接在這六個(gè)類聯(lián)接中所占的比重相似,其中,ADJ+N和PRON+N占的比重較大,兩者大約占總數(shù)的一半,其余四項(xiàng)類聯(lián)接比重較小且比例相當(dāng)。這充分說明了托馬斯·哈代《德伯家的苔絲》中“l(fā)ife”一詞的用法遵循了英語的一般用法,符合英國人的表達(dá)習(xí)慣。
值得一提的是,“l(fā)ife”一詞的語義韻在這兩個(gè)語料庫中呈現(xiàn)出了較大的差異,主要表現(xiàn)在:在自建語料庫(Tess)中,“l(fā)ife”的語義韻積極涵義和中性涵義所占比重相當(dāng),分別為25.38%和27.69%,而消極涵義接近半數(shù),占到了總數(shù)的46.92%。這說明在Tess中,“l(fā)ife”多呈現(xiàn)消極意義,具有濃厚的悲觀主義色彩,這一點(diǎn)與哈代的宿命觀是一致的。在LOB語料庫中,“l(fā)ife”的積極語義韻和消極語義韻比重相當(dāng),分別為21.12%和19.72%,中性語義韻超過半數(shù),為59.15%。通過這兩個(gè)語料庫的前后對(duì)比,可以很清晰地看到哈代的寫作手法,悲觀色彩貫穿作品全篇。通過運(yùn)用這種詞匯手段來渲染苔絲的悲慘命運(yùn),為小說的悲劇結(jié)局埋下了伏筆。通過基于數(shù)據(jù)的分析,本文得出了與基于數(shù)據(jù)驅(qū)動(dòng)的分析相一致的結(jié)論,進(jìn)一步證明了本文數(shù)據(jù)的有效性。
語義韻研究可以豐富人們對(duì)語言規(guī)則的認(rèn)識(shí),加深對(duì)語言運(yùn)作機(jī)制的理解,促使人們重視詞語行為模式(衛(wèi)乃興,2002)。為了增強(qiáng)研究結(jié)果的可靠性和權(quán)威性,本文分別采用了數(shù)據(jù)驅(qū)動(dòng)的方法和基于數(shù)據(jù)的方法,對(duì)《德伯家的苔絲》中的“l(fā)ife”一詞進(jìn)行了語義韻研究,并與LOB語料庫進(jìn)行了對(duì)比。研究表明:在自建語料庫(Tess)與LOB語料庫中,“l(fā)ife”一詞的類聯(lián)接形式具有很大的共性,都有六種類聯(lián)接:N+N,PREP+N,DT+N+PREP,ADJ+N,PRON+N,V+N+PREP,并且各自所占的比重相當(dāng)。但是“l(fā)ife”在這兩個(gè)語料庫中呈現(xiàn)出的語義韻卻存在較大的差異性,主要表現(xiàn)在:在LOB語料庫中,“l(fā)ife”多呈現(xiàn)中性語義韻,而在自建語料庫(Tess)中,“l(fā)ife”多呈現(xiàn)消極語義韻。這種顯著性差異充分說明了:在小說《德佰家的苔絲》中,作者托馬斯·哈代多用消極悲觀色彩詞來描述命運(yùn)與生活,通過運(yùn)用這種詞匯手段來渲染苔絲的悲慘命運(yùn),充分體現(xiàn)了作者的宿命觀,悲觀主義色彩貫穿全篇,為小說的悲劇結(jié)局埋下了伏筆。
(本文為廣東外語外貿(mào)大學(xué)高層次人才引進(jìn)聯(lián)合項(xiàng)目“認(rèn)知翻譯學(xué)的理論及模型建構(gòu)”[GWTP-YJ-2015-07]和廣東省人文社會(huì)科學(xué)重點(diǎn)研究基地廣東外語外貿(mào)大學(xué)翻譯學(xué)研究中心2015年招標(biāo)項(xiàng)目“認(rèn)知翻譯學(xué)的學(xué)科理論基礎(chǔ)及體系建構(gòu)研究”[CTS201503]的階段性研究成果。)
[1]Sinclair,J.Corpus,Concordance,Collocation[M].Oxford:Oxford University Press,1991.
[2]Louw,B.Irony in the Text or Insincerity in the Writer?The Diagnostic Potential of Semantic Prosodies[A].In M.Baker,G.Francis &E.Tognini-Bonelli(eds.).Text and Technology:In Honour of John Sinclair[C].Amsterdam:John Benjamins,1993.
[3]衛(wèi)乃興.基于語料庫學(xué)生英語中的語義韻對(duì)比研究[J].外語學(xué)刊,2006,(5):50-54.
[4]Stubbs,M.Text and Corpus Analysis[M].Oxford:Blackwell Publishers,1996.
[5]Firth,J.R.Papers in Linguistics 1934-1951[C].London:Oxford University Press,1957.
[6]Mitchell,T.F.Principles of Firthian Linguistics[M].London:Longman,1975.
[7]Jones,S & J.Sinclair.English Lexical Collocations:A Study in Computational Linguistics[C].Cahiers de Lexicoligie,1974,(2):15-61.
(孫娟 廣東廣州 廣東外語外貿(mào)大學(xué)高級(jí)翻譯學(xué)院 510420)