• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      外語研究中的語料庫方法

      2012-11-22 02:50:34
      大連大學學報 2012年4期
      關(guān)鍵詞:近義詞連詞語料

      班 柏

      (四川大學 外國語學院,四川 成都 610064)

      楊惠中認為,語料庫是現(xiàn)代語言學的三大研究方法之一,其它兩個分別是內(nèi)省法(introspection)和誘導法(elicitation)。[2]如今,語料庫已廣泛應用于外語研究,除了語言學領(lǐng)域,還可應用于翻譯研究、文學研究、文化研究、詞典學研究等領(lǐng)域。本文擬在上述方面展開討論。

      一、語料庫與翻譯研究

      基于語料庫的翻譯研究(Corpus-Based Translation Studies:CBTS)已經(jīng)成為當今描述翻譯研究領(lǐng)域中一種新的研究范式。Baker提出了基于語料庫的翻譯普遍特征,即:簡略化(simplification)、明晰化(explicitation)、規(guī)范化(normalisation)和平整化(levelling out)。后來的研究者主要集中在平均句長、類符/型符比、詞匯密度等進行共時語料研究。Baker[3]還對譯者風格研究給出了較為可行的模式。她認為,風格是表達的個性特征。文本類型的選擇、翻譯策略的運用、前言、后語、腳注、文內(nèi)注也在廣義的翻譯風格之內(nèi)。

      語料庫對翻譯的考察,既可以在微觀層面,也可以在宏觀層面進行。微觀上可對文本細節(jié)進行考察,宏觀上可對文本內(nèi)外的文化模式進行考察。有研究采用語料庫的方法對《尤利西斯》進行了意識流語言特點翻譯的研究[4]。將蕭乾、金隄譯本的句長及不同句子對齊比在語料庫中所占比例進行了分析,結(jié)果發(fā)現(xiàn)蕭譯本句式多變,而金對齊比占語料庫中對齊句子總數(shù)的98%,非常傾向于保留原文的句式。分析其原因在于蕭譯的譯文讀者取向和金譯的原文取向。這種方法也驗證了施萊爾馬赫對兩種不同翻譯途徑的闡述。要么不擾亂原作者的安寧,讓讀者去接近作者,要么盡可能地不擾亂讀者的安寧,讓作者去接近讀者。在語篇層面,該研究對比了銜接機制的差異,通過代詞的統(tǒng)計分析了兩種譯本敘述方式的差異。

      運用語料庫還可以對漢語翻譯語體進行研究,翻譯語言的特征是20世紀80年代以來的研究熱點之一。Toury(1979)提出了“中介語”(interlanguage),F(xiàn)rawley提出了“第三語碼”。Baker(1993)提出“翻譯共性”(translation universals),Sch¨a ff ner&Adab(2001)提出“雜合語言”(hybrid language)。Olohan(2004)提出的“翻譯的特征”(features of translation),都將翻譯語言作為獨特的語言變體來研究。

      對翻譯共性的研究主要集中在簡化、顯化、規(guī)范化三個方面??梢酝ㄟ^類符/型符比(TTR)反映譯文的用詞豐富程度,進而考察其簡化特征。詞匯密度(實詞型符/總型符)也可考察文本信息量和難易程度。平均詞長、平均句長、平均段長可以考察翻譯文本的可讀性。詞類頻率分布可考察譯本受到源語的影響大小。顯化特征可以從語法顯化程度(虛詞比例)來加以考察,胡顯耀的研究[5]還分析了助詞、介詞、連詞、代詞總頻率,發(fā)現(xiàn)了譯文在以上方面使用的高頻化趨勢。規(guī)范化可通過高頻詞前十等來體現(xiàn)。一次性詞(hapax legomena)可體現(xiàn)譯文的創(chuàng)造性。把字句、被子句、習用語、成語等也可體現(xiàn)譯文的地道性或規(guī)范性。胡文通過多維分析的手段,發(fā)現(xiàn)漢語文學比非文學翻譯語法明顯顯化,翻譯語料的句子長度更長,更集中地使用常用詞(高頻詞)、習慣用語和被字句、把字句、成語等漢語特有的用法。當然,這些特征在文學翻譯和非文學翻譯語料中的表現(xiàn)有所不同??傮w而言,漢語文學翻譯與文學原創(chuàng)的差別大于非文學翻譯與原創(chuàng)之間的差異。

      以上是語料庫在翻譯研究中的應用舉隅。國內(nèi)語料庫翻譯實證研究主要集中于翻譯普遍性的研究,其他領(lǐng)域很少涉及,研究范圍過于狹窄。楊梅和白楠指出,語料庫翻譯研究還存在“理論研究欠缺、實證研究少”等問題[6]。

      二、語料庫與文學研究

      語料庫用于文學研究領(lǐng)域,出現(xiàn)了語料庫文體學等新興研究領(lǐng)域。語料庫語言學用于文學研究領(lǐng)域特點如下:一、驗證文學語言與思想表達方式的完整性,文學評論的合理性;二、定量分析和定性分析結(jié)合,研究文本的潛在意義。李晉,郎建國認為,“該領(lǐng)域的最初研究以歸納驗證文學文本的語言特征為主,而后期逐步轉(zhuǎn)向?qū)ξ谋尽饬x’的探析?!保╗7]

      在歸納與驗證方面,語料庫文體學是比較典型的應用。2001-2007年間共舉辦了四屆語料庫語言學會議(第一屆到第四屆),均對這一領(lǐng)域有所探討。第三屆的一個議題即“文學文本語言的語料庫研究方法”,會議要點如下:(1)借用語料標注和分析解析文學語言特征;(2)利用參照語料庫中詞語搭配、類聯(lián)接、語義韻等語言證據(jù)來研究文本的文學效果(或“偏離常規(guī)的現(xiàn)象”);(3)借助語料證據(jù)辨別或分析語言的獨創(chuàng)性。這些嘗試無疑為語料庫文學研究拓展了思路,同時解決了技術(shù)層面的部分問題。

      在探究文學文本的意義方面,語料庫也做成了獨特的貢獻。麥卡拉·麥博格(Michaela Mahlberg)[8]認為,運用新型分類法,如“詞語搭配(collocations)、詞叢(clusters)、詞項(lexical items)及局部語篇功能(local textual functions)等描述工具”有助于探索文學文本的意義。

      語料庫用于文學研究也日趨便捷,羅吾提出,語料庫文體學家擁有以下三樣即可完成文學文本分析:1)可機讀的文學文本;(2)收有文學文本及非文學文本語料的參照語料庫;(3)用于檢索詞語搭配情況的索引軟件[9]。以邁克爾·斯特布斯的研究為例,他在分析康拉德《黑暗的心臟》時,利用語料庫分析了詞頻、詞的分布、文本結(jié)構(gòu),單個詞的搭配情況、詞語-語法結(jié)構(gòu)以及互文性信息,為敘述者馬婁的不可靠性和種族偏見主題等提供了數(shù)據(jù)支撐,為其語言特征提出了新的見解[10]。文本意義的發(fā)掘成為語料庫文學研究的重點領(lǐng)域。

      利用語料庫還可對文學文本中的主題意義、文體風格、語言特色、人稱視角和象征意義進行分析,為文學研究另辟蹊徑。通過文本量化對文學作品更為理性地解讀。

      三、語料庫與文化研究

      語料庫用于文化研究,目前在文化詞匯研究已有一定進展。例如,何宇茵在《基于美國當代英語語料庫的中國文化詞匯研究》(2010:7-11)一文中,采用美國當代英語語料庫,統(tǒng)計了每百萬詞詞頻超過0.5的詞項(表1)[11]:

      ?

      其研究發(fā)現(xiàn)“武術(shù)”應譯為kong fu,而非意義更為廣泛的martial arts;Lei Feng正是對“雷鋒精神”的準確解讀,并指出,美國對中國文化的深層理解仍有空白。這種以語料庫為輔助的文化研究給出了令人信服的證據(jù)。

      運用語料庫進行文化研究目前尚不充分,僅在文化詞匯、法律文化等領(lǐng)域有所應用,其他方面仍有待加強。

      四、語料庫與詞典學研究

      另外,語料庫也可用于詞典研究,有學者應用語料庫對雙語詞典編撰中的文化詞條的譯義問題進行了研究[1參見衡孝軍把漢語成語和諺語的英譯手段分為4種:詞譯、直譯、意譯和功能對等(即英語中相應的成語或諺語)。參見衡孝軍.從社會符號學翻譯法看漢語成語英譯過程中的功能對等.中國翻譯,2003,24(6):23-25.2],該研究采用雙語平行語料庫CrpDict系統(tǒng),以“馬不停蹄”、“馬到成功”、“馬馬虎虎”、“先發(fā)制人”、“熙熙攘攘”、“人老珠黃”、“亡羊補牢”這7個成語及短語為例,通過語料庫手段進行歸納整理,最終發(fā)現(xiàn),以往的詞典編撰受人工操作的限制,無法在目標語中大規(guī)模進行對應語段的檢索,解釋性對應詞成為無奈之選。但運用平行語料庫來檢索、發(fā)掘?qū)Φ仍~(釋義詞)、提取例證、研究搭配,可以還原關(guān)鍵詞所在的真實語境。從而有效地彌補文化虧損(cultural loss),接近衡孝軍倡導的功能對等的譯義1。

      近義詞辨析研究也是新興的詞典研究的重要領(lǐng)域之一,語料庫為這一研究提供了新的方法。語料庫在以下方面都發(fā)揮了極其重要的作用,如近義詞的詞匯搭配,近義詞的語義韻,近義詞的類連接以及近義詞的語域分布。搭配和語義韻是辨析語詞意義相關(guān)性的重要概念;運用語料庫進行相關(guān)研究更簡潔、有效。有學者使用高等教育出版社2007年出版的《英語學習與交際大詞典》和商務印書館2009年出版的《牛津高階英漢雙解詞典》(第7版),研究其近義詞辨析專欄[13]。以cause和bring about為例,《交際詞典》未對cause的消極語義韻特征和bring about的積極或中性語義韻特征進行描述?!杜=?》則運用語料庫手段進行了近義詞的辨析。給出了語義韻特征,常用搭配,但仍然不夠系統(tǒng)。該文作者進一步強調(diào)了近義詞列的選取,近義詞的辨析信息處理以及詞典中近義詞的索引結(jié)構(gòu)設(shè)置的重要性。

      現(xiàn)在在編寫英語詞典時幾乎無不利用語料庫。詞典從語料庫中所獲得信息的方式大多數(shù)都是隱性的。即通過對語料庫數(shù)據(jù)的分析來幫助詞典編纂者對一些編纂問題做出決策,如詞義(某一語詞有多少義項)、片語(哪些短語或搭配值得凸顯)、句法特征(哪些句法結(jié)構(gòu)需要收入詞典中)等等。Rundell提出了語料庫詞典學的顯性研究話題[14]。顯性研究之所以可能是因為新科技給詞典編纂者提供了讓詞典使用者直接使用語料庫信息的機會。COBUILD詞典大膽地采用從語料庫中選取的、未經(jīng)過任何修改的句子作為例證來闡示語詞的用法,這種做法引起了一定的爭議。語料庫的真正價值在于為詞典編纂者分析語詞意義與用法提供了不可或缺的原始數(shù)據(jù)。在具體層面上,即單個詞條層面,語言數(shù)據(jù)使我們能夠非常精確地描述語詞的意義。在系統(tǒng)層面,語料庫讓我們重新認識語言使用的規(guī)律。

      五、語料庫與語言學研究

      當然語料庫最重要的領(lǐng)域仍然是語言學。比利時魯漢大學英語語料庫中心負責人Sylviane Grander教授利用平行語料庫考察英法兩種語言在語態(tài)(主動語態(tài)和被動語態(tài))、連詞(并列連詞和從屬連詞)以及代詞方面的對應關(guān)系和變化趨勢(陸軍,張樂:32),研究發(fā)現(xiàn):(1)在新聞文體的英法平行語料中,法文原文中被動語態(tài)的頻數(shù)遠遠低于英文原文。然而,在對應的翻譯語料中,被動語態(tài)的頻數(shù)都呈現(xiàn)減少趨勢,英譯法中的頻數(shù)降低幅度更為明顯;(2)英語和法語在從屬連詞和并列連詞的分布上也存在差異,在英法翻譯中有很多并列連詞轉(zhuǎn)換成從屬連詞,同時有很多從屬連詞轉(zhuǎn)換成并列連詞??傮w而言,英譯法過程中,主要表現(xiàn)為并列連詞轉(zhuǎn)換為從屬連詞,而法譯英過程正好相反;(3)平行語料庫為觀察詞語對等現(xiàn)象(lexical equivalence)提供了大量證據(jù):在英法平行語料庫中,動詞、代詞和介詞都表現(xiàn)出不同的分布頻數(shù)和對等程度,其中法語中的代詞on視語境不同而譯為英語one和you等。

      語料庫語言學還可以用于隱喻研究,其方法大致有以下幾種:削尾處理(lemmatization)、形符數(shù)(token)和類符數(shù)(type)、詞語索引(concordance)。(參見朱煒:49)把隱喻關(guān)鍵詞設(shè)為類符,它們以不同形態(tài)的出現(xiàn)視為形符,那么類符數(shù)和形符數(shù)的乘積就是回鳴值(resonance)?;伉Q值表明某類隱喻在一定語料中的出現(xiàn)率,它是隱喻產(chǎn)率的衡量標準[15]。

      朱煒的研究運用語料庫的手段對比了曼德拉和里根總統(tǒng)的演講,發(fā)現(xiàn)曼德拉演講語料的隱喻種類少于里根演講語料的隱喻種類,類符數(shù)(163個)少于里根演講語料的隱喻的類符數(shù)(187個),但曼德拉演講語料的形符數(shù)(872個)卻多于里根演講語料的形符數(shù)(606個),特別在沖突類、建筑物類隱喻中相差明顯。相同的是在政治演講中他們均傾向于使用沖突、旅程、建筑物、火與光、人體部位、植物、地理環(huán)境、宗教、健康和飲食等10類隱喻[16]。

      近十年,語料庫語言學在中國的發(fā)展迅猛,建成了一批可與國際同類語料庫相比的專門語料庫、學習者口筆語語料庫、平行語料庫等,研究話題也從詞匯、語法和詞典學擴展到語言教學、二語習得、翻譯、自然語言處理、話語分析、認知語言,乃至抽象的理論語言學問題探索等廣泛的領(lǐng)域[17]。

      以語料庫方法進行外語教學研究為例,上海交大研發(fā)的JDEST學術(shù)英語語料庫提供了通用詞匯、技術(shù)詞匯、次技術(shù)詞匯的應用信息,為中國大學英語教學大綱制定了可靠的科學量化依據(jù)。Tim Johns(1991)提出數(shù)據(jù)驅(qū)動學習(Data-driven Learning)是一種把語料庫數(shù)據(jù)和檢索技術(shù)直接應用于外語教學的方法。其主要思想是引導學生基于語料庫中大量真實語言數(shù)據(jù),通過觀察、描述、歸納語言使用現(xiàn)象,自我發(fā)現(xiàn)語言規(guī)律,突破了傳統(tǒng)外語教學中的規(guī)約式課程和內(nèi)省式數(shù)據(jù)。

      語料庫語言學可用于二語習得。國內(nèi)已建成的學習者語料庫除了CLEC,COLSEC,SWECCL和MSEE以外,還有華中科技大學的“碩士寫作語料庫”(簡稱MWC,12萬詞),華南師范大學的“國際外語學習者英語口語語料庫中國部分”(LINSEI-China,10萬詞)。研究多數(shù)將學習者英語同母語者英語對比,進行學習者英語特征分析和錯誤分析。研究話題涉及了搭配、類聯(lián)接、語義韻、句型、語篇、語體等特征描述,對二語習得研究以及英語教學研究具有重要參考價值。語料庫還將繼續(xù)在語篇分析研究、自然語言處理等領(lǐng)域發(fā)展。甄鳳超指出,“從宏觀角度看,短語學(Phraseology)將持續(xù)成為語料庫語言學的核心研究內(nèi)容之一,從而影響到各個領(lǐng)域研究的態(tài)勢和趨向。”[17]40

      Tognini-Bonelli將語料庫語言學的方法分為兩種:以語料庫為基礎(chǔ)的(corpus-based)研究方法和受語料庫驅(qū)動的(corpus-driven)研究方法。(2001:89)以語料庫為基礎(chǔ)的研究方法指的是研究者用語料庫提供的大量真實語言材料去支持或推翻現(xiàn)有的語言學理論或語言描述,其結(jié)果不會產(chǎn)生新的語言理論。為此,Tognini-Bonelli主張采用受語料庫驅(qū)動的研究方法。對建立在直覺基礎(chǔ)上的語言學理論持較開放的態(tài)度,認為現(xiàn)有理論有可能捕捉不到一些人們不易察覺或容易忽略的現(xiàn)象。由Sinclair主持的Collins Cobuild English Dictionary被認為是第一項受語料庫驅(qū)動的研究,它對意義的解釋提出了新的方法,認為語言運用離不開語境,語境決定詞匯的意義。該詞典就提供了語境的描述,如詞匯的搭配(collocation),類聯(lián)接(colligation)以及語言單位使用的社會場景等,同時還提供了語用信息。

      語料庫語言學基本研究方法是自下而上的,即通過真實語言數(shù)據(jù)來體現(xiàn)語言學理論。研究過程體現(xiàn)為提取(extraction)——觀察(observation)——概括(generalization)——解釋(interpretation)。也有一種自上而下的方法:語料庫例證的方法。此時,語料庫只是用來佐證特定理論、觀點的工具。

      一部分語料庫學者也在嘗試使用語料庫數(shù)據(jù)解釋心智語言問題,如生成語言學和認知語言學等領(lǐng)域的問題(Hoey,2005)。這些研究體現(xiàn)了學科融合和交叉。

      生成語言學研究的核心焦點是語言能力;語言能力體現(xiàn)為心智中存在的普遍語法。認知語言學雖然強調(diào)社會環(huán)境與語言使用對語言知識的重要作用,但從根本上仍視語言為一種心智現(xiàn)象或認知事件。心智語言本質(zhì)上難以可觀察,其探索需要復雜的心理語言實驗和神經(jīng)語言研究;僅憑語料庫數(shù)據(jù),無法知道語言規(guī)則和詞語型式如何在大腦組織。衛(wèi)乃興指出,“語言學者很難憑借自己的數(shù)據(jù)推斷心理詞庫、詞匯啟動、心智表征、認知處理等問題?!保?009:39)

      過去30多年間,語料庫語言學主要集中于共時研究,最近幾年歷時研究范式正在興起。Teubert是歷時研究范式的主要創(chuàng)設(shè)者之一(Teubert 2004,2007)。他所研究的話語意義涉及具體詞語不同時期意義的演變,如“human rights”,“work”,“wealth”等。從歷時的角度考察話語意義的演變,會增加研究發(fā)現(xiàn)的解釋力。

      六、結(jié)束語

      本文分別就語料庫應用于外語研究中的翻譯、文學、詞典學、文化研究和語言學領(lǐng)域分別進行了介紹。在語料庫翻譯研究中重點介紹了翻譯語體研究和翻譯共性研究。同時指出了不足之處。在語料庫文學研究方面,在歸納與驗證方面及文本意義方面進行了挖掘,給出了語料庫文學研究的多元視角。在語料庫文化研究方面,重點介紹了文化詞匯研究。在語料庫詞典學研究方面,介紹了雙語詞典編撰中的文化詞條的譯義問題的語料庫處理方案,并對詞典編撰中的近義詞辨析進行了探索。最后,在語料庫語言學方面,考察了語態(tài)、銜接手段、詞性的分布頻數(shù)及其對等程度等相關(guān)研究。文章還對語料庫語言學的方法進行了歸納,展望了其發(fā)展前沿。

      [1]桂詩春.語料庫語言學的發(fā)展前景與資源共享[J].現(xiàn)代外語,2010(4):419.

      [2]楊惠中.語料庫語言學導論[M].上海:上海外語教育出版社,2002:6.

      [3]Baker,M.Corpus-based translation studies:the challenges that lie ahead[G]//H.Somers(ed.).Terminology,LSP and Translation:Studies in Language Engineering,in Honor of Juan C.Sage.Amsterdam:John Benjamins,1996:176-186.

      [4]韓佳霖,夏廷德.基于語料庫的《尤利西斯》意識流語言特點翻譯[J].大連海事大學學報(社會科學版),2010(6):120-122.

      [5]胡顯耀.基于語料庫的漢語翻譯語體特征多維分析[J].外語教學與研究,2010(6):451-458.

      [6]楊梅,白楠.國內(nèi)語料庫翻譯研究現(xiàn)狀調(diào)查——基于國內(nèi)學術(shù)期刊的數(shù)據(jù)分析(1993-2009)[J].中國翻譯,2010(6):46.

      [7]李晉,郎建國.語料庫語言學視野中的外國文學研究[J].2010(3):83.

      [8]Mahlberg,Michaela.Corpus Linguistics:Methodology,theory and patterns in literary texts[J/OL].[2011-02-20].http://ahds.ac.uk/print/litlangling/events/approaches/mahlberg.htm.

      [9]Louw,Bill.Literary Worlds as Collocations.Greg Watson and Sonia Zyngier.Literature and Stylistics for Language Learners:Theory and Practice[C].New York:Palgrave Macmillan:104.

      [10]Stubbs,Michael.Conrad in the computer:examples of quantitative stylistic methods[J].Language and Literature,2005(1):5-24.

      [11]何宇茵.基于美國當代英語語料庫的中國文化詞匯研究[J].山東外語教學,2010(1):7-11.

      [12]鐘蘭鳳,鐘家寶,陳紅.漢英詞典編纂中文化詞條的譯義問題——基于平行語料庫[J].江蘇大學學報(社會科學版),2010(5):60-64+69.

      [13]朱文慧,馬立東.英漢學習型詞典中近義詞辨析欄的優(yōu)化設(shè)置——基于語料庫的近義詞辨析及其應用[J].辭書研究,2010(6):78-87.

      [14]Rundell,Michael撰.夏立新,朱冬生譯.語料庫詞典學的最新發(fā)展和未來趨勢(上)——語料庫數(shù)據(jù)在學習詞典中的顯性應用[J].辭書研究,2009(3):74.

      [15]Charteris-Black,J.Corpus Approaches to Critical Metaphor Analysis[M].New York:Palgrave Macmillan,2004:89.

      [16]參見朱煒.語料庫語言學和語篇中隱喻的識別[J].外語電化教學,2010(6):49.

      [17]甄鳳超.語料庫語言學在中國的成長與發(fā)展[J].當代外語研究,2010(3):36.

      猜你喜歡
      近義詞連詞語料
      你會用連詞嗎?
      怎樣辨析近義詞
      連詞that引導的賓語從句
      找找近義詞
      基于語料調(diào)查的“連……都(也)……”出現(xiàn)的語義背景分析
      西夏語中的對比連詞 djij2
      西夏學(2016年1期)2016-02-12 02:24:02
      華語電影作為真實語料在翻譯教學中的應用
      不由分說
      不勞而獲
      《苗防備覽》中的湘西語料
      新巴尔虎右旗| 波密县| 河间市| 吉水县| 九龙县| 沾益县| 梅河口市| 日照市| 南溪县| 兴文县| 滨海县| 北流市| 华池县| 深泽县| 茂名市| 通化县| 柞水县| 托里县| 兰坪| 伊通| 巨野县| 富蕴县| 五大连池市| 济阳县| 景泰县| 北宁市| 马关县| 江永县| 铜陵市| 青冈县| 上高县| 姚安县| 临泉县| 铅山县| 荥经县| 浙江省| 西丰县| 福泉市| 漳平市| 平陆县| 海盐县|