邵斌,何蓮珍
(1.浙江財經(jīng)大學外國語學院,浙江 杭州 310018;2.浙江大學外國語言文化與國際交流學院,浙江 杭州 310058)
美國北亞利桑那大學語料庫語言學家Douglas Biber是英語語體研究領域的著名學者,其倡導的多維度分析方法(Multi-Dimensional Analysis)在語體研究中獨樹一幟,影響很大。他和另兩位學者在1998年合著的《語料庫語言學》一書是語料庫研究領域的經(jīng)典著作。
2012年,Douglas Biber和Randi Reppen再度合作,編纂了《語料庫語言學》手冊,該書由Sage出版公司出版。整套書共四卷,多達1600余頁,收錄論文60篇,分為十五個部分,論文的時間跨度為1993年至2011年,內(nèi)容涉及語料庫語言學的多個方面,集中體現(xiàn)了西方語料庫語言學的最新發(fā)展。下面對其主要內(nèi)容和觀點做一扼要述介。
全書四卷,各有側重。卷一為“詞匯研究”,卷二為“語法研究”,卷三為“變體研究”,卷四為“方法及應用”。Biber&Reppen(2012)在引言中指出,過去20年來的語料庫語言學研究主要包含兩大方面內(nèi)容:一是描述語言特征,諸如詞的使用、詞匯型式、詞匯組合和語法結構等;二是描述某一語言變體的整體特征,如語域變體或方言變體。因此,本書的卷一和卷二可視作第一類研究,描述的是微觀的語言特征,卷三和卷四則可視作第二類研究,描述的是宏觀的語言變體。
卷一詞匯研究 本卷包括三部分,分別為“詞的使用”、“搭配和語義韻”以及“短語學”,收文16篇,側重詞匯的語料庫研究。
第一部分僅有1篇論文,Lindemann&Mauranen基于密歇根學術英語口語語料庫(MICASE)對美國大學學術口語中just一詞的用法、功能和語音進行了探討。文章發(fā)現(xiàn),just在學術口語中常用作“最低程度語”(m inim izer)①。索引行分析還表明just常用于元話語語境,而對整個口語事件的語境調(diào)查則表明,just做“最低程度語”使用時,常有語音弱化的現(xiàn)象,如出現(xiàn)“jus”、“jiss”和“jist”等變體。
第二部分收文7篇,分別聚焦論文引言中搭配的語篇功能、語料庫驅動的教學語法、語義偏好和語義韻、高級英語學習者的搭配使用、語義相關詞對在使用中的相互排斥性,以及語義韻的定量研究等。Hunston&Francis闡釋了作為詞匯語法統(tǒng)一體的“型式語法”(pattern grammar),Stubbs探討了定量方法在語義韻研究中的使用,分別為各自領域的經(jīng)典論文。更值得注意的是兩篇最近的論文。Morley&Partington的“A few frequently asked questions about semantic—or evaluative—prosody”一文,探討了語義韻的重要性、語義韻和評價意義的關系、語義韻的詞匯屬性和話語屬性之爭、語義韻和詞語內(nèi)涵意義的聯(lián)系、語義韻的歷時演變等重要問題,對語義韻領域長期具有爭議的話題進行了梳理,不乏洞見。Renouf&Banerjee的“Lexical repulsion between sense-related pairs”一文從8億詞的英國報紙語料庫中獲取數(shù)據(jù),以近義詞和反義詞等語義相關詞對為例探索了詞匯相斥現(xiàn)象(即不在同一語境中共現(xiàn)),將詞的橫聚合關系分為“強搭配”、“弱搭配”和“相排斥”三類,有別于以往多聚焦于詞匯共現(xiàn)的研究,可謂獨辟蹊徑。
第三部分收文8篇,分別聚焦美國大學課堂教學和教材中的詞串、同現(xiàn)詞列②的短語傾向、狄更斯小說中詞簇的語篇功能、作為通用語的英語(English as a lingua franca,簡稱ELF)中的詞塊、學術演講中的詞串和話語標記、學術書評中的短語、學術口語中的成語,以及學術程式語詞表等。Cheng等以p lay/role為個案探討了同現(xiàn)詞列的多種變體(如p lay a leading/vital role以及role to be played等),文章借助ConcGram軟件獲取所有p lay和role兩詞同現(xiàn)的數(shù)據(jù),以語料庫驅動的方法揭示了詞匯的短語趨向及其共選機制。Mahlberg通過對狄更斯小說中的主題詞簇及其語篇功能的分析,探討了狄更斯獨特的寫作風格,譬如在“身體部位”這一類型主題詞簇中,“his hands in his pockets”是五詞詞簇中使用最頻繁的,它主要起語境構建功能,敘事中用其增加故事的生動性,讀者能據(jù)此想見故事發(fā)生的情境。R?mer探討如何揭示某文本或文本類型的“短語樣態(tài)模式”(phraseological profile model),文章對庫容為350萬詞的語言學書評語料庫中的短語進行提取和分析,來探索語篇中的語義構建,其探索過程主要經(jīng)歷以下四大步驟:識別短語項;確定項內(nèi)變異;分析短語項的功能;分析短語項在文本內(nèi)的分布情況。
卷二語法研究 本卷包括四部分,分別為“語法特征和語法變異分析”、“語法變異的歷時研究”、“語法和語用”以及“‘詞匯語法’(lexico-grammatical)研究”,收文13篇,側重語法的語料庫研究。
第一部分收文5篇,分別聚焦立場結構中“名詞+that從句”型式的使用、以-ic和-ical為后綴的形容詞對比、論文摘要中的評價詞that、存現(xiàn)句there’s主謂一致性的多因素分析,以及英語口語中which引導的非限定性從句等。Charles對政治學論文語料庫和材料學論文語料庫進行對比,分析了不同學科中的“名詞+that從句”結構在表示立場功能上所體現(xiàn)的差異。比如政治學文本中的“idea/argument+that”結構呈現(xiàn)出相對較高的頻率,而材料學文本中呈現(xiàn)高頻性的則是“evidence+that”結構,這反映了前一學科常需通過對“觀點”和“論據(jù)”的分析來構建知識,而后一學科則多通過實驗方法得到“事實”,從而獲取知識。Riordan以MICASE語料庫為數(shù)據(jù)來源,對存現(xiàn)句there’s的主謂(不)一致現(xiàn)象進行了多因素分析研究,涉及語言、句子加工、話語和社會等四方面因素。
第二部分收文2篇,內(nèi)容涉及英語所有格功能演變及頻率變化以及英語動詞補語結構的型式演進。兩篇文章都以“布朗家族語料庫”(Brown fam ily corpora)為數(shù)據(jù)來源,該語料庫包含四大可比語料庫,即在20世紀60年代初和90年代初建成的代表美國英語的Brown和Frown語料庫以及相對應的代表英國英語的Lob和Flob語料庫,該系列語料庫可用于英語變體的對比研究及歷時研究。Hinrichs&Szm recsanyi對英語所有格結構,即’s和of結構的功能和頻率的變化進行了研究,論文對影響該結構的各種因素(如語義語用因素、音位因素、句子加工因素、語言經(jīng)濟性因素等)進行語料庫標注,再以二元邏輯回歸方法進行多因素分析。
第三部分收文4篇,內(nèi)容涉及18世紀謙卑話語中的禮貌性和情態(tài)意義、歷時言語行為分析、英語口語的語法,以及英語口語中的滯留現(xiàn)象(persistence)③。Leech介紹了一系列英語口語語料庫,并基于語料庫分析了口語語法和書面語語法的異同,著重探討了“會話語法”的特征,如交互性、對實時加工需求的適應性、相對簡單性和非完整句狀態(tài)(non-sentencehood)等。Szm recsanyi以BNC語料庫的口語分庫和弗萊堡英語方言語料庫(FRED)為數(shù)據(jù)來源,以比較結構、小品詞位置和將來時態(tài)標記詞為個案探討英語口語中的滯留現(xiàn)象,從而以語料庫方法驗證了心理語言學中的假設。
第四部分收文2篇,內(nèi)容涉及英語口語中表將來時的進行體動詞,以及“構式搭配”(collostruction)。Nesselhauf&R?mer從BNC語料庫的口語分庫中提取了100個表將來時的最高頻進行體動詞,對其共現(xiàn)的副詞、主語、be動詞的型式,以及其所處的句法環(huán)境進行考察,探索了英語口語中的詞匯語法型式。Stefanowitsch和Gries以構式語法為理論基礎,提出“構式搭配”的概念,即搭配(collocation)和構式(construction)的縮合形式,并從語料庫定量角度對其進行細致分析。該研究為語料庫語言學和認知語言學相結合的交叉研究,是頗具前景的研究領域。胡健、張佳易(2012)對其做了詳細介紹,茲不贅述。
卷三變體研究 本卷包括四部分,分別為“語域描述”、“語域變異”、“方言變異”以及“國別變體和世界英語”,收文15篇,側重英語變體的語料庫研究。
第一部分收文5篇,內(nèi)容涉及倫敦皇家學會主辦的《自然科學會報》的社會歷史語篇分析、外包呼叫中心語篇的語言變異、生物化學領域論文的修辭結構、歷時視角下的醫(yī)學病例報告寫作特征、某體裁中的語步結構(discourse move)④的語料庫分析等。Friginal從菲律賓的美國外包呼叫中心收集數(shù)據(jù)建立語料庫,以多特征多維度分析方法對不同語篇的語言變異模式進行了定量分析,從而對呼叫中心語篇這類語體做出充分描述。
第二部分收文3篇,內(nèi)容涉及美國大學生口筆語的多維度比較、西班牙語口筆語的多維度分析,以及基于語料庫的英語進行時態(tài)演變分析。Biber&Davies等以多維度分析方法對西班牙語口語和書面語的語域變異進行了細致描寫。他們設計并建設了西班牙語語料庫(包含11個口語語域和8個書面語語域),對其中85項語言特征進行標注,之后將這些語言特征歸為六大維度,最后從這些維度對口語和書面語的差異進行量化分析。
第三部分收文3篇,內(nèi)容涉及標準英語演進過程中英語用法所體現(xiàn)的性別差異、區(qū)域性語法(community grammar)的頻率和變異,以及基于語料庫的方言計量學(dialectometry)。Tagliamonte&D’Arcy以引語導入語be like為研究對象,對加拿大多倫多地區(qū)199名年齡分布為9歲至87歲的市民進行采訪,從中提取6300句引語,之后對不同年齡段的be like使用特征進行詳盡分析,該研究是典型的“基于語料庫的社會語言學研究”。Szm recsanyi以弗萊堡英語方言語料庫為基礎,對34種英語方言變體的57項語言特征進行標注,并提取它們的頻率數(shù)據(jù),將其轉換為頻率矩陣和距離矩陣,從而實現(xiàn)方言變異的地圖可視化。該過程是基于語料庫的變異研究和方言計量學定量分析的結合,也是語言變體研究中新的發(fā)展方向,比利時魯汶大學的“定量詞匯學與變異語言學”研究所也主要從事這方面的研究⑤(見Geeraerts,2010;Grieve,Speelman & Geeraerts,2011)。
第四部分收文4篇,內(nèi)容涉及英語變體中集體名詞和動詞主謂一致現(xiàn)象、新英語變體中的動詞補語樣態(tài)、東非英語中的文化話語,以及英語附加問句等。Hundt著眼于內(nèi)圈英語和外圈英語變體在集體名詞主謂一致型式上的差異比較,她以國際英語語料庫(ICE)的英國分庫和新西蘭分庫作為內(nèi)圈英語代表,以菲律賓分庫和新加坡分庫作為外圈英語代表,對該語言現(xiàn)象在上述四個分庫的差異做了量化分析。
卷四 方法及應用 本卷包括四部分,分別為“語料庫設計”、“分析方法”、“以應用為目的的語料庫調(diào)查”以及“教學應用”,收文15篇,側重語料庫的設計、方法以及在應用語言學領域的應用研究。
第一部分收文3篇,內(nèi)容涉及語料庫的代表性、歷史語用學中的數(shù)據(jù),以及早期現(xiàn)代英語口語文本的語言學研究等。Culpeper&Kyt?著眼于17世紀和口語相關的文本類型研究。他們以四種文本,即證人證詞、審判記錄、散文小說(prose fiction)和戲劇文本為研究對象,考察上述文本作為面對面口語文本的可行性,從共時和歷時的角度探討了以上文本的代表性問題。其考察點主要集中于口語文本的三個典型特征,即詞匯反復、話輪轉換(包含問答相鄰配對和話語打斷)、四類詞語的交互特征(包含第一人稱代詞、第二人稱代詞、指示代詞和表征只有說話者本人才能意識到的狀態(tài)或行為的個人動詞)。
第二部分收文4篇,內(nèi)容涉及《羅密歐與朱麗葉》里角色對話中的詞語、語料庫的離散度計算和修正頻率、可比語料庫,以及從主題詞到主題語義域等。Culpeper把主題詞的概念延伸至主題詞類和主題語義域。他以《羅密歐與朱麗葉》劇本中六個角色的對談作為研究對象,研究人物對話中的主題詞語、詞類和語義域,試圖揭示每個人物角色的獨特性。與之類似的是Rayson的文章,他以蘭卡斯特大學開發(fā)的Wmatrix軟件對英國兩黨某次選舉宣言的文本進行語義標注,對其主題詞、詞類和語義域進行了比較。該研究過程首先是建庫,然后進行自動標注和分析,再對數(shù)據(jù)進行提取,之后再設計研究問題和研究思路,這和大多數(shù)需事先確定研究問題的語料庫研究有所不同。他認為該模式可稱作是“數(shù)據(jù)驅動”(data-driven)范式,是“基于語料庫”和“語料庫驅動”研究范式的結合。
第三部分收文5篇,內(nèi)容涉及口語語篇中的詞匯覆蓋率、本族語和非本族語學生作文中的make一詞的語法和詞匯型式、頻率和語法教學的關系、學術詞表,以及本族語和非本族語學生作文中的連接詞使用等。Biber&Reppen探討了如何從語料庫中發(fā)現(xiàn)新的語言使用現(xiàn)象,并將其應用于語法教材設計。他們選取了6種通行的語法教科書作為研究對象,以基于語料庫編纂的《朗文英語口語和筆語語法》著作中的頻率數(shù)據(jù)作為對照,從名詞前修飾語、現(xiàn)在進行時和一般現(xiàn)在時的重要性對比,以及常用動詞作為三個個案,探討了語法教材的涵蓋面、語法項目的編排次序、語法特征例句中的詞匯常用程度等三方面的教材設計問題。該研究頗具實用意義,就筆者所知,基于語料庫的語法教材在我國尚不多見。
第四部分收文4篇,內(nèi)容涉及語料庫索引行在課堂上的應用、通過語料庫工具學習學術詞匯、學習者語料庫與學術用途英語(簡稱EAP)教學,以及語料庫在初始教師教育(Initial Teacher Education)中的運用等。Gilquin,Granger和Paquot探討了學習者語料庫在學術用途英語教學中的應用。以往EAP教學一般利用本族語語料庫,而此類語料庫甚少涉及學習者寫作時所面臨的特殊問題,換句話說,EAP教學中存在著學習者語料庫缺位的問題。論文以國際英語學習者語料庫(ICLE)為數(shù)據(jù)來源,以BNC的學術英語部分為參照語料庫,探討了《麥克米倫高階英語學習詞典》第二版的編纂。她們經(jīng)語料庫對比發(fā)現(xiàn)了學習者寫作中存在的頻率、語域、詞序、語義和短語等五大方面問題,該詞典將上述問題一一明示,從而達到提高英語學習者學術英語寫作能力的目的。
縱觀全書,《語料庫語言學》可謂是本領域自Teubert&Krishnamurthy(2007)編纂的《語料庫語言學:語言學關鍵概念》以及Lüdeling&Kyt?(2008,2009)所編纂的《語料庫語言學:國際手冊》之后的又一長篇巨制。其突出優(yōu)點表現(xiàn)如下:一是選文新。90%的文章皆為21世紀以來發(fā)表的最新論文,集中體現(xiàn)近20年來語料庫語言學研究的最新發(fā)展。二是覆蓋面廣,文章涉及語料庫研究的各個方面,這從其選文的期刊來源亦可看出。文章來源分布主要有以下三類:其一為語料庫語言學期刊,如International Journal of Corpus Linguistics(12篇)、Corpus Linguistics and Linguistic Theory(2篇)和Corpora(3篇);其二為應用語言學期刊,如Applied Linguistics(6篇)、English for Specific Purposes(7篇)和TESOL Quarterly(5篇);其三為英語語言學期刊,如Journal of English Linguistics(5篇)、English Language and Linguistics(3篇)和 World Englishes(2篇)。三是突出英語語體變異和英語變體研究,特別強調(diào)使用多維度分析方法進行語體變異分析,而這在國內(nèi)語料庫研究中尚不多見,較為突出的僅有桂詩春(2009)和潘璠(2012)。
本手冊對國內(nèi)語料庫語言學研究的啟示主要有二。一是本書聚焦語料庫的應用研究。語料庫是理論,是方法,還是學科?迄無定論。本書對此也不予置評,編者本著務實的態(tài)度,更關注語料庫如何在語言研究及語言教學中發(fā)揮作用,因此屬于“應用語料庫語言學”(applied corpus linguistics)。這種關注其應用的腳踏實地的做法值得學界學習。二是本手冊特別關注運用語料庫來研究語言變異。語言的差異來自于各個方面:共時的或是歷時的;年齡的、性別的、地域的或是社會階層的;語域的、文體的或是文本類型的,等等。國內(nèi)對語言差異的分析多基于定性研究,而利用語料庫則可對影響語言差異的諸多因子進行綜合分析,從而確定它們各自所起的作用,即上文所說的“多維度分析方法”。本書為語言變異研究提供了借鑒,指明了方法。
綜上所述,Biber和Reppen主編的《語料庫語言學》一書可謂是語料庫領域頗具特色的最新巨著,通讀全書,讀者對語料庫語言學的應用及其最新發(fā)展當會有更進一步的了解和認識。
注釋:
① Quirk等(1985:445-446)把“強化語”(intensifier)分為“增強語”(amplifier)和“減弱語”(downtoner)?!白畹统潭日Z”為“減弱語”中的小類,如hardly、barely等,此類副詞性表達方式可對句中另一成分的意義起極度減弱的作用。
②“同現(xiàn)詞列”為語料庫語言學術語“concgram”的漢譯,它指的是“任意方向連續(xù)或非連續(xù)強搭配”,比如increase和 expenditure之間可能出現(xiàn)“expenditure will increase”、“increase expenditure”、“increase government expenditure”等排列形式,expenditure/increase即可視作一組“同現(xiàn)詞列”。也有學者譯為“框合結構”。
③“滯留現(xiàn)象”是指在一個人的話語中常有相同結構聚集的現(xiàn)象,這說明話語中的連續(xù)可變位點可能產(chǎn)生相互影響。譬如,諸多心理語言學實驗表明,說話者傾向使用剛被使用過(或被激活)的語言型式,即所謂的“產(chǎn)出觸發(fā)”(production priming),具體有“句法觸發(fā)”、“語義觸發(fā)”、“詞匯觸發(fā)”、“形態(tài)觸發(fā)”、“形式觸發(fā)”和“詞序觸發(fā)”等。
④體裁分析(genre analysis)研究中提出“語步”概念(也譯作“話步”),認為語步是構成某體裁的基本部分。譬如,學術論文中一般包括四語步,即前言、研究方法、研究結果和討論等。
⑤事實上,Benedikt Szmrecsanyi已于2013年加入魯汶大學的“定量詞匯學與變異語言學”研究所,該所將進一步推動其“基于語料庫的語言變異多維度分析研究”。
[1]Biber,D.,S.Conrad & R.Reppen.Corpus Linguistics[M].Cambridge:Cambridge University Press.
[2]Biber,D.& R.Reppen(eds.).Corpus Linguistics[C].London:SAGE Publications,2012.
[3]Geeraerts,D.Ten Lectureson Cognitive Sociolinguistics[M].Beijing:Foreign Language Teaching and Research Press,2010.
[4]Grieve,J.,D.Speelman& D.Geeraerts.A statisticalmethod for the identification and aggregation of regional linguistic variation[J].Language Variation and Change,2011,(2):1 -29.
[5]Lüdeling,A.& M.Kyt?(eds.).Corpus Linguistics:An International Handbook(Vol.1).Berlin:Mouton de Gruyter,2008.
[6]Lüdeling,A.& M.Kyt?(eds.).Corpus Linguistics:An International Handbook(Vol.2).Berlin:Mouton de Gruyter,2009.
[7]Quirk,R.,S.Greenbaum,G.Leech& J.Svartvik.AComprehensive Grammar of the English Language[M].London:Longman,1985.
[8]Teubert,W.& R.Krishnamurthy.Corpus Linguistics:Critical Concepts in Linguistics[C].London:Routledge,2007.
[9]桂詩春.基于語料庫的英語語言學語體分析[M].北京:外語教學與研究出版社,2009.
[10]胡健,張佳易.認知語言學與語料庫語言學的結合:構式搭配分析法[J].外國語,2012,(4):61-69.
[11]潘璠.中國非英語專業(yè)本科生和研究生書面語體的多特征多維度調(diào)查[J].外語教學與研究,2012,(2):220-232.