趙永剛
(北京外國語大學中國外語與教育研究中心,北京)
語料庫語言學是基于對大量的電子文本檢索,以詞匯、短語為研究核心,以探索語言局部使用尤其是發(fā)掘語言潛在意義為研究目的,具有明顯的方法論傾向的應用語言學學科。話語分析是以句子以上的語言單位為研究對象,以揭示言語交際中的意義協商為研究目的,有著明顯社會學傾向的語言學學科。前者偏向定量分析,而后者偏向定性研究,但兩者的共同點在于都研究意義、研究語言的實際使用。正是由于這個共同點,兩者才可能優(yōu)化組合,更好地研究語言的使用。本書即是繼 Baker和McEnery (2013)之后又一本聚焦語料庫語言學與話語分析結合的論文集。
除第1章外,全書共收錄了13篇文章。編者在第1章介紹了語料庫語言學和話語分析的主要概念及兩個研究領域結合的優(yōu)勢和挑戰(zhàn)。接著,編者簡介了本書的章節(jié)安排。第一部分(2—5章)的研究涉及新型文本類型或模式,如電腦輔助交際文本。第二部分(6—10章)探討和社會實踐相關的話語。第三部分(11—14章)則通過話語分析揭示意識形態(tài)或態(tài)度立場。
在第2章中,Dawn Knight考察了劍橋和諾丁漢e-語言語料庫(CANELC)中情態(tài)動詞的使用。通過比較和對比,作者發(fā)現在twitter中情態(tài)動詞特別少用,而在e-mail和短信中則很常見;整體而言,CANELC中情態(tài)動詞的頻次高于BNC中口語和筆語子庫,這一點是出乎意料的。作者認為,情態(tài)動詞的使用與使用者對其交際對象的評估(群體大小、有無利害關系)有關:由于twitter的受眾群體大且不確定,其作者便會較少使用情態(tài)動詞;而e-mail和短信的受眾群體小且一般有利害關系(親友、生意伙伴等),因此其作者會更多地使用情態(tài)動詞以維護交際雙方的面子。而相對于口語,e-語言先天缺少當面交際時的手勢、副語言和語言外線索,于是更多地使用情態(tài)動詞以做補充。
在第3章中,Adolphs,Knight和Carter嘗試將“非語言”數據流納入口語語料庫分析。三位作者認為由于自然發(fā)生的交際是碎片式的,交際者在交談的過程中不斷調整自己的交際目標,所以話語分析應該考慮語境的這種動態(tài)特征。作者使用Fieldwork Tracker(手機APP)來記錄3對參觀英國藝術展的受試在不同時間、不同地點的話語,形成具有多模態(tài)的動態(tài)語境口語語料庫,以語料庫驅動的方法,通過對高頻詞的分析逐步將研究重心從指示語轉到評價語的使用,發(fā)現在展館中人們更多地將like作為評價語使用,在展館外則將更多地將其用作引言(quotative),而更多地使用love作評價語。作者們認為,這項研究提供了旨在研究超越常規(guī)概念的文本和語言的課題做出示范。
Bednarek在第4章討論了用語料庫方法分析另一種多模態(tài)文本——電影和電視時產生的問題。她不僅關心劇本,也關注視聽媒介所展現的敘述、肢體語言、視覺交際和舉止成為話語一部分的方式。在討論了建立或獲得這種語料庫的方法,特別是轉寫問題后,她分析了美國電視連續(xù)劇Nurse Jackie中的一個場景,展示了圖像和文本是如何結合起來創(chuàng)造意義的。鏡頭特寫經常用來解釋劇本中的元素,若非如此,這些元素就會讓劇本“讀者”不知所云。另外,眼動和眼神交流有助于人物性格刻畫,這表明僅僅分析口語中的詞語對這種多模態(tài)的媒介研究是不夠的。
Karin Aijmer在第5章中研究了口語中的話語標記語。作者指出話語標記語由于位置靈活、表達的功能較多(如組織話語、調節(jié)交際雙方關系、表達說話人態(tài)度情感等),給句法和語義分析帶來了挑戰(zhàn)。在案例中,她比較了ICE中英國英語、新西蘭英語、新加坡英語和香港英語口語中actually的使用,通過比較詞頻和分布發(fā)現,actually在前兩種變體中更多地出現在句子的中間位置(接近70%),而在后兩種變體中更多地出現在句子起始位置(超過50%)。進一步比較發(fā)現,盡管actually有核心意義,但在不同的變體和位置中有明顯差異:出現在句子右側時用來糾正前面的宣稱,而出現在左側時則用來引出視角的轉換;在香港英語和新加坡英語中,actually有主體意義,指示話語的理解和相關性,而在英國英語和新西蘭英語中則具有主體間性,指向更早的宣稱并對其進行糾正。作者對actually的分析展示了語料庫分析要在多大程度上做定性分析,超越索引行去考察較長的對話片段以確定意義。
Bevitori在第6章對1960—2013年10位美國總統演講中environment的意義演變做了歷時考察。作者通過檢索environment及其變體形式(environmental, environmentally)入手,得到其高頻搭配詞protect和clean,通過檢索protect*及其近義詞preserv*和conserv*得到高頻搭配詞energy,然后分別對energy和clean所在的索引行做了分析。結合社會和政治語境,作者展示了environment的意義是隨著政治優(yōu)先目標、歷史事件和當權者的世界觀的變化而不斷變化的,并發(fā)現環(huán)保、節(jié)能和潔凈三個概念隨著時間推移逐漸交織在一起。
在第7章中,Hunt和Harvey通過語料庫的常用技術,包括主題詞、搭配和索引行分析發(fā)現并描述了人們用以表達其對自身飲食疾病的擔憂和協商其厭食癥患者身份的語言的突出特征。作者收集了兩個在線論壇中的信息,建立了THF(Teenage Health Freak)語料庫和anorexia.net語料庫,發(fā)現在前者中主題詞am, I’m, anorexic和stone突出了疾病和健康異常情況,構建了醫(yī)療話語,而在后者中圍繞ED(eating disorder)的語法型式更少地用于將飲食性疾病構建成個人的所有物或特征,而是構建成和患者分離的、獨立的實體,即飲食性疾病被賦予語法上的主體地位。通過對比,作者發(fā)現了兩個論壇中關于飲食疾病話語的一系列差異,并討論了這類研究對于醫(yī)療從業(yè)者了解病人的話語、在診療時調整話語策略以達到更好的醫(yī)患溝通的積極意義。
在第8章中,Jack Hardy研究了不同年級和不同學科的學生學術寫作中語言使用的差異。作者采用多維度分析方法研究了Michigan Corpus of Upper-level Student Papers中四大學科門類中大四、研究生一、二、三年級學生的學術論文在四個維度的異同。研究發(fā)現,在第一個維度(參與性學術敘述vs.描述性信息型話語)中,不同專業(yè)有明顯差異:哲學和教育專業(yè)的學生傾向于使用更多的與參與性敘述有關的話語特征,而生物和物理專業(yè)的學生更多地使用名詞、形容詞和長詞等和描述性信息型話語有關的特征。在年級差異方面,大四的學生使用最多的參與性學術敘述,而研一學生使用最多的描述性信息型話語,研二、研三學生的論文中則又再次體現較多的參與性。在其他三個維度中也發(fā)現了類似的情況。這表明從本科生到研究生的轉變導致了寫作風格上的“突變”,然后逐漸回到“中間狀態(tài)”,這可能和研一學生對研究生寫作的“學術”期待并做了過量的補充努力有關。
在第9章中,Walker和McIntyre借助Semino和Short(2004)的話語呈現(Discourse Presentation)模型,以當代英語新聞為參照,研究了Corpus of Early Modern English News Writing(1500-1750)中的話語呈現模式(引語呈現、寫作呈現和思想呈現),發(fā)現在早期英語報道中,一個突出而有趣的特點是呈現被報道人物的思想和情感狀態(tài),而思想呈現往往或用作新聞總結和大眾觀點,或用作宣傳或用來增加新聞報道的戲劇性,并解釋這些特點可能與當時媒體自由沒有保障,發(fā)表不同政見會受到嚴懲有關,也可能與報道作者的意識形態(tài)立場有關。本文顯示通過小規(guī)模、大量標注的語料庫可以用來發(fā)現型式、做出假設,而后在更大規(guī)模的、未經標注的語料庫中驗證、探索是對不以形式為基礎(form-based)的范疇進行研究的有效方法。
在第10章中,Hocking嘗試將語料庫工具與社會學和話語分析方法結合來對職業(yè)或機構場景中的話語進行多視角研究(multi-perspectival study)。為了考察在一個高等藝術與設計項目中創(chuàng)造性實踐是如何發(fā)生的,作者收集了一系列不同類型的文本:學生簡報、教師簡報、教師討論、師生討論的錄音和對教師、學生的采訪的錄音,以及已發(fā)表的關于藝術家和設計師的藝術實踐和感悟的文本。作者通過對學生簡報的通讀確定ideas為研究核心,采用NVivo工具對參與者對ideas的特征表述進行分類,并對ideas的搭配型式進行索引行分析,發(fā)現關于ideas的表述包含兩個隱喻——導管模型和轉移/轉換過程,即學生簡報中的抽象概念通過導管(簡報或師生討論)進入學生的認知,并轉化成創(chuàng)造性的作品。在社會-歷史語境下,作者討論了不同時期的知名藝術家如梵高對ideas這個概念的認識,以解釋本研究語料庫中圍繞ideas的話語。
在第11章中,Partington首先討論了塑造之塑造的概念(representations of representations),指出媒體對實體的報道是塑造,而研究者對媒體文本的分析是對實體的另一重塑造。接著作者比較了英國兩家報紙與阿聯酋和埃及的英文報紙對Arab World的塑造。作者以Arab World為檢索詞,比較了其在2010和2013年報道中的型式,并對這些型式進行了及物性分析,發(fā)現2010年在四家報紙中,Arab World都被塑造成被動的接收者,對外界的刺激特別敏感,進而做出反應。形成對比的是,盡管在英國報紙中也有對western world的批評和負面塑造,western world更多的是被塑造成主動的施事。同時發(fā)現,在2013年四家報紙的報道中,Arab World的被動形象大大減少。Parting-ton指出批評話語分析要特別注意區(qū)分新聞報道中的負面塑造(negative reporting)和歧視塑造(prejudiced reporting),揭示負面現象是新聞的價值所在,而對比語料庫分析有助于這種區(qū)分。
在第12章,Baker和McEnery建成了有關系列紀錄片Benefits Street的twitter語料庫。通過對這個專用語料庫的前100個主題詞的分析和分類,而后對主題詞建立搭配網絡(collocational network),并通過索引行分析對搭配網絡進行語境解釋,作者發(fā)現了語料庫中三個主要的話語,即“懶散窮人”話語、“窮人是受害者”話語和“富人變得更富”話語,同時也發(fā)現了與之相關的話語群體。一些主題詞指向特定的話語,如fags通常被用來批評那些受到政府援助卻浪費錢去買香煙等非生活必需品的人;而其它主題詞如depression則有多種不同甚至相互競爭的意義。最后作者討論了互動媒體如twitter是如何對話語的發(fā)出和傳播造成影響的。
Hunt在第13章結合語料庫技術和批評話語分析,研究了《哈利波特》系列中(語料庫包括《魔法石》、《阿茲卡班的囚徒》和《死亡圣器》三個文本)對男女人物的身體部位的描寫。通過對hand, feet, fingers, legs和face等詞的索引行分析發(fā)現男性人物的身體部位被更多地提及,與這些部位相關的動作更加積極和靈活,對推動故事的發(fā)展起到重要的作用;而女性人物的身體部位則用來體現女性的被動,對外界的影響不大。通過這種綜合的方法解讀隱藏在兒童讀物中性別角色的塑造,對糾正將女性塑造成二等公民的做法有積極的推動作用。
在第14章中,Potts收集關于颶風Katrina的美國新聞文章建成語料庫,在話語-歷史觀框架內聚焦高頻謂語指示策略以分析其對人類參與者身份的構建。通過對people的搭配詞的分析,作者展示了圍繞種族和階級的話語相互交叉,造成雙重變異現象,即社會行動者的其他特質如poor和black混在一起,達到將這些行動者排除在圈外的效果,受到颶風影響的人們最終被報紙塑造成社會秩序和國民福利的威脅。Potts指出,在青睞一些身份特征的同時,另外一些特征(如情感和身體狀態(tài))被淡化,而團結和賦權的建構也被忽視,這反映了媒體偏離社會和諧的意識形態(tài)。
綜觀全文,本書有以下幾個特色和優(yōu)點:(1)覆蓋領域較廣,視野開闊,囊括了對不同語域和不同語類的研究。(2)研究方法多樣,結合了語料庫技術和多模態(tài)分析、多維度分析、多視角分析,尤其是第三章展示的利用多種技術將“非語言數據流”納入口語分析的方法,展現了語料庫語言學和話語分析在不同層次上的容和。(3)認識論層面較客觀,多數強調定量研究和定性研究的結合。語料庫語言學近幾十年蓬勃發(fā)展,得益于其對大數據的檢索和批量處理功能,但同時也受到不少詬病,最多的批評就是語料庫式研究和統計分析,而對實際內容關注不夠。本書的絕大多數文章都做到了定量和定性分析的結合,在很大程度上避免了上述缺陷。(4)共時和歷時研究兼有,關注專用語料庫,討論發(fā)人深省。本書收錄的論文既有共時研究,也有歷時研究。在大數據時代,語料庫的“大”已經不再是問題,但對特定領域或話題的討論,小型的專用語料庫則更為合適。話語分析的目的在于揭示和解釋社會現象,因此,如何做深刻的討論是研究者的難題,需要哲學和社會學層面的思考,這點在Partington對新聞負面報道價值的肯定和Potts對于新聞媒體缺乏向心、偏離和諧的意識形態(tài)的批評中可見一斑。
本論文集的優(yōu)點非常突出,但也存在一些疏漏與瑕疵。(1)本書的題目中用了術語discourse studies,而在第一章中編者并未說明discourse studies和discourse analysis的區(qū)別,而是直接用了discourse analysis(p. 3)。盡管很多學者將兩個術語互換使用,但作為全書的一個關鍵術語,編者不能想當然地認為所有人都將兩個術語等同,尤其是Tannen et al(2015)編寫的話語分析手冊The Handbook of Discourse Analysis仍然使用了術語discourse analysis。(2)個別報告不夠嚴謹、論證不夠清晰。如第5章即對英國英語、新西蘭英語與新加坡英語、香港英語中actually非常明顯的位置差異沒有做任何解釋,而僅僅說“很難就位置和話語標記語做出一般總結”;第6章對高頻搭配詞的搭配強度計算未做說明,并且對environment的另外幾個重要搭配詞如economy, health未做任何說明。
毋庸諱言,本書是由基于語料庫的話語分析權威學者編著的權威文集,在該領域具有相當的引領作用。本書所收錄的一些研究如第3章對動態(tài)語境的細致分析是開創(chuàng)性的,是語料驅動的,自然可以避免Widdowson(2004)關于傳統話語分析“摘櫻桃式的(cherry-picking)”的選取語料的方法,但正如Adolphs,Knight和Carter所意識到的,他們在錄音采集語料時,受事是有自我意識的,這種語料在多大程度上是“真實的”就值得考慮,因為這關乎語料庫的“真實性、樣本性和平衡性”原則。另外,基于口語語料庫的話語分析和多模態(tài)話語分析高度依賴技術,也需要大量的人力和資金,是個體研究者難以企及的,這也是制約國內相關研究的重要原因。因此,組建由話語分析學者與語料庫技術人員組成的研究團隊,開發(fā)口語語料庫和多模態(tài)語料庫并在其基礎上開展話語研究,或是國內研究可以借鑒的路徑。
可能受編者自身研究興趣的影響,本書收錄的研究有三分之一是批評話語分析,而批評話語分析是有價值取向的,需要就文本的隱性評價做出判斷,而這是超越索引行的即時共文(immediate co-text)的。盡管相關學者如Baker和McEnery(2013)和Partington et al(2013)坦言,對隱性評價的判斷有時需要擴展索引行甚至通讀全文,但在什么時候擴展,擴展到什么程度則取決于分析者的經驗。國內基于語料庫的批評話語分析盡管已經取得了一些成果,如唐麗萍(2016)采用該方法研究了美國大報對中國形象的構建,但如本書所示,在環(huán)境話語(第6章)、社會群體話語(第12、14章)和不同性別話語方面(第13章)的研究還需進一步拓展。
總體來看,正如Cadlin在前言中所說,本書提供了基于語料庫的話語分析領域的權威地圖(p.xi),具有前瞻性和引領作用,是一部拓展語料庫語言學應用和話語分析范式的佳作。