• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      語料庫語言學研究的新進展
      ——《語料庫語言學研究中的三角驗證方法》評介

      2017-02-07 06:29:29
      英語知識 2017年3期
      關鍵詞:變體主題詞語言學

      張 懂

      (北京外國語大學,北京)

      語料庫語言學研究的新進展
      ——《語料庫語言學研究中的三角驗證方法》評介

      張 懂

      (北京外國語大學,北京)

      語料庫語言學研究方法眾多,且各有所長。綜合運用多種研究方法,對研究結果進行相互驗證,是語料庫語言學研究發(fā)展的新方向。Paul Baker和Jesse Egbert共同編著的《語料庫語言學研究中的三角驗證方法》就是采用多角度互證法的佳作,也是在語料庫語言學研究中采用多角度互證法的首次嘗試。本文旨在對該書作介紹和評價,指出其貢獻和不足。

      三角驗證方法;網(wǎng)絡問答語料庫;語料庫驅動法;搭配網(wǎng)絡分析法;主題詞分析法

      1.引言

      基于語料庫的語言學研究日益成為語言學研究的活躍領域。語料庫語言學研究方法眾多,且各有所長。采用多種研究方法互證,可以將因研究者的個人知識背景導致的研究缺陷最小化,使采用多種方法所得到的研究結果相互補充?!墩Z料庫語言學研究中的三角驗證方法》就是采用多角度互證法的典型佳作,也是在語料庫語言學研究中采用多角度互證法的首次嘗試。該書由語料庫研究著名學者Paul Baker和Jesse Egbert共同編著,Routledge出版社出版。該書基于同一個語料庫,綜合運用多種研究方法(包括基于語料庫的話語分析、多維度分析、主題詞分析等),解決相同的研究問題,旨在對比語料庫語言學研究中的不同方法。

      2. 內容概述

      該書共十二章,可分為五個部分。第一部分為第一章,介紹了該論文集的背景信息和結構;第二部分為第二章到第五章,采取了語料庫驅動的研究方法;第三部分為第六章到第九章,采取了基于語料庫的方法;第四部分為第十章到第十一章,采取了對小型抽樣語料的定性和定量研究;第五部分為最后一章,對比了各個研究所取得的發(fā)現(xiàn)和結論,并對相互矛盾的結論作出了可能的解釋。

      第一部分即第一章。Paul Baker和Jesse Egbert介紹了該論文集的目的和組織架構。該論文集包含十項研究,研究所用的語料是“網(wǎng)絡問答語料庫”。該語料庫庫容為40萬詞,收集自英國、美國、印度和菲律賓等四個國家的“雅虎”網(wǎng)絡論壇問答專區(qū),涵蓋社會與文化、家庭與社會關系、政治與政府等三個領域。這十項研究涉及的研究問題均為關于四個英語變體和三個領域間的語言使用差異。

      第二部分包括第二章到第五章。Tony McEnery采取了主題詞分析法,以研究四個英語變體的相似和差異。他分別將其中一個子語料庫與其他三個進行比較,并用對數(shù)似然率檢驗,從而得出每一個子語料庫的主題詞表。研究發(fā)現(xiàn),印度英語子語料庫中共有83個主題詞,菲律賓英語子語料庫中共有48個主題詞,英國英語子語料庫中共有46個主題詞,美國英語子語料庫中共有57個主題詞。通過對主題詞的語義歸類,作者發(fā)現(xiàn)印度英語子語料庫主要討論話題和宗教相關;美國英語子語料庫內容多和權力相關;菲律賓英語子語料庫的主要討論話題和宗教、權利都相關;且除了英國英語子語料庫,其余三個語料庫都和政治系統(tǒng)話題高度相關。通過對主題詞的詞類標注分析,作者發(fā)現(xiàn)英國和美國英語都較少使用強義務性情態(tài)動詞(如can, must, should等);而印度和菲律賓英語則較多使用強義務性情態(tài)動詞。

      Bethany Gray研究了語料庫中高頻出現(xiàn)的四詞短語、結構類型和語篇功能在四個不同語言變體和三個領域之間的差異。作者采取語料庫驅動法,鑒別出82個四詞短語,發(fā)現(xiàn)55%的短語具有表達立場的語篇功能。這表明“網(wǎng)絡問答語料庫”的語體接近口語語體,其目的在于給予建議和表達個人看法。通過統(tǒng)計四詞短語在四個不同語言變體中的使用頻率,作者發(fā)現(xiàn)菲律賓英語子語料庫中四詞短語的使用頻率高于其他三個英語子語料庫。通過統(tǒng)計四詞短語在三個不同領域中的使用頻率,作者發(fā)現(xiàn)四詞短語在家庭和社會關系領域中的使用頻率最高。因此,作者認為,菲律賓英語子語料庫及家庭和社會關系領域最能體現(xiàn)“網(wǎng)絡問答語料庫”口語語體特征,且該語料庫的本質是就人際關系給予建議和陳述個人觀點。

      Amanda Potts采用UCREL語義標注系統(tǒng)(USAS)和Wmatrix,對比不同的英語變體。通過分別將其中一個子語料庫和其余三個子語料庫對比,統(tǒng)計出主題詞和關鍵語義標注(key semantic tags)。關鍵語義標注能夠反映各個英語變體中關注的主要話題和討論內容。研究發(fā)現(xiàn),印度英語子語料庫的話題和心理、靈性、宗教等高度相關,這一發(fā)現(xiàn)和第二章Tony McEnery的發(fā)現(xiàn)相一致。菲律賓英語子語料庫的討論話題主要涉及政府、政策及教育方面。英國英語子語料庫的談論話題主要和地理名字、食物等相關,反映了人們對社會間差異及對飲食和健康的關注。美國英語子語料庫凸顯的談論話題為社會問題,譬如社會上無家可歸者人口的增加及其引發(fā)的相關社會問題和與種族相關的社會問題。

      Eric Friginal和Douglas Biber通過采用多維度分析法(Biber,1988,1995, 2003),比較和對比了四個英語變體和三個領域語言特征之間的相似和差異。多維度分析模型包括交互性與信息性表達(involved vs. informational production)、敘述性與非敘述性關切(narrative vs. non-narrative concerns)、指稱明晰性與情景依賴型指稱(explicit vs. situation-dependent reference)、顯性勸說型表述(overt expression of persuasion)等(Biber,1988;江進林 許家金,2015)。作者聚焦于交互性與信息性表達維度,發(fā)現(xiàn)“網(wǎng)絡問答語料庫”總體上具有交互性和非正式性特征。此發(fā)現(xiàn)與第三章中Bethany Gray的發(fā)現(xiàn)具有一致性。具體地說,英國英語子語料庫和美國英語子語料庫更傾向于使用第一人稱代詞,因而呈現(xiàn)出高交互性和非正式性特點。與此相反,菲律賓英語子語料庫和印度英語子語料庫更傾向于使用名詞性短語和介詞等成分,因而呈現(xiàn)出正式性和學術性特點。在話題方面,家庭和社會關系語篇更具非正式性和交互性特征,而政治和政府語篇更具信息性特征。

      第三部分包括第六章到第九章。Brezina采用搭配網(wǎng)絡分析法(Phillips,1983,1985),分析了四個不同語言變體中典型的搭配類型。作者將四個不同子語料庫中的問題和答案部分分別進行主題詞分析。通過統(tǒng)計和對比兩個主題詞詞表,概括出兩部分中最常使用的詞項。“問題”子語料庫中的最常用主題詞是wh-詞(如what, why, how, when, who),“答案”子語料庫中的最常用主題詞是god,love和president等實詞。通過觀察“問題”子語料庫中常用詞項的搭配網(wǎng)絡,作者發(fā)現(xiàn)wh-疑問句的功能主要為社會功能,而非一般的詢問信息功能。另一方面,作者通過觀察“回答”子語料庫中常用詞項的搭配網(wǎng)絡,發(fā)現(xiàn)其反映了不同國家人們的信仰、社會系統(tǒng)和政治體系的相似和差異。

      Stefan Gries采取多因素方法研究了語言使用中的詞匯—句法轉換現(xiàn)象(lexicosyntactic alternations)。與以往研究中采取的多因素方法不同的是,本文作者提出了影響語言選擇和使用的另外兩個因素——隨機效應(random effects)和自動相關(autocorrelation)因素。他以對將來時標記(will, shall, going to)的使用為例,解釋了影響語言詞匯—句法選擇的隨機效應和自動相關因素。隨機效應包括兩種,一種是說話者主體因素,即說話者個人在選擇將來時標記時有很大的差異;另一種是詞匯搭配因素,指的是語法構式對詞匯的選擇具有傾向性。自動相關因素也叫滯留或結構啟動,指的是前一個說話者所用的詞匯和句法結構對后一個說話者的語言選擇會產(chǎn)生影響。作者詳細論證了隨機效應和自動相關因素對將來時標記選擇和使用的重大影響,認為在詞匯—句法轉換的研究中不可忽視這兩個因素。

      Jonathan Culpeper和Claire Hardaker對“網(wǎng)絡問答語料庫”的語用特征作了分析。通過用Wmatrix 和USAS語義分析系統(tǒng)對語料庫進行語義標注,發(fā)現(xiàn)“責備言語行為”是語料庫表達的主要行為,特別是在印度英語子語料庫中的政治和政府領域中尤其如此。通過對語用噪音(pragmatic noise)的統(tǒng)計和分析,作者認為語用噪音的大量出現(xiàn)導致了語料庫具有明顯的口語體特征。作者還探討了語料庫中疑問句的詞匯—句法形式和功能的映射模式,發(fā)現(xiàn)語料庫中疑問句的突出語用功能是表達批判性評價,這一語用功能在除了菲律賓英語子語料庫之外的其他三個子語料庫中都有體現(xiàn)。

      Paul Baker采取定性方法,基于對擴展索引行的分析,鑒別四個不同子語料庫的性別語篇并比較其相似和差異。作者通過統(tǒng)計四個子語料庫中與性別相關的詞的出現(xiàn)頻率,發(fā)現(xiàn)除了美國英語子語料庫外,其他三個子語料庫都顯示出男性相關詞匯具有更高頻率。作者隨后以七個性別相關詞匯(men, women, girls, boys, guys, gentlemen, and ladies)作為檢索詞,分別在四個子語料庫檢索,對索引行進行分析后,概括出四組性別語篇,分別是:火星和金星、騎士精神、性別標準和女權主義。作者對四組語篇詳細分析后,發(fā)現(xiàn)“火星和金星”語篇是主導性別語篇。

      第四部分包括第十章到第十一章。Erez Levon先利用ProtAnt軟件,從“網(wǎng)絡問答語料庫”按話題從四個英語變體子語料庫中分別抽取一個最具代表性的文本,組成一個包含12個文本的小型語料庫,然后對這個小型語料庫定性分析,旨在研究問語和答語的結構一致性和答語用于表達立場和態(tài)度的可能性。研究發(fā)現(xiàn),不同國家的英語變體對同一領域的問題,傾向于采取不同的回答方式。譬如,社會和文化領域的問題以詢問信息性問題為主導,美國英語子語料庫和菲律賓英語子語料庫的答語傾向于提供信息,而印度英語子語料庫和英國英語子語料庫更傾向于表達立場;家庭和社會關系領域中的問題兼有詢問信息性和評價性,英國英語子語料庫中的回答傾向于明確表明自己立場,而菲律賓英語子語料庫和印度英語子語料庫中的回答傾向于僅提供信息,隱藏自己的立場,美國英語子語料庫中的回答則兼有提供信息和明確表達自己立場。作者最后給出了解釋,認為產(chǎn)生這一差異的原因在于不同的文化傾向于選擇不同的表達立場和態(tài)度的交際策略。

      Jesse Egbert從“網(wǎng)絡問答語料庫”中隨機抽取了60個問題和300個答案,采取定性和定量相結合的研究方法,研究了讀者對問題答案的感知差異。作者列出了讀者對問題答案的五個感知差異變量,分別是可讀性、偏見性、有效性、相關性和信息性等。本研究中有5個受事對這300個答案的五個感知變量分別作了測試。作者分別對五個感知變量進行了相關性分析,對最佳答案和其他答案在五個感知變量上的差異進行獨立樣本t檢驗,最后通過方差分析來測試美國讀者對不同英語變體子語料庫中答案的感知變量差異。結果顯示,五個感知變量具有高度相關性。讀者對答案的感知差異受不同英語變體子語料庫的影響很大,例如印度英語子語料庫的答案被讀者認為可讀性較差,菲律賓英語子語料庫的答案被讀者認為更具偏見,英國英語子語料庫的答案被讀者認為相關性更強。通過對不同答案間的對比,作者還發(fā)現(xiàn)讀者對答案的感知和語言標準化程度緊密相關。

      第五部分為第十二章。Jesse Egbert 和Paul Baker綜合并比較了前面所有的研究。詳細對比之后,作者發(fā)現(xiàn),不同研究中的大部分發(fā)現(xiàn)是兼容和互補的。當然,也存在一些互相矛盾的研究結論,作者給出了一些可能的解釋。其次,作者對前面研究中用到各種方法的優(yōu)點和缺點進行了剖析,認為語料庫驅動法由于不存在理論預設,經(jīng)??梢詭泶罅恳庀氩坏降陌l(fā)現(xiàn);基于語料庫的研究方法帶來的發(fā)現(xiàn)一般很有限;定性方法一般只對抽樣的小型語料庫進行研究,使得其研究發(fā)現(xiàn)很難反映語料庫的整體特征。最后,作者闡述了語料庫語言學中三角驗證方法的優(yōu)點和缺點,探討了對未來研究的啟示。

      3. 簡要評述

      3.1 特色與不足

      該書通過運用多種語料庫研究方法,對由英國、美國、印度和菲律賓等四個國家“雅虎”網(wǎng)絡論壇問答專區(qū)的語料組成的“網(wǎng)絡問答語料庫”進行研究,探討了不同語言變體之間的語言使用差異。該書至少有三點特色:

      第一,對語篇特征的描寫更加全面。每一種語料庫研究方法只能提供關于所研究語篇的部分特征。因此,要更加全面、系統(tǒng)地描寫和揭示要研究語篇的特征,必須綜合運用各種研究方法。該書每個研究都運用不同的研究方法,全面展示了“網(wǎng)絡問答語料庫”的整體語篇特征,避免語料庫研究得出的結論“只見樹木,不見森林”。

      第二,研究發(fā)現(xiàn)和結論更加可靠。三角驗證方法提供了一個驗證不同研究方法所得到的發(fā)現(xiàn)的新思路,能對研究結果進行交叉檢驗,從而使得研究發(fā)現(xiàn)更加可靠。該書通過綜合運用多種研究方法,比較和對比了不同研究方法所得出的研究結論,發(fā)現(xiàn)大部分結論具有互補性和兼容性,這從一定程度上增加了研究結論的有效性和可靠性。

      第三,使讀者對各種語料庫研究方法的認識更加深刻。該書詳細展示了多種語料庫研究方法,例如多維度分析法、搭配網(wǎng)絡分析法、多因素分析法等,使我們清楚地了解到語料庫語言學研究中不同研究方法的利弊,使我們認識到不同的語料庫類型和研究問題需要使用不同的研究方法和工具。

      當然,該書也存在一些不足。該書顯著的缺點之一是語料庫規(guī)模過小,且語料涵蓋范圍有限。該書用于分析的語料庫庫容僅40萬詞,收集自英國、美國、印度和菲律賓等四個國家的“雅虎”網(wǎng)絡論壇問答專區(qū),涵蓋社會與文化、家庭與社會關系、政治與政府等三個話題。由于語料庫庫容偏小,涵蓋領域范圍有限,很多語言模式和搭配出現(xiàn)的頻率太少,導致得出的結論具有偶然性,說服力不強。譬如第10章中作者基于對僅包含12個文本的抽樣語料庫進行研究,發(fā)現(xiàn)不同文化決定著不同國家的人回答問題時采取不同策略:英國和印度文化在表達個人立場和態(tài)度時,傾向于“求異”,而美國和菲律賓文化在表達個人立場和態(tài)度時,傾向于“求同”。本文認為,該研究所用語料的局限性,導致這一結論未免有以偏概全之嫌。

      3.2 啟示

      縱覽全書,至少可以帶給我們兩點啟示:

      第一,方法上可以用多種方法進行三角驗證。目前,語言學研究領域的新技術、新方法層出不窮。利用不同的研究方法對同一語言現(xiàn)象進行研究,可以深化我們對語言現(xiàn)象的認識,挖掘潛在的語言規(guī)律。

      第二,語料庫語言學研究應加強合作。沒有一種研究方法能解決所有研究問題,不同的研究方法往往具有互補性。語料庫語言學研究中使用三角驗證,可以帶來不同的研究發(fā)現(xiàn),從而使我們對語篇特征的認識和把握更加全面。不同的學者可以相互合作,運用自己最擅長的研究方法和工具,共同解決面臨的研究問題。語料庫語言學研究中只聚焦于一種研究方法,無疑會使得研究結論具有很大的片面性。因此,語料庫語言學研究中應加強學者之間深入、密切的合作和交流。

      總之,該書促進了多種語料庫語言學方法的綜合運用,展現(xiàn)了語料庫語言學中三角驗證方法的獨特魅力,對語料庫語言學研究作出了巨大的理論貢獻和方法論貢獻,必將一定程度上推動語料庫語言學的發(fā)展。

      [1] Biber, D. 1988. Variation Across Speech and Writing [M]. Cambridge: Cambridge University Press.

      [2] Biber, D. 1995. Dimensions of Register Variation: A Cross-Linguistic Perspective [M]. Cambridge: Cambridge University Press.

      [3] Biber, D. 2003. Variation among university spoken and written registers: A new multi-dimensional analysis [A]. In P. Leistyna & C. Meyer (eds.). Corpus Analysis: Language Structure and Language Use [C]. Amsterdam: Rodopi.

      [4] Phillips, K. 1983. Lexical Macrostructure in Science Text [D]. Birmingham: University of Birmingham.

      [5] Phillips, K. 1985. Aspects of Text Structure: An Investigation of the Lexical Organization of Text [M]. Amsterdam: North-Holland.

      [6] 江進林 許家金.2015.基于語料庫的商務英語語域特征多維分析[J].外語教學與研究,(2):225-236.

      The New Development of Corpus Linguistics:Review of Triangulating Methodological Approaches in Corpus Linguistic Research

      There are many methods in corpus linguistic studies and different methods have different advantages and disadvantages. It is a new direction in corpus linguistic studies to take triangulating methodological approaches in order to verify the research findings. Co-authored by Paul Baker and Jesse Egbert, Triangulating Methodological Approaches in Corpus Linguistic Research is a masterpiece and the first attempt adopting that approach in this field. The purpose of this paper is to introduce and evaluate the book, and point out both its contribution and deficiency.

      Triangulating Methodological Approaches; Q+A Corpus; corpus-driven method; collocation network; keyword analyses

      H0

      A

      2095-4891(2017)03-0093-04

      本文系中央高?;究蒲袠I(yè)務費專項資金資助“基于語料庫的英漢雙及物構式與動詞語義互動對比研究”(項目編號:2017JX012)的階段性研究成果。

      張懂,博士生;研究方向:認知語言學、語料庫語言學

      通訊地址:100089 北京市海淀區(qū)西三環(huán)北路2號 北京外國語大學中國外語與教育研究中心

      猜你喜歡
      變體主題詞語言學
      基于DDPG算法的變體飛行器自主變形決策
      非仿射參數(shù)依賴LPV模型的變體飛行器H∞控制
      認知語言學與對外漢語教學
      耀變體噴流高能電子譜的形成機制
      我校學報第32卷第5期(2014年10月)平均每篇有3.04個21世紀的Ei主題詞
      我校學報第32卷第6期(2014年12月)平均每篇有3.00個21世紀的Ei主題詞
      2014年第16卷第1~4期主題詞索引
      《疑難病雜志》2014年第13卷主題詞索引
      中國傳統(tǒng)文學的換形變體——論“詩化小說”的興起與傳承
      語言學與修辭學:關聯(lián)與互動
      當代修辭學(2011年2期)2011-01-23 06:39:12
      那曲县| 乐安县| 陕西省| 江孜县| 中山市| 赤壁市| 环江| 万荣县| 外汇| 鞍山市| 普兰店市| 鸡泽县| 阿拉善左旗| 碌曲县| 如东县| 屯留县| 前郭尔| 辽宁省| 边坝县| 汾西县| 留坝县| 京山县| 句容市| 神池县| 资源县| 陵水| 虹口区| 特克斯县| 行唐县| 叙永县| 崇仁县| 通化县| 绥滨县| 图木舒克市| 榆社县| 三原县| 宁乡县| 姚安县| 建瓯市| 奇台县| 蓝田县|