• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      衛(wèi)乃興談語料庫語言學的本體與方法

      2014-03-11 09:04:00北京航空航天大學衛(wèi)乃興
      語料庫語言學 2014年2期
      關鍵詞:語言學語料庫語言

      北京航空航天大學 衛(wèi)乃興

      衛(wèi)乃興談語料庫語言學的本體與方法

      北京航空航天大學 衛(wèi)乃興

      編者按

      本刊從第2期開始,將推出“同題共議”欄目。每期由《語料庫語言學》提出選題,邀請兩位從事語料庫語言學相關研究的學者,就約定的議題進行筆談。兩人各自闡述,互不交流,以此保證觀點的獨立性。本欄目鼓勵和而不同的學術爭鳴。學術思潮諸流并進,方才是興盛氣象。

      本期“同題共議”立意語料庫語言學的本體與方法,由衛(wèi)乃興、許家金兩位語料庫研究者,就有關的5個議題分述各自觀點。本刊不作評點,亦不選擇立場,其中觀點全賴讀者審查。本刊歡迎讀者同仁就相同議題來稿研討。

      1.你怎么看語料庫研究對語言學的貢獻和意義?

      要回答這個問題,我們最好看看語料庫語言學對語言學產(chǎn)生了什么樣的影響。我個人的認知是:語料庫語言學對語言學產(chǎn)生了無法忽視的理論與方法影響。在理論層面,辛克萊式語料庫語言學(Sinclairian Corpus Linguistics以下簡稱“辛式語料庫語言學”1)對傳統(tǒng)語言學的影響與沖擊十分巨大。這個研究路線與范式取得了一系列重要發(fā)現(xiàn)。Sinclair提出的成語原則、擴展意義單位、語義韻、短語學等重要思想及其理論,否定了傳統(tǒng)語言學“句法至上”的思想以及諸多觀點,使人們認識到了語言使用過程中形式與意義、詞匯與語法、型式與功能等各種共選關系。具體而言,我們不再將詞匯與語法割裂分治,也不再將單詞視為自足的意義單位,而是首要地觀察它們的共選型式。這些思想催生和推進了世界范圍內(nèi)語料庫語言學的多方面發(fā)展,沖擊波影響到理論語言學和應用語言學,曾引起激烈的討論。應用語言學家Widdowson(2000)強烈地反對將語料庫研究成果應用于語言教學,生成語言學家Newmeyer(2003)尖銳否定語料庫數(shù)據(jù)對語言能力理論構建的作用。語料庫語言學造成的沖擊與反彈可見一斑!對這些貢獻,老一代的語言學家是能夠公正、客觀評價的。Johansson(2011:117)說,這些研究“對語言理解有著深遠的影響,為新的語言理論誕生打下了基礎”。Halliday (1992)認為,Sinclair的研究寫下了語言學史上最重要的一章。

      我個人的體會也十分強烈。早年在伯明翰大學聽Sinclair講授語料庫研究,研讀他的著述,如Sinclair(1966,1991)、Jones & Sinclair(1974),深深為其嶄新觀點所吸引。后來跟隨楊惠中先生進行實證研究,折服于這些思想與觀點的表述力。這些經(jīng)歷改變了我的語言觀和研究方法,也走上了語料庫語言學的不歸之路。

      就國內(nèi)語料庫研究而言,人們對辛式語料庫語言學所知較少,所受影響大多來自Geoffrey Leech的一類研究和計算語言學。但近年來人們開始了解Sinclair,逐漸認識到了辛式語料庫語言學的意義。這值得鼓勵,但認真閱讀他的一系列經(jīng)典著述,理解其思想和方法仍需時間。

      在方法層面,語料庫語言學對語言學的貢獻體現(xiàn)為語料庫建設技術與數(shù)據(jù)處理方法的發(fā)展。在語言學史上,研究者從未像今天這樣可以使用大數(shù)量的、真實的、經(jīng)過科學手段處理的高質量數(shù)據(jù),這是語料庫語言學的貢獻。這方面,以Geoffrey Leech為代表的學者做了重要的工作。他們建立了具有示范效應的語料庫建設技術,開發(fā)了英語詞類、句法、語義分析的多種計算技術,所建立的多種語料庫以及各種標注工具已成為語言研究,尤其是應用語言研究的重要資源。

      簡言之,無論在理論層面還是方法層面,語料庫語言學對語言學都產(chǎn)生了深遠影響,作出了重要貢獻。需要注意的是,近幾年語料庫語言學的兩個研究路線和兩個社團(指伯明翰團隊和蘭卡斯特團隊)間爭辯不休,2008年在“語料庫郵件列表”(Corpora List)討論組上發(fā)生了針對“新手語料庫研修訓練營”(Bootcamp Workshop)課程設置的一系列辯論,該辯論被整理后在《國際語料庫語言學雜志》(International Journal of Corpus Linguistics)2010年第3期進行了集中報道,McEnery & Hardie(2012)第6章也有專門論述,其中雙方使用了一些有失雅量的話語,也影響到中國語料庫學者。我認為,兩者代表了兩種不同類型的語料庫語言學,如Leech(2011:156)所言,伯明翰的語料庫語言學是研究驅動的(research-driven),而蘭卡斯特是資源驅動的(resource-driven)。從這個角度看,兩類語料庫語言學當然都是語言學需要的,或許不應發(fā)生那么偏激的爭執(zhí)。

      2.你如何描述語料庫研究的本體論與方法論及其關系?

      本體論涉及語料庫語言學的本質屬性、研究客體及目標,影響著方法論。現(xiàn)在,語料庫研究隊伍急劇增大,對該學科的本質屬性及其研究客體多有認知殊異。比如,有人將研究客體視為社會現(xiàn)象或做事方式,有人視之為心智行為,還有人視之為科學體系之符號等等。因此會有不同的方法論表述。然而,將語料庫語言學簡要且寬泛地概括為“對真實語言使用的研究”(the study of real life language use)應是整個社團的共識之一。由此,語料庫語言學的研究客體則具有極強的社會現(xiàn)象屬性。作為一種科學探索,其本體論的區(qū)別性屬性是研究真實語言使用,包括真實使用的詞匯、結構、意義和功能等廣泛內(nèi)容,其方法學涉及范圍極廣的過程性方法和微技術,其中語料庫資源、數(shù)據(jù)處理以及相關計算技術是必不可少的支撐性要素。

      目前,絕大多數(shù)研究者將語料庫語言學視為一種方法(見McEnery & Hardie 2012)。這并無大錯。語料庫語言學正在進入相當廣泛的語言學甚至其他社會學科領域,不同的領域及其客體需要不同的方法。況且,這些學科久已發(fā)展起了各自的經(jīng)典方法,語料庫的介入只是增加了一種新的方法。然而,這種觀點輕易地抹殺了語料庫語言學的理論分量。如上面所談,語料庫語言學的理論分量與貢獻不容忽視。像詞語共選、擴展意義單位、語義韻這些重要的發(fā)現(xiàn)及表述已在很大程度上成為語料庫語言學的缺省值,即使強烈批判辛式語料庫語言學或新弗斯語料庫語言學(neo-Firthian Corpus Linguistics)、否認語料庫語言學理論地位的“方法論者”,其研究也不乏這些重要概念、觀點與方法。如果我們認真閱讀一下McEnery與同行的研究(如Bakeret al.2013等),也不難發(fā)現(xiàn)其中明顯的弗斯和辛式特征。也就是說,嚴肅的語料庫語言學學者回避和擺脫不了業(yè)已確立的研究成就及其方法;犀利尖刻的批評背后可能是對批評對象的不解。試圖將語料庫語言學描述為理論中立的一套方法失之于極端表述,且弊多益少。

      毋庸諱言,辛式語料庫語言學是少數(shù)。但我認為,科學研究不是民主政治,不能搞少數(shù)服從多數(shù);目前,少數(shù)人對辛式語料庫語言學的堅守格外重要。

      進一步講,科學探索中的本體論和方法論是互為影響和制約的,理論與方法相互界定、相互滲透。我經(jīng)常給學生講,如果你做Chomsky的生成語言學,你要學會種樹(畫深層結構樹形圖),做Langacker和Talmy的認知語言學,你要學會蓋房子(畫語義表征圖),做辛式語料庫語言學,你要學會閱讀詞語索引。不同的本體理論要求不同的特征性方法。如果我們觀察國內(nèi)語言學博士點訓練學生的方法,會發(fā)現(xiàn)很多不同。之所以不同,主要因為語言本體觀不同。有些博士點共享一些訓練方法,則由于本體立場接近?,F(xiàn)在,語料庫語言學內(nèi)部因其本體觀的認識差異,所需的具體技術、程序與環(huán)節(jié)也不同,但基本的特征性方法應不至殊異太大。

      簡言之,我贊同Leech(1992:106)早年的表述,即語料庫語言學既是方法的,又是理論的,是語言研究的一種新路徑。

      3.相對于其他語言學領域,語料庫研究的方法論特色是什么?

      結合國內(nèi)語料庫語言學年輕學者的認知現(xiàn)狀,我想談三點。

      1)語料庫語言學數(shù)據(jù)的區(qū)別性特征。語料庫語言學數(shù)據(jù)以其驗證性、大數(shù)量性、自動化、計量性等特征有別于其他類型數(shù)據(jù)。我們使用的是自然發(fā)生的驗證數(shù)據(jù)(attested data),是研究效度的必要條件;我們不可能將直覺數(shù)據(jù)混雜其內(nèi)。語料庫語言學依據(jù)的是大數(shù)量數(shù)據(jù),研究報告和論文呈現(xiàn)的也是大數(shù)量數(shù)據(jù),與傳統(tǒng)思辨研究依賴的例舉(exemplification)以及微量數(shù)據(jù)形成鮮明對比。現(xiàn)在人們熱衷于談論大數(shù)據(jù),事實上語料庫語言學是最早開始大數(shù)據(jù)研究的。語料庫語言學數(shù)據(jù)由自動或半自動計算技術處理,準確度高。語料庫語言學數(shù)據(jù)可計量,揭示了概率信息。

      2)語料庫語言學的特征性分析技術。任何一個學科都有其核心的分析技術(analytical apparatus)。語料庫語言學在其數(shù)十年的歷程中發(fā)展起了自己的特征性分析技術,包括頻數(shù)統(tǒng)計、詞語索引分析、搭配分析、詞叢、主題詞等。中國學者對這些概念及其操作并不陌生,但我想強調(diào)的是它們作為分析技術的屬性。它們是概念,是數(shù)據(jù)種類,也是語料庫語言學賴以進行各種語言問題探索的分析技術。也就是說,我們使用這些概念及數(shù)據(jù),以它們?yōu)楣ぞ?,切入所關注的問題,進行抽象與概括。比如,我們可以使用上述分析概念和技術探討話語分析或篇章組織的問題、特定語域文本的句法特征、第二語言不同發(fā)展階段的結構、語義及語篇問題、外語教學中的技能發(fā)展,等等。

      3)自下而上與自上而下兼用的精密分析過程。我曾在過去兩篇文章中(衛(wèi)乃興2008,2009)強調(diào)自下而上方法的重要性,但主張兼之以自上而下的方法。實際上,語料庫語言學的研究過程顯示很強的自下而上與自上而下交替兼用的精密分析特征。經(jīng)典語料庫語言學研究中的歸納與推演,數(shù)據(jù)觀察與理論(特征)討論,往往是層層展開,步步深入,窮盡一切可能,逐漸逼近,到達結論。需要指出的是,國內(nèi)的不少語料庫語言學研究缺乏應有的精密分析過程,顯示不出應有的分析力量(analytical power)。一些研究將事實與評價混在一起,將語料庫數(shù)據(jù)與直覺數(shù)據(jù)雜合,宏觀概述多而語境分析少,數(shù)據(jù)與觀察與結論之間、不同理論之間跳躍大,缺失環(huán)節(jié)多,沒有語料庫語言學社團所熟悉和接受的范式特征。這可能與中國人歷史悠久的“天人合一”世界觀、偏好辯證與綜合、擅長宏論的習慣有關。無論如何,這不利于中國語料庫語言學走向世界。

      4.統(tǒng)計分析手段在語料庫研究中的地位與作用如何?

      統(tǒng)計手段的使用是語料庫語言學重要的方法特征。目前使用的諸多統(tǒng)計手段,T檢驗、Z檢驗、互信息、對數(shù)似然率檢驗、卡方檢驗、Dice系數(shù)、因子分析等,都是概率模型下的數(shù)據(jù)分析手段,提供了關于語言形式的概率信息,揭示出形式在交際中的效用程度,是研究者進行量化分析并繼而定性分析的必要信息。統(tǒng)計信息也使語料庫語言學較其他語言學更具方法學上的科學屬性。

      另外一方面,統(tǒng)計手段有待于改進和發(fā)展。Kilgarriff(2005)發(fā)表了題為Language is never, ever, ever random的論文,講了統(tǒng)計手段存在的問題:目前所有的統(tǒng)計手段都基于對“語言現(xiàn)象是隨機的”這一零假設的拒絕或接受;但語言交際從根本上講卻是目的驅動的而非隨機的。當語料庫很大時,我們總能拒絕零假設,但這不一定意味著語言事件互為關聯(lián)。再之,各種統(tǒng)計手段的原理及其適用對象和目的有別,但都不無缺憾。比如,MI偏向于低頻事件,高頻事件不一定獲得顯著高值。

      據(jù)我所知,Sinclair是最早使用統(tǒng)計分析的語料庫語言學家(見Sinclair 1966)。他在OSTI項目中首先使用了多種統(tǒng)計分析(如卡方檢驗、費舍爾精確檢驗,以及Poisson檢驗等,見Jones & Sinclair 1974)。但在后來的COBUILD語料庫和Bank of English語料庫研究中,Sinclair較少使用統(tǒng)計手段。這應當與大型語料庫條件下現(xiàn)有統(tǒng)計工具的缺陷有關。

      然而,因噎廢食不是可取之策。一方面,應在諸多可能性中選擇合適的統(tǒng)計手段處理數(shù)據(jù),以免誤導;另一方面應嘗試克服現(xiàn)有問題,改進統(tǒng)計手段。比如,Gries(2013)等一直在試圖改進統(tǒng)計手段;李晶潔等也嘗試設計了新的互信息(MI)計算方法(Wei & Li 2013)。

      需要指出的是,部分年輕學者的研究顯示了另一種傾向,即一味熱衷于統(tǒng)計信息的展示,而忽視語言學問題的討論。一些文章展示了大量各式各樣的統(tǒng)計信息圖表,卻鮮見具體語境下形式與意義的詳盡分析。這是一種“見林不見樹”或“見量不見質”的傾向:語言不見了,文本意義不見了,只留下干巴巴的數(shù)學信息!

      5.語料庫研究如何做到與相關學科的借鑒融通?

      這個問題至少可有兩種理解。其一,語料庫語言學如何進入其他學科,擴展跨學科研究?事實上,語料庫語言學一直在擴展其研究領地,從早期的語言描寫進入了廣泛的學科問題探索。這些進入與擴展大體上采用了下述幾個策略:1)選取那些與語料庫語言學不存在本體論尖銳對立的學科,易采用語料庫語言學的特征性方法;2)聚焦于特定的具體學術問題而不試圖對付整個學科的宏觀問題;曾經(jīng)響亮一時的“認知語料庫語言學”、“語料庫批評話語分析”、“語料庫語義學”等旗號最終只是曇花一現(xiàn);3)提供強有力的語料庫語言學描述與獨特的理論表述。這些擴展活動成果豐碩。如,下列分別是語料庫語言學在應用語言學、二語習得與外語教學、語用學、話語分析、批評語言學、翻譯研究、口語研究、對比語言學、文學等領域產(chǎn)生的經(jīng)典研究:Flowerdew(1997)、Altenberg(1998)、Gu(2001)、Aijmer(2002)、Tognini-Bonelli(2002)、Nesselhauf(2005)、Mahlberg(2007)、Simpson-Vlach & Ellis(2010)、Xiao & Dai(2014),這些也應是國內(nèi)研究者的必讀作品。

      第二種可能的理解為:語料庫方法如何與其他研究方法結合、融通?很多研究都是非常具體的問題導向型研究,需從不同的角度探索,而語料庫方法是可選者之一。比如,關于外語教學常用詞組表的研制,可用普通和專門語料庫的詞頻和搭配研究加上旨在檢驗詞匯單位心理凸顯性的心理語言實驗,再結合旨在調(diào)查教學價值的教師訪談研究(見Simpson-Vlach & Ellis 2010)。理論上說,語料庫應用于其他學科問題研究應有廣闊前景。

      然而,語料庫語言學參與其他學科問題探索時,仍有分析技術的兼容和中間過程環(huán)節(jié)的銜接問題。如,系統(tǒng)功能語言學的諸多系統(tǒng)與子系統(tǒng)(如評價系統(tǒng)、鑒賞系統(tǒng)、評判系統(tǒng)、情感系統(tǒng))與語料庫數(shù)據(jù)的兼容與排斥度如何?進行認知語言問題探索時,語料庫數(shù)據(jù)顯示的型式(patterns in the data)與心智型式(patterns in the mind)之間的連接環(huán)節(jié)是什么?生成語言學的深層結構樹形圖與語料庫語言學的高頻線性序列如何兼容?這些概念與技術問題值得認真思考和解決,而不是倉促打出眼花繚亂的旗號。

      相對而言,語料庫語言學易與本體立場相近的學科結合,如上面提到的應用語言學等;與本體立場尖銳對立的學科則有不少沖突,如各式各樣的心智語言研究、生成語言研究等。

      從另一個角度看,融合固然必要,分歧也不可少??茖W的突破與發(fā)展常常需要一些有益的歧見與新徑,有賴于獨特的思想與方法。

      注釋

      1.此處Sinclairian譯成“辛式”而不是“辛氏”,其主要考慮是:“辛氏”過于強調(diào)Sinclair個人的研究特色;“辛式”則指包含Sinclair本人在內(nèi)的相關團隊以及遵循的研究范式。后者更符合我們希望表達的意思。

      Aijmer, K.2002.English Discourse Particles: Evidence from a Corpus[M].Amsterdam: John Benjamins.

      Altenberg, B.1998.On the phraseology of spoken English: The evidence of recurrent wordcombinations [A].In A.Cowie (ed.).Phraseology: Theory, Analysis, and Applications[C].Oxford: Clarendon Press.101-122.

      Baker, P., C.Gabrielatos & T.McEnery.2013.Sketching Muslims: A corpus driven analysis of representations around the word ‘Muslim’ in the British press 1998-2009 [J].Applied Linguistics34(3): 255-278.

      Flowerdew, J.1997.The discourse of colonial withdrawal: A case study in the creation of mythicdiscourse [J].Discourse and Society8(4): 453-477.

      Gries, S.2013.50-something years of work on collocations: What is or should be next? [J].International Journal of Corpus Linguistics18(1): 137-165.

      Gu, Y.2001.The changing orders of discourse in a changing China [A].In H.Pan (ed.).Studies in Chinese Linguistics.Volume II[C].Hong Kong: Linguistic Society of Hong Kong.31-58.

      Halliday, M.1992.Language as system and language as instance: The corpus as a theoretical construct [A].In J.Svartvik (ed.).Directions in Corpus Linguistics: Proceedings of the Nobel Symposium 82 Stockholm, 4-8 August 1991[C].New York: Mouton de Gruyter.61-77.

      Johansson, S.2011.A multilingual outlook of corpora studies [A].In V.Viana, S.Zyngier & G.Barnbrook (eds.).Perspectives on Corpus Linguistics[C].Amsterdam: John Benjamins.115-130.

      Jones S.& J.Sinclair.1974.English lexical collocations: A study in computational linguistics [J].Cahiers de Lexicology24: 15-61.

      Kilgarriff, A.2005.Language is never ever ever random [J].Corpus Linguistics and Linguistic Theory1(2): 263-276.

      Leech, G.1992.Corpora and theories of linguistic performance [A].In J.Svartvik (ed.).Directions in Corpus Linguistics: Proceedings of the Nobel Symposium 82 Stockholm, 4-8 August 1991[C].Berlin: Mouton de Gruyter.104-122.

      Leech, G.2011.Principles and applications of Corpus Linguistics [A].In V.Viana, S.Zyngier & G.Barnbrook (eds.).Perspectives on Corpus Linguistics[C].Amsterdam: John Benjamins.155-170.

      Mahlberg, M.2007.Clusters, key clusters and local textual functions in Dickens [J].Corpora2(1): 1-31.

      McEnery, A.& A.Hardie.2012.Corpus Linguistics: Method, Theory and Practice[M].Cambridge: CUP.

      Nesselhauf, N.2005.Collocations in a Learner Corpus[M].Amsterdam: John Benjamins.

      Newmeyer, F.2003.Grammar is grammar and usage is usage [J].Language79(4): 682-707.

      Simpson-Vlach, R.& N.Ellis.2010.An academic formulas list: New methods in phraseology research [J].Applied linguistics31(4): 487-512.

      Sinclair, J.1966.Beginning the study of lexis [A].In C.Bazell, J.Catford, M.Halliday & R.Robins (eds.).In memory of J.R.Firth[C].London: Longmans.410- 430.

      Sinclair, J.1991.Corpus, Concordance, Collocation[M].Oxford: OUP.

      Tognini-Bonelli.E.2002.Functionally complete units of meaning across English and Italian [A].In B.Altenberg & S.Granger (eds.).Lexis in Contrast[C].Amsterdam: John Benjamins.74-95.

      Wei, N.& J.Li.2013.A new computing method for extracting contiguous phraseological sequences from academic text corpora [J].International Journal of Corpus Linguistics18(4): 506-535.

      Widdowson, H.2000.On the limitation of linguistics applied [J].Applied Linguistics21(1): 3-25.

      Xiao, R.& G.Dai.2014.Lexical and grammatical properties of translational Chinese: Translationuniversal hypotheses reevaluated from the Chinese perspective [J].Corpus Linguistics and Linguistic Theory10(1): 11-55.

      衛(wèi)乃興,2008,語料庫語言學的Firth學說基礎 [J],《外國語》(2):23-32。

      衛(wèi)乃興,2009,語料庫語言學的方法論及相關理念 [J],《外語研究》(5):36-42。

      通信地址:100191 北京市北京航空航天大學外國語學院

      猜你喜歡
      語言學語料庫語言
      語言是刀
      文苑(2020年4期)2020-05-30 12:35:30
      《語料庫翻譯文體學》評介
      讓語言描寫搖曳多姿
      把課文的優(yōu)美表達存進語料庫
      認知語言學與對外漢語教學
      累積動態(tài)分析下的同聲傳譯語言壓縮
      基于JAVAEE的維吾爾中介語語料庫開發(fā)與實現(xiàn)
      語言與翻譯(2015年4期)2015-07-18 11:07:45
      我有我語言
      語言學與修辭學:關聯(lián)與互動
      當代修辭學(2011年2期)2011-01-23 06:39:12
      語料庫語言學未來發(fā)展趨勢
      舒城县| 陆川县| 湟源县| 栾城县| 汕尾市| 册亨县| 仁寿县| 五大连池市| 鹤山市| 黄浦区| 沅江市| 中山市| 玉门市| 聊城市| 永清县| 芒康县| 荣成市| 临澧县| 凭祥市| 微山县| 阜宁县| 宜兰市| 太原市| 会同县| 黑龙江省| 汉中市| 德令哈市| 阳高县| 和田市| 桑日县| 古丈县| 泗水县| 家居| 绩溪县| 淮滨县| 绥江县| 呈贡县| 招远市| 济南市| 五台县| 蓬莱市|