邢紅兵,辛 鑫
(1.北京語言大學(xué)漢語水平考試中心,北京100083; 2.北京市海淀北部新區(qū)實驗學(xué)校,北京100194)
在第二語言習(xí)得研究中,針對第二語言學(xué)習(xí)者 (Non-native Speaker, 簡稱 “二語者”)的語言進(jìn)行分析和研究,主要經(jīng)歷了以下幾個階段: 對比分析 (CA,Contrastive Analysis)、偏誤分析 (EA,Error analysis)、 中介語理論(Interlanguage)、 中 介 語 對 比 分 析 (CIA,Contrastive Interlanguage Analysis)等。對比分析法產(chǎn)生于上個世紀(jì)50年代,興盛于60年代,理論基礎(chǔ)是Lado(1957)提出的對比分析假說(CAH, Contrastive Analysis Hypothesis), 核心思想就是在第二語言學(xué)習(xí)中,二語者學(xué)習(xí)的目的語 (TL,Target Language)和二語者的母語相同的因素將會相對簡單,而那些不同的因素會習(xí)得比較困難。對比分析最早運用于外語教學(xué)界,主要是將學(xué)習(xí)者母語和目的語進(jìn)行對比,從而找出共同點和差異,以預(yù)測和描寫學(xué)習(xí)者可能遇到的困難來確定教學(xué)難點和重點。從60年代末開始,出現(xiàn)了偏誤分析理論。該理論建立于上個世紀(jì)60年代,是由Corder(1967)最早提出來的。70年代以來,中介語理論的產(chǎn)生標(biāo)志著第二語言習(xí)得研究已經(jīng)發(fā)展為一個獨立的研究領(lǐng)域,人們的研究角度開始轉(zhuǎn)向?qū)W習(xí)者和學(xué)習(xí)者的 “語言”本身,即 “中介語”。隨著計算機科學(xué)的發(fā)展以及語料庫語言學(xué)的興起,人們越來越清楚地意識到通過比較學(xué)習(xí)者母語、目的語,甚至學(xué)習(xí)者的偏誤,并不能系統(tǒng)地了解學(xué)習(xí)者習(xí)得語言的全面特征及其動態(tài)過程,需要站在更高的角度來比較,即把學(xué)習(xí)者語言系統(tǒng) (中介語系統(tǒng))作為一個整體來和目的語語言系統(tǒng)進(jìn)行比較。在這樣的研究背景下,Granger(1996;1998a;2002)提出了中介語對比分析方法。這是對比分析理論和語料庫語言學(xué)在第二語言習(xí)得研究領(lǐng)域的結(jié)合,是利用語料庫資源對比中介語和目的語的對比研究方法。
中介語對比方法由于結(jié)合了對比分析、中介語理論和語料庫語言學(xué)等方面的特點,目前在第二語言習(xí)得方面已經(jīng)受到了學(xué)界的關(guān)注。文秋芳、王立非 (2004)認(rèn)為,中介語對比分析方法作為二語習(xí)得研究的新趨勢之一,將成為二語習(xí)得研究的新手段。但是,就目前漢語作為第二語言中介語對比研究的研究現(xiàn)狀來看,還存在一定的局限,這主要體現(xiàn)在對漢語中介語對比分析范圍的界定和對比內(nèi)容的確立等方面還不夠深入,沒有能夠?qū)⒒谡Z料庫的語言知識提取運用到對比分析之中。邢紅兵(2012)分析了目前第二語言習(xí)得研究中采用語料庫分析方法存在的不足,并提出了建立用于對比的詞匯知識庫建設(shè)的設(shè)想。
我們認(rèn)為,中介語對比方法非常適合第二語言詞匯知識習(xí)得過程的研究,因為這樣可以將中介語對比分析法和詞匯知識體系結(jié)合起來,系統(tǒng)研究中介語系統(tǒng)中詞匯知識的習(xí)得及其發(fā)展過程。本文將以漢語中介語系統(tǒng)為例,提出基于中介語對比分析方法的第二語言詞匯習(xí)得研究對比方法,并將重點探討基于語料庫的詞匯知識對比分析的原則和相關(guān)參數(shù)。
Granger(1998a,2002)認(rèn)為基于學(xué)習(xí)者語料庫的研究方法包括兩個方面:1)中介語對比方法 (CIA, Contrastive Interlanguage Analysis)。這種方法是對以二語者學(xué)習(xí)目的語為母語者(NS,Native Speaker)的語言材料和二語者的語言及其語言材料之間進(jìn)行定量和定性的研究;2)計算機輔助錯誤分析 (CEA, Computeraided Error Analysis),這種方法是利用計算機對中介語中的錯誤進(jìn)行標(biāo)注、檢索和分析。其中,中介語對比方法逐漸受到研究者的注意。根據(jù)Granger的設(shè)想,中介語對比分析涉及到兩個方向的比較:目的語與中介語 (IL,Interlanguage)的對比分析和中介語與中介語的對比分析。第一方面是目的語和中介語的對比分析,這是中介語對比分析所必不可少的,也是對比分析方法所特別強調(diào)的,是對比分析的核心。第二方面是對中介語系統(tǒng)本身的不同階段或者不同類型的中介語進(jìn)行對比。因為中介語的發(fā)展過程會受到各種因素的影響,這些因素包括學(xué)習(xí)者的年齡、第二語言的熟練水平、學(xué)習(xí)者的母語背景、學(xué)習(xí)任務(wù)類型、學(xué)習(xí)策略、學(xué)習(xí)動機等,同時還表現(xiàn)在語言的輸入和輸出的不同加工過程中。
在 Granger(1998a)看來,CIA的核心是基于學(xué)習(xí)者語料庫 (CLC,Computer Learner Corpus)的研究。因此,在CIA的研究中,語料庫建設(shè)及語料的選擇至關(guān)重要,其中包括二語者自己的母語語料庫。CIA方法不但重視中介語、目標(biāo)語的對比,同時也強調(diào)學(xué)習(xí)者母語和目的語語料庫的對比研究。因此在涉及遷移現(xiàn)象研究時,要將CIA和CA的方法結(jié)合起來,這樣才能得出完整又可靠的結(jié)論。從這兩個方面來看,中介語對比方法是對以前關(guān)于二語學(xué)習(xí)者研究理論的一個綜合吸收,將對比分析的思路引入中介語系統(tǒng),同時考慮到學(xué)習(xí)者母語和目的語、不同學(xué)習(xí)者中介語等因素,并且還將偏誤分析納入其中。
Granger(1996)針對前人的研究,以108個連接詞為研究對象,對國際學(xué)習(xí)者英語語料 庫 (ICLE, International Corpus of Learner English)中法語學(xué)習(xí)者語料進(jìn)行分析,結(jié)果發(fā)現(xiàn)連接詞存在過度使用 (如: “moreover”、“indeed”)和使用不足以及誤用 (如:“however”、 “therefore”)的情況 。 Granger(1998b)發(fā)現(xiàn)法國英語學(xué)習(xí)者獨有的增強程度詞 (booster)修飾形容詞的形式,英語母語者并不使用,而這些修飾詞在法語中卻經(jīng)常使用,這表明學(xué)習(xí)者是根據(jù)自己的母語來構(gòu)造目的語搭配的。Lorenz(1998)運用中介語對比分析法,系統(tǒng)分析了德國不同年齡段的英語學(xué)習(xí)者對于形容詞強化語的用法。作者選取了德國青年英語學(xué)習(xí)者語料庫 (BWF)、德國英語系大學(xué)生語料庫 (UNI)、英國青年人語料庫(GCE)、 英國大學(xué)生語料庫 (LOCNESS)4個語料庫,通過比較形容詞前強化語 (intensifier)的使用情況,作者發(fā)現(xiàn):1)英語二語者和英語母語者使用頻率最高的10個強化詞中,有7個是一致的 (如: “important”、 “good” 等);2)所有水平等級的德國學(xué)習(xí)者在英語強化語使用上都存在過度使用的現(xiàn)象 (如 “pretty”、“really”等);3)在同一語義范疇內(nèi),二語者所用的形容詞更多,并且區(qū)分更細(xì),使用了一些目的語母語者很少使用的形容詞。Altenberg&Granger(2001)通過對ICLE的研究發(fā)現(xiàn):法國和瑞典英語學(xué)習(xí)者對高頻動詞 “make”的使用情況和美國英語母語者有很大差別,這兩組學(xué)習(xí)者在使用虛義動詞 “make” (如 “make a decision”)的時候都出現(xiàn)明顯的使用不足的情況,在使役動詞 “make”的使用上,法國學(xué)習(xí)者明顯地在 “make+形容詞”和 “make+名詞”做補語方面使用不足,而瑞典學(xué)習(xí)者卻在 “make+形容詞”和 “make+動詞”做補語方面存在著明顯的過度使用的情況。針對這種情況,Altenberg(2002)結(jié)合瑞典語-英語雙語語料庫和學(xué)習(xí)者語料庫,通過對瑞典語-英語的原始文本、翻譯版的對比發(fā)現(xiàn):瑞典英語學(xué)習(xí)者過度使用使役動詞 “make+形容詞補語”是由于母語的遷移。
國內(nèi)學(xué)者對CIA理論的介紹和研究主要集中在外語教學(xué)界,成果也比較豐富,研究者將本族語語料庫和學(xué)習(xí)者語料庫中詞語的使用情況進(jìn)行了對比 (潘璠等,2003、2004)。楊彩梅等 (2002)運用CIA理論,使用英國國家語料庫 (BNC)、 中國學(xué)習(xí)者英語語料庫 (CLEC),對動詞 “adapt”、 “survive” 和 “cost” 在英語目標(biāo)語語料庫和中介語語料庫中的使用情況進(jìn)行了對比分析,并在此基礎(chǔ)上提出了一個本族語 (NL)、 目的語 (TL)和中介語 (IL)三語相交的第二語言習(xí)得模型。俞燕明 (2004)基于英國英語語料庫 (LOB)和中國學(xué)習(xí)者英語語料庫 (CLEC)進(jìn)行對比分析,構(gòu)建了中國英語學(xué)習(xí)者的CIA模型。齊建曉 (2006)發(fā)現(xiàn)中國英語學(xué)習(xí)者過多使用強化詞的傾向和德國學(xué)習(xí)者的使用特點不謀而合,這說明學(xué)習(xí)者在寫作過程中確實傾向于過多使用強化詞來吸引讀者的注意,結(jié)果反而使得他們的寫作顯得有點夸大其詞 (overstatement), 從而呈現(xiàn)出 “非母語風(fēng)格” (non-native style)。 齊建曉 (2006)還發(fā)現(xiàn):中國英語學(xué)習(xí)者過度使用增強程度詞“very”,這與漢語中常常使用語氣強烈的措辭,“很”字的出現(xiàn)頻率較高有關(guān),即通常所說的“母語遷移”。肖忠華等 (2010)提出了一個“對比語料庫語言學(xué)研究模式”,該模式以學(xué)習(xí)者的母語與目標(biāo)語之間的跨語言對比研究為基礎(chǔ),對中介語系統(tǒng)進(jìn)行分析。作者認(rèn)為中介語對比方法主要包括以下幾種情況:1)中介語與學(xué)習(xí)者母語比較,依此可以對母語遷移作出判斷;2)中介語與目的語比較,可以研究特定語言特征的使用不足或使用過度的幅度;3)不同母語背景學(xué)習(xí)者的中介語比較,依此可以發(fā)現(xiàn)二語習(xí)得過程中的共同特征,作者希望該研究模式能展示出對比語料庫語言學(xué)在二語習(xí)得研究中的預(yù)測功能與闡釋功能。
隨著國內(nèi)語料庫語言學(xué)的興起和各種語料庫的建立,在漢語作為第二語言的習(xí)得研究中,越來越多的學(xué)者開始注重通過語料庫來獲取相關(guān)語料并進(jìn)行語言習(xí)得研究。目前大部分的研究方法還是基于傳統(tǒng)的對比分析 (CA)、偏誤分析 (EA),即使涉及到中介語與目的語、學(xué)習(xí)者母語的比較也只是為了尋找偏誤原因,并沒有通過三者的對比解釋學(xué)習(xí)者習(xí)得過程中的特點和動態(tài)特征。在CIA的運用上,雖然不像英語教學(xué)界那樣提出相關(guān)理論模型,但是也在積極地運用語料庫對比的方法來研究學(xué)習(xí)者漢語的習(xí)得情況。下面我們分析通過對學(xué)習(xí)者語料庫和母語者語料庫的詞語使用情況進(jìn)行對比分析的方法來研究漢語作為第二語言的詞匯習(xí)得過程的研究成果。
南旭萌 (2008)對現(xiàn)代漢語語料庫和漢語中介語語料庫中常用動詞的句法功能進(jìn)行了對比分析,主要的結(jié)論包括:1)TL(目的語)/IL(中介語)對比?,F(xiàn)代漢語中動詞的各個句法功能類在中介語語料中都得到了體現(xiàn),但每一項句法功能的數(shù)量比重不能完全吻合;并且,中介語語料庫中動詞的主要句法功能出現(xiàn)了使用過度的傾向,次要的句法功能出現(xiàn)了使用不足的傾向。2)中介語內(nèi)部對比。動詞功能類數(shù)隨著水平的增加出現(xiàn)比較復(fù)雜的情況,句法功能類數(shù)的變化是曲折、復(fù)雜、多變的過程。李芬芬 (2008)對現(xiàn)代漢語語料庫和漢語中介語語料庫中的常用形容詞的句法功能進(jìn)行了對比分析,結(jié)果發(fā)現(xiàn):1)形容詞句法功能的相對頻度在兩個語料庫中存在差異,不一致的部分錯誤率高,是二語者學(xué)習(xí)的難點。不一致的情況包括,留學(xué)生對形容詞的謂語功能存在使用泛化或者類推,而對定語功能的使用則存在使用不足的問題。2)即使是句法功能相對頻度比較一致的情況,也存在問題,這類詞主要是受到語義關(guān)系的制約。作者認(rèn)為語料庫較好地反映了詞匯習(xí)得過程,對教學(xué)活動具有較大的實踐指導(dǎo)意義。蔡北國 (2010)對比了現(xiàn)代漢語語料庫和漢語中介語語料庫中動作動詞的使用情況,發(fā)現(xiàn)中介語中存在常用詞語過度使用,而非常用詞語使用不足或者不會用的現(xiàn)象。作者將詞匯對比研究的視角擴大到一組詞,而不是傳統(tǒng)意義的同義詞范圍,比如動詞“看”和 “檢查、見、見到、看到、看見、了解、欣賞、游覽、展示、觀、瞧、上、斜視”等詞語都可能混用,同時將研究的視角擴展到“替代錯誤”和 “被替代錯誤”兩個方面,并認(rèn)識到 “被替代錯誤”是一種非顯性錯誤。張金竹 (2009)考察了留學(xué)生對同語義類狀位形容詞與動詞語義搭配的習(xí)得情況。作者依據(jù)《同義詞詞林》,選取了 “高興類”形容詞作為研究對象,通過對現(xiàn)代漢語語料庫和漢語中介語語料庫中狀位形容詞的相關(guān)統(tǒng)計發(fā)現(xiàn):留學(xué)生同語義類狀位形容詞搭配的語義域很單調(diào),搭配詞主要集中在個別高頻動詞上,現(xiàn)代漢語中的高頻搭配詞語在中介語語料庫中并沒有出現(xiàn)。劉慧芳 (2011)對現(xiàn)代漢語語料庫和漢語中介語語料庫中形容詞的搭配類型、詞語以及頻度等因素進(jìn)行了詳細(xì)的分析,發(fā)現(xiàn)留學(xué)生使用形容詞的偏誤率不高,大部分時候能正確地使用形容詞搭配。和現(xiàn)代漢語搭配的匹配度也比較高,在留學(xué)生的形容詞搭配詞庫里,大部分搭配都屬于正確搭配。但是,留學(xué)生使用形容詞搭配的豐富度卻不夠高,使用形容詞搭配時形式比較單一,熟悉的搭配重復(fù)使用率偏高。
以上的研究均是基于漢語學(xué)習(xí)者語料庫和漢語母語者語料庫進(jìn)行的,主要從詞匯的句法功能、搭配等角度,對各項屬性的頻率進(jìn)行統(tǒng)計對比,從而得出漢語學(xué)習(xí)者詞匯習(xí)得的特點及相關(guān)結(jié)論。這些分析使我們更加認(rèn)識到對比研究的可深入程度,但是這些研究思路并沒有深入到詞匯知識體系和句法語義知識內(nèi)部,也沒有挖掘語料庫的各種知識特征。我們認(rèn)為應(yīng)該將中介語對比研究和語料庫研究結(jié)合起來,建立詞匯知識體系,并按照一定的原則進(jìn)行二語詞匯知識習(xí)得過程的研究。
詞匯知識是指學(xué)習(xí)者心理詞典中儲存的、表示詞匯及其關(guān)系的各類知識,包括詞的形態(tài)(詞形和讀音)、詞的意義、詞的用法、詞語之間的關(guān)系等等。在第二語言詞匯習(xí)得過程中,詞匯在實際語言中的運用知識的獲得是第二語言詞匯習(xí)得的關(guān)鍵內(nèi)容 (邢紅兵,2009)。我們認(rèn)為,一個詞語在實際語言使用過程中表現(xiàn)出的句法功能、語義關(guān)系框架、搭配的詞語及其使用頻度、同類詞語的語義特征的建立和搭配關(guān)系的區(qū)分等因素構(gòu)成了心理詞典中詞匯知識體系的核心,其中,搭配關(guān)系在第二語言詞匯習(xí)得過程尤為重要。下面我們以形容詞 “簡單”為例,考察 “漢語庫”和 “中介語庫”中形容詞 “簡單”的搭配詞語的情況。
我們考察 “簡單”的句法功能包括作謂語、作定語、作狀語、作補語等,按照句法功能將兩個語料庫中和 “簡單”按照不同功能搭配的詞語按照以下幾個方面進(jìn)行提取:
(1)“簡單”做謂語時搭配的主語詞語,例如 “事情”、 “頭腦” 等;
(2)“簡單”做謂語時搭配的狀語詞語,例如 “很”、 “非?!钡?;
(3)“簡單”做謂語時搭配的補語詞語,例如 “多”、 “一些” 等;
(4)“簡單”做定語時搭配的中心語詞語,例如 “問題”、 “辦法”等;
(5)“簡單”做狀語時搭配的中心語詞語,例如 “回答”、 “解釋”等;
(6)“簡單”做補語時搭配的中心語詞語, 例如 “想”、 “講” 等;
我們將作為目的語的現(xiàn)代漢語詞語的功能和詞語搭配作為參照,對比中介語語料庫對應(yīng)的搭配詞語,形成圖1(見下頁)的目的語和中介語詞語搭配知識及對比關(guān)系示意圖,其中實線的圓圈表示漢語母語搭配詞語,虛線的圓圈表示中介語搭配詞語。
圖1 :中介語和目的語詞匯知識對比示意圖
從該圖可以看出:兩個庫中 “簡單”的句法功能是一致的,但是所搭配的詞語根據(jù)是否重合形成了3種關(guān)系:交叉關(guān)系、包含關(guān)系和分離關(guān)系。交叉關(guān)系是兩種系統(tǒng)詞匯知識的主要關(guān)系類型,表明兩種語言系統(tǒng)中搭配知識體系存在共同搭配和各自特有搭配,共同搭配越多,表明中介語和目的語在搭配知識上更為接近,學(xué)習(xí)者掌握的詞匯知識更接近目的語。例如形容詞 “簡單”的狀語成分,中介語中使用的搭配和現(xiàn)代漢語的搭配共有搭配較多,表明在狀語成分的使用上更接近于目標(biāo)語漢語;而中介語的搭配詞語和現(xiàn)代漢語共性小,則表明二語學(xué)習(xí)者習(xí)得的搭配知識和目的語的搭配知識有一定的差距。例如,補語是留學(xué)生漢語習(xí)得的難點,從中介語系統(tǒng)來看, “簡單”的補語成分和 “簡單”作為補語時的中心語都和目的語的搭配詞語差別比較大,形成了包含關(guān)系和分離關(guān)系。這表明,對留學(xué)生來說,二語學(xué)習(xí)者 “簡單”的補語成分的習(xí)得存在一定的困難。因此,從中介語和目的語 (現(xiàn)代漢語)的搭配詞語及其頻度等是否重合以及重合度大小可以看出中介語系統(tǒng)中詞匯搭配知識和目的語存在的差異。
CIA為基于語料庫的二語習(xí)得對比研究提供了基本的研究框架,特別是確定了明確的比較范圍,這個范圍包括中介語和目的語、中介語和母語、中介語之間,甚至包括目的語和母語之間的對比分析。我們認(rèn)為基于中介語對比分析方法進(jìn)行研究可以從以下幾個維度進(jìn)行。
(1)中介語和目的語的對比。這部分的對比是目前第二語言習(xí)得研究最為關(guān)注的,因為目前采用的偏誤分析方法實際上就是將中介語系統(tǒng)中詞匯、句法等知識體系和目的語知識進(jìn)行對照來研究的。我們認(rèn)為第二語言詞匯習(xí)得的最終目的就是能夠?qū)⒛康恼Z的詞匯準(zhǔn)確運用在二語實際中,其中,二語者的目的語詞匯知識體系是逐漸接近目的語母語者語料庫中表現(xiàn)出來的詞匯特征。
(2)目的語和學(xué)習(xí)者母語的比較。二語學(xué)習(xí)者詞匯知識的獲得過程受到學(xué)習(xí)者母語及目的語的共同影響,早期的第二語言詞匯知識的構(gòu)建主要以其母語的詞匯知識為基礎(chǔ),第二語言詞匯知識的發(fā)展過程實際上是一個目標(biāo)語詞匯知識構(gòu)建的過程。在這樣的知識構(gòu)建過程中,學(xué)習(xí)者母語和目的語表達(dá)不一致的地方,實際上是二語詞匯學(xué)習(xí)的難點。我們以漢語和英語為例來分析,根據(jù)汪慧慧 (2010)的統(tǒng)計發(fā)現(xiàn),漢語動詞所帶的賓語和該動詞對應(yīng)的英語動詞所帶的賓語有三種類型:基本對應(yīng)、基本不對應(yīng)和部分對應(yīng)的情況,其中部分對應(yīng)是兩種語言中動詞搭配的主要對應(yīng)形式。從這個結(jié)果來看,第二語言詞匯習(xí)得在處理母語搭配知識和目的語搭配知識關(guān)系問題上出現(xiàn)了難度。因此,我們認(rèn)為,學(xué)習(xí)者目的語和目的語詞匯知識的對比研究是二語詞匯習(xí)得研究中詞匯知識發(fā)展過程、不同母語背景的留學(xué)生詞匯知識習(xí)得研究的基礎(chǔ)。
(3)中介語系統(tǒng)的比較。中介語系統(tǒng)是個不斷發(fā)展的系統(tǒng),具有動態(tài)性的特點,同時由于二語詞匯習(xí)得受到學(xué)習(xí)者母語的影響,這樣使得不同母語背景的中介語系統(tǒng)具備了不同的特點。因此,研究二語詞匯習(xí)得還應(yīng)該進(jìn)行中介語系統(tǒng)的比較。我們認(rèn)為中介語的比較研究可以分為兩個方面:不同母語的二語學(xué)習(xí)者中介語的比較和相同母語者中介語不同階段的對比分析。對比不同母語背景學(xué)習(xí)者的中介語系統(tǒng),就可以了解不同母語背景學(xué)習(xí)者在詞匯習(xí)得過程中的差異;而對相同背景中介語系統(tǒng)不同階段的研究,就可以觀察詞匯知識的發(fā)展過程。
(4)中介語和學(xué)習(xí)者母語的比較。在目前的偏誤分析研究中,研究者也注意到母語對第二語言學(xué)習(xí)的影響,但是,很少有研究能夠?qū)⒅薪檎Z和學(xué)習(xí)者的母語語料庫進(jìn)行對比,我們認(rèn)為,這部分的對比研究能夠觀察學(xué)習(xí)者在二語學(xué)習(xí)過程中母語的影響。這部分的研究實際上是要結(jié)合目的語和學(xué)習(xí)者母語比較來進(jìn)行的。
基于上面的詞匯知識對比分析框架,結(jié)合目前的研究現(xiàn)狀,我們將詞匯知識的語料庫對比分析研究中的關(guān)鍵因素概括為 “四率三度”,這些概念基本上體現(xiàn)了詞語的句法功能和搭配關(guān)系的對比研究的主要內(nèi)容。下面分別進(jìn)行舉例分析描述。
(1)頻率。從詞匯的使用層面來看,我們常用的概念就是詞語的使用次數(shù)和頻率,每個詞語作為一個詞性出現(xiàn)在語料庫中,在語料庫中出現(xiàn)的不同詞語總數(shù)就是詞數(shù) (type),每個詞在語料庫中出現(xiàn)的次數(shù)我們稱之為使用次數(shù)(token),比如說 “現(xiàn)代漢語研究語料庫” (以下簡稱為 “現(xiàn)漢庫”的總詞次為1227164次(tokens),按不同詞性分列,總詞數(shù)為50137條 (types); “漢語中介語語料庫”總詞次為432145次 (tokens),全部中介語語料中出現(xiàn)的分詞單位共有17576個,如果按不同詞性分列,總詞數(shù)18515條 (types)。我們將每個詞語的使用次數(shù),除以語料庫詞語的總詞次,就會得到一個詞的使用頻率,比如 “馬虎”這個詞,在 “現(xiàn)漢庫”中使用6次,頻率以100萬為基數(shù)是4.8893,在 “中介語庫”中使用 45次,頻率是104.1320,使用率遠(yuǎn)遠(yuǎn)高于 “現(xiàn)漢庫”。根據(jù)邢紅兵 (2009)的統(tǒng)計,中介語系統(tǒng)中,詞匯系統(tǒng)就使用頻率層面來看,存在詞語的豐富性不足,表現(xiàn)為一些漢語常用詞語在中介語系統(tǒng)中頻率低,或者沒有出現(xiàn),而有些詞語存在一定的泛化。
(2)錯誤率/正確率。錯誤率/正確率一般情況下是指在中介語語料庫中或者在某個水平階段、某個母語背景等特定范圍內(nèi)詞語使用中出現(xiàn)錯誤/正確的次數(shù)與使用總次數(shù)的比率。這是目前第二語言習(xí)得研究中使用最廣的指標(biāo)。對于詞語的句法功能和搭配關(guān)系來說,我們界定的正確率就是中介語使用的錯誤搭配數(shù)量和總搭配數(shù)的比值。比如在中介語語料庫中, “簡單”的狀語搭配次數(shù)是7次,其中有一個 “比”做狀語是錯誤的,因此錯誤次數(shù)是1次,所以形容詞 “簡單”的狀語搭配的錯誤率就是1除以7得到的比例,是14.29%,正確率就是 85.71%。
(3)分布率。我們前面界定的分布率是從一個詞語不同的功能分類角度和搭配詞語的類型等的分布情況的比率。比如形容詞 “簡單”具有的句法功能包括謂語、定語、狀語、補語等。而這些功能的具體分布情況,我們就需要進(jìn)行分析,分布率可以從搭配詞語數(shù)和頻率兩個方面衡量,見圖2(見下頁)。
從該圖的情況來看,中介語語料庫中形容詞 “簡單”的句法功能在類型上和漢語母語者語料庫的是一致的,但是在分布上并不能完全一致,表現(xiàn)為 “簡單”的狀語搭配的詞語出現(xiàn)不足,而作為狀語搭配的中心語出現(xiàn)了超出現(xiàn)代漢語的情況。圖2的對比可以看出, “簡單”各個功能搭配的詞語分布率除了狀語以外都比現(xiàn)代漢語略低,其中狀語詞語的分布和現(xiàn)代漢語差距較大。在各個成分的使用次數(shù)基本接近,只是 “簡單”作謂語時搭配的主語次數(shù)略高,作定語時,使用次數(shù)偏低。通過對比分布率,我們就基本了解了兩個語料庫中 “簡單”的各個功能搭配的詞語及其使用次數(shù)分布情況的差異。
圖2 : “簡單”按照功能形成的搭配詞語分布圖
(4)搭配率。是指詞語在中介語或者目的語中搭配詞語的次數(shù)和總次數(shù)的比例,比如“簡單”的狀語的個數(shù) (type)在目的語語料庫中是11個,使用次數(shù)總和 (token)是86次,其中每個詞語的使用次數(shù)不完全相同, “很”使用42次,比例是42比86,搭配率為48.84%, “越來越”使用 1次,比例為 1比86,搭配率為1.16%。在中介語語料庫中也是11個,使用次數(shù)總和是34次, “很”使用11次,比例是11比34,搭配率為32.35%, “越來越”使用1次,比例為1比34,搭配率為2.94%。 顯然, “很” 和 “簡單” 在中介語中的搭配率要低于目的語的搭配率。
(5)使用度。我們最常用的關(guān)于使用的概念就是使用次數(shù)和頻率的概念,使用次數(shù)是指一個詞語在特定語料庫中使用次數(shù)之和,頻率是使用次數(shù)和語料庫詞語的總使用次數(shù)之比。使用度是將不同的語料庫中詞語的使用頻率或者是搭配詞語的頻率進(jìn)行對比的結(jié)果。例如我們要計算詞語 “形式”的使用度,就是 “中介語庫” 頻率 41.6528, 除以 “現(xiàn)代漢語庫”頻率 220.8344, 得到使用度為18.86%, 而 “馬虎” 的使用度為 2129.79%。這個數(shù)據(jù)可以看出在一定數(shù)量的語料中詞語的使用是否均衡。
(6)豐富度。是指中介語和目的語搭配的詞語數(shù)量的比例,比如 “簡單”在目的語和中介語的搭配詞語數(shù)都是11,那么 “簡單”的狀語的豐富度就是11比11,比例是100%;“簡單”的狀語中心語在中介語中是6個,在目的語中是22個,比例是6比22,豐富度只有27.27%。豐富度可以較全面觀察詞語的使用情況,同時可以結(jié)合頻率、錯誤率的分析來彌補頻度和錯誤率分析的不足。
(7)匹配度。這里定義的匹配度是指一個詞語的某項功能在中介語和目的語中搭配詞語的數(shù)量的比例,比如說 “簡單”的狀語的個數(shù) (type)在目的語語料庫中是11個,在中介語中出現(xiàn)的搭配數(shù)量也是11個,其中共同的狀語有8個。我們認(rèn)為 “簡單”狀語的匹配度就是8除以11(目的語搭配數(shù))得到的比例是72.73%。匹配度用來衡量中介語詞語中的搭配項目和目的語之間的匹配程度,匹配度越高,搭配的范圍越接近,中介語與目的語更接近。
我們對這些概念的解釋是以中介語和目的語的對比為例來進(jìn)行的。這些概念同樣也可以應(yīng)用于中介語和母語、目的語和母語的對比研究之中,也可以運用于中介語語料庫不同階段的對比研究。
在第二語言習(xí)得研究領(lǐng)域,研究方法經(jīng)歷了對比分析、偏誤分析、中介語分析,到了目前逐漸受到重視的中介語對比方法,最主要的改變就是代表語言事實的語料庫系統(tǒng)在語言習(xí)得研究中的應(yīng)用?;谥薪檎Z對比分析方法的二語詞匯習(xí)得研究,重要的是要將基于語料庫的詞語使用知識提取出來,應(yīng)用到對比研究之中。我們認(rèn)為,二語學(xué)習(xí)者詞匯知識的習(xí)得過程實際上是詞語的功能分布、搭配及其形成的詞語關(guān)系、詞語的使用頻度、詞語語義特征等詞匯知識逐漸接近目的語對應(yīng)詞的詞匯知識的過程。這個過程是一個漫長的過程,需要經(jīng)過大量的語言事實的輸入才能逐步形成,這個過程也是二語學(xué)習(xí)者詞匯習(xí)得過程中最難的階段。在詞匯習(xí)得過程中,學(xué)習(xí)者母語的詞匯知識體系在目的語詞匯應(yīng)用上也會對其中介語產(chǎn)生影響,因此,我們構(gòu)建的模型也同樣適合于學(xué)習(xí)者母語體系和中介語體系的對比。我們也可以按照這樣的框架去進(jìn)行學(xué)習(xí)者母語詞匯知識體系和目的語詞匯知識體系的對比分析。中介語對比方法研究,從系統(tǒng)上講實際上就是學(xué)習(xí)者的母語、中介語、目的語三者之間的對應(yīng)關(guān)系分析研究,學(xué)習(xí)者詞匯知識的獲得實際上是詞語的使用逐漸接近目的語并擺脫母語的負(fù)遷移作用的過程。
盡管中介語對比方法已經(jīng)進(jìn)入了詞匯的使用層面,但是,我們也要看到,基于中介語語料庫的習(xí)得研究也有其局限性,主要表現(xiàn)在語料本身的特點上,比如中介語語料庫是學(xué)習(xí)者產(chǎn)出的詞匯集合,對詞匯理解的研究就存在一定的局限,語料的分布是否均衡,規(guī)模是否足夠和均衡等因素也會影響基于語料庫研究的結(jié)果。在利用語料庫進(jìn)行詞匯知識習(xí)得研究的同時,也要盡量采用多因素實驗設(shè)計的思路,將中介語和目的語、中介語和母語中的相關(guān)因素進(jìn)行對比,將相關(guān)統(tǒng)計方法應(yīng)用于對比分析之中,比如聚類分析的方法、相關(guān)分析、方差分析等方法,來檢驗中介語和目的語的差異性以及相互關(guān)系。
蔡北國 2010 中介語動作動詞混用的調(diào)查與分析[J].世界漢語教學(xué), (4):526-535.
李芬芬 2008 留學(xué)生甲級形容詞句法功能的統(tǒng)計分析[D].北京語言大學(xué)碩士學(xué)位論文.
劉慧芳 2011 基于語料庫的形容詞詞匯知識習(xí)得研究[D].北京語言大學(xué)碩士學(xué)位論文.
南旭萌 2008 留學(xué)生常用動詞句法功能的統(tǒng)計分析[D].北京語言大學(xué)碩士學(xué)位論文.
潘 璠,馮躍進(jìn) 2003 語義韻律的語料庫調(diào)查及應(yīng)用研究[J].當(dāng)代語言學(xué), 5(4):359-366.
潘 璠,馮躍進(jìn) 2004 非英語專業(yè)研究生寫作中連接詞用法的語料庫調(diào)查[J].現(xiàn)代外語, (2):157-218.
汪慧慧 2010 基于英漢動賓搭配對比的留學(xué)生詞匯習(xí)得研究[D].北京語言大學(xué)碩士學(xué)位論文.
文秋芳,王立非 2004 二語習(xí)得研究方法35年:回顧與思考[J].上海外國語大學(xué)學(xué)報, (4):18-25.
肖忠華,戴光榮 2010 語料庫在語言教學(xué)中的運用——中國英語學(xué)習(xí)者被動句式習(xí)得個案研究[J].浙江大學(xué)學(xué)報(人文社會科學(xué)版), (4):56-67.
邢紅兵 2009 中介語詞匯與現(xiàn)代漢語詞匯對比分析[J].對外漢語研究, (5):57-65.
邢紅兵 2012 第二語言詞匯習(xí)得的語料庫研究方法[J].漢語學(xué)習(xí), (2):77-85.
楊彩梅,寧春巖 2002 本族語、目標(biāo)語和中介語三語相交的二語習(xí)得理論模型[J].湖南大學(xué)學(xué)報(社會科學(xué)版),(4):71-75.
俞燕明 2004 中介語對比分析法及其對詞匯教學(xué)的啟示[J].國外外語教學(xué), (2):30-35.
張金竹.同語義類狀位形容詞和動詞的語義搭配及習(xí)得考察[D].北京語言大學(xué)碩士學(xué)位論文.
齊建曉 2006 中國英語學(xué)習(xí)者強化詞使用的語料庫調(diào)查[J].西安外國語學(xué)院學(xué)報, 14(4):48-51.
Altenberg, B 2002 Using bilingual corpus evidence in learner corpus research[A].In S.Granger, J.Hung,and S.Petch-Tyson (eds.), Computer learner corpora,second language acquisition and foreign language teaching[C].Amsterdam: John Benjamins, 37-54.
Altenberg,B.& Granger, S. 2001 The grammatical and lexical patterning of make in native and non-native student writing[J].Applied Linguistics, 173-194.
Borin, L.& Prütz, K. 2004 New wine in old skins? A corpus investigation of L1 syntactic transfer in learner language[A].In Aston, G., Bernardini, S.& Stewart, D (eds.), Corpora and language learners[C].Amsterdam: John Benjamins, 67-87.
Corder, S.P. 1967 The significance of learners'errors[J].International Review of Applied Linguistics (5):160-170.
———1996From CA to CIA and back:an integrated approach to computerized bilingual and learner corpora[A].In K.Aijmer, B.Altenberg& M.Johansson(eds), Languages in Contrast: Papers from a Symposium on Text-based Cross-linguistic Studies[C].Lund University Press, 37-51.
———1998aThe computer learner corpus:A versatile new source of data for SLA research [A]. Granger(eds), Learner English on computer [C].London:Longman, 3-18.
———1998bPrefabricated patterns in advanced EFL writing: Collocations and formulate[A].In A.P.Cowie(eds.), Phraseology: Theory, Analysis and Applications[C].Oxford: Clarendon Press:145-160.
———2002A bird’s-eye view of learner corpus re-search[A].In S.Granger, J.Hung & S.Petch-Tyson(eds.), Computer learner corpora, secondlanguage acquisition and foreign language teaching[C].Amsterdam: John Benjamins, 3-33.
Lado, R. 1957 Linguistics Across Cultures: Applied Linguistics for Language Teachers[M].Ann Arbor:U-niversity of Michigan Press.
Lorenz, G. 1998 Overstatement in advanced learners’writing:stylistic aspects of adjective intensification[A].In Granger, S.(eds.), Learner English on computer[C].Addison Wesley Longman Limited, 53-66.