陸蕓
(南京工業(yè)大學(xué),江蘇 南京 210009)
使用不同詞表檢驗(yàn)詞匯復(fù)雜度測(cè)量方法信度和效度之比較
陸蕓
(南京工業(yè)大學(xué),江蘇 南京 210009)
本文比較了使用N ation詞表后檢驗(yàn)詞匯復(fù)雜度三種測(cè)量方法信度效度的結(jié)果是否與以往使用大綱詞表檢驗(yàn)結(jié)果一致,從而比較N ation詞表和大綱詞表的差異,發(fā)現(xiàn)N ation詞表區(qū)分度更大,更適于研究二語(yǔ)學(xué)習(xí)者產(chǎn)出性文本。
詞匯復(fù)雜度;N ation詞表;大綱詞表
詞匯復(fù)雜度是詞匯豐富程度的一個(gè)重要指標(biāo),詞匯復(fù)雜度從某種程度上可以反映詞匯量的大小。測(cè)量詞匯復(fù)雜度以Nation(1995)的詞頻分布(LFP)和Meara(2001)的泊松擬合法影響最為廣泛,國(guó)內(nèi)外學(xué)者對(duì)詞匯的研究多會(huì)借助Nation等開(kāi)發(fā)的Range軟件和Meara等開(kāi)發(fā)的P_Lex(如Espinosa 2005,鮑貴2010);也有專(zhuān)門(mén)研究詞匯復(fù)雜度測(cè)量方法的如(Nation 1995,Meara 2001,鮑貴2011,陸蕓2012)。研究表明如何控制文本長(zhǎng)度對(duì)詞匯復(fù)雜度的影響是詞匯復(fù)雜度測(cè)量的一大難題,LFP用截取等長(zhǎng)度的方法來(lái)控制文本長(zhǎng)度的影響,但是這容易造成因低頻詞聚集于某一段文本而使測(cè)量結(jié)果發(fā)生偏差的情況,P_Lex因計(jì)算概率較好地控制文本長(zhǎng)度對(duì)詞匯復(fù)雜度的影響,但P_Lex沒(méi)有解決將段落內(nèi)重復(fù)低頻詞視為不同低頻詞類(lèi)的問(wèn)題。因此陸蕓等(2013)提出隨機(jī)取樣方法即隨機(jī)截取相同長(zhǎng)度文本n次,取平均值以減小誤差,并將傳統(tǒng)的類(lèi)符型符比方法,隨機(jī)取樣方法和改進(jìn)的P_Lex方法(解決了將段落內(nèi)重復(fù)低頻詞視為不同低頻詞類(lèi)的問(wèn)題)集成在一起,開(kāi)發(fā)了中國(guó)的詞匯復(fù)雜度測(cè)量軟件,使用根據(jù)大學(xué)英語(yǔ)大綱要求制定的詞表驗(yàn)證其信度和效度。驗(yàn)證發(fā)現(xiàn)隨機(jī)取樣方法和改進(jìn)的P_Lex方法更有信度和效度,尤其是隨機(jī)取樣方法可以針對(duì)較短的文本和比較不同長(zhǎng)度的文本,更適用于測(cè)量二語(yǔ)學(xué)習(xí)者的產(chǎn)出性文本。使用大綱詞表是考慮到使用的數(shù)據(jù)來(lái)源是中國(guó)二語(yǔ)學(xué)習(xí)者,中國(guó)詞表可能更符合中國(guó)學(xué)生的學(xué)習(xí)規(guī)律。然而Range和P_Lex使用的詞表都是Nation根據(jù)BNC語(yǔ)料庫(kù)開(kāi)發(fā)的詞表。利用不同的詞表是否具有相同的驗(yàn)證結(jié)果以及大綱詞表和Nation詞表有何差異成為本研究想要解決的問(wèn)題。
2.1 研究問(wèn)題
本研究將Nation的詞表按照自行開(kāi)發(fā)的軟件的要求進(jìn)行編輯,并將之導(dǎo)入軟件,計(jì)算使用Nation詞表后三種方法的詞匯復(fù)雜度值,并將其與以往使用大綱詞表所得出的對(duì)應(yīng)值進(jìn)行比較,主要解決以下問(wèn)題。
1)使用Nation詞表檢驗(yàn)信度,結(jié)果與使用大綱詞表是否具有一致性?
2)使用Nation詞表檢驗(yàn)效度,結(jié)果與使用大綱詞表是否具有一致性?
3)Nation詞表和大綱詞表有何差異?
2.2 數(shù)據(jù)收集和處理
為了便于比較兩種詞表的差異,本文所使用的數(shù)據(jù)與以往使用大綱詞表檢驗(yàn)詞匯復(fù)雜度測(cè)量方法信度和效度是同一批數(shù)據(jù)。檢驗(yàn)信度使用新概念英語(yǔ)第二冊(cè)和第三冊(cè)奇數(shù)編號(hào)的文本,共78篇。檢驗(yàn)效度使用的是《英語(yǔ)專(zhuān)業(yè)語(yǔ)料庫(kù)》(上海外語(yǔ)教育出版社,2008年版)2004年的英語(yǔ)專(zhuān)業(yè)八級(jí)作文,經(jīng)過(guò)處理,96篇作文被用于研究。這些作文按照其分?jǐn)?shù)分成高低作文水平組,經(jīng)非參數(shù)檢驗(yàn),兩組作文分?jǐn)?shù)存在顯著差異。
數(shù)據(jù)處理經(jīng)過(guò)去標(biāo)注、削尾(即將動(dòng)詞的屈折變化形式還原成動(dòng)詞原形)、文本清理和詞匯復(fù)雜度測(cè)量幾個(gè)階段。
研究中使用了去標(biāo)注軟件(DetaggingTool)、線削尾處理軟件(CST's Lemmatiser)、自行開(kāi)發(fā)的詞匯復(fù)雜度測(cè)量軟件(LexicalSophistication)和統(tǒng)計(jì)軟件SPSS13.0。
3.1 信度一致性問(wèn)題
信度一致性問(wèn)題是通過(guò)78篇新概念英語(yǔ)文本進(jìn)行折半信度分析來(lái)探討的。78篇新概念英語(yǔ)的文本被依次重新編號(hào),并根據(jù)新的編號(hào)分為奇數(shù)組和偶數(shù)組兩組。這兩組文本使用不同的詞匯復(fù)雜度測(cè)量方法測(cè)量,其平均值如下??梢园l(fā)現(xiàn)使用Nation詞表測(cè)量后,兩組詞匯復(fù)雜度平均值沒(méi)有太大差異,這和使用大綱詞表的情況接近。但是使用Nation詞表后,詞匯復(fù)雜度值比使用大綱詞表得到的對(duì)應(yīng)值都要相對(duì)更高。
表1 使用Nation詞表和大綱詞表兩組詞匯復(fù)雜度均值
使用Nation詞表后,Guttman折半系數(shù)分別為.781,.842和.655,分別大大高于使用大綱詞表的系數(shù).614,.699和.606。說(shuō)明使用Nation詞表后發(fā)現(xiàn)新概念英語(yǔ)兩組文本間信度很高,兩組文本來(lái)自同一個(gè)整體,也反映了三種測(cè)量方法是有信度的。從三種詞匯復(fù)雜度測(cè)量方法比較來(lái)看,使用隨機(jī)取樣方法時(shí)折半系數(shù)最高,說(shuō)明隨機(jī)取樣方法是較為可靠的方法。這些結(jié)果都和之前使用大綱詞表得出的結(jié)果一致。
從兩種詞表比較來(lái)看,使用Nation詞表后得出的值都要比使用大綱詞表得出的相應(yīng)值高。這是因?yàn)槲覀儗?duì)低頻詞的不同操作定義造成的。使用大綱詞表時(shí),我們將不在中學(xué)詞表中的詞定義為低頻詞,而使用Nation詞表時(shí),將不在最常用的2000詞詞表中的詞定義為低頻詞,測(cè)量軟件就會(huì)取出不同低頻詞個(gè)數(shù)。從結(jié)果看,大綱詞表中學(xué)詞表中的一部分詞已超出Nation的最常用和次常用詞的范圍。而既然使用Nation詞表后信度更高,顯然Nation詞表中的常用詞范圍較為合理。
3.2 效度一致性問(wèn)題
效度問(wèn)題是通過(guò)將語(yǔ)料庫(kù)中96篇專(zhuān)八作文的詞匯復(fù)雜度值與其對(duì)應(yīng)的作文分?jǐn)?shù)進(jìn)行相關(guān)分析來(lái)檢驗(yàn)的。使用Nation詞表后,使用三種詞匯復(fù)雜度測(cè)量方法發(fā)現(xiàn)詞匯復(fù)雜度和作文分?jǐn)?shù)呈現(xiàn)低相關(guān),詞匯復(fù)雜度值可以區(qū)分高低作文水平組。這和許多研究者的發(fā)現(xiàn)都比較一致(如Engber1995,鮑貴2011)。而使用隨機(jī)取樣法得出的相關(guān)系數(shù)最高,使用傳統(tǒng)方法相關(guān)系數(shù)最低,再一次證明了隨機(jī)取樣法的優(yōu)勢(shì)。這些都說(shuō)明了以往使用大綱詞表對(duì)三種方法信度效度檢驗(yàn)的結(jié)論是具有普遍性的。
值得注意的是,以往使用大綱詞表時(shí),各種方法的相關(guān)系數(shù)和t值比較接近,區(qū)分度不高,而使用Nation詞表后,相關(guān)系數(shù)和t值差異較明顯,區(qū)分度較高。這說(shuō)明將中學(xué)詞表以外的詞定義為低頻詞的標(biāo)準(zhǔn)對(duì)研究二語(yǔ)學(xué)習(xí)者產(chǎn)出性文本有些高了。
表2 使用不同詞表詞匯復(fù)雜度值與作文分?jǐn)?shù)呈低相關(guān)
表3 使用不同詞表高低作文水平組平均詞匯復(fù)雜度值差異顯著
3.3 Nation詞表和大綱詞表比較
Range的詞表是Nation根據(jù)BNC語(yǔ)料庫(kù)制定的,其中第一個(gè)基礎(chǔ)詞表包括最常用的約1,000個(gè)英語(yǔ)詞簇(wordfamily),第二個(gè)基礎(chǔ)詞表包括次常用的約1,000個(gè)英語(yǔ)詞簇。Nation(1997)認(rèn)為,雖然一種語(yǔ)言的詞匯是一個(gè)無(wú)限量,但并非所有的詞都同樣重要。衡量一個(gè)詞的重要性,目前主要依據(jù)詞在書(shū)面和口語(yǔ)文本中出現(xiàn)的頻率,即詞頻。大學(xué)英語(yǔ)教學(xué)大綱(修訂本)制定的詞匯表規(guī)定了各級(jí)詞表。鄧昭春(2004)認(rèn)為大綱詞表規(guī)定了要求各級(jí)領(lǐng)會(huì)式掌握的單詞數(shù)量和具體單詞,相反,對(duì)復(fù)用式詞匯只有數(shù)量上的要求。這無(wú)形中將大綱詞表定位在對(duì)接受性詞匯的掌握,降低了對(duì)共核詞匯的復(fù)用要求。因此她建議編寫(xiě)出對(duì)我國(guó)大學(xué)生最具有復(fù)用意義的分類(lèi)詞族表。從這些學(xué)者的觀點(diǎn)看,Nation的詞表從制表原則上來(lái)講要比大綱詞表更具科學(xué)性和實(shí)際意義。
從實(shí)證研究看,使用Nation詞表詞匯復(fù)雜度值更高,區(qū)分度更大,說(shuō)明Nation的分級(jí)詞表在研究中更具有可操作性,更能反映英語(yǔ)學(xué)習(xí)者詞匯產(chǎn)出的特點(diǎn),英語(yǔ)學(xué)習(xí)者總是最容易掌握那些最重要,最高頻的詞匯。而大綱詞匯規(guī)定的中學(xué)詞匯表領(lǐng)會(huì)式掌握單詞的數(shù)量超過(guò)了最常用2000詞的數(shù)量,實(shí)際上對(duì)二語(yǔ)學(xué)習(xí)者產(chǎn)出性詞匯量來(lái)講要求偏高。因此使用大綱詞表,將大綱詞表中學(xué)詞表以外的詞定義為低頻詞來(lái)研究低水平英語(yǔ)學(xué)習(xí)者詞匯掌握情況并不適合。也許借鑒國(guó)外詞簇詞頻研究成果,結(jié)合我國(guó)英語(yǔ)教學(xué)實(shí)際,編寫(xiě)出對(duì)我國(guó)大學(xué)生最具有復(fù)用意義的分類(lèi)詞族表對(duì)我國(guó)英語(yǔ)教學(xué)和詞匯研究將更有意義。
本文使用Nation詞表對(duì)詞匯復(fù)雜度測(cè)量方法信度和效度進(jìn)行檢驗(yàn),發(fā)現(xiàn)其結(jié)果與以往使用大綱詞表檢驗(yàn)具有一致性。而使用Nation詞表后,區(qū)分度更大。說(shuō)明Nation詞表和大綱詞表相比更適合研究二語(yǔ)學(xué)習(xí)者產(chǎn)出性文本。也許今后可以借鑒國(guó)外詞表制表原則,制定出更符合中國(guó)英語(yǔ)學(xué)習(xí)者學(xué)習(xí)特點(diǎn)的英語(yǔ)詞表,更好地為國(guó)內(nèi)英語(yǔ)教學(xué)和研究服務(wù)。
[1]Laufer,B.&Nation,P.Vocabulary size and use:lexi cal richness in L2 written production.[J].Applied Linguistics,1995,16:307-322.
[2]Meara,P.&Bell.H.P_Lex:A simple and effective way of describing the lexical characteristics of short L2texts.[J].Prospect,2001,16(3):323-337.
[3]Moreno Espinosa,S.,Fernandez Fontecha,A.and A gustin Llach,M.P.Can P_Lex accurately measure lex ical richness in the written production of young learners of EFL?[J]Porta Linguarum:Revista Internacional de Didactica de las Lenguas Extranjeras,2005,4:7-21.
[4]鮑貴.英語(yǔ)學(xué)習(xí)者語(yǔ)言復(fù)雜性變化對(duì)比研究[J].現(xiàn)代外語(yǔ),2010,(2):166-176.
[5]鮑貴.英語(yǔ)學(xué)習(xí)者詞匯復(fù)雜度的最新測(cè)量及驗(yàn)證[J],山東外語(yǔ)教學(xué),2011,(6):44-52.
[6]陸蕓.詞匯豐富性測(cè)量方法及計(jì)算機(jī)程序開(kāi)發(fā):回顧與展望[J].南京工業(yè)大學(xué)學(xué)報(bào),2012,(2):104-108.
[7]Engber,C.A.The relationship of lexical proficiency to the quality of L2 compositions[J].Journal of Second Language Writing,1995,4:139-155.
[8]鄧昭春.《大綱》詞表的局限性與分類(lèi)詞族表的教學(xué)意義[J].中國(guó)大學(xué)教學(xué),2004,(9):45-48.
[9]Nation,P.&R.Waring.1997.Vocabulary size,textcoverage and word lists[A].Vocabulary:Description, Acquisition and Pedagogy[C].Schmitt,N.&M.McCarthy (Eds.),NewYork:Cambridge University Press.http: //www.132.208.224.131/ResearchWeb.
責(zé)任編輯:周哲良
H 313
A
1672-2094(2013)06-0066-03
2013-10-18
陸蕓(1978-),女,江蘇太倉(cāng)人,南京工業(yè)大學(xué)講師,碩士。研究方向:應(yīng)用語(yǔ)言學(xué)。