黃 敬,王佶旻
(1.2.北京語(yǔ)言大學(xué)漢語(yǔ)水平考試中心,北京,100083)
語(yǔ)言能力問(wèn)題是語(yǔ)言測(cè)試研究的基本問(wèn)題,因此對(duì)這個(gè)問(wèn)題的討論在語(yǔ)言測(cè)試?yán)碚撝酗@得尤為重要。根據(jù)接受性和產(chǎn)出性兩類模式,語(yǔ)言能力可分為語(yǔ)言理解能力和語(yǔ)言表達(dá)能力 (Brown,1996)。聽(tīng)力理解能力和閱讀理解能力都屬于語(yǔ)言理解能力。關(guān)于語(yǔ)言能力結(jié)構(gòu)的研究,國(guó)內(nèi)外學(xué)界都做了大量的研究。但是在國(guó)內(nèi)漢語(yǔ)作為第二語(yǔ)言測(cè)試界,有關(guān)語(yǔ)言理解能力的研究還有待補(bǔ)充。聽(tīng)力理解和閱讀理解都是復(fù)雜的和多維的過(guò)程,國(guó)內(nèi)外學(xué)者們都在試圖從不同角度描述其內(nèi)部包括的子能力。正如 Alderson&Lukmani(1989)指出,不同的研究者認(rèn)為存在不同數(shù)量和類型的子能力,但是有的研究者擁有實(shí)驗(yàn)數(shù)據(jù)的支持,有的卻沒(méi)有 (例如 Davis,1968;Munby,1978;Richards, 1983; Weir, 1993)。 同時(shí), 在子能力的數(shù)量和類型這一問(wèn)題上,學(xué)者們?nèi)匀粵](méi)有達(dá)成一致。在國(guó)內(nèi),有關(guān)語(yǔ)言理解能力結(jié)構(gòu)的研究,特別是漢語(yǔ)作為第二語(yǔ)言的語(yǔ)言理解能力的結(jié)構(gòu)研究尚不充分,本研究可作為這方面研究的補(bǔ)充。同時(shí),對(duì)語(yǔ)言理解能力結(jié)構(gòu)進(jìn)行深入研究,可以為漢語(yǔ)測(cè)驗(yàn)的編制提供思路,為分?jǐn)?shù)解釋和診斷性測(cè)驗(yàn)提供依據(jù),也可以為漢語(yǔ)教學(xué)起到指導(dǎo)和改善作用,為有針對(duì)性地進(jìn)行聽(tīng)力和閱讀技能的訓(xùn)練,改進(jìn)課堂教學(xué)效果提供科學(xué)的依據(jù)。
基于以上理論目的和實(shí)踐目的,本研究將使用結(jié)構(gòu)方程模型 (Structural Equation Model,SEM)的方法,探討漢語(yǔ)作為第二語(yǔ)言的高級(jí)水平學(xué)習(xí)者語(yǔ)言理解能力的結(jié)構(gòu)。本研究涉及語(yǔ)言理解能力及其內(nèi)部子能力這些潛變量的復(fù)雜關(guān)系,傳統(tǒng)的統(tǒng)計(jì)方法 (如回歸分析)不能妥善處理這些潛變量,而結(jié)構(gòu)方程模型能夠同時(shí)處理潛變量 (latent variable)及其外顯指標(biāo)(observable indicators)(侯杰泰、溫忠麟、成子娟,2004)。此外,結(jié)構(gòu)方程分析經(jīng)常用以比較不同模型,將同一組數(shù)據(jù)用不同的模型去擬合,看看哪一個(gè)模型擬合更好,從而推想被試的能力結(jié)構(gòu) (侯杰泰、溫忠麟、成子娟,2004),這也有利于本研究比較漢語(yǔ)作為第二語(yǔ)言的高級(jí)水平學(xué)習(xí)者語(yǔ)言理解能力結(jié)構(gòu)的多個(gè)可能模型,并最終得出最優(yōu)模型。在語(yǔ)言測(cè)試領(lǐng)域,一些研究也使用過(guò)相似的方法來(lái)研究第二語(yǔ)言能力結(jié)構(gòu) (如Bachman & Palmer, 1981, 1982;Buck,1991,1992; Sang, Schmitz, Vollmer, Baumert &Roeder, 1986; Sasaki, 1996; Shin, 2005),但很少有研究使用結(jié)構(gòu)方程模型的方法來(lái)研究漢語(yǔ)作為第二語(yǔ)言學(xué)習(xí)者語(yǔ)言理解能力的結(jié)構(gòu)。
基于以上論述,本研究主要解決以下問(wèn)題:
第一,漢語(yǔ)作為第二語(yǔ)言的高級(jí)水平學(xué)習(xí)者的聽(tīng)力理解能力和閱讀理解能力這兩種語(yǔ)言理解能力是否可分?如果可分,其結(jié)構(gòu)分別是什么?其內(nèi)部所包括的子能力的數(shù)量和類型分別是什么?
第二,漢語(yǔ)作為第二語(yǔ)言的高級(jí)水平學(xué)習(xí)者的語(yǔ)言理解能力是否可分?如果可分,語(yǔ)言理解能力的結(jié)構(gòu)是什么?其內(nèi)部所包括的子能力的數(shù)量和類型分別是什么?
基于以上提出的研究問(wèn)題,我們將從語(yǔ)言理解能力結(jié)構(gòu)研究和聽(tīng)力理解能力與閱讀理解能力的結(jié)構(gòu)關(guān)系研究?jī)煞矫鎭?lái)梳理前人的有關(guān)研究成果。
2.1 語(yǔ)言理解能力結(jié)構(gòu)研究
關(guān)于語(yǔ)言理解能力的結(jié)構(gòu),學(xué)界一直存在著爭(zhēng)議。歸結(jié)起來(lái)主要有兩個(gè)基本問(wèn)題:第一,語(yǔ)言理解能力的可分性;第二,如果可分,那么語(yǔ)言理解能力內(nèi)部的子能力的數(shù)量和種類分別是什么?對(duì)于第一個(gè)問(wèn)題的回答,研究者關(guān)于語(yǔ)言理解能力結(jié)構(gòu)主要持有兩派觀點(diǎn),即語(yǔ)言理解能力不可分論和語(yǔ)言理解能力可分論。
持不可分論的學(xué)者認(rèn)為,語(yǔ)言理解能力由一個(gè)單一的、整體的、綜合的特質(zhì)構(gòu)成,并不存在不同的可分性的子能力。Lunzer&Gardner(1979)根據(jù)研究指出,閱讀是一種單一的、整體性的技能,并沒(méi)有明晰的證據(jù)表明其內(nèi)部存在可分離的子能力。Alderson&Lukmani(1989)通過(guò)研究也對(duì)閱讀理解能力是否由不同的子能力構(gòu)成,以及這些子能力之間是否存在層級(jí)關(guān)系提出了質(zhì)疑。他認(rèn)為,即使是專家,有時(shí)候也很難判斷某一道閱讀題究竟考查的是哪一種閱讀能力。
持可分論觀點(diǎn)的學(xué)者認(rèn)為,語(yǔ)言理解能力是由多個(gè)各不相同的子能力構(gòu)成的。但是對(duì)于構(gòu)成語(yǔ)言理解能力的子能力的數(shù)量和種類,學(xué)界一直未能達(dá)成共識(shí)。目前存在兩派觀點(diǎn):
一種觀點(diǎn)認(rèn)為,語(yǔ)言理解能力由兩部分構(gòu)成。在聽(tīng)力理解能力結(jié)構(gòu)研究方面,一些研究者提出聽(tīng)力理解能力包括兩個(gè)部分 (Clark&Clark, 1977; Hughes, 1989; Oakeshott-Taylor,1977;Rivers,1966), 最為典型的是 Carroll(1972),他認(rèn)為聽(tīng)力理解能力由兩部分構(gòu)成:一是理解語(yǔ)言信息的能力;二是將語(yǔ)言信息和廣闊的交際語(yǔ)境聯(lián)系起來(lái)的能力。在閱讀理解能力結(jié)構(gòu)研究方面,目前的研究者越來(lái)越傾向于認(rèn)為,閱讀理解能力由解碼和理解兩部分構(gòu)成。解碼是識(shí)別詞匯,而理解則包括對(duì)句子進(jìn)行語(yǔ)法分析、理解句子在語(yǔ)篇中的意義、建構(gòu)語(yǔ)篇結(jié)構(gòu)以及將這些理解與已有知識(shí)整合等(Gough, Ehri& Treiman, 1992)。由于語(yǔ)言材料呈現(xiàn)的方式不一樣,在解碼階段,聽(tīng)力和閱讀存在明顯的差異,而在理解階段,兩者則是一致的。
另一種觀點(diǎn)認(rèn)為,語(yǔ)言理解能力內(nèi)部包含三種及以上的子能力。但是,對(duì)于語(yǔ)言理解能力內(nèi)部的子能力的數(shù)量和種類,研究者并未取得一致意見(jiàn)。在聽(tīng)力理解能力結(jié)構(gòu)研究方面,研究者們一直嘗試確定構(gòu)成聽(tīng)力理解能力的子能力。但是,對(duì)于構(gòu)成聽(tīng)力理解能力的子能力的數(shù)量和種類,學(xué)界一直未能達(dá)成共識(shí)。不同的研究者從不同的角度劃分了聽(tīng)力理解能力的子能力,少至3種,多達(dá)250種 (例如Kenneth, 1976; Munby, 1978; Richards, 1983;Valette, 1977; Weir, 1993; 杜建, 1992; 谷陵,2003;金天相、李泉,1994;李清華,1987;劉秀明、王蘋(píng),2008;楊惠元,1989,1991;朱正才、范開(kāi)泰,2001)。在閱讀理解能力結(jié)構(gòu)研究方面,從事閱讀研究的學(xué)者們同樣也都一直試圖確定構(gòu)成閱讀理解能力的子能力,并提出了許多不同的子能力列表。但是對(duì)于構(gòu)成閱讀理解能力的子能力的數(shù)量和種類,學(xué)界也未能達(dá)成共識(shí)。不同的研究者從不同的角度劃分了閱讀理解能力的子能力,少至3種,多達(dá)100 種(例如 Carroll,1993;Carver,1982, 1983,1984, 1990, 1992; Davis, 1944,1968; Grabe,1991; Gray, 1960;Harmer, 1983; Kintsch &Dijk,1978;Kintsch& Yarbrough,1982;Lennon,1962;Munby,1978)。綜觀此類研究,多角度考察了語(yǔ)言理解能力,對(duì)語(yǔ)言理解能力的研究呈現(xiàn)出多元化趨勢(shì)。既有從語(yǔ)音 (重音、語(yǔ)調(diào)等)、詞匯、語(yǔ)法 (句型、句式等)等語(yǔ)言要素的角度考察語(yǔ)言理解能力的結(jié)構(gòu),也有從交際目的、說(shuō)話者態(tài)度等語(yǔ)用學(xué)角度來(lái)分析語(yǔ)言理解能力的結(jié)構(gòu),還有從修辭、連貫等篇章要素的角度來(lái)研究語(yǔ)言理解能力的結(jié)構(gòu),等等。這樣的劃分雖然全面,但是帶來(lái)的一個(gè)嚴(yán)重的問(wèn)題就是劃分的維度和層次不清晰,有的研究對(duì)于子能力的劃分過(guò)于細(xì)致,導(dǎo)致下位能力與上位能力之間層次混亂;有的研究對(duì)于子能力的劃分過(guò)于籠統(tǒng),導(dǎo)致有的子能力過(guò)于復(fù)雜,實(shí)際上是一個(gè)綜合性能力。這樣既加大了子能力定義的難度,也影響了其理論與實(shí)證價(jià)值的實(shí)現(xiàn)。
在實(shí)證研究方面,大多數(shù)的研究使用了因素分析的方法 (Carroll, 1993; Davis, 1968;Lennon, 1962; Rost, 1993; Spearitt, 1972; 金琰如、王佶旻,2012)和多元回歸分析的方法(Davey, 1988; Drum, Calfee & Cook, 1981;Freedle & Kostin, 1996; Nissan, DeVincenzi&Tang,1996; Pollitt, Hutchinson, Entwistle &DeLuca, 1985)。隨著統(tǒng)計(jì)技術(shù)的發(fā)展,一些研究者開(kāi)始使用認(rèn)知診斷模型來(lái)研究語(yǔ)言理解能力 (Buck& Tatsuoka, 1998; Jang, 2009;李小蘭,2008;王靜,2008;徐式婧,2007;楊旭,2010),但此類研究都是側(cè)重解決有關(guān)測(cè)驗(yàn)分?jǐn)?shù)的診斷性報(bào)告的問(wèn)題,而非研究語(yǔ)言理解能力結(jié)構(gòu)本身的結(jié)構(gòu)特點(diǎn)。
2.2 聽(tīng)力理解能力和閱讀理解能力的結(jié)構(gòu)關(guān)系研究
有關(guān)聽(tīng)力理解能力和閱讀理解能力的結(jié)構(gòu)關(guān)系依舊沒(méi)有定論。Reves&Levine(1988)運(yùn)用相關(guān)分析和多元回歸分析進(jìn)行研究,結(jié)果發(fā)現(xiàn)兩種語(yǔ)言理解能力 (聽(tīng)力理解和閱讀理解)都包含一個(gè)單一因子和許多子能力。他們認(rèn)為閱讀理解能力內(nèi)部的子能力在某種程度上來(lái)說(shuō)和聽(tīng)力理解能力內(nèi)部的子能力是相似的。聽(tīng)力理解能力不同于閱讀理解能力,是因?yàn)槁?tīng)力理解與閱讀理解相比,是更為整體性的語(yǔ)言理解能力。口頭話語(yǔ)和書(shū)面話語(yǔ)之間的差異會(huì)導(dǎo)致處理模式的差異。Buck(1991)使用多質(zhì)多法(Multitrait-Multimethod, MTMM)模型進(jìn)行構(gòu)想效度的研究表明聽(tīng)力理解能力作為一種不同的特質(zhì)區(qū)別于閱讀理解能力。然而,Buck(1992)的研究指出支持聽(tīng)力理解能力作為一種不同的特質(zhì)這一觀點(diǎn)的證據(jù)是矛盾的。通過(guò)兩次研究所得出的不同結(jié)果,他進(jìn)一步推測(cè)研究中的 “強(qiáng)大特質(zhì)效應(yīng)”的存在并不能表明聽(tīng)力理解能力區(qū)別于閱讀理解能力。Bae&Bachman(1998)使用驗(yàn)證性因素分析進(jìn)行研究,認(rèn)為聽(tīng)力理解能力和閱讀理解能力存在重疊部分,但各自又有獨(dú)特的方面。Freedle&Kostin(1994,1999)對(duì)比了聽(tīng)力理解能力和閱讀理解能力,也得出了類似的結(jié)論。Buck(2001)在對(duì)以往理論研究和實(shí)證研究總結(jié)的基礎(chǔ)之上,認(rèn)為 “聽(tīng)力理解能力和閱讀理解能力的許多重要特征實(shí)際上是語(yǔ)言理解能力所有形式的特征。雖然兩者在某些方面存在獨(dú)特性,但它們擁有許多共同的特征?!盤(pán)ark(2004)則認(rèn)為聽(tīng)力理解能力和閱讀理解能力是不同的。第二語(yǔ)言聽(tīng)話者比較容易處理推理性信息,而第二語(yǔ)言閱讀者則較為容易處理事實(shí)性信息。語(yǔ)言知識(shí)和背景知識(shí)對(duì)于聽(tīng)力理解能力來(lái)說(shuō)都十分重要,而在閱讀理解能力中,背景知識(shí)沒(méi)有語(yǔ)言知識(shí)重要。
本研究的數(shù)據(jù)來(lái)自于2010年10月16日施測(cè)的HSK[高等]考試,共有來(lái)自52個(gè)國(guó)家和地區(qū)的2733名考生參加了此次考試。此考試適用于漢語(yǔ)作為第二語(yǔ)言的高級(jí)水平學(xué)習(xí)者,接受過(guò)3000學(xué)時(shí)和3000學(xué)時(shí)以上現(xiàn)代漢語(yǔ)正規(guī)教育的學(xué)習(xí)者 (包括具有同等學(xué)歷或同等水平的漢語(yǔ)學(xué)習(xí)者)可達(dá)到這一級(jí)標(biāo)準(zhǔn)。
本研究使用的試卷是HSK[高等]的筆試試卷。筆試試卷分為三個(gè)部分:聽(tīng)力理解、閱讀理解和綜合表達(dá),共120題。本研究由于需要同時(shí)考查聽(tīng)力理解能力和閱讀理解能力的結(jié)構(gòu),故只選取聽(tīng)力理解和閱讀理解兩個(gè)分測(cè)驗(yàn)。其中聽(tīng)力理解分測(cè)驗(yàn)主要考查應(yīng)試者聽(tīng)懂并理解漢語(yǔ)口語(yǔ)的能力,有2個(gè)小部分,共40題,約30分鐘;閱讀理解分測(cè)驗(yàn)主要考查應(yīng)試者看懂并理解漢語(yǔ)書(shū)面材料的能力,有2個(gè)小部分,共40題,約40分鐘。
3.3.1 對(duì)試題進(jìn)行分類
基于前人的研究和HSK[高等]測(cè)驗(yàn)試題的內(nèi)容以及測(cè)驗(yàn)問(wèn)題和選項(xiàng)分析,80道測(cè)驗(yàn)試題被分為以下3類:
1)概括總結(jié)能力:理解并抓住語(yǔ)言材料的主要內(nèi)容的能力。
2)細(xì)節(jié)捕捉能力:理解并抓住語(yǔ)言材料的有關(guān)細(xì)節(jié)的能力。
3)推理判斷能力:理解并根據(jù)語(yǔ)言材料進(jìn)行推理的能力。
基于此分類,兩位專家受邀分別考查了聽(tīng)力理解分測(cè)驗(yàn)和閱讀理解分測(cè)驗(yàn)的語(yǔ)言材料以及問(wèn)題和選項(xiàng),對(duì)80道測(cè)驗(yàn)試題進(jìn)行了歸類,并比較分類結(jié)果。兩位專家分類結(jié)果一致的題目有77道,占總題數(shù)的96%。未能取得一致意見(jiàn)的題目為3道,其中閱讀理解分測(cè)驗(yàn)試題2道,聽(tīng)力理解分測(cè)驗(yàn)試題1道。在經(jīng)過(guò)討論之后,兩位專家對(duì)所有題目的分類取得了一致意見(jiàn)。分類結(jié)果見(jiàn)表1:
表1 : 試題分類結(jié)果
3.3.2 項(xiàng)目合并
在結(jié)構(gòu)方程模型中,觀測(cè)變量 (或稱指標(biāo))被用來(lái)測(cè)量那些不能被直接測(cè)量的潛變量(或稱因子)。題目或題目組均可作為因子的外顯指標(biāo)。就本研究而言,選擇采用題目組作為各因子的觀測(cè)變量,將各分測(cè)驗(yàn)中相同分類下的幾個(gè)題目合并成為一個(gè)新的連續(xù)變量。主要原因有:第一,這80道試題均為二項(xiàng)記分,不能滿足現(xiàn)有結(jié)構(gòu)方程模型軟件的需要;第二,結(jié)構(gòu)方程模型對(duì)于樣本量與觀測(cè)變量個(gè)數(shù)之間的比值有一定的要求,樣本量小,變量個(gè)數(shù)多的情況下極有可能得到不穩(wěn)定的解,因此本研究采用將題目劃分成小組的方式來(lái)減少變量個(gè)數(shù)。在項(xiàng)目合并的過(guò)程中,應(yīng)遵循以下原則:1)合并的項(xiàng)目應(yīng)該是相似的,并被用來(lái)測(cè)量同一構(gòu)念 (Kishton& Widaman, 1994);2)合并的項(xiàng)目應(yīng)該來(lái)自同一篇文章,因?yàn)閮?nèi)容相似也是項(xiàng)目合并的一個(gè)重要原則 (Nasser,Takahashi&Benson,1997);3)項(xiàng)目合并后的合成分?jǐn)?shù)應(yīng)該盡可能呈正態(tài)分布 (Bandalos&Finney,2001; Enders& Bandalos, 1999);4)項(xiàng)目小組中的每一項(xiàng)目應(yīng)該是單維的 (Hattie,1986;Hayduk, 1996; Kishton & Widaman, 1994)。
因此,最終得到13個(gè)聽(tīng)力變量和10個(gè)閱讀變量,總共為23個(gè)變量,如表2所示:
表2 :觀測(cè)變量與分?jǐn)?shù)
3.4.1 初步數(shù)據(jù)分析
首先,對(duì)23個(gè)觀測(cè)變量進(jìn)行描述性統(tǒng)計(jì)分析,并計(jì)算各變量的組間內(nèi)部一致性信度系數(shù)。計(jì)算結(jié)果如表3。
表3 :各變量組間內(nèi)部一致性信度系數(shù)
由表3知,聽(tīng)力理解測(cè)驗(yàn)13個(gè)題目組的內(nèi)部一致性信度系數(shù)為0.852,閱讀理解測(cè)驗(yàn)10個(gè)題目組的內(nèi)部一致性信度系數(shù)為 0.816,所有23個(gè)題目組的內(nèi)部一致性信度系數(shù)為0.900,可以看出各分測(cè)驗(yàn)題目組間具有較高的內(nèi)部一致性。
3.4.2 結(jié)構(gòu)方程模型分析
基于對(duì)以往文獻(xiàn)的回顧以及本研究的目的,本研究將建立以下三類模型:1)單一能力模型;2)雙能力模型;3)三能力模型。在單一能力模型中,只包含一個(gè) “一般理解能力”因子。在雙能力模型和三能力模型中,均包含了 “概括總結(jié)能力”、 “細(xì)節(jié)捕捉能力”和 “推理判斷能力”三個(gè)因子。但是,在雙能力模型中,將 “概括總結(jié)能力”和 “細(xì)節(jié)捕捉能力”合并為 “理解顯性信息的能力”,而將“推理判斷能力”稱為 “理解隱性信息的能力”。
因此,本研究將分為兩步:
首先,在聽(tīng)力理解能力和閱讀理解能力分別是不同的能力特質(zhì)這一理論假設(shè)下,分別對(duì)聽(tīng)力變量和閱讀變量進(jìn)行三個(gè)模型的檢驗(yàn);第二,在聽(tīng)力理解能力和閱讀理解能力都是語(yǔ)言理解能力,只是呈現(xiàn)模式不同 (聲音和文本)這一理論假設(shè)下,把聽(tīng)力變量和閱讀變量整合在一起進(jìn)行三個(gè)模型的檢驗(yàn)。
3.4.3 模型評(píng)價(jià)的標(biāo)準(zhǔn)
擬合指數(shù)是模型擬合數(shù)據(jù)程度的評(píng)價(jià)標(biāo)準(zhǔn),一個(gè)理想的擬合指數(shù),應(yīng)當(dāng)具有下面三個(gè)特征 (溫忠麟、侯杰泰、馬什赫伯特,2004):1)不受樣本容量的影響;2)懲罰復(fù)雜模型;3)對(duì)誤設(shè)模型敏感。
參考已有研究中常用且普遍認(rèn)為較穩(wěn)定的擬合指數(shù) (Boomsma,2000;Hoyle&Panter,1995; Raykov, Tomer & Nesselroade, 1991),本研究擬選擇以下幾個(gè)擬合指數(shù)作為模型擬合的檢驗(yàn)標(biāo)準(zhǔn):GFI、CFI、RMSEA、ECVI、AIC。需要特別說(shuō)明的是,由于本研究采用大樣本, 且 χ2和 χ2/df易受樣本容量的影響 (侯杰泰、溫忠麟、成子娟,2004),因此本研究不選擇χ2和χ2/df作為模型評(píng)價(jià)的標(biāo)準(zhǔn)。各擬合指數(shù)特性和判斷標(biāo)準(zhǔn)如下:
GFI(goodness of fit index,擬合優(yōu)度指數(shù)):早期使用較多,一般認(rèn)為大于或等于0.90則模型擬合較好。
CFI(comparative fit index, 比較擬合指數(shù)):不受樣本容量的影響,從而避免對(duì)模型與小樣本擬合優(yōu)度的低估。缺點(diǎn)是沒(méi)有懲罰復(fù)雜模型。大于0.90表示較好的擬合。
RMSEA(root mean square error of approximation,近似誤差均方根):評(píng)價(jià)模型時(shí),會(huì)考慮模型的復(fù)雜性,受樣本量影響較小。小于0.05表示非常好的擬合,0.05和0.08之間表示較好的擬合,大于0.10說(shuō)明擬合很差 (Browne&Cudeck,1993)。
ECVI (expected cross-validation index, 交互效度指數(shù)):反映了模型擬合結(jié)果對(duì)同一總體的另一樣本的可重復(fù)性,其值越小,在另一樣本擬合的結(jié)果越好。
AIC (akaike information criterion, 赤 池 信息量準(zhǔn)則):是用于比較不同模型擬合數(shù)據(jù)效果的一種信息指數(shù),可以權(quán)衡所估計(jì)模型的復(fù)雜度和此模型擬合數(shù)據(jù)的優(yōu)良性。其數(shù)值越小,表明模型擬合越好。
3.5.1 對(duì)聽(tīng)力變量和閱讀變量的分別檢驗(yàn)
我們分別對(duì)聽(tīng)力變量和閱讀變量進(jìn)行了三個(gè)模型的檢驗(yàn) (單一能力模型、雙能力模型和三能力模型)。單一能力模型假設(shè)第二語(yǔ)言聽(tīng)力理解能力和閱讀理解能力都是單一的、整體的能力。而雙能力模型和三能力模型則假設(shè)在第二語(yǔ)言理解能力中內(nèi)部存在可分性的子能力,同時(shí),作為高階因子的 “聽(tīng)力理解能力”或者 “閱讀理解能力”影響著作為一階因子的子能力,并通過(guò)被試在聽(tīng)力試題或者閱讀試題上的作答反應(yīng)表現(xiàn)出來(lái)。三個(gè)模型檢驗(yàn)后的擬合指數(shù)總結(jié)于表4:
如表4所示,無(wú)論是聽(tīng)力變量還是閱讀變量,雙能力模型和三能力模型的擬合度均優(yōu)于單一能力模型。單一能力模型的GFI和CFI均低于 0.90 (未達(dá)到 0.09以上), RMSEA 也均介于0.05和0.08之間 (雖然表明模型擬合較好,但是仍高于雙能力模型和三能力模型的RMSEA指數(shù)),ECVI和AIC也都是三個(gè)模型當(dāng)中最高的。參考所有的擬合指數(shù),對(duì)于聽(tīng)力變量,三能力模型的GFI和CFI分別為0.994和 0.995, 均達(dá)到 0.90 以上, RMSEA 為 0.015,遠(yuǎn)遠(yuǎn)小于 0.05, ECVI和 AIC 分別為 0.058 和158.386,均是三個(gè)模型中最小的,故三能力模型優(yōu)于單一能力模型和雙能力模型;對(duì)于閱讀變量,雙能力模型的GFI和CFI分別為0.977和 0.958, 均達(dá)到 0.90 以上, RMSEA 為 0.054,介于 0.05和 0.08之間, ECVI和 AIC 分別為0.123和 335.009, 也均是三個(gè)模型中最小的,故雙能力模型優(yōu)于單一能力模型和三能力模型。聽(tīng)力理解能力三能力模型圖和閱讀理解能力雙能力模型圖見(jiàn)圖1和圖2。
表4 :對(duì)聽(tīng)力變量和閱讀變量進(jìn)行三個(gè)模型檢驗(yàn)后的擬合指數(shù)
圖1 :聽(tīng)力理解能力的三能力模型圖
因此,在聽(tīng)力理解能力和閱讀理解能力分別是不同的能力特質(zhì)這一理論假設(shè)下,分別對(duì)聽(tīng)力變量和閱讀變量進(jìn)行三個(gè)模型的檢驗(yàn)結(jié)果顯示:1)第二語(yǔ)言聽(tīng)力理解能力和閱讀理解能力并不是一個(gè)單一的、整體的能力,其內(nèi)部包括不同的可分性子能力;2)對(duì)于聽(tīng)力理解能力而言,三能力模型為最優(yōu)模型,而對(duì)于閱讀理解能力而言,雙能力模型為最優(yōu)模型。
3.5.2 對(duì)語(yǔ)言理解能力的檢驗(yàn)
在聽(tīng)力理解能力和閱讀理解能力都是語(yǔ)言理解能力,只是呈現(xiàn)模式不同 (聲音和文本)這一理論假設(shè)下,我們將聽(tīng)力變量和閱讀變量整合在一起進(jìn)行了三個(gè)模型的檢驗(yàn)。三個(gè)模型的擬合指數(shù)總結(jié)于表5:
圖2 :閱讀理解能力的雙能力模型圖
表5 :對(duì)語(yǔ)言理解能力進(jìn)行三個(gè)模型檢驗(yàn)后的擬合指數(shù)
如表5所示,三個(gè)模型的GFI和CFI均處于 0.60 和 0.70 之間, 遠(yuǎn)遠(yuǎn)低于 0.90。 單一能力模型的RMSEA雖然小于0.50,但也處于接近0.50的位置,而雙能力模型和三能力模型的RMSEA均處于0.50和0.80之間,只表明模型擬合較好。因此,三個(gè)模型的擬合度都不太好?;仡欀胺謩e對(duì)聽(tīng)力變量和閱讀變量的檢驗(yàn),雙能力模型和三能力模型在聽(tīng)力變量和閱讀變量中都擬合較好,而將聽(tīng)力變量和閱讀變量整合在一起檢驗(yàn)后則擬合不太好。
因此,我們對(duì)三個(gè)模型進(jìn)行了一些調(diào)整,在原有模型的基礎(chǔ)之上,我們加入了兩個(gè) “渠道”因子,即 “聽(tīng)覺(jué)渠道”和 “視覺(jué)渠道”。這一做法的理論假設(shè)為,在第二語(yǔ)言聽(tīng)力理解能力和閱讀理解能力中,不僅僅只包含了一個(gè)共有的理解過(guò)程,同時(shí)也包含著一個(gè)不同的解碼過(guò)程。在聽(tīng)力理解能力中,存在著對(duì)聽(tīng)覺(jué)渠道信息的解碼,而在閱讀理解能力中,存在著對(duì)視覺(jué)渠道信息的解碼。三個(gè)新模型的擬合指數(shù)總結(jié)于表6:
表6 :對(duì)語(yǔ)言理解能力進(jìn)行三個(gè)新模型檢驗(yàn)后的擬合指數(shù)
如表6所示,在對(duì)原模型調(diào)整后,三個(gè)新模型的擬合度都比較好。但是,是否語(yǔ)言理解能力只包含兩個(gè) “渠道”因子,而不包括三個(gè)“子能力”因子呢?于是,我們將新模型中的“子能力”因子剔除,得到一個(gè)只包含兩個(gè)“渠道”因子的模型 (簡(jiǎn)稱 “渠道”模型),并對(duì)所有變量進(jìn)行了檢驗(yàn)。 “渠道”模型的GFI和 CFI 分 別 為 0.827 和 0.849, RMSEA 為0.065,這就表明 “渠道”模型不能較好擬合。同時(shí),這也就說(shuō)明了在原有模型的基礎(chǔ)上加上“渠道”因子是必要的。
根據(jù)表6的各項(xiàng)擬合指數(shù),三個(gè)新模型的擬合度都很好。因此,僅僅依據(jù)擬合指數(shù),我們很難選出語(yǔ)言理解能力的最優(yōu)模型。單純就統(tǒng)計(jì)的角度來(lái)看,新單一能力模型是最優(yōu)模型,原因如下:1)在三個(gè)新模型中,單一能力模型的擬合指數(shù)是最好的;2)單一能力模型和三能力模型的各項(xiàng)擬合指數(shù)十分接近,單一能力模型的GFI、CFI和RMSEA分別為0.962、 0.946 和 0.031, 三 能 力 模 型 的 GFI、CFI 和 RMSEA 分 別 為 0.950、 0.939 和 0.038,兩個(gè)模型的ECVI和AIC也都十分接近。同時(shí)在三能力模型中,三個(gè)一階因子在高階因子上的因子負(fù)荷都接近1,這就似乎表明三個(gè) “子能力”因子實(shí)際上可能就是一個(gè)單一因子。
但是,在結(jié)構(gòu)方程模型中,選擇最優(yōu)模型不能僅僅依靠統(tǒng)計(jì)信息 (侯杰泰、溫忠麟、成子娟,2004)。由于在對(duì)聽(tīng)力變量和閱讀變量的分別檢驗(yàn)中,單一能力模型的擬合度均不好。因此,對(duì)所有變量而言,似乎選擇雙能力模型或者三能力模型為最優(yōu)模型比較合適。而根據(jù)表6,新三能力模型的各項(xiàng)擬合指數(shù)均優(yōu)于新雙能力模型。因此,我們選擇新三能力模型為語(yǔ)言理解能力的最優(yōu)模型。語(yǔ)言理解能力的最優(yōu)模型圖見(jiàn)圖3。
圖3 :語(yǔ)言理解能力的最優(yōu)模型圖
本研究的研究問(wèn)題一是:漢語(yǔ)作為第二語(yǔ)言的高級(jí)水平學(xué)習(xí)者的聽(tīng)力理解能力和閱讀理解能力這兩種語(yǔ)言理解能力是否可分?如果可分,其結(jié)構(gòu)分別是什么?其內(nèi)部所包括的子能力的數(shù)量和類型分別是什么?
關(guān)于這一研究問(wèn)題,我們分別對(duì)聽(tīng)力變量和閱讀變量進(jìn)行了三個(gè)模型的檢驗(yàn)。如表4所示,在聽(tīng)力理解能力中,三能力模型優(yōu)于單一能力模型和雙能力模型;在閱讀理解能力中,雙能力模型優(yōu)于單一能力模型和三能力模型。如圖1所示,三能力模型在聽(tīng)力變量中擬合較好,包含三個(gè)子能力因子,即 “概括總結(jié)能力”、 “細(xì)節(jié)捕捉能力”和 “推理判斷能力”。如圖2所示,雙能力模型在閱讀變量中擬合較好,包含兩個(gè)子能力因子,即 “理解顯性信息的能力”和 “理解隱性信息的能力”。
就雙能力模型而言,它在閱讀變量中的擬合度優(yōu)于在聽(tīng)力變量中的擬合度。這就說(shuō)明“概括總結(jié)能力”和 “細(xì)節(jié)捕捉能力”并不能夠很好地在閱讀變量中區(qū)分開(kāi)來(lái),但卻能夠很好地在聽(tīng)力變量中區(qū)分開(kāi)來(lái)。我們認(rèn)為原因如下:
第一,參加HSK[高等]考試的漢語(yǔ)學(xué)習(xí)者對(duì)漢語(yǔ)閱讀文本比較熟悉,因此,他們既能掌握和理解閱讀文本的主要內(nèi)容,也能較好地理解閱讀文本的具體細(xì)節(jié)。因此,這就使得“概括總結(jié)能力”和 “細(xì)節(jié)捕捉能力”在閱讀變量中很難被區(qū)分開(kāi)來(lái)。然而,正如許多聽(tīng)力研究者所言,即使學(xué)習(xí)者理解了口頭演講中的每一個(gè)詞的意義,他們也很難理解其主要觀點(diǎn)(Olsen&Huckin,1990)。因此,這就使得“概括總結(jié)能力”和 “細(xì)節(jié)捕捉能力”能夠在聽(tīng)力變量中得以區(qū)分。同時(shí),這也就說(shuō)明了對(duì)于高級(jí)水平漢語(yǔ)學(xué)習(xí)者而言,理解長(zhǎng)對(duì)話或者口頭演講比理解閱讀文本難度更大和更具挑戰(zhàn)性。
第二,HSK[高等]的聽(tīng)力理解分測(cè)驗(yàn)和閱讀理解分測(cè)驗(yàn)的任務(wù)特征不同,也是導(dǎo)致聽(tīng)力理解能力和閱讀理解能力具有不同的能力結(jié)構(gòu)的一個(gè)重要原因。HSK[高等]的閱讀理解分測(cè)驗(yàn)的閱讀文本相對(duì)較短,每篇文章750字左右。同時(shí),考生在進(jìn)行閱讀理解測(cè)試的過(guò)程中可以隨時(shí)反復(fù)多次閱讀文本。這些都有利于考生理解文章的主要內(nèi)容和具體細(xì)節(jié)。而聽(tīng)力理解分測(cè)驗(yàn)中有的聽(tīng)力材料比閱讀文本要長(zhǎng)。更為重要的是,考生在聽(tīng)力理解測(cè)試的過(guò)程中只能聽(tīng)一遍,沒(méi)有機(jī)會(huì)回過(guò)頭去重新檢查和思考。這就使得考生的 “概括總結(jié)能力”和 “細(xì)節(jié)捕捉能力”得以有效區(qū)分。
正如Alderson(2000)所言,子能力對(duì)于初級(jí)閱讀者來(lái)說(shuō)能夠更為有效地進(jìn)行區(qū)分,技能成分的研究方法對(duì)于低水平的第二語(yǔ)言閱讀者來(lái)說(shuō)可能較為有效,而對(duì)于高級(jí)閱讀者來(lái)說(shuō)則不亦然。也就是說(shuō),在考生表現(xiàn)較差的測(cè)驗(yàn)中,子能力能夠更好地區(qū)分開(kāi)來(lái)。因此,在本研究中,較之閱讀變量而言,子能力能夠更好地在聽(tīng)力變量中區(qū)分開(kāi)來(lái)。
本研究的研究問(wèn)題二是:漢語(yǔ)作為第二語(yǔ)言的高級(jí)水平學(xué)習(xí)者的語(yǔ)言理解能力是否可分?如果可分,語(yǔ)言理解能力的結(jié)構(gòu)是什么?其內(nèi)部所包括的子能力的數(shù)量和類型分別是什么?
有關(guān)這一研究問(wèn)題,我們將聽(tīng)力變量和閱讀變量整合在一起進(jìn)行了三個(gè)模型的檢驗(yàn)。研究結(jié)果從實(shí)證的角度支持了聽(tīng)力理解能力和閱讀理解能力都是語(yǔ)言理解能力,只是呈現(xiàn)模式不同 (聲音和文本)這一理論假設(shè)。但就本研究而言,聽(tīng)力理解能力和閱讀理解能力兩者的關(guān)系是異大于同的,因?yàn)閱渭儼?“子能力”因子的三個(gè)模型的擬合度都不好,在加入 “渠道”因子之后,三個(gè)新模型的擬合度有了顯著提高?;谀壳暗姆治?,我們很難斷定語(yǔ)言理解能力是整體的、單一的能力還是其內(nèi)部包含若干不同的子能力。雖然我們綜合考慮把新三能力模型作為最優(yōu)模型,但是新單一能力模型和新雙能力模型的擬合度同樣也是好的,這種不確定性有可能源于本研究的數(shù)據(jù)特征。正如之前所討論的,HSK[高等]的聽(tīng)力理解分測(cè)驗(yàn)和閱讀理解分測(cè)驗(yàn)上的任務(wù)特征不同,這就使得當(dāng)我們把聽(tīng)力變量和閱讀變量整合在一起檢驗(yàn)時(shí), “渠道”因子就解釋了總體變異中的大部分,而 “子能力”因子的影響就小得多。
因此,就目前的研究結(jié)果而言,雖然單一能力模型優(yōu)于雙能力模型和三能力模型,但是我們就此斷言第二語(yǔ)言理解能力是一個(gè)單一的、整體的能力是值得商榷的。正如前面的討論,實(shí)驗(yàn)數(shù)據(jù)受到被試語(yǔ)言能力和測(cè)驗(yàn)任務(wù)特征的影響,因此第二語(yǔ)言理解能力的可分性也可能受到被試語(yǔ)言能力和測(cè)驗(yàn)任務(wù)特征的影響。
本研究的結(jié)論如下:
第一,聽(tīng)力理解能力和閱讀理解能力的結(jié)構(gòu)是相似的,它們都包含兩個(gè)或者三個(gè)子能力。聽(tīng)力理解能力包含三個(gè)子能力,即 “概括總結(jié)能力”、 “細(xì)節(jié)捕捉能力”和 “推理判斷能力”;閱讀理解能力包含兩個(gè)子能力,即“理解顯性信息的能力”和 “理解隱性信息的能力”。
第二,聽(tīng)力理解能力和閱讀理解能力在理解過(guò)程方面是相似的,但在解碼過(guò)程中卻是不同的,具體表現(xiàn)在呈現(xiàn)模式上,即聽(tīng)覺(jué)渠道和視覺(jué)渠道。
第三,第二語(yǔ)言理解能力的可分性會(huì)受到被試語(yǔ)言能力和測(cè)驗(yàn)任務(wù)特征的影響。因此,在解決有關(guān)語(yǔ)言理解能力的可分性及其內(nèi)部子能力的種類和數(shù)量的問(wèn)題時(shí),需要考慮具體測(cè)驗(yàn)情境下的被試語(yǔ)言能力因素和測(cè)驗(yàn)任務(wù)特征因素。
杜 建 1992 聽(tīng)音理解過(guò)程和聽(tīng)力評(píng)估方法[J].外語(yǔ)教學(xué)與研究(4):47-51.
谷 陵 2003 論漢語(yǔ)聽(tīng)力測(cè)試中應(yīng)考查的六種聽(tīng)力技能[J].云南師范大學(xué)學(xué)報(bào)(對(duì)外漢語(yǔ)教學(xué)與研究版)(6):23-25.
侯杰泰,溫忠麟,成子娟 2004 結(jié)構(gòu)方程模型及其應(yīng)用[M].北京:教育科學(xué)出版社:14-16.
金天相,李 泉 1994 廣播新聞聽(tīng)力課教學(xué)論略[J].漢語(yǔ)學(xué)習(xí)(3):60-63.
金琰如,王佶旻 2012 初級(jí)階段留學(xué)生漢語(yǔ)聽(tīng)力能力結(jié)構(gòu)探究[J].語(yǔ)言教學(xué)與研究(3):35-41.
李清華 1987 談科技漢語(yǔ)的聽(tīng)力理解 [J].語(yǔ)言教學(xué)與研究(2):103-110.
李小蘭 2008 知識(shí)空間理論與規(guī)則空間模型在漢語(yǔ)聽(tīng)力理解技能測(cè)驗(yàn)編制中的應(yīng)用[D].北京語(yǔ)言大學(xué)碩士學(xué)位論文.
劉秀明,王 蘋(píng) 2008 預(yù)科漢語(yǔ)聽(tīng)力成績(jī)測(cè)試中的微技能與信息轉(zhuǎn)換[J].喀什師范學(xué)院學(xué)報(bào)(1):95-97.
王 靜 2008 C.TEST閱讀理解測(cè)驗(yàn)的診斷性評(píng)價(jià)研究[D].北京語(yǔ)言大學(xué)碩士學(xué)位論文.
溫忠麟,侯杰泰,馬什赫伯特 2004 結(jié)構(gòu)方程模型檢驗(yàn):擬合指數(shù)與卡方準(zhǔn)則[J].心理學(xué)報(bào)(2):186-194.
徐式婧 2007 C.TEST聽(tīng)力理解測(cè)驗(yàn)的診斷性評(píng)價(jià)研究[D].北京語(yǔ)言大學(xué)碩士學(xué)位論文.
楊惠元 1989 談?wù)劼?tīng)力教學(xué)的四種能力訓(xùn)練[J].世界漢語(yǔ)教學(xué)(1):58-63.
———1991論聽(tīng)和說(shuō)[J].語(yǔ)言教學(xué)研究(1):88-110.
楊 旭 2010 融合模型在C.TEST聽(tīng)力理解試題中的認(rèn)知診斷研究[D].北京語(yǔ)言大學(xué)碩士學(xué)位論文.
朱正才,范開(kāi)泰 2001 語(yǔ)言聽(tīng)力理解的認(rèn)知結(jié)構(gòu)與測(cè)試[J].語(yǔ)言教學(xué)與研究(3):41-46.
Alderson, J. 2000 Assessing Reading[M].Cambridge,UK: Cambridge University Press.
Alderson, J.& Y.Lukmani 1989 Cognition and reading: Cognitive levels as embodied in test questions[J].Reading in a Foreign Language 5(2): 253-270.
Bachman, L.& A.Palmer 1981 The construct validation of the FSI oral interview [J].Language Learning 31: 67-86.
———1982The construct validation of some components of communicative proficiency[J].TESOL Quarterly 16: 449-465.
Bae, J.& L.Bachman 1998 A latent variable approach to listening and reading: Testing factorial invariance across two groups of children in the Korean/English Two-Way immersion Program[J].Language Testing 15(3): 380-414.
Bandalos,D.& S.Finney 2001 Item parceling issues in structural equation modeling[A].In G.Marcoulides et al. (eds.), New Developments and Techniques in Structural Equation Modeling [C]. Mahwah, NJ:Lawrence Erlbaum Associates: 269-295.
Boomsma, A. 2000 Reporting analyses of covariance structure[J].Structural Equation Modeling 7: 461-483.
Brown, J. 1996 Testing in Language Programs [M].Upper Saddle River, NJ: Prentice Hall Regents.
Browne,M.& R.Cudeck 1993 Alternative ways of assessing model fit[A].In K.Bollen et al.(eds.), Testing Structural Equation Models [C].Newbury Park,CA: Sage Publications: 136-162.
Buck, G. 1991 The testing of listening comprehension:An introspective study[J].Language Testing 8 (1):67-91.
———1992Listening comprehension:Construct validity and trait characteristics[J].Language Learning 42(3): 313-357.
———2001Assessing Listening[M].Cambridge,UK:Cambridge University Press.
Buck, G.& K.Tatsuoka 1998 Application of the rulespace procedure to language testing: Examining attributes of a free response listening test[J].Language Testing 15(2): 119-157.
Carroll, J.1972 Defining language comprehension[A].In R.Freedle et al.(eds.), Language Comprehension and the Acquisition of Knowledge [C]. New York:John Wiley.
———1993Human Cognitive Abilities[M].Cambridge, UK: Cambridge University Press.
Carver, R. 1982 Optimal rate of reading prose [J].Reading Research QuarterlyXVIII(1): 56-88.
———1983Is reading rate constant or flexible? [J].Reading Research QuarterlyXVIII(2): 190-215.
———1984Rauding theory predictions of amount comprehended under different purposes and speed reading conditions[J].Reading Research QuarterlyXIX(2): 205-218.
———1990Reading Rate:A Review of Research and Theory[M].New York: Academic Press.
———1992What do standardized tests of reading comprehension measure in terms of efficiency,accuracy, and rate? [J]. Reading Research Quarterly 27(4): 347-359.
Clark, H.& E.Clark 1977 Psychology and Language:An Introduction to Psycholinguistics[M].New York:Harcourt Brace Jovanovich.
Davey, B. 1988 Factors affecting the difficulty of reading comprehension items for successful and unsuccessful readers[J].Experimental Education (56): 67-76.Davis, F. 1944 Fundamental factors of comprehension in reading[J].Psychometrika 9: 185-197.
———1968Research in comprehension in reading[J].Reading Research Quarterly 3: 499-545.
Drum,P.,R.Calfee& L.Cook 1981 The effects of surface structure variables on performance in reading comprehension tests[J].Reading Research Quarterly 16:486-514.
Enders, K.& L.Bandalos 1999 The effects of heterogeneous item distribution on reliability[J].Applied Measurement in Education 12: 133-150.
Freedle, R.& I.Kostin 1994 Can multiple-choice reading tests be construct valid?[J].Psychological Science 5: 107-110.
———1996The Prediction of TOEFL Listening Comprehension Item Difficulty for Mini-talk Passages: Implications for Construct Validity (TOEFL Research Report No.RR-56)[M].Princeton, NJ: Educational Testing Service.
———1999Does text matter in a multiple-choice test of comprehension? The case for the construct validity of TOEFL’s minitalks[J].Language Testing 16(1):2-32.
Gough, P., L.Ehri& R.Treiman 1992 Reading Acquisition[M].Hillsdale, NJ: L Erlbaum.
Grabe, W. 1991 Current development in second language reading research [J]. TESOL Quarterly 25:375-397.
Gray W. 1960 The major aspects of reading[A].In H.Robinson (ed.), Sequential Development of Reading Abilities[C].Chicago: University of Chicago Press,8-24.
Harmer, J. 1983 The Practice of English Language Teaching[M].New York: Longman Group Limited,144-145.
Hattie,A. 1986 Methodology review:Assessing unidimensionality of tests and items [J].Applied Psychological Measurement 9: 139-164.
Hayduk,L. 1996 LISREL Issues,Debates, and Strategies[M].Baltimore, MD: Johns Hopkins University Press.
Hoyle,R.& A.Panter 1995 Writing about structural equation models[A].In H.Hoyle (ed.), Structural E-quation Modeling: Concepts, Issues, and Applications[C].Thousand Oaks, CA: Sage Publications.
Hughes, A. 1989 Testing for Language Teachers[M].Cambridge, UK: Cambridge University Press.
Jang, E. 2009 Cognitive diagnostic assessment of L2 reading comprehension ability: Validity arguments for Fusion Model application to language assessment [J].Language Testing 26(1): 31-73.
Kenneth, C. 1976 Developing Second Language Skills:Theory to Practice[M].Boston: Houghton Mifflin Company.
Kintsch,W.& T.van Dijk 1978 Toward a model of text comprehension and production[J].Psychological Review 85: 363-394.
Kintsch, W.&J.Yarbrough 1982 Role of rhetorical structure in text comprehension[J].Educational Psychological 74(6): 828-834.
Kishton,J.& K.Widaman 1994 Unidimensional versus domain representative parceling of questionnaire items:An empirical example[J].Educational and Psychological Measurement 54: 757-765.
Lennon, R. 1962 What can be measured? [J].Reading Teacher 15: 326-337.
Lunzer, E.& K.Gardner 1979 The Effective Use of Reading[M].London: Heinemann Educational Books.Munby, J. 1978 Communicative Syllabus Design[M].Cambridge: Cambridge University Press.
Nasser, F., T.Takahashi& J.Benson 1997 The structure of test anxiety in Israeli-Arab high school students: An application of confirmatory analysis with miniscales[J].Anxiety, Stress, and Coping 10: 129-151.
Nissan, S., F.DeVincenzi& L.Tang 1996 An Analysis of Factors Affecting the Difficulty of Dialogue Items in TOEFL Listening Comprehension(TOEFL Research Report No.RR-51)[M].Princeton, NJ: Educational Testing Service.
Oakeshott-Taylor, J. 1977 Information redundancy,and listening comprehension[A].In R.Dirven (ed.),Horverstandnis im Fremdsprachenunterricht(Listening Comprehension in Foreign Language Teaching)[C].Kronberg /Ts: Scriptor.
Olsen, L.& T.Huchin 1990 Point-driven understanding in engineering lecture comprehension[J].English for Special Purposes 9: 33-47.
Park,G. 2004 Comparison of L2 listening and reading comprehension by university students learning English in Korea[J].Foreign Language Annals 37: 448-458.
Pollitt, A., C.Hutchinson, N.Entwistle & C.DeLuca 1985 What Makes Exam Questions Difficult? An Analysis of‘O’ Grade Questions and Answers[M].Edinburgh: Scottish Academic Press.
Raykov, T., A.Tome & J.Nesselroade 1991 Reporting structural equation modeling results in Psychology and Aging: Some proposed guidelines[J].Psychology and Aging 6: 499-503.
Reves, T.& A.Levine 1988 The FL receptive skills:Same or different? [J].System 16: 327-336.
Richards,J. 1983 Listening comprehension: Approach,design, procedure[J].TESOL Quarterly 17(2): 219-240.
Rivers, W. 1966 Listening comprehension[J].Modern Language Journal 50(4): 196-202.
Rost, D. 1993 Assessing the difference components of reading comprehension: fact or fiction? [J].Language Testing 10(1): 79-92.
Sang, F., B.Schmitz, H.Vollmer, J.Baumert& P.Roeder 1986 Models of second language competence:Structural equation approach[J].Language Testing 3:54-79.
Sasaki,M. 1996 Second Language Proficiency,F(xiàn)oreign Language Aptitude,and Intelligence:Quantitative and Qualitative Analyses[M].New York: Peter Lang.
Shin, S. 2005 Did they take the same test? Examinee language proficiency and the structure of language tests[J].Language Testing 22(1): 31-57.
Spearitt, D. 1972 Identification of subskills of reading comprehension by maximum likelihood factor analysis[J].Reading Research Quarterly 8: 92-111.
Valette, R. 1977 Modern Language Testing[M].New York: Harcourt Brace Jovanovich.
Weir, C. 1993 Understanding and Developing Language Tests[M].New York: Prentice Hall.