張啟睿,邊玉芳(中國人民公安大學(xué)犯罪學(xué)院,北京 100038;北京師范大學(xué)認知神經(jīng)科學(xué)與學(xué)習(xí)國家重點實驗室,北京 100875)
?
語言認知診斷測驗:產(chǎn)生、發(fā)展與面臨的挑戰(zhàn)*
張啟睿,邊玉芳
(中國人民公安大學(xué)犯罪學(xué)院,北京 100038;北京師范大學(xué)認知神經(jīng)科學(xué)與學(xué)習(xí)國家重點實驗室,北京 100875)
摘要:認知診斷測驗是認知心理學(xué)與現(xiàn)代測量學(xué)相結(jié)合的產(chǎn)物,測量方式和測驗設(shè)計方法均建立在認知理論基礎(chǔ)上,可以提供有關(guān)知識掌握狀態(tài)與技能水平的詳細信息。利用測驗結(jié)果采取有針對性的補救措施,可以提高學(xué)習(xí)效率。認知診斷測驗已經(jīng)有了長足發(fā)展,在語言領(lǐng)域中也有了廣泛應(yīng)用。但由于語言的復(fù)雜性和認知診斷測量模型的局限性,語言認知診斷測驗研究還有待于進一步發(fā)展。
關(guān)鍵詞:語言;測驗;認知診斷
Lado于1961出版了《Language testing》,標(biāo)志著語言測驗成為一門獨立學(xué)科。隨后,陸續(xù)出現(xiàn)許多理論與方法用于評估個體的語言知識狀態(tài)與語言技能水平。隨著研究的深入,研究者認識到籠統(tǒng)的語言水平測驗總分或能力分數(shù)不能實現(xiàn)這一目的,測驗分數(shù)相同的個體,往往具有不同的知識狀態(tài)和能力結(jié)構(gòu)。這就需要測驗?zāi)軌蛱峁┯嘘P(guān)語言知識狀態(tài)與技能水平的更為詳細的個性化評估信息。學(xué)生和教師可以采取更有針對性的補習(xí)和輔導(dǎo),提高語言學(xué)習(xí)效率,在這一認識激勵下,伴隨著認知診斷測驗理論發(fā)展,語言認知診斷測驗應(yīng)運而生。
認知診斷測驗是以認知為基礎(chǔ)的評價方法。它依賴于如下共識:了解測驗背后的認知過程,可以有效地構(gòu)建測驗項目、解釋測驗結(jié)果和評分。[1-3]認知心理學(xué)家與心理測量學(xué)家使用認知模型構(gòu)建測驗項目,利用認知診斷統(tǒng)計模型分析測驗數(shù)據(jù),通過測驗結(jié)果了解個體的弱點與不足,制定出有針對性的教學(xué)與學(xué)習(xí)計劃。這些特點使認知診斷測驗成為新一代測驗理論的代表。本文綜述了語言認知診斷測驗的產(chǎn)生、結(jié)構(gòu)、現(xiàn)狀和難點,指出未來的研究方向。
(一)原有語言測驗的缺陷
經(jīng)典語言測驗都屬于標(biāo)準(zhǔn)參照測驗,都在經(jīng)典測驗理論和項目反應(yīng)理論指導(dǎo)下發(fā)展起來,目的是測量個體在量表中的位置,以觀察是否完成了特定教學(xué)要求或達到了一定專業(yè)水平。分數(shù)要么僅代表個體在群體中的位置,缺乏知識水平的信息;要么提供了分數(shù)的知識性解釋,但知識有時非常繁雜,沒有基于認知理論,使個體在補習(xí)時無的放矢。為了保證不同位置能夠反映出個體的不同水平,量表必須準(zhǔn)確、可靠、有區(qū)分性,符合分數(shù)分布的一般規(guī)律;測量必須有效。這一類測驗以學(xué)生的考試成績?yōu)槟繕?biāo),對考生的行為感興趣,可以稱之為教育心理測量模型 (Educational Psychometric Measurement Models)[4]或標(biāo)準(zhǔn)測驗理論(Standard test theory)[5]。從認知科學(xué)的角度看,這一理論存在著不足:(1)項目不一定有心理學(xué)意義。模型的好壞取決于能否較好地描述數(shù)據(jù),不取決于是否符合認知加工過程。(2)模型的部分假設(shè) (如項目的局部獨立性假設(shè)、項目難度的單維性假設(shè))和認知心理學(xué)的實驗結(jié)果不符。例如,在閱讀理解測驗中,一篇文章后有幾道題目,這些題目容易造成局部依賴,與題目局部獨立性假設(shè)不符;解題中的技能、策略、知識結(jié)構(gòu),很難說是單維的。(3)把項目和分數(shù)看作是不可觀察的“黑箱”,內(nèi)容是否有效需要反復(fù)論證。[6]為了彌補這些缺陷,研究者利用認知加工模型,對認知過程作出假定,并與標(biāo)準(zhǔn)測驗理論結(jié)合,從而實現(xiàn)對認知技能與知識結(jié)構(gòu)的測量。Fischer使用IRT模型進行了認知診斷嘗試,從認知的角度對項目難度進行定義,使單維IRT模型向診斷模型發(fā)展[7-8];Tatsuoka等人使用規(guī)則空間模型估計能力,把被試歸類到認知模式類別中[9];Misley等人應(yīng)用項目反應(yīng)理論評估考生使用不同策略的項目。這些努力促進了語言認知診斷測驗產(chǎn)生。[10]
(二)語言能力觀的演進
語言能力是語言測驗的對象,語言能力觀對語言測驗具有深遠影響,語言能力觀的演進經(jīng)歷了2個重要階段:
(1)結(jié)構(gòu)主義的語言能力觀。認為語言應(yīng)該劃分成小塊,再描述如何拼湊在一起,產(chǎn)生連續(xù)的言語。[11]語言能力包括語言成分和語言技能。語言成分指構(gòu)成有意義語言的各個要素,如語音、語調(diào)、重音、語素、詞匯以及詞匯的意義等。語言技能包括聽、說、讀、寫。需要逐個測試語言成分和語言技能。[12]在這種語言能力觀影響下,聽、說、讀、寫的分立式測驗流行起來,許多影響大的語言測試 (TOEFL、GRE、劍橋英語考試)都遵循該思路安排測驗。分立式測驗有易于操作、評分客觀的優(yōu)點,但語言測試不注重對語言能力的解釋,不能清晰表達知識和技能的關(guān)系,忽略語言運用的環(huán)境和語言的整體性。教師孤立地進行分項教學(xué),學(xué)生缺乏在語言交際中綜合運用語言的能力。[13]
(2)功能主義的語言能力觀。Oller主張將分解測試綜合起來,認為語言能力是一種無形的、各部分無差別的整體,主張運用綜合測試測量運用多項語言知識的能力。在整體能力觀影響下,人們開發(fā)出完形填空、翻譯、寫作等綜合測試形式。[14]Hymes提出“交際能力”的概念,認為交際能力包括語言是否合乎語法和是否可以接受。[15]Canale和Swain認為,交際能力包括四個方面:①語法能力 (詞匯、形態(tài)、句法和音位);②社會語言學(xué)能力 (社會文化規(guī)則和話語規(guī)則);③成段話語能力;④策略能力 (交際中的應(yīng)變能力)。[16]Bachman認為,語言能力是把語言知識和語言使用的場景特征結(jié)合起來,創(chuàng)造并解釋意義的能力,包括語言能力、策略能力和心理、生理運動機制三個部分。這一模型強調(diào)交際語言能力的各個部分以及它們與語用環(huán)境和語言使用者的知識結(jié)構(gòu)之間的相互作用。[17]按照這種模型開發(fā)的語言測試既注重考慮個體的語言知識,同時又考慮在有意義的語境中能否恰當(dāng)使用語言的能力,擺脫了分立式測試對綜合性語言行為作分類式歸納、綜合性測試目的不明以及題目之間相互依賴等不足。[13]這一模型被譽為“語言測試史上的里程碑”。語言測試開始注重知識和能力的關(guān)系,注重對項目背后的語言能力的解讀,個體在語言環(huán)境中的認知過程開始受到重視,語言測量學(xué)家與語言心理學(xué)家開始越來越多地分享研究的成果。
(三)后現(xiàn)代主義的影響
語言測試的科學(xué)精神,正在被越來越多地為后現(xiàn)代主義理念詮釋。[18]科學(xué)精神強調(diào)確定性、可預(yù)測性、普遍性,后現(xiàn)代主義強調(diào)不確定性、暫時性、地域性和個體性。[19]在閱讀理解測驗中,科學(xué)精神強調(diào)文本內(nèi)容理解的確定性、同一性。后現(xiàn)代主義認為,意義并非源于文本自身,而是產(chǎn)生于讀者同文本之間的相互作用。對于同一文本,可以有不同的解釋。[20]Alderson認為,閱讀理解測試應(yīng)該允許多種可能的理解,試題設(shè)計者應(yīng)該在可接受范圍上更加開放些。閱讀能力測驗應(yīng)該超越文本內(nèi)容的束縛,探究認知加工的內(nèi)容。[21]后現(xiàn)代主義強調(diào)個體性,強調(diào)測驗的結(jié)果不僅提供了一般輪廓,還應(yīng)該針對個體提供不同的評價信息。測驗應(yīng)該為學(xué)習(xí)者提供詳細的診斷反饋,反映學(xué)生在特定知識領(lǐng)域內(nèi)的認知水平,給予途徑或方法去幫助學(xué)生補救認知缺陷,或提高知識掌握的熟悉性。[22]McNamara把這種個人覺悟意識提高歸因于“后現(xiàn)代主義發(fā)動的知識變革把個體的意識模式置于整個社會背景中加以重新闡釋”,呼吁“重新審視語言測試研究的重點”[23]。
(四)語言測驗效度理論研究的不斷深入
經(jīng)典的語言測驗由于缺乏效度理論的支持,在效度檢驗時往往以其他語言測驗為標(biāo)準(zhǔn)計算校標(biāo)關(guān)聯(lián)效度。效度被看作是一種相關(guān)系數(shù),容易陷入其他測驗效度又如何的循環(huán)論證之中。隨著效度理論研究的深入,出現(xiàn)了不同類型的效度,但繁多的效度表明了選擇效度證據(jù)時的任意性。[24]通過探索,構(gòu)念效度成為效度的核心。[25]在構(gòu)念效度的基礎(chǔ)上,出現(xiàn)了整體效度觀。整體效度觀認為,效度是一個整體概念。效度既非對測試的評價,也非對測試分數(shù)的評價,是對測試結(jié)果的解釋和使用的評價。效度針對測試的特定解釋和使用,同一測試分數(shù)可以有不同的解釋和使用。效度只有程度的高低,不是全或無。整體效度觀強調(diào)后果效度,認為效驗過程就是收集、積累證據(jù)支持對測試結(jié)果的特定解釋或使用。測試開發(fā)者和使用者都有效驗舉證的責(zé)任。[24](P26-27)構(gòu)念效度與整體效度觀要求在測驗設(shè)計之初就應(yīng)該把握好測驗?zāi)康摹?nèi)容和試題的對應(yīng)關(guān)系。與經(jīng)典的語言測驗比,認知診斷測驗在測驗效度控制上具有優(yōu)勢。Messick提出了在整體效度觀指導(dǎo)下效驗舉證的方法:(1)內(nèi)容分析:由相關(guān)專家判斷項目與要測量構(gòu)念的對應(yīng)關(guān)系。(2)項目分析:用定量的方法探究相關(guān)因素對項目難度和區(qū)分度的影響,用定性的方法考察被試使用的策略,用語篇分析法研究被試的語言,并將語言和語用特征與構(gòu)念定義作比較。(3)維度分析:研究測試的內(nèi)部結(jié)構(gòu)。通過反應(yīng)數(shù)據(jù)的心理測量學(xué)模型與構(gòu)念理論的擬合加以檢驗。(4)測試分數(shù)與其他測試和行為的關(guān)系。(5)行為差異分析:分析不同群體在不同測試任務(wù)上的差別。(6)測試結(jié)果分析:通過問卷、訪談、觀察了解測試結(jié)果的準(zhǔn)確性。[26]將語言認知診斷測驗的方法與這6種方法比較,二者在多數(shù)方法上一致。因此,語言認知診斷測驗?zāi)茉谧畲蟪潭壬媳WC測驗的構(gòu)念效度。
(五)測量理論的進步和計算機技術(shù)的應(yīng)用
分析和解釋個體差異,僅有認知模型是不夠的,必須強調(diào)測驗設(shè)計,即根據(jù)測量對象的心理模型來選擇、編制項目和測驗。[28]測驗設(shè)計是通過項目設(shè)計,引發(fā)出個體內(nèi)在認知特點的外在表現(xiàn),實現(xiàn)對內(nèi)在認知特征的判斷。測驗設(shè)計好后,需要借助合適的測量模型,使理性的思辨獲得實證性的數(shù)據(jù)。具體做法是:將各種認知變量直接融入模型,借助統(tǒng)計方法揭示個體認知變量的特征。認知診斷測驗與傳統(tǒng)測驗的模型具有很大的不同:在傳統(tǒng)測驗中,有一套測量模型就能夠解決有統(tǒng)計特征的個體能力定位,如真分數(shù)模型以及由此引申的信度、效度、難度、區(qū)分度計算,構(gòu)成了一套解決能力定位和測驗質(zhì)量分析的模型。在認知診斷測驗中,出現(xiàn)了一族模型,每一個模型都對應(yīng)于特殊的對象,模型之間從表現(xiàn)形式到診斷功能都有較大的差異。[29]由于認知診斷測驗要求較大的測驗規(guī)模,加上模型公式復(fù)雜,計算繁瑣,數(shù)據(jù)量大,一些計算機軟件,如Statshop[30]、Arpeggio[31]、Mdltm[32]等被開發(fā)出來。
(一)語言認知診斷測驗的結(jié)構(gòu)
語言認知診斷測驗通常包括四個階段:
(1)定義認知屬性:認知屬性即測驗要評估的內(nèi)容。認知屬性以及屬性與項目之間存在著一定的聯(lián)系規(guī)則,認知診斷測驗假設(shè)項目可以被描述為一系列認知屬性,如果被試正確地回答了某一項目,就意味著掌握了構(gòu)成該項目的相關(guān)屬性。[2]穩(wěn)固的屬性定義以及屬性與項目的編碼是確定屬性掌握輪廓和解釋測驗結(jié)果的關(guān)鍵,在確定認知屬性的過程中,可以從測驗?zāi)康?、相關(guān)的認知學(xué)習(xí)理論、測驗項目的內(nèi)容分析、被試的口語匯報告獲得指導(dǎo)。[33-34]定義認知屬性不僅要基于相關(guān)的認知模型,還要對知識的內(nèi)容屬性進行充分的挖掘。
(2)構(gòu)建屬性的層級關(guān)系:即確認認知屬性之間的邏輯關(guān)系或心理順序。構(gòu)建屬性層級關(guān)系可以借鑒認知屬性確定中的方法,如學(xué)科專家確定法、口語報告法、文獻分析法等。屬性層次關(guān)系有四種基本類型:線性型、收斂型、分支型和無結(jié)構(gòu)型。這四種基本類型可以組合成更為復(fù)雜的網(wǎng)絡(luò)型。[35]
(3)數(shù)據(jù)分析:基于數(shù)據(jù)估計個體認知屬性掌握的輪廓。選擇一定的認知診斷模型去校準(zhǔn)測驗,在不同的認知診斷模型中,數(shù)據(jù)分析的過程不同。一些認知診斷模型本質(zhì)上是分類運算法則,根據(jù)認知屬性掌握模式將被試分類。也有使用線性項目反應(yīng)理論進行估計,根據(jù)整體熟練水平及反應(yīng)特性分類。多數(shù)基于項目反應(yīng)理論的認知診斷模型是多維模型,即假定存在著多維建構(gòu)。校準(zhǔn)模型的過程通常包括項目參數(shù)估計以及項目參數(shù)檢驗。無論選擇何種估計方法,均要檢查模型對項目和被試參數(shù)的收斂是否達到。如果沒有收斂或產(chǎn)生嚴重的模型與數(shù)據(jù)的不擬合,就要檢查所選屬性、所確定的屬性層級關(guān)系及所用的認知診斷模型是否合適。
(4)報告分數(shù)和診斷反饋。數(shù)據(jù)分析完成以后,要設(shè)計溝通性強、說明性高的的分數(shù)報告,報告可以分為個體報告和團體報告。個體報告報告學(xué)生在測驗中的總體表現(xiàn),即總體能力水平(定量報告),同時報告學(xué)生對測驗的各認知屬性的掌握情況 (定性報告)。團體報告要給出團體的總體水平及對認知屬性的掌握情況。[36]在分數(shù)報告的同時,針對弱點與缺陷,提供有針對性的補救措施。因此,一個完整的診斷報告至少包含以下信息:學(xué)習(xí)者的知識掌握狀態(tài)和水平、知識或技能的優(yōu)勢、知識或技能的弱勢以及如何對弱勢進行補救學(xué)習(xí)。
(二)語言認知診斷測驗的研究現(xiàn)狀
語言認知診斷的研究范式有二:(1)編制與開發(fā)新的語言認知診斷測驗。(2)在現(xiàn)有語言測驗基礎(chǔ)上,使用新技術(shù),獲取有效的診斷性信息。多數(shù)研究沿著后一種范式進行。在認知屬性確定及屬性層級關(guān)系分析上,研究多采用專家小組評定與口語報告法,通過對已有測驗項目內(nèi)容的評定,確定語言加工所需的知識與能力。在模型選擇上,多采用規(guī)則空間模型對數(shù)據(jù)進行擬合。
規(guī)則空間模型是將在測驗項目上的反應(yīng)劃歸為某種與認知技能相聯(lián)系的屬性掌握模式的統(tǒng)計方法。模型包括兩部分:(1)確定Q矩陣理論,確定可能的屬性掌握模式以及在屬性掌握模式下在項目上的典型反應(yīng)模式;(2)建構(gòu)規(guī)則空間,根據(jù)在測驗項目上的反應(yīng)進行模式判別。[9]模型以特定認知規(guī)則刻畫測驗項目,用認知規(guī)則掌握模式表征認知結(jié)構(gòu)。在運用規(guī)則空間模型診斷學(xué)生的知識狀態(tài)或策略時,通常將單一分數(shù)轉(zhuǎn)化為對試題中涉及的認知過程與技能的掌握概率,將知識、技能和策略定義為規(guī)則或?qū)傩?,不同屬性的組合可以產(chǎn)生不同屬性模式;通過在各項目上的反應(yīng)找出個體的屬性模式,根據(jù)屬性掌握與否的組合診斷出個體的知識結(jié)構(gòu),了解個體在認知過程與技能的哪些方面已經(jīng)具有良好結(jié)構(gòu),哪些部分需要完善,從而進行有針對性的補救教學(xué)。[37]
Buck等人考察了5000名日本被試參加托業(yè)考試 (TOEIC)的情況。先從語言學(xué)的角度確定了27種重要屬性,然后對屬性進行了修改、精簡。經(jīng)過4次RSM分析,確定了16種技能和8種有交互作用的技能組合,這些技能包括綜合分散信息的能力、應(yīng)用相關(guān)內(nèi)容處理文本的能力、在記憶中保存信息并進行推論的能力、利用相關(guān)背景知識處理任務(wù)的能力等。然后,利用這些技能與技能組合構(gòu)建Q矩陣,將91%的被試歸入相應(yīng)的屬性掌握模式,為被試提供診斷性報告。Buck等人運用多元回歸方法驗證結(jié)果,發(fā)現(xiàn)這些屬性解釋了被試表現(xiàn)中97%的變異。[38]Buck等人又研究第二語言測驗 (日本學(xué)生的英語測驗)中聽力理解簡答題。首先,從語言學(xué)的角度分析出完成這些題目所需要的多種技能。經(jīng)過兩次RSM分析,最后確定了15種技能和14種有交互作用的技能組合,將96%的被試成功歸入相應(yīng)的屬性掌握模式,為被試作出診斷分析。[33]Kasai應(yīng)用規(guī)則空間模型分析英語托福測試中的閱讀理解測驗,利用專家評定等方法從托福閱讀理解測驗中分析出16種認知屬性,把屬性劃分為4個類別:(1)與整篇文章相關(guān)的屬性;(2)與位置信息相關(guān)的屬性;(3)與選擇正確選項相關(guān)的屬性;(4)與考試策略相關(guān)的屬性。盡管托業(yè)考試和托??荚囋陂喿x理解測驗上的測試目的、能力要求與篇章設(shè)置不同,但都涉及語言閱讀理解的相關(guān)內(nèi)容。[39]Scott等人使用規(guī)則空間模型對托福閱讀理解考試進行分析,得到的認知屬性與Kasai存在區(qū)別。Scott等人歸納了24種認知屬性,通過分類,總結(jié)出8種認知屬性,分別是:(1)與問題類型相關(guān)的屬性;(2)與文本結(jié)構(gòu)相關(guān)的屬性;(3)與定位必要信息相關(guān)的屬性;(4)與獲得正確選項相關(guān)的屬性;(5)與語言特征相關(guān)的屬性;(6)與測驗形式相關(guān)的屬性;(7)與背景知識相關(guān)的屬性;(8)與高級認知技能相關(guān)的屬性。[40]雖然屬性不同,卻未影響三個研究結(jié)果的準(zhǔn)確性,它們在被試屬性掌握模式上的判歸率都在90%以上,表明規(guī)則空間模型可以用作語言測驗的診斷方法,同時也說明認知屬性界定的重要性。認知屬性不同,可以得到不同的結(jié)果。這就為后來的補救教學(xué)提供了難度:如果認知屬性定義粗糙,則診斷信息作用有限,直接影響補救教學(xué)效果;如果認知屬性定義詳細,數(shù)目繁多,就為診斷模型及數(shù)據(jù)分析提出了較高要求。
在國內(nèi),徐式婧對《使用漢語水平認定考試》中的聽力理解測驗進行認知診斷研究,分析852名被試在C.TEST[A-D級]測驗18個聽力理解題目上的反應(yīng)。首先,綜合了3名對外漢語教學(xué)專家和12名對外漢語專業(yè)研究生的意見,借鑒了前人的研究,確定了被試作答18個聽力理解測驗題目所需的9種聽力理解微技能,利用規(guī)則空間模型將大部分被試成功地歸入68種屬性掌握模式。在此基礎(chǔ)上,為被試提供關(guān)于聽力理解技能掌握情況的診斷報告。[41]王靜運用規(guī)則空間模型對在閱讀理解題目上的反應(yīng)作診斷性評價。他們基于文獻整理、2名對外漢語教學(xué)研究專家的建議以及10名有對外漢語教學(xué)經(jīng)驗的教師的意見,確定了作答全部閱讀理解題目所需的8種閱讀理解微技能,采用軟件對776名被試進行了參數(shù)估計,將被試成功地歸入50種理想的反應(yīng)模式中,歸類比率為90%,最終為被試提供了能表明閱讀理解微技能掌握情況的診斷報告。[42]也有的研究者采用先確定認知屬性再編制診斷測驗的范式。劉慧采用自編測驗的方式,利用規(guī)則空間模型對漢語為第二外語的留學(xué)生漢語顏色詞學(xué)習(xí)情況進行診斷研究。[43]李小蘭結(jié)合運用知識空間理論和規(guī)則空間模型,在專家?guī)椭麓_定了漢語聽力理解技能結(jié)構(gòu),編制了漢語作為第二語言的“中級漢語聽力理解技能測驗”。對306名中級水平的漢語學(xué)習(xí)者施測后,運用分類診斷功能成功地將94%的被試歸類,并探討了技能結(jié)構(gòu)、被試數(shù)量、被試水平對研究結(jié)果可能造成的影響。[44]
規(guī)則空間模型是在語言認知診斷測驗研究中廣泛使用的方法。規(guī)則空間模型實現(xiàn)了認知分析與診斷補救的結(jié)合。但是,在實際應(yīng)用中,使用規(guī)則空間模型也存在著一定的障礙。首先,規(guī)則空間模型的Q矩陣理論十分嚴格。由鄰接矩陣到可達矩陣,再到縮減矩陣、被試屬性矩陣、理想反應(yīng)模式矩陣,每一步的銜接都十分嚴密,對Q矩陣的層次性、順序性、清晰性的要求十分嚴格。這在數(shù)學(xué)等邏輯思維領(lǐng)域容易實現(xiàn),在語言領(lǐng)域就比較困難。其次,規(guī)則空間模型建立的基礎(chǔ)是項目反應(yīng)理論,要根據(jù)項目反應(yīng)理論理論軟件算出每名被試的能力值,因此對樣本量有要求,樣本量小會影響診斷的結(jié)果。再次,規(guī)則空間模型沒有用參數(shù)來刻畫項目與其所測屬性間的關(guān)系。僅用Q矩陣來表明項目測量了何種屬性、未測量何種屬性,并沒有用參數(shù)來說明項目的難易與所測屬性的關(guān)系,項目所測的認知屬性是否完備,在模型中也沒有一個評價的標(biāo)準(zhǔn)。因此,一些研究者嘗試將新的認知診斷模型運用到語言測驗中去。
目前,運用于語言認知診斷測驗的其他模型有DINA模型、屬性層次方法 (AHM)、融合模型 (FM)、廣義診斷模型 (GDM)等。DINA模型克服了規(guī)則空間模型的局限,對屬性的層級關(guān)系要求不嚴格,考慮了學(xué)生在實際解題中可能存在的失誤或猜測成分,形式更加靈活。DINA模型是比較簡單的認知診斷模型,在滿足診斷目的前提下,參數(shù)越簡單,模型擬合就越好。[45]陳艷梅利用了DINA模型,選用PISA的閱讀公開題目,研究初中三年級學(xué)生的語文閱讀能力。在293名被試中,77.1%掌握了閱讀能力的全部三個屬性,17.4%只掌握了部分屬性,5.5%全未掌握。[46]研究從微觀層面對閱讀能力的發(fā)展進行了評價,為教師和學(xué)生提供了指導(dǎo)。融合模型對認知屬性的層級關(guān)系要求亦不嚴格,還可以提供比DINA模型更加豐富的信息。在融合模型的項目反應(yīng)函數(shù)中,包括兩個與能力相關(guān)的參數(shù)αj、θj,分別是技能掌握參數(shù)和對Q矩陣中未指定的重要技能的殘余能力的掌握程度,還包括3個與項目有關(guān)的參數(shù)πi、rik、ci,分別代表項目i的難度參數(shù)、項目i中屬性k的區(qū)分度參數(shù)以及項目i反應(yīng)函數(shù)依賴于Q矩陣之外的其他技能的程度。這些參數(shù)彌補了規(guī)則空間模型的不足。Lee和Sawaki采用擴展的認知診斷模型、融合模型、潛在類別分析模型分析ESL閱讀和聽力測驗的數(shù)據(jù),比較了幾個模型的優(yōu)劣,發(fā)現(xiàn)融合模型是一個很成功的認知診斷模型,符合有效的認知診斷模型應(yīng)具備的三個條件,即對學(xué)生的知識狀態(tài)進行估計、刻畫項目與各屬性的關(guān)系、模型參數(shù)可以識別。[47]Jang應(yīng)用融合模型對LanguEdge閱讀課程測驗進行了研究。首先通過出聲思維分析和測驗項目內(nèi)容分析確定了9種主要的閱讀理解技能。然后根據(jù)確定的9個閱讀技能屬性對LanguEdge閱讀理解測驗題目中所涉及的閱讀技能屬性進行屬性與項目之間的矩陣構(gòu)建,表1是屬性與項目對應(yīng)關(guān)系圖。由表1可見,在使用融合模型對閱讀技能屬性檢驗時,屬性與項目之間的對應(yīng)關(guān)系相對于規(guī)則空間模型而言是松散的。一個項目中涉及到的屬性之間并不需要一個嚴格的層級結(jié)構(gòu)。這為測量語言中并行存在的復(fù)雜認知加工提供了途徑。
表1 Jang(2009)研究中屬性與項目的對應(yīng)關(guān)系
Jang使用融合模型估計被試的閱讀技能掌握模式。通過對后驗掌握模式概率分布的分類,對每一被試的每項閱讀技能,都可以提供掌握 (概率大于0.60)、未掌握 (概率小于0.40)以及不確定 (概率在0.60到0.40之間)三種評定。將結(jié)果匯總,采用掌握概率條形圖形式將最終診斷報告提供給被試。Jang隨后考察了被試對診斷報告的評價。40%的學(xué)生反映報告中的技能掌握模式非常準(zhǔn)確地反應(yīng)了閱讀技能現(xiàn)狀。根據(jù)診斷報告,Jang進行了輔導(dǎo)。通過一段時間輔導(dǎo)后,39%的學(xué)生表示輔導(dǎo)作用非常有效,50%的學(xué)生表示輔導(dǎo)有一定的作用。研究取得了初步的成效,也驗證了融合模型在語言認知診斷測驗中的有效性。[48-49]黃海峰采用融合模型對HSK初、中等考生的數(shù)據(jù)進行診斷分析:采用探索性因素分析提取6個因子,以6個因子作為認知屬性,根據(jù)項目在各因子上的載荷值大小把載荷矩陣轉(zhuǎn)換為項目與屬性關(guān)系的Q矩陣,也取得了較好的結(jié)果。[50]但融合模型的聯(lián)合正確診斷率還不很理想。[51]Douglas研究表明,融合模型的正確診斷率受測驗認知屬性的個數(shù)以及屬性間的相關(guān)程度影響。認知屬性個數(shù)越少,正確診斷率就越高;認知屬性之間的相關(guān)越高,正確診斷率也越高。[52]因此,該模型更適宜于認知屬性不太多 (5個左右)、屬性之間相關(guān)高的認知診斷測驗。除以上兩個模型外,還有人使用廣義診斷模型 (GDM)進行語言診斷測驗。[32][53]廣義診斷模型的優(yōu)點在于使用要求不嚴,適用范圍廣泛,不僅可以分析二分的觀測數(shù)據(jù),還可以分析多分的觀測數(shù)據(jù),既可以分析二分的潛變量,也可以分析順序或連續(xù)的潛變量。
語言是一個復(fù)雜的過程。語言測驗具有自身的特點。研究者在創(chuàng)建新的語言認知診斷模型的同時,也針對語言測驗的特點,開展一些相應(yīng)的研究。在語言測驗中,常使用短文作為測驗內(nèi)容,這就不可避免地會遭遇到含篇章題組形式的項目,進而產(chǎn)生局部依賴。劉文將題組反應(yīng)理論與廣義診斷模型相結(jié)合,探討局部依賴和題組內(nèi)項目數(shù)量對二分廣義診斷模型與多分廣義診斷模型的影響。結(jié)果表明,隨著題組內(nèi)局部依賴程度的增加,診斷的準(zhǔn)確性下降。題組內(nèi)項目的多少對于診斷的準(zhǔn)確性也有影響。[54]
綜上所述,語言認知診斷研究已經(jīng)逐步開展起來。但由于語言現(xiàn)象的復(fù)雜性和統(tǒng)計測量技術(shù)本身的限制,這些研究還處于探索階段,離大規(guī)模的普及還有一定距離。
(一)語言認知診斷測驗研究的難點
語言認知診斷測驗?zāi)壳案嗟赝A粼谘芯亢椭行∫?guī)模實測階段,在大規(guī)??荚囍械膽?yīng)用并不多見。什么原因使語言認知診斷測驗的發(fā)展步履蹣跚?語言認知診斷測驗研究有如下難點:
(1)缺乏可操作的認知理論模型。語言認知診斷研究并不缺乏測量模型,但測量模型與語言認知學(xué)習(xí)理論之間存在著較大的脫節(jié)。復(fù)雜的模型 (如統(tǒng)一模型)雖然能很好地容納語言認知心理研究的結(jié)果,參數(shù)也能精確地解釋心理特質(zhì),但參數(shù)估計等技術(shù)難以解決,常常出現(xiàn)無法識別參數(shù)的情況。簡單的模型 (如DINA)的參數(shù)估計技術(shù)容易解決,但參數(shù)不能很好地解釋心理現(xiàn)象。即便是被譽為最為成功的認知診斷測量模型――融合模型,也不能處理認知屬性太多、屬性之間高度相關(guān)的情況。語言認知心理學(xué)家無法提供可操作的語言認知學(xué)習(xí)理論。以語言習(xí)得為例,較為流行的是聯(lián)結(jié)主義模型。[55]該模型認為,語言習(xí)得是學(xué)習(xí)者通過語言材料獲取語言知識并儲存于心理詞典中。心理詞典中有形、音、義三種表征系統(tǒng),詞匯在心理詞典中呈分布式表征,詞匯在頭腦中不是以單一概念的方式儲存,而是以語義特征、句法特征、語音特征的形式分別儲存在不同的表征系統(tǒng)中。新詞和已有詞匯在語義、字形、語音特征上是否匹配,決定了新詞的學(xué)習(xí)速度。聯(lián)結(jié)主義模型通過特征單元激活、抑制與聯(lián)結(jié)能有效地表達語言行為。聯(lián)結(jié)主義模型可以解釋很多語言現(xiàn)象,其合理性也被計算機模擬證明。但是,將聯(lián)結(jié)主義模型轉(zhuǎn)變?yōu)榭刹僮鞯恼J知屬性以及認知屬性的層級關(guān)系就有困難。在一些認知模型里,有的認知加工成分無法變成認知診斷測驗中可操作的認知屬性。
(2)在現(xiàn)有語言測驗的基礎(chǔ)上提取認知診斷信息存在著“瓶頸”。由于開發(fā)新的語言認知診斷測驗困難重重,多數(shù)研究是在現(xiàn)有語言測驗的基礎(chǔ)上,利用認知診斷技術(shù)分析出有用信息。對這種研究范式,有以下質(zhì)疑:①認知受試題內(nèi)容的影響大,不同的試題可能出現(xiàn)不同認知加工模式,這在閱讀測驗中尤為明顯。閱讀過程嚴重地依賴于文本,受測驗項目編排形式的影響也大。這樣,針對同一認知過程有不同的認知加工模式,這對補救措施安排帶來很大困惑。②原有測驗題目的難度分布。由于原有測驗并非為認知診斷設(shè)計,在項目難度分布上,原有測驗會根據(jù)測驗需求,有意安排測驗難度。例如,在過關(guān)性測驗中,題目的難度會降低,測驗里含有大量的難度低的題目,干擾了認知診斷信息的提取。③原有測驗與認知診斷測驗的編制原理存在著差異。
(3)在定義認知屬性和創(chuàng)建認知屬性層級關(guān)系時具有主觀性。人們廣泛使用專家小組評定法,在同一專家小組內(nèi)部,會出現(xiàn)意見不一致的情況,這就給認知屬性打上了主觀烙印。以周霞和徐式婧研究為例[41][56],對象都為漢語二語聽力理解測驗,能力水平要求類似。在定義認知屬性和創(chuàng)建認知屬性層級關(guān)系時,都采用專家小組評定操作程序,但結(jié)果不同,前者確定了9種認知屬性,后者確定了8種認知屬性,認知屬性中有4種不一致,屬性的層級關(guān)系也不一致。究竟哪一個真實描繪了漢語二語聽力理解能力的結(jié)構(gòu)?在下結(jié)論時需要慎重。
(4)補救措施的合理性需要證實。Jang對考生和教師的訪談發(fā)現(xiàn),不足主要集中在診斷報告上。一位教師對補救措施提出了質(zhì)疑,認為盡管知道學(xué)生的優(yōu)勢和缺陷,但由于學(xué)生的閱讀能力存在著差異,教師無法也無時間對每一個學(xué)生做個別輔導(dǎo)。一些診斷信息過于細微,偏于認知,缺乏操作性,不具有教學(xué)指導(dǎo)意義。有考生咨詢,在診斷報告上,已經(jīng)掌握的部分,是否不再需要進行同類知識點的測量以及相同能力的培養(yǎng)?有的考生質(zhì)疑認知屬性的劃分,認為閱讀技能不能被區(qū)分得如此細致,因為很多閱讀需要將多種技能進行綜合。[49]
另外,語言認知診斷測驗在實施中還存在認知屬性的粒度、題目數(shù)量與技能的對應(yīng)關(guān)系、同一屬性需要測試多少題目、紙筆測驗題目無法涵蓋所有認知屬性等問題。
(二)語言認知論斷未來的研究方向
盡管語言認知診斷測驗還存在著難點或問題,但是,作為一種新興的測驗理論,仍然具有許多優(yōu)點和光明前景。未來研究應(yīng)該做好如下工作:
(1)加強認知心理學(xué)與心理測量學(xué)的結(jié)合。語言認知診斷測驗的未來在于第一種研究范式,它將給語言測驗理論和應(yīng)用帶來革命性的進展。隨著認知心理學(xué)研究的深入,可以用于認知診斷的語言認知模型會不斷涌現(xiàn)。應(yīng)該結(jié)合語言學(xué)習(xí)過程,對語言認知模型進行可操作性的修改和補充。
(2)開發(fā)適用性強的認知診斷測量模型和計算機統(tǒng)計軟件。在進行語言認知診斷研究時,會遇到語言認知診斷模型的晦澀難懂和計算機統(tǒng)計軟件紛繁復(fù)雜的問題,巨大的模型與冗長的程序往往會讓認知心理學(xué)家望而卻步。因此,應(yīng)該致力開發(fā)出實用性強的測量模型與計算機程序。
(3)加強診斷報告的設(shè)計。語言認知診斷測驗的價值體現(xiàn)在對個體補救學(xué)習(xí)的幫助上。診斷信息只告訴個體“哪里弱”,補救報告要告訴個體“如何強”。研究者要結(jié)合補救教學(xué)的實際,針對診斷出的問題,設(shè)計出操作性強、指導(dǎo)性高的補救意見。
(4)加強語言認知診斷測驗與計算機輔助測驗、計算機自適應(yīng)測驗的聯(lián)合。以往的語言測驗,往往未涵蓋語言認知的整個過程,計算機技術(shù)為語言認知診斷測驗提供了廣闊的操作平臺。借助計算機技術(shù),可以克服紙筆測驗的缺陷,如測驗內(nèi)容無法覆蓋所有知識點,補救措施滯后導(dǎo)致補救效果低等。計算機技術(shù)還可為診斷測驗提供非語言的卻影響語言過程的診斷信息,如注意力、動機、文化差異等,還可以提供項目反應(yīng)時間、答案選項變動等多種信息。
(5)加強群體的語言認知診斷研究。Tatsuoka等應(yīng)用RSM比較20多個國家的8年級學(xué)生參加TIMSS-R數(shù)學(xué)考試情況。由專家確定完成測驗所需的23種技能,99.5%的被試被成功歸類,并為被試作出診斷性評價,發(fā)現(xiàn)不同國家的學(xué)生在技能掌握和認知上有很大差異。語言具有深刻的民族性。[57]Worlf認為,語言影響認知。[58]因此,可以利用語言認知診斷測驗研究使用不同語言、有不同文化背景的人的語言認知學(xué)習(xí),揭示語言認知的群體特征。
總之,認知診斷理論是為了彌補標(biāo)準(zhǔn)測驗理論在描述個體知識與技能掌握方面的不足而發(fā)展起來的新一代測驗理論。[5]認知機制與測量模型是認知診斷理論發(fā)展的兩大動力。今后,要將語言認知心理學(xué)的最新成果進行可操作化轉(zhuǎn)變,根據(jù)語言測驗特點,選擇合適的認知診斷模型,將語言認知診斷測驗研究推向深入,開創(chuàng)語言測驗的美好未來。
參考文獻:
[1]Gao L.,Rodgers T.Cognitive-psychometric modeling of the MELAB reading items[N].Paper presented at the annual meeting of the National Council on Measurement in Education,Chicago,2007.
[2]Gierl,M.,Leighton,J.P.,&Hunka,S.M.Exploring the logic of Tatsuoka’s rule-space model for test development and analysis[J].Educational Measurement:Issues and Practices,2000,(3).
[3]National Research Council.Knowing what students know:The science and design of educational assessment[M].Washington,DC:National Academy Press,2001.
[4]桂詩春.認知與語言測試.基礎(chǔ)教育外語教學(xué)研究[J].2003,(12).
[5]Mislevy R.J.Foundations of a new test theory[A].In:N Frederiksen et al.Eds.Test theory for a new generation of tests[C].Hillsdale NJ:LEA.19-39.
[6]Snow,R.Lohman,D.Implications of cognitive psychology for educational measurement[A].In Linn(ed):Educational Measurement,[C].3 Edition.N.Y:ColierMacMillen,1989.
[7]Fischer,G.H.The linear logistic test model as an instrument in educational research[J].Acta Psychologica,1973,(6).
[8] Fischer,G.H.Logistic latent trait modelswith linear constraints[J].Psychometrika,1983,(1).
[9]Tatsuoka,K.K.Rule space:An approach for dealing with misconceptions based on item response theory[J].Journal of Educational Measurement,1983,(4).
[10]Misley,R.J.,Verhelst,N.Modeling item responses when different subjects employ different solution strategies.Technical Report[N].RR-87-47-ONR,Educational Testing Service,Princeton,NJ,1987.
[11]Baker,D.Language Testing:A Critical Survey and Practical Guide[J].London:Edward Ar-nold,1989.
[12]Lado R.Language Testing:the construction and use of foreign language tests[M].London:Longm an.
[13]李傳益.語言能力觀對語言測試的影響.咸寧學(xué)院學(xué)報[J].2009,(5).
[14]Oller,J.W.Issues in Language Testing Research[M].Rowley,Mass:Newbury House,1983.
[15]Hymes,D.Foundations in sociolinguistics:an ethnographic approach[M].London:Tavistock publications,1974.
[16]Canale,M.,Swain,M.Theoretical bases of communicativ eapproaches to second language teaching and testing[J].Applied linguistics,1980,(1).
[17]Bachman,L.F.,Palmer,A.S.Language testing in practice[M].Oxford:Oxford University Press,1996.
[18]Lewy,A.Postmodernism in the field of achievement testing[J].Studies in Educational Evaluation,1996,(22).
[19]Grenz,S.J.A Primer on Postmodernism[M].Michigan,US:William B.Eerdmans Publishing Co,1996.
[20]Rosenau,P.M.Post-Modernism and the Social Sciences:Insights,Inroads and Intrusions [M].Princet on:Princeton University Press,1992.
[21]Alderson,J.C.Assessing Reading[M].Cambridge:Cambridge University Press,2000.
[22]Rupp,A.A.Unique characteristics of cognitive diagnosis models[N].Paper presented at the annual meeting of the National Council on Measurement in Education,Chicago,2007.
[23]McNamara,T.Language assessment as social practice:Challenges for research[J].Language Testing,2001,(18).
[24]Kane,M.T.Current concerns in validity theory[J].JEM,2001,(4).
[25]Anastasi,A.Psychological Testing(6th ed.)[M].New York:Macmillan,1988.
[26]Messick,S.Validity of psychological assessment:Validation of inferences from person’s responses and performance as scientific inquiry into scoring meaning[J].American Psychologist,1995,(9).
[26]Bachman,L.F.Statistical Analyses for Language Assessment[M].Cambridge:CUP,2004.
[27]Weir,C.J.Language Testing and Validation[M].Palgrave:Macmillan,2005.
[28]Embretson,S.E.Cognitive psychology applied to testing[A].In F.T.Durso(eds.),Handbook of applied cognition[C].New York:Wiley&Sons,1999.
[29]Fu,J.,Li,Y.Cognitively diagnostic psychometric models:An integrative review[N].Paper presented at the annual meeting of the National Council on Measurement in Education,Chicago,2007.
[30]Almond,R.G.,Yan,D.,Matukhin,A.,&Chang,D.StatShop testing(ETS Research Memorandum No.RM-06-05)[M].Princeton,NJ:Educational Testing Service,2006.
[31]DiBello,L.,&Stout,W.Arpeggio documentation and analyst manual(Ver.3.1.001)(Computer software)[M].St.Paul:MN:Assessment Systems Corporation,2008.
[32]von Davier,M.Multidimensional latent trait modeling(mdltm)(Computer software)[M]. Princeton,NJ:Educational Testing Service,2006.
[33]Buck,G.,Tatsuoka,K.K.Application of the rule-space procedure to language testing:Examining attributes of a free response listening test[J].Language Testing,1998.
[34]Leighton,J.P.,Gierl,M.J.Defining and evaluating models of cognition used in educational measurement to make inferences about examinees’thinking processes[J].Educational Measurement:Issues and Practices,2007,(2).
[35]Leighton,J.P.,Gierl,M.J.,&Hunka,S.The attribute hierarchy method for cognitive assessment:A variation on Tatsuoka’s rule-space approach[J].Journal of Educational Measurement,2004,(41).
[36]涂冬波,漆書清,戴海琦,蔡艷,丁樹良.教育考試中的認知診斷評估,考試研究[J]. 2008,(4).
[37]余嘉元.運用規(guī)則空間模型識別解題中的認知錯誤[J].心理學(xué)報,1995,(2).
[38]Buck,G.,Tatsuoka,K.,&Kostin,I.The subskills of reading:Rule-space analysis of amultiple-choice test of second language reading comprehension[J].Language Learning,1997,(47).
[39]Kasai,M.Application of the rule-space model to the reading comprehension section of the Test of English as a Foreign Language(TOEFL)[D].Unpublished doctoral dissertation,University of Illinois at Urbana-Champaign,1997.
[40]Scott,H.S.Cognitive diagnosis perspectives of a second language reading test[D].Unpublished doctoral dissertation,University of Illinois at Urbana-Champaign,1998.
[41]徐式婧.C.TEST聽力理解測驗的診斷性評價研究[D].碩士學(xué)位論文.北京語言大學(xué),2007.
[42]王靜.C.TEST閱讀理解測驗的診斷性評價研究[D].碩士學(xué)位論文.北京語言大學(xué),2008.
[43]劉慧.規(guī)則空間模型在留學(xué)生漢語顏色詞掌握模式診斷中的應(yīng)用[D].碩士學(xué)位論文.北京語言大學(xué),2006.
[44]李小蘭.知識空間理論與規(guī)則空間模型在漢語聽力理解技能測驗編制中的應(yīng)用[D].碩士學(xué)位論文.北京語言大學(xué),2006.
[45]Dibello,L.V.,&Stout,W.Guest Editors’Introduction and Overview:IRT-Based Cognitive Diagnostic Models and Related Methods[J].Journal of Educational Measurement,2007,(4).
[46]陳艷梅.初中三年級學(xué)生閱讀能力評價研究[D].碩士學(xué)位論文.江西師范大學(xué),2009.
[47]Lee,Y.W.,&Sawaki,Y.An application of three cognitive diagnosis models to ESL reading and listening assessments:Latent class analysis,general diagnostic model,and fusion model[Z].Manuscript in preparation,2008.
[48]Jang,E.E.A validity narrative:Effects of reading skills diagnosis on teaching and learning in the context of NG TOEFL[D].Unpublished doctoral dissertation,University of Illinois at Urbana-Champaign,2005.
[49]Jang,E.E.Cognitive diagnostic assessment of L2 reading comprehension ability:Validity arguments for Fusion Model application to LanguEdge assessment[J].Language Testing,2009,(1).
[50]黃海峰.基于融合模型的漢語作為第二語言閱讀之認知診斷研究.博士學(xué)位論文[D].北京語言大學(xué),2010.
[51]Hartz,S.A Bayesian framework for the unified model for assessing cognitive abilities:Blending theory with practicality[D].Unpublished doctoral dissertation,University of Illinois,Urbana-Champaign,2002.
[52]Douglas,J.,de la Torre,J.,Chang,H.,Henson,R.,&Templin,J.Skills diagnosis with latent variable models[M].Symposium presented at the annual meeting of the National Council on Measurement in Education,San Francisco,CA,2006.
[53]Von Davier,M.A general diagnostic model applied to language testing data(ETS Research Rep [Z].No.RR-05-16).Princeton,NJ:Educational Testing Service,2005.
[54]劉文.題組認知診斷方法模擬與初中語文測驗的認知診斷研究[D].博士學(xué)位論文.北京師范大學(xué),2011.
[55]McClelland,J.,Rumelhart,D.An interactive activation model of context effects in 1etter perception:Part 1.An account of basic findings[J].Psychological Review,1981,88.
[56]周霞.HSK(中級)聽力理解測驗的診斷性研究[D].碩士學(xué)位論文.北京語言大學(xué),2009.
[57]Tatsuoka,K.K.,Corter,J.E.,&Tatsuoka,C.Patterns of Diagnosed Mathematical Content and Process Skills in TIMSS-R Across a Sample of 20 Countries[J].American Educational Research Journal.2004,(4).
[58]Whorf,B.L.Language,thought,and reality:Selected writing of Benjamin Lee Whorf[M]. New York:Wiley,1956.
(責(zé)任編輯劉祖鑫)
A Review on the Research of Cognitive Diagnostic Studies to Language Assessment
ZHANG Qirui&BIAN Yufang
(Institute of Criminology,People’s Public Security University of China,100038,Beijing;National Key Laboratory of Cognitive Neuroscience and Learning,Beijing Normal University,100875,Beijing)
Abstract:Cognitive Diagnostic Assessment(CDA)is a new developing technology in cognition psychology and psychological measurement.Based on the theory of cognition,CDA could provide diagnostic information,such as the student’s mastery level about some knowledge or skills,which can be used to adopt remedial measures and improve learning efficiency.Cognitive diagnosis assessment has grown by leaps and bounds.Its application in language assessment conforms to the latest trend of thought and technical innovation in the area of language assessment.However,due to the complexity of language itself,as well as the limitations of cognitive diagnostic measurement model,Cognitive diagnostic studies of language assessment needs further development.
Key words:language.assessment.cognitive diagnostic.
中圖分類號:H0
文章標(biāo)識碼:A
文章編號:1671-7406(2016)02-0071-09
*收稿日期:2016-01-16
作者簡介:張啟睿 (1982—),男,中國人民公安大學(xué)犯罪學(xué)院講師、博士,研究方向:教育學(xué)。