陸 璐 趙少勇 張年寬
隨著我國基礎(chǔ)教育課程改革的不斷深入, 新時代的教育聚焦于培養(yǎng)具有社會競爭力的個體。 個體的核心素養(yǎng)水平?jīng)Q定著其生存的競爭能力[1]。 學(xué)生發(fā)展核心素養(yǎng),主要是指學(xué)生應(yīng)具備的、能夠適應(yīng)終身發(fā)展和社會發(fā)展需要的必備品格和關(guān)鍵能力。 中國學(xué)生發(fā)展核心素養(yǎng)以培養(yǎng) “全面發(fā)展的人” 為核心,分為文化基礎(chǔ)、自主發(fā)展和社會參與三個方面。 具體包括人文底蘊(yùn)、科學(xué)精神、學(xué)會學(xué)習(xí)、健康生活、責(zé)任擔(dān)當(dāng)和實(shí)踐創(chuàng)新六大素養(yǎng)。
核心素養(yǎng)作為一個宏觀概念包括了眾多方面,想要使其更好地落地生根, 就必須始終貫徹以學(xué)生為主體,始終立足于學(xué)生成長的需要。 然而,學(xué)生的認(rèn)知水平參差不齊, 對每個學(xué)科知識的掌握情況也有很大差別。 傳統(tǒng)的測驗(yàn)只能提供一個分?jǐn)?shù)或者能力值, 雖然分?jǐn)?shù)在一定程度上可以提供診斷依據(jù),但是相同分?jǐn)?shù)的學(xué)生往往具有不同的認(rèn)知結(jié)構(gòu)和認(rèn)知過程[2]。 認(rèn)知診斷測評(cognitive diagnostic assessment, CDA)的出現(xiàn)很好地彌補(bǔ)了這一缺陷,有助于人們更深入地了解隱藏在學(xué)生分?jǐn)?shù)背后的認(rèn)知結(jié)構(gòu)、 加工技能和認(rèn)知過程等心理內(nèi)部結(jié)構(gòu)之間的差異, 從而幫助教師為學(xué)生提供更具有針對性的補(bǔ)救措施和教學(xué)方案[3],進(jìn)一步達(dá)到提升學(xué)生核心素養(yǎng)的目標(biāo)。
認(rèn)知診斷理論是新一代心理與教育測驗(yàn)理論的核心, 是認(rèn)知心理學(xué)與現(xiàn)代測量學(xué)相結(jié)合的產(chǎn)物[4],已經(jīng)成為心理學(xué)、 測量學(xué)和教育學(xué)等學(xué)科的研究熱點(diǎn),引起了國內(nèi)外研究者的廣泛關(guān)注。 要對學(xué)生進(jìn)行更有效、更準(zhǔn)確的認(rèn)知診斷測評,就必須借助科學(xué)的認(rèn)知診斷測驗(yàn)以及選擇合適的認(rèn)知診斷模型。目前關(guān)于認(rèn)知診斷領(lǐng)域的研究主要集中在以下兩個方面:(1)理論基礎(chǔ)研究,即認(rèn)知診斷模型(cognitive diagnostic models, CDMs)的開發(fā)及拓展;(2)實(shí)證應(yīng)用研究, 即研究者在理論研究的基礎(chǔ)上采用實(shí)證數(shù)據(jù)對被試進(jìn)行測評。
以下將分別介紹目前常見的認(rèn)知診斷模型和認(rèn)知診斷應(yīng)用研究的現(xiàn)狀。
認(rèn)知診斷模型是實(shí)現(xiàn)認(rèn)知診斷功能必不可少的核心環(huán)節(jié),它將認(rèn)知變量融入心理計(jì)量模型,成功連接了個體的外部作答反應(yīng)和內(nèi)部認(rèn)知屬性, 從而實(shí)現(xiàn)對被試內(nèi)部心理加工過程的分析, 進(jìn)而提供具體的認(rèn)知診斷信息。 每個認(rèn)知診斷模型都是基于某些既定的假設(shè), 不同的認(rèn)知診斷模型具有其各自的特點(diǎn)和適用條件, 研究者需要根據(jù)各自研究的特點(diǎn)(如計(jì)分方式、屬性水平等)選擇或者建構(gòu)適當(dāng)?shù)恼J(rèn)知診斷模型,CDMs 的合理性直接決定了認(rèn)知診斷測評結(jié)果的準(zhǔn)確性及有效性[5]。 至今,國內(nèi)外的研究者已經(jīng)根據(jù)不同的研究需要開發(fā)出了眾多認(rèn)知診斷模型[6,7]。
較早被研究者用來進(jìn)行認(rèn)知診斷研究的模型是線性邏輯斯諦克特質(zhì)模型(linear logistic trait model,LLTM)[8],LLTM 是在 Rasch 模型[9]的基礎(chǔ)上發(fā)展出來的, 與單維的Rasch 模型具有相同的基本形式。 此外,還有一個具有開創(chuàng)意義的認(rèn)知診斷方法,即規(guī)則空間方法(rule space methodology,RSM)[10],其強(qiáng)調(diào)的Q 矩陣?yán)碚摚≦-matrix theory)建立了項(xiàng)目與屬性之間的關(guān)系, 將不可觀察的認(rèn)知屬性轉(zhuǎn)化為項(xiàng)目反應(yīng)模式,Q 矩陣?yán)碚撎岢龊缶统蔀檎J(rèn)知診斷研究中的核心理論, 隨后開發(fā)的認(rèn)知診斷模型很多都是基于Q 矩陣?yán)碚摌?gòu)建的。 LLTM 和RSM 被認(rèn)為是兩個基礎(chǔ)性的認(rèn)知診斷模型[11],后續(xù)發(fā)展出來的許多認(rèn)知診斷模型均是以這兩個模型為基礎(chǔ)。例如,多成分潛在特質(zhì)模型(multicomponent latent trait model, MLTM)[12]和一般潛在特質(zhì)模型(general latent trait model, GLTM)[13]等多個潛在特質(zhì)模型均是在LLTM 的基礎(chǔ)上發(fā)展而來; 而統(tǒng)一模型 (unified model, UM)[14]、 融合模型(fusion model, FM)[15]和屬性層次方法(attribute hierarchy methodology, AHM)[16]等模型均是在 RSM 的基礎(chǔ)上發(fā)展出來的。
根據(jù)不同的研究需要及理論假設(shè), 研究者陸續(xù)開發(fā)了一系列的認(rèn)知診斷模型。 除了上述提到的幾個以外,常見的還有DINA 模型(deterministic input,noisy “and” gate model)[17,18]、DINO 模型(deterministic input, noisy “or” gate model)[19]、LCDM (log-linear CDM)[20]、ACDM(additive CDM)[21]等。 其中,DINA 模型具有參數(shù)簡單、計(jì)算簡便且易于理解的優(yōu)點(diǎn),是應(yīng)用最廣泛的認(rèn)知診斷模型之一, 眾多研究者針對DINA 模型的不同方面進(jìn)行了相應(yīng)的拓展。 有研究者在DINA 模型的基礎(chǔ)上考慮高階成分在模型中的潛在作用, 發(fā)展出高階 DINA 模型 (high-order DINA model, HO-DINA model)[22]。 針對具有多種解題方法的題目, 也有研究者提出了多策略DINA 模型(multiple-strategy DINA model, MS-DINA)[23]。 為了彌補(bǔ)DINA 模型在診斷過程中不考慮屬性的層級關(guān)系而導(dǎo)致屬性判準(zhǔn)率較低的缺陷, 研究者開發(fā)了基于屬性層級關(guān)系的 DINA 模型,即 DINA_HC 模型[24]。 還有研究者提出了飽和模式的DINA 模型(generalized DINA, G-DINA)[25], 該模型在特定的約束條件下可以轉(zhuǎn)換成DINA 模型、DINO 模型或其他約束模型。此外, 考慮到多個時間點(diǎn)的測量結(jié)果可以對個體的發(fā)展進(jìn)行更全面的診斷, 因此縱向數(shù)據(jù)的重要性得到了研究者的關(guān)注, 然而現(xiàn)有的大部分CDMs 均不能處理縱向數(shù)據(jù), 因此有研究者在DINA 模型的基礎(chǔ)上開發(fā)出了縱向DINA 模型 (longitudinal DINA model, Long-DINA model), 以期可以更好地對縱向數(shù)據(jù)進(jìn)行處理[26]。
雖然目前研究者們已經(jīng)開發(fā)或拓展出了數(shù)量眾多的認(rèn)知診斷模型, 然而較早的CDMs 大多僅適用于 0-1 計(jì)分的二級評分?jǐn)?shù)據(jù) (dichotomous data),適用于多級評分?jǐn)?shù)據(jù)(polytomous data)的CDMs 較少。這種二級計(jì)分的數(shù)據(jù)通常只適用于填空題、 選擇題或者判斷題。 然而,在實(shí)際的教育情境中,大部分學(xué)科的試卷往往還有其他題型,如計(jì)算題、綜合題、作圖題等, 這些比較復(fù)雜的題型無法簡單地采用二級計(jì)分的方式(0-1)來評分。 雖然在分析數(shù)據(jù)時,可以根據(jù)一定的規(guī)則將多級評分的數(shù)據(jù)轉(zhuǎn)換成二級計(jì)分的形式,但是該做法會丟失部分?jǐn)?shù)據(jù)信息。 因此,為了更好地滿足現(xiàn)實(shí)的教育需求, 不少研究者對多級評分的CDMs 進(jìn)行了探索與研究。
其中, 有研究者在傳統(tǒng)二級評分DINA 模型的基礎(chǔ)上提出了多級評分DINA 模型(polytomous DINA model, P-DINA model)[27]。 由于 P-DINA 模型傾向于將被試得分歸為0 分或滿分, 因此有研究者在P-DINA 模型的基礎(chǔ)上對其進(jìn)行優(yōu)化并提出了rPDINA 模型(revised P-DINA model),優(yōu)化后的模型在一定程度上克服了該缺陷[28]。 還有研究基于PDINA 模型的拓展思路提出了多級評分的HO-DINA模型[29]以及多級評分的DINO 模型(polytomous DINO model, P-DINO model)[30]等。 此外,還有研究者基于Tatsuoka(1995)的規(guī)則空間方法拓展出了多級評分RSM[31];Sun 等人基于廣義距離判別法(generalized distance discriminating method, GDD)[32]提出了多級評分的廣義距離判別法 (GDD method for test with polytomous response , GDD-P)[33];祝玉芳等人在多策略認(rèn)知診斷方法 (multiple-strategies cognitive diagnosis method, MSCD)的基礎(chǔ)上拓展出了多級評分?jǐn)?shù)據(jù)的 MSCD[34];Ma 和 de la Torre 提出了可以處理多級評分?jǐn)?shù)據(jù)的順序反應(yīng)G-DINA 模型(sequential GDINA model)[35]。 近期還有不少研究者為滿足研究或現(xiàn)實(shí)需要, 提出新的多級評分CDMs, 例如GPDM(general polytomous diagnosis model)[36]和可以處理多策略項(xiàng)目多級評分?jǐn)?shù)據(jù)的診斷樹模型(diagnostic tree model, DTM)[37]等, 進(jìn)一步豐富了多級評分CDMs 及其應(yīng)用。
同樣地,在屬性的水平劃分上,較早的CDMs 幾乎都屬于二分屬性(dichotomous attributes)的范疇,沒有考慮多分屬性(polytomous attributes)的情況,即認(rèn)為被試對屬性的掌握情況只有兩種, 即0 =“未掌握”/1 =“掌握”;項(xiàng)目對屬性的考查情況也只有兩種,即 0 =“未考查”/1 =“考查”。 然而,被試對某一知識點(diǎn)(屬性)的掌握情況通常無法簡單地歸為 “掌握” 或“未掌握”, 對被試的屬性掌握情況進(jìn)行多水平劃分更加符合實(shí)際情境。例如,《義務(wù)教育的課程標(biāo)準(zhǔn)》使用 “了解、理解、掌握、運(yùn)用” 等術(shù)語表述學(xué)習(xí)活動結(jié)果目標(biāo)的不同水平;PISA 2015 的科學(xué)素養(yǎng)測試框架將認(rèn)知屬性的掌握水平分為 “低水平、中等水平和高水平”[38];TIMSS 2015 的科學(xué)認(rèn)知框架也將屬性的掌握程度從低到高分為“了解、應(yīng)用和推理” 三種水平[39]。
因此,為滿足現(xiàn)實(shí)需求,研究者們提出了多分屬性的概念[40,41], 并且提出了順序類別屬性編碼(ordered category attribute coding, OCAC)[42]的方法,以期可以開發(fā)出更加適合實(shí)際教育情景的多分屬性CDMs。 例如,Karelitz 在 OCAC 的框架下提出了 OCAC-DINA 模型[43];von Davie 提出的 GDM(general diagnostic model)既適用于二分屬性的情景,也適用于多分屬性的情境[44];Chen 和de la Torre 基于GDINA 模型提出了可處理多分屬性數(shù)據(jù)的pG-DINA(polytomous generalized DINA)模型[45];后續(xù),蔡艷和涂冬波基于該拓展思路在rRUM(reduced reparameterized unified model)[46]和 DINA 模型的基礎(chǔ)上分別拓展出了 PA-rRUM (polytomous attributes rRUM)和PA-DINA(polytomous attributes DINA)模型[47];詹沛達(dá)、邊玉芳和王立君對pG-DINA 模型的約束模型進(jìn)行了重參數(shù)化(reparametrized),重參數(shù)化后的模型(i.e., RPa-DINA 模型和 RPa-DINO 模型)相比原模型更易于研究者和讀者的理解與應(yīng)用, 可以在一定程度上降低多分屬性CDMs 的實(shí)踐應(yīng)用難度[48]。Templin 和Bradshaw 在已有的診斷分類模型(diagnostic classification models, DCM) 基礎(chǔ)上提出了可處理多分屬性的DCM (diagnostic classification models for polytomous attributes)[49]。 近期還有研究者將高階潛在結(jié)構(gòu)模型 (high order latent structural model,high-order LSM)與RPa-DINA 模型進(jìn)行融合,開發(fā)出了可處理多分屬性的高階LSM (partial mastery,higher-order LSM for polytomous attributes)[50]。
綜合以上的論述可以看出, 目前研究者們已經(jīng)在傳統(tǒng)CDMs 的基礎(chǔ)上分別拓展出了多級評分的CDMs 和多分屬性的CDMs,相比之前那些只能處理二級評分及二分屬性數(shù)據(jù)的傳統(tǒng)CDMs 更加符合實(shí)際的教育情境。 然而,目前的多分屬性CDMs 均是在二級評分CDMs 基礎(chǔ)上拓展而來的, 而現(xiàn)實(shí)教育環(huán)境中存在同時具有多分屬性和需要多級評分題目的情境, 此時現(xiàn)有的多分屬性CDMs 就顯得 “力不從心” 了。 雖然可以根據(jù)一定的規(guī)則將多級評分?jǐn)?shù)據(jù)轉(zhuǎn)化為二級評分?jǐn)?shù)據(jù), 但是該做法會造成數(shù)據(jù)信息的丟失。 如果能夠?qū)⒍喾謱傩缘腃DMs 進(jìn)行多級評分拓展, 使模型在考慮多分屬性的同時又能夠處理多級評分?jǐn)?shù)據(jù), 那么研究者就可以利用該模型從被試的作答數(shù)據(jù)中得到更全面、準(zhǔn)確的診斷信息。 因此有研究對多分屬性多級評分CDMs 進(jìn)行了初步探索與研究。
昌維將RPa-DINA 模型進(jìn)行了多級評分拓展,新模型簡稱為PRPa-DINA 模型[51]。 該模型具有可以同時處理多分屬性多級計(jì)分與二分屬性二級計(jì)分?jǐn)?shù)據(jù)的優(yōu)點(diǎn)。雖然Karelitz 指出在使用OCAC 對屬性的各個水平進(jìn)行編碼時, 多分屬性的水平與二分屬性之間存在一定的對應(yīng)關(guān)系:K 個多分屬性相當(dāng)于個二分屬性,可以將多分屬性轉(zhuǎn)化為二分屬性之后, 使用更簡單的二分屬性模型對數(shù)據(jù)進(jìn)行處理[52]。 詹沛達(dá)等人也指出多分屬性與二分屬性之間可以進(jìn)行等價轉(zhuǎn)換[53]。 然而,隨后有研究者在對比了二分屬性和多分屬性之后發(fā)現(xiàn), 當(dāng)多分屬性的個數(shù)不超過3 個時, 可以考慮將多分屬性轉(zhuǎn)化成二分屬性,采用相對簡單的二分屬性模型;但當(dāng)多分屬性個數(shù)超過3 個時, 多分屬性模型對被試能力估計(jì)更為準(zhǔn)確[54]。 在實(shí)際教育情境中,大部分學(xué)科的知識點(diǎn)(屬性)都是具有多種水平的,實(shí)踐研究中多分屬性的個數(shù)很可能不止3 個,因此采用多分屬性的CDMs 是非常有必要的。 PRPa-DINA 模型的數(shù)學(xué)表達(dá)式如下:
其中,Pnit 表示被試n 在項(xiàng)目i 上恰得t 分的概率;P*nit表示被試n 在該項(xiàng)目i 上得 t 分以及 t 分以上的概率;P*ni(t+1)表示被試 n 在該項(xiàng)目 i 上得(t+1)分及以上的概率;sit 表示被試在項(xiàng)目i 上的潛在得分為t分,而實(shí)際得分小于t 分的概率;git 表示被試在項(xiàng)目i 上的潛在得分為t 分,而實(shí)際得分大于t 分的概率;表示被試n 在項(xiàng)目i 上的潛在作答(只有當(dāng)被試n 對項(xiàng)目i 所考查的全部屬性的掌握水平都大于/等于項(xiàng)目 i 對屬性的考查水平時,ηni=1;否則,ηni=0);ωnik表示被試n 在項(xiàng)目i 中屬性k 上的潛在作答(當(dāng)被試n對屬性k 的掌握水平大于/等于項(xiàng)目i 對屬性k 的考查水平時,ωnik=1;否則,ωnik=0);q*ik表示項(xiàng)目 i 是否考查了屬性k;αnk表示被試n 對屬性k 的掌握水平。
值得注意的是,被試在項(xiàng)目上的得分增高,失誤參數(shù)和猜測參數(shù)的變化趨勢不一樣。 失誤參數(shù)呈遞增趨勢,Sit≤Si,(t+1), 即假設(shè)被試掌握了項(xiàng)目 i 考查的所有屬性,那么其在t 分上的失誤概率會小于或等于(t+1)分上的失誤概率,可以理解為被試更容易在高分上表現(xiàn)出失誤。 猜測參數(shù)呈遞減趨勢,,即被試如果沒有全部掌握項(xiàng)目i 考查的所有屬性,那么其在t分上的猜測概率大于或等于(t+1)分上的猜測概率,可以理解為取得低分的被試更有可能是猜對的。
以上從評分方式(二級計(jì)分/多級計(jì)分)和屬性的劃分水平(二分屬性/多分屬性)兩個方面對現(xiàn)有的常用認(rèn)知診斷模型進(jìn)行了介紹, 這些模型的簡單分類概括及其各自的特點(diǎn)(適用條件)如表1 所示。
表1 常用認(rèn)知診斷模型及特點(diǎn)
如前所述, 目前研究者對認(rèn)知診斷的研究主要可以分為兩個部分, 一部分集中在認(rèn)知診斷模型的開 發(fā) 和 拓 展 上 (e.g., Chen & de la Torre, 2013;Chen, de la Torre, & Zhang, 2013; de la Torre,2009; de la Torre & Douglas, 2004; Hou, de la Torre, & Nandakumar, 2014; Templin & Bradshaw,2013; Zhan, Wang, Jiao, & Bian, 2018; 詹沛達(dá),陳平, 邊玉芳, 2016)[55], 另一部分就是認(rèn)知診斷的實(shí)證應(yīng)用研究。 目前,認(rèn)知診斷已經(jīng)被廣泛地應(yīng)用于學(xué)科知識測評、 語言技能評估和精神障礙的診斷等多個領(lǐng)域。
將認(rèn)知診斷應(yīng)用到學(xué)科知識測評領(lǐng)域的研究是最多的。 Tatsuoka 首次提出RSM 后就將其運(yùn)用到數(shù)學(xué)加減法的認(rèn)知診斷中[56],隨后出現(xiàn)了眾多研究者將認(rèn)知診斷應(yīng)用于測評關(guān)于數(shù)學(xué)的各種知識技能中。 例如,de la Torre 等人提出了高階潛在特質(zhì)模型(Higher-order latent trait models), 并將其應(yīng)用到分?jǐn)?shù)減法的測評研究中[57];Birenbaum 等人將RSM 應(yīng)用到TIMSS-R 中八年級數(shù)學(xué)部分的診斷評估[58];在國內(nèi),學(xué)者余嘉元較早地將RSM 應(yīng)用到數(shù)學(xué)中不等式知識的評估中, 以期可以識別學(xué)生在解題過程中的認(rèn)知錯誤[59];康春花等人編制了小學(xué)數(shù)學(xué)應(yīng)用題和小學(xué)數(shù)學(xué)的圖形與幾何的認(rèn)知診斷測驗(yàn)[60,61]。 除了將認(rèn)知診斷應(yīng)用到數(shù)學(xué)學(xué)科, 英語學(xué)科的認(rèn)知診斷研究也不在少數(shù), 主要集中在對英語閱讀理解部分的診斷測評[62-65]。 同時,也有研究者將認(rèn)知診斷應(yīng)用到其他學(xué)科。 例如,王玨和解月光使用基于前概念體系的學(xué)習(xí)者認(rèn)知診斷方法對被試的初中物理學(xué)習(xí)情況進(jìn)行測評[66]。 還有研究者將GDM 應(yīng)用到包括閱讀、寫作、數(shù)學(xué)和科學(xué)等學(xué)科的NAEP(National Assessment of Educational Progress)數(shù)據(jù)分析中,結(jié)果發(fā)現(xiàn),GDM 在各個學(xué)科上均能準(zhǔn)確地對被試的能力進(jìn)行診斷, 并且該方法可以有效降低其他控制變量對結(jié)果的影響[67]。
在語言技能測評方面, 較早時就有學(xué)者使用RSM 對被試的第二語言閱讀技能進(jìn)行測評, 結(jié)果發(fā)現(xiàn)該方法可以很好地對口語測試數(shù)據(jù)進(jìn)行分析,并為測試者提供準(zhǔn)確的診斷反饋報告[68]。 后續(xù)出現(xiàn)了不少研究者將CDMs 應(yīng)用于外語 (相對被試的母語而言)的閱讀技能測評,結(jié)果均表明基于CDMs 的方法不僅能為研究者提供被試總體能力, 還可以準(zhǔn)確診斷被試在各個屬性上的掌握情況[69-72]。 還有研究者將融合模型FM(fusion model)用于測評被試在托福測試中的閱讀技能水平, 并且探討了基于CDMs 的個性化診斷報告對教學(xué)的影響[73]。von Davier 將GDM應(yīng)用到托福測驗(yàn)的聽力和閱讀技能的測評, 結(jié)果表明,GDM 可以對被試的屬性掌握情況進(jìn)行準(zhǔn)確的診斷歸類[74]。 國內(nèi)學(xué)者范曉玲還將認(rèn)知診斷技術(shù)應(yīng)用到閱讀障礙兒童的語音、字形閱讀、語素意識和漢語詞匯的診斷評估中,結(jié)果均表明,基于認(rèn)知診斷的結(jié)果不僅能夠準(zhǔn)確評估閱讀障礙兒童的具體表現(xiàn),還能提供更豐富的診斷信息[75-77]。
認(rèn)知診斷作為一種新技術(shù)為各類精神障礙的診斷提供了重要的依據(jù)。 例如,有研究者使用部分的有序分類模型(partially ordered classification models)診斷精神分裂癥患者的神經(jīng)認(rèn)知功能[78]。 還有研究者將 CDMs (i.e., DINA & DINO) 應(yīng)用到病態(tài)性賭博(pathological gambling)的診斷研究中,結(jié)果表明,基于 CDMs 的診斷結(jié)果與 DSM-IV (Diagnostic and Statistical Manual of Mental Disorders-IV)[79]對病態(tài)性賭博的診斷標(biāo)準(zhǔn)基本一致[80]。 de la Torre, van der Ark和 Rossi 將 G-DINA 模型及其約束模型(i.e., DINA,DINO & ACDM)應(yīng)用到米隆臨床多軸調(diào)查量表(Millon Clinical Multiaxial Inventory-III, MCMI-III)[81]的數(shù)據(jù)分析上,并且在項(xiàng)目水平(item level)上對比了各個模型的優(yōu)劣, 同時對基于CDMs 的分析結(jié)果和傳統(tǒng)分析結(jié)果進(jìn)行對比,結(jié)果發(fā)現(xiàn),基于CDMs 的方法可以提供更詳細(xì)、準(zhǔn)確的結(jié)果[82]。 近來,有研究者將認(rèn)知診斷應(yīng)用于抑郁癥的診斷研究中,基于CDMs的框架提出了抑郁癥的認(rèn)知診斷測驗(yàn) (cognitive diagnostic test for depression, CDMs-D)[83]。 此外,還有學(xué)者將認(rèn)知診斷應(yīng)用到個體的酒精干預(yù)研究中[84]。
認(rèn)知診斷的應(yīng)用研究還涉及到了其他領(lǐng)域。 例如, 部分研究者將認(rèn)知診斷應(yīng)用到計(jì)算機(jī)自適應(yīng)測試(computerized adaptive testing, CAT)上,提出了各種認(rèn)知診斷計(jì)算機(jī)自適應(yīng)測試(CD-CAT),旨在結(jié)合認(rèn)知診斷和計(jì)算機(jī)自適應(yīng)測試的優(yōu)勢, 從而更好地對被試的能力進(jìn)行測評[85-89]。 此外,García, Olea 與de la Torre 還將G-DINA 模型應(yīng)用于情景判斷測驗(yàn)(situational judgment tests, SJTs) 的數(shù)據(jù)分析中,結(jié)果表明,該模型可以很好地對此數(shù)據(jù)進(jìn)行分析[90]。
總之,認(rèn)知診斷已經(jīng)應(yīng)用于眾多領(lǐng)域,這為認(rèn)知診斷研究提供了大量理論和實(shí)證方面的依據(jù), 充分證明了認(rèn)知診斷測驗(yàn)在許多領(lǐng)域中都是有效的測量工具。 學(xué)科教育作為認(rèn)知診斷應(yīng)用最廣泛的領(lǐng)域,現(xiàn)已取得了較為豐富的理論基礎(chǔ)和實(shí)證研究成果。 然而,鑒于認(rèn)知診斷的相關(guān)知識比較復(fù)雜,目前很少有一線教師能夠掌握認(rèn)知診斷的知識與技術(shù), 對認(rèn)知診斷測驗(yàn)的編制、 使用認(rèn)知診斷模型進(jìn)行數(shù)據(jù)分析等關(guān)鍵部分掌握起來較為困難, 因此研究者在發(fā)展認(rèn)知診斷的同時, 應(yīng)該考慮如何使一線教師更好地掌握該技術(shù), 使認(rèn)知診斷技術(shù)的應(yīng)用在各領(lǐng)域更好地落地,從而具備更普遍的推廣價值。
首先,在現(xiàn)實(shí)教育情境中,各學(xué)科所涉及的內(nèi)容和知識點(diǎn)大多屬于多分屬性 (即一個知識點(diǎn)并不能簡單地被分為掌握/未掌握), 并且許多題目的計(jì)分方式也不是簡單的0-1 計(jì)分, 很多題型均需采用多級評分的方式。 因此,在條件允許的情況下,使用多分屬性多級評分認(rèn)知診斷測驗(yàn)對學(xué)生進(jìn)行測評,并且采用多分屬性多級計(jì)分的認(rèn)知診斷模型對測驗(yàn)數(shù)據(jù)進(jìn)行分析是一個較好的選擇。 雖然已有研究者在RPa-DINA 模型的基礎(chǔ)拓展出了多級評分的RPa-DINA 模型(PRPa-DINA 模型),然而該研究僅停留在理論研究的層面, 還沒有研究者進(jìn)行相應(yīng)的實(shí)證研究,因此,未來研究者可以進(jìn)行相應(yīng)的實(shí)證研究,采用真實(shí)數(shù)據(jù)來進(jìn)一步驗(yàn)證PRPa-DINA 模型的科學(xué)性。
其次,PRPa-DINA 模型是基于P-DINA 模型的拓展思路進(jìn)行建構(gòu)的,存在一定的局限性,研究者在未來的研究中可以嘗試基于其他更好的思路對其進(jìn)行拓展。此外,PRPa-DINA 模型是在DINA 模型的基礎(chǔ)上拓展出來的,而DINA 模型是一種連接、非補(bǔ)償?shù)腃DM,其理論假設(shè)并不符合所有教育情境,因此,未來研究者可以對其他 CDMs(e.g., G-DINA)進(jìn)行多分屬性多級評分的拓展, 以應(yīng)對復(fù)雜的現(xiàn)實(shí)教育情境。
再者, 所有的測評都是為了學(xué)生更好更全面的發(fā)展,從而提升他們的核心素養(yǎng)。 因此,結(jié)合具體的干預(yù)手段, 對學(xué)生的知識掌握情況進(jìn)行多個時間點(diǎn)測量, 從而對學(xué)生的縱向發(fā)展進(jìn)行較全面的測評是必不可少的。 在未來研究中,可以從該角度出發(fā),根據(jù)認(rèn)知診斷報告制定個性化的補(bǔ)救方案, 然后進(jìn)行縱向追蹤,并與傳統(tǒng)的教學(xué)補(bǔ)救進(jìn)行對比,探討認(rèn)知診斷補(bǔ)救效果是否優(yōu)于傳統(tǒng)的教學(xué)補(bǔ)救。
最后, 認(rèn)知診斷的關(guān)鍵技術(shù)對于一線教師而言較難掌握。 因此,研究者在未來研究中應(yīng)當(dāng)考慮該因素,致力于開發(fā)出操作較簡單的認(rèn)知診斷分析平臺。目前, 江西師范大學(xué)涂冬波教授團(tuán)隊(duì)已經(jīng)開發(fā)出了操作較簡單的認(rèn)知診斷分析平臺(flexCDMs),該平臺包括了幾種常用的認(rèn)知診斷模型 (如DINA、DINO、rRUM、ACDM、seqGDINA), 在一定程度上方便了研究者及一線教師對認(rèn)知診斷數(shù)據(jù)的分析。 然而該平臺所包括的CDMs 主要是二級計(jì)分的, 多級計(jì)分的 CDMs 只有 seqGDINA, 并不包括多分屬性CDMs 以及更符合實(shí)際教育情境的多分屬性多級計(jì)分CDMs,因此還有待于進(jìn)一步拓展。