戴 靜 顧小清 江 波
殊途同歸:認(rèn)知診斷與知識(shí)追蹤*——兩種主流學(xué)習(xí)者知識(shí)狀態(tài)建模方法的比較
戴 靜 顧小清[通訊作者]江 波
(華東師范大學(xué) 教育信息技術(shù)學(xué)系,上海 200062)
學(xué)習(xí)者知識(shí)狀態(tài)建模是建立個(gè)性化學(xué)習(xí)系統(tǒng)的重要任務(wù)之一。目前,學(xué)習(xí)者知識(shí)狀態(tài)建模的主流方法有兩種,分別是心理測(cè)量領(lǐng)域?qū)<姨岢龅恼J(rèn)知診斷方法和人機(jī)交互領(lǐng)域?qū)<姨岢龅闹R(shí)追蹤方法。為了更恰當(dāng)?shù)貙⑦@兩種方法應(yīng)用于智能教育領(lǐng)域,文章圍繞以何建模、如何建模、結(jié)果為何、如何應(yīng)用這四個(gè)學(xué)習(xí)者建模的關(guān)鍵問(wèn)題,從輸入維度的可擴(kuò)展性、模型參數(shù)的可適應(yīng)性、輸出結(jié)果的精益求精、助力個(gè)性化推薦服務(wù)四個(gè)方面,對(duì)認(rèn)知診斷方法和知識(shí)追蹤方法進(jìn)行論述比較??偟膩?lái)說(shuō),認(rèn)知診斷方法適用于靜態(tài)評(píng)估且在輸出結(jié)果方面更為精細(xì)化、多樣化,而知識(shí)追蹤方法適用于動(dòng)態(tài)預(yù)測(cè)且在輸入維度方面更具可擴(kuò)展性。通過(guò)研究,文章期望為研究者合理應(yīng)用這兩種方法以服務(wù)于個(gè)性化學(xué)習(xí)系統(tǒng)提供參考。
學(xué)習(xí)者建模;知識(shí)狀態(tài);認(rèn)知診斷;知識(shí)追蹤
近年來(lái),《教育信息化2.0行動(dòng)》、《中國(guó)教育現(xiàn)代化2035》等系列政策均強(qiáng)調(diào)利用智能技術(shù)輔助實(shí)現(xiàn)個(gè)性化學(xué)習(xí)。個(gè)性化學(xué)習(xí)的本質(zhì)在于,根據(jù)學(xué)習(xí)過(guò)程數(shù)據(jù)對(duì)學(xué)習(xí)者進(jìn)行全面刻畫(huà),據(jù)此適時(shí)進(jìn)行學(xué)習(xí)路徑與學(xué)習(xí)資源推薦等個(gè)性化干預(yù)[1]。學(xué)習(xí)者模型作為個(gè)性化干預(yù)的依據(jù),是個(gè)性化學(xué)習(xí)系統(tǒng)的重要組成模塊,可將其看作一組學(xué)習(xí)者特征的集合,包括知識(shí)狀態(tài)、情感狀態(tài)、能力狀態(tài)等[2]。但是,針對(duì)學(xué)習(xí)者情感、能力的建模研究目前還處于探索階段,個(gè)性化學(xué)習(xí)系統(tǒng)仍以學(xué)習(xí)者知識(shí)狀態(tài)作為主要的推薦依據(jù)[3]。也正因此,如何對(duì)學(xué)習(xí)者知識(shí)狀態(tài)進(jìn)行建模一直是個(gè)性化學(xué)習(xí)領(lǐng)域關(guān)注的重點(diǎn)內(nèi)容。為此,本研究選取認(rèn)知診斷與知識(shí)追蹤這兩種學(xué)習(xí)者知識(shí)狀態(tài)建模的主流方法進(jìn)行比較,以期為研究者合理應(yīng)用個(gè)性化學(xué)習(xí)系統(tǒng)提供參考。
學(xué)習(xí)者知識(shí)狀態(tài)建模指通過(guò)學(xué)習(xí)者個(gè)體的作答行為與結(jié)果數(shù)據(jù)對(duì)個(gè)性化的知識(shí)狀態(tài)進(jìn)行刻畫(huà)的過(guò)程[4]。截至2021年7月24日,在中國(guó)知網(wǎng)數(shù)據(jù)庫(kù)以“學(xué)習(xí)者建?!被颉皩W(xué)習(xí)者模型”為關(guān)鍵詞、以“CSSCI”為來(lái)源類別,檢索到86篇文獻(xiàn);在Web of Science-SSCI引文索引數(shù)據(jù)庫(kù)以“Learner model”或“Student model”為關(guān)鍵詞,檢索到141篇文獻(xiàn)。文獻(xiàn)分析表明,學(xué)習(xí)者建模研究關(guān)注四個(gè)關(guān)鍵問(wèn)題:①“以何建?!保床捎煤畏N數(shù)據(jù)作為建模輸入;②“如何建模”,即關(guān)注模型本身,如模型參數(shù)類別與數(shù)量等;③“結(jié)果為何”,即模型的輸出是什么、如何改善當(dāng)前方法所得結(jié)果的局限性等;④“如何應(yīng)用”,即如何用學(xué)習(xí)者建模結(jié)果服務(wù)個(gè)性化學(xué)習(xí)。
就學(xué)習(xí)者知識(shí)狀態(tài)的建模方法而言,目前有覆蓋模型、微分模型、攝動(dòng)模型、認(rèn)知診斷、偏差模型、知識(shí)追蹤等[5]。其中,覆蓋模型是通過(guò)比較學(xué)習(xí)者知識(shí)與專家知識(shí)來(lái)發(fā)現(xiàn)學(xué)習(xí)者缺乏的知識(shí)技能,而微分模型和攝動(dòng)模型是基于覆蓋模型的改進(jìn);認(rèn)知診斷是對(duì)具體的認(rèn)知加工過(guò)程或子技能進(jìn)行評(píng)估;偏差模型是通過(guò)學(xué)習(xí)者的問(wèn)題解決路徑與專家解決路徑的偏差,來(lái)發(fā)現(xiàn)學(xué)習(xí)者特定知識(shí)點(diǎn)的不足;知識(shí)追蹤是通過(guò)學(xué)習(xí)者與習(xí)題的交互數(shù)據(jù),預(yù)測(cè)學(xué)習(xí)者的知識(shí)狀態(tài)。
認(rèn)知診斷和知識(shí)追蹤是被廣泛采納的兩種學(xué)習(xí)者知識(shí)狀態(tài)建模方法[6],但認(rèn)知診斷來(lái)源于心理測(cè)量領(lǐng)域,而知識(shí)追蹤來(lái)源于人機(jī)交互領(lǐng)域。這兩種由跨學(xué)科專家提出的看似不相關(guān)的方法,在個(gè)性化學(xué)習(xí)系統(tǒng)興起后相互碰撞,為建立學(xué)習(xí)者模型提供了有力手段。然而,在個(gè)性化學(xué)習(xí)的實(shí)踐中,選用哪種方法一般取決于研究者自身特長(zhǎng),鮮有研究對(duì)這兩種方法進(jìn)行比較。因此,本研究圍繞以何建模、如何建模、結(jié)果為何、如何應(yīng)用這四個(gè)學(xué)習(xí)者建模的關(guān)鍵問(wèn)題,比較認(rèn)知診斷和知識(shí)追蹤這兩大學(xué)習(xí)者建模方法,研究思路如圖1所示。
圖1 研究思路
認(rèn)知診斷(Cognitive Diagnosis,CD)是心理測(cè)量領(lǐng)域?qū)φJ(rèn)知加工過(guò)程或知識(shí)技能進(jìn)行診斷評(píng)估的產(chǎn)物[7]。20世紀(jì)80年代,隨著心理測(cè)量學(xué)的發(fā)展,人們不滿足于從宏觀上測(cè)量和評(píng)價(jià)學(xué)生能力,因而開(kāi)始探索學(xué)習(xí)者內(nèi)部心理的加工過(guò)程。于是,繼經(jīng)典測(cè)量理論(Classical Test Theory,CTT)、概化理論(Generalizability Theory,GT)和項(xiàng)目反應(yīng)理論(Item Response Theory,IRT)之后,認(rèn)知診斷成為新一代測(cè)驗(yàn)理論的核心。
認(rèn)知診斷的發(fā)展歷程中有兩個(gè)里程碑式的模型:一個(gè)是1973年Fischer[8]提出的線性邏輯斯蒂特質(zhì)模型(Linear Logistic Trait Model,LLTM),該模型考慮了正確回答問(wèn)題所需的認(rèn)知成分,以各個(gè)認(rèn)知屬性的難度代替Rasch模型(單參數(shù)邏輯斯蒂模型)中的題目難度參數(shù),由IRT向CD跨越了一大步,但此時(shí)LLTM還不能進(jìn)行認(rèn)知屬性的評(píng)估;另一個(gè)是1983年Tatsuoka[9]提出的規(guī)則空間模型(Rule Space Model,RSM),該模型首創(chuàng)性地使用Q矩陣來(lái)代替LLTM中的認(rèn)知屬性難度成分,此后Q矩陣的建立便成為了認(rèn)知診斷的關(guān)鍵步驟?;赒矩陣,產(chǎn)生了一系列認(rèn)知診斷模型,如針對(duì)選擇題、填空題、判斷題等的二級(jí)評(píng)分認(rèn)知診斷模型和針對(duì)計(jì)算題、應(yīng)用題、作文題等的多級(jí)評(píng)分認(rèn)知診斷模型。
(1)二級(jí)評(píng)分認(rèn)知診斷模型
二級(jí)評(píng)分認(rèn)知診斷的典型模型包括DINA[10]、DINO[11]、NIDA[12]、NIDO[13]、C-RUM[14]、R-RUM[15]、M2PL[16]等,具體如表1所示。在公式中,q=1,表示題目考察了屬性;q=0,表示未考察。a=1,表示學(xué)生掌握屬性;a=0,表示未掌握。X=1,表示學(xué)生對(duì)于題目作答正確;X=0,表示作答錯(cuò)誤。除通用參數(shù)外,每個(gè)模型均包含特有參數(shù),如DINA模型包含兩個(gè)定義在題目水平上的參數(shù),即失誤參數(shù)s和猜測(cè)參數(shù)g:若學(xué)生掌握了題目考察的所有屬性,則作答正確的概率為1-s;反之,則作答正確的概率為g。
表1 二級(jí)評(píng)分認(rèn)知診斷的典型模型
表2 多級(jí)評(píng)分認(rèn)知診斷的典型模型
(2)多級(jí)評(píng)分認(rèn)知診斷模型
針對(duì)多級(jí)評(píng)分題目的認(rèn)知診斷模型,本質(zhì)是對(duì)每一個(gè)得分等級(jí)進(jìn)行建模,從而將多級(jí)評(píng)分問(wèn)題轉(zhuǎn)化為二級(jí)評(píng)分問(wèn)題。按照具體二分化轉(zhuǎn)換方法的不同,多級(jí)評(píng)分認(rèn)知診斷模型可分為累積概率模型(Cumulative Probability Model)、連續(xù)比率模型(Continuation-Ratio Model)和相鄰類別模型(Adjacent-Category Model)[17],如表2所示。其中,表示得分等級(jí)(Score),若題目的滿分為3分,則的取值為{0, 1, 2, 3}。四種得分等級(jí)可簡(jiǎn)單理解為未答對(duì)(0)、答對(duì)一個(gè)步驟(1)、答對(duì)兩個(gè)步驟(2)、全部答對(duì)(3)。例如,累積概率模型針對(duì)每個(gè)得分等級(jí)或步驟,將其二分化為(X<)和(X≥);被試在第題恰得分的概率為得分及以上的概率減去得+1分及以上的概率,即(X=t|a)(X≥t|a)-(X≥+1|a)。
知識(shí)追蹤(Knowledge Tracing,KT)是計(jì)算機(jī)科學(xué)與心理學(xué)結(jié)合的產(chǎn)物,由卡內(nèi)基梅隆大學(xué)計(jì)算機(jī)科學(xué)學(xué)院人機(jī)交互研究所專家Corbett等[21]于1995年引入智能教育領(lǐng)域,后成為個(gè)性化學(xué)習(xí)系統(tǒng)中學(xué)習(xí)者知識(shí)狀態(tài)建模的主流方法。知識(shí)追蹤的初衷是對(duì)知識(shí)習(xí)得過(guò)程中的知識(shí)狀態(tài)動(dòng)態(tài)建模,確定學(xué)習(xí)者何時(shí)掌握了一項(xiàng)特定技能。知識(shí)追蹤根據(jù)學(xué)習(xí)者的歷史作答行為數(shù)據(jù),包括作答題目、題目對(duì)應(yīng)的知識(shí)點(diǎn)、作答結(jié)果序列,預(yù)測(cè)下次給定題目的作答結(jié)果與知識(shí)狀態(tài)。
早期的知識(shí)追蹤研究以貝葉斯知識(shí)追蹤模型為主,后因深度學(xué)習(xí)技術(shù)的發(fā)展,深度知識(shí)追蹤模型也成為研究熱點(diǎn)[22]。自1995年以來(lái),貝葉斯知識(shí)追蹤的研究主要圍繞改善其本身的局限性展開(kāi),如貝葉斯知識(shí)追蹤假設(shè)知識(shí)狀態(tài)只分為掌握和未掌握兩種、學(xué)習(xí)者不會(huì)遺忘知識(shí)點(diǎn)、只針對(duì)單個(gè)知識(shí)點(diǎn)建模等。直至2015年,第一個(gè)深度知識(shí)追蹤模型才出現(xiàn),即Piech等[23]提出使用循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)及其變體長(zhǎng)短期記憶(Long Short-Term Memory,LSTM)神經(jīng)網(wǎng)絡(luò),來(lái)預(yù)測(cè)學(xué)習(xí)者的作答結(jié)果和知識(shí)狀態(tài)。之后,研究者主要通過(guò)增加輸入特征[24]、改進(jìn)神經(jīng)網(wǎng)絡(luò)等[25],嘗試進(jìn)一步提升預(yù)測(cè)效果。
(1)貝葉斯知識(shí)追蹤模型
貝葉斯知識(shí)追蹤(Bayesian Knowledge Tracing,BKT)模型本質(zhì)上可以看作是隱馬爾可夫模型(Hidden Markov Model,HMM),如圖2所示。其中,(a)部分為HMM的一般形式,包括隱狀態(tài)(S)、觀測(cè)狀態(tài)(y)、初始概率分布、轉(zhuǎn)移概率矩陣和發(fā)射概率五個(gè)元素。(c)部分為BKT實(shí)例,結(jié)合(a)部分來(lái)看,可知BKT針對(duì)單個(gè)知識(shí)點(diǎn)建模,隱狀態(tài)為知識(shí)點(diǎn)掌握情況,包括掌握(M)或未掌握(N);觀測(cè)狀態(tài)為作答結(jié)果,包括正確(1)或錯(cuò)誤(0)。(b)部分則顯示了BKT中影響狀態(tài)轉(zhuǎn)換的參數(shù),具體有四個(gè):(0),即開(kāi)始學(xué)習(xí)之前掌握該知識(shí)點(diǎn)的概率;(),即通過(guò)學(xué)習(xí)之后該知識(shí)點(diǎn)從未被掌握到被掌握的概率,結(jié)合BKT不存在遺忘現(xiàn)象的假設(shè)可得轉(zhuǎn)移概率矩陣;(),即未掌握該知識(shí)點(diǎn)卻答對(duì)題目的概率;(),即掌握了該知識(shí)點(diǎn)卻答錯(cuò)的概率。
圖2 貝葉斯知識(shí)追蹤模型
圖3 深度知識(shí)追蹤模型
(2)深度知識(shí)追蹤模型
深度知識(shí)追蹤(Deep Knowledge Tracing,DKT)模型將深度學(xué)習(xí)技術(shù)應(yīng)用于知識(shí)追蹤任務(wù),如圖3所示。學(xué)習(xí)者在學(xué)習(xí)過(guò)程中進(jìn)行了多次題目練習(xí)(1,2, …,T),每一道題目都標(biāo)注了知識(shí)點(diǎn)(1,2, …,m),將學(xué)生在第次之前的作答結(jié)果(t={t,t})序列、下一道題編號(hào)(t+1)、所有題目與知識(shí)點(diǎn)的對(duì)應(yīng)關(guān)系矩陣以及其他相關(guān)信息作為輸入,經(jīng)過(guò)神經(jīng)網(wǎng)絡(luò)的隱藏層,在輸出層預(yù)測(cè)第+1次作答時(shí)的知識(shí)點(diǎn)掌握概率向量t+1。
針對(duì)學(xué)習(xí)者建模的四個(gè)關(guān)鍵問(wèn)題“以何建模”“如何建?!薄敖Y(jié)果為何”“如何應(yīng)用”,結(jié)合對(duì)表1、表2、圖2和圖3的分析,本研究從輸入數(shù)據(jù)、模型參數(shù)、輸出結(jié)果、應(yīng)用初衷四個(gè)維度,對(duì)認(rèn)知診斷和知識(shí)追蹤的典型模型進(jìn)行初步比較,結(jié)果如表3所示。其中,多級(jí)評(píng)分認(rèn)知診斷可以轉(zhuǎn)化為二級(jí)評(píng)分認(rèn)知診斷問(wèn)題,故兩者未分開(kāi)論述;而貝葉斯知識(shí)追蹤模型與深度知識(shí)追蹤模型的差異較大,故在下文中將兩者分開(kāi)論述。
表3 認(rèn)知診斷與知識(shí)追蹤典型模型的初步比較
由表3可知,認(rèn)知診斷與深度知識(shí)追蹤的輸入數(shù)據(jù)相近,區(qū)別在于Q矩陣不僅包括題目與知識(shí)點(diǎn)的對(duì)應(yīng)關(guān)系,還隱含了知識(shí)點(diǎn)之間的層級(jí)關(guān)系;而貝葉斯知識(shí)追蹤并非不考慮題目與知識(shí)點(diǎn)的對(duì)應(yīng)關(guān)系,只是其針對(duì)單個(gè)知識(shí)點(diǎn)建模,所有題目只對(duì)應(yīng)當(dāng)前這一個(gè)知識(shí)點(diǎn),故不會(huì)特意列出。從模型參數(shù)維度來(lái)看,認(rèn)知診斷的參數(shù)根據(jù)不同的統(tǒng)計(jì)公式而定,表1中已有說(shuō)明;貝葉斯知識(shí)追蹤采用HMM統(tǒng)計(jì)模型,最典型的貝葉斯知識(shí)追蹤包括初始掌握概率(0)、學(xué)習(xí)概率()、猜測(cè)概率()、失誤概率()四個(gè)參數(shù);深度知識(shí)追蹤則采用不同于統(tǒng)計(jì)模型的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),其內(nèi)部參數(shù)在教學(xué)方面不具有可解釋性。從輸出結(jié)果維度來(lái)看,認(rèn)知診斷和貝葉斯知識(shí)追蹤通常以掌握或未掌握二分狀態(tài)來(lái)呈現(xiàn),但前者也可以計(jì)算知識(shí)點(diǎn)的掌握概率;深度知識(shí)追蹤通常以知識(shí)點(diǎn)掌握概率呈現(xiàn)。從應(yīng)用初衷維度來(lái)看,認(rèn)知診斷是為了診斷學(xué)習(xí)者當(dāng)前時(shí)刻的知識(shí)狀態(tài),而知識(shí)追蹤是為了通過(guò)動(dòng)態(tài)監(jiān)測(cè)來(lái)發(fā)現(xiàn)學(xué)習(xí)者何時(shí)掌握了某一知識(shí)點(diǎn),但兩者本質(zhì)上都是評(píng)估學(xué)習(xí)者的知識(shí)狀態(tài)??傮w而言,認(rèn)知診斷與知識(shí)追蹤的輸入數(shù)據(jù)和輸出結(jié)果相近、模型參數(shù)有明顯差異,在學(xué)習(xí)者知識(shí)狀態(tài)建模方面有殊途同歸之效。
然而,大規(guī)模個(gè)性化學(xué)習(xí)趨勢(shì)的發(fā)展對(duì)學(xué)習(xí)者建模提出了進(jìn)一步的要求。就“以何建?!倍裕柙谳斎霐?shù)據(jù)中嘗試增加各項(xiàng)影響學(xué)習(xí)者知識(shí)狀態(tài)的因素;就“如何建模”而言,需探索能夠體現(xiàn)知識(shí)狀態(tài)個(gè)性化特征的模型參數(shù);就“結(jié)果為何”而言,需不斷思考如何改善當(dāng)前方法所得結(jié)果的局限性;就“如何應(yīng)用”而言,需明確各建模方法的應(yīng)用場(chǎng)景與應(yīng)用方法。為滿足這四個(gè)方面的需求,認(rèn)知診斷與知識(shí)追蹤都進(jìn)行了持續(xù)的擴(kuò)展研究。
學(xué)習(xí)者建模的輸入維度正在從單一化向多維化轉(zhuǎn)變,可擴(kuò)展性成為學(xué)習(xí)者建模的需求之一。以往,評(píng)估學(xué)習(xí)者的知識(shí)狀態(tài)多從作答結(jié)果(對(duì)錯(cuò)、得幾分)單一維度來(lái)看;后來(lái),隨著大數(shù)據(jù)技術(shù)及各種數(shù)據(jù)采集設(shè)備的完善,學(xué)習(xí)者信息維度(如作答行為、情緒、個(gè)性特征)、知識(shí)點(diǎn)信息維度(如知識(shí)點(diǎn)之間的層級(jí)關(guān)系)等影響評(píng)估結(jié)果的因素也被納入建模維度。
①學(xué)習(xí)者信息維度。貝葉斯知識(shí)追蹤模型一般通過(guò)增設(shè)節(jié)點(diǎn)變量或外生變量的形式,來(lái)擴(kuò)展學(xué)習(xí)者信息維度;節(jié)點(diǎn)變量扮演外顯證據(jù)的角色,如Spaulding等[26]嘗試通過(guò)增加情緒觀測(cè)節(jié)點(diǎn)(微笑、困惑等)來(lái)提高預(yù)測(cè)性能;外生變量扮演影響因素的角色,如González-Brenes等[27]提出了一個(gè)類似非齊次隱馬爾可夫模型的知識(shí)追蹤框架,該框架可納入影響狀態(tài)轉(zhuǎn)移概率、發(fā)射概率的各種特征。深度知識(shí)追蹤模型的本質(zhì)形式是深度神經(jīng)網(wǎng)絡(luò),本就可以接受多維輸入,如Zhang等[28]增加學(xué)習(xí)者第一次作答嘗試的時(shí)間、嘗試的次數(shù)等行為數(shù)據(jù),作為深度知識(shí)追蹤的輸入維度。相比而言,在認(rèn)知診斷模型中增加學(xué)習(xí)者信息維度的研究目前并不多見(jiàn)。
②知識(shí)點(diǎn)信息維度。認(rèn)知診斷模型的Q矩陣中已隱含了知識(shí)點(diǎn)之間的層級(jí)關(guān)系,即大多數(shù)認(rèn)知診斷模型已默認(rèn)將知識(shí)點(diǎn)之間的關(guān)系維度作為輸入。貝葉斯知識(shí)追蹤模型只針對(duì)單個(gè)知識(shí)點(diǎn)進(jìn)行建模,一般不考慮知識(shí)點(diǎn)關(guān)系維度;但也有少數(shù)研究者對(duì)此進(jìn)行了嘗試,如Huang等[29]提出了融入知識(shí)層級(jí)關(guān)系的貝葉斯網(wǎng)絡(luò)建??蚣堋I疃戎R(shí)追蹤模型可對(duì)多個(gè)知識(shí)點(diǎn)進(jìn)行建模,知識(shí)點(diǎn)之間的關(guān)系作為一個(gè)研究點(diǎn)備受關(guān)注,如Chen等[30]嘗試以順序配對(duì)的形式將知識(shí)點(diǎn)之間的先決關(guān)系作為模型的輸入。值得一提的是,深度知識(shí)追蹤模型中每道題或每道題的某一個(gè)步驟通常只與一個(gè)知識(shí)點(diǎn)掛鉤,將多個(gè)知識(shí)點(diǎn)一起考察,本質(zhì)上是不同知識(shí)點(diǎn)順序上的交叉練習(xí),而非真正的混合練習(xí)。
總體來(lái)說(shuō),認(rèn)知診斷模型均為概率公式的形式,無(wú)法靈活地增加學(xué)習(xí)者行為、情緒等維度。貝葉斯知識(shí)追蹤模型只針對(duì)作答結(jié)果單一維度建模,但可利用貝葉斯網(wǎng)絡(luò)本身的可塑性來(lái)增加其他維度。深度知識(shí)追蹤模型以人工神經(jīng)網(wǎng)絡(luò)為載體,擴(kuò)展輸入維度正是其優(yōu)勢(shì)的體現(xiàn)。因此,在輸入維度方面,知識(shí)追蹤模型比認(rèn)知診斷模型更具可擴(kuò)展性。
認(rèn)知診斷與知識(shí)追蹤的建模過(guò)程相同,大體可分為數(shù)據(jù)采集和參數(shù)估計(jì)(或模型訓(xùn)練)。模型的參數(shù)是體現(xiàn)模型差異的重要方面,通過(guò)各類參數(shù)以準(zhǔn)確表征每一個(gè)學(xué)習(xí)者的知識(shí)狀態(tài)是建模的關(guān)鍵任務(wù)。刻畫(huà)知識(shí)狀態(tài)的參數(shù)大致可分為三個(gè)層面:題目層面、屬性層面和學(xué)習(xí)者層面,這三個(gè)層面分別針對(duì)每一道題、每一個(gè)屬性或每一個(gè)學(xué)習(xí)者設(shè)置適應(yīng)性參數(shù)。以“猜答案”這一現(xiàn)象為例,若將參數(shù)置于題目層面,可解釋為不同題目被猜對(duì)的概率是不同的;若將參數(shù)置于屬性層面,可解釋為不同知識(shí)點(diǎn)未被掌握卻被成功應(yīng)用的概率是不同的;若將參數(shù)置于學(xué)習(xí)者層面,則可解釋為不同學(xué)習(xí)者猜對(duì)題目的概率是不同的。無(wú)論是典型模型的常規(guī)參數(shù),還是后期擴(kuò)展研究的新增參數(shù),都體現(xiàn)了這三個(gè)層面的適應(yīng)性。
①常規(guī)參數(shù)。在認(rèn)知診斷模型中,既有針對(duì)題目層面的參數(shù)建模,如DINA、DINO模型中的猜測(cè)和失誤參數(shù);也有針對(duì)屬性層面的參數(shù)建模,如NIDO模型中的下限和增益參數(shù);還有針對(duì)屬性和題目交叉層面的參數(shù)建模,如R-RUM模型中的懲罰參數(shù)。貝葉斯知識(shí)追蹤模型是針對(duì)屬性層面的參數(shù)建模,即當(dāng)所有學(xué)習(xí)者就同一知識(shí)點(diǎn)對(duì)所有題目進(jìn)行作答時(shí),其所擁有的初始掌握概率、學(xué)習(xí)概率、猜測(cè)概率、失誤概率這四個(gè)參數(shù)是一樣的。后來(lái),有研究者在題目層面進(jìn)行了適應(yīng)性嘗試,如Pardos等[31]提出KT-IDEM模型,賦予每道題一個(gè)猜測(cè)概率和一個(gè)失誤概率,那么道題就有2×+2個(gè)參數(shù)。也有研究者在學(xué)習(xí)者層面進(jìn)行了適應(yīng)性嘗試,如Pardos等[32]提出對(duì)于同一知識(shí)點(diǎn),每個(gè)學(xué)習(xí)者應(yīng)擁有個(gè)性化的初始掌握概率和學(xué)習(xí)概率;Lee等[33]的研究表明,擁有適應(yīng)性參數(shù)的模型比典型模型更具有教學(xué)指導(dǎo)意義。而在深度知識(shí)追蹤模型中,由于深度學(xué)習(xí)技術(shù)的“黑盒”特質(zhì),神經(jīng)網(wǎng)絡(luò)層之間的權(quán)重等參數(shù)暫不具有可解釋的教學(xué)意義。
②新增參數(shù)。遺忘特性是后期研究嘗試最多的新增參數(shù)。貝葉斯知識(shí)追蹤模型假設(shè)學(xué)習(xí)者不存在遺忘現(xiàn)象,但Qiu等[34]發(fā)現(xiàn)該模型對(duì)于學(xué)習(xí)者的預(yù)測(cè)表現(xiàn)(一天或更長(zhǎng)時(shí)間之后)優(yōu)于實(shí)際情況,于是提出可按照是否為學(xué)習(xí)當(dāng)天分別采用不同屬性層面的遺忘參數(shù)——當(dāng)天的遺忘參數(shù)(s)和第二天及以后的遺忘參數(shù)(n);而Nedungadi等[35]依據(jù)上次嘗試作答和當(dāng)前嘗試作答的具體時(shí)間間隔,提出以時(shí)間衰減函數(shù)的形式引入遺忘參數(shù)。深度知識(shí)追蹤模型雖然無(wú)法直接增加具有顯著教育意義的遺忘參數(shù),但可在輸入?yún)?shù)中增加同一知識(shí)點(diǎn)最近兩次作答之間的時(shí)間間隔、無(wú)知識(shí)點(diǎn)限制情況下最近兩次作答之間的時(shí)間間隔等體現(xiàn)遺忘特性的信息[36]。認(rèn)知診斷模型本意是針對(duì)測(cè)驗(yàn)情境而未考慮遺忘特性的典型模型。
總體來(lái)說(shuō),在認(rèn)知診斷模型中,針對(duì)題目層面、屬性層面、屬性與題目交叉層面的參數(shù)建模均已進(jìn)行了嘗試,并已開(kāi)發(fā)出相應(yīng)的模型。貝葉斯知識(shí)追蹤模型的參數(shù)都屬于屬性層面,但可通過(guò)題目層面和學(xué)習(xí)者層面進(jìn)一步細(xì)化,以賦予每一道題或每一個(gè)學(xué)習(xí)者個(gè)性化的特征。深度知識(shí)追蹤模型的參數(shù)不可解釋,暫不具有顯著的教學(xué)意義。值得一提的是,選擇不同層面的參數(shù),僅意味著采用不同的建模思路,并無(wú)優(yōu)劣之分。
學(xué)習(xí)者建模的目的就是獲得準(zhǔn)確、精細(xì)的知識(shí)狀態(tài)。就輸出結(jié)果的精細(xì)化程度而言,有些模型僅可展示是否掌握的離散值,有些模型卻可展示具體掌握程度的連續(xù)值。就輸出結(jié)果的準(zhǔn)確度而言,除增加輸入數(shù)據(jù)、豐富模型參數(shù)外,建模時(shí)還應(yīng)在一定程度上考慮各種因素,如一道題考察多個(gè)知識(shí)點(diǎn),掌握一道題中涉及幾個(gè)知識(shí)點(diǎn)才可能答對(duì)該題、該知識(shí)點(diǎn)是否被標(biāo)全等。
①輸出結(jié)果的精細(xì)化程度。認(rèn)知診斷模型通常以是否掌握二元狀態(tài)來(lái)描述,但實(shí)質(zhì)上二元狀態(tài)是在計(jì)算概率值后劃分而來(lái)的;也有少數(shù)多維IRT模型以能力值(通常取值范圍為[-4, +4])來(lái)表征每一個(gè)知識(shí)維度的掌握情況。貝葉斯知識(shí)追蹤模型的輸出結(jié)果依賴于HMM框架中的隱狀態(tài),通常為掌握、未掌握兩種;也有研究者嘗試進(jìn)行更為精細(xì)化的劃分,如Zhang等[37]提出在二分知識(shí)掌握情況中間加入過(guò)渡狀態(tài),將建模結(jié)果分為三種:掌握、可能掌握、未掌握。深度知識(shí)追蹤模型可獲得學(xué)習(xí)者對(duì)每一個(gè)知識(shí)點(diǎn)的掌握概率,其范圍為0~1之間的連續(xù)值。
②輸出結(jié)果的準(zhǔn)確度。對(duì)于一道題考察多個(gè)知識(shí)點(diǎn)的現(xiàn)象,現(xiàn)實(shí)生活中并不少見(jiàn)。認(rèn)知診斷模型相關(guān)研究對(duì)此思考較多,并衍生出各種模型。例如,掌握一道題中涉及的幾個(gè)知識(shí)點(diǎn)才可能答對(duì)該題,針對(duì)這一問(wèn)題,不同的認(rèn)知診斷模型采用了不同的假設(shè):DINA模型假設(shè)所有知識(shí)點(diǎn)全部掌握才能答對(duì);DINO模型假設(shè)只要掌握其中一個(gè)知識(shí)點(diǎn)就可能答對(duì);R-RUM模型則假設(shè)隨著掌握的知識(shí)點(diǎn)數(shù)量增加,答對(duì)的概率隨之增加。又如,針對(duì)一道題考察了多個(gè)知識(shí)點(diǎn)但知識(shí)點(diǎn)并未標(biāo)注完全的情況,RUM模型作為R-RUM簡(jiǎn)化前的版本,增加了一個(gè)參數(shù)表示Q矩陣以外被忽略的殘余能力。貝葉斯知識(shí)追蹤模型并沒(méi)有考慮到這一問(wèn)題,但也有Xu等[38]嘗試采用動(dòng)態(tài)貝葉斯網(wǎng)絡(luò)追蹤每一個(gè)知識(shí)點(diǎn)。深度知識(shí)追蹤模型的相關(guān)研究也不多,Xiong等[39]表示DKT在處理該問(wèn)題時(shí)將單條作答記錄擴(kuò)展成多條記錄,這是DKT的效果顯著優(yōu)于BKT的原因;但是,DKT的輸出結(jié)果存在波動(dòng)性,即調(diào)換答題順序后所得的知識(shí)狀態(tài)結(jié)果不同。
總體來(lái)說(shuō),認(rèn)知診斷模型的建模結(jié)果既可以是連續(xù)值,也可以是離散值,且對(duì)一道題考察多個(gè)知識(shí)點(diǎn)等細(xì)節(jié)問(wèn)題做出了良好的應(yīng)對(duì)。貝葉斯知識(shí)追蹤模型的建模結(jié)果只有掌握或未掌握兩種值,雖然也有研究嘗試突破二元狀態(tài),但由于HMM模型本身隱狀態(tài)的限制,使其只能在離散狀態(tài)的個(gè)數(shù)上進(jìn)行突破,并不能將離散過(guò)渡改為連續(xù)過(guò)渡。深度知識(shí)追蹤模型可通過(guò)權(quán)重參數(shù)計(jì)算0~1之間的連續(xù)值,準(zhǔn)確度也優(yōu)于貝葉斯知識(shí)追蹤,但存在結(jié)果波動(dòng)性的問(wèn)題。
學(xué)習(xí)者建模的價(jià)值不止于獲得學(xué)習(xí)者知識(shí)狀態(tài),更重要的是應(yīng)用建模結(jié)果進(jìn)行個(gè)性化推薦。首先,需明確認(rèn)知診斷和知識(shí)追蹤兩種方法在個(gè)性化學(xué)習(xí)系統(tǒng)中的應(yīng)用場(chǎng)景,這是保證建模結(jié)果的第一步。然后,根據(jù)建模結(jié)果,應(yīng)用可行的方法為學(xué)習(xí)者提供個(gè)性化學(xué)習(xí)資源推薦等服務(wù)。
①應(yīng)用場(chǎng)景。認(rèn)知診斷適用于短時(shí)間內(nèi)可完成的測(cè)試或作業(yè)場(chǎng)景,而知識(shí)追蹤更適用于持續(xù)性的日常練習(xí)場(chǎng)景。具體來(lái)說(shuō),用于認(rèn)知診斷模型的作答數(shù)據(jù),一般是在學(xué)習(xí)者知識(shí)狀態(tài)未發(fā)生改變的時(shí)間范圍內(nèi);而知識(shí)追蹤是為了在學(xué)習(xí)者進(jìn)行知識(shí)習(xí)得的過(guò)程中,對(duì)動(dòng)態(tài)變化的知識(shí)狀態(tài)進(jìn)行建模。從模型本身也可看出,用于貝葉斯知識(shí)追蹤的貝葉斯網(wǎng)絡(luò)和用于深度知識(shí)追蹤的循環(huán)神經(jīng)網(wǎng)絡(luò)本就是針對(duì)時(shí)序問(wèn)題的模型;對(duì)于相同的題目和相同的答案,若做題順序不同,知識(shí)追蹤模型得到的知識(shí)狀態(tài)結(jié)果也會(huì)不同。
②應(yīng)用方法。根據(jù)認(rèn)知診斷和知識(shí)追蹤方法獲得認(rèn)知優(yōu)勢(shì)與劣勢(shì)后,一方面可直接推薦與未掌握知識(shí)點(diǎn)相對(duì)應(yīng)的資源,以進(jìn)行針對(duì)性補(bǔ)救;另一方面可與協(xié)同過(guò)濾、矩陣分解等推薦領(lǐng)域常用的方法結(jié)合提供學(xué)習(xí)者知識(shí)狀態(tài)信息,以提高推薦的有效性。除此通用方法之外,認(rèn)知診斷特有一種已成體系的推薦方法——認(rèn)知診斷自適應(yīng)測(cè)試(Cognitive Diagnostic Computerized Adaptive Testing,CD-CAT)中的選題算法,其本意是高效測(cè)量學(xué)習(xí)者的知識(shí)狀態(tài)及能力水平,本質(zhì)上也是針對(duì)每一個(gè)學(xué)習(xí)者予以個(gè)性化題目推薦。
總體來(lái)說(shuō),認(rèn)知診斷和知識(shí)追蹤方法的出發(fā)點(diǎn)不同,前者為靜態(tài)診斷,尤其適用于測(cè)試場(chǎng)景;后者為動(dòng)態(tài)預(yù)測(cè),更適用于能夠體現(xiàn)知識(shí)狀態(tài)變化的知識(shí)習(xí)得過(guò)程。認(rèn)知診斷和知識(shí)追蹤均可與協(xié)同過(guò)濾、矩陣分解等常用方法相結(jié)合,以實(shí)現(xiàn)學(xué)習(xí)資源的有效、個(gè)性化推薦。但相較于知識(shí)追蹤而言,認(rèn)知診斷還可借鑒自適應(yīng)測(cè)試中的選題策略向每個(gè)學(xué)習(xí)者推薦個(gè)性化題目。
本研究圍繞學(xué)習(xí)者建模需要考慮的四個(gè)關(guān)鍵問(wèn)題,即以何建模、如何建模、結(jié)果為何、如何應(yīng)用,論述分析認(rèn)知診斷和知識(shí)追蹤這兩種方法的特點(diǎn)及優(yōu)劣勢(shì)。總結(jié)來(lái)說(shuō),在輸入維度方面,知識(shí)追蹤比認(rèn)知診斷更具可擴(kuò)展性;在模型參數(shù)方面,兩者采用的建模思路不同,因而參數(shù)類別不同;在輸出結(jié)果方面,認(rèn)知診斷比知識(shí)追蹤更為精細(xì)化、多樣化;在建模應(yīng)用方面,認(rèn)知診斷適用于靜態(tài)評(píng)估,而知識(shí)追蹤適用于動(dòng)態(tài)預(yù)測(cè)。
為了合理采用這兩種方法以服務(wù)于智能教育領(lǐng)域,本研究提出以下建議:①針對(duì)兩種方法的優(yōu)劣勢(shì)進(jìn)行算法的整合與改進(jìn)研究。例如,Wang等[40]提出神經(jīng)認(rèn)知診斷框架,既保留了認(rèn)知診斷方法的準(zhǔn)確性和可解釋性,又納入了神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)較強(qiáng)的函數(shù)擬合能力,可以說(shuō)綜合了認(rèn)知診斷和深度知識(shí)追蹤兩種方法的優(yōu)勢(shì)。②根據(jù)場(chǎng)景和數(shù)據(jù)源來(lái)選擇學(xué)習(xí)者建模方法。若是根據(jù)個(gè)性化學(xué)習(xí)系統(tǒng)中的自適應(yīng)測(cè)試或普通測(cè)試場(chǎng)景做題數(shù)據(jù)來(lái)刻畫(huà)學(xué)習(xí)者知識(shí)狀態(tài),建議選擇認(rèn)知診斷方法;若是根據(jù)有智能提示的導(dǎo)學(xué)場(chǎng)景做題數(shù)據(jù)來(lái)刻畫(huà)學(xué)習(xí)者知識(shí)狀態(tài),則建議選擇知識(shí)追蹤方法——若是擬納入學(xué)習(xí)風(fēng)格、答題時(shí)長(zhǎng)、作答嘗試次數(shù)等數(shù)據(jù)來(lái)刻畫(huà)學(xué)習(xí)者知識(shí)狀態(tài),尤其建議選擇深度知識(shí)追蹤模型。
[1]Pardo A, Jovanovic J, Dawson S, et al. Using learning analytics to scale the provision of personalised feedback[J]. British Journal of Educational Technology, 2019,(1):128-138.
[2]Normadhi N B A, Shuib L, Nasir H N M, et al. Identification of personal traits in adaptive learning environment: Systematic literature review[J]. Computers & Education, 2019,(3):168-190.
[3]萬(wàn)海鵬,余勝泉,王琦,等.基于學(xué)習(xí)認(rèn)知地圖的開(kāi)放學(xué)習(xí)者模型研究[J].現(xiàn)代教育技術(shù),2021,(4):97-104.
[4]黃濤,王一巖,張浩,等.智能教育場(chǎng)域中的學(xué)習(xí)者建模研究趨向[J].遠(yuǎn)程教育雜志,2020,(1):50-60.
[5]張舸,周東岱,葛情情.自適應(yīng)學(xué)習(xí)系統(tǒng)中學(xué)習(xí)者特征模型及建模方法述評(píng)[J].現(xiàn)代教育技術(shù),2012,(5):77-82.
[6]Abyaa A, Khalidi I M, Bennani S. Learner modelling: Systematic review of the literature from the last 5 years[J]. Educational Technology Research and Development, 2019,(5):1105-1143.
[7]Henson R, Douglas J. Test construction for cognitive diagnosis[J]. Applied Psychological Measurement, 2005,(4):262-277.
[8]Fischer G H. The linear logistic test model as an instrument in educational research[J]. Acta Psychologica, 1973,(6):359-374.
[9]Tatsuoka K K. Rule space: An approach for dealing with misconceptions based on item response theory[J]. Journal of Educational Measurement, 1983,(4):345-354.
[10][12]Junker B W, Sijtsma K. Cognitive assessment models with few assumptions, and connections with nonparametric item response theory[J]. Applied Psychological Measurement, 2001,(3):258-272.
[11]Templin J L, Henson R A. Measurement of psychological disorders using cognitive diagnosis models[J]. Psychological Methods, 2006,(3):287-305.
[13]Rupp A A, Templin J, Henson R A. Diagnostic measurement: Theory, methods, and applications[M]. New York: Guilford Press, 2010:131-135.
[14]Maris E. Estimating multiple classification latent class models[J]. Psychometrika, 1999,(2):187-212.
[15]Hartz S, Roussos L. The fusion model for skills diagnosis: Blending theory with practicality[R]. Princeton, NJ: Educational Testing Service, 2008:5-10.
[16]Reckase M D. Multidimensional item response theory[M]. New York, NY: Springer, 2009:86.
[17]高旭亮,龔毅,王芳.多級(jí)評(píng)分認(rèn)知診斷模型述評(píng)[J].心理科學(xué),2021,(2):457-464.
[18]涂冬波,蔡艷,戴海琦,等.一種多級(jí)評(píng)分的認(rèn)知診斷模型:P-DINA模型的開(kāi)發(fā)[J].心理學(xué)報(bào),2010,(10):1011-1020.
[19]Ma W, Torre J de la. A sequential cognitive diagnosis model for polytomous responses[J]. British Journal of Mathematical and Statistical Psychology, 2016,(3):253-275.
[20]Yao L, Schwarz R D. A multidimensional partial credit model with associated item and test statistics: An application to mixed-format tests[J]. Applied Psychological Measurement, 2006,(6):469-492.
[21]Corbett A T, Anderson J R. Knowledge tracing: Modeling the acquisition of procedural knowledge[J]. User Modeling and User-adapted Interaction, 1995,(4):253-278.
[22]張暖,江波.學(xué)習(xí)者知識(shí)追蹤研究進(jìn)展綜述[J].計(jì)算機(jī)科學(xué),2021,(4):213-222.
[23]Piech C, Spencer J, Huang J, et al. Deep knowledge tracing[A]. Proceedings of the 28th International Conference on Neural Information Processing Systems[C]. Massachusetts: MIT Press, 2015:505-513.
[24][28]Zhang L, Xiong X, Zhao S, et al. Incorporating rich features into deep knowledge tracing[A]. Proceedings of the 4th ACM Conference on learning@scale[C]. New York: Association for Computing Machinery, 2017:169-172.
[25]Zhang J, Shi X, King I, et al. Dynamic key-value memory networks for knowledge tracing[A]. Proceedings of the 26th International Conference on World Wide Web[C]. New York: Association for Computing Machinery, 2017:765-774.
[26]Spaulding S, Breazeal C. Affect and inference in Bayesian knowledge tracing with a robot tutor[A]. Proceedings of the10th Annual ACM/IEEE International Conference on Human-Robot Interaction Extended Abstracts[C]. New York: Association for Computing Machinery, 2015:219-220.
[27]González-Brenes J, Huang Y, Brusilovsky P. General features in knowledge tracing to model multiple subskills, temporal item response theory, and expert knowledge[A]. Proceedings of the 7th International Conference on Educational Data Mining[C]. Massachusetts: International Educational Data Mining Society, 2014:84-91.
[29]Huang Y, Hollstein J D G, Brusilovsky P. Modeling skill combination patterns for deeper knowledge tracing[A]. Proceedings of the 24th International Conference on User Modeling, Adaptation, and Personalization (Extended Proceedings)[C]. Berlin: Springer, 2016:1-9.
[30]Chen P, Lu Y, Zheng V W, et al. Prerequisite-driven deep knowledge tracing[A]. Proceedings of 2018 IEEE International Conference on Data Mining (ICDM)[C]. Piscataway: The Institute of Electrical and Electronics Engineers, 2018:39-48.
[31]Pardos Z A, Heffernan N T. KT-IDEM: Introducing item difficulty to the knowledge tracing model[A]. Proceedings of the 19th International Conference on User Modeling, Adaptation, and Personalization[C]. Berlin: Springer, 2011:243-254.
[32]Pardos Z A, Heffernan N T. Modeling individualization in a Bayesian networks implementation of knowledge tracing[A]. Proceedings of the 18th International Conference on User Modeling, Adaptation, and Personalization[C]. Berlin: Springer, 2010:255-266.
[33]Lee J I, Brunskill E. The impact on individualizing student models on necessary practice opportunities[A]. Proceedings of the 5th International Conference on Educational Data Mining[C]. Massachusetts: International Educational Data Mining Society, 2012:118-125.
[34]Qiu Y, Qi Y, Lu H, et al. Does time matter? Modeling the effect of time with Bayesian knowledge tracing[A]. Proceedings of the 4th International Conference on Educational Data Mining[C]. Massachusetts: International Educational Data Mining Society, 2011:139-148.
[35]Nedungadi P, Remya M S. Incorporating forgetting in the personalized, clustered, Bayesian knowledge tracing (pc-bkt) model[A]. Proceedings of 2015 International Conference on Cognitive Computing and Information processing[C]. Piscataway: Institute of Electrical and Electronics Engineers, 2015:353-357.
[36]Nagatani K, Zhang Q, Sato M, et al. Augmenting knowledge tracing by considering forgetting behavior[A]. Proceedings of the 28th International Conference on World Wide Web[C]. New York: Association for Computing Machinery, 2019:3101-3107.
[37]Zhang K, Yao Y. A three learning states Bayesian knowledge tracing model[J]. Knowledge-Based Systems, 2018, 148:189-201.
[38]Xu Yanbo, Jack Mostow. Using logistic regression to trace multiple sub-skills in a dynamic Bayes net[A]. Proceedings of the 4th International Conference on Educational Data Mining[C]. Massachusetts: International Educational Data Mining Society, 2011:241-246.
[39]Xiong X, Zhao S, Van Inwegen E G, et al. Going deeper with deep knowledge tracing[A]. Proceedings of the 9th International Conference on Educational Data Mining[C]. Massachusetts: International Educational Data Mining Society, 2016:545-550.
[40]Wang F, Liu Q, Chen E, et al. Neural cognitive diagnosis for intelligent education systems[A]. Proceedings of the AAAI Conference on Artificial Intelligence[C]. Palo Alto: Association for the Advancement of Artificial Intelligence, 2020:6153-6161.
All Roads Lead to Rome: Cognitive Diagnosis and Knowledge Tracing——A Comparison of Two Modeling Methods for Mainstream Learners’ Knowledge State
DAI Jing GU Xiao-qing[Corresponding Author]JIANG Bo
The modeling of learners’ knowledge state is one of the important tasks to build a personalized learning system. At present, there are two main mainstream methods for modeling learners’ knowledge state, namely the cognitive diagnosis method proposed by experts in the field of psychometrics and the knowledge tracking method proposed by experts in the field of human-computer interaction. In order to more properly apply the two methods to the field of intelligent education, this paper focused on the four issues of what to model, how to model, what the result is, and how to apply, discussed and compared cognitive diagnosis and knowledge tracking methods from four aspects of the scalability of input dimensions, the adaptability of modeling parameters, the refinement of output results, and the assistance of personalized recommendation services. In conclusion, the cognitive diagnosis was suitable for static evaluation and was more refined and diversified in terms of output results, while the knowledge tracking model was suitable for dynamic prediction and was more scalable in terms of input dimensions. Through research, this paper hoped to provide reference for researchers to apply these two methods reasonably to serve the personalized learning system.
learner modeling; knowledge state; cognitive diagnosis; knowledge tracing
G40-057
A
1009—8097(2022)04—0088—11
10.3969/j.issn.1009-8097.2022.04.010
基金項(xiàng)目:本文受上海市“科技創(chuàng)新行動(dòng)計(jì)劃”人工智能科技支撐專項(xiàng)“教育數(shù)據(jù)治理與智能教育大腦關(guān)鍵技術(shù)研究及典型應(yīng)用”(項(xiàng)目編號(hào):20511101600)資助。
戴靜,在讀博士,研究方向?yàn)閷W(xué)習(xí)分析與計(jì)算機(jī)測(cè)評(píng),郵箱為925613528@qq.com。
2021年7月30日
編輯:小時(shí)