(1.泉州師范學(xué)院 數(shù)學(xué)與計(jì)算機(jī)科學(xué)學(xué)院,福建 泉州 362000;2.福建省大數(shù)據(jù)管理新技術(shù)與知識(shí)工程重點(diǎn)實(shí)驗(yàn)室,福建 泉州 362000;3.智能計(jì)算與信息處理福建省高等學(xué)校重點(diǎn)實(shí)驗(yàn)室,福建 泉州 362000)
現(xiàn)有教學(xué)系統(tǒng)提供的教學(xué)資源、練習(xí)或作業(yè)幾乎都是靜態(tài)的,所有的學(xué)習(xí)者下載同樣的教學(xué)資源,完成同樣的練習(xí)及作業(yè),教學(xué)系統(tǒng)無(wú)法對(duì)不同學(xué)生的學(xué)習(xí)情況及知識(shí)掌握情況做出區(qū)分.但教學(xué)系統(tǒng)中也存在著大量的學(xué)習(xí)者學(xué)習(xí)行為,如點(diǎn)擊行為、瀏覽行為,還包括作業(yè)、練習(xí)、考試等完成情況.此外,部分智能教學(xué)系統(tǒng)甚至可以記錄詳細(xì)的學(xué)生解題過(guò)程行為,在這樣具有海量行為日志的環(huán)境中,新型的智能教學(xué)系統(tǒng)應(yīng)能自動(dòng)識(shí)別出學(xué)習(xí)者的學(xué)習(xí)特點(diǎn)及學(xué)習(xí)傾向,跟蹤學(xué)習(xí)者的學(xué)習(xí)情況,對(duì)學(xué)習(xí)者的知識(shí)點(diǎn)掌握程度進(jìn)行實(shí)時(shí)評(píng)估,從而能夠調(diào)整學(xué)習(xí)者的學(xué)習(xí)策略,向?qū)W習(xí)者推送薄弱知識(shí)點(diǎn)的教學(xué)資源、例題、作業(yè)及練習(xí)等,甚至是制訂個(gè)性化學(xué)習(xí)路徑.因此,根據(jù)學(xué)生的解題過(guò)程對(duì)其學(xué)習(xí)行為進(jìn)行預(yù)測(cè)及評(píng)估就顯得尤為重要.但在對(duì)學(xué)生解題過(guò)程行為進(jìn)行分析時(shí),首先題目之間具有較為復(fù)雜的相互關(guān)系;其次,對(duì)于同一類(lèi)題目,不同的學(xué)習(xí)者可能使用不同的知識(shí)點(diǎn)并采用不同的方法來(lái)解答,再加上不同學(xué)習(xí)者對(duì)所使用知識(shí)點(diǎn)的掌握情況不同,這樣就構(gòu)成了一個(gè)具有高度不確定性的復(fù)雜系統(tǒng).在這樣的一個(gè)復(fù)雜系統(tǒng)中,必須采用一種能有效開(kāi)展復(fù)雜系統(tǒng)分析的新方法,而貝葉斯網(wǎng)絡(luò)作為人工智能領(lǐng)域中不確定知識(shí)表達(dá)與推理的方法之一,在故障診斷[1,2]、態(tài)勢(shì)估計(jì)[3,4]、醫(yī)學(xué)診斷[5]、風(fēng)險(xiǎn)評(píng)估[6]、目標(biāo)識(shí)別[7]、推薦系統(tǒng)[8]等領(lǐng)域均得到了廣泛應(yīng)用.利用貝葉斯網(wǎng)絡(luò)來(lái)評(píng)估及預(yù)測(cè)學(xué)習(xí)者的解題過(guò)程行為具有以下幾個(gè)優(yōu)點(diǎn):首先,可以通過(guò)樣本數(shù)據(jù)學(xué)習(xí)來(lái)構(gòu)建貝葉斯網(wǎng)絡(luò)結(jié)構(gòu),避免了主觀性;其次,能通過(guò)貝葉斯網(wǎng)絡(luò)的網(wǎng)絡(luò)結(jié)構(gòu)清晰地表達(dá)解題過(guò)程之間的因果關(guān)系;最后,貝葉斯網(wǎng)絡(luò)具有學(xué)習(xí)能力,可以根據(jù)學(xué)習(xí)者的解題情況高效地更新網(wǎng)絡(luò)中的概率信息,實(shí)現(xiàn)對(duì)實(shí)習(xí)者學(xué)習(xí)情況的實(shí)時(shí)跟蹤.因此,本文采用貝葉斯網(wǎng)絡(luò)方法,首先根據(jù)己有的學(xué)習(xí)者解題過(guò)程行為為每一類(lèi)題目構(gòu)建貝葉斯網(wǎng)絡(luò),在此基礎(chǔ)上,將具有關(guān)聯(lián)關(guān)系的貝葉斯網(wǎng)絡(luò)合并,構(gòu)建鏈?zhǔn)截惾~斯網(wǎng)絡(luò),旨在對(duì)學(xué)習(xí)者的學(xué)習(xí)行為進(jìn)行評(píng)估及預(yù)測(cè).
貝葉斯網(wǎng)絡(luò)是一組隨機(jī)變量u={X1,X2,…,Xn}上概率分布的圖形表示[9],它由兩部分構(gòu)成:
1)有向無(wú)環(huán)圖(Directed Acyclic Graph,DAG),即貝葉斯網(wǎng)絡(luò)結(jié)構(gòu),圖的節(jié)點(diǎn)對(duì)應(yīng)了隨機(jī)變量,而連接節(jié)點(diǎn)的有向邊則表示父節(jié)點(diǎn)對(duì)子節(jié)點(diǎn)的直接影響;
2)每個(gè)節(jié)點(diǎn)都關(guān)聯(lián)著一個(gè)條件概率分布(conditional probability distribution,CPD),這可以表示該節(jié)點(diǎn)與其所有父節(jié)點(diǎn)之間的相互關(guān)系.假若該節(jié)點(diǎn)沒(méi)有父節(jié)點(diǎn),則條件概率分布轉(zhuǎn)化為邊緣分布.所有節(jié)點(diǎn)的條件概率分布可以用P(Xi|Pai(Xi))來(lái)表示,其中Pai(Xi)表示有向無(wú)環(huán)圖中結(jié)點(diǎn)Xi的父結(jié)點(diǎn)集合.因此,X的聯(lián)合概率分布可以表示為:
貝葉斯網(wǎng)絡(luò)學(xué)習(xí)包括結(jié)構(gòu)學(xué)習(xí)和參數(shù)學(xué)習(xí),結(jié)構(gòu)學(xué)習(xí)是指網(wǎng)絡(luò)結(jié)構(gòu)的構(gòu)建,而參數(shù)學(xué)習(xí)是指在網(wǎng)絡(luò)結(jié)構(gòu)己知的情況下,計(jì)算出每個(gè)節(jié)點(diǎn)的條件概率表.無(wú)論是結(jié)構(gòu)學(xué)習(xí)和參數(shù)學(xué)習(xí)均可以采用基于專(zhuān)家經(jīng)驗(yàn)的學(xué)習(xí)方法和基于數(shù)據(jù)的學(xué)習(xí)方法.基于專(zhuān)家經(jīng)驗(yàn)的網(wǎng)絡(luò)結(jié)構(gòu)學(xué)習(xí)和參數(shù)學(xué)習(xí)分別是指專(zhuān)家根據(jù)先驗(yàn)知識(shí)中的因果關(guān)系來(lái)確定貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)及每個(gè)節(jié)點(diǎn)的條件概率.然而,在對(duì)復(fù)雜系統(tǒng)進(jìn)行分析時(shí),單純利用專(zhuān)家經(jīng)驗(yàn)構(gòu)建貝葉斯網(wǎng)絡(luò)模型存在著工作量大、結(jié)果帶有專(zhuān)家主觀傾向等缺點(diǎn),因此現(xiàn)多采用基于數(shù)據(jù)的學(xué)習(xí)方法.基于數(shù)據(jù)的學(xué)習(xí)是指從己有的客觀觀測(cè)數(shù)據(jù)中學(xué)習(xí)出貝葉斯網(wǎng)絡(luò),這同樣包括網(wǎng)絡(luò)結(jié)構(gòu)學(xué)習(xí)和參數(shù)學(xué)習(xí).基于數(shù)據(jù)的貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)學(xué)習(xí)是指通過(guò)分析數(shù)據(jù)找到和樣本數(shù)據(jù)集匹配度最好的貝葉斯網(wǎng)絡(luò)結(jié)構(gòu).而基于數(shù)據(jù)的參數(shù)學(xué)習(xí)是指網(wǎng)絡(luò)結(jié)構(gòu)己知時(shí),給定樣本數(shù)據(jù)集,通過(guò)學(xué)習(xí)樣本來(lái)計(jì)算出每個(gè)節(jié)點(diǎn)的概率分布表,從而確定網(wǎng)絡(luò)參數(shù).
本文主要研究學(xué)習(xí)者對(duì)數(shù)學(xué)方程求解的貝葉斯網(wǎng)絡(luò)構(gòu)建.數(shù)學(xué)方程求解具有若干基本方法,如去分母、去括號(hào)、移項(xiàng)、合并項(xiàng)、化系數(shù)等.雖然不同的學(xué)習(xí)者面對(duì)同一形式數(shù)學(xué)方程時(shí)可能采用不同的求解方法,但是在解法有限的情況下貝葉斯網(wǎng)絡(luò)的網(wǎng)絡(luò)結(jié)構(gòu)和參數(shù)學(xué)習(xí)是可以根據(jù)專(zhuān)家知識(shí)來(lái)完成的.但在參數(shù)學(xué)習(xí)方面就需要專(zhuān)家具有豐富的教學(xué)經(jīng)驗(yàn),并且還需要對(duì)全體學(xué)習(xí)者的知識(shí)點(diǎn)掌握情況有充分了解.然而,采用基于專(zhuān)家經(jīng)驗(yàn)的參數(shù)學(xué)習(xí)存在以下兩個(gè)缺點(diǎn):1)隨著學(xué)習(xí)的持續(xù)進(jìn)行,學(xué)習(xí)者的知識(shí)點(diǎn)掌握情況會(huì)發(fā)生變化,這就需要專(zhuān)家根據(jù)學(xué)習(xí)者學(xué)習(xí)情況的變化對(duì)貝葉斯網(wǎng)絡(luò)參數(shù)進(jìn)行實(shí)時(shí)調(diào)整;2)隨著樣本量的持續(xù)增加,可能存在一些專(zhuān)家主觀未能注意到的關(guān)系或情況.基于以上兩點(diǎn)考慮,假若采用基于專(zhuān)家經(jīng)驗(yàn)的方法來(lái)構(gòu)建貝葉斯網(wǎng)絡(luò)及參數(shù)學(xué)習(xí)則需要很大的工作量,且構(gòu)建出來(lái)的貝葉斯網(wǎng)絡(luò)可能帶有專(zhuān)家的主觀傾向性,甚至可能會(huì)遺漏到一些專(zhuān)家沒(méi)能注意到的情況.因此本文采用基于數(shù)據(jù)的方法來(lái)構(gòu)建貝葉斯網(wǎng)絡(luò)并進(jìn)行參數(shù)學(xué)習(xí).本文主要關(guān)注根據(jù)學(xué)習(xí)者的解題過(guò)程來(lái)預(yù)測(cè)后續(xù)解題行為,首先根據(jù)學(xué)習(xí)者的解題過(guò)程來(lái)構(gòu)建貝葉斯網(wǎng)絡(luò),然后為網(wǎng)絡(luò)中的每個(gè)節(jié)點(diǎn)計(jì)算條件概率表.
假設(shè)己有解題日志如下,共包含2個(gè)學(xué)生的對(duì)同一類(lèi)題目P1的解題過(guò)程,表格中編號(hào)的第1位數(shù)表示學(xué)生編號(hào),第二位數(shù)表示該生解題過(guò)程的步驟編號(hào).第一個(gè)步驟為要解的數(shù)學(xué)方程,后續(xù)幾行是學(xué)生的解題過(guò)程,過(guò)程中的若干步驟根據(jù)學(xué)生的解題方法對(duì)應(yīng)了一個(gè)知識(shí)點(diǎn).采用如下步驟構(gòu)建貝葉斯網(wǎng)絡(luò):
1)如下表所示,對(duì)于P1類(lèi)型的題目,教學(xué)系統(tǒng)會(huì)生成不同的常數(shù)、系數(shù)及方程變量名,因此首先應(yīng)該對(duì)步驟中的方程進(jìn)行規(guī)范,規(guī)范后的步驟如表中第3列所示.
2)對(duì)比表1中的兩組解題步驟,前3步兩位學(xué)習(xí)者應(yīng)用了同樣的知識(shí)點(diǎn)來(lái)解題.但是,從第4步開(kāi)始,編號(hào)為2的學(xué)習(xí)者應(yīng)用了與編號(hào)為1的學(xué)習(xí)者不同的知識(shí)點(diǎn)來(lái)解題,因而產(chǎn)生了兩組不一樣解題過(guò)程.而且,觀察編號(hào)1.5和2.5的規(guī)范步驟,兩個(gè)規(guī)范步驟中的方程是一樣的,但是兩位學(xué)習(xí)者面對(duì)同樣的方程應(yīng)用的知識(shí)點(diǎn)卻不一樣.因此要構(gòu)建的貝葉斯網(wǎng)絡(luò)中的節(jié)點(diǎn)信息不應(yīng)該只包含規(guī)范步驟信息,還應(yīng)該包含學(xué)生所應(yīng)用的知識(shí)點(diǎn).根據(jù)表1信息所構(gòu)建的貝葉斯網(wǎng)絡(luò)如圖1所示.
表1 2個(gè)學(xué)習(xí)者對(duì)P1類(lèi)方程的解題步驟
圖1 單一題目的貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)
網(wǎng)絡(luò)中共有9個(gè)節(jié)點(diǎn),分別標(biāo)記為1~9.節(jié)點(diǎn)信息包含有規(guī)范好的步驟及學(xué)習(xí)者解當(dāng)前方程所應(yīng)用到的知識(shí)點(diǎn),其中節(jié)點(diǎn)6和9只是計(jì)算,并沒(méi)有關(guān)聯(lián)到系統(tǒng)中預(yù)設(shè)的知識(shí)點(diǎn).根據(jù)表1,編號(hào)為1的學(xué)生采用的解題過(guò)程為:1,2,3,4,5,6,編號(hào)為2的學(xué)生采用的解題過(guò)程為:1,2,3,7,8,6,9.
接下來(lái),從文中所使用數(shù)據(jù)集中提取出采用了同樣兩種解題方法的34組解題過(guò)程對(duì)如上圖貝葉斯網(wǎng)絡(luò)進(jìn)行參數(shù)學(xué)習(xí),可得到以下條件概率參數(shù)表,其中1表示正確,0表示錯(cuò)誤,-1表示不使用該節(jié)點(diǎn).
表2 條件概率參數(shù)表
節(jié)點(diǎn)2節(jié)點(diǎn)1 不使用正確錯(cuò)誤 正確00.560 錯(cuò)誤00.440
節(jié)點(diǎn)3節(jié)點(diǎn)2 不使用正確錯(cuò)誤 正確010.93 錯(cuò)誤000.07 不使用000
節(jié)點(diǎn)4節(jié)點(diǎn)3 不使用正確錯(cuò)誤 正確00.580 錯(cuò)誤00.060 不使用00.361
節(jié)點(diǎn)5節(jié)點(diǎn)4 不使用正確錯(cuò)誤 正確011 錯(cuò)誤000 不使用100
節(jié)點(diǎn)7節(jié)點(diǎn)3不使用正確錯(cuò)誤 正確00.331 錯(cuò)誤00.030 不使用00.630
節(jié)點(diǎn)7節(jié)點(diǎn)3不使用正確錯(cuò)誤 正確00.831 錯(cuò)誤00.160 不使用100
節(jié)點(diǎn)9節(jié)點(diǎn)6不使用正確錯(cuò)誤 正確00.551 錯(cuò)誤000 不使用00.450
節(jié)點(diǎn)5節(jié)點(diǎn)8節(jié)點(diǎn)6不使用正確錯(cuò)誤 不使用正確00.910.09 不使用錯(cuò)誤010 不使用不使用00.50.5 正確正確00.50.5 正確錯(cuò)誤00.50.5 正確不使用010 錯(cuò)誤正確000 錯(cuò)誤錯(cuò)誤000 錯(cuò)誤不使用000
例1:假設(shè)己知有學(xué)習(xí)者解題過(guò)程如下:1(正確)->2(正確)->3(正確)->7(正確),現(xiàn)要預(yù)測(cè)節(jié)點(diǎn)8的狀態(tài),采用條件概率表計(jì)算后,節(jié)點(diǎn)8不使用、錯(cuò)誤、正確的概率分別為0、0.17、0.83,因此本例中貝葉斯網(wǎng)絡(luò)的預(yù)測(cè)結(jié)果為正確.
例2:假設(shè)己知有學(xué)習(xí)者解題過(guò)程如下:1(正確)->2(正確)->3(正確)->4(正確)->5(正確),現(xiàn)要預(yù)測(cè)節(jié)點(diǎn)8的狀態(tài),但節(jié)點(diǎn)7狀態(tài)未知,采用條件概率表計(jì)算后,節(jié)點(diǎn)8不使用、錯(cuò)誤、正確的概率分別為0.64、0.06、0.3.因此本例中貝葉斯網(wǎng)絡(luò)的預(yù)測(cè)結(jié)果為不使用.從圖1可知,該生解題過(guò)程采用的是左側(cè)路徑,與節(jié)點(diǎn)8無(wú)因果關(guān)系,這與貝葉斯網(wǎng)絡(luò)的預(yù)測(cè)結(jié)果一致.
然而,以上方法存在的缺點(diǎn)是對(duì)于每一個(gè)題目只提取出該題目下所有解題過(guò)程來(lái)訓(xùn)練一個(gè)貝葉斯網(wǎng)絡(luò).此外,在實(shí)際教學(xué)過(guò)程中數(shù)學(xué)方程題目的復(fù)雜度是隨著教學(xué)過(guò)程的深入而逐漸遞增的,再?gòu)?fù)雜的數(shù)學(xué)方程終會(huì)被變形或化簡(jiǎn)到簡(jiǎn)單的形式.如表1中方程ax+bx+c=d經(jīng)過(guò)若干解題步驟后終會(huì)被化簡(jiǎn)為ax=b的形式.另外,如前所述,對(duì)于同一類(lèi)題目,不同學(xué)習(xí)者可能采用不同的方法來(lái)解答,大部分學(xué)習(xí)者可能采用常規(guī)方法來(lái)解方程,但小部分學(xué)習(xí)者可能采用特殊的方法解答并且也能得到正確的結(jié)果,在這樣的情況下,采用特殊方法的所構(gòu)成的路徑會(huì)由于訓(xùn)練數(shù)據(jù)偏少而導(dǎo)致對(duì)應(yīng)節(jié)點(diǎn)上的條件概率非常小.基于以上考慮,如果根據(jù)以上方法來(lái)構(gòu)建貝葉斯網(wǎng)絡(luò),學(xué)習(xí)者可能會(huì)因?yàn)椴捎昧颂厥獾慕忸}方法而導(dǎo)致預(yù)測(cè)正確率下降.因此本文提出第二種方法,即鏈?zhǔn)截惾~斯網(wǎng)絡(luò)模型,以題目為單位,先為簡(jiǎn)單形式的題目構(gòu)建貝葉斯網(wǎng)絡(luò),對(duì)于復(fù)雜形式的題目進(jìn)行貝葉斯網(wǎng)絡(luò)構(gòu)建時(shí),依次檢測(cè)新節(jié)點(diǎn)方程是否已經(jīng)對(duì)應(yīng)有貝葉斯網(wǎng)絡(luò),如果已有,則不再將新節(jié)點(diǎn)添加到貝葉斯網(wǎng)絡(luò)中,而是直接指向己有的貝葉斯網(wǎng)絡(luò).例如,為一般形式為ax+bx+c=d的題目構(gòu)建貝葉斯網(wǎng)絡(luò)時(shí),假若學(xué)習(xí)者已經(jīng)經(jīng)過(guò)若干步驟化簡(jiǎn)到ax=b形式,不再繼續(xù)為該網(wǎng)絡(luò)繼續(xù)構(gòu)建后續(xù)路徑,而是直接采用己有的一般形式為ax=b的題目的貝葉斯網(wǎng)絡(luò)進(jìn)行預(yù)測(cè).
實(shí)驗(yàn)所采用的是KDD Cup 2010所提供的智能教學(xué)輔導(dǎo)系統(tǒng)2005-2006年的學(xué)生交互記錄日志.該數(shù)據(jù)集記錄了學(xué)生在系統(tǒng)中解答題目的過(guò)程行為日志信息.系統(tǒng)中的題目主要是解數(shù)學(xué)方程,題目按單元及章節(jié)的結(jié)構(gòu)進(jìn)行劃分,每個(gè)題目均隸屬于某單元下的某章節(jié).學(xué)生在系統(tǒng)中選擇性的答題,即并非每個(gè)學(xué)生都會(huì)解答所有題目.系統(tǒng)將學(xué)生方程求解過(guò)程中的每一次解方程操作(如移項(xiàng)、合并同類(lèi)項(xiàng)、系數(shù)化等)或其他系統(tǒng)操作記錄為一條日志記錄,每條日志記錄包含有學(xué)生編號(hào)、題目、當(dāng)前方程、學(xué)生解當(dāng)前方程所使用的知識(shí)點(diǎn)、是否正確、題目從屬結(jié)構(gòu)、題目查看次數(shù)、步驟開(kāi)始時(shí)間、正確事務(wù)持續(xù)時(shí)間、錯(cuò)誤事務(wù)持續(xù)時(shí)間、步驟結(jié)束時(shí)間、正確次數(shù)、錯(cuò)誤次數(shù)、查看提示次數(shù)等19個(gè)特征.
本文提取數(shù)據(jù)集中包含了規(guī)范化步驟為ax+bx+c=d的所有解題過(guò)程,并且僅研究每組解題過(guò)程中規(guī)范化步驟為ax+bx+c=d及之后的所有解題過(guò)程.由于數(shù)據(jù)集中還包含了非解方程的系統(tǒng)操作記錄,去掉這些與解方程無(wú)關(guān)的系統(tǒng)操作記錄、部分解題組數(shù)過(guò)少的解題過(guò)程后,涉及到的題目包括EG46,EG46A,EG47,EG47A等,合計(jì)共18 494條解題記錄,其中包含3213組解題過(guò)程.根據(jù)每個(gè)題目的組數(shù),分別隨機(jī)提取其中20%作為測(cè)試集,80%作為訓(xùn)練集.其中測(cè)試集以每組解題過(guò)程的最后一條記錄為測(cè)試對(duì)象,由于并非每個(gè)測(cè)試對(duì)象的規(guī)范化步驟和知識(shí)點(diǎn)所構(gòu)成的結(jié)點(diǎn)都存在于貝葉斯網(wǎng)絡(luò)中,因此需要把這些解題過(guò)程去掉,得到最終的測(cè)試集為535組.
表3 兩種方法的實(shí)驗(yàn)結(jié)果
如表1所示,實(shí)驗(yàn)數(shù)據(jù)集中每條日志記錄中包含有當(dāng)前解題步驟的方程,其中的變量名、系數(shù)和常數(shù)均由系統(tǒng)隨機(jī)生成,因此首先需要對(duì)數(shù)據(jù)集中每條日志記錄中的方程進(jìn)行規(guī)范;接著采用本文第3小節(jié)中的方法,對(duì)于每一個(gè)題目,根據(jù)訓(xùn)練集中每個(gè)學(xué)生的解題過(guò)程進(jìn)行貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)的構(gòu)建;第三,根據(jù)學(xué)生的解題步驟的三種狀態(tài):正確、錯(cuò)誤及不使用構(gòu)建參數(shù)學(xué)習(xí)數(shù)據(jù)集,接著采用最大似然估計(jì)法為已經(jīng)構(gòu)建好的貝葉斯網(wǎng)絡(luò)進(jìn)行參數(shù)學(xué)習(xí),得出最終的條件概率表;最后,對(duì)測(cè)試集中每組學(xué)生解題過(guò)程的最后一條記錄采用貝葉斯網(wǎng)絡(luò)進(jìn)行預(yù)測(cè).在以上實(shí)驗(yàn)過(guò)程中還需要注意以下問(wèn)題:在網(wǎng)絡(luò)結(jié)構(gòu)構(gòu)建過(guò)程中會(huì)遇到小部分學(xué)生解題未完成時(shí)發(fā)現(xiàn)做錯(cuò),在同一次解答過(guò)程中產(chǎn)生多次返回重做的路徑,這會(huì)在網(wǎng)絡(luò)構(gòu)建過(guò)程中產(chǎn)生環(huán)路.對(duì)于這樣的情況,需要對(duì)每組解題路徑進(jìn)行檢測(cè)并刪除掉會(huì)產(chǎn)生環(huán)路的路徑
接下來(lái)采用兩種方法分別進(jìn)行實(shí)驗(yàn).首先采用單一題目貝葉斯網(wǎng)絡(luò)(S-BN)的方法,對(duì)于每個(gè)題目均構(gòu)建一個(gè)貝葉斯網(wǎng)絡(luò),只采用該題目的訓(xùn)練集進(jìn)行訓(xùn)練,再使用該題目的測(cè)試集進(jìn)行測(cè)試;其次,采用鏈?zhǔn)截惾~斯網(wǎng)絡(luò)(L-BN)的方法,由于數(shù)據(jù)集中EG53A題目對(duì)應(yīng)的方程即為ax+bx+c=d形式,因此僅采用EG53A的訓(xùn)練集構(gòu)建并訓(xùn)練出一個(gè)貝葉斯網(wǎng)絡(luò),再使用上述同樣的所有題目的測(cè)試集進(jìn)行測(cè)試,對(duì)于每個(gè)題目采用兩種方法分別得到的正確率如表3所示.
從實(shí)驗(yàn)結(jié)果來(lái)看,除了作為L(zhǎng)-BN訓(xùn)練集的題目EG53A及記錄數(shù)太少的題目EG60上正確率相等以外,在其余題目上,L-BN所得到的正確率均優(yōu)于S-BN.首先觀察S-BN的實(shí)驗(yàn)結(jié)果,正確率波動(dòng)較大,主要分布在55%~100%之間.部分題目正確率較高的原因是絕大部分學(xué)生都選用了同樣的方法來(lái)解題,這使得訓(xùn)練數(shù)據(jù)解法較為單一,因此能得到較高的正確率.而部分題目正確率明顯偏低的原因正如前所述,同一題目有多種解法,在這些題目上所有學(xué)生并沒(méi)有采用較為單一的解法,而是分散使用了多種不同的解法,這導(dǎo)致了小部分解法的訓(xùn)練數(shù)據(jù)偏少,因此導(dǎo)致計(jì)算出來(lái)的正確率下降.而L-BN只采用EG53A題目的解題記錄作為訓(xùn)練集,相當(dāng)于對(duì)于訓(xùn)練數(shù)據(jù)偏少的部分解法加入足夠多的訓(xùn)練數(shù)據(jù),因此大部分題目上得到的正確率均有明顯提升.此外,從訓(xùn)練集情況來(lái)看,S-BN的訓(xùn)練數(shù)據(jù)總和有一萬(wàn)余條,且為每個(gè)題目都訓(xùn)練了獨(dú)立的貝葉斯網(wǎng)絡(luò),而L-BN的訓(xùn)練數(shù)據(jù)只有2 030條,只訓(xùn)練了一個(gè)貝葉斯網(wǎng)絡(luò),卻幾乎在所有題目上都得到了優(yōu)于S-BN的正確率.這不僅解決了部分解題方法訓(xùn)練數(shù)據(jù)過(guò)少導(dǎo)致正確率低下的問(wèn)題,而且明顯減少了網(wǎng)絡(luò)結(jié)構(gòu)構(gòu)建時(shí)間和參數(shù)學(xué)習(xí)的訓(xùn)練時(shí)間.
本文主要對(duì)教學(xué)系統(tǒng)上的學(xué)生解數(shù)學(xué)方程的過(guò)程行為進(jìn)行評(píng)估及預(yù)測(cè),首先提出基于單一題目的貝葉斯網(wǎng)絡(luò)模型,分析了該方法存在的不足之處,并在此基礎(chǔ)上,提出鏈?zhǔn)降呢惾~斯網(wǎng)絡(luò)模型,最后通過(guò)實(shí)驗(yàn)驗(yàn)證兩種方法的有效性.實(shí)驗(yàn)表明,比起單一題目的貝葉斯網(wǎng)絡(luò),鏈?zhǔn)截惾~斯網(wǎng)絡(luò)在網(wǎng)絡(luò)構(gòu)建時(shí)間、訓(xùn)練時(shí)間及正確率方面都有顯著性的提升.