張春飛1,李萬(wàn)龍2,魏久鴻1
(1.吉林大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,吉林長(zhǎng)春 130062;2.長(zhǎng)春工業(yè)大學(xué)計(jì)算機(jī)科學(xué)與工程學(xué)院,吉林長(zhǎng)春 130012)
當(dāng)今社會(huì),人們?cè)絹?lái)越重視教育的投入,據(jù)不完全統(tǒng)計(jì),每年世界各類組織用于教育培訓(xùn)的費(fèi)用高達(dá)250億美元[1]。傳統(tǒng)的學(xué)習(xí)過(guò)程僅僅局限于書(shū)本和課堂,顯然已不適應(yīng)今天教育的快速發(fā)展。E-learning環(huán)境允許學(xué)習(xí)者在模擬實(shí)驗(yàn)室中進(jìn)行實(shí)驗(yàn)[2],觀看視頻和在線學(xué)習(xí)其他國(guó)家的語(yǔ)言[3]。E-learning系統(tǒng)可以概括為一個(gè)基于web的系統(tǒng),通過(guò)用戶在線通訊技術(shù)來(lái)實(shí)現(xiàn)學(xué)習(xí)者與學(xué)習(xí)系統(tǒng)的交互[4]。目前,它主要是指網(wǎng)上課程的學(xué)習(xí)。不同的基于web的學(xué)習(xí)管理系統(tǒng)已經(jīng)發(fā)展到在線對(duì)學(xué)習(xí)者的學(xué)習(xí)過(guò)程進(jìn)行全程實(shí)時(shí)幫助。傳統(tǒng)的網(wǎng)絡(luò)教學(xué)環(huán)境缺乏用戶與系統(tǒng)的交互,不能智能地分析和評(píng)估教育資源,從而導(dǎo)致不能根據(jù)學(xué)習(xí)者的學(xué)習(xí)水平制定個(gè)性化的學(xué)習(xí)指導(dǎo)[5]。根據(jù)學(xué)習(xí)者的學(xué)習(xí)層次提供合適的交互的學(xué)習(xí)環(huán)境能夠追蹤學(xué)習(xí)者的學(xué)習(xí)特點(diǎn),從而提供個(gè)性化的學(xué)習(xí)課程[6]。當(dāng)學(xué)習(xí)者帶著相同的學(xué)習(xí)請(qǐng)求再次登錄該系統(tǒng)時(shí),個(gè)性化的學(xué)習(xí)推薦模型便自動(dòng)生成了。通過(guò)分析學(xué)習(xí)日志信息,為學(xué)習(xí)者提供個(gè)性化的學(xué)習(xí)資源。而且這些算法可以識(shí)別學(xué)習(xí)者的興趣和偏好,從而在無(wú)處不在的網(wǎng)絡(luò)環(huán)境中為學(xué)習(xí)者創(chuàng)建自適應(yīng)的學(xué)習(xí)內(nèi)容[7-8]。
本文給出了一種個(gè)性化的學(xué)習(xí)評(píng)價(jià)環(huán)境,并提出一種新的稱為推拉模式的E-learning模式。在拉模式中,數(shù)據(jù)采集和分析技術(shù)用于挖掘個(gè)人的學(xué)習(xí)信息。在推模式中,利用決策樹(shù)理論和個(gè)性趨勢(shì)分析算法來(lái)分現(xiàn)學(xué)習(xí)過(guò)程中薄弱環(huán)節(jié),從而給用戶提供合理的學(xué)習(xí)建議。
考慮到傳統(tǒng)的網(wǎng)絡(luò)教學(xué)環(huán)境的不足之處,基于推拉模式的思想提出了一個(gè)交互式的個(gè)性化E-learning系統(tǒng)框架。推和拉模式可以有效地提高用戶與系統(tǒng)之間的交互性。
信息采集和分析模塊的主要功能是在LAN范圍內(nèi)從所有節(jié)點(diǎn)收集和分析個(gè)性化的學(xué)習(xí)信息。這些信息資源主要包括注冊(cè)信息、登錄狀態(tài)、學(xué)習(xí)狀態(tài)以及網(wǎng)絡(luò)日志等。系統(tǒng)的數(shù)據(jù)挖掘模塊動(dòng)態(tài)地生成相應(yīng)的記錄,從而提供一個(gè)更好的交互式的學(xué)習(xí)環(huán)境,幫助學(xué)生方便地查詢他們的學(xué)習(xí)情況?;谶@些個(gè)性化的分析信息,系統(tǒng)能夠提供學(xué)習(xí)者的智能評(píng)估情況,以及用于改善教學(xué)環(huán)境的合理建議。信息的采集和分析的過(guò)程主要依賴于LAN中的不同的agent節(jié)點(diǎn)。本文給出了一個(gè)面向教育的動(dòng)態(tài)點(diǎn)擊流采集算法。Agent結(jié)點(diǎn)將收集所有的數(shù)據(jù)信息來(lái)構(gòu)建數(shù)據(jù)庫(kù)中的表,進(jìn)而進(jìn)行個(gè)性化的分析和評(píng)估。
推模式的主要任務(wù)是選擇合適的算法來(lái)建立個(gè)性化的學(xué)習(xí)評(píng)估模型。信息分析和評(píng)估模塊如圖1所示。應(yīng)用決策樹(shù)理論和個(gè)性趨勢(shì)分析算法來(lái)評(píng)估學(xué)習(xí)者的學(xué)習(xí)現(xiàn)狀,并提供給他們合理的建議。評(píng)價(jià)結(jié)果存放在一個(gè)表中,稱為PLAT表,即個(gè)性學(xué)習(xí)推薦表。
圖1 個(gè)性化的評(píng)價(jià)和推薦模塊
為了更好地了解學(xué)習(xí)者的狀態(tài),本文引入個(gè)性趨勢(shì)分析算法,基于對(duì)一個(gè)人的學(xué)習(xí)狀態(tài)評(píng)估和考試結(jié)果,能夠預(yù)測(cè)該學(xué)習(xí)者的學(xué)習(xí)趨勢(shì)。學(xué)習(xí)趨勢(shì)能夠表現(xiàn)出,如果該學(xué)生繼續(xù)當(dāng)前的學(xué)習(xí)方法、進(jìn)度和狀態(tài),那么在下一階段的學(xué)習(xí)中,會(huì)得到什么樣的結(jié)果。通過(guò)分析趨勢(shì)預(yù)測(cè)的結(jié)果,系統(tǒng)可以及時(shí)調(diào)整教學(xué)方法和策略,以保證在其下一個(gè)學(xué)習(xí)階段能達(dá)到更好的學(xué)習(xí)效果。個(gè)性趨勢(shì)分析算法分為以下幾個(gè)部分:
2.1.1 歸一化數(shù)據(jù)
原始數(shù)據(jù)如表1所示。對(duì)于各種各樣的評(píng)估數(shù)據(jù),該算法只選擇與系統(tǒng)相關(guān)的幾個(gè)數(shù)據(jù)集,并且將其歸一化成0~10范圍內(nèi)的數(shù)據(jù),作為下一次數(shù)學(xué)分析的基礎(chǔ)。假設(shè)當(dāng)前有n個(gè)數(shù)據(jù)集,如果算法選擇其中的m個(gè)數(shù)據(jù)集,算法的預(yù)測(cè)深度為τ,則它應(yīng)該滿足0<τ 表1 原始數(shù)據(jù)集表 2.1.2 原始數(shù)據(jù)處理 (i)累積轉(zhuǎn)換 (ii)平均值轉(zhuǎn)換 2.1.3 計(jì)算功能 2.1.4 評(píng)估和預(yù)測(cè) (i)MSE(均方誤差) (ii)比值 (iii)最小誤差率 通過(guò)以上的計(jì)算,數(shù)據(jù)評(píng)估和預(yù)測(cè)值如表2所示。 表2 評(píng)估和預(yù)測(cè)表 在表2中,pi0的值越大越好,ci0的值越小越好,它們是對(duì)當(dāng)前原始數(shù)據(jù)的評(píng)估。從x贊i(ni+1)到x贊i(ni+τ)是對(duì)該組數(shù)據(jù)集在下一階段預(yù)測(cè)的結(jié)果。這表明學(xué)習(xí)者目前的學(xué)習(xí)狀態(tài),及在未來(lái)可能達(dá)到的學(xué)習(xí)效果。 表3 預(yù)測(cè)等級(jí)表 表3是預(yù)測(cè)等級(jí)表,Level1是最好的預(yù)測(cè)結(jié)果,它表明如果學(xué)習(xí)者保持目前的學(xué)習(xí)狀態(tài),將能夠保持一個(gè)好的學(xué)習(xí)趨勢(shì)。相對(duì)來(lái)說(shuō),Level4是最壞的情況。學(xué)習(xí)者必須調(diào)整學(xué)習(xí)方法和策略,以扭轉(zhuǎn)當(dāng)前的不良的學(xué)習(xí)情況。 在推模式下,決策樹(shù)理論用來(lái)對(duì)一門學(xué)科進(jìn)行分析,并且對(duì)學(xué)習(xí)者的學(xué)習(xí)信息進(jìn)行評(píng)估。在決策樹(shù)的構(gòu)建過(guò)程中,信息增益方法通常用于幫助確定生成決策樹(shù)的分枝。假設(shè)集合E=F1×F2×…×Fn是一個(gè)n維有限的向量空間,其中Fj是一個(gè)有限的離散符號(hào),E中的元素Vj∈Fj,j=1,2,…,n。設(shè)PE和NE是E中的兩個(gè)實(shí)例的子集,分別稱為正樣例集和負(fù)樣例集,其大小分別為P和N。決策樹(shù)算法是基于以下兩個(gè)假設(shè)進(jìn)行的。 在向量空間E中,對(duì)于任意集合的一個(gè)正確的決策樹(shù)的分類概率同E中的正樣例集和負(fù)樣例集的概率是一致的。構(gòu)建一個(gè)決策樹(shù)來(lái)制定正確的決定所需的信息集合如下: 如果以屬性A作為決策樹(shù)的根,A具有V個(gè)值(V1,V2,…,Vv),它將E分為V個(gè)子集(E1,E2,…,Ev),假設(shè)Ei中包含有Pi個(gè)正樣例集和Ni個(gè)負(fù)樣例集,那么Ei子集所需的期望信息就是I(Pi,Ni),從而使屬性A作為根的信息熵表示為: 將A作為根節(jié)點(diǎn)的信息增益是:Gain(A)=I(p,n)-E(A)。選擇Gain(A)的最大值,也就是說(shuō),選擇E(A)取最小值的屬性A*作為根節(jié)點(diǎn)。對(duì)A*的不同取值對(duì)應(yīng)的E的V個(gè)子集Ei遞歸調(diào)用上述過(guò)程生成A*的一組子節(jié)點(diǎn)B1,B2,…,Bv。 在個(gè)性趨勢(shì)分析算法實(shí)驗(yàn)中,我們選擇了兩個(gè)學(xué)生的相同數(shù)據(jù)集,每一個(gè)都含有10個(gè)原始數(shù)據(jù),選擇其中9個(gè)進(jìn)行計(jì)算,算法的預(yù)測(cè)深度為3,原始數(shù)據(jù)如表4所示。 表4 兩名學(xué)生相同類別的原始數(shù)據(jù)表 計(jì)算結(jié)果如表5所示。根據(jù)表3的預(yù)測(cè)等級(jí),在這個(gè)類別中,學(xué)生1有一個(gè)非常好的數(shù)據(jù)樣本,他對(duì)應(yīng)的等級(jí)為L(zhǎng)evel1,個(gè)人學(xué)習(xí)趨勢(shì)處于上升階段。學(xué)生2的數(shù)據(jù)不夠理想,他對(duì)應(yīng)的等級(jí)為L(zhǎng)evel3,他的學(xué)習(xí)趨勢(shì)處于下降階段,因此,如果他不能改變目前的學(xué)習(xí)方法策略,那么將來(lái)獲取知識(shí)的情況會(huì)更加糟糕。 表5 預(yù)測(cè)結(jié)果表 在學(xué)科評(píng)估實(shí)驗(yàn)中,決策樹(shù)算法用于提供教學(xué)推薦。選擇五門課程的160個(gè)考試成績(jī)作為測(cè)試集來(lái)評(píng)估學(xué)生的情況。測(cè)試成績(jī)?nèi)绫?所示。 表6 五門課程成績(jī)表 將160條記錄全部作為訓(xùn)練集,并將這些記錄分為A、B兩個(gè)層次,如表7所示。 表7 分?jǐn)?shù)統(tǒng)計(jì)表 因此,算法可以得到Course1所需的信息: 基于以上決策樹(shù)理論分析,算法的計(jì)算過(guò)程主要遵循以下規(guī)則: 依據(jù)以上規(guī)則,使用該系統(tǒng)的教師可以適時(shí)地調(diào)整和改進(jìn)他們的課程和教學(xué)策略,以取得最佳的教學(xué)效果。 基于教學(xué)過(guò)程中的推拉模式,本文提出了一個(gè)基于Agent的交互式個(gè)性化學(xué)習(xí)評(píng)估模型。引入個(gè)性趨勢(shì)分析算法,設(shè)計(jì)了個(gè)性分析和評(píng)估模塊,用于滿足不同用戶的交互性和個(gè)性化需要。實(shí)驗(yàn)結(jié)果證實(shí)該評(píng)估算法的有效性和準(zhǔn)確性。然而,信息采集的效率和個(gè)性化評(píng)估的準(zhǔn)確性等問(wèn)題仍需將來(lái)的進(jìn)一步完善。 [1]R.Johnson,S.Hornik,E.Salas.An empirical examination offactors contributingtothe creation ofsuccessful e-learningenvironments[J].International Journal ofHuman-Computer Studies,2008(66):356-369. [2]H.J.Gibbons,C.Evans,A.Payne.Computer simulations improve universityinstructional laboratories[J].Cell BiologyEducation,2004(3):263-269. [3]H.Y.Xu,Y.Feng.Design and Implementation on E-learningSystembased on Agent and integrated with studycontext[J].Computer Engineeringand Design,2009(30):515-520. [4]路鵬,周東岱,解月光.面向E-learning領(lǐng)域的軟件體系結(jié)構(gòu)設(shè)計(jì)[J].中國(guó)電化教育,2011(197):125-131. [5]Q.J.Wang,R.M.Shen.Studies on Web MiningBased Intelligent and Personalized Distance learningEnvironment[J].Computer Engineering,2000(26):157-159. [6]藍(lán)雯飛,鄭波盡.基于資源整合的E-Learning系統(tǒng)研究[J].計(jì)算機(jī)應(yīng)用與軟件,2011(3):53-57. [7]李好,楊貫中.基于本體的E-Learning課程構(gòu)建[J].計(jì)算機(jī)工程與設(shè)計(jì),2010(4):881-884. [8]A.Rae,Y.K.Dwivedi.Web-based implementation ofthe Personalized SystemofInstruction:Acase studyofteachingmathematics in an online learningenvironment[C].Int.J.ofWeb-based Learningand TeachingTechnologies,2007(1):36-39.2.2 學(xué)科評(píng)估:決策樹(shù)分析算法
3 實(shí)驗(yàn)和分析
3.1 評(píng)價(jià):個(gè)性趨勢(shì)分析算法
3.2 推薦:決策樹(shù)分析
5 結(jié)語(yǔ)