郭長(zhǎng)東, 尹永學(xué)
(延邊大學(xué) 理學(xué)院,吉林 延吉 133000)
通過網(wǎng)絡(luò)平臺(tái)進(jìn)行學(xué)習(xí),具有學(xué)習(xí)資源豐富、學(xué)生主體性強(qiáng)、交互獨(dú)特及學(xué)習(xí)時(shí)空靈活的特點(diǎn)[1]。與傳統(tǒng)師生面對(duì)面的教學(xué)方式相比,網(wǎng)絡(luò)平臺(tái)學(xué)習(xí)具有許多獨(dú)特的優(yōu)點(diǎn)。首先,網(wǎng)絡(luò)學(xué)習(xí)資源的豐富使學(xué)生學(xué)習(xí)更加方便,學(xué)生能夠?qū)W習(xí)的課程將不限于本校、不限于本學(xué)科、不限于本校教師,打破了傳統(tǒng)教學(xué)過程中的學(xué)校邊界、學(xué)科邊界以及教師邊界;其次,網(wǎng)絡(luò)學(xué)習(xí)過程中,學(xué)生的主體性變強(qiáng),學(xué)生更多地會(huì)基于自身的興趣去選擇喜歡的課程及喜歡的老師,也會(huì)更加自由地安排自己的學(xué)習(xí)時(shí)間;再次,網(wǎng)絡(luò)學(xué)習(xí)交互獨(dú)特,教師與學(xué)生在云端進(jìn)行交流溝通,大大提升了學(xué)生與教師之間的互動(dòng)積極性。然而,任何事物都有其兩面性。網(wǎng)絡(luò)學(xué)習(xí)給我們帶來諸多便利的同時(shí),也產(chǎn)生了許多弊端,比如,學(xué)生由于缺乏教師的監(jiān)管學(xué)習(xí)態(tài)度變得消極被動(dòng)、教師難以掌握學(xué)生的近期學(xué)習(xí)狀況等。因此,對(duì)學(xué)生的網(wǎng)絡(luò)學(xué)習(xí)行為進(jìn)行分析,并根據(jù)分析結(jié)果采取合理化的措施將變得十分必要。
學(xué)習(xí)分析是近年來教育技術(shù)領(lǐng)域迅速崛起的熱點(diǎn)問題,它的出現(xiàn)也推動(dòng)了教育信息化的浪潮[2]。它通過網(wǎng)絡(luò)得到學(xué)習(xí)的過程數(shù)據(jù),特別是學(xué)生的行為數(shù)據(jù),采用先進(jìn)的分析方法和分析工具,如數(shù)據(jù)挖掘和可視化方法等,對(duì)學(xué)生在學(xué)習(xí)過程中遇到的問題進(jìn)行診斷,并對(duì)學(xué)習(xí)結(jié)果做出預(yù)測(cè),從而有針對(duì)性地優(yōu)化和增強(qiáng)教學(xué)效果[3-4]。王堅(jiān)等通過因子分析提取出能夠客觀反映學(xué)習(xí)特征的兩個(gè)公共因子,并依據(jù)不同學(xué)生的因子得分進(jìn)行聚類分析,發(fā)現(xiàn)學(xué)生網(wǎng)絡(luò)學(xué)習(xí)具有群體性的特征[5]。黃丹霞等對(duì)比了不同貝葉斯知識(shí)跟蹤模型預(yù)測(cè)的準(zhǔn)確率,發(fā)現(xiàn)當(dāng)采用邏輯回歸算法作為學(xué)生態(tài)度積極性分類算法時(shí),可較準(zhǔn)確地預(yù)測(cè)學(xué)習(xí)態(tài)度[6]。
研究表明,學(xué)生的學(xué)習(xí)態(tài)度對(duì)于學(xué)習(xí)效果至關(guān)重要[7],積極主動(dòng)型的學(xué)生在考試中能夠取得較好的成績(jī),而消極被動(dòng)型學(xué)習(xí)者的成績(jī)往往不理想。本文針對(duì)網(wǎng)絡(luò)課程教學(xué)中教師難以了解學(xué)生的學(xué)習(xí)態(tài)度問題,通過對(duì)學(xué)生的網(wǎng)絡(luò)學(xué)習(xí)行為分析,構(gòu)建學(xué)習(xí)態(tài)度跟蹤模型,以期實(shí)現(xiàn)教師對(duì)學(xué)生學(xué)習(xí)態(tài)度的精準(zhǔn)把握。
本文數(shù)據(jù)主要來源于超星學(xué)習(xí)通,課程涉及延邊大學(xué)數(shù)學(xué)系開設(shè)的運(yùn)籌學(xué)和應(yīng)用隨機(jī)過程,學(xué)生涉及本校2017級(jí)統(tǒng)計(jì)學(xué)和應(yīng)用數(shù)學(xué)專業(yè)全體學(xué)生。指標(biāo)選取方面,本文選取與學(xué)生學(xué)習(xí)態(tài)度相關(guān)性較高的8個(gè)指標(biāo),分別為課程簽到率、課程積分、課程討論回復(fù)數(shù)、章節(jié)學(xué)習(xí)次數(shù)、作業(yè)提交次數(shù)、作業(yè)平均分?jǐn)?shù)、期中考試分?jǐn)?shù)、考前測(cè)驗(yàn)分?jǐn)?shù)。計(jì)算指標(biāo)間相關(guān)系數(shù)矩陣,按照指標(biāo)間相關(guān)性強(qiáng)弱可以將上述8個(gè)指標(biāo)大致分為3大類,如表1所示。對(duì)于學(xué)生的學(xué)習(xí)態(tài)度標(biāo)簽數(shù)據(jù),本文運(yùn)用調(diào)查法獲取,通過尋訪任課教師,和教師溝通交流學(xué)生的學(xué)習(xí)態(tài)度情況,并由老師對(duì)學(xué)生的態(tài)度進(jìn)行打分(10分制),將獲取的態(tài)度標(biāo)簽數(shù)據(jù)進(jìn)行分類匯總,轉(zhuǎn)化為二分類變量:一類是積極主動(dòng)型的學(xué)習(xí)態(tài)度,另一類是消極被動(dòng)型的學(xué)習(xí)態(tài)度。
表1 學(xué)生網(wǎng)絡(luò)學(xué)習(xí)行為觀測(cè)指標(biāo)Tab.1 Observation index of students’ online learning behavior
由于數(shù)據(jù)量較小,為了防止模型產(chǎn)生過擬合現(xiàn)象,所以本文采用K折交叉驗(yàn)證方式。K折交叉驗(yàn)證思想如下:首先將數(shù)據(jù)分成K份,其中一份作為測(cè)試集,另外K-1份作為訓(xùn)練集,以此類推,這樣使得每一份都有作為測(cè)試集進(jìn)行預(yù)測(cè)的機(jī)會(huì),最終將所有結(jié)果進(jìn)行投票,選取票數(shù)最多的結(jié)果作為最終預(yù)測(cè)結(jié)果[8-9]。實(shí)驗(yàn)中發(fā)現(xiàn)K取5時(shí)預(yù)測(cè)效果較好,故本文中采用的是五折交叉驗(yàn)證方式。
本文數(shù)據(jù)在范圍和量綱方面存在較大差異,為提升模型的預(yù)測(cè)效果,在模型訓(xùn)練前,需要對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,本文采用均值方差歸一化方法對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理。
分類是機(jī)器學(xué)習(xí)領(lǐng)域的一種重要的有監(jiān)督學(xué)習(xí)方法[10],本文對(duì)學(xué)生的學(xué)習(xí)態(tài)度進(jìn)行分類,將學(xué)生的學(xué)習(xí)態(tài)度分為兩類——積極主動(dòng)型和消極被動(dòng)型。積極主動(dòng)型學(xué)生通常會(huì)表現(xiàn)出如下特點(diǎn):日常簽到率較高,作業(yè)完成度較高,課程積分較高,課堂討論的回復(fù)數(shù)較多,消極被動(dòng)型學(xué)生相反。本文的模型設(shè)計(jì)包括獲取數(shù)據(jù)、數(shù)據(jù)預(yù)處理、特征選擇、模型構(gòu)建、模型評(píng)價(jià),模型設(shè)計(jì)的基本原理如圖1所示。算法方面,本文選取支持向量機(jī)、隨機(jī)森林和AdaBoost自適應(yīng)提升算法完成分類任務(wù),通過對(duì)比不用算法的訓(xùn)練結(jié)果,選取分類準(zhǔn)確率最高的算法作為態(tài)度跟蹤模型的分類算法。模型評(píng)價(jià)方面,本文選取分類算法常用的準(zhǔn)確率、精準(zhǔn)率、召回率和F1值度量。
圖1 分類器訓(xùn)練的基本原理Fig.1 The basic principle of classifier training
本文選用Python作為建模工具,實(shí)驗(yàn)平臺(tái)為Windows10下的JupyterNotebook,使用不同分類算法分別對(duì)學(xué)生的態(tài)度進(jìn)行預(yù)測(cè),將預(yù)測(cè)結(jié)果與調(diào)查結(jié)果進(jìn)行對(duì)比得到的預(yù)測(cè)準(zhǔn)確率如表2所示。從結(jié)果中可以看出,AdaBoost算法的分類準(zhǔn)確率最高。
表2 不同分類算法準(zhǔn)確率比較Tab.2 Accuracy comparison of different classification algorithms
實(shí)驗(yàn)以學(xué)習(xí)者態(tài)度積極為正類,消極為負(fù)類,對(duì)比分析了不同分類算法的精準(zhǔn)率、召回率和F值度量,結(jié)果如表3所示,其中AdaBoost取得100%的好分?jǐn)?shù),意味著在預(yù)測(cè)過程中學(xué)習(xí)態(tài)度積極的同學(xué)被誤判為不積極的概率和學(xué)習(xí)態(tài)度不積極的同學(xué)被誤判為積極的概率幾乎為零。
表3 不同分類算法各類指標(biāo)比較Tab.3 Comparison of various indexes of different classification algorithms
綜合表2和表3的結(jié)果,AdaBoost算法通過集成弱分類器形成強(qiáng)分類器,對(duì)學(xué)習(xí)態(tài)度進(jìn)行預(yù)測(cè)可以得到較好的訓(xùn)練效果,故本文選用AdaBoost算法作為學(xué)生態(tài)度跟蹤模型的分類算法。
本文基于超星學(xué)習(xí)通課程的網(wǎng)絡(luò)學(xué)習(xí)行為數(shù)據(jù)和調(diào)查法得到的學(xué)習(xí)態(tài)度標(biāo)簽數(shù)據(jù),構(gòu)建基于分類算法的學(xué)習(xí)態(tài)度跟蹤模型,對(duì)學(xué)生學(xué)習(xí)態(tài)度進(jìn)行預(yù)測(cè)。實(shí)驗(yàn)結(jié)果表明,本文構(gòu)建的模型具備對(duì)學(xué)習(xí)態(tài)度進(jìn)行預(yù)測(cè)的能力,能夠幫助教師及時(shí)了解學(xué)生的學(xué)習(xí)態(tài)度,亦能夠?qū)W(xué)生的學(xué)習(xí)過程起到監(jiān)督作用。