呂 品,于文兵,汪 鑫,計春雷
(上海電機學院,上海 201306)
隨著數(shù)據(jù)科學的快速發(fā)展,越來越多的教育研究者開始將目光聚焦于教育數(shù)據(jù)的挖掘分析[1-3]。目的是利用挖掘得到的結果幫助教師改進教學方法,幫助學生改善學習過程,幫助教育管理者們優(yōu)化管理決策。而實現(xiàn)教育數(shù)據(jù)挖掘的重要技術支撐是機器學習算法。
研究者們通常利用決策樹分析學生的在線學習數(shù)據(jù),并以此預測學生的期末考試成績[4];利用樸素貝葉斯算法分析學生入學申請背景,幫助教育機構預測學生的累計平均績點[5]。盡管這些研究在一定程度上實現(xiàn)了學習期預警的作用,但是,它們關注的重點是學生的到課率和作業(yè)提交情況等,忽視了影響學習成績的其他行為特征,如學生在課堂上是否積極舉手、積極參與討論以及關注與該課程相關信息等。因此,有必要在學習成績預測研究中深入研究這些行為特征,分析它們對學習成績的影響,以提高學習成績預測的應用價值。
文中利用學生活動跟蹤工具xAPI,從Kalboard 360[4]學習管理系統(tǒng)中收集了某國際學校高一年級學生春季和秋季2個學期的學習數(shù)據(jù),共480個樣本。其中,春季學期245名學生,秋季學期235名學生。研究目的旨在通過構建學生學習成績預測模型,挖掘分析影響學生成績的關鍵因素,試圖結合挖掘得到的結果提出可操作性的教學策略。
Kalboard 360學習管理系統(tǒng)是一個基于云平臺的學習管理系統(tǒng),由Nidal khalifeh設計,其應用遍布世界50多個國家[4]。它的核心特征是內嵌了教室管理系統(tǒng),使得學生可以通過各種移動設備來體驗教室內外的學習環(huán)境,真正實現(xiàn)了BYOD(bring your own device)的學習理念。此外,教師,學生家長,教育管理者也可通過合適的接口連接到Kalboard 360,使得學生的學習成為一個真正的整體過程。
在研究的480名學生的樣本數(shù)據(jù)中,每個樣本具有16個特征。這些特征分為四類:人口特征,如性別,國籍,出生地和父母對孩子的監(jiān)管,等等;學習背景特征,如教育階段,成績(90-100分的成績類別為優(yōu),用H表示;70-89分的成績類別為中,用M表示;60-69分的成績類別為差,用L表示),年級,上課地點,學期,科目,缺勤天數(shù),等等;家長的行為特征,如父母回答調查、父母對學校的滿意度等;學生的行為特征,如課堂舉手、參與小組討論、訪問資源和瀏覽通告等。學生的行為特征描述了學生在學習過程中的參與情況。
文中的研究步驟主要包括數(shù)據(jù)采集、數(shù)據(jù)預處理、模型構建、模型評價以及模型分析等。數(shù)據(jù)采集階段,利用xAPI接口,收集480名學生在Kalboard 360學習管理系統(tǒng)中春季和秋季2個學期的學習數(shù)據(jù);數(shù)據(jù)預處理階段,首先分析原始數(shù)據(jù)的特征,以獲得有利于提高模型分類性能的特征子集,其次處理數(shù)據(jù)集中的異常值,最終得到可用于構建模型的數(shù)據(jù)集;模型構建階段,在經(jīng)過數(shù)據(jù)預處理階段后得到的數(shù)據(jù)集上訓練各種機器學習算法,得到各種預測模型;模型評價階段,基于評價標準選擇性能最優(yōu)的模型;模型分析階段,從教育的角度解釋模型參數(shù)的含義,為教師改進教學方法提供參考。
許多特征(學生的性別/父母的受教育程度/父母對孩子的監(jiān)管/學生的學習行為)對學生的學習成績都有影響[6-14]。為了對原始特征進行篩選,利用可視化方法分別分析了每一特征與學習成績的關系。得到了缺勤天數(shù)、學生的監(jiān)護人、參與小組討論、課堂舉手、訪問課程資源以及瀏覽與該課程相關通告等特征與學習成績具有清晰模式的結論。為了從理論上進一步驗證這些行為特征對學習成績的影響,繼續(xù)利用特征選取方法對16個原始特征進行了重要性排序。
特征選取的目的是從理論角度分析各個特征的有效性,并選擇最有代表性、分類性能最好的特征子集來有效地描述輸入數(shù)據(jù),是構建預測模型之前的一項重要任務。常用的特征選取方法有2類:基于過濾的方法和基于包裝的方法。由于包裝方法的性能優(yōu)于過濾方法,因此文中選用了基于包裝的特征選取方法—XGB算法(extreme gradient boosting)分析了原始特征重要性的排序情況。分析特征選取的結果發(fā)現(xiàn):學生參與課堂討論、訪問課程資源、課堂舉手以及瀏覽與課程相關的通告是最重要的4個特征,其次是學生學習的科目、學生所處的教育階段、家長對學校的滿意程度以及學生缺勤次數(shù)。
由于文中研究的焦點是研究學生的行為特征對學習成績的影響,因此,結合原始特征分析的結果與特征選取的結果,從16個原始特征中選取了參與小組討論、訪問課程資源、課堂舉手、瀏覽與課程相關的通告、性別、監(jiān)護人以及缺勤天數(shù)這7個特征構成的特征子集用于構建學習成績預測模型。盡管父母的滿意度、學生所處的教育階段以及學習科目這3個特征也比較重要,但是,由于它們并沒有包含學生在課堂上的任何行為信息,因此,構建模型時不予考慮。
基于預處理后的數(shù)據(jù)集,采用10折交叉驗證的形式,分別采用感知機、支持向量機和神經(jīng)網(wǎng)絡構造了3種成績預測模型。
實驗運行的環(huán)境為:Windows 8.1專業(yè)版、Python 3.6、Intel i54210-U以及8 G內存。其中,在訓練階段,感知機使用隨機梯度下降算法估計參數(shù);支持向量機的分類決策函數(shù)使用高斯核;使用誤差逆?zhèn)鞑ニ惴ㄓ柧毦W(wǎng)絡。在測試階段,利用訓練階段得到的模型對測試集中的數(shù)據(jù)進行預測。10次預測得到的性能評估值的均值如表1和表2所示。使用的性能評價標準為正確率、召回率、F值、精確度以及誤分類樣本個數(shù)。正確率是指預測為某一類別的樣本中真正屬于該類別的樣本的比例;召回率是指預測為某一類別的真實類別占所有真實類別的比例;F值是指正確率與召回率的調和平均值;精確度是預測正確的樣本占所有樣本的比例。
表1 三種模型的正確率、召回率與F值的對比
表2 三種模型的精確度與誤分類樣本數(shù)量的對比
在以上三種算法構建的模型中,除了基于神經(jīng)網(wǎng)絡的成績預測模型在H類別上的召回率上稍高于支持向量機,基于感知機的成績預測模型在L類別上的召回率上稍高于支持向量機之外,基于支持向量機的成績預測模型在三種類別上的正確率、F值均最高。此外,在三種成績預測模型中,利用支持向量機構建的模型誤分類樣本數(shù)量最少,預測的精確度最高。
因此,文中選擇支持向量機構建成績預測模型,試圖通過分析模型參數(shù),證實行為特征對學習成績影響的重要性。教師可以通過了解學生在學習過程中的行為特征,發(fā)現(xiàn)并追蹤那些行為特征表現(xiàn)有落后傾向的學生。通過分析出現(xiàn)這種現(xiàn)象的原因,根據(jù)不同學生采取提供有針對性的教學資料或開展個別輔導。
分析基于支持向量機的學習成績預測模型發(fā)現(xiàn),模型分類時使用的支持向量個數(shù)為300。其中,成績類別為H、M和L的支持向量個數(shù)分別為91、136和73。由此可見,在480位學生組成的樣本集合中,只需300位學生的學習數(shù)據(jù)即可實現(xiàn)成績預測。由于篇幅原因,下面列舉其中3個樣本進行分析。
以索引號為10的支持向量為例。這是一位成績類別為H的學生。他的學習行為特征分別為:課堂舉手次數(shù)50,訪問與課程相關資源次數(shù)88,瀏覽與課程相關通告次數(shù)30,參加小組討論次數(shù)80,缺勤天數(shù)少于7天。該樣本對應的特征權重向量為:[1.062 7 1.059 8 1.654 1 1.495 9 0.809 4 0.845 1 -0.700 3]。對比該學生的學習行為特征數(shù)據(jù)和基于支持向量機的成績預測模型得到的權重向量發(fā)現(xiàn),前4項特征的權重高于后3項特征,尤其是瀏覽與課程相關通告和小組討論這2項特征的權重最高。由此可見,參與小組討論對成績好壞的影響較大。
再以索引號為13的樣本為例。這是一位成績類別為L的學生。他的學習行為特征數(shù)據(jù)分別是:課堂舉手次數(shù)20,訪問與課程相關資源次數(shù)14,瀏覽與課程相關通告次數(shù)12,參加小組討論次數(shù)19,缺勤天數(shù)大于7天。該樣本對應權重向量為:[0.487 2 0.275 2 1.349 1 1.532 9 -1.235 4 -1.183 2 -0.799 3]。將其與索引號為10的樣本比較后發(fā)現(xiàn),該樣本所有特征的權重要比后者小,尤其是課堂舉手和瀏覽與課程相關的資源。這表明,課堂舉手對成績好壞影響也較大。
索引號為285的樣本對應的是一位成績類別為M的學生。他的學習行為特征數(shù)據(jù)分別是:課堂舉手次數(shù)41,訪問與課程相關資源次數(shù)39,瀏覽與課程相關通告次數(shù)35,參加小組討論次數(shù)39,缺勤天數(shù)大于7天。該樣本對應的權重向量為:[-0.695 6 -1.505 3 -0.938 7 -0.350 2 0.809 4 0.845 1 -0.799 3]。與索引號為10的樣本比較后發(fā)現(xiàn),該樣本中前4項特征對應的權重全部為負數(shù),尤其是瀏覽與課程相關的資源和瀏覽與課程相關通告這2項特征的權重。這意味著,一個成績中等的學生,他的學習行為特征比成績優(yōu)的學生要差,比成績差的學生要好。
基于上述模型分析,提出了如下的教學建議:
(1)合理運用價值動機理論,激發(fā)學生學習投入。
通過基于支持向量機的成績預測模型可知,學生的行為特征對成績好壞起著決定性的作用。學生的行為特征實質是學生的學習投入狀況。學習投入[15-16]是衡量學習一種最重要的指標,是學生在學習過程中表現(xiàn)出的一種持續(xù)的、充滿積極情感的學習狀態(tài),以活力、奉獻和專注為主要特征,能直接影響學生的學習行為特征。雖然學生的學習投入受諸多復雜因素的影響,但最主要的因素是學生的動機信念[17]。而動機信念來源于任務價值。因此,教師在組織教學的過程中,需要把學生學習某項知識的過程融入到解決某項實際任務的過程中,使學生在完成該任務的過程中體驗該任務的價值。
因此,教師需要通過學生的學習行為特征數(shù)據(jù)反映出的學習投入狀況,在組織教學資源時要注重將傳授的知識與實際問題相聯(lián)系,讓學生在解決實際問題的過程中體驗到學習的知識與自己的生活主題相關,讓學生在解決實際問題的過程中促進自我價值和自我認同,從而自覺地進行學習投入。
(2)合理運用內隱智力信念調節(jié)機制,激發(fā)學生的學習動力。
盡管行為特征對成績有直接的影響,但每一個學生都是一個具有不同特質的個體,即每一個學生學習行為也會受其內隱智力信念的影響。內隱智力[18]信念指個體對其能力、智力等方面的自我信念,它會影響個體在學習中的行為表現(xiàn)。這意味著行為特征表現(xiàn)出來的數(shù)據(jù)值較低的學生,有可能受其接受能力的影響。因此,教師應該采取面談、趣味性比賽或者組織一些特定的教學活動等措施深入了解行為特征數(shù)據(jù)值較低的那些學生,掌握他們的內隱智力信念差異。正確運用智力增長論[19-20]的方法,為這些成績差的學生提供個性化的教學指導和學習任務,讓他們通過自己的努力、訓練、自我調節(jié)來提升他們的接受能力。
文中采集了在線學習者的人口統(tǒng)計信息、學習背景、家長的行為特征和學習者的行為特征等信息作為研究對象的特征,運用特征分析和特征選擇,選取了學習者參與討論、課堂舉手、訪問與課程相關資源、瀏覽通告、性別、監(jiān)護人以及缺勤天數(shù)這7個特征構成的特征子集表示每一個研究對象。采用感知機、支持向量機和神經(jīng)網(wǎng)絡三種機器學習算法,構造了不同的學習成績預測模型。通過比較模型的準確度、召回率、F值,誤分類樣本數(shù)量和精確度,選擇支持向量機作為構建成績預測模型的分類算法。通過分析基于支持向量機的成績預測模型,發(fā)現(xiàn)影響學習成績的主要因素是學習者的行為特征。為提高學習者的成績,教師在教學過程中應該合理運用價值動機理論和內隱智力信念調節(jié)機制,激發(fā)學生的學習投入以及學生的學習動力。