劉冬鄰
(四川外國(guó)語(yǔ)大學(xué)網(wǎng)絡(luò)信息中心 重慶市 400031)
隨著網(wǎng)絡(luò)與信息技術(shù)特別是云計(jì)算的發(fā)展,各高校都建設(shè)了各種網(wǎng)絡(luò)教學(xué)平臺(tái)和大量的網(wǎng)絡(luò)學(xué)習(xí)資源、網(wǎng)絡(luò)開放課程,學(xué)生可以在任意時(shí)間和地點(diǎn)利用這些平臺(tái)和資源,進(jìn)行自主學(xué)習(xí)。目前,像高校建設(shè)的MOOC開放式課程平臺(tái),網(wǎng)絡(luò)教學(xué)平臺(tái),網(wǎng)絡(luò)資源平臺(tái)等系統(tǒng),雖然學(xué)生用戶數(shù)量巨大,但實(shí)際課程完成率卻很低,學(xué)生在課程學(xué)習(xí)過程中出現(xiàn)大量的中途棄學(xué)現(xiàn)象,學(xué)習(xí)過程不完整,學(xué)習(xí)效果不理想[1]。為了找到這些問題的原因,找到大學(xué)生網(wǎng)絡(luò)學(xué)習(xí)效果的關(guān)聯(lián)因素,需要基于大數(shù)據(jù)分析,建立基于機(jī)器學(xué)習(xí)的網(wǎng)絡(luò)學(xué)習(xí)分析系統(tǒng),對(duì)平臺(tái)中的大學(xué)生學(xué)習(xí)行為軌跡進(jìn)行跟蹤分析,進(jìn)而對(duì)老師的網(wǎng)絡(luò)教學(xué),對(duì)學(xué)生網(wǎng)絡(luò)自主學(xué)習(xí),對(duì)教學(xué)管理的教學(xué)安排進(jìn)行評(píng)估、指導(dǎo)和改進(jìn)。
然而,包括網(wǎng)絡(luò)教學(xué)在內(nèi)的任何一種教學(xué)模式,在沒有得到使用效果反饋的情況下,不管是教師教學(xué)內(nèi)容安排、教學(xué)形式設(shè)計(jì)、還是教學(xué)平臺(tái)功能結(jié)構(gòu)上,顯然都是不能進(jìn)行針對(duì)性的調(diào)整和改進(jìn)的[2]。本文即是以某高校的網(wǎng)絡(luò)教學(xué)平臺(tái)為例,使用基于機(jī)器學(xué)習(xí)和統(tǒng)計(jì)分析及數(shù)據(jù)可視化的技術(shù),構(gòu)建對(duì)其平臺(tái)中的網(wǎng)絡(luò)教學(xué)數(shù)據(jù)進(jìn)行分析的系統(tǒng),為網(wǎng)絡(luò)教學(xué)過程和教學(xué)效果的分析、評(píng)估提供自動(dòng)化的信息手段。
網(wǎng)絡(luò)教學(xué)評(píng)估一般從教學(xué)管理、教學(xué)條件和教學(xué)過程以及教學(xué)效果這四個(gè)方面,進(jìn)行綜合的評(píng)估。具體評(píng)估內(nèi)容包括:對(duì)學(xué)生、教師、學(xué)習(xí)資源、支持系統(tǒng)和支持服務(wù)這五部分的評(píng)估[3]。通過對(duì)教師、學(xué)生和教學(xué)資源的綜合分析實(shí)現(xiàn)對(duì)教學(xué)過程的評(píng)估;通過對(duì)學(xué)習(xí)服務(wù)支持的評(píng)估實(shí)現(xiàn)對(duì)教學(xué)條件的評(píng)估;通過對(duì)學(xué)生成績(jī)進(jìn)行形成性分析,實(shí)現(xiàn)對(duì)網(wǎng)絡(luò)學(xué)習(xí)效果的評(píng)估。高校網(wǎng)絡(luò)教學(xué)平臺(tái)的教學(xué)應(yīng)用特點(diǎn)是以大學(xué)生自主學(xué)習(xí)為主,對(duì)學(xué)生學(xué)習(xí)效果的評(píng)估是系統(tǒng)評(píng)估的主要內(nèi)容。
本文設(shè)計(jì)、實(shí)現(xiàn)的基于網(wǎng)絡(luò)教學(xué)平臺(tái)的大學(xué)生網(wǎng)絡(luò)學(xué)習(xí)評(píng)估系統(tǒng),對(duì)于學(xué)生的評(píng)估主要包括對(duì)大學(xué)生在網(wǎng)絡(luò)教學(xué)平臺(tái)的學(xué)習(xí)活動(dòng)和最終學(xué)習(xí)效果的評(píng)估。該系統(tǒng)通過對(duì)網(wǎng)絡(luò)教學(xué)平臺(tái)的學(xué)生學(xué)習(xí)行為數(shù)據(jù)、教師和學(xué)生個(gè)人信息數(shù)據(jù)、作業(yè)和測(cè)試結(jié)果數(shù)據(jù)以及教務(wù)系統(tǒng)的相關(guān)科目考試成績(jī)數(shù)據(jù)等信息進(jìn)行采集、集成、轉(zhuǎn)換處理并進(jìn)行分析、挖掘。進(jìn)而完成對(duì)大學(xué)生在網(wǎng)絡(luò)教學(xué)平臺(tái)上的學(xué)習(xí)活動(dòng)和學(xué)習(xí)效果的綜合分析與評(píng)估,讓教師和學(xué)生真正掌握學(xué)生的學(xué)習(xí)過程,找到網(wǎng)絡(luò)學(xué)習(xí)行為和學(xué)習(xí)效果之間的關(guān)系,建立基于大學(xué)生網(wǎng)絡(luò)學(xué)習(xí)行為的,網(wǎng)絡(luò)教學(xué)平臺(tái)-評(píng)估模型。并通過該模型對(duì)學(xué)生的學(xué)習(xí)進(jìn)行形成性評(píng)估,幫助學(xué)生了解自己的學(xué)習(xí)狀態(tài),指導(dǎo)老師的教學(xué)內(nèi)容安排和教學(xué)設(shè)計(jì),為教學(xué)管理者提供教學(xué)管理決策支持。
目前,基于Web的網(wǎng)絡(luò)教學(xué)系統(tǒng),是高校里大學(xué)生進(jìn)行自主網(wǎng)絡(luò)學(xué)習(xí),老師進(jìn)行在線授課的主要平臺(tái)。其主要以Web作為內(nèi)容載體,不但能向師生提供不受時(shí)空限制的訪問,還能提供交互式學(xué)習(xí)環(huán)境,方便了師生之間、學(xué)生之間的交流討論。現(xiàn)在,國(guó)內(nèi)高校都建設(shè)了基于各種網(wǎng)絡(luò)和信息技術(shù)的網(wǎng)絡(luò)教學(xué)平臺(tái),眾多教育學(xué)者和系統(tǒng)提供商都對(duì)網(wǎng)絡(luò)教學(xué)平臺(tái)的建設(shè)進(jìn)行了大量研究。中國(guó)學(xué)者張偉遠(yuǎn)在分析了眾多在國(guó)際上廣泛使用的網(wǎng)絡(luò)教學(xué)平臺(tái)后,提出網(wǎng)絡(luò)教學(xué)平臺(tái)三大主要功能:課程設(shè)計(jì)功能、交流和協(xié)作功能、管理功能。這三大功能模塊下又包括教學(xué)設(shè)計(jì)工具、課程設(shè)計(jì)模板、個(gè)人空間、討論區(qū)、工作組等17項(xiàng)子功能[4-5]。
本文研究的網(wǎng)絡(luò)教學(xué)平臺(tái)所使用的教學(xué)模型如圖1所示?;诖私虒W(xué)模型,設(shè)計(jì)并實(shí)現(xiàn)了網(wǎng)絡(luò)教學(xué)平臺(tái)學(xué)習(xí)評(píng)估系統(tǒng)。
圖1:網(wǎng)絡(luò)教學(xué)平臺(tái)教學(xué)模型
基于高校網(wǎng)絡(luò)教學(xué)平臺(tái)的網(wǎng)絡(luò)學(xué)習(xí)分析評(píng)估系統(tǒng)主要由三個(gè)模塊組成:數(shù)據(jù)采集模塊、學(xué)習(xí)數(shù)據(jù)統(tǒng)計(jì)分析模塊、基于機(jī)器學(xué)習(xí)的數(shù)據(jù)分析和挖掘模塊。學(xué)習(xí)評(píng)估系統(tǒng)總體結(jié)構(gòu)如圖2所示。
圖2:系統(tǒng)總體結(jié)構(gòu)圖
數(shù)據(jù)采集模塊主要負(fù)責(zé)采集、量化學(xué)生在網(wǎng)絡(luò)學(xué)習(xí)平臺(tái)上進(jìn)行在線學(xué)習(xí)的學(xué)習(xí)行為數(shù)據(jù)、操作日志數(shù)據(jù)和一些結(jié)果數(shù)據(jù),同時(shí)根據(jù)分析評(píng)估的需要從教務(wù)系統(tǒng)等數(shù)據(jù)庫(kù)采集各科考試數(shù)據(jù),并存儲(chǔ)于數(shù)據(jù)庫(kù)中。
統(tǒng)計(jì)分析模塊主要負(fù)責(zé)對(duì)數(shù)據(jù)庫(kù)中的數(shù)據(jù)進(jìn)行提取、加工,采用統(tǒng)計(jì)分析技術(shù)和方法對(duì)教學(xué)平臺(tái)的各種數(shù)據(jù)進(jìn)行探索性分析、相關(guān)性分析,同時(shí)為數(shù)據(jù)提供圖形化的直觀展現(xiàn),進(jìn)而為整體教學(xué)情況和平臺(tái)應(yīng)用情況提供評(píng)估依據(jù)。
學(xué)習(xí)行為評(píng)估模塊主要實(shí)現(xiàn)兩個(gè)功能:
(1)運(yùn)用機(jī)器學(xué)習(xí)技術(shù)構(gòu)建“網(wǎng)絡(luò)教學(xué)平臺(tái)-評(píng)估”模型;
(2)根據(jù)所構(gòu)建的“網(wǎng)絡(luò)教學(xué)平臺(tái)-評(píng)估”模型對(duì)學(xué)生在線學(xué)習(xí)行為進(jìn)行評(píng)估預(yù)測(cè)。
基于本文的應(yīng)用場(chǎng)景,數(shù)據(jù)的采集就是根據(jù)學(xué)習(xí)評(píng)估系統(tǒng)的需要,主要從網(wǎng)絡(luò)教學(xué)平臺(tái)數(shù)據(jù)庫(kù)及其日志文件、教務(wù)管理系統(tǒng)的成績(jī)數(shù)據(jù)庫(kù)和相關(guān)學(xué)生信息數(shù)據(jù)庫(kù)中,采集系統(tǒng)進(jìn)行統(tǒng)計(jì)分析和教學(xué)系統(tǒng)應(yīng)用效果分析所需要的數(shù)據(jù)。從采集來(lái)的數(shù)據(jù)中可以得到學(xué)生學(xué)習(xí)某門課程的具體行為數(shù)據(jù)如:每單元學(xué)習(xí)次數(shù)、每次學(xué)習(xí)時(shí)間、每次開始結(jié)束的具體時(shí)間、每單元的視頻學(xué)習(xí)時(shí)間及次數(shù)、每單元的文字、課件等資料學(xué)習(xí)情況、參加BBS討論情況、單元作業(yè)完成情況、提問情況、考勤情況等數(shù)據(jù)。
根據(jù)學(xué)習(xí)分析評(píng)估系統(tǒng)需要,抽取所需數(shù)據(jù)并在MySQL數(shù)據(jù)庫(kù)系統(tǒng),建立分析評(píng)估數(shù)據(jù)庫(kù),建立相應(yīng)數(shù)據(jù)庫(kù)信息表如:用戶信息表User_pg見表1、課程信息表Kc_pg見表2、學(xué)習(xí)行為信息表Study_log見表3、BBS討論信息表Bbs_pg、考試成績(jī)信息表KS_pg、小組討論和作業(yè)信息表等。
表 1:用戶信息表
表 2:課程信息表
表 3:學(xué)習(xí)行為表
除以上數(shù)據(jù)表外,還有各種學(xué)習(xí)行為信息表如:視頻觀看信息表、BBS討論信息表、作業(yè)完成信息表、小組討論信息表、科目考試成績(jī)表等。
統(tǒng)計(jì)分析模塊主要是在完成對(duì)數(shù)據(jù)庫(kù)中用于分析的數(shù)據(jù)進(jìn)行提取、加工處理,即對(duì)采集的數(shù)據(jù)進(jìn)行合法性驗(yàn)證,對(duì)不完整記錄進(jìn)行檢查處理,確保數(shù)據(jù)一致性和完整性的基礎(chǔ)上,對(duì)用于分析的相關(guān)數(shù)據(jù)進(jìn)行探索性分析、相關(guān)性分析,同時(shí)為數(shù)據(jù)提供圖形化的直觀展現(xiàn)[6]。
主要從學(xué)生和課程這樣兩個(gè)不同的角度,進(jìn)行統(tǒng)計(jì)分析,從而能較全面的掌握學(xué)生在線學(xué)習(xí)情況,分析教學(xué)平臺(tái)的使用情況。以學(xué)生為分析對(duì)象,可以分析大學(xué)生利用網(wǎng)絡(luò)學(xué)習(xí)平臺(tái)進(jìn)行網(wǎng)上學(xué)習(xí)的整體情況和具體科目、具體章節(jié)的具體內(nèi)容的學(xué)習(xí)情況如:某同學(xué)一學(xué)期、一個(gè)月等不同時(shí)間周期的網(wǎng)絡(luò)平臺(tái)學(xué)習(xí)時(shí)間曲線,學(xué)生參加的網(wǎng)絡(luò)課程數(shù)量以及每門課程的時(shí)間投入等詳細(xì)的學(xué)習(xí)情況。以課程為分析對(duì)象,可以分析某門課程被同學(xué)們選擇和學(xué)習(xí)的情況比如:分析課程被同學(xué)們選擇學(xué)習(xí)的人數(shù)、專業(yè)分布、人均學(xué)習(xí)時(shí)間、課程各章節(jié)的完成度、作業(yè)完成情況等。
基于教學(xué)評(píng)估理論的研究和大學(xué)生學(xué)習(xí)的客觀規(guī)律,如果學(xué)生平時(shí)學(xué)習(xí)努力、認(rèn)真,相應(yīng)會(huì)取得較好的期末考試成績(jī)。因此本文采用基于機(jī)器學(xué)習(xí)的方法,通過對(duì)大學(xué)生在網(wǎng)絡(luò)教學(xué)平臺(tái)的學(xué)習(xí)行為數(shù)據(jù),進(jìn)行建模分析從而挖掘出學(xué)生學(xué)習(xí)行為和他獲得的相應(yīng)期末成績(jī)之間的關(guān)系,并將學(xué)習(xí)得到的模型用于以后對(duì)大學(xué)生在網(wǎng)絡(luò)教學(xué)平臺(tái)的學(xué)習(xí)狀況進(jìn)行評(píng)估、預(yù)測(cè)。
常用的分類器構(gòu)造方法有統(tǒng)計(jì)方法、機(jī)器學(xué)習(xí)方法、神經(jīng)網(wǎng)絡(luò)方法等。機(jī)器學(xué)習(xí)方法包括決策樹方法和規(guī)則歸納法,前者對(duì)應(yīng)的表示為決策樹,后者則一般為產(chǎn)生式規(guī)則。機(jī)器學(xué)習(xí)的決策樹方法,比神經(jīng)網(wǎng)絡(luò)和貝葉斯方法更直觀,效率也更高更適合于大數(shù)據(jù)集;決策樹方法不需要屬性信息之外的附加信息,算法受屬性字段的影響也較??;決策樹獲得的分類模型有更好的可解釋性、通用性。因此,本文采用C4.5決策樹構(gòu)建算法,構(gòu)建“網(wǎng)絡(luò)教學(xué)平臺(tái)-評(píng)估”模型[7-8]。
通過使用Python的數(shù)據(jù)分析工具,如Pandas、Numpy的數(shù)據(jù)庫(kù)讀寫和統(tǒng)計(jì)分析功能,可以通過計(jì)算某些屬性的特征量進(jìn)行數(shù)據(jù)特征分析;也可以根據(jù)網(wǎng)絡(luò)教學(xué)平臺(tái)分析、評(píng)估的需要,對(duì)特定分析目標(biāo)進(jìn)行分析;還可以使用Matplotlib繪制各種圖表,直觀展現(xiàn)數(shù)據(jù)特征。
可以對(duì)某科目的期末成績(jī)數(shù)據(jù)的分布特征和分布類型進(jìn)行分布分析,在此基礎(chǔ)上上做出頻率分布表、繪制頻率分布圖,對(duì)定性的優(yōu)、良、差之類的定性數(shù)據(jù),可用餅圖或條形圖表示;可以進(jìn)行對(duì)比分析,把兩個(gè)相關(guān)的指標(biāo)進(jìn)行比較,比如進(jìn)行縱、橫向比較、時(shí)間序列的比較分析;可以計(jì)算統(tǒng)計(jì)量,用統(tǒng)計(jì)指標(biāo)對(duì)定量數(shù)據(jù)進(jìn)行統(tǒng)計(jì)描述,比如計(jì)算數(shù)據(jù)的均值和中位數(shù),方差、變異系數(shù)和四分位間距等統(tǒng)計(jì)指標(biāo)。
以對(duì)某學(xué)期“大學(xué)計(jì)算機(jī)基礎(chǔ)”課的期末成績(jī),進(jìn)行分布分析為例,繪制期末成績(jī)分布直方圖見圖3所示。
圖3:成績(jī)分布直方圖
該模塊的實(shí)現(xiàn),就是根據(jù)3.4提出的評(píng)估模塊構(gòu)建方法,采用機(jī)器學(xué)習(xí)的決策樹算法,通過對(duì)大學(xué)生在網(wǎng)絡(luò)教學(xué)平臺(tái)的學(xué)習(xí)行為數(shù)據(jù)進(jìn)行學(xué)習(xí),找到大學(xué)生網(wǎng)絡(luò)學(xué)習(xí)行為和學(xué)習(xí)效果之間的關(guān)系,得到教學(xué)平臺(tái)評(píng)估模型,進(jìn)而使用該模型對(duì)未來(lái)的大學(xué)生網(wǎng)絡(luò)學(xué)習(xí)行為進(jìn)行分類預(yù)測(cè)[9-10]。
首先對(duì)采集的分析數(shù)據(jù)庫(kù)進(jìn)行數(shù)據(jù)預(yù)處理,選取機(jī)器學(xué)習(xí)所需的數(shù)據(jù)字段,構(gòu)建分析對(duì)象模型即大學(xué)生網(wǎng)絡(luò)教學(xué)平臺(tái)學(xué)習(xí)模型。在分析這些可用數(shù)據(jù)后,根據(jù)其與分析建模的關(guān)聯(lián)性和屬性間的相關(guān)性,選擇相關(guān)屬性用于構(gòu)建學(xué)生網(wǎng)絡(luò)學(xué)習(xí)對(duì)象模型,并對(duì)相關(guān)數(shù)據(jù)進(jìn)行預(yù)處理,得到模型訓(xùn)練和測(cè)試用的數(shù)據(jù)集。比如為提高機(jī)器學(xué)習(xí)效率,使決策樹算法最后得到的模型易于使用,預(yù)測(cè)結(jié)果易于理解,將期末的科目考試成績(jī)從數(shù)值成績(jī)映射成A、B、C、D、E,5個(gè)等級(jí),將部分內(nèi)容的學(xué)習(xí)時(shí)間進(jìn)行加權(quán)組合,組合成新的屬性數(shù)據(jù)等。
準(zhǔn)備好學(xué)習(xí)數(shù)據(jù)集后,使用C4.5算法用于完全決策樹的構(gòu)造,它選取當(dāng)前數(shù)據(jù)集中有最大信息增益率的屬性作為測(cè)試屬性,不斷對(duì)樣本進(jìn)行劃分,直到形成一顆完全決策樹。C4.5算法生成的完全決策樹規(guī)模太大,難以理解應(yīng)用,甚至對(duì)學(xué)習(xí)樣本產(chǎn)生過擬合問題,因此本文使用EBP方法,即基于錯(cuò)誤的剪枝方法進(jìn)行剪枝,生成最終的決策樹。
準(zhǔn)備好樣本集T后,完全決策樹的構(gòu)造過程如圖4。
圖4:決策樹構(gòu)造過程
為驗(yàn)證所設(shè)計(jì)的基于機(jī)器學(xué)習(xí)的,大學(xué)網(wǎng)絡(luò)教學(xué)平臺(tái)分析評(píng)估系統(tǒng)的分析評(píng)估效果和評(píng)估模型預(yù)測(cè)準(zhǔn)確性,本文使用2018-2021年的大學(xué)網(wǎng)絡(luò)教學(xué)平臺(tái)上,“大學(xué)計(jì)算機(jī)基礎(chǔ)”課程教學(xué)數(shù)據(jù)及相應(yīng)期末考試成績(jī)數(shù)據(jù)進(jìn)行實(shí)驗(yàn)。經(jīng)過處理,選取滿足實(shí)驗(yàn)要求的25800名同學(xué)的學(xué)習(xí)樣本參與實(shí)驗(yàn),將2/3的數(shù)據(jù)用作訓(xùn)練集,1/3的數(shù)據(jù)用作測(cè)試集。
系統(tǒng)使用訓(xùn)練集數(shù)據(jù)生成的決策樹模型,對(duì)測(cè)試數(shù)據(jù)集進(jìn)行預(yù)測(cè)分類,分類正確率見表4,通過實(shí)驗(yàn)測(cè)試,顯示系統(tǒng)預(yù)測(cè)分類準(zhǔn)確率達(dá)到85.36%,基本達(dá)到將該系統(tǒng)用于網(wǎng)絡(luò)教學(xué)平臺(tái)分析評(píng)估的要求。
表4:測(cè)試數(shù)據(jù)實(shí)驗(yàn)結(jié)果
本文通過大學(xué)生學(xué)習(xí)行為日志數(shù)據(jù)和相關(guān)科目期末考試成績(jī)等數(shù)據(jù)進(jìn)行建模,并采用統(tǒng)計(jì)分析方法和基于機(jī)器學(xué)習(xí)的分類預(yù)測(cè)算法,建立了基于高校網(wǎng)絡(luò)教學(xué)平臺(tái)的大學(xué)生網(wǎng)絡(luò)學(xué)習(xí)分析評(píng)估系統(tǒng)。系統(tǒng)的統(tǒng)計(jì)分析功能,能呈現(xiàn)出網(wǎng)絡(luò)教學(xué)平臺(tái)的整體應(yīng)用情況,可以對(duì)各院系網(wǎng)絡(luò)學(xué)習(xí)課程建設(shè)和質(zhì)量進(jìn)行比較,也可以對(duì)學(xué)生個(gè)體或群體的網(wǎng)絡(luò)學(xué)習(xí)情況用圖表的形式進(jìn)行直觀展現(xiàn);系統(tǒng)的模型分析預(yù)測(cè)功能可以分析大學(xué)生具體的網(wǎng)絡(luò)學(xué)習(xí)行為特征及其與學(xué)習(xí)效果的關(guān)系,還能提前預(yù)測(cè)其期末考試成績(jī)。
本課題,可以繼續(xù)研究收集更豐富的數(shù)據(jù)種類,用于系統(tǒng)分析;繼續(xù)改進(jìn)用于網(wǎng)絡(luò)教學(xué)平臺(tái)分析評(píng)估的算法,提高算法執(zhí)行效率和預(yù)測(cè)精度。