羅楊洋 韓錫斌
關(guān)鍵詞:混合課程;課程分類;聚類分析;在線學(xué)習(xí)行為;機(jī)器學(xué)習(xí)算法
一、引言
課程分類是課程本質(zhì)屬性的一部分,對于課程評價(jià),課程設(shè)計(jì)和課程實(shí)施具有重要意義[1]?;旌险n程融合了在線與面授兩種授課場景[2][3],課程設(shè)計(jì)和實(shí)施過程更加靈活復(fù)雜,為混合課程分類研究帶來了較大挑戰(zhàn)?,F(xiàn)有混合課程分類研究主要從混合課程的技術(shù)應(yīng)用、學(xué)習(xí)經(jīng)歷、課程目標(biāo)、實(shí)施環(huán)境、實(shí)施主體以及活動組織形式等視角進(jìn)行了探索[4-8],然而這些分類都無法為教師依據(jù)客觀數(shù)據(jù)動態(tài)優(yōu)化和管理教學(xué)提供幫助?;旌险n程的教學(xué)策略動態(tài)調(diào)整、個(gè)性化評價(jià)和教學(xué)預(yù)警等研究中關(guān)鍵問題的解決方法均指向數(shù)據(jù)驅(qū)動的混合課程分類[9-12]。本文旨在研究學(xué)生的在線學(xué)習(xí)行為聚類特征,據(jù)此提出混合課程的分類方法,分析該方法的穩(wěn)定性,為幫助教師動態(tài)調(diào)整教學(xué)策略,個(gè)性化混合課程評價(jià)和學(xué)習(xí)預(yù)警奠定基礎(chǔ)。
二、文獻(xiàn)綜述
課程分類是分析課程的本質(zhì)特征,以一定的標(biāo)準(zhǔn)和方法將課程分類有助于發(fā)現(xiàn)課程某一方面的特點(diǎn),在幫助教學(xué)設(shè)計(jì)、實(shí)施、管理、評價(jià)等方面具有重要意義[13]。混合課程是一種課程形式,已有文獻(xiàn)從不同方面對混合課程分類開展研究,如:依據(jù)技術(shù)融入教學(xué)的程度將混合課程分為使能型、增強(qiáng)型、轉(zhuǎn)換型;依據(jù)在線與面授的內(nèi)容及方式分為面授講解與在線學(xué)習(xí)結(jié)合型、在線講解與面對面討論結(jié)合型、虛擬現(xiàn)實(shí)模擬與結(jié)構(gòu)化面授結(jié)合型、現(xiàn)場實(shí)習(xí)與在線引導(dǎo)結(jié)合型、現(xiàn)場培訓(xùn)與線上培訓(xùn)結(jié)合型;依據(jù)課程目標(biāo)分為面向任務(wù)型、面向產(chǎn)品型、面向項(xiàng)目型等,然而上述研究都沒有依據(jù)學(xué)生在線學(xué)習(xí)行為進(jìn)行混合課程分類。有學(xué)者提出學(xué)生在線學(xué)習(xí)行為可作為混合課程分類的依據(jù),當(dāng)一門課程中主要學(xué)生群體的在線學(xué)習(xí)行為都屬于某一類時(shí),這類學(xué)生群體的學(xué)習(xí)行為特點(diǎn)就可代表該門課程的特征,據(jù)此將混合課程分為四類:很少使用學(xué)習(xí)平臺類、在線協(xié)作類、在線討論類和提交在線作業(yè)類[14],為本文探究基于學(xué)生在線行為數(shù)據(jù)的混合課程分類方法提供了借鑒與啟示。目前基于學(xué)生在線學(xué)習(xí)行為進(jìn)行混合課程分類的研究涉及三個(gè)方面:學(xué)生在線學(xué)習(xí)行為聚類研究、基于學(xué)生在線學(xué)習(xí)行為的混合課程分類研究和基于數(shù)據(jù)的分類穩(wěn)定性研究。
(一)學(xué)生在線學(xué)習(xí)行為聚類研究
學(xué)生在線學(xué)習(xí)行為聚類研究的目標(biāo)是采用某種聚類方法提取學(xué)生在線學(xué)習(xí)行為的典型特征,為下一步研究提供依據(jù)[15]。使用機(jī)器學(xué)習(xí)聚類算法開展聚類分析是一種無監(jiān)督學(xué)習(xí)過程,其特點(diǎn)是無需數(shù)據(jù)的類別標(biāo)識,通過學(xué)習(xí)樣本之間的數(shù)據(jù)特征將樣本劃分為不同組別[16]。算法的選擇是聚類研究的關(guān)鍵問題,K-means算法是目前進(jìn)行學(xué)生在線學(xué)習(xí)行為聚類研究的常用算法,如有研究分析了學(xué)生的研究型學(xué)習(xí)行為記錄,發(fā)現(xiàn)了4類不同能力水平的學(xué)生群體[17]。K-means算法雖然簡單易實(shí)現(xiàn),但不能保證在任何研究情境中都能獲得最佳的學(xué)生行為聚類結(jié)果。因此需要圍繞特定問題嘗試不同算法,采用評價(jià)指標(biāo)對比分析聚類結(jié)果的優(yōu)劣,以求獲得最佳聚類結(jié)果。使用聚類算法開展研究時(shí)所得結(jié)果的有效性對研究結(jié)論是否具有偏誤具有重要影響[18],但在已有文獻(xiàn)中極少報(bào)告聚類結(jié)果的評價(jià)指標(biāo)[19]。本文將嘗試不同機(jī)器學(xué)習(xí)算法對學(xué)生在線學(xué)習(xí)行為進(jìn)行聚類,依據(jù)相關(guān)評價(jià)指標(biāo)對比各種算法,獲得最優(yōu)的聚類結(jié)果,并分析不同類型學(xué)生在線學(xué)習(xí)的典型行為特征,為混合課程的分類提供依據(jù)。
(二)基于學(xué)生在線學(xué)習(xí)行為的混合課程分類研究
混合課程分類對學(xué)生評價(jià)、學(xué)習(xí)預(yù)警和教學(xué)優(yōu)化都十分重要,然而以往研究的混合課程分類方法或框架未有幫助上述目標(biāo)實(shí)現(xiàn)的功能[20]。當(dāng)前為混合課程分類的研究主要從混合課程的要素構(gòu)成和自身屬性出發(fā),有學(xué)者從教師在教學(xué)設(shè)計(jì)中融合技術(shù)開展混合教學(xué)模式改革角度討論了三種課程的混合方式,分別是使能型混合,即將混合的重點(diǎn)放在課程的接入性和學(xué)習(xí)便利性上,使學(xué)習(xí)的靈活性最大化。增強(qiáng)型混合,即利用在線課程內(nèi)容補(bǔ)充面授課程的內(nèi)容,不從根本上改變課程。轉(zhuǎn)換型混合,即從根本上變革課程設(shè)計(jì),將學(xué)習(xí)者從信息的接受者變更為一個(gè)可通過動態(tài)交互自主建構(gòu)知識的模型。該分類能夠指導(dǎo)教師在混合課程中整合技術(shù),幫助學(xué)生更好的學(xué)習(xí),但對學(xué)習(xí)預(yù)警沒有幫助。還有學(xué)者從學(xué)習(xí)經(jīng)歷的角度出發(fā)也定義了一種二維的混合課程分類方法。該方法的兩種維度分別是傳遞信息的中介以及課程內(nèi)容的屬性。在不同的維度下混合課程的核心學(xué)習(xí)活動會有極大差異。具體來說,為適應(yīng)教師的教學(xué)目標(biāo),滿足學(xué)生的學(xué)習(xí)偏好,即使是相同的混合課程也有可能在課程設(shè)計(jì)的呈現(xiàn)方式和知識偏好上有所不同,從而引導(dǎo)學(xué)習(xí)者出現(xiàn)相應(yīng)的學(xué)習(xí)活動。該分類框架雖然面向?qū)W生的學(xué)習(xí)經(jīng)歷,但沒有關(guān)注學(xué)生在混合課程中的學(xué)習(xí)投入特征,無法為學(xué)生評價(jià)和課程評價(jià)提供幫助。另外還有研究分別從混合課程實(shí)施環(huán)境、課程實(shí)施主體以及課程活動組織形式的視角提出了混合課程分類方法。以上分類方法沒有涉及師生在混合課程實(shí)施中的教學(xué)活動特征,對教學(xué)優(yōu)化、學(xué)習(xí)預(yù)警、學(xué)習(xí)評價(jià)等研究沒有直接的指導(dǎo)作用。
近年來有學(xué)者提出學(xué)生在線學(xué)習(xí)行為可作為混合課程分類的依據(jù),并通過記錄的學(xué)生在線學(xué)習(xí)行為數(shù)量進(jìn)行了標(biāo)記,區(qū)分學(xué)生在不同在線學(xué)習(xí)行為指標(biāo)中的活動特征,以此劃分不同類別的混合課程。該研究認(rèn)為基于學(xué)生在線學(xué)習(xí)行為的混合課程分類可反應(yīng)出混合課程的真實(shí)運(yùn)行狀態(tài),幫助院校管理者干預(yù)混合課程的實(shí)施狀態(tài),并通過網(wǎng)絡(luò)教學(xué)平臺為混合學(xué)習(xí)提供更好的支持。該方法從混合課程實(shí)施過程的數(shù)據(jù)出發(fā),提出了一種將學(xué)生在線學(xué)習(xí)行為特征轉(zhuǎn)化為混合課程分類方法的思路,且該方法關(guān)注不同學(xué)生在線學(xué)習(xí)行為的特征,為后續(xù)研究基于客觀數(shù)據(jù)的動態(tài)教學(xué)管理、個(gè)性化評價(jià)和學(xué)習(xí)預(yù)警奠定了基礎(chǔ)??梢钥闯觯酝幕旌险n程分類研究只有少量從過程數(shù)據(jù)的視角開展研究,雖有學(xué)者基于學(xué)生在線學(xué)習(xí)行為數(shù)據(jù)對混合課程分類,但該分類方法的穩(wěn)定性如何尚不清楚。
(三)基于數(shù)據(jù)的分類穩(wěn)定性研究
采集學(xué)生在線學(xué)習(xí)行為數(shù)據(jù)并以此為依據(jù)為混合課程分類,是一種依賴數(shù)據(jù)的分類方法。這種分類的目標(biāo)是從樣本數(shù)據(jù)中提取一個(gè)分類函數(shù)或分類模型,當(dāng)有新數(shù)據(jù)時(shí)根據(jù)已有分類函數(shù)或模型將新數(shù)據(jù)映射到給定類別的某一類中[21]。這種分類方法通常要面臨新數(shù)據(jù)加入后分類穩(wěn)定性的問題。好的分類方法應(yīng)具有良好的穩(wěn)定性,穩(wěn)定性是指分類方法可以適用于構(gòu)建分類方法相似的新數(shù)據(jù),并將新數(shù)據(jù)完整分入每個(gè)類別中,且每個(gè)類別內(nèi)部的數(shù)據(jù)特征類似[22]。機(jī)器學(xué)習(xí)領(lǐng)域的學(xué)者指出,在數(shù)據(jù)集不平衡的情況下,分類器可能出現(xiàn)部分樣本分類準(zhǔn)確率高而另一部分樣本準(zhǔn)確率較低的情況[23]。從混合課程中提取的學(xué)習(xí)過程數(shù)據(jù)一般是不平衡的,然而混合課程樣本各部分分類準(zhǔn)確率差異較大的結(jié)果則是不可容忍的。類似的問題在數(shù)據(jù)科學(xué)研究中也引起了學(xué)者的關(guān)注,且一直未取得突破性的進(jìn)展[24]。
三、研究問題及研究方法
本文根據(jù)以上文獻(xiàn)分析提出以下研究問題:
問題1:采用何種算法才能獲得最優(yōu)的學(xué)生在線學(xué)習(xí)行為聚類結(jié)果?每類學(xué)生在線學(xué)習(xí)行為的典型特征什么?
問題2:基于學(xué)生在線學(xué)習(xí)行為特征對混合課程進(jìn)行分類的結(jié)果是什么?
問題3:基于學(xué)生在線學(xué)習(xí)行為特征的混合課程分類方法的穩(wěn)定性如何?
選擇某高校2018年秋季學(xué)期的2456門混合課程和2020年春季學(xué)期的1851門混合課程中學(xué)生的在線學(xué)習(xí)行為日志為研究樣本數(shù)據(jù)。其中,2018年秋季學(xué)期的數(shù)據(jù)用于構(gòu)建基于學(xué)生在線學(xué)習(xí)行為的混合課程分類方法,2020年春季學(xué)期的數(shù)據(jù)用于檢驗(yàn)基于學(xué)生在線學(xué)習(xí)行為的混合課程分類方法的穩(wěn)定性。
研究過程與方法如下:(1)收集數(shù)據(jù)和預(yù)處理階段,收集2018年學(xué)生在線學(xué)習(xí)行為日志,將日志轉(zhuǎn)換為學(xué)生學(xué)習(xí)行為數(shù)據(jù)并對行為數(shù)據(jù)進(jìn)行預(yù)處理;(2)學(xué)生在線行為聚類階段,采用聚類分析研究學(xué)生在線學(xué)習(xí)行為,得到不同聚類標(biāo)簽的學(xué)生群體;(3)混合課程分類階段,分析每門課程中的學(xué)生在線學(xué)習(xí)行為,嘗試使用課程中包含的學(xué)生聚類標(biāo)簽為課程分類,取分類準(zhǔn)確率最高的標(biāo)簽作為課程分類結(jié)果,將相同分類的課程歸為一類,分析每類課程特征;(4)混合課程分類驗(yàn)證階段,使用2020年新數(shù)據(jù)驗(yàn)證課程分類方法的穩(wěn)定性。
(一) 收集數(shù)據(jù)和預(yù)處理階段
本研究中的學(xué)生采用優(yōu)慕課?綜合教學(xué)平臺V9開展混合課程的在線學(xué)習(xí)活動。網(wǎng)絡(luò)教學(xué)平臺中存儲的日志數(shù)據(jù)記錄了學(xué)生的學(xué)習(xí)行為,按照學(xué)習(xí)者對網(wǎng)絡(luò)課程各模塊的操作方式分離日志中的行為數(shù)據(jù),再按頻次和時(shí)長累積計(jì)數(shù)[25][26]。據(jù)此得到的一條數(shù)據(jù)包含一名學(xué)生在一門課程中一個(gè)學(xué)期的歷史在線學(xué)習(xí)行為。為使用機(jī)器學(xué)習(xí)算法識別上述數(shù)據(jù)項(xiàng),對每項(xiàng)數(shù)據(jù)進(jìn)行編碼,形成的學(xué)生在線學(xué)習(xí)行為數(shù)據(jù)集編碼如表1所示。
從表1中可以發(fā)現(xiàn)當(dāng)學(xué)生使用網(wǎng)絡(luò)教學(xué)平臺時(shí),數(shù)據(jù)項(xiàng)都具有不同的量綱。且數(shù)據(jù)項(xiàng)內(nèi)部存在嵌套關(guān)系,如,生生交互學(xué)習(xí)活動中,若學(xué)生課程討論區(qū)中被回復(fù)的計(jì)數(shù),則在課程討論區(qū)中發(fā)表話題計(jì)數(shù)至少有1,但反之則不然。為消除數(shù)據(jù)項(xiàng)之間量綱的差異及數(shù)據(jù)項(xiàng)之間的嵌套問題,在聚類分析前需對每一個(gè)在線學(xué)習(xí)行為數(shù)據(jù)字段進(jìn)行最大值最小值歸一化處理。通過最大值最小值歸一化操作后,各項(xiàng)數(shù)據(jù)都在保留其代表學(xué)生在該操作中與其他學(xué)生差異特征的前提下,減小了數(shù)據(jù)的離散化程度,增加了數(shù)據(jù)的內(nèi)聚性。經(jīng)過簡單探索發(fā)現(xiàn),雖經(jīng)過歸一化處理,樣本集中仍然存在大量極值,這些具有極值的學(xué)生并非均勻分布在每一門課程中,且極值也不是簡單聚集在某幾項(xiàng)行為中,因此在預(yù)處理時(shí)沒有刪掉樣本集中具有極值的學(xué)生行為數(shù)據(jù)。經(jīng)過上述數(shù)據(jù)處理后,將2456門混合課程中的學(xué)生行為日志處理為229796條行為數(shù)據(jù)。
(二) 學(xué)生行為數(shù)據(jù)聚類階段
為識別學(xué)生的在線學(xué)習(xí)行為特征,聚類分析將在線學(xué)習(xí)行為數(shù)據(jù)作為輸入項(xiàng),聚類分析流程如圖1所示。
為獲得學(xué)生在線學(xué)習(xí)行為最優(yōu)聚類,研究分別選取了三類聚類方法中最具代表性、應(yīng)用最多的典型算法:K-means聚類算法(KM)、GMM實(shí)現(xiàn)的EM聚類算法(EM)和DBSCAN算法。研究采用python語言中的scikit-learn數(shù)據(jù)挖掘工具包開展聚類分析處理。雖然EM算法和DBSCAN算法都無需設(shè)定聚類個(gè)數(shù),但通過設(shè)定聚類個(gè)數(shù)可比較不同聚類算法聚類結(jié)果的優(yōu)劣,因此每項(xiàng)聚類算法的起始聚類個(gè)數(shù)從2開始并逐漸增加聚類個(gè)數(shù)(設(shè)為N),直到聚類的傾向指標(biāo)霍普金斯統(tǒng)計(jì)量(Hopkins Statistic Index,HSI)顯示聚類分離明顯,無需繼續(xù)劃分聚類為止。完成三種聚類算法的參數(shù)設(shè)定后,為得到不受樣本順序影響的聚類偏差,每種聚類算法在完成參數(shù)設(shè)定后都會重復(fù)運(yùn)行當(dāng)前聚類設(shè)定的兩倍加一次(2N+1),每次運(yùn)行聚類算法前樣本順序會進(jìn)行隨機(jī)變換。每次聚類算法執(zhí)行后,記錄聚類結(jié)果和聚類評價(jià)指標(biāo)。在重復(fù)聚類完成后樣本點(diǎn)的聚類標(biāo)簽以標(biāo)記標(biāo)簽占多數(shù)的情況決定,如某學(xué)生的學(xué)習(xí)行為在KM算法設(shè)定為2個(gè)聚類時(shí),重復(fù)5次有3次為第一類,其余2次為第二類時(shí)將該學(xué)生記錄為第一類。對聚類結(jié)果的評價(jià)指標(biāo)則以所有重復(fù)次數(shù)完成后的平均值表示。
(三)混合課程分類階段
使用混合課程的學(xué)生在線學(xué)習(xí)行為及每類學(xué)生的聚類標(biāo)簽為混合課程分類的基本思路是:首先,將學(xué)生的行為數(shù)據(jù)表與學(xué)生的聚類標(biāo)簽連接,得到每一門課程中包含的各類學(xué)生。然后分析每一門課程中各類型學(xué)生的聚類特征,去除只包含不活躍類型學(xué)生的課程。最后以課程中包含的學(xué)生類型依此為課程標(biāo)記類型,用分類算法確定分類準(zhǔn)確率最高的類型作為該課程的類型(如圖2所示)。
課程的分類流程銜接和其中的每一步都可以使用程序自動完成。在具體流程中刪除只包含不活躍型學(xué)生課程。在將學(xué)生類型作為標(biāo)簽對課程進(jìn)行標(biāo)記時(shí),執(zhí)行步驟是首先以課程中其中一類學(xué)生的類型作為標(biāo)簽進(jìn)行課程標(biāo)記。然后采用分類算法,以該課程中標(biāo)記的學(xué)生行為數(shù)據(jù)和聚類標(biāo)簽為輸入項(xiàng)對當(dāng)前標(biāo)記的課程進(jìn)行分類,并記錄分類準(zhǔn)確率。分類準(zhǔn)確率以標(biāo)記正確的個(gè)數(shù)占課程標(biāo)記的總數(shù)百分比計(jì)算,每次選出不同的學(xué)生類型標(biāo)記課程,并記錄分類準(zhǔn)確率,直到課程中不再有其他學(xué)生類型。比較每種類型標(biāo)記課程得到的分類準(zhǔn)確率,以準(zhǔn)確率最高的類型記錄課程分類。對課程進(jìn)行分類時(shí)采用隨機(jī)森林算法,并采用5折交叉檢驗(yàn)。為保證課程分類不受課程中學(xué)生數(shù)據(jù)的順序影響,每門課程采用隨機(jī)森林算法完成分類后會通過重新亂序排列課程中的學(xué)生數(shù)據(jù)并重復(fù)10次。最終獲得混合課程分類結(jié)果。
采集上述高校2020年春季學(xué)期的1851門混合課程中的學(xué)生行為日志,重復(fù)收集數(shù)據(jù)和預(yù)處理階段、學(xué)生行為數(shù)據(jù)聚類階段和混合課程分類階段的所有操作,分析混合課程分類方法對新數(shù)據(jù)分類的穩(wěn)定性。
四、研究結(jié)果與討論
(一)學(xué)生在線學(xué)習(xí)行為聚類的算法選擇及其結(jié)果分析
本研究采用4個(gè)指標(biāo)評價(jià)聚類結(jié)果:聚類輪廓系數(shù)(Silhouette Score,SI),聚類緊密度(Calinski-Harabaz Index,CH),戴維森堡丁指數(shù)(DaviesBouldin Index,DBI)和霍普金斯統(tǒng)計(jì)量(HopkinsStatistic Index,HSI)。SI度量聚類中同類樣本之間的距離與該類樣本和其他類樣本之間的距離的比值,該值越接近1則聚類結(jié)果越好;CH度量聚類中心點(diǎn)和全部樣本的中心點(diǎn)平方和(分離度)與聚類中的樣本和聚類中心的平方和(緊密度)的比值,數(shù)值越大則聚類結(jié)果越好;DBI量化每個(gè)聚類之間的最大相似度均值,該指標(biāo)越接近0則聚類結(jié)果越好。HSI用于評價(jià)聚類個(gè)數(shù)是否最優(yōu),該指標(biāo)使用數(shù)據(jù)樣本所構(gòu)成的向量空間判斷其中的數(shù)據(jù)分布類型,當(dāng)該指標(biāo)越接近1時(shí)則樣本聚類個(gè)數(shù)越趨近于最優(yōu)[27]。
使用三種聚類算法對2018年混合課程和2020年混合課程中學(xué)生在線學(xué)習(xí)行為數(shù)據(jù)進(jìn)行聚類,每項(xiàng)聚類算法的起始聚類個(gè)數(shù)從2開始逐漸增加,當(dāng)個(gè)數(shù)達(dá)到8時(shí),傾向指標(biāo)HSI顯示樣本隨機(jī)化明顯,無需繼續(xù)增加。表2呈現(xiàn)了三種聚類算法聚類個(gè)數(shù)為5時(shí)所得結(jié)果在4個(gè)評價(jià)指標(biāo)上的取值。表中第1列是三種算法,如KM5即代表采用KM算法將學(xué)生在線學(xué)習(xí)行為數(shù)據(jù)聚類為5類;第2—5列顯示的是某種算法將2018年混合課程中學(xué)生在線學(xué)習(xí)行為數(shù)據(jù)聚類在4個(gè)評價(jià)指標(biāo)的值,而6—9列則是2020年數(shù)據(jù)聚類的評價(jià)指標(biāo)取值。
觀察表2可知,2018年與2020年的混合課程學(xué)生數(shù)據(jù)都在聚類為5類時(shí),結(jié)果最佳。且EM算法和KM算法的聚類結(jié)果在4項(xiàng)評價(jià)指標(biāo)的數(shù)值上差異不大。因此選擇這兩種算法將在線學(xué)習(xí)行為分為5類是最優(yōu)結(jié)果。
根據(jù)上述聚類結(jié)果將2018年混合課程中的學(xué)生分為五個(gè)類別,每個(gè)類別學(xué)生的20項(xiàng)在線學(xué)習(xí)行為指標(biāo)的均值和標(biāo)準(zhǔn)差如表3所示。
從圖3中可以看出五類學(xué)生在線學(xué)習(xí)行為有非常明顯的區(qū)別,其典型特征如下:
(1)聚類編號為0的學(xué)生在線活動非常少,在表征學(xué)生在線學(xué)習(xí)行為的20項(xiàng)指標(biāo)中,有17項(xiàng)均值為0,只有3項(xiàng)指標(biāo)均值大于0.001。據(jù)此將該聚類編號的學(xué)生命名為“不活躍型學(xué)生”。
(2)聚類編號1的學(xué)生相比聚類編號0的學(xué)生活躍,但沒有一項(xiàng)在線學(xué)習(xí)行為指標(biāo)數(shù)據(jù)的均值高于其他類,有12項(xiàng)指標(biāo)的均值小于0.01,其中8項(xiàng)為0。據(jù)此將該聚類編號的學(xué)生命名為“低活躍型學(xué)生”。
(3)聚類編號2的學(xué)生在線學(xué)習(xí)行為集中在兩項(xiàng)活動上,他們的上交課程作業(yè)(LBS17)和保持在線活動(LBS11)兩項(xiàng)指標(biāo)均值是最高的,同時(shí)該類學(xué)生幾乎沒有其他在線學(xué)習(xí)行為,有13項(xiàng)小于0.001。據(jù)此將該聚類編號的學(xué)生命名為“任務(wù)型學(xué)生”。
(4)聚類編號3的學(xué)生更加關(guān)注視頻材料的學(xué)習(xí),點(diǎn)擊進(jìn)入播課(LBS6),參與播課學(xué)習(xí)(LBS7)、視頻觀看時(shí)長(LBS12)、記錄學(xué)習(xí)筆記(LBS16)和提交在線測試(LBS20)等指標(biāo)均值是所有類別中最高的,其他指標(biāo)中只有3項(xiàng)均值小于0.01。據(jù)此將該聚類的學(xué)生命名為“閱覽型學(xué)生”。
(5)聚類編號4的學(xué)生在線學(xué)習(xí)行為特征是其大多數(shù)行為指標(biāo)均值最高,在21項(xiàng)指標(biāo)中的12項(xiàng)均值是最高的。據(jù)此將該聚類的學(xué)生命名為“高活躍型學(xué)生”。
各類型學(xué)生在所有學(xué)生中的占比分別為,“不活躍型學(xué)生”77%,“低活躍型學(xué)生”15%,“任務(wù)型學(xué)生”6%,“閱覽型學(xué)生”1%,“高活躍型學(xué)生”1%。
(二)基于學(xué)生聚類結(jié)果分類的混合課程特征
采用第三節(jié)中所述方法將所有課程進(jìn)行分類后,基于學(xué)生在線學(xué)習(xí)行為典型特征,可獲得每門課程按照其包含學(xué)生類型標(biāo)簽的準(zhǔn)確率列表。表3顯示部分課程通過分類后得到在五種學(xué)生分類標(biāo)記下的結(jié)果準(zhǔn)確率。
從表3中可見采用分類算法對不同課程依據(jù)學(xué)生典型行為標(biāo)記為五種類型后,其準(zhǔn)確率存在差異,將準(zhǔn)確率最高的類別作為該課程的類別標(biāo)記。將每門課程標(biāo)記完成后,同樣標(biāo)記的課程歸為一類,可得到每個(gè)課程類型包含學(xué)生的占比分布圖(如下頁圖4所示)。
分析每類混合課程中的學(xué)生占比構(gòu)成,可發(fā)現(xiàn)每類課程的典型特征如下:(1)有1403門課程被分類為不活躍型課程中,該類課程中不活躍的學(xué)生占83.2%,任務(wù)型學(xué)生中占13.5%,而剩余的3.3%學(xué)生則分布在低活躍型,閱覽型和高活躍型三類學(xué)生中。說明不活躍型課程中,不活躍型學(xué)生都占大多數(shù)。不活躍型課程在每個(gè)學(xué)院中均有出現(xiàn),且在體育學(xué)院和外國語學(xué)院開設(shè)課程中占比較高。
(2)有113門課程被分類為低活躍型課程中,該類課程中有58.1%的學(xué)生是低活躍型,17.1%的學(xué)生屬于任務(wù)型,不活躍型學(xué)生占12.2%,高活躍型學(xué)生占10.8%,閱覽型學(xué)生占1.7%。低活躍型學(xué)生占大多數(shù)。低活躍型課程只在全校27個(gè)開課學(xué)院中的10個(gè)學(xué)院中出現(xiàn),同樣在外國語學(xué)院開設(shè)課程中占比較高。
(3)有880門課程被分類為任務(wù)型課程,該類課程中有73.7%的學(xué)生屬于任務(wù)型,15.5%的學(xué)生屬于不活躍型,低活躍型學(xué)生占5.1%,高活躍型學(xué)生占4.3%,閱覽型學(xué)生占1.3%。任務(wù)型學(xué)生占大多數(shù)。任務(wù)型課程分布在22個(gè)開課學(xué)院中,且在計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院開設(shè)課程中尤為集中。
(4)有38門課程被分類為閱覽型課程,該類課程中有56.7%的學(xué)生屬于閱覽型,有19.2%的學(xué)生屬于低活躍型,12.2%的學(xué)生屬于任務(wù)型,10.9%的學(xué)生屬于高活躍型,1.1%的學(xué)生屬于不活躍型。閱覽型學(xué)生占大多數(shù)。閱覽型課程只出現(xiàn)在3個(gè)開課學(xué)院中,且主要屬于建筑工程學(xué)院開設(shè)的課程。
(5)有22門課程被分類為高活躍型課程,該類課程中有高活躍型學(xué)生72.9%,有15.7%的學(xué)生為低活躍學(xué)生,4.5%的任務(wù)型學(xué)生,3.88%的閱覽型學(xué)生,3.55%的不活躍型學(xué)生占比。高活躍型課程主要集中在生命科學(xué)院、電氣與電子工程學(xué)院和法學(xué)院開設(shè)課程中占比較高。
本研究結(jié)果與以往研究者的結(jié)論相比,分類結(jié)果同樣發(fā)現(xiàn)了有大量混合課程屬于不活躍型,但從方法上來看,本研究實(shí)現(xiàn)了無需人工干預(yù)的自動化混合課程分類。
(三)基于學(xué)生在線學(xué)習(xí)行為聚類特征的混合課程分類方法的穩(wěn)定性
在采用學(xué)生在線學(xué)習(xí)行為聚類結(jié)果為混合課程分類時(shí),學(xué)生行為聚類結(jié)果的穩(wěn)定性也會影響混合課程分類的結(jié)果。好的分類方法應(yīng)具有良好的穩(wěn)定性,穩(wěn)定性是指分類方法可以適用于構(gòu)建分類方法相似的新數(shù)據(jù),并將新數(shù)據(jù)完整分入每個(gè)類別中,且每個(gè)類別內(nèi)部學(xué)生學(xué)習(xí)行為特征類似。本文對比分析了2018秋季和2020春季兩學(xué)期學(xué)生行為的聚類結(jié)果,結(jié)果發(fā)現(xiàn)2018年與2020年的混合課程中各聚類編號下的學(xué)生在線學(xué)習(xí)行為特征相似。說明依據(jù)學(xué)生在線學(xué)習(xí)行為聚類特征對混合課程分類時(shí)兩學(xué)期的聚類特征較為穩(wěn)定,為混合課程分類方法的穩(wěn)定性奠定了基礎(chǔ)。依據(jù)2020年學(xué)生在線學(xué)習(xí)行為聚類特征為混合課程分類后,可獲得不活躍型課程(841門),同樣在每個(gè)學(xué)院中均有出現(xiàn),主要集中在體育學(xué)院中;低活躍型課程(232門),該類課程較為平均的分布在每個(gè)學(xué)院中;任務(wù)型課程(314門)該類課程分布在16個(gè)開課學(xué)院中,同樣在計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院開設(shè)課程中尤為集中;閱覽型課程(413門)該類課程分布在18個(gè)學(xué)院中,除建筑工程學(xué)院外,還集中在材料科學(xué)與工程學(xué)院及交通與車輛工程學(xué)院開設(shè)的課程及高活躍型課程(51門)該類課程除集中在2018秋季學(xué)期的三個(gè)學(xué)院外還新增了管理學(xué)院和數(shù)學(xué)與統(tǒng)計(jì)學(xué)院。研究進(jìn)一步對比了2018年混合課程各類學(xué)生構(gòu)成與2020年混合課程各類學(xué)生(如圖5所示)。
對比圖4和圖5可知,依據(jù)學(xué)生在線學(xué)習(xí)行為聚類特征分類后依然可將2020年的全部混合課程分類到五類課程中,且每類課程的典型特征一致。
由此可見,基于學(xué)生聚類特征的混合課程分類方法完整的將某高校2018年秋季學(xué)期的混合課程與2020年春季學(xué)期的混合課程分入了五個(gè)類別之中,每個(gè)類別的典型特征相同,分類標(biāo)準(zhǔn)和結(jié)果并未因樣本數(shù)據(jù)不同而變化。本研究首次通過相同學(xué)校的不同學(xué)期數(shù)據(jù)驗(yàn)證了基于學(xué)生在線學(xué)習(xí)聚類特征的混合課程分類方法的穩(wěn)定性。
五、研究結(jié)論及教育意義
混合課程情境下,如何依據(jù)學(xué)生在線學(xué)習(xí)行為進(jìn)行分類,是解決混合課程動態(tài)優(yōu)化、管理,個(gè)性化評價(jià)及教學(xué)預(yù)警的基礎(chǔ)問題。本文提出了一種依據(jù)學(xué)生在線學(xué)習(xí)行為特征對混合課程進(jìn)行分類的方法,結(jié)果表明:(1)該方法首先通過機(jī)器學(xué)習(xí)算法對混合課程中的學(xué)生在線學(xué)習(xí)行為進(jìn)行聚類并分析每類學(xué)生的典型特征,依據(jù)學(xué)習(xí)行為的典型特征將混合課程分為可以自動識別的五種類型:不活躍型課程、低活躍型課程、任務(wù)型課程、閱覽型課程和高活躍型課程;(2)采用該方法對同一個(gè)高校兩個(gè)學(xué)期的混合課程進(jìn)行分類,結(jié)果都?xì)w入了五個(gè)類別之中,且每類課程中學(xué)生學(xué)習(xí)行為的典型特征相同,由此驗(yàn)證了該方法具有良好的穩(wěn)定性;(3)該方法不依賴人工事先標(biāo)注,便于計(jì)算機(jī)自動化分類,能發(fā)現(xiàn)課程中的學(xué)生群體行為特征,分析學(xué)習(xí)過程差異,為教師動態(tài)設(shè)計(jì)、管理混合課程,及時(shí)預(yù)警學(xué)生,實(shí)現(xiàn)個(gè)性化混合課程評價(jià)奠定基礎(chǔ)。
本研究將學(xué)生行為特征轉(zhuǎn)換為混合課程的分類依據(jù),獲得了五個(gè)類型的混合課程,具有良好的通用性,適用于不同院系、不同學(xué)科、不同教師、不同規(guī)模的課程,對教學(xué)實(shí)踐具有以下指導(dǎo)意義:
(一)精確指導(dǎo)混合課程建設(shè)和實(shí)施
本研究發(fā)現(xiàn)在案例院校4307門混合課程中有大量課程仍屬于不活躍型(52.1%),這些課程還處于混合教學(xué)實(shí)施的早期階段[28]。從開課學(xué)院來看,體育學(xué)院并不適用于傳統(tǒng)線上線下結(jié)合的混合課程,學(xué)院需進(jìn)一步分析體育類課程的特點(diǎn),建設(shè)適合的線上教學(xué)內(nèi)容,探索適用于體育類課程特點(diǎn)的線上教學(xué)形式。低活躍型課程則顯示出傳統(tǒng)面授課程向混合課程改革過渡的特征,說明這些課程中的師生正在積極嘗試混合課程。院校管理者需加強(qiáng)這類課程的管理,防止師生因片面理解混合課程的意義,將教學(xué)撕裂為線上和線下互相獨(dú)立的活動,導(dǎo)致教學(xué)效果降低的問題。閱覽型和任務(wù)型課程則幾乎全部出現(xiàn)在工科學(xué)院開設(shè)的課程中,說明工科學(xué)院將混合課程的線上內(nèi)容更多理解為課程呈現(xiàn)和任務(wù)完成的環(huán)境,還需進(jìn)一步挖掘混合課程的潛力,以促進(jìn)學(xué)生協(xié)作和反思能力的培養(yǎng)。對于高活躍型課程,管理者可以分析課程特點(diǎn),總結(jié)典型經(jīng)驗(yàn),探索推廣方式,構(gòu)建教師互助體系,全面推進(jìn)混合教學(xué)改革。
(二)構(gòu)建更有效的學(xué)習(xí)預(yù)警體系
構(gòu)建學(xué)生成績預(yù)測模型是實(shí)現(xiàn)學(xué)習(xí)預(yù)警重要方法,以往研究指出不存在一種適用于所有混合課程的成績預(yù)測模型,構(gòu)建具有較高預(yù)測結(jié)果準(zhǔn)確率的混合課程成績預(yù)測模型前提是對混合課程分類。本文提出的混合課程分類方法依據(jù)學(xué)生的學(xué)習(xí)過程特征,構(gòu)建了分類混合課程的依據(jù),可成為按類型構(gòu)建混合課程成績預(yù)測模型,提升預(yù)測結(jié)果準(zhǔn)確率的基礎(chǔ)。從而幫助混合課程中對大規(guī)模學(xué)生實(shí)時(shí)預(yù)警系統(tǒng)的構(gòu)建,提升教師和教學(xué)管理者學(xué)情分析的效率和準(zhǔn)確率。
(三)有利于為教師動態(tài)優(yōu)化教學(xué)提供依據(jù)
在混合教學(xué)實(shí)施過程中,學(xué)生的學(xué)習(xí)行為特征通常具有階段性差異[29]。以往教師只能基于學(xué)生的歷史學(xué)習(xí)過程和學(xué)習(xí)成績,在學(xué)期末反思自己的教學(xué)過程,優(yōu)化下一學(xué)期的教學(xué)。本文提出的混合課程分類方法可隨時(shí)收集學(xué)生數(shù)據(jù),發(fā)現(xiàn)課程中大多數(shù)學(xué)生線上學(xué)習(xí)的偏好,幫助教師動態(tài)調(diào)整混合教學(xué)策略,改變學(xué)生的線上學(xué)習(xí)狀態(tài),促進(jìn)學(xué)生增加某類活動中的學(xué)習(xí)投入,按教學(xué)設(shè)計(jì)完成混合課程目標(biāo)。
(四)有利于為混合課程提供個(gè)性化評價(jià)依據(jù)
以往研究指出,欠缺數(shù)據(jù)驅(qū)動課程分類方法是研究混合課程個(gè)性化評價(jià)中的瓶頸問題。分析學(xué)生學(xué)習(xí)過程數(shù)據(jù),獲取個(gè)性化評價(jià)依據(jù)有助于以評促學(xué)[30]。本文提出的混合課程方法可發(fā)現(xiàn)課程中存在的差異化學(xué)生行為特征,幫助研究者了解學(xué)生群體在混合課程中學(xué)習(xí)行為特征差異,發(fā)現(xiàn)學(xué)習(xí)群體特性,對不同學(xué)習(xí)群體開展精準(zhǔn)的個(gè)性化評價(jià)提供基礎(chǔ)。如對不活躍型和低活躍型混合課程,評價(jià)應(yīng)重點(diǎn)關(guān)注線下學(xué)習(xí)過程;對任務(wù)型和閱覽型混合課程,評價(jià)應(yīng)關(guān)注某類學(xué)習(xí)活動的質(zhì)量;對高活躍型混合課程,評價(jià)應(yīng)全面覆蓋學(xué)生在線學(xué)習(xí)活動。另外,本文提出的課程分類方法可幫助院校管理者分析全校混合課程的真實(shí)運(yùn)行狀態(tài),在開展課程評價(jià)時(shí),比對教學(xué)設(shè)計(jì)中在線學(xué)習(xí)的安排與課程類型的差異,從而形成數(shù)據(jù)驅(qū)動的個(gè)性化混合課程評價(jià)。
本研究結(jié)論從一所學(xué)校兩個(gè)學(xué)期的數(shù)據(jù)中獲得,提出的方法是否能夠?qū)崿F(xiàn)跨學(xué)校、跨平臺的混合課程穩(wěn)定分類還有待進(jìn)一步驗(yàn)證。另外,基于這種分類構(gòu)建的學(xué)習(xí)成績預(yù)測模型是否具有更好的準(zhǔn)確率也需要開展研究。