張莉
摘 要:本文針對MOOC在線學(xué)生的行為,分析數(shù)據(jù)模型,建模學(xué)生參與行為,提出基于學(xué)生行為開發(fā)用于理解學(xué)生參與在線課程的框架,研究潛在學(xué)生在三門MOOC課程中堅持下來的模式,預(yù)測學(xué)生在課程前期的生存狀況,對以用戶與MOOC交互和課程的不同點識別學(xué)生活動的指標作進一步的定量分析。
關(guān)鍵詞:MOOCs;模型;概率軟邏輯;學(xué)生評價
中圖分類號:G434 文獻標志碼:A 文章編號:1673-8454(2018)11-0048-04
一、引言
大量學(xué)生參與MOOC課堂為我們提供了分析大型在線交互和行為數(shù)據(jù)的機會。通過識別模式,提出新的反饋機制并提高教師干預(yù)措施,可以幫助提高學(xué)生參與MOOC的能力,此外通過分析在線學(xué)生參與MOOC的行為,也有助于驗證和改進大家對傳統(tǒng)教室的理解。
運用模型從MOOC課程收集真實數(shù)據(jù),并以實證顯示其捕捉學(xué)生行為的模式和預(yù)測結(jié)業(yè)能力。為了準確地預(yù)測學(xué)生的學(xué)習動機和完成課程的能力,實驗結(jié)合上網(wǎng)行為的各個方面驗證了為學(xué)生活動提供一個全面的看法的重要性,數(shù)據(jù)表明,模型能夠用課程早期階段獲得的數(shù)據(jù)完成預(yù)測。早期階段的預(yù)測可以幫助教師進行干預(yù),有助于提高學(xué)生的課程結(jié)業(yè)率。
國內(nèi)很多研究集中在MOOC的發(fā)展歷程及主要特征分析;[1]基于MOOC數(shù)據(jù)的學(xué)習行為分析與預(yù)測;[2]學(xué)生學(xué)習效果和能力等方面進行研究;[3]以及以課程為例的教學(xué)模式的研究;[4]并嘗試在不同學(xué)期相同課程中進行平臺改進并對比;[5]搭建一個大數(shù)據(jù)分析平臺,對不同課程,不同平臺的數(shù)據(jù)進行綜合分析。[6]Kuh 研究了傳統(tǒng)課堂的課程中學(xué)生參與和學(xué)習成績之間的關(guān)系,確定用戶參與的幾個指標(如師生互動、學(xué)術(shù)水平的挑戰(zhàn))。[4]Carini 等定量地證明,盡管大多數(shù)參與指標呈正相關(guān)性能,在許多情況下該關(guān)系可以弱化。本研究的思路借用了Kuh(2003)、Carini、Kuh和Klein(2006),并從統(tǒng)計學(xué)生課程結(jié)業(yè)模型(Richards2012)和適應(yīng)這些MOOC來設(shè)置。
學(xué)生的參與被稱為是學(xué)生學(xué)習成功的一個顯著因素,但對于研究MOOC學(xué)生的參與仍然是有限。本研究試圖利用集群了解學(xué)生的參與度,不同在于使用參與類型作為潛變量和從數(shù)據(jù)來區(qū)分不同的參與類型。[7]使用測驗——提交作為學(xué)生存在的量度,并使用學(xué)生存活分來訓(xùn)練模型。因此,潛參與變量是為預(yù)測學(xué)生生存專門構(gòu)建的。然后用這個模型來預(yù)測學(xué)生是否在學(xué)習課程中提交了期終考試/任務(wù)/測驗,即學(xué)生是否堅持學(xué)完了課程。
二、建模學(xué)生課程結(jié)業(yè)
預(yù)測并建模MOOC數(shù)據(jù)具有極大的技術(shù)挑戰(zhàn)性,因為它需要結(jié)合大量的網(wǎng)絡(luò)論壇實體(學(xué)生、教師、任務(wù)等)的語言能力和圖表分析。為了應(yīng)對這一挑戰(zhàn),使用概率軟邏輯(PSL)這樣一個框架,以一種簡潔的方式提供簡單的方法來表示行為、語言和結(jié)構(gòu)特征。由于在傳統(tǒng)的教學(xué)模式下,評估在線學(xué)生參與有間接線索來評價。在電子環(huán)境識別這些線索是具有挑戰(zhàn)性的,但大量的可用數(shù)據(jù)可以抵消人與人間通信的丟失。建模學(xué)生參與,需要考慮在線學(xué)生的觀察行為和在教室中的生存狀態(tài)的潛變量,發(fā)現(xiàn)這個潛在的信息提供一個更好的學(xué)生完成課程的行為的解釋。
檢查實際MOOC數(shù)據(jù),可以觀察到有幾個指標對衡量學(xué)生參與是有用的,如查看課程內(nèi)容、與其他學(xué)員或工作人員在論壇互動這些主題和內(nèi)容。此外學(xué)生經(jīng)常參與整個課程中不同方面,例如一些學(xué)生參與在線社區(qū)方面——通過發(fā)帖、提問和回答問題;而另一些只是聽講課和做一些小測試卻沒有與社區(qū)進行交互??紤]到這些差異并提出一個模型,用不同的行為來區(qū)分參與模式:被動或主動。使用這些參與類型來預(yù)測學(xué)生的生存和推理其隨時間的行為。
由于學(xué)生在與MOOC課程的交互過程中會生成詳細的記錄,包括網(wǎng)頁瀏覽和視頻點擊率,訪問論壇,論壇的互動如投票、發(fā)布消息和回復(fù)、以及像測試和作業(yè)類的分數(shù)元素。在本節(jié)中將描述怎樣建模學(xué)生的課程,以及交互過程中這些學(xué)生的各種行為和語言特征。
為了建模在這些特點和學(xué)生生存之間的交互作用,使用PSL,一種關(guān)系概率模型。PSL通過對這些謂詞編寫規(guī)則來編碼觀察到的特征和(潛在和目標)變量作為邏輯謂詞和設(shè)計模型。PSL在一個參數(shù)化的概率模型中解釋這些規(guī)則,并能夠使用機器學(xué)習算法和參數(shù)擬合執(zhí)行高效的推理。PSL的表現(xiàn)力和靈活性使能夠輕松地為MOOC數(shù)據(jù)建立不同的模型,通過對比多種模式建立一種簡單的直接關(guān)系到學(xué)生生存特征的模型。
1.概率軟邏輯
PSL是應(yīng)用在學(xué)習和預(yù)測關(guān)系領(lǐng)域的一種建模語言。類似的任務(wù)發(fā)生在自然語言處理等很多領(lǐng)域,社交網(wǎng)絡(luò)分析、計算機視覺、機器學(xué)習。PSL允許用戶直觀描述問題,類似邏輯的語言,然后將其模型應(yīng)用于數(shù)據(jù)。
PSL是一種在關(guān)系領(lǐng)域中進行收集和進行概率推理的框架,其語法基于一階邏輯,作為連續(xù)的圖形模板語言模型用隨機變量代表軟真實值。像其他的統(tǒng)計關(guān)系學(xué)習方法,PSL采用加權(quán)規(guī)則來建模一個領(lǐng)域中的依賴模型,然而一個顯著的方面是PSL使用持續(xù)的變量來代表真值,限制布爾真值在區(qū)間[0,1]。三角規(guī)范是邏輯連接詞AND和OR。由PSL語義定義的底層概率模型是hinge-loss Markov 隨機數(shù)(HL-MRF)。在HL-MRFs中推理最可能的解釋是凸優(yōu)化問題,這使得相比那些使用離散表示的許多關(guān)系模型工具用PSL工作是非常高效的。HL-MRFs應(yīng)用各種學(xué)習算法到完全監(jiān)督訓(xùn)練數(shù)據(jù),并適用于點估算期望最大化的潛變量部分監(jiān)督數(shù)據(jù)。在該模型中使用該功能來表示學(xué)生的參與潛變量。
2.建模MOOC學(xué)生活動
MOOC在線環(huán)境主要包括兩個資源:視頻講座和在線論壇。學(xué)生可以多次觀看視頻并在此期間回答測試提問。學(xué)生可以通過在論壇中提出和回答問題進行互動。通常有按主題組織的多個論壇,分別有多個主題,每個主題由多個提問組成,學(xué)生們可以響應(yīng)、對現(xiàn)有問題投票(向上或向下)以及訂閱更新論壇的主題。每個學(xué)生都給予基于選票創(chuàng)建的信譽得分。這些活動如圖1所示,通過定義一組用于創(chuàng)建特征的PSL謂詞來量化這些活動,把這些謂詞分類為行為性、交互性或時間性。
(1) 行為特性
行為特征是學(xué)生在MOOC網(wǎng)站上所顯現(xiàn)出來的屬性, 考慮兩種類型的行為特征:聚合和非聚合。聚合特征描述學(xué)生的行為,論壇中捕獲用戶活動的行為有發(fā)貼(用戶)、投票(用戶)和查看(用戶)。綜合所有用戶評估是否該功能的值大于中值。聚合詞取布爾值。非集合特征直接量化學(xué)生的行為。發(fā)布(USER,POST)和投票(USER,POST)捕捉用戶在發(fā)布并投票的討論論壇的一個實例級別的日志。如果后期有積極的票贊同(POST)是true的,否則為false,如果一個投票一直向下投票,預(yù)測反對(POST)是true。
(2)論壇內(nèi)容和交互特性
MOOC論壇具有相關(guān)信息因而內(nèi)容豐富,體現(xiàn)該學(xué)生對課程和內(nèi)容的態(tài)度,以及學(xué)生之間的社會交往。使用兩種類型的特征捕捉論壇特性,語言特征捕捉帖子內(nèi)容的感悟,結(jié)構(gòu)特征捕捉論壇結(jié)構(gòu)信息、局部組織成線和論壇類型,學(xué)生在論壇上表達的態(tài)度可以通過估算情感傾向被捕獲(正面或負面),并確定主觀性的發(fā)帖。由于MOOC論壇包含數(shù)千個帖子,使用一個自動化的工具OpinionFinder(Wilson et al.2005)以避免手工標注。該工具把論壇帖子分成句子,并給每個句子分配主觀性和極性標記.基于它的預(yù)測,定義了兩個謂詞:主觀(POST)和極性(POST)。使用OpinionFinder工具通過正常化主/客觀和正/負極性標簽的數(shù)量進行計算,通過保持這些值在[0; 1]區(qū)間使之正常化。
論壇是結(jié)構(gòu)化的實體,由高層次的主題(論壇級)和特定主題(線程級)組織。包括這些結(jié)構(gòu)關(guān)系上的模型來確定論壇的帖子之間的結(jié)構(gòu)關(guān)系,并與學(xué)生們參與論壇討論連接起來。代表論壇結(jié)構(gòu)謂詞sameThread(POST 1,POST2)和sameForum(THREAD1,THREAD2),分別適用于在同一個線程和線程在同一論壇上。這些謂詞適用于學(xué)生論壇交流時的傳播。
(3)時間特性
學(xué)生活動程度是隨著課程變化而轉(zhuǎn)變的。學(xué)生們經(jīng)?;钴S在初期,隨著課程的進展失去興趣。為捕捉學(xué)生活動隨著時間變化的信號,引入一組時間特性。將課程劃分為三個時期:前期、中期和結(jié)束期。通過將整個持續(xù)時間分成三個相等的塊。時間特性有l(wèi)astQuiz lastLecture lastView和lastVote,表明每個交互用戶發(fā)生的最后時段。這些特性通過長度來測量用戶參與課程的不同方面。
使用上面的特征來構(gòu)造有意義的PSL規(guī)則,使用邏輯連接詞,如表1所示。PSL模型將這些規(guī)則與學(xué)生生存,直接或間接使用潛變量聯(lián)系。
三、實證評估
模型基于中國人民大學(xué)的三門MOOC課程:C語言程序設(shè)計、大學(xué)英語以及高等數(shù)學(xué)。將這些課程分別記作C-TECH、E-Question和 M-E。數(shù)據(jù)由每門課的七周為一周期的匿名學(xué)生檔案、成績和在線行為組成。圖2揭示了不同課程相關(guān)活動參與者的數(shù)量。學(xué)生注冊總數(shù)6%左右的學(xué)生選擇C-TECH和P-Question,約15%的學(xué)生選擇M-E并完成了期末考試。用這類方法來定義課程的存在。在所有這三門課程中,在線學(xué)生最突出的活動是觀看講座。因此排名基于觀看講座的學(xué)生人數(shù),作為基線進行比較。其他常見的活動包括競猜提交和查看論壇內(nèi)容等。觀察統(tǒng)計數(shù)據(jù),相比M-E課程,C-TECH和P-Question課程參加論壇的比例更高。
評估在如下度量模型中進行:ROC曲線下面積為正和負標簽。使用10倍交叉驗證,留出10%的數(shù)據(jù)為訓(xùn)練模型權(quán)重測試。
實驗的目的是通過了解影響學(xué)生生存過程中的因素測定學(xué)生生存、參與的類型和參與過程中的變化,并預(yù)測課程不同時間段的有效性。在第一組實驗中,用整個過程中所有學(xué)生的活動來預(yù)測每個學(xué)生是否需要最終的測驗。選擇基線通過觀看講座人數(shù)對學(xué)生進行排名?;€和兩個模型列于表2中,僅使用演講提交功能可以預(yù)測輟學(xué)相當良好的基線,但其相對較低的精確度和召回為被動生存(AUC-PR pos),單獨采用這種方式是不理想的。因為該班級失衡和較高的輟學(xué)率,它可以識別哪些學(xué)生將更有價值地高比例完成課程。模型結(jié)合行為、語言、時間和結(jié)構(gòu)特征來預(yù)測學(xué)生的生存。
預(yù)測學(xué)生的生存能給教師提供一個強大的工具,如果能夠在學(xué)生脫離和輟學(xué)前可靠地預(yù)測,就可以模擬這個場景通過訓(xùn)練的模型在課程早期收集數(shù)據(jù)。學(xué)生生存的標簽具有相同的完整數(shù)據(jù)集(即在課程結(jié)束時,學(xué)生是否提交了最終的測驗),但模型只從課程的早期訪問數(shù)據(jù)。把過程分為三部分,根據(jù)過程的持續(xù)時間、時間特征建模MOOC學(xué)生活動。表2列出了兩個模型的性能指標,表3顯示的是同樣的結(jié)果,在AUC-PR的分數(shù)變化是可以忽略的,因為班級是不平衡的,所以在所有模型中接近最優(yōu)。為了彰顯模型的實力,只報告模型的AUC-PR(Pos)分數(shù)。把每個課程分為開始、中間和終點三個階段。開始——中間指通過開始和中間階段收集的數(shù)據(jù)。開始——結(jié)束指的是在整個課程過程中收集的數(shù)據(jù)。
早期預(yù)測的分數(shù),在表3“開始”、“中間”和“開始—中間”中(即用部分數(shù)據(jù)預(yù)測生存),表明模型確實可以使這些預(yù)測可靠。作為更接近課程結(jié)束的現(xiàn)有數(shù)據(jù),模型能做出更好的預(yù)測。正如在以前的實驗設(shè)置中,潛參與模型達到最高預(yù)測質(zhì)量。潛在模型在M-E課程的所有時間段中開始階段優(yōu)于直接模型。
從結(jié)果來看,似乎中間階段是監(jiān)控學(xué)生活動用于預(yù)測學(xué)生是否在課程中生存的最重要階段。從中間相位數(shù)據(jù)對比,使用的數(shù)據(jù)從起始階段設(shè)置,并且?guī)缀跸嗟鹊臄?shù)值,啟動中間模型能產(chǎn)生更高的AUC-PR值??梢酝茰y,這是由于開始較多的學(xué)生參與,未能堅持到結(jié)束。這種現(xiàn)象不管是傳統(tǒng)課堂還是在線課堂都是很典型的,學(xué)生對課程熟悉,然后再決定是繼續(xù)或輟學(xué)。消除這一類群收集的數(shù)據(jù)有助于提高學(xué)生的生存預(yù)測。
四、特征分析
通過讓每個功能顯現(xiàn)出來并觀察預(yù)測性能值所產(chǎn)生的變化來評估每個功能的特征??紤]的特征是:在論壇發(fā)帖子(發(fā)布),查看論壇內(nèi)容(視圖),在最后測驗的時間段用戶提交的測試(測驗)以及查看演講。以上提到的四個特性,從所有PSL規(guī)則忽略相關(guān)功能構(gòu)建一個PSL模型。圖3給出這些測試階段(啟動、中期和最終)的結(jié)果。講座的特征對于學(xué)生的生存預(yù)測是很重要的。論壇作為連接世界各地在線課程的一個平臺,也被證明有強烈的促進功能。一直以來,論壇帖子所分析的課程更多是在中期和結(jié)束階段,所以論壇的帖子在中期和結(jié)束階段相應(yīng)地更重要。從圖3可以看出論壇特性僅次于講座。
五、結(jié)束語
維護和培養(yǎng)學(xué)生參與學(xué)習是至關(guān)重要的。了解學(xué)生參與在線課程的影響因素將有助于設(shè)計更好的課程和提高學(xué)生的保留率。大規(guī)模開放在線課程(MOOC)的參與者和MOOC交互過程中收集的數(shù)據(jù)為研究學(xué)生大規(guī)模參與學(xué)習提供了開放的途徑。
參考文獻:
[1]陳肖庚,王頂明.MOOC的發(fā)展歷程與主要特征分析[J].現(xiàn)代教育技術(shù),2013(11):23.
[2]蔣卓軒,張巖,李曉明.基于MOOC數(shù)據(jù)的學(xué)習行為分析與預(yù)測[J].計算機研究與發(fā)展,2015(3):614-618.
[3]伍苗苗,黃蕙歡,馬北河,等.基于學(xué)生學(xué)習評價的國內(nèi)翻轉(zhuǎn)課堂研究述評[J].中國教育信息化,2017(18):1-4.
[4]劉正濤,黃慧,曹陽.基于MOOCs教學(xué)模式的研究與實踐[J].中國教育信息化,2017(18):47-52.
[5]AndersonA,Huttenlocher D,Kleinberg J,et al.Engaging With massive online courses [C].http://Procof the 23 rdInt Conf on World Wide Web.NewYork:ACM,2014:687-689.
[6]Dernoncourt F,Do C,Halawa S,et al.MoocViz:A large scale,open access,collaborative,data analytics platform for MOOCs[C/OL]//MOOCs [C/OL].http://Neural Information Processing SystemsWorkshopon Data Driven Education,2013 [2014-06-01].http://groups .csail.mit.edu/EVO-DesignOpt/groupWebSite/uploads/Site/MoocViz.pdf.
[7]陳然,楊成.SPOC混合學(xué)習模式設(shè)計研究[J].中國遠程教育,2015(5):42-47.
(編輯:王曉明)