黃煥 元帥
[摘 要]在線學(xué)習(xí)行為的時(shí)序模式反映了在線學(xué)習(xí)行為隨時(shí)間動(dòng)態(tài)變化的規(guī)律,對(duì)于理解在線學(xué)習(xí)過程、設(shè)計(jì)有效的干預(yù)措施具有重要作用。目前,研究者主要采用滯后序列分析來探索在線學(xué)習(xí)行為的時(shí)序模式,但這種方法通常揭示不同在線學(xué)習(xí)行為之間的依賴性,由此推出在線學(xué)習(xí)行為時(shí)序模式不夠準(zhǔn)確,且難以對(duì)不同的時(shí)序模式進(jìn)行量化比較。針對(duì)上述問題,文章將過程挖掘技術(shù)引入在線學(xué)習(xí)行為時(shí)序模式研究,提出了一個(gè)基于過程挖掘的在線學(xué)習(xí)行為時(shí)序模式分析方法,并據(jù)此開展了一項(xiàng)案例研究。研究發(fā)現(xiàn):在一個(gè)主題單元期間,中途棄學(xué)者和持續(xù)學(xué)習(xí)者的在線學(xué)習(xí)行為時(shí)序模式并無顯著差異,但是,在整個(gè)課程期間,持續(xù)學(xué)習(xí)者在時(shí)間與精力分配上與中途棄學(xué)者存在差異,表現(xiàn)出了更強(qiáng)的自我調(diào)節(jié)能力。
[關(guān)鍵詞]在線學(xué)習(xí)行為分析;時(shí)序模式分析;過程挖掘
[中圖分類號(hào)]G434 [文獻(xiàn)標(biāo)識(shí)碼]A [文章編號(hào)]1008-7656(2023)03-0011-08
引言
在線學(xué)習(xí)分析是教育技術(shù)領(lǐng)域中一個(gè)重要的研究方向。新媒體聯(lián)盟的地平線報(bào)告曾連續(xù)四年(2011-2014年)將其列為影響未來教育發(fā)展的六大關(guān)鍵技術(shù)之一。在線學(xué)習(xí)分析包括行為分析、情感分析、知識(shí)結(jié)構(gòu)分析、學(xué)習(xí)路徑分析等多個(gè)方面。在線學(xué)習(xí)行為分析是學(xué)習(xí)分析的重要組成部分,旨在從在線學(xué)習(xí)過程的行為數(shù)據(jù)中挖掘出隱藏的有價(jià)值信息,比如行為模式、行為偏好等,從而促進(jìn)對(duì)學(xué)習(xí)過程、學(xué)習(xí)結(jié)果、學(xué)習(xí)環(huán)境的理解和優(yōu)化[1]。近年來,國內(nèi)外學(xué)者已通過在線學(xué)習(xí)行為分析開展了多方面的研究,例如在線學(xué)習(xí)參與模式探索[2-3]、在線學(xué)業(yè)成績或?qū)W習(xí)風(fēng)險(xiǎn)預(yù)測[4-7]、在線學(xué)習(xí)投入度評(píng)估等[8-9]。但是,這些研究主要分析各種在線學(xué)習(xí)行為的分布特征(頻次或時(shí)間分布),而對(duì)在線學(xué)習(xí)行為的時(shí)序特征探究不多。
近幾年,隨著研究的不斷深入,越來越多的研究關(guān)注在線學(xué)習(xí)行為的時(shí)序特征。因?yàn)樵诰€學(xué)習(xí)行為的時(shí)序特征能更精細(xì)地刻畫學(xué)習(xí)過程的動(dòng)態(tài)特性,反映學(xué)習(xí)者的學(xué)習(xí)方式、使用的學(xué)習(xí)策略等復(fù)雜特征[10-11],這有助于深化對(duì)在線學(xué)習(xí)過程的理解和優(yōu)化。從研究所采用的分析方法來看,已有的研究大多采用滯后序列分析(Lag Sequential Analysis,LSA)來挖掘不同學(xué)習(xí)者的學(xué)習(xí)行為時(shí)序模式。例如,Hou等采用LSA探索了教師在基于問題解決的在線討論活動(dòng)中的行為時(shí)序模式,比較了學(xué)生在不同平臺(tái)(在線論壇、Facebook)支撐的在線討論活動(dòng)中的知識(shí)建構(gòu)行為和認(rèn)知過程的時(shí)序模式[12-13];劉智等以大學(xué)生在SPOC(Small Private Online Course)中的在線學(xué)習(xí)行為記錄為研究對(duì)象,采用LSA比較了不同年級(jí)學(xué)生的行為時(shí)序模式[14];李爽等以開放大學(xué)學(xué)生在Moodle平臺(tái)上的在線學(xué)習(xí)行為日志為研究對(duì)象,通過LSA發(fā)現(xiàn)了五種不同的在線學(xué)習(xí)參與方式,并對(duì)其行為時(shí)序模式進(jìn)行了比較分析[15]。菅保霞等以學(xué)生在Moodle平臺(tái)的在線學(xué)習(xí)行為數(shù)據(jù)為基礎(chǔ),以全腦模型為分類依據(jù),探索了邏輯型、組織型、交流型和空想型等四種思維類型的學(xué)生在在線學(xué)習(xí)行為序列上的差異[16]。
滯后序列分析的基本思路是對(duì)各種一階行為序列的出現(xiàn)頻次進(jìn)行統(tǒng)計(jì)分析,計(jì)算一種行為發(fā)生之后另一種行為出現(xiàn)的概率,找出統(tǒng)計(jì)顯著的一階行為序列。由此可見,滯后序列分析只能發(fā)現(xiàn)學(xué)習(xí)過程中存在顯著時(shí)序依賴的相鄰學(xué)習(xí)行為,并不能很好地揭示一次學(xué)習(xí)會(huì)話或整個(gè)課程學(xué)習(xí)期間的行為時(shí)序模式[14],也難以對(duì)不同學(xué)習(xí)群體的行為時(shí)序模式進(jìn)行定量比較。為此,本研究嘗試引入管理學(xué)領(lǐng)域的過程挖掘(Process Mining,PM)技術(shù)來探索在線學(xué)習(xí)行為的時(shí)序模式,以加深對(duì)在線學(xué)習(xí)過程的理解,支撐在線學(xué)習(xí)干預(yù)措施的設(shè)計(jì)。
一、過程挖掘技術(shù)概述
過程挖掘也稱“工作流挖掘”,是支撐工作流分析和再設(shè)計(jì)的一項(xiàng)關(guān)鍵技術(shù)[17]。為了在快速變化的環(huán)境中保持競爭力,企業(yè)需要不斷地對(duì)現(xiàn)有的工作流程進(jìn)行分析和再設(shè)計(jì)以提高工作效率,這就需要經(jīng)常實(shí)施工作流建模。傳統(tǒng)的工作流建模通常由管理者和企業(yè)顧問使用建模工具來完成,這種建模方式易受建模者個(gè)人經(jīng)驗(yàn)影響,且模型只表達(dá)了流程“應(yīng)該”的樣子,難以發(fā)現(xiàn)“實(shí)際”的樣子,同時(shí)這種建模方式效率不夠、成本高[18]。過程挖掘是伴隨著各種工作流管理系統(tǒng)的應(yīng)用而出現(xiàn)的一種新的工作流建模方法,它采用一定的數(shù)據(jù)挖掘技術(shù)從工作流管理系統(tǒng)積累的日志數(shù)據(jù)中自動(dòng)重構(gòu)出一個(gè)工作流模型,從而支撐工作流的診斷、分析和再設(shè)計(jì)。
通過過程挖掘建立的模型不僅能反映出業(yè)務(wù)的實(shí)際執(zhí)行過程,而且建模過程是自動(dòng)化的,可減少建模者個(gè)人經(jīng)驗(yàn)對(duì)建模的影響,也能提高建模效率。過程挖掘的關(guān)鍵是過程挖掘算法,它直接決定了生成的工作流模型的質(zhì)量,過程挖掘的一般過程包括以下三個(gè)步驟。
(一)事件日志生成
事件日志生成是從工作流管理系統(tǒng)積累的日志數(shù)據(jù)中根據(jù)實(shí)際需要篩選出相應(yīng)的業(yè)務(wù)活動(dòng)執(zhí)行記錄,并將其轉(zhuǎn)化為統(tǒng)一的事件日志格式進(jìn)行存儲(chǔ)。事件日志是一個(gè)業(yè)務(wù)活動(dòng)執(zhí)行記錄的集合,每條業(yè)務(wù)活動(dòng)執(zhí)行記錄至少需要包括三個(gè)字段:業(yè)務(wù)活動(dòng)的類型、業(yè)務(wù)活動(dòng)執(zhí)行的時(shí)間、業(yè)務(wù)活動(dòng)所屬的業(yè)務(wù)流程。一個(gè)完整的業(yè)務(wù)流程通常需要經(jīng)歷多個(gè)業(yè)務(wù)活動(dòng),這些業(yè)務(wù)活動(dòng)按時(shí)間順序排列就形成一個(gè)事件序列。
(二)過程模型發(fā)現(xiàn)
過程模型發(fā)現(xiàn)是利用過程挖掘算法或工具從事件日志中挖掘出一個(gè)反應(yīng)業(yè)務(wù)真實(shí)執(zhí)行流程的過程模型。目前,研究者已提出了很多高效的過程挖掘算法,常見算法有α算法、啟發(fā)式算法、歸納式算法等,不同的過程挖掘算法輸出的過程模型可能不同[17]。在過程挖掘算法基礎(chǔ)上,已出現(xiàn)了很多優(yōu)秀的過程挖掘工具,如ProM、ARIS、Celonis、Disco、PM4Py等。這些過程挖掘工具都具有圖形化操作界面,實(shí)現(xiàn)了多種典型的過程挖掘算法,可以生成多種過程模型,能夠有效支撐過程挖掘的研究與實(shí)踐。
(三)過程模型可視化
過程模型可視化是將發(fā)現(xiàn)的過程模型采用一種形象直觀的圖形呈現(xiàn)給相關(guān)人員。不同的過程挖掘算法輸出的過程模型可能也不同,常見的過程模型有Petri網(wǎng)、活動(dòng)轉(zhuǎn)換圖、過程樹、BPMN等[17]。因?yàn)镻etri網(wǎng)有著較嚴(yán)格的數(shù)學(xué)理論基礎(chǔ),有利于過程模型的形式化驗(yàn)證和分析,因此,在過程挖掘中Petri網(wǎng)得到了廣泛應(yīng)用。同樣,活動(dòng)轉(zhuǎn)換圖也因其易理解性得到了認(rèn)可。
二、基于PM的在線學(xué)習(xí)行為時(shí)序模式分析方法
(一)基于PM的在線學(xué)習(xí)行為時(shí)序模式分析流程
從過程挖掘的一般過程可以看出,如果將學(xué)習(xí)者在一次學(xué)習(xí)會(huì)話或整個(gè)課程學(xué)習(xí)期間的在線學(xué)習(xí)行為按時(shí)間順序整理成一個(gè)序列,則可以利用過程挖掘技術(shù)提取出一個(gè)可視化的過程模型。顯然,這個(gè)過程模型反映了學(xué)習(xí)者在學(xué)習(xí)期間的行為時(shí)序模式。如果將學(xué)習(xí)者按照性別、成績等進(jìn)行劃分,就可以發(fā)掘不同群體的在線學(xué)習(xí)行為時(shí)序模式,進(jìn)而觀察它們的異同。另外,過程挖掘還可以計(jì)算一個(gè)過程模型與實(shí)際事件日志的一致性程度。因此,將過程模型應(yīng)用于在線學(xué)習(xí)行為時(shí)序分析還可以對(duì)不同群體的行為時(shí)序模式進(jìn)行定量比較?;谝陨戏治?,本研究提出了一個(gè)基于過程挖掘的在線學(xué)習(xí)行為時(shí)序模式分析模型,其基本流程如圖1所示。
1.行為數(shù)據(jù)抽取
在線學(xué)習(xí)平臺(tái)記錄的在線學(xué)習(xí)過程數(shù)據(jù)是很豐富的,常見的數(shù)據(jù)包括學(xué)習(xí)者的基本信息、作業(yè)與測試成績、點(diǎn)擊行為數(shù)據(jù)、論壇發(fā)帖等。在分析學(xué)習(xí)者個(gè)人或群體的行為時(shí)序模式時(shí),首先要根據(jù)研究問題從網(wǎng)絡(luò)學(xué)習(xí)平臺(tái)的后臺(tái)數(shù)據(jù)庫中抽取出相關(guān)的在線學(xué)習(xí)行為記錄,過濾掉不相關(guān)的噪音數(shù)據(jù)和無效數(shù)據(jù)。研究問題是在線學(xué)習(xí)行為數(shù)據(jù)抽取的主要依據(jù),研究問題不同,需要提取的在線學(xué)習(xí)行為數(shù)據(jù)一般也不同。
2.事件日志生成
如前所述,過程挖掘所需的事件日志有專門的描述格式,它至少包含事件的類型、事件發(fā)生的時(shí)間和事件所屬的序列三個(gè)字段。網(wǎng)絡(luò)學(xué)習(xí)平臺(tái)記錄的在線學(xué)習(xí)行為數(shù)據(jù)往往只包含了行為的發(fā)生時(shí)間和作用對(duì)象,沒有包含行為的類型和所屬的序列。即使一些在線學(xué)習(xí)平臺(tái)根據(jù)行為的作用對(duì)象將各種行為進(jìn)行了分類,也不一定能夠滿足研究的需要。因此,事件日志生成需要完成兩個(gè)任務(wù):一是依據(jù)研究問題制定行為編碼框架,并以行為的作用對(duì)象為線索對(duì)各種行為的類型進(jìn)行編碼;二是根據(jù)研究問題定義行為序列的邊界,并以各種行為的發(fā)生時(shí)間為線索標(biāo)注它們所屬的序列。
3.時(shí)序模式發(fā)現(xiàn)
將相關(guān)學(xué)習(xí)行為數(shù)據(jù)轉(zhuǎn)化為事件日志后,就可以利用過程挖掘工具來發(fā)現(xiàn)不同學(xué)習(xí)者個(gè)體或群體的行為時(shí)序模式,并輸出可視化的表征圖形。雖然,這一階段的工作主要是由計(jì)算機(jī)自動(dòng)完成,但分析者依然需要完成三方面的工作:一是根據(jù)研究問題對(duì)事件日志中的在線學(xué)習(xí)行為數(shù)據(jù)進(jìn)行劃分,例如,從事件日志中提取出成績較高的學(xué)生和成績較低的學(xué)生的行為數(shù)據(jù),以比較二者的行為時(shí)序模式;二是根據(jù)研究問題選擇合適的過程挖掘算法,并根據(jù)數(shù)據(jù)的實(shí)際情況設(shè)定算法的參數(shù),以發(fā)現(xiàn)不同群體突出的、較穩(wěn)定的行為時(shí)序模式;三是設(shè)置圖形表征的樣式,使時(shí)序模式表征更直觀。
4.時(shí)序模式分析
得到不同個(gè)體或群體的在線學(xué)習(xí)行為時(shí)序模式后,可以用兩種方法對(duì)這些時(shí)序模式進(jìn)行對(duì)比分析。一是通過觀察來分析不同在線學(xué)習(xí)行為時(shí)序模式的差異,如各種行為的數(shù)量分布差異、各種行為的時(shí)序結(jié)構(gòu)差異等;二是通過一致性檢驗(yàn)計(jì)算發(fā)現(xiàn)的時(shí)序模式與實(shí)際數(shù)據(jù)之間的擬合性,進(jìn)而對(duì)不同時(shí)序模式之間的相似度進(jìn)行定量比較。
(二)基于PM的在線學(xué)習(xí)行為時(shí)序模式分析應(yīng)注意的問題
在運(yùn)用過程挖掘技術(shù)分析在線學(xué)習(xí)行為的時(shí)序模式時(shí),需要注意以下問題。
第一,要根據(jù)研究問題,選擇或制定合理的行為編碼框架。在線學(xué)習(xí)行為包括外顯行為和內(nèi)隱行為[19]。外顯行為是一些操作性行為,如登錄系統(tǒng)、瀏覽資源、提交作業(yè)、完成測驗(yàn)、發(fā)布帖子等;內(nèi)隱行為則是隱藏在外顯行為背后的認(rèn)知活動(dòng),需要依據(jù)特定的理論編碼框架對(duì)相關(guān)操作進(jìn)行編碼才能得到。過程挖掘不僅可以分析外顯行為的時(shí)序模式,也可以分析內(nèi)隱行為的時(shí)序模式。在分析外顯行為的時(shí)序模式時(shí),一般可直接使用在線學(xué)習(xí)平臺(tái)中的行為編碼框架或?qū)ζ溥M(jìn)行一定的合并。在分析內(nèi)隱行為的時(shí)序模式時(shí),則需要根據(jù)研究的問題選擇或制定合理的行為編碼框架,對(duì)外顯行為數(shù)據(jù)進(jìn)行手動(dòng)或半自動(dòng)編碼。相同的外顯行為數(shù)據(jù),如果研究的問題不同,就需要采用不同的編碼框架將其映射為不同的內(nèi)隱行為。為了保證編碼的可靠性和效率,還應(yīng)該采取預(yù)編碼和多人協(xié)商的編碼策略。
第二,要根據(jù)研究問題,定義合理的行為序列邊界。在線學(xué)習(xí)平臺(tái)的后臺(tái)數(shù)據(jù)庫中往往只記錄了各種行為的發(fā)生時(shí)間和作用對(duì)象,沒有記錄行為所屬的序列。如何定義各種行為記錄所屬的行為序列呢?需要根據(jù)實(shí)際的研究目的來定義,研究目的不同,行為序列的邊界一般也不同。例如,當(dāng)研究目的是探索學(xué)習(xí)者在學(xué)習(xí)一門課程過程中的知識(shí)建構(gòu)路徑時(shí),應(yīng)將一名學(xué)習(xí)者在一個(gè)主題單元上的知識(shí)建構(gòu)行為(如瀏覽資源、提交作業(yè)、參與測驗(yàn)等)視為一種行為,將一名學(xué)習(xí)者在整個(gè)課程期間的行為定義為一個(gè)序列;但是,當(dāng)研究目的是探索學(xué)習(xí)者偏好的在線學(xué)習(xí)行為習(xí)慣(認(rèn)知風(fēng)格)時(shí),則應(yīng)該將學(xué)習(xí)者在每個(gè)學(xué)習(xí)會(huì)話或?qū)W習(xí)某個(gè)主題的各類學(xué)習(xí)行為定義為一個(gè)序列,而且需要對(duì)這些學(xué)習(xí)行為進(jìn)行區(qū)分。
第三,要對(duì)在線學(xué)習(xí)行為的數(shù)量和過程挖掘算法的參數(shù)進(jìn)行合理設(shè)置,以獲得結(jié)構(gòu)清晰的過程模型。在線學(xué)習(xí)行為的數(shù)量和過程挖掘算法的參數(shù)對(duì)生成的過程模型具有直接影響,它們共同決定了過程模型中的節(jié)點(diǎn)數(shù)量和鏈接數(shù)量。如果在線學(xué)習(xí)行為的類型過多,過程挖掘算法的相關(guān)參數(shù)設(shè)置過于寬松,會(huì)得到一個(gè)復(fù)雜的過程模型,不利于行為時(shí)序模式的分析和比較[20]。相反就會(huì)得到一個(gè)過于簡單的過程模型,丟失一些頻繁的行為序列模式。因此,要綜合研究問題和數(shù)據(jù)實(shí)際情況合理選擇在線學(xué)習(xí)行為類型、設(shè)定過程挖掘算法的參數(shù),以獲得復(fù)雜度適中的過程模型,更好地支撐行為時(shí)序模式分析。
三、基于PM的在線學(xué)習(xí)行為時(shí)序模式分析案例
為了更好地展示上述在線學(xué)習(xí)行為時(shí)序模式分析模型的效用,本研究以一門MOOC的在線學(xué)習(xí)行為數(shù)據(jù)為基礎(chǔ),依據(jù)該模型開展了一項(xiàng)探索性的案例研究。
(一)研究目的
本項(xiàng)案例研究的主要目的是探索持續(xù)學(xué)習(xí)者和中途棄學(xué)者的學(xué)習(xí)行為時(shí)序模式,并對(duì)二者的時(shí)序模式進(jìn)行比較。具體來說,本項(xiàng)案例研究分別從宏觀和微觀兩個(gè)視角探索了兩個(gè)問題:一是比較持續(xù)學(xué)習(xí)者和中途棄學(xué)者在學(xué)習(xí)一個(gè)主題單元時(shí)表現(xiàn)出的學(xué)習(xí)行為時(shí)序模式,此在線學(xué)習(xí)行為時(shí)序模式能夠反映學(xué)習(xí)者偏好的學(xué)習(xí)風(fēng)格和習(xí)慣;二是比較持續(xù)學(xué)習(xí)者和中途棄學(xué)者在學(xué)習(xí)整個(gè)課程期間的知識(shí)建構(gòu)路徑,以探索二者建構(gòu)知識(shí)時(shí)的順序和路徑是否存在差異。
(二)數(shù)據(jù)來源
本項(xiàng)案例研究的數(shù)據(jù)來源于KDD Cup 2015數(shù)據(jù)集。KDD Cup 2015數(shù)據(jù)集是研究MOOC中途棄學(xué)者預(yù)測的一個(gè)標(biāo)準(zhǔn)數(shù)據(jù)集,它包含了39門MOOC的前30天的日志數(shù)據(jù),這些數(shù)據(jù)主要來源于“學(xué)堂在線”平臺(tái)。本研究隨機(jī)選取了其中一門MOOC的數(shù)據(jù),數(shù)據(jù)的起止時(shí)間為2014年6月12日至2014年7月11日。該課程的注冊(cè)學(xué)員數(shù)量為10 322名,其中3 136名學(xué)員被定義為持續(xù)學(xué)習(xí)者,其余7 186名學(xué)員被定義為中途棄學(xué)者。所有學(xué)員的在線學(xué)習(xí)行為記錄總數(shù)為878 119條,涉及觀看視頻、提交作業(yè)、使用論壇、訪問Wiki、瀏覽其他材料、導(dǎo)航、關(guān)閉頁面7個(gè)方面的操作行為。
(三)數(shù)據(jù)分析工具
本研究采用的數(shù)據(jù)分析工具主要是PM4Py。PM4Py是一個(gè)基于Python的開源過程挖掘工具,由Fraunhofer FIT的過程挖掘工作小組開發(fā)。PM4Py具有強(qiáng)大的事件日志處理、過程模型可視化、過程模型一致性檢驗(yàn)等功能。在事件日志處理方面,PM4Py支持XES和CSV兩種事件日志格式的導(dǎo)入、導(dǎo)出和轉(zhuǎn)換,還具有強(qiáng)大的事件日志篩選功能。在過程挖掘算法方面,PM4Py目前實(shí)現(xiàn)了2種α算法、3種歸納式算法和1種啟發(fā)式算法。在過程模型可視化方面,PM4Py支持多種常見的可視化模型,包括Petri網(wǎng)、過程樹、BPMN、活動(dòng)轉(zhuǎn)換圖等,而且還可以對(duì)這些模型進(jìn)行相互轉(zhuǎn)換。PM4Py還實(shí)現(xiàn)了兩種一致性檢驗(yàn)方法(基于令牌的重播和基于對(duì)齊的重播),能夠定量計(jì)算過程模型與事件日志之間的擬合度。
(四)在線學(xué)習(xí)行為時(shí)序模式分析
1.學(xué)習(xí)一個(gè)主題單元期間的行為習(xí)慣分析
為了探索持續(xù)學(xué)習(xí)者和中途棄學(xué)者在學(xué)習(xí)一個(gè)主題單元時(shí)的行為習(xí)慣,本研究基于PM的在線學(xué)習(xí)行為時(shí)序模式分析模型,首先從選定的課程數(shù)據(jù)中提取了第一周的五種行為記錄,分別為瀏覽視頻、瀏覽其他材料、提交作業(yè)、參與討論和使用wiki。之所以選擇第一周的行為記錄,是因?yàn)閮山M學(xué)生在第一周的在線學(xué)習(xí)行為記錄比較豐富且只與第一個(gè)主題單元相關(guān),可以準(zhǔn)確地發(fā)現(xiàn)學(xué)生在學(xué)習(xí)單個(gè)主題單元時(shí)的在線學(xué)習(xí)行為時(shí)序模式。之所以選擇以上五種在線學(xué)習(xí)行為,是因?yàn)檫@五種行為與知識(shí)建構(gòu)密切相關(guān)。篩選出所需的行為記錄數(shù)據(jù)之后,本研究將每個(gè)學(xué)生的全部在線學(xué)習(xí)行為按時(shí)間順序轉(zhuǎn)化為一個(gè)序列,然后采用啟發(fā)式算法Heuristics Miner來發(fā)掘每一組學(xué)生的在線學(xué)習(xí)行為時(shí)序模式,并使用活動(dòng)轉(zhuǎn)換圖對(duì)其進(jìn)行可視化,結(jié)果如圖2所示。
在圖2中,兩個(gè)圓形分別表示行為序列的開始和結(jié)束,每個(gè)矩形表示一種行為類別,矩形中還給出了行為的名稱(其中,access表示訪問其他材料,video表示瀏覽視頻,problem表示提交作業(yè),discussion表示參與討論,wiki表示使用wiki)和出現(xiàn)頻次,連接兩個(gè)矩形的每條箭頭表示行為轉(zhuǎn)換,箭頭上的數(shù)字表示行為轉(zhuǎn)換出現(xiàn)的頻次。對(duì)比圖2中(a)和(b)的結(jié)構(gòu)可以看出,兩組學(xué)生的行為時(shí)序模式非常相似,并沒有表現(xiàn)出明顯的差異,這表明兩組學(xué)生的行為習(xí)慣并不存在顯著差異。但是,對(duì)比圖2中(a)和(b)的行為頻次可以看出,持續(xù)學(xué)習(xí)者的行為參與度要顯著高于中途棄學(xué)者的行為參與度。雖然,從總頻次來看,中途棄學(xué)者各種行為的頻次與持續(xù)學(xué)習(xí)者相差不大,但中途棄學(xué)者的人數(shù)顯著高于持續(xù)學(xué)習(xí)者,因此,中途棄學(xué)者的人均頻次要明顯低于持續(xù)學(xué)習(xí)者的人均頻次。
2.學(xué)習(xí)整個(gè)課程期間的知識(shí)建構(gòu)路徑分析
為了探索持續(xù)學(xué)習(xí)者和中途棄學(xué)者在學(xué)習(xí)整個(gè)課程期間的知識(shí)建構(gòu)路徑,本研究依據(jù)基于PM的在線學(xué)習(xí)行為時(shí)序模式分析模型,首先提取了瀏覽視頻、瀏覽其他材料和提交作業(yè)三種在線學(xué)習(xí)行為的全部記錄,并依據(jù)其作用對(duì)象進(jìn)一步將它們映射為針對(duì)不同主題單元的知識(shí)建構(gòu)行為。這里之所以去掉了參與討論和使用wiki兩種行為,是因?yàn)殡y以區(qū)分這兩種行為記錄到底屬于哪個(gè)主題單元。之所以將這三種行為記錄進(jìn)一步抽象、合并為針對(duì)不同主題單元的知識(shí)建構(gòu)行為,是因?yàn)楸狙芯刻剿鞯膯栴}是兩組學(xué)生的知識(shí)建構(gòu)路徑,沒必要對(duì)屬于同一個(gè)主題單元的三種行為作進(jìn)一步區(qū)分。篩選出所需的行為記錄數(shù)據(jù)后,本研究還是將每個(gè)學(xué)生的全部在線學(xué)習(xí)行為按時(shí)間順序轉(zhuǎn)化為一個(gè)序列,然后采用啟發(fā)式算法Heuristics Miner來發(fā)掘每一組學(xué)生的在線學(xué)習(xí)行為時(shí)序模式,并使用活動(dòng)轉(zhuǎn)換圖對(duì)其進(jìn)行可視化處理,結(jié)果如圖3所示。
從圖3可以看出,兩組學(xué)習(xí)者總體來說都是按照發(fā)布時(shí)間來依次學(xué)習(xí)各個(gè)主題單元,即按照“第一章→第二章→第三章→……”的順序依次進(jìn)行學(xué)習(xí)。這說明任課教師對(duì)課程內(nèi)容的組織比較合理。但是,仔細(xì)觀察兩個(gè)活動(dòng)轉(zhuǎn)換圖可以發(fā)現(xiàn)它們存在以下四個(gè)不同之處。一是持續(xù)學(xué)習(xí)者在各個(gè)主題單元上的參與度要高于中途棄學(xué)者。這一點(diǎn)與學(xué)習(xí)單個(gè)主題單元時(shí)類似,通過繪制學(xué)習(xí)行為人均頻次對(duì)比圖就可以很容易看出,在此不再贅述。二是在線學(xué)習(xí)行為在各個(gè)主題上的分布比例不同。持續(xù)學(xué)習(xí)者在第三章的在線學(xué)習(xí)行為最多,總頻次達(dá)到了50 997,而中途棄學(xué)者在第一章的在線學(xué)習(xí)行為最多,總頻次為23 218;持續(xù)學(xué)習(xí)者在前四章的在線學(xué)習(xí)行為頻次較多且較均衡,而中途棄學(xué)者的在線學(xué)習(xí)行為頻次較少且逐漸遞減。三是部分持續(xù)學(xué)習(xí)者在學(xué)完第一章后直接進(jìn)入了第三章的學(xué)習(xí),而中途棄學(xué)者都是按照主題單元的發(fā)布順序依次開展學(xué)習(xí)。四是持續(xù)學(xué)習(xí)者中只有少部分在第一章和第二章就結(jié)束了學(xué)習(xí),大部分是在第三章或第四章學(xué)完后才結(jié)束學(xué)習(xí),而中途棄學(xué)者大部分在第一章和第二章學(xué)完后就結(jié)束了學(xué)習(xí)。對(duì)以上四個(gè)不同點(diǎn)進(jìn)行綜合分析可以得出:一是持續(xù)學(xué)習(xí)者的參與度更高,持久性更強(qiáng),這可能是因?yàn)槌掷m(xù)學(xué)習(xí)者往往有更強(qiáng)的自我管控能力;二是持續(xù)學(xué)習(xí)者能夠更好地分配自己的學(xué)習(xí)時(shí)間和精力。第三章應(yīng)該是這門課程的核心內(nèi)容,難度可能也較大,持續(xù)學(xué)習(xí)者知道在這一章需要花費(fèi)大量的時(shí)間和精力,而反觀中途棄學(xué)者則發(fā)現(xiàn),學(xué)生的參與度隨著時(shí)間逐漸遞減,在學(xué)完第三章后參與度更是直線下降,這可能是因?yàn)閷W(xué)生在遇到挫折時(shí)選擇了放棄。
四、結(jié)語
針對(duì)滯后序列分析法在分析在線學(xué)習(xí)行為時(shí)序模式時(shí)存在的問題,本研究提出了一個(gè)基于過程挖掘技術(shù)的在線學(xué)習(xí)行為時(shí)序模式分析方法,并使用該方法探索了兩種視角下MOOC持續(xù)學(xué)習(xí)者和中途棄學(xué)者的在線學(xué)習(xí)行為時(shí)序模式。研究結(jié)果表明:一是從學(xué)習(xí)一個(gè)主題單元時(shí)的操作行為來看,持續(xù)學(xué)習(xí)者和中途棄學(xué)者雖然在參與度上具有明顯差異,但在行為習(xí)慣上很相似,這說明二者的在線學(xué)習(xí)方式與風(fēng)格并無明顯差異;二是從學(xué)習(xí)整個(gè)課程期間的知識(shí)建構(gòu)路徑來看,持續(xù)學(xué)習(xí)者和中途棄學(xué)者雖然總體上都遵照了教師設(shè)計(jì)的邏輯順序進(jìn)行知識(shí)建構(gòu),但持續(xù)學(xué)習(xí)者不僅表現(xiàn)出了更高的參與度,而且在時(shí)間和精力投入上表現(xiàn)出了更合理的分配,在知識(shí)建構(gòu)的邏輯順序上也表現(xiàn)出了一定的自主性,這說明他們具有較強(qiáng)的自我調(diào)節(jié)學(xué)習(xí)能力。
本研究提出了一種新的在線學(xué)習(xí)行為時(shí)序模式分析方法,為教育研究者更深入地探索在線學(xué)習(xí)過程的規(guī)律、理解在線學(xué)習(xí)過程提供了新的思路,但是,本研究也存在一些不足之處。例如,案例研究僅對(duì)學(xué)習(xí)持久性與在線學(xué)習(xí)行為時(shí)序模式之間的關(guān)系作了初步分析,并沒有深入分析在線學(xué)習(xí)行為時(shí)序模式與學(xué)業(yè)成績之間的關(guān)系。這主要是因?yàn)檠芯繑?shù)據(jù)中沒有包含學(xué)習(xí)者的成績信息,難以按照成績對(duì)學(xué)習(xí)者進(jìn)行分組。未來可以針對(duì)上述問題開展更深入的研究,揭示在線學(xué)習(xí)行為時(shí)序模式對(duì)學(xué)習(xí)結(jié)果的影響,并據(jù)此設(shè)計(jì)有效的對(duì)策和措施。
[參考文獻(xiàn)]
[1]楊現(xiàn)民,王懷波,李冀紅.滯后序列分析法在學(xué)習(xí)行為分析中的應(yīng)用[J].中國電化教育,2016(2):17-23.
[2]White A, & Carroll P. Identifying patterns of learner behaviour: What business statistics students do with learning resources[J]. INFORMS Transactions on Education, 2017(1): 1-13.
[3]Khalil M, Ebner M. Clustering patterns of engagement in Massive Open Online Courses (MOOCs): the use of learning analytics to reveal student categories[J]. International Journal of Computing in Higher Education, 2017( 29): 114-132.
[4]Conijn R, Snijders C, Kleingeld A, etal. Predicting Student Performance from LMS Data: A Comparison of 17 Blended Courses Using Moodle LMS[J]. IEEE Transaction on Learning Technologies, 2017(1):17-29.
[5]Macfadyen L, Dawson S. Mining LMS data to develop an “early warning system” for educators: A proof of concept[J]. Computer & Education, 2010( 54): 588-599.
[6]Hu Y-H, Lo C-L, Shih S-P. Developing early warning systems to predict students online learning performance[J]. Computer in Human Behavior, 2014(36): 469-478.
[7]范逸洲,汪瓊.學(xué)業(yè)成就與學(xué)業(yè)風(fēng)險(xiǎn)的預(yù)測——基于學(xué)習(xí)分析領(lǐng)域中預(yù)測指標(biāo)的文獻(xiàn)綜述[J].中國遠(yuǎn)程教育,2018(1):5-15.
[8]李爽,王增賢,喻忱,等.在線學(xué)習(xí)行為投入分析框架與測量指標(biāo)研究——基于LMS數(shù)據(jù)的學(xué)習(xí)分析[J].開放教育研究,2016(2):77-88.
[9]張琪,武法提.學(xué)習(xí)行為投入評(píng)測框架構(gòu)建與實(shí)證研究[J].中國電化教育,2018(9):102-108.
[10]Maldonado-Mahauad J, Perez-Sanagustín M, Kizilcec R F,etal.Mining theory-based patterns from Big data: Identifying self-regulated learning strategies in Massive Open Online Courses[J]. Computers in Human Behavior, 2018( 80): 179-196.
[11]Wong J, Khalil M, Baars M,etal. Exploring sequences of learner activities in relation to self-regulated learning in a massive open online course[J]. Computers & Education, 2019, 140: 103595.
[12]Hou H-T, Wang S-M, Lin P-C,etal. Exploring the learners knowledge construction and cognitive patterns of different asynchronous platforms: comparison of an online discussion forum and Facebook[J]. Innovations in Education and Teaching International, 2015(6):610-620.
[13]Hou H-T, Sung Y-T, Chang K-E. Exploring the behavioral patterns of an online knowledge-sharing discussion activity among teachers with problem-solving strategy[J]. Teaching and Teacher Education, 2009( 25): 101-108.
[14]劉智,王亞妮,鄭年亨,等.高校SPOC環(huán)境下學(xué)習(xí)者行為序列的差異性分析研究[J].中國電化教育,2017(7):88-94.
[15]李爽,鐘瑤,喻忱,等.基于行為序列分析對(duì)在線學(xué)習(xí)參與模式的探索[J].中國電化教育,2017(3):88-95.
[16]菅保霞,姜強(qiáng),趙蔚.基于全腦模型的在線學(xué)習(xí)者學(xué)習(xí)行為序列分析[J].現(xiàn)代教育技術(shù),2020(1):107-113.
[17]曾慶田.過程挖掘的研究現(xiàn)狀與問題綜述[J].系統(tǒng)仿真學(xué)報(bào),2007(16):275-280.
[18]李燕,馮玉強(qiáng).工作流挖掘:一種新型工作流自動(dòng)化建模方法[J].計(jì)算機(jī)工程,2007(4):20-22.
[19]祝智庭,賀斌.智慧教育:教育信息化的新境界[J].電化教育研究,2012(12):5-13.
[20]Bannert M, Reimann P, Sonnenberg C. Process mining techniques for analysing patterns and strategies in students self-regulated learning[J]. Metacognitive Learning, 2014(9):161-185.
[作者簡介]黃煥,中南民族大學(xué)教育學(xué)院副教授,博士,研究方向:教育技術(shù)學(xué);元帥,湖北第二師范學(xué)院計(jì)算機(jī)學(xué)院講師,博士,研究方向:教育技術(shù)學(xué)。
[責(zé)任編輯 李培福]
廣西廣播電視大學(xué)學(xué)報(bào)2023年3期