沈欣憶 劉美辰 吳健偉 董現(xiàn)壘
【摘要】? MOOC的自主性和靈活性特征,使得學(xué)習(xí)者具有多樣化的學(xué)習(xí)行為模式,很多研究指出學(xué)習(xí)者在線學(xué)習(xí)行為模式與學(xué)習(xí)成果具有高度相關(guān)性。線上授課的教學(xué)方式因為其便捷等各種優(yōu)點,廣泛被學(xué)生群體所接受,雖然線上授課彌補了傳統(tǒng)教學(xué)的不可重復(fù)性等缺陷,但是由于每個學(xué)生的在線學(xué)習(xí)行為不同,其教學(xué)效果也因人而異,本研究嘗試從國內(nèi)最早的MOOC平臺“學(xué)堂在線”上獲取學(xué)生的學(xué)習(xí)行為數(shù)據(jù),建立學(xué)生在線學(xué)習(xí)行為與在線學(xué)習(xí)績效評估模型,并進(jìn)行抽樣逐步回歸,以了解學(xué)生在線學(xué)習(xí)行為對其學(xué)習(xí)成績的影響。結(jié)果表明,學(xué)生某些在線學(xué)習(xí)行為,如作業(yè)完成比例、視頻完成率等對其學(xué)習(xí)效果產(chǎn)生重要的正面影響,反之部分在線學(xué)習(xí)行為對學(xué)習(xí)效果會產(chǎn)生不良影響。因此,根據(jù)本研究結(jié)果對教師設(shè)計在線學(xué)習(xí)、對學(xué)生開展線上學(xué)習(xí)提供意見和建議,將有效提高在線學(xué)習(xí)的效率和效果。
【關(guān)鍵詞】? 在線學(xué)習(xí)行為;學(xué)習(xí)績效評估模型;在線學(xué)習(xí)者;教育大數(shù)據(jù);數(shù)據(jù)挖掘;學(xué)堂在線;Python
【中圖分類號】? ?G434? ? ? ? 【文獻(xiàn)標(biāo)識碼】? A? ? ? ?【文章編號】? 1009-458x(2020)10-0001-08
一、引言
“互聯(lián)網(wǎng)+”時代,在線學(xué)習(xí)已經(jīng)被應(yīng)用于各個教育階段,是學(xué)習(xí)者不可或缺的學(xué)習(xí)方式。在線學(xué)習(xí)因其不受時空分離的影響,學(xué)習(xí)方式變得更加靈活,信息化時代所具有的精細(xì)化、碎片化和去權(quán)威化的特征更加凸顯(夏青, 2018)。MOOC(Massive Open Online Course,MOOC)的自主性和靈活性特征,使得學(xué)習(xí)者具有多樣化的學(xué)習(xí)行為模式,很多研究指出學(xué)習(xí)者在線學(xué)習(xí)行為模式與學(xué)習(xí)成果具有高度相關(guān)性(Johnson & Sinatra, 2013; 高潔, 2016; 李爽, 2016)。在“互聯(lián)網(wǎng)+”背景下,大數(shù)據(jù)迅速充斥著各行各業(yè),教育領(lǐng)域也不例外,隨著學(xué)習(xí)分析和人工智能技術(shù)等的發(fā)展,利用學(xué)生在線學(xué)習(xí)行為數(shù)據(jù)來評估學(xué)生的學(xué)習(xí)表現(xiàn)以為學(xué)生提供更好的服務(wù)已經(jīng)成為不可阻擋的趨勢(Francisco, García, ?ngel, & María, 2018; Tsai, Lin, Hong, & Tai, 2018),數(shù)據(jù)挖掘成為深入探究在線學(xué)習(xí)行為以及行為數(shù)據(jù)背后隱藏的行為模式和學(xué)習(xí)績效的關(guān)聯(lián)性的重要方法 (Jesús, Alejandro, & Manuel, 2017; Elena, Zhang, Cristina, & Francisco,2018; Manuela, Tiago, Fernando, & Marco, 2018)。
本研究選取“學(xué)堂在線”的一門課程,運用Python技術(shù)對學(xué)生在線學(xué)習(xí)行為數(shù)據(jù)進(jìn)行整理加工,建立學(xué)生在線學(xué)習(xí)績效評估模型,最后利用Stata進(jìn)行抽樣逐步回歸,形成學(xué)生學(xué)習(xí)行為對學(xué)習(xí)績效的貢獻(xiàn)模型,分析和發(fā)掘有利于提高學(xué)生學(xué)習(xí)績效的在線學(xué)習(xí)行為,助力在線學(xué)習(xí)過程性評估的研究,同時也為MOOC學(xué)習(xí)績效提升提供實質(zhì)性建議。
二、MOOC在線學(xué)習(xí)行為和學(xué)習(xí)績效研究現(xiàn)狀
(一)在線學(xué)習(xí)行為和學(xué)習(xí)績效的關(guān)系研究
隨著現(xiàn)代信息技術(shù)的迅速發(fā)展,網(wǎng)絡(luò)技術(shù)在教育中的應(yīng)用日益廣泛和深入,研究學(xué)生在線學(xué)習(xí)行為和學(xué)習(xí)績效的關(guān)系成為新的研究熱點。郎波等 (2019)利用學(xué)習(xí)向量化方法將在線學(xué)習(xí)行為數(shù)據(jù)分類,并通過遺傳算法預(yù)測在線學(xué)習(xí)成績。孫發(fā)勤等(2019)利用數(shù)據(jù)和模型,通過機器學(xué)習(xí)相關(guān)知識研究了影響在線學(xué)業(yè)成就的主要因素、次要因素以及無關(guān)因素。趙西粉等(2019)以北方民族大學(xué)為例研究了在線學(xué)習(xí)效果的主要影響因素。吳林靜等(2018)提出了一種基于數(shù)據(jù)挖掘的網(wǎng)絡(luò)學(xué)習(xí)行為分析模型,并根據(jù)分析結(jié)果為網(wǎng)絡(luò)學(xué)習(xí)中的各類利益相關(guān)者提供了教學(xué)參考。郭芳俠等(2018)研究了學(xué)習(xí)者的在線學(xué)習(xí)行為與學(xué)習(xí)效果之間的相關(guān)性,以及男女生的在線學(xué)習(xí)行為與學(xué)習(xí)效果的差異。胡藝齡等(2014)建立了學(xué)習(xí)者在線學(xué)習(xí)行為模型并對學(xué)習(xí)數(shù)據(jù)進(jìn)行了模式分類與解析。魏順平等(2012)以江蘇電大新生為研究對象,分析了某一課程的在線學(xué)習(xí)行為數(shù)據(jù),研究了學(xué)生在線學(xué)習(xí)行為特點及其影響因素。陳圓圓等(2019)基于數(shù)據(jù)挖掘進(jìn)一步分析了成人學(xué)習(xí)者的在線學(xué)習(xí)行為與學(xué)習(xí)效果之間的關(guān)系。
在線學(xué)習(xí)行為已被證實與學(xué)習(xí)績效有著緊密的聯(lián)系,學(xué)習(xí)行為可以作為預(yù)測學(xué)生學(xué)習(xí)績效的重要表征,通過對學(xué)習(xí)行為的監(jiān)控引導(dǎo)學(xué)生進(jìn)行有益的學(xué)習(xí)行為,從而提升學(xué)生的有效學(xué)習(xí)比率。
(二)學(xué)習(xí)行為指標(biāo)研究
MOOC學(xué)習(xí)的自主性導(dǎo)致學(xué)生的學(xué)習(xí)行為多種多樣,研究者從不同的視角對學(xué)習(xí)行為進(jìn)行選取和分類。
有的研究從學(xué)生努力程度出發(fā)考察學(xué)生的時間管理情況,主要以時間投入長度、投入頻率和投入規(guī)律為重要指標(biāo)。Joo等人(2007)在研究中發(fā)現(xiàn)學(xué)生在在線學(xué)習(xí)中的表現(xiàn)受其對學(xué)習(xí)時間的分配和管理情況的影響。Kwon(2009)認(rèn)為時間管理是在線學(xué)習(xí)成功的一個顯著因素,并發(fā)現(xiàn)了學(xué)習(xí)者的行動水平、時間管理和學(xué)習(xí)結(jié)果之間的關(guān)系。Lin等人(2005)對影響在線學(xué)習(xí)的關(guān)鍵因素進(jìn)行分析,最終得到八個影響因子,學(xué)習(xí)時間管理是其中的關(guān)鍵因素之一。Jo、Yoont和Ha(2013)指出學(xué)生的自我調(diào)節(jié)能力,特別是他們的時間管理策略,是驅(qū)動正常參與在線學(xué)習(xí)活動的隱性心理特征,會導(dǎo)致高績效。Carver等人(2017)對167名研究生在9門在線課程中的學(xué)習(xí)數(shù)據(jù)進(jìn)行分析,以了解學(xué)生的學(xué)習(xí)成績與其在課程各個模塊中所花時間之間是否存在關(guān)系,包括課程學(xué)習(xí)總時長、課件/教學(xué)視頻學(xué)習(xí)時長、學(xué)習(xí)資源學(xué)習(xí)時長、同步在線會話時長四個方面。分析發(fā)現(xiàn),學(xué)生在同步在線會話中所花時間越長,考試成績獲得A的可能性越大,但是學(xué)習(xí)總時長、課件/教學(xué)視頻學(xué)習(xí)時長、學(xué)習(xí)資源學(xué)習(xí)時長與考試成績之間不存在這樣的關(guān)系。
有的研究從學(xué)生的學(xué)習(xí)積極性出發(fā),以參與意識和互動程度為主要指標(biāo)。Bolliger等人(2018)在研究中發(fā)現(xiàn),在在線學(xué)習(xí)中學(xué)生的參與意識與其學(xué)習(xí)結(jié)果之間存在必然聯(lián)系,參與意識越強,在參與學(xué)習(xí)活動中投入的時間越長,其獲取較高學(xué)習(xí)成績的可能性越大。Libby 等人(2005)提取345名學(xué)生的在線課程訪問日志,將學(xué)生分成完全參與在線學(xué)習(xí)活動、不完全參與在線學(xué)習(xí)活動、成功學(xué)習(xí)者、不成功學(xué)習(xí)者四種類型,采用多元回歸分析方法分析參與頻率、參與持續(xù)時間等8個變量與學(xué)習(xí)成就之間的關(guān)系,發(fā)現(xiàn)完全參與在線學(xué)習(xí)活動的學(xué)習(xí)者和成功學(xué)習(xí)者在學(xué)習(xí)活動中的參與頻率和參與持續(xù)時間明顯多于其他兩類學(xué)生。
有的研究從在線學(xué)習(xí)的某個要素出發(fā),專門研究某個要素或者學(xué)生的某個學(xué)習(xí)行為與學(xué)習(xí)績效的關(guān)系。在Watanabe(2011)的一項關(guān)于在線英語學(xué)習(xí)時間管理研究中,發(fā)現(xiàn)那些有在作業(yè)提交前臨時突擊學(xué)習(xí)傾向的學(xué)生往往比那些每周平均分配在線學(xué)習(xí)時間的學(xué)生在學(xué)習(xí)上投入的時間少得多,當(dāng)然最終的考試成績也是比每周平均分配學(xué)習(xí)時間的學(xué)生差得多。
有的研究從學(xué)習(xí)偏好出發(fā)了解不同學(xué)習(xí)習(xí)慣的學(xué)生行為模式。沈欣憶等(2019)對MOOC學(xué)習(xí)績效評價指標(biāo)進(jìn)行梳理,構(gòu)建了MOOCAP學(xué)習(xí)績效評價指標(biāo)模型,指出學(xué)習(xí)偏好可以分為時間偏好、投入偏好、節(jié)奏偏好、序列偏好和交流偏好幾個類型。
也有一些研究關(guān)注學(xué)習(xí)過程的動態(tài),研究不同的學(xué)習(xí)階段學(xué)生的學(xué)習(xí)行為特征。Huei-Tse Hou等人(2011)對基于項目的學(xué)習(xí)環(huán)境中學(xué)生交互的時間管理模式進(jìn)行了研究,研究發(fā)現(xiàn)在不同的學(xué)習(xí)階段學(xué)生在不同的交互行為上投入的時間不同:學(xué)習(xí)初期,學(xué)生之間的交互更多的是收集和分享信息,學(xué)習(xí)中后期則以問題分析和討論為主。這說明,學(xué)習(xí)初期學(xué)生會在信息的收集與分享上投入較多的時間,而隨著時間的推移,學(xué)生在問題分析和討論上投入的時間會逐漸增多。Laurie等人(2010)對學(xué)生在線開放式話題(沒有教師規(guī)定的特定截止日期的話題)中的時間投入變化趨勢進(jìn)行了研究,研究發(fā)現(xiàn)學(xué)生在一個開放式話題中的時間投入集中爆發(fā)在21~28天之間,31天之后基本趨于穩(wěn)定;一周中,學(xué)生在話題中的時間投入傾向于前半周;一天中學(xué)生在話題中的投入變化趨勢不明顯。
很多關(guān)于在線學(xué)習(xí)參與的研究都將時間維度作為對學(xué)習(xí)者參與程度的詳細(xì)描述,并報告說時間管理和分配對于描述學(xué)習(xí)者和預(yù)測學(xué)習(xí)效果具有重要意義(Macfadyen & Dawson, 2010; Wong, 2013; Hamane, 2014)。另外,在線學(xué)習(xí)的一些習(xí)慣和偏好也可以作為預(yù)測學(xué)習(xí)績效的重要指標(biāo)。本研究將結(jié)合學(xué)習(xí)形式(視頻、作業(yè)、論壇)、時間偏好等重要指標(biāo),系統(tǒng)梳理在線學(xué)習(xí)的學(xué)習(xí)行為,以全面分析和挖掘哪些學(xué)習(xí)行為對績效有正面影響,希望有助于探索學(xué)生學(xué)習(xí)投入的特點和規(guī)律,為MOOC課程的設(shè)計和支持提供依據(jù),進(jìn)一步降低MOOC課程的輟學(xué)率。
三、研究設(shè)計
(一)數(shù)據(jù)來源
獲取16,000多名學(xué)生在2018年于“學(xué)堂在線”網(wǎng)站學(xué)習(xí)課程“財務(wù)管理”的學(xué)習(xí)行為數(shù)據(jù)和本學(xué)期個人期末考試成績,利用學(xué)生在線學(xué)習(xí)績效評估模型分析學(xué)生在線行為對學(xué)習(xí)成績的影響,并根據(jù)學(xué)生在線學(xué)習(xí)行為預(yù)測其學(xué)習(xí)成績。
(二)構(gòu)建學(xué)生在線學(xué)習(xí)績效評估模型
梳理MOOC平臺“學(xué)堂在線”網(wǎng)站上“財務(wù)管理”課程中的學(xué)生行為,將學(xué)生在線學(xué)習(xí)行為變量分成以下五類(如圖1所示):①視頻(Video)學(xué)習(xí)行為:學(xué)生看視頻總數(shù)、視頻完成率、視頻觀看總時長、視頻觀看間隔、視頻觀看跳數(shù)、學(xué)生是否按順序觀看視頻、視頻復(fù)看率等;②作業(yè)(Classwork)學(xué)習(xí)行為:學(xué)生的作業(yè)得分率和作業(yè)完成比例等;③論壇(Forum)學(xué)習(xí)行為:學(xué)生在討論區(qū)的活躍程度,如學(xué)生在討論區(qū)的發(fā)帖數(shù)、回帖數(shù)、發(fā)帖字?jǐn)?shù)以及發(fā)帖回復(fù)數(shù);④學(xué)習(xí)時間偏好(Time preference):學(xué)生習(xí)慣在凌晨、上午、下午、晚上四個時間段中的哪一個時間段進(jìn)行在線視頻學(xué)習(xí),學(xué)習(xí)多長時間、多少次;⑤頁面訪問情況(Page visits):學(xué)生在線訪問與課程相關(guān)頁面的次數(shù),如課程公告訪問次數(shù)、課件訪問次數(shù)、其他頁面訪問次數(shù)。
構(gòu)建學(xué)生在線學(xué)習(xí)績效評估模型,如下所示:
表1列出了用于衡量學(xué)生在線學(xué)習(xí)績效的每個子因素的25個具體數(shù)據(jù)項,每個數(shù)據(jù)項都表示學(xué)生在線學(xué)習(xí)績效評估模型中的獨立變量。
(三)抽樣逐步回歸
逐步回歸的基本思想是將自變量逐個引入模型,每引入一個解釋變量后都進(jìn)行F檢驗,同時對已經(jīng)選入的解釋變量逐個進(jìn)行t檢驗,當(dāng)原有的解釋變量由于后面的解釋變量被引入后變得不顯著時,將其刪除。這樣每次引入新的變量之前回歸方程中只包含統(tǒng)計顯著的變量。反復(fù)進(jìn)行該過程,直到既沒有顯著的解釋變量被選入回歸方程,也沒有不顯著的解釋變量從回歸方程中被剔除為止。逐步回歸常常被用來解決自變量間的多重共線性問題。
求解該模型需要估計26個參數(shù):表1中25個自變量的參數(shù)([β25×1])和截距項([α])。除了完全對學(xué)習(xí)績效不產(chǎn)生影響的變量以及完全共線性的變量,我們希望所有其余變量均被包含在模型中。本研究嘗試通過結(jié)合逐步回歸和基于大數(shù)定律的抽樣來進(jìn)行建模。
一般地,可以主觀先驗設(shè)置[πk]。例如,對于模型中每次逐步回歸的迭代,如果希望包含大約[M]個在線學(xué)習(xí)行為變量,可以初始化[πk=Mk]。其中,[k=25]表示在線學(xué)習(xí)行為變量的總數(shù),[M]表示在每次逐步回歸中期望的抽樣個數(shù)。
四、結(jié)果分析與討論
使用 Stata/MP 14.0,運行程序10,000次獲得收斂的運算結(jié)果。模型估計的擬合優(yōu)度R2為0.398,說明模型擬合效果較好。將每位學(xué)生擬合得到的期末成績與其真實期末成績進(jìn)行比較,如圖2所示,可以發(fā)現(xiàn),通過模型得到的期末成績曲線與真實期末成績曲線趨勢走向一致,該模型精確度相對較高。也就是說,學(xué)生的在線學(xué)習(xí)行為能夠在一定程度上預(yù)測學(xué)生的學(xué)習(xí)績效。