林麒麟 李川 俸世洲
摘 要:MOOC的出現(xiàn)推動(dòng)了教育平臺(tái)的發(fā)展,為不同人群提供了門(mén)類(lèi)眾多的在線學(xué)習(xí)資源。在學(xué)習(xí)過(guò)程中產(chǎn)生了學(xué)習(xí)時(shí)長(zhǎng)、播放天數(shù)以及學(xué)習(xí)章節(jié)數(shù)等相關(guān)數(shù)據(jù)。本文根據(jù)MOOC相關(guān)學(xué)習(xí)數(shù)據(jù),利用K-Mean聚類(lèi)的方法對(duì)不同人群學(xué)習(xí)行為進(jìn)行聚類(lèi),探討了學(xué)習(xí)行為與學(xué)習(xí)成效的關(guān)系,以期為MOOC教育和發(fā)展提供有益參考。
關(guān)鍵詞:MOOC;數(shù)據(jù)挖掘;學(xué)習(xí)行為;學(xué)習(xí)成效
Abstract:The emergence of MOOC promotes the development of education platform and provides a wide range of online learning resources for different groups of people.In the process of learning,relevant data such as learning time,playing days and learning chapters are generated.Based on MOOC related learning data,this paper uses K-Mean clustering method to cluster learning behavior of different groups,and explores the relationship between learning behavior and learning effectiveness,in order to provide useful reference for MOOC education and development.
Key words:MOOC;data mining;Learning Behavior;Learning effectiveness
隨著網(wǎng)絡(luò)技術(shù)的發(fā)展,教育發(fā)展過(guò)程中逐步引入慕課新形式,受到各類(lèi)學(xué)校的歡迎。該教學(xué)模式能夠更好地實(shí)現(xiàn)學(xué)習(xí)和學(xué)習(xí)者的自由化,能夠有效滿足不同階段、不同人群的學(xué)習(xí)需求。在學(xué)習(xí)過(guò)程中產(chǎn)生了學(xué)習(xí)時(shí)長(zhǎng)、播放天數(shù)以及學(xué)習(xí)章節(jié)數(shù)等相關(guān)數(shù)據(jù),根據(jù)慕課的數(shù)據(jù)分析能夠進(jìn)行有效的學(xué)習(xí)研究,得出學(xué)習(xí)過(guò)程與成效之間的關(guān)系,據(jù)此繼續(xù)加強(qiáng)個(gè)性化學(xué)習(xí)方式的設(shè)計(jì)。
為了做好慕課當(dāng)中的數(shù)據(jù)分析,本文主要以某MOOC平臺(tái)中的慕課數(shù)據(jù)作為基礎(chǔ),進(jìn)行數(shù)據(jù)的分析,廣泛涉及了十個(gè)不同的科目、二百堂課的學(xué)習(xí)狀況,將所有數(shù)據(jù)整合起來(lái),形成三十多萬(wàn)個(gè)數(shù)據(jù)樣本,其中,每條樣本顯示了一名學(xué)生在一門(mén)課程中的學(xué)習(xí)情況,其中,學(xué)習(xí)情況包括了課程的內(nèi)容、學(xué)生的信息、學(xué)習(xí)目標(biāo)、學(xué)習(xí)頻率和學(xué)習(xí)效果。本文將對(duì)主要針對(duì)學(xué)生學(xué)習(xí)行為數(shù)據(jù)進(jìn)行學(xué)習(xí)成效探究分析,以期為MOOC學(xué)習(xí)和發(fā)展提供有益參考價(jià)值。
1 K-MEAN聚類(lèi)算法
K-MEAN算法是典型的距離聚類(lèi)算法,基本原則是兩個(gè)對(duì)象距離越近相似度越高,然后可以把距離較近的劃分一個(gè)簇,簇內(nèi)需要距離保持最小,不同簇間保持距離最大,其基本流程如圖1所示。
如圖1所示,首先選取K個(gè)質(zhì)心,然后計(jì)算各個(gè)數(shù)據(jù)樣本到該質(zhì)心的距離,然后將其歸到最近的質(zhì)心類(lèi),再計(jì)算新類(lèi)的質(zhì)心,判斷其是否小于或等于原質(zhì)心指定閾值,如果滿足,則結(jié)束,否則重復(fù)上述步驟,即可進(jìn)行較好的聚類(lèi)。
2 用戶學(xué)習(xí)畫(huà)像分析
本文選取了某MOOC平臺(tái)的用戶學(xué)習(xí)的天數(shù)(Learning Days-LD)、播放時(shí)長(zhǎng)(Play Time-PT)、章節(jié)數(shù)(Chapter Number-CN)、發(fā)帖數(shù)(Post Number-PN)等特征,利用K-MEAN進(jìn)行聚類(lèi)分析,分析結(jié)果如下表所示。
由上表可知,根據(jù)LD、PT、CN、PN四個(gè)特征,把學(xué)習(xí)人群大概分為Cluster1-4,共四類(lèi)。Cluster1:LD、PT、CN和PN指標(biāo)均較少,屬于MOOC體驗(yàn)者;Cluster2:有一個(gè)明顯特征與其他類(lèi)不同,即PN均值高于其他類(lèi),屬于積極好問(wèn)者;Cluster3:各項(xiàng)指標(biāo)處于中等水平,表現(xiàn)良好,屬于積極探索者;Cluster4:學(xué)習(xí)時(shí)長(zhǎng)、播放時(shí)長(zhǎng)、學(xué)習(xí)章節(jié)數(shù)處于較高水平,屬于MOOC學(xué)霸用戶。
3 學(xué)習(xí)行為與學(xué)習(xí)成效分析
根據(jù)上述聚類(lèi)結(jié)果,本文分別對(duì)上述四類(lèi)用戶的學(xué)習(xí)成效進(jìn)行了統(tǒng)計(jì)分析,分析結(jié)果如圖2所示。
由圖2可知,第一類(lèi)用戶學(xué)習(xí)效果較差,成績(jī)均值以及獲得證書(shū)數(shù)量均較少;第二類(lèi)用戶為積極好問(wèn)型用戶學(xué)習(xí)成效明顯高于第一類(lèi);第三類(lèi)用戶為積極譚索型用戶學(xué)習(xí)成效較好;第四類(lèi)終極學(xué)霸型用戶,學(xué)習(xí)成效最佳,成績(jī)均值以及獲得證書(shū)情況明顯高于其他用戶。
4 分析結(jié)果討論
4.1 學(xué)習(xí)者的情況與行為的關(guān)系
首先,當(dāng)學(xué)習(xí)者進(jìn)行主動(dòng)形成時(shí),在慕課上的活躍天數(shù)、學(xué)習(xí)數(shù)量、完成程度和論文或意見(jiàn)發(fā)表次數(shù)都比較高,但是在被動(dòng)的人里,其完成程度比較高,比主動(dòng)的人更高。其他類(lèi)型的人則在各項(xiàng)數(shù)據(jù)上都比較低,數(shù)據(jù)表明,當(dāng)形成主動(dòng)學(xué)習(xí)的習(xí)慣之后,他們能夠按照自己的學(xué)習(xí)需要進(jìn)行高頻率的課程參與,相反,其他類(lèi)型的人則較少參與到課程的學(xué)習(xí)中,其中,學(xué)習(xí)上較為被動(dòng)的人則會(huì)根據(jù)學(xué)習(xí)需要進(jìn)行針對(duì)性學(xué)習(xí),為了達(dá)到任務(wù)要求而參與到學(xué)習(xí)當(dāng)中。
4.2 學(xué)習(xí)目的的不同與行為的關(guān)系
在調(diào)查的過(guò)程中,主要將學(xué)習(xí)群體分為以下幾種情況,一種是入學(xué)考試、一種是工作需要、還有的是純粹為了提升自我,另外還有一種是為了培養(yǎng)自己的興趣。按照數(shù)據(jù)分析的結(jié)果來(lái)看,在準(zhǔn)備入學(xué)考試的人群在各項(xiàng)指標(biāo)上都比其他人群高,工作需要的人在完成程度上也比較高,而其他兩種人群雖然也在學(xué)習(xí)中呈現(xiàn)出很大的熱情,但是在學(xué)習(xí)數(shù)量、頻率上沒(méi)有硬性要求,這說(shuō)明他們?cè)趯W(xué)習(xí)頻率上沒(méi)有要求,而是按照自己的空閑時(shí)間確定自己的學(xué)習(xí)時(shí)間,具備一定的隨意性,缺乏計(jì)劃性。
4.3 學(xué)習(xí)人群的信息與行為的關(guān)系
在學(xué)習(xí)群體的信息調(diào)查中,不僅對(duì)其職業(yè)的調(diào)查,還對(duì)其年齡進(jìn)行調(diào)查,并做出詳細(xì)的分析,將這一群體中的年齡劃分為三個(gè)階段:三十五歲以下、三十五歲到五十五歲、五十五歲以上。從結(jié)果的分析中可以看出,所有數(shù)據(jù)的增長(zhǎng)與年齡的增加成正比,這就說(shuō)明年紀(jì)稍長(zhǎng)的人群在學(xué)習(xí)過(guò)程中更加規(guī)律,具備更好的計(jì)劃性,這一結(jié)果可以在學(xué)習(xí)過(guò)程中以彈幕的形式告知學(xué)習(xí)群體,增加他們學(xué)習(xí)的熱情,不斷提升他們學(xué)習(xí)的頻率。
4.4 學(xué)習(xí)過(guò)程與學(xué)習(xí)結(jié)果的關(guān)系
在進(jìn)行數(shù)據(jù)分析的過(guò)程中發(fā)現(xiàn),學(xué)習(xí)過(guò)程中的活躍程度、意見(jiàn)等發(fā)表頻率、學(xué)習(xí)數(shù)量等都和學(xué)習(xí)結(jié)果成正比,其中,學(xué)習(xí)數(shù)量與學(xué)習(xí)結(jié)果的相關(guān)程度最低,學(xué)習(xí)程度與其關(guān)系最高。
5 結(jié)語(yǔ)
本文以MOOC數(shù)據(jù)進(jìn)行學(xué)習(xí)行為與學(xué)習(xí)成效的探討分析。根據(jù)學(xué)習(xí)天數(shù)、章節(jié)數(shù)、發(fā)帖數(shù)以及播放時(shí)長(zhǎng),對(duì)MOOC用戶進(jìn)行了聚類(lèi)分析,利用K-MEAN聚類(lèi)算法將其聚為四類(lèi)用戶,并探討相應(yīng)的學(xué)習(xí)行為與學(xué)習(xí)成效的關(guān)系。在未來(lái),隨著個(gè)性化學(xué)習(xí)理念的深入,慕課學(xué)習(xí)將更大范圍地應(yīng)用在各個(gè)學(xué)習(xí)群體當(dāng)中,因此,需要慕課根據(jù)不同時(shí)期的數(shù)據(jù)分析進(jìn)行課程調(diào)節(jié),為學(xué)習(xí)群體設(shè)定最恰當(dāng)?shù)哪J?,也可以設(shè)置系統(tǒng)評(píng)價(jià)機(jī)制,搜集建議,做好革新,做好課程設(shè)置工作。
參考文獻(xiàn):
[1]陳蘭嵐,宋海虹.基于MOOC數(shù)據(jù)挖掘的學(xué)習(xí)行為和學(xué)習(xí)成效分析[J].教育教學(xué)論壇,2019,(6):50-51.
[2]陳若航,常朵.基于數(shù)據(jù)挖掘的MOOC學(xué)習(xí)行為與學(xué)習(xí)效果研究[J].太原城市職業(yè)技術(shù)學(xué)院學(xué)報(bào),2017,(12):178.
[3]張大胤.基于互聯(lián)網(wǎng)環(huán)境下學(xué)習(xí)行為的數(shù)據(jù)挖掘研究——以MOOC學(xué)習(xí)行為研究為例[D].廣西師范大學(xué),2018,(12):10-11.
[4]王洪巖.MOOC中的學(xué)習(xí)行為挖掘研究[D].山東大學(xué),2016,(10):5.
基金項(xiàng)目:重慶師范大學(xué)涉外商貿(mào)學(xué)院科研項(xiàng)目(數(shù)據(jù)挖掘在MOOC用戶行為分析中的應(yīng)用研究)-ZGKY2018008;重慶師范大學(xué)涉外商貿(mào)學(xué)院科研項(xiàng)目(基于教育大數(shù)據(jù)的學(xué)生學(xué)習(xí)行為分析研究)-ZGKY2018003
作者簡(jiǎn)介:林麒麟(1989-),男,河南信陽(yáng)人,碩士,主要研究方向:數(shù)據(jù)挖掘與人工智能;李川(1982-),男,重慶人,碩士,實(shí)驗(yàn)師,主要從事教育信息化、數(shù)據(jù)挖掘、計(jì)算機(jī)應(yīng)用等研究;俸世洲(1981-),男,四川廣漢人,碩士,講師,主要研究方向:數(shù)據(jù)挖掘與深度學(xué)習(xí)。