• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于K-means的MOOC學習行為分析及用戶畫像研究

      2019-03-06 12:40王曉芳賈宗維
      中國教育信息化·高教職教 2019年1期
      關(guān)鍵詞:用戶畫像學習行為

      王曉芳 賈宗維

      摘? ?要:隨著學界對MOOC教育研究的廣泛關(guān)注,以edX平臺開放共享的MOOC教育大數(shù)據(jù)為研究基礎(chǔ),通過數(shù)據(jù)的清洗、篩選、分析,從課程、國家、年齡、性別等方面針對學習者學習行為進行分析,之后提取5類學習行為特征進行K-means聚類分析,得到四類學習者群體,通過對群體畫像特點的深入分析,為MOOC教育的優(yōu)化建設和持續(xù)發(fā)展提供了諸多有益的啟示。

      關(guān)鍵詞:K-means;MOOC;學習行為;用戶畫像

      中圖分類號:G434 文獻標志碼:A 文章編號:1673-8454(2019)01-0043-04

      一、引言

      2011年,美國斯坦福大學華裔教授吳恩達通過互聯(lián)網(wǎng)上線了一門機器學習課程,吸引了全球近10萬人參與學習。隨后這種新興的教育模式引起教育界廣泛的關(guān)注,緊隨其后在2012年一種對教育領(lǐng)域劃時代的教育改革模式——大型開放在線課程(Massive Open Online Courses,即MOOC)誕生了。區(qū)別于傳統(tǒng)教育模式,MOOC教育不受時間、空間、人數(shù)限制,在整合多種多媒體數(shù)字資源社交網(wǎng)絡工具下,隨時隨地學習全球頂尖學府共享的優(yōu)秀課程。[1]同年4月,麻省理工學院和哈佛大學共同創(chuàng)建了基于MOOC教育模式的edX免費在線學習平臺。MOOC教育的發(fā)展從此走向快速發(fā)展的軌道,截至2018年3月全球已有800多所大學加入MOOC,上線9400門課程,注冊學生數(shù)達8100萬。[2]如此眾多的MOOC課程產(chǎn)生了前所未有的教育大數(shù)據(jù),對這些教育數(shù)據(jù)的分析挖掘,有助于教育工作者更好地改善教學方式和課程設計方案,同時也為學習者的個性化推薦、學習行為、群體畫像提供了研究的可能。[3]本文正是基于此分析了edX平臺課程在線教育數(shù)據(jù),揭示了一些學習者的學習行為特點和群體分類。

      二、相關(guān)工作

      1.MOOC發(fā)展

      MOOC教育模式是伴隨著開放教育運動的發(fā)展而產(chǎn)生的。早在2008年加拿大學者Couros教授就在開放教育思潮下開設了一門基于YouTube和Twitter等社交軟件與各類共享數(shù)字資源的網(wǎng)絡在線課程。[4]從此傳統(tǒng)資源型網(wǎng)絡學習發(fā)生了翻天覆地的變化,學習者的在線學習呈現(xiàn)出的是一種全程參與式的教與學過程。伴隨著師生之間、生生之間思想的聚集、碰撞和融合,一種新興的教學形式產(chǎn)生了。我們稱此類課程為連通主義支持下的課程,亦即cMOOC。

      自MOOC誕生以來,全球陸續(xù)上線了數(shù)十種學習平臺,尤以Coursera、edX、學堂在線、中國大學MOOC等國內(nèi)外平臺為代表,匯聚了眾多知名學府的優(yōu)秀課程資源,向全球8000多萬學習者提供免費的教育資源。

      2.MOOC學習行為

      MOOC是一種面向網(wǎng)絡的學習者只要注冊就可免費使用的在線教育模式,其擁有類似于傳統(tǒng)課堂教學的作業(yè)、測試和評估體系。一門MOOC課程通常在指定的時間段進行授課,在整個授課期間包含了多個教學環(huán)節(jié),諸如瀏覽大綱、視頻點播、階段測試、作業(yè)提交、論壇互動、最終考試等。學習者在整個MOOC課程學習流程中,在初始的用戶注冊、每天登錄、網(wǎng)頁導航、點播視頻(暫停、回放)、互動討論、作業(yè)提交、頁面滯留等事件中都留下了大量的學習痕跡并被學習平臺所保存。大量的學習痕跡匯聚成教育大數(shù)據(jù),對這些教育大數(shù)據(jù)進行分析挖掘,使分析學習者學習行為、改善教學方法和評估教學質(zhì)量、發(fā)現(xiàn)潛在問題、優(yōu)化師生教與學活動成為可能。

      MOOC學習者學習行為分析就是對教育大數(shù)據(jù)的數(shù)據(jù)挖掘。[5]換言之,就是利用數(shù)據(jù)分析方法和數(shù)據(jù)挖掘技術(shù),從海量的學習痕跡(學習日志)數(shù)據(jù)中發(fā)掘有價值的信息,為學習者的個性化學習、差異化學習、畫像區(qū)分等提供強有力的數(shù)據(jù)支撐,同時不斷優(yōu)化師生教與學的活動歷程,更有助于教與學規(guī)律的聚焦。

      三、實驗數(shù)據(jù)準備

      1.數(shù)據(jù)集選取

      2014 年,哈佛大學和麻省理工學院聯(lián)合發(fā)布了兩校開設在edX平臺上的MOOC課程數(shù)據(jù)集,整個數(shù)據(jù)集涵蓋了兩校2013學年(2012年秋季、2013年春季和2013年夏季)的edX平臺上16門課程的在線學習數(shù)據(jù)以及相關(guān)文檔的數(shù)據(jù)。[6]這些數(shù)據(jù)中每條記錄代表一個學習者在一門MOOC課程中的學習記錄,涉及課程名、學習者ID號、國籍、學歷、性別、出生年份等 20 項內(nèi)容。整個數(shù)據(jù)集包含641138條記錄,其中哈佛大學有 338,223 條,麻省理工學院有302,915 條。同時數(shù)據(jù)集在公開前進行了一系列的去身份識別,以保護學習者的隱私和保證學習數(shù)據(jù)的真實有效。

      2.數(shù)據(jù)預處理

      為了保證數(shù)據(jù)結(jié)果更具說服力,通過Excel2010、IBM SPSS等工具對數(shù)據(jù)記錄進行了判空、缺失值、無效值、異常值篩選等操作,從641,138 條記錄數(shù)據(jù)中最終獲得學習行為日志信息 472,652條。本文以上述數(shù)據(jù)為研究基礎(chǔ),進行MOOC學習行為分析。

      四、數(shù)據(jù)分析

      對于一個采用英語為主且面向全球?qū)W習者的edX教學平臺,MOOC學習者的學習行為對不同的課程類型、國家、學歷、年齡、性別都呈現(xiàn)差異化的表現(xiàn),本節(jié)將從課程、國籍、年齡、性別等方面對平臺學習者學習行為進行統(tǒng)計分析,并通過k-means聚類方法對學習者群體畫像進行研究分析。

      1.課程分析

      edX平臺公開數(shù)據(jù)集共涉及16門課程,各門課程的受眾人數(shù)和獲取課程證書人數(shù)反映了學習者對課程的喜好程度以及最終的學習情況。

      各門課程中男性學習者遠多于女性學習者,縱觀全局,發(fā)現(xiàn)女性學習者更傾向于選修諸如《古希臘英雄》、《正義》、《衛(wèi)生統(tǒng)計》《人類健康與全球環(huán)境變化》文科類課程,而男性學習者對《計算機科學概論》、《計算機科學與編程導論》、《電路與電子》等理工類課程更感興趣。對比各門課程獲取證書的學習者占該門課程所有學習者的比例,發(fā)現(xiàn)大部分課程的證書獲取比例維持在3%~4.5%之間,唯獨《全球貧困的挑戰(zhàn)》課程獲取證書比例達8%,這可能是課程內(nèi)容與人類面臨的問題更相關(guān),而且該門課程男女學習者人數(shù)基本相同。另外《固態(tài)化學》、《結(jié)構(gòu)力學》等課程由于專業(yè)性較強,選課人數(shù)相對較少,其中學習者人數(shù)最少的是《結(jié)構(gòu)元件》,該課程主要是介紹有關(guān)可變形結(jié)構(gòu)元件的力學行為,需要經(jīng)典力學和微積分先修知識,這可能是造成學習者人數(shù)偏少的主要原因。

      2.獲取證書學習者學歷分布

      在眾多獲取證書學習者中,其受教育水平大致有低于高中水平、高中教育水平、本科教育水平、碩士、博士5個等級,對不同課程獲取證書學歷分布情況統(tǒng)計比例。

      通過對16門課程的證書獲取數(shù)據(jù)對比分析,發(fā)現(xiàn)本科、碩士教育經(jīng)歷的學習者在社會科學類課程占比很高,相反化學、計算機科學、力學類課程高中學歷人群占比更高,這也反映了他們迫切希望獲得大學課程的教育,進而提升個人知識素養(yǎng)。

      3.國家類別分析

      不同國家的學習者受文化背景、發(fā)展水平不同因素的影響,在MOOC課程中都有明顯的不同反映。通過選取中國、美國、日本等14個國家的學習者進行數(shù)據(jù)分析,得出各國學習者分布情況。

      不同國家學習者男女比例與不同課程分布情況相似,女性學習者全部低于男性學習者,這和全球女性在不同國家的受教育程度存在差異有很大關(guān)系。此外所有學習者的平均年齡是28歲,中國、印度、哥倫比亞等國學習者的平均年齡為23~25歲,明顯低于全球平均水平,可見發(fā)展中國家大多數(shù)參加工作人員很少再參與MOOC學習,反觀英國、西班牙、日本、美國、加拿大、德國、澳大利亞等發(fā)達國家學習者平均年齡都超過27歲,美國甚至有近5000位60歲以上的學習者,反映了發(fā)達地區(qū)人員對MOOC教育的需求更為強烈,這些人中大多數(shù)是工作后繼續(xù)學習,真可謂“活到老,學到老”。

      五、學習行為K-means聚類分析

      K-means聚類是一種典型的無監(jiān)督聚類算法,通常是基于不同對象特征值間的相似度,來確定對象的歸屬問題。edX平臺對不同學習者的學習行為痕跡進行了存儲,學習行為的具體體現(xiàn)包括課程交互次數(shù)、課程訪問天數(shù)、播放視頻次數(shù)、學習章節(jié)數(shù)和論壇發(fā)帖數(shù)痕跡記錄。通過對數(shù)據(jù)的進一步篩選、清洗,選取學習行為中的5種學習事件作為特征值進行聚類分析。

      1.特征相似度計算

      假設每個學習行為向量包含5個特征,即xi=(xi1,xi2,xi3,xi4,xi5),則學習者xi和xj之間的相似度計算公式如下:

      2.數(shù)據(jù)歸一化

      學習行為特征值之間的數(shù)據(jù)值域存在很大差異,如課程交互次數(shù)與論壇發(fā)帖數(shù)間呈現(xiàn)數(shù)十倍的差距,為了保證每個特征對相似度的影響處于相當?shù)乃?,各個特征之間的數(shù)量級應該是一致的。 通過線性函數(shù)轉(zhuǎn)換統(tǒng)一對特征取值進行歸一化處理,使其取值全部介于[0,1]范圍之間,計算公式如下:

      其中:Xnorm為標準化處理后的取值,Xmax、Xmin分別為樣本的最大、最小值。

      3.群體畫像分析

      采用K-means算法對上述特征數(shù)據(jù)進行聚類分析,將K設置為3~6之間,分別進行多次聚類,在K取值為4時得到較好的聚類結(jié)果,此時的學習行為特征均值和各學習者群體獲取證書情況如表1所示。

      通過對表1的分析,將MOOC學習者劃分為四類群體——簡單體驗者、善于提問者、積極探索者和學霸型學習者。下面分別對這些群體畫像進行比較分析:

      第一類:此類群體占總學習者數(shù)的83.3%,平臺賬戶注冊后,只是偶爾登錄進行簡單的學習,課程結(jié)束時僅學習了部分課程內(nèi)容,登錄天數(shù)、學習互動、論壇發(fā)帖數(shù)遠低于其他類別的學習者。此外,該類學習者考試成績大多為0分,獲取證書的人數(shù)只有0.8%,這類學習者從注冊到課程結(jié)束幾乎沒有認真學習,學習效果極差,可以認為該類群體參與MOOC學習的初衷僅僅就是為了體驗。因此,將其歸為簡單體驗者。

      第二類:此類群體在MOOC學習的過程中,論壇發(fā)帖數(shù)遠高于其他幾類,反映了這類群體對課程的先修知識較為缺乏,要想順利地完成課程,必須求助于論壇解決,同時也反映了這類群體的學習熱情高、目的性強、期望獲取課程認證,雖然都堅持學習并參加了課程的考試,但效果一般,大多數(shù)沒有達到獲取證書的要求(成績>0.5)。因此將其歸為善于提問者。

      第三類:此類群體在MOOC課程結(jié)束時幾乎都完成了課程的章節(jié)學習,其互動次數(shù)、登錄天數(shù)、視頻播放數(shù)均處于中等水平,但論壇發(fā)帖數(shù)很少,反映了這類學習者知識掌握程度較好,很少借助論壇解決問題,但獲取課程認證的目的明確,證書獲取率達31%。這類學習者對學習充滿熱情,投入中等時間精力進行課程學習,學習效果良好,將其歸為積極探索者。

      第四類:此類群體的學習行為尤為突出,課程交互次數(shù)、課程訪問天數(shù)、播放視頻次數(shù)是前三類人員之和,且最終考試成績均在80分以上,證書獲取率高達81%,這類學習者屬于學霸型。

      六、結(jié)束語

      不久的將來,以MOOC理念為主的新興互聯(lián)網(wǎng)教育定會成為繼金融、游戲、社交、電商為主的互聯(lián)網(wǎng)第五大產(chǎn)業(yè),通過對MOOC學習者的學習行為進行研究,從課程、國家、年齡、性別等多角度對學習者的特點進行分析,既找到不同類型課程的學習者差異,也發(fā)現(xiàn)了不同國家學習者的文化背景和不同性別受教育程度的異同。此外,以學習行為特征為基礎(chǔ)對MOOC學習者進行聚類分析,獲取了特點鮮明的四類群體,這些研究反映了不同群體在MOOC教育中的興趣關(guān)注、學習頻率、學習習慣、學習目的等的差異,為MOOC的優(yōu)化建設和持續(xù)發(fā)展提供了諸多有益的啟示。

      參考文獻:

      [1]伍杰華,付慧平.MOOC學習行為的統(tǒng)計、預測與展望[J].工業(yè)和信息化教育,2017(2):81-89.

      [2]By The Numbers: MOOCS in 2017[DB/OL]. https://www.class-central.com/report/mooc-stats-2017/.

      [3]程志君,羅鵬程,羅玉文.基于開放數(shù)據(jù)的edX課程學習者行為及相關(guān)因素分析[J].高等教育研究學報,2017(4):46-49.

      [4]劉方林,喬莉莉.慕課:我國基礎(chǔ)教育均衡發(fā)展的出路[J].教育探索,2015(7):32-34.

      [5]王萍.基于edX開放數(shù)據(jù)的學習者學習分析[J].現(xiàn)代教育技術(shù),2015(4):86-93.

      [6]王雪宇,鄒剛,李驍,王玉龍.中美MOOC學習者學習行為分析——基于edX公開數(shù)據(jù)集和國防科技大學夢課數(shù)據(jù)集[J].計算機教育,2016(6):116-120.

      (編輯:王天鵬)

      猜你喜歡
      用戶畫像學習行為
      基于學習行為數(shù)據(jù)的在線學習時間規(guī)律探析
      慕課環(huán)境下的學習者
      江陵县| 红原县| 老河口市| 莱芜市| 江永县| 峨眉山市| 万山特区| 博白县| 嵊泗县| 会理县| 广水市| 鸡泽县| 霍邱县| 万山特区| 上蔡县| 清镇市| 中西区| 德兴市| 上高县| 桦南县| 康马县| 马公市| 大姚县| 霞浦县| 德保县| 龙陵县| 兴国县| 将乐县| 金昌市| 大方县| 衡南县| 梓潼县| 马关县| 五家渠市| 法库县| 沈丘县| 盖州市| 汽车| 潮州市| 徐州市| 四平市|