• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于MOOC的個性化預(yù)測和干預(yù)研究

      2020-09-15 16:30蔣翀朱名勛王點(diǎn)
      計算機(jī)時代 2020年8期
      關(guān)鍵詞:預(yù)測模型個性化

      蔣翀 朱名勛 王點(diǎn)

      摘要:針對MOOC研究現(xiàn)狀,結(jié)合MOOC平臺多樣、規(guī)模龐大、種類眾多、學(xué)習(xí)者背景和目的各異等特點(diǎn),以個性化預(yù)測研究為主要對象,分析和對比了作為研究基礎(chǔ)的點(diǎn)擊流日志、討論區(qū)、課后任務(wù)、課程信息和學(xué)習(xí)者基本屬性五類數(shù)據(jù)源的優(yōu)劣,歸納了用于預(yù)測的基于活動、討論區(qū)、社交和認(rèn)知的模型。以《大學(xué)信息技術(shù)二(Python程序設(shè)計)》為例,構(gòu)建和應(yīng)用了個性化預(yù)測和干預(yù)模型。

      關(guān)鍵詞:MOOC:個性化:預(yù)測模型:復(fù)制框架

      中圖分類號:G434 文獻(xiàn)標(biāo)識碼:A 文章編號:1 006-8228(2020)08-10-04

      0引言

      自2012年以來,MOOC浪潮以美國為起點(diǎn)迅速席卷全球,吸引了全球不同國籍和教育背景的數(shù)以千萬計的學(xué)習(xí)者加入。截止2020年3月,Coursera與來自52個國家207個院校和公司合作,提供4116門課程,學(xué)習(xí)者超過4500萬人[1];edX與全球140多所頂尖機(jī)構(gòu)合作,學(xué)習(xí)者數(shù)量超過2400萬,提供2600多門課程。國內(nèi)知名MOOC平臺學(xué)堂在線匯集600余所知名院校的近2000門課程,注冊用戶近3000萬[2]。經(jīng)過近十年的發(fā)展,MOOC平臺提供給學(xué)習(xí)者的選擇更加多樣化,除了免費(fèi)課程以外,也有一部分付費(fèi)、學(xué)分和學(xué)位課程,一些企業(yè)也會定向提供付費(fèi)的培訓(xùn)。

      從MOOC誕生之初,高輟課率就是困擾MOOC發(fā)展的絆腳石。2014年,哈佛大學(xué)的HarvardX研究委員會和MIT的數(shù)字化學(xué)習(xí)辦公室合作發(fā)布的在線課程研究報告顯示:拿到證書的學(xué)習(xí)者僅占總?cè)藬?shù)的5.1%[3]。因此,從研究內(nèi)容來看,大部分MOOC相關(guān)的研究工作圍繞學(xué)生輟課率展開,對學(xué)生行為和活動進(jìn)行分析,預(yù)測可能的學(xué)習(xí)結(jié)果(是否能完成課程,測試是否通過)[4],進(jìn)行個性化干預(yù);也有部分研究獲取學(xué)習(xí)者學(xué)習(xí)行為、興趣和結(jié)果,在學(xué)習(xí)過程中開展個性化學(xué)習(xí)資源推薦,規(guī)劃學(xué)習(xí)路徑,或者在完成課程后進(jìn)行相似課程推薦。本文闡述了MOOC個性化預(yù)測研究的數(shù)據(jù)基礎(chǔ)和主要類別、歸納了四種類型的模型構(gòu)建,總結(jié)了復(fù)制框架在驗(yàn)證已有預(yù)測研究結(jié)論中的應(yīng)用,最后提出未來研究可能的重點(diǎn)和方向。

      1 基礎(chǔ)數(shù)據(jù)源

      在MOOC研究領(lǐng)域,特別是對直接講授MOOC的教師和團(tuán)隊(duì),可以直接獲取大量用于教學(xué)研究的原始數(shù)據(jù),這在傳統(tǒng)的高校教育環(huán)境中很難實(shí)現(xiàn)。在目前MOOC預(yù)測研究中,基礎(chǔ)數(shù)據(jù)有點(diǎn)擊流日志、討論區(qū)、測試及課后任務(wù)、課程信息和學(xué)習(xí)者基本屬性五類。

      1.1 點(diǎn)擊流日志

      點(diǎn)擊流日志又稱為服務(wù)器日志,是學(xué)習(xí)者與課程平臺交互的記錄,由服務(wù)器自動記錄,是MOOC研究的主要數(shù)據(jù)來源。記錄的學(xué)習(xí)者行為(事件)包括鼠標(biāo)點(diǎn)擊,頁面瀏覽(當(dāng)前頁碼,后退或前進(jìn)),回答問題,視頻播放/瀏覽/略過,問題提交和討論區(qū)互動等。一般來說,會開展特征工程,從日志中抽取特征,分析屬性和操作,以及產(chǎn)生的結(jié)果,形成規(guī)則[5],例如,如果花費(fèi)在學(xué)習(xí)資源上的總時間大于所有學(xué)生的平均時間,那么更可能完成課程。在很多情況下,特征工程比統(tǒng)計算法更為重要,研究者會采用新的特征工程算法和標(biāo)準(zhǔn)的分類算法[6],提升預(yù)測模型的表現(xiàn)。除了服務(wù)器日志外,客戶端日志在實(shí)時預(yù)測中也有使用。Pardos等人在edX平臺客戶端嵌入JavaScript腳本,獲取學(xué)習(xí)者最近(幾秒前)的操作數(shù)據(jù),實(shí)現(xiàn)實(shí)時的學(xué)習(xí)預(yù)測和干預(yù)[7]。

      1.2 討論區(qū)

      在討論區(qū)內(nèi),主要有學(xué)習(xí)者發(fā)布的基于主題的討論,與課程內(nèi)容相關(guān)的討論和互動,所有學(xué)習(xí)者都能發(fā)表主題和回復(fù),教學(xué)團(tuán)隊(duì)也會參與其中。但是,只有部分想要完成課程或?qū)φn程興趣較高的學(xué)習(xí)者會在討論區(qū)發(fā)言。與點(diǎn)擊流日志相比,這部分?jǐn)?shù)據(jù)量相對較小。這部分原始數(shù)據(jù)都是自然語言構(gòu)成的文本數(shù)據(jù),經(jīng)過分析處理,可以獲取兩方面的信息,一方面是對與發(fā)帖行為相關(guān)的數(shù)據(jù),例如發(fā)帖次數(shù),回復(fù)次數(shù),發(fā)布的主題貼是否有更多的回復(fù)(相比平均數(shù)),點(diǎn)贊和反對的操作次數(shù)等,另一方面通過自然語言和詞匯復(fù)雜度分析,獲取語言和詞法相關(guān)信息,例如是否使用更復(fù)雜的詞匯和更準(zhǔn)確的詞語[8],更多的使用二元/三元語法,使用更多種的詞匯(與平均使用次數(shù)相比)。這些數(shù)據(jù)可用于獲知學(xué)習(xí)者參與度、掌握和理解學(xué)習(xí)內(nèi)容的程度,可用于構(gòu)建基于課程的社交網(wǎng)絡(luò)。

      1.3 測試、作業(yè)和課后任務(wù)

      與大學(xué)實(shí)體面授課程相似,MOOC學(xué)習(xí)過程中,有各種類型的測試、作業(yè)和課后任務(wù),包括視頻中的QUIZ,課后測試,任務(wù),仿真實(shí)驗(yàn),程序編寫和報告論文等。從中抽取的特征主要包括學(xué)習(xí)者在課后任務(wù)中所花費(fèi)的時間,嘗試作業(yè)次數(shù)、

      嘗試小測次數(shù)和嘗試講座次數(shù)等[9]。因?yàn)閷τ诖蟛糠终n程而言,完成作業(yè)的學(xué)生較少,數(shù)據(jù)量和覆蓋的學(xué)生比例也比較小。同時,不同學(xué)科課程的作業(yè)形式有一定差異,數(shù)據(jù)處理的方法各異,為研究帶來了一定的困難。

      1.4 學(xué)習(xí)者基本屬性和課程信息

      課程信息一般與其他信息想結(jié)合,進(jìn)行學(xué)習(xí)行為和結(jié)果的預(yù)測,也應(yīng)用于學(xué)習(xí)者的持續(xù)性和參與度的預(yù)測。學(xué)習(xí)者基本信息一般是通過課前的可選問卷獲取,信息量小,獲取的內(nèi)容與真實(shí)情況有一定偏差,可用性不高。

      1.5 數(shù)據(jù)獲取與應(yīng)用

      在實(shí)際研究中,直接使用點(diǎn)擊流數(shù)據(jù)或結(jié)合多項(xiàng)數(shù)據(jù)的情況較多。華中師范大學(xué)張浩等人綜合運(yùn)用了用戶屬性信息(ID,年齡,性別,教育程度和地區(qū))、用戶行為數(shù)據(jù)(瀏覽、評論、收藏、是否參與課程、交互次數(shù)、播放視頻次數(shù)等)和課程屬性信息(ID、名稱和分類)進(jìn)行課程資源的推薦。國防科技大學(xué)的王雪宇等人在研究中擴(kuò)大使用的數(shù)據(jù)范圍,不僅使用學(xué)習(xí)者學(xué)習(xí)本課程時產(chǎn)生的數(shù)據(jù),而且綜合考慮其學(xué)習(xí)本課程之前在其他課程的行為數(shù)據(jù),包括登錄次數(shù),學(xué)習(xí)其他課程數(shù),通過的課程數(shù)和平均成績等,學(xué)習(xí)本課程期間在其他課程的學(xué)習(xí)數(shù)據(jù),包括同時學(xué)習(xí)的課程數(shù)量,通過的其他課程數(shù)和平均成績等[10]。

      在絕大部分的MOOC研究中,數(shù)據(jù)基本源于研究者或團(tuán)隊(duì)所講授的幾門課程。對于其他未講授MOOC的研究者,可以從MORF和DataStage獲取大規(guī)模的共享基準(zhǔn)數(shù)據(jù)集,

      2 預(yù)測模型

      預(yù)測模型是在根據(jù)不同課程源數(shù)據(jù)提取的特征,構(gòu)建預(yù)測模型,分別進(jìn)行訓(xùn)練、測試和應(yīng)用。常見的預(yù)測模型主要有基于活動、討論區(qū)、社交和認(rèn)知的模型。

      2.1 基于活動的模型

      基于活動的模型使用行為數(shù)據(jù),以學(xué)習(xí)者行為理論為基礎(chǔ),評估行為結(jié)果。因?yàn)榫哂写罅靠煽糠€(wěn)定的數(shù)據(jù)源(服務(wù)器日志)且具有較好的預(yù)測表現(xiàn),基于活動的模型最為常見。具體來說,有基于早期課程行為的模型,針對學(xué)習(xí)者在第一周內(nèi)的學(xué)習(xí)表現(xiàn)進(jìn)行早期輟課預(yù)測,為風(fēng)險學(xué)生提供早期干預(yù)[11];也有包括LSTM神經(jīng)網(wǎng)絡(luò)的序列模型,將每周的活動特征向量序列作為輸入,累積每周的學(xué)習(xí)數(shù)據(jù),逐步提高預(yù)測效率[12];另外,SVM、隱馬爾科夫和邏輯回歸等模型也有不同程度的應(yīng)用。

      2.2 基于討論區(qū)的模型

      基于討論區(qū)的模型使用自然語言數(shù)據(jù)作為基礎(chǔ)。這些自然語言數(shù)據(jù)來自于學(xué)習(xí)者或使用語言學(xué)理論分析得出。對討論區(qū)數(shù)據(jù)的細(xì)節(jié)分析包括語言、社交和行為的一些特征,這些只從點(diǎn)擊流數(shù)據(jù)分析無法獲取。從討論區(qū)的自然語言中抽取特征是一項(xiàng)十分耗費(fèi)時間和人力的工作,但帶來的效果是其他工作無法替代的。通過比較基于點(diǎn)擊流活動特征和自然語言處理特征預(yù)測優(yōu)劣的研究,發(fā)現(xiàn)基于點(diǎn)擊流活動的特征是課程完成率最有效的推薦指標(biāo)?;谟懻搮^(qū)模型的局限性主要是數(shù)據(jù)稀疏性[13],覆蓋的學(xué)生比例一般不超過完成課程的學(xué)生比例。

      2.3 社交模型

      社交模型使用觀測或推導(dǎo)出的社交關(guān)系,社交互動的理論作為學(xué)生模型的基礎(chǔ)。在研究中,以討論區(qū)數(shù)據(jù)為基礎(chǔ)構(gòu)建社交網(wǎng)絡(luò),學(xué)生是節(jié)點(diǎn),不同的回復(fù)關(guān)系構(gòu)成邊。Joksimovi等人評估了評論區(qū)社交網(wǎng)絡(luò)聯(lián)系與學(xué)習(xí)表現(xiàn)之間的關(guān)系,相比未完成課程的學(xué)生,獲得認(rèn)證或者優(yōu)秀的學(xué)生更愿意互動和交流,得出了社交網(wǎng)絡(luò)中的結(jié)構(gòu)中心與課程完成正相關(guān)的結(jié)論[14]。與MOOC評論區(qū)分析社交網(wǎng)絡(luò)相比,外部社交網(wǎng)絡(luò)(Facebook、Twitter、微信和微博等)具有數(shù)據(jù)豐富和網(wǎng)絡(luò)關(guān)系相對穩(wěn)定等優(yōu)點(diǎn),可作為未來獲取更多社交因素,研究社交聯(lián)系與學(xué)生成功之間聯(lián)系的新方向。

      2.4 認(rèn)知模型

      認(rèn)知模型的基礎(chǔ)是認(rèn)知理論和學(xué)習(xí)者的認(rèn)知狀態(tài)。認(rèn)知數(shù)據(jù)的獲取主要是通過傳感技術(shù)進(jìn)行生物特征追蹤和同期問卷調(diào)查。Dillon等人關(guān)注在MOOC模型中情緒這一認(rèn)知狀態(tài),用自述的情感狀態(tài)檢測情緒與學(xué)習(xí)活動和輟學(xué)之間的關(guān)系。研究結(jié)果顯示,焦慮、困惑、沮喪和希望都與輟學(xué)明顯相關(guān)。雖然MOOC學(xué)習(xí)本身就是一個認(rèn)知的過程,學(xué)習(xí)結(jié)果是認(rèn)知狀態(tài)的直接反映,但是總體來說,對于認(rèn)知數(shù)據(jù)的研究和應(yīng)用相對較少,這與目前傳感設(shè)備的普及率不高,認(rèn)知數(shù)據(jù)量小有直接關(guān)聯(lián)。

      3 個性化預(yù)測和干預(yù)模型構(gòu)建

      自關(guān)注以MOOC為代表的開放在線課程以來,筆者完成了Coursera約翰霍普金斯大學(xué)“探索性數(shù)據(jù)分析”和“R語言程序設(shè)計”,學(xué)堂在線清華大學(xué)“數(shù)據(jù)挖掘:理論與算法”等課程。在超星學(xué)習(xí)通先后開設(shè)了“數(shù)字視頻制作”、“數(shù)字媒體技術(shù)與應(yīng)用”和“數(shù)字媒體技術(shù)專業(yè)實(shí)訓(xùn)”等課程。目前正在講授“大學(xué)信息技術(shù)二(Python程序設(shè)計)”課程,本文以該課程為例,結(jié)合學(xué)習(xí)和教學(xué)經(jīng)驗(yàn),構(gòu)建了個性化預(yù)測和干預(yù)模型,如圖1所示。根據(jù)學(xué)生學(xué)習(xí)表現(xiàn),預(yù)測可能的學(xué)習(xí)行為和狀態(tài),通過系統(tǒng)信息和郵件及時地干預(yù)。

      具體來說,將學(xué)習(xí)活動劃分為課前、課中、課后。課前簽到,課中直播、看微課和參與討論,課后完成作業(yè)。綜合這三個階段不需要學(xué)生額外參與,系統(tǒng)根據(jù)所有學(xué)生已參與的課堂活動,給出一個分?jǐn)?shù)評價。下面對每個階段的學(xué)習(xí)活動進(jìn)行詳細(xì)描述。

      (1)簽到。根據(jù)歷史簽到情況預(yù)測下次課程是否會簽到,若結(jié)果為不會簽到則發(fā)送信息提醒學(xué)生。

      (2)直播。根據(jù)以往觀看直播視頻和是否參與互動的情況,預(yù)測學(xué)生下次參與直播課程的情況,通過信息進(jìn)行提醒,郵件反饋歷史情況。若預(yù)測參與直播的可能性小,則在下次直播課程中重點(diǎn)關(guān)注并進(jìn)行適當(dāng)提問。

      (3)微課。微課相當(dāng)于布置的錄播課任務(wù),要求在規(guī)定時間內(nèi)完成觀看,沒有實(shí)時互動。根據(jù)觀看微課的歷史情況,預(yù)測下次將不觀看、部分觀看或完整觀看。對于完整觀看的學(xué)生,發(fā)送額外學(xué)習(xí)資料的聯(lián)系,鼓勵進(jìn)行拓展學(xué)習(xí)。對齊其他學(xué)生,發(fā)送信息進(jìn)行反饋和提醒。

      (4)討論。根據(jù)學(xué)生在討論區(qū)的表現(xiàn),預(yù)測是否會發(fā)布主題、參與討論或主題能被回復(fù),將討論區(qū)動態(tài)及時通過信息反饋給學(xué)生,并為行為活躍的學(xué)生推薦相關(guān)性高的主題和討論。

      (5)作業(yè)。預(yù)測學(xué)生完成課后作業(yè)的情況,對全部完成作業(yè)和優(yōu)秀的學(xué)生推薦部分高階練習(xí)。對其他同學(xué)發(fā)送提醒信息。

      (6)課程積分。課程積分由學(xué)習(xí)平臺自動生成,為學(xué)生各學(xué)習(xí)階段的表現(xiàn)綜合評價。根據(jù)現(xiàn)階段課程積分,來預(yù)測課程完結(jié)總積分,對積分排名20%的給予不同程度平時成績加分。對于排名后20%的發(fā)送預(yù)警信息。

      目前,在課程《大學(xué)信息技術(shù)二(Python程序設(shè)計)》的簽到、直播、作業(yè)和課程積分4項(xiàng)活動中,應(yīng)用了預(yù)測和干預(yù)模式,結(jié)果表明,學(xué)生簽到率明顯提高,直播互動人數(shù)增多,作業(yè)完成情況有所提升,課程積分有一定程度提高。

      4 結(jié)束語

      本文對目前MOOC研究中的數(shù)據(jù)源和預(yù)測模型研究進(jìn)行了梳理,結(jié)合自身學(xué)習(xí)和教學(xué)經(jīng)驗(yàn)提出了個性化預(yù)測和干預(yù)模型,并將模型應(yīng)用于所講授的課程中,教學(xué)效果和學(xué)生在課程中的參與度都有一定程度的提升。對于以MOOC為代表的在線課程的過程管控、個性化施教和輟課率降低具有重要的參考和指導(dǎo)意義。下一步研究工作的開展主要從以下兩個方面入手,一是在微課和討論2項(xiàng)課程活動中應(yīng)用預(yù)測和干預(yù)模式,進(jìn)一步驗(yàn)證模型效率;二是應(yīng)用計算機(jī)技術(shù)和教育學(xué)理論,提升預(yù)測的準(zhǔn)確度,為個性化干預(yù)提供更精準(zhǔn)的支持。

      參考文獻(xiàn)(References):

      [1]http://www.rcoe.edu.cn/?p=4 269

      [2]https://baijiahao.baidu.com/s?id=1647805030394904836&,A,fr=spider&for=pc

      [3]Le C V,Pardos Z A,Meyer S D,et al_Communication atScale in a MOOC Using Predictive EngagementAnalytics. Lecture Notes in Computer Science, 2018:239-252

      [4] Gardner, J., & Brooks, C. Student success prediction inMOOCs. User Modeling and User-Adapted Interaction,2018.28(2):127-203

      [5] Pardos, Z. A., Tang, S., Davis, D., & Le, C. V. EnablingReal-Time Adaptivity in MOOCs with a PersonalizedNext-Step Recommendation Framework. Proceedingsof the Fourth (2017) ACM Conference on Learning @Scale - L@S '17:23-32

      [6] Andres, J. M. L., Baker, R. S., Gasevie, D., Siemens, G.,Crossley, S. A., &Joksimovie, S. Studying MOOCcompletion at scale using the MOOC replicationframework. Proceedings of the 8th (2018)lnternationalConference on Learning Analytics and Knowledge-LAK '18:71-78

      [7]盧曉航,王勝清,黃俊杰 . -種基于滑動窗口模型的 MOOCs輟學(xué)率預(yù)測方法 [J].現(xiàn)代圖書情報技術(shù) ,2017.4:67-75

      [8]王雪宇,鄒剛,~驍 .基于 MOOC數(shù)據(jù)的學(xué)習(xí)者輟課預(yù)測研究[J].現(xiàn)代教育技術(shù),2017.6:95-101

      [9] Ho A D, Reich J, Nesterko S O, et aL HarvardX and MITx:The First Year of Open Online Courses, Fall 2012-Summer2013[J]. Social Science Electronic Publishing,2014:1-33

      [10] RenZ ,Rangwala H , Johri A . Predicting Performance onMOOC Assessments using Multi-Regression Models,2016.

      [11] Xing, W., Chen, X., Stein, J., &Marcinkowski, M.Temporal predication of dropouts in MOOCs:Reaching the low hanging fruit through stackinggeneralization. Computers in Human Behavior,2016.58:119-129

      [12] Fei, M., &Yeung, D.-Y. Temporal Models for PredictingStudent Dropout in Massive Open Online Courses.2015 IEEE International Conference on Data MiningWorkshop (ICDMW),2015:256-263

      [13] Crossley, S., Paquette, L., Dascalu, M., McNamara, D.S., & Baker, R. S. Combining click-stream datawith NLP tools to better understand MOOC comple-tion. Proceedings of the Sixth (2016)lnternationalConference on Learning Analytics & Knowledge- LAK '16:6-14

      [14] Joksimovie, S., Manataki, A., Gasevie, D., Dawson, S.,Kovanovie, V., & de Kereki, I. F. Translatingnetwork position into performance. Proceedings ofthe Sixth(2016) International Conference on LearningAnalytics & Knowledge - LAK '16:314-323

      ★基金項(xiàng)目:湖南省教育廳科學(xué)研究項(xiàng)目“基于移動微課的非結(jié)構(gòu)化教育資源個性化推送算法研究”(16C0804)

      作者簡介:蔣翀(1980-),女,湖南黔陽人,碩士,講師/高級工程師,主要研究方向:推薦系統(tǒng),個性化技術(shù),教育信息化。

      猜你喜歡
      預(yù)測模型個性化
      堅持個性化的寫作
      新聞的個性化寫作
      上汽大通:C2B個性化定制未來
      基于神經(jīng)網(wǎng)絡(luò)的北京市房價預(yù)測研究
      中國石化J分公司油氣開發(fā)投資分析與預(yù)測模型研究
      基于IOWHA法的物流需求組合改善與預(yù)測模型構(gòu)建
      基于預(yù)測模型加擾動控制的最大功率點(diǎn)跟蹤研究
      滿足群眾的個性化需求
      巴彦淖尔市| 沾益县| 安国市| 潍坊市| 西城区| 临颍县| 平乐县| 潼关县| 二连浩特市| 富顺县| 堆龙德庆县| 原阳县| 泰安市| 泗水县| 江山市| 宜章县| 长寿区| 涪陵区| 阿图什市| 栖霞市| 诏安县| 永胜县| 定陶县| 杭锦旗| 甘孜| 乃东县| 漳浦县| 昌乐县| 鹿邑县| 日土县| 乳山市| 萍乡市| 喀什市| 昭通市| 三原县| 安新县| 寻乌县| 昔阳县| 化州市| 兰西县| 淮南市|