李夢蕾 李爽 沈欣憶
【摘 要】 學習分析作為當前教育技術研究熱點經歷了近十年的快速發(fā)展。為把握國內學習分析研究在過去十年間的主要進展和現狀,本研究采用文獻計量法、可視化分析、內容分析等方法對《中國電化教育》《中國遠程教育》等五本國內核心學術期刊2007—2017年發(fā)表的204篇學習分析文獻進行分析,總結、評述了十年來我國學習分析文獻的研究類型、年度高頻關鍵詞、研究者與機構、研究數據、研究技術與工具、研究主題。在此基礎上提出學習分析研究四個發(fā)展趨勢:從技術和數據驅動轉向教育需求驅動,多元化、多模態(tài)、高質量的數據采集,跨學科合作與技術融合,學習分析在教育領域全面展開。本研究希望通過描繪和反思近十年來國內學習分析研究圖景,為今后學習分析的研究與實踐提供參考。
【關鍵詞】 學習分析;教育大數據;學術期刊;文獻計量分析;可視化分析;內容分析;主要進展;發(fā)展趨勢
【中圖分類號】 G420 【文獻標識碼】 A 【文章編號】 1009-458x(2018)10-0005-12
一、引言
學習分析運用各種數據采集工具和分析技術,研究教學實踐中的學生投入、學習績效和進展,為課程、教學和評估的實時調整與改善提供了重要支撐(Johnson et al., 2012),成為當前發(fā)展最為迅速的研究領域。盡管學習分析最早可以追溯到20世紀60年代的計算機管理教學(顧小清, 等, 2012),但是學習分析領域真正引起廣泛關注是在2011年美國新媒體聯盟(New Media Consortium)《地平線報告》發(fā)布之后,報告將學習分析技術視為影響教育發(fā)展的新興技術。從2011年起,學習分析引起國際教育技術領域的廣泛興趣,發(fā)展迅速,并推動了教學評價與研究的科學化發(fā)展。隨著我國進入“互聯網+”時代,教育信息化環(huán)境全面升級,大量教育數據產生,成為新時期教育教學生產力的關鍵要素。挖掘這些數據隱含的教學知識與需求,探索新環(huán)境下的教育教學規(guī)律、提升教學的精準度與適應性、創(chuàng)新教學服務供給模式、推動教育教學系統變革的需求日益強烈。在此背景下,近幾年學習分析在我國教育領域的關注度與應用持續(xù)升溫,該領域的技術工具和實踐應用研究均發(fā)展迅猛,成為教育大數據的主要應用領域,也成為推動新時期教育教學研究范式變革的重要力量(王良周, 等, 2015; 楊現民, 等, 2017)。然而,學習分析作為一個新興領域,無論是理論研究還是實踐應用研究都仍處于初期探索階段,學習分析的教育應用價值與潛力尚待挖掘,迫切需要更多高質量研究支撐未來學習分析的教育應用。為此,有必要對以往學習分析的相關研究進行系統梳理與評述,總結學習分析研究近幾年的主要進展,剖析已有研究的局限與問題,明確未來研究方向與發(fā)展路徑。綜上所述,本文將聚焦能夠體現我國學習分析領域研究與實踐關鍵進展和成果的國內核心學術期刊,對近十年來學習分析研究文獻進行系統綜述,以期為學習分析的理論研究與實踐探索提供參考。
二、文獻綜述
已有學者對學習分析進行了文獻綜述。如黃志南等(2016)以 Web of Science 核心庫為數據來源,采用多種分析工具及可視化技術,從高被引文獻、核心作者分布、論文高產機構和高頻關鍵詞入手,梳理并揭示了當前學習分析的研究現狀;吳青等(2015)從利益相關者、研究目標、研究對象、技術方法四個維度梳理了學習分析的形成過程;孟玲玲等(2014)從多個角度對學習分析工具進行了分類,并從使用環(huán)境、數據支持格式、是否可視化等維度做了詳細比較;韓錫斌等(2017)對2008—2016年與學習分析相關的國內外學術期刊、碩博士學位論文和會議報告與論文進行了系統梳理,包括概念與綜述、構成與模型、技術系統、組織實施和效果評價五個方面,并提出了該領域的發(fā)展趨勢和路徑。
對相關綜述文獻的深入分析發(fā)現,已有研究關注的文獻時間跨度各不相同,主要是在學習分析興起的近十年范圍內;綜述的文獻來源以期刊文獻為主,也有少數綜述關注國外期刊文獻以及國際會議中的主題報告和論文(吳永和, 等, 2014; 曹帥, 等, 2016; 李香勇, 等, 2017)。有的綜述還對國內外文獻做了對比研究(韓錫斌, 等, 2017; 郭炯, 等, 2017)。從綜述范圍來看,尚沒有專門針對國內教育技術和遠程教育核心期刊2007—2017年學習分析文獻的系統分析。
在綜述內容方面,已有綜述的聚焦點各有不同。大部分綜述的內容圍繞學習分析模型與方法、學習分析的技術與工具、學習分析的實踐與應用、學習分析的研究主題等方面。如王紫琴等(2017)從學習分析技術規(guī)范的角度綜述了ADL、IMS 和 ISO /IEC三大標準組織制定的學習分析技術規(guī)范,并對Caliper Analytics和xAPI兩個學習分析技術規(guī)范進行了比較,分析兩者的不同點和內在聯系;李艷燕等(2012)通過對已有實證研究文獻的概括,整理出五種典型的數據分析方法,并提出了面向不同利益相關群體的應用服務。可是,從綜述內容上來看,已有文獻缺乏對學習分析研究者、數據來源、數據量、分析方法與工具、分析主題的系統分析,因此難以全面描述領域研究現狀,難以深入挖掘研究問題與局限。
在綜述方法上,大部分綜述研究都借助多種可視化工具和技術來分析學習分析的現狀。如牟智佳等(2016)以元分析、知識圖譜、社會網絡分析為研究方法,從研究者國籍、學科背景、關鍵文獻、關鍵詞、研究主題和研究方法六個方面,對文獻進行內容分析;黃志南等(2016)利用可視化工具分析了學習分析研究主題的年度變化,并在此基礎上加入了對文獻主題內容的分析。然而,在整體上大部分研究較少綜合定量、定性、可視化等多種方法對文獻進行多視角、深入的分析。
綜上所述,有必要對近十年來我國核心教育技術學術期刊的學習分析研究文獻進行系統深入的分析與綜述,總結十年來學習分析在我國教育技術領域的主要研究進展,分析已有研究局限與問題,為未來研究與實踐提供參考和依據。
三、研究方法
核心期刊是期刊中學術水平與影響力較高的刊物。已有研究對遠程教育領域核心期刊進行了期刊影響力的分析,指出《電化教育研究》《中國電化教育》《中國遠程教育》《現代遠程教育研究》《開放教育研究》《現代教育技術》《遠程教育雜志》七本期刊基本上反映了我國遠程教育領域的學術水平、研究動態(tài)、熱點話題和發(fā)展趨勢,是我國遠程教育領域的重要信息來源。其中,《電化教育研究》《中國遠程教育》《中國電化教育》三本期刊的影響指數最高(黃淑敏, 2011)??紤]到本研究將基于文章內容對核心期刊文獻進行人工篩選以避免使用關鍵詞搜索導致的文獻遺漏,人工篩選文獻工作量較大,因此決定從七本期刊中選擇五本進行學習分析相關文章的篩選。除了影響指數最高的三本期刊,還選擇了近幾年學術影響力提升較快的《現代遠程教育研究》和《開放教育研究》兩本期刊。聚焦這五本核心期刊,綜合應用文獻計量分析、可視化分析、內容分析等分析技術對學習分析相關文獻進行系統分析。
(一)文獻樣本及其選取
本研究綜述的文獻樣本通過如下兩個步驟獲得。首先,在中國知網(CNKI)以“大數據”和“學習分析”為關鍵詞,以“核心期刊”、發(fā)表時間在2007—2017年為篩選條件對《中國電化教育》《電化教育研究》《中國遠程教育》《現代遠程教育研究》《開放教育研究》五本期刊進行第一輪文獻檢索,得到62篇文獻。之后,研究者逐篇篩選五本核心期刊在2007—2017年發(fā)表的文章,選取與學習分析主題相關的研究文獻,一方面避免遺漏沒有以學習分析和大數據為關鍵詞的相關文獻,另一方面對關鍵詞檢索結果進行印證。最后通過雙向檢索和統計,最終篩選獲得有效文獻樣本共204篇,作為文獻綜述分析的對象。
(二)文獻分析過程與方法
本研究綜合應用文獻計量法、可視化分析、內容分析方法對所選取的204篇文獻進行分析。研究者首先根據分析內容對204篇文獻樣本進行整理與編碼,整理與編碼的內容包括文章題目、來源期刊、時間、作者、作者單位、研究類型、學習分析對象、分析數據來源、類型、樣本量、分析技術與工具、分析主題等。兩名研究者完成了編碼工作,協商編碼問題,檢驗編碼結果,確保了編碼結果的有效性。在文獻樣本編碼的基礎上,研究者分別借助Citespace5.0分析工具對文獻樣本的研究類別、研究年度熱度變化、作者合作關系進行可視化分析,采用Excel2013對133篇實證研究的被試或參與者的教育階段、來源、類型和樣本量、分析的技術和工具進行了描述性統計;采用UCINET6.0對實證研究中采用的學習分析方法進行關系網絡分析,采用內容分析法對文獻樣本的研究主題進行歸納與分析。
四、研究結果
(一)年度研究類型與熱點分析
1. 文獻研究類型分析
對文獻樣本分析發(fā)現,已有文獻可以分為三類:①理論分析類(53篇),即從理論視角出發(fā)構建學習分析的理論模型框架,或探討與學習分析相關的技術理論,探討學習分析的發(fā)展趨勢和基于各種平臺和應用范圍的理論架構;②實證研究類(133篇),即基于真實教育教學案例和數據開展學習分析的實證研究,以探索規(guī)律、構建模型、探索方法、開發(fā)系統等;③文獻綜述類(18篇),即從不同聚焦點對學習分析領域的文獻進行綜述,如學術群體、文獻可視化分析、分析工具、在線學習行為和大數據視角等。因此,本研究把大數據與學習分析的文獻分為三類,即實證研究類、理論分析類和文獻綜述類。由文獻的年度統計分析(見圖1)可以看出,文獻量逐年增大,三類文獻均增長較快,實證研究類的漲幅最大,說明研究者和實踐者都相繼進入學習分析領域開展研究,在理論建構的基礎上更加傾向與真實的學習分析實踐案例相結合,在實踐中探索和尋找理論與實踐的交叉點。
2. 文獻年度高頻關鍵詞分析
對五本期刊文獻樣本關鍵詞的分析(見圖2)顯示,學習分析從2011年被《地平線報告》定義為影響教育發(fā)展的新興技術之后迅速引起國內學者的關注,在2012年呈現爆發(fā)式增長(節(jié)點越大,表明出現的頻次越高),從2012年至2017年的年度熱詞分別是MOOC、教育大數據、翻轉課堂、教育技術、可視化、互聯網+、高等教育、深度學習、人工智能。2012年被稱為“MOOC元年”,與之伴隨的是對MOOC平臺的數據進行學習分析的大規(guī)模興起。隨后幾年互聯網飛速發(fā)展,教育信息化深入開展,教育數據集日漸龐大,越來越多的研究者開始關注“互聯網+教育”“教育大數據”背后的潛在價值,并在學習分析技術領域積極踐行。近兩年來關于學習分析的研究主要集中在高等學校。EDUCAUSE分析和研究中心(ECAR)不久前發(fā)布了《2017年高等教育十大戰(zhàn)略性技術》報告,認為學習分析技術是2017年美國高等院校正在投入的技術之一,高等院校準備讓應用系統支持院校新的數據需求。未來工廠(2016)發(fā)布了《2016—2020年在線教育邁向智能時代》,預測人工智能為核心的新技術與教學融合是在線教育的下一個核心驅動力,而人工智能的本質是基于大量數據的分析建立模型進行應用。目前人工智能和學習分析的融合已經在自適應學習、虛擬助手、專家系統、語言學習等方面具有廣泛的應用,2017年“人工智能”在學習分析領域的高頻出現正預示著人工智能將在在線教育領域迎來爆發(fā)期,通過對學習過程中產生的數據進行分析建模,運用技術手段充分發(fā)揮機器標準化的優(yōu)勢和人類富有情感及在創(chuàng)造力和復雜決策上的優(yōu)勢。未來,隨著技術的成熟和學習分析理論的深入融合,更多新的場景必將出現。
(二)作者可視化分析
從圖3可看出,作者整體分布較分散,沒有形成大的合作網絡,研究者大部分形成小的研究流派或者單獨開展研究。經過進一步查閱文獻發(fā)現,這些小研究流派大部分是基于高校內部和研究院內部的合作,跨??珙I域合作極少,且內部研究者大多為師徒關系、同事關系。目前主要形成了四大流派,如最大的合作網絡是以祝智庭、顧小清為中心的華東師范大學,以鄭勤華、孫洪濤、武法提、牟智佳等為代表的北京師范大學遠程教育研究中心和教育技術學院,以姜強、趙蔚為核心的華中師范大學等,他們之間都各自形成了較強和固定的關系網絡并不斷加強合作。但學習分析領域還應進一步加強不同機構的合作,發(fā)揮權威專家的學術引領作用,豐富不同高校間的聯系,搭建學習分析的研究交流平臺,形成更大型的研究者關系網。
同時,要鼓勵不同學科領域學者的交流合作,推進學習分析的跨學科合作研究。學習分析研究需要豐富的學科背景作支撐,包括腦認知科學、學習科學、社會學等,學習分析技術可以吸收借鑒其他學科的分析方法、理論、技術,對不同的分析場景、對象提出適用的理論框架體系,如與腦認知科學結合來探究學生認知規(guī)律,通過交叉合作的形式解決教與學中的問題,等等,進而形成跨學科研究的學習分析生態(tài)圈,以更加開放、多元的視角開展研究和實踐,推動學習分析領域更快發(fā)展。
(三)樣本與數據來源
教育大數據產生于各種教學實踐活動,核心的數據源頭是“人”和“物”,“人”包括學生、教師、管理者和家長,“物”包括學習平臺、校園網站、服務器、多媒體設備等各種教育裝備(楊現民, 等, 2016)。與傳統教育數據不同,大數據更多是過程性、即時性的行為和現象的記錄,這使得大數據下的學習分析技術能夠對每一個學習者的學習過程進行細致分析。通常不同數據的類型和來源不同,主要的采集方式和應用場景也不同。通過133篇實證研究文章進行二次編碼和整理,得出以下發(fā)現:
1. 學習分析對象所在教育階段
學習分析對象主要是在在線平臺開展教學和學習活動的教師和學生。整理案例研究中學習分析對象的相關信息可以發(fā)現,學習分析的對象類別多樣:從小學到大學本科、研究生都有所涉及,年齡跨度大,教育階段多樣,同時有很多MOOC學習者,以及不同教育階段的教師。經過討論,排除文章中未明確告知所分析對象的文章32篇,將學習分析對象按照教育階段和種類分為五大類(如圖4所示):基礎教育階段、職業(yè)與繼續(xù)教育階段、高等遠程教育學校、傳統高校、非學歷教育。可見,目前學習分析領域的研究主要集中于傳統高校和繼續(xù)教育領域,基礎教育的研究占比較少,這與教育大數據與分析技術最早產生于高校有關,同時說明未來基礎教育領域研究空間很大。
2. 學習分析數據來源
根據學習分析數據的來源和范圍不同,可以將其分為個體數據、課程數據、班級數據、學校數據、區(qū)域數據和國家數據,從上到下,從小到大,不斷匯聚?;谖墨I總結(如圖5所示),目前國內學習分析研究的數據主要來自于在線學習平臺(如Moodle平臺、電大網絡教育平臺、MOOC平臺、網絡研修社區(qū)等)及在線學習管理系統(如智能導學系統、學習神經元、Few儀表盤、電子學檔等)。也有實證研究的數據來自于網易、新浪和貓撲等網站論壇和QQ、微信、微博等移動社交平臺。此外,少量學習分析研究也結合線下調查問卷的數據作為學習數據的補充??梢钥闯?,分析數據的來源更加多元化,而且已經有學者開始關注社交平臺等非正式學習空間中的數據。未來,數據還有可能更多來源于多模態(tài)數據、情境中的互動、運動手環(huán)等。隨著越來越多的數據被關注和采集,學習數據的多來源不僅讓我們更加清晰地了解學生的偏好和習慣,而且數據間的關聯性加強,能夠更加準確地再現學習過程。
3. 數據類型
分析目標和研究目的不同,則需要選擇與研究的數據類型不同(郁曉華, 等, 2016)。學習分析類研究關注的數據不再僅僅是學生基本特征和學業(yè)成績,還包括分布在各種教學、學習情境和空間中的教學和學習過程生成數據。這些生成數據種類多樣、繁雜,既有行為頻次、行為時間等行為屬性的數據,也有行為對象相關數據。行為類型不同,行為對象數據也存在差異。如果是學生與技術系統、工具的互動行為,行為對象是功能模塊、資源、練習題、帖子、筆記、微博等,相關數據可能是資源的元數據、學生創(chuàng)作內容特征數據、學生考試成績數據等。如果是學生的社會性互動,那么行為對象就是教師或同伴,相關數據是不同主體的特征和基本信息數據。根據文獻樣本報告的數據所屬對象,本研究將分析數據分為學生、教師和課程三類數據集合,見表1。學生數據由學生基本特征與信息數據以及學生在學習過程中產生的各類行為數據構成。教師數據由教師基本特征與信息、教師與課程平臺或技術工具的交互行為數據、教師與學生的互動數據構成。課程數據包括課程基本信息數據和課程生成數據。后者都是由學生和教師生成,與前兩類數據集有交叉,但課程數據是以課程為對象進行的數據分析,支持課程實施情況的分析和評估。
對文獻樣本的數據類型分析發(fā)現,大部分研究的數據類型相對單一,體現在:①已有研究主要關注學生學習行為數據,缺乏學生行為數據與學生特征、基本信息數據的關聯分析,缺乏學生數據與教師數據、課程數據的關聯分析,因此難以評估課程和教學因素對學習行為的影響;②對學習行為數據的分析以表面的量化行為數據分析居多,較少關注體現學習質量的行為數據、挖掘行為數據中隱含的情感和認知特征、對學生在線學習進行深入剖析。近幾年,已經有一些研究者意識到對體現學習質量和心理投入的行為數據,以及多元、多類數據進行整合分析的價值,對學生的在線學習特征及其影響因素進行了更深入的探索。未來研究要更多關注體現學習質量的行為數據,要融合多類、多元數據對學習進行全面、深入的分析。
4. 分析數據量
學習分析教育價值和潛力的有效發(fā)揮建立在對大數據分析的基礎上。那么已有研究分析的數據量級是怎樣的呢?為考察該問題,本研究對文獻樣本中實證研究的數據量進行了統計(見圖6),發(fā)現明確報告數據量的文獻只有61篇。其中,分析數據量小于100的文章有5篇;數據量在100到10,000之間的文章有33篇,占比近一半;數據量大于1萬以上的文章有23篇。有的研究使用了幾百個在線帖子及在線行為數據進行分析和預測;僅有少量研究的數據量達到1.1億次的課程點擊量,幾十萬學習者的在線行為數據。根據分析,已有研究學生樣本量以百人左右為主,在線數據記錄數主要在萬條以內??梢姡缥喉樒剑?016)所指出的,雖然大數據時代已經到來,但是國內學習分析實證研究以小樣本研究為主,真正基于大數據的學習分析研究還沒有全面展開,已有研究所發(fā)現的規(guī)律與模型大多只是在特定情境下的局部探索,很難獲得普適性的規(guī)律與模型。未來,需要從樣本規(guī)模、學習經歷完整性和深度等方面采集更大規(guī)模的數據,將學習分析建立在大數據基礎上,提升分析的價值。
(四)分析技術與工具
1. 分析技術與方法
教育數據挖掘為學習分析技術奠定了基礎(胡水星, 2016)。學習分析過程包括數據采集與儲存、數據篩選、數據預處理、數據變換、數據挖掘、模式解釋與評價等環(huán)節(jié)。對已有研究的分析方法調查顯示,已有研究采用了描述性統計、關系挖掘、文本挖掘、社會網絡分析、內容分析、聚類等多種數據挖掘方法。本研究基于Romero和Ventura(2007)對教育挖掘技術的分類將學習分析技術分為五類:統計分析、可視化分析、聚類與分類、關聯規(guī)則挖掘和序列模型挖掘、文本挖掘。對方法出現頻次的統計分析發(fā)現(見圖7),出現頻次最多的三種方法是描述性統計、社會網絡分析和聚類。從方法類型上看,統計分析類方法出現頻次最多,其次是聚類與分類方法。
研究者根據每個研究中組合使用的分析方法建立矩陣圖,采用UCINET6.0繪制出學習分析方法關聯使用的關系網絡圖(見圖8)。據圖可知,多數研究組合了多種方法開展學習分析。其中,描述性統計、聚類分析、相關分析處于網絡的中心,可見它們是與其他方法關聯使用頻度較高的分析方法。此外,社會網絡分析、方差分析也與其他方法有較高的組合使用頻度。組合使用頻次較高(≥5次)的方法為描述性統計分別與方差分析、聚類分析、社會網絡分析、內容分析的組合,相關分析與聚類分析,社會網絡分析與內容分析。
綜上所述,相關研究多采用多種分析方法對學習數據進行挖掘,但是分析以對學習數據的描述性、探索性分析為主,缺乏對學習過程的建模分析。根據方法組合的分析結果,結合具體研究分析,可知大多數研究會首先對數據進行描述性分析,之后再開展深入的數據挖掘,檢驗成績差異。根據行為特征聚類學生、分析學生互動形成的關系網絡和交互質量是已有研究較為常見的研究路線。
2. 工具
學習分析工具在學習分析過程中具有重要作用,任何研究分析的順利進行都離不開優(yōu)質工具的支持,便捷、實用的工具可以使研究更為有效(劉三,等, 2017)。對樣本中實證研究采用的分析技術與工具進行統計分析發(fā)現,報告分析工具的文獻采用的技術工具主要集中在統計分析工具、社會網絡分析工具、內容分析工具三類。
研究對各類工具在文獻中的使用頻次進行了統計(見表2),發(fā)現統計分析工具是最常用的學習分析工具,其中SPSS的使用頻次最高(24次),有研究使用SPSS進行數據的預處理、數據轉換、差異檢驗、回歸分析、聚類、降維等。在統計分析工具中,Excel(8次)和AMOS(5次)也是研究者較多選擇的統計分析工具,前者操作簡單,多用于簡單的描述性統計、差異檢驗、回歸分析等,后者多用于SPSS所不能實現的結構方程分析。在社會網絡分析中,UCINET(5次)更受青睞,除了該工具支持數據的深入分析,可能還因為該軟件的數據兼容性更強,更易獲得。在內容分析工具中,使用頻次最高的是Nvivo(3次),它是一種常用的非常靈活的編碼工具,能夠分析音頻、視頻、圖片和文檔信息,適用范圍較廣。除了上述三種之外,有學者還使用了其他的分析工具,如Google Analytics、Quinlan等。
分析工具的統計結果表明,國內研究者常選用的分析工具往往具有較好的可獲得性和易用性,如SPSS、Excel、Nvivo、UCINET。專業(yè)性較強的工具或可獲得性較差的工具使用率普遍偏低。這在某種程度上反映出現有學習分析研究團隊分析研究的技術力量和資源支持有限。另外,值得注意的是,已有研究大多缺乏對所用技術工具的評價與反思,也較少有學者對同類分析技術或工具進行對比分析。工欲善其事必先利其器,有效的分析工具將會顯著提升學習分析的效果,未來亟須學習分析工具的對比與評價研究,以便為分析工具的選擇提供參考。
(五)研究主題
基于對文獻內容的分析與編碼,本研究將文獻樣本的主題歸納為六大類(見圖9):探索教與學規(guī)律、學習過程監(jiān)控和評價、學習分析的工具和方法、學習分析的基本理論、自適應和個性化學習、其他。在編碼中,研究者發(fā)現部分文章可能涉及多個主題內容,經過協商選擇了文章的核心內容進行主題歸類。極少數文章不屬于前五大類中,但仍與學習分析相關,如在介紹教育技術發(fā)展、大數據平臺構建中介紹性地談到學習分析領域,研究者把這類文章歸到“其他”類,未做進一步分析。本研究對前五個主題的內容進行詳細論述。
1. 探索教與學規(guī)律
在學習分析相關文獻中,探索教與學規(guī)律的研究占比最大。過去十年不僅是教育大數據和學習分析興起和發(fā)展的十年,也是教與學環(huán)境數字化和網絡化顯著發(fā)展的十年,亟待探索新環(huán)境下教與學的規(guī)律,而學習分析為挖掘和揭示新環(huán)境下教與學的深層規(guī)律提供了有力支撐。已有研究基于教學平臺中的各種教學數據對在線學習行為特征及其影響因素、教學交互行為特征、教師特征與行為對學習行為的影響、學生特征對學習行為的影響、特定在線學習活動對學習體驗和效果的影響等進行了探索。如馬婧等(2014)基于網絡教學平臺中師生行為的表征數據,探索了網絡教學環(huán)境中教師教學行為與學生自主學習行為之間的關系;張婧婧等(2017)通過對B站中一門PS課程的彈幕數據進行分析和文本挖掘,發(fā)現彈幕在一定程度上有助于促進師生、生生間的情感交流,縮小師生間的心理距離,增強學習者的社會臨場感,減少網絡學習孤獨感;王敏娟等(2007)用內容分析法對師生討論記錄進行挖掘,探索性別、對話風格和平等參與之間的關系。此外,還有研究關注社會化批注對大學生深度閱讀的影響(柴陽麗, 2016),探究英語學習規(guī)律(蘭國帥, 等, 2013)、學生學習行為規(guī)律(石磊, 等, 2017)等。
學習分析技術和教育大數據的結合有助于挖掘不斷豐富的教育數據中隱含的教學知識與需求,是探索新環(huán)境下教與學規(guī)律的重要方法。然而,現有研究在規(guī)律探索層面更多是基于單一數據來源分析行為層面的規(guī)律與特征,未來需要更多聚焦多來源、多類型數據的整合分析,挖掘行為數據背后的學習心理特征與規(guī)律,探索教與學的規(guī)律。
2. 學習過程監(jiān)控與評價
采用學習分析技術對學生學習行為及過程進行評價、監(jiān)控和預警的研究是學習分析研究關注的另一個重要主題。已有文獻對學習過程監(jiān)測模型和指標、學習績效預測模型與指標、學習預警與反饋模型和系統、教學干預方式與模型、學習路徑、學習預警與反饋、困難學生干預等進行了探究。研究者力求基于學習行為數據對學習投入、學習過程與路徑進行有效的監(jiān)控,支持基于過程的學習評價和教學,根據學習情況實時調整,及時發(fā)現預警行為或預警學生并提供有效的干預和反饋。在該主題下,定義基于學習數據的監(jiān)控與預警指標,構建相應監(jiān)控和預警模型,設計開發(fā)監(jiān)控、評價和預警系統成為這方面研究的熱點。如孫鴻飛等(2007)利用電子學檔記錄學生學習過程信息并提供及時反饋,一定程度上實現了對在線學習各環(huán)節(jié)的監(jiān)控;李爽等(2016)在學習行為投入理論框架下定義在線學習行為投入評測指標,基于實際數據分析相應指標內在結構以及對學習績效的預測作用,探索在線學習行為投入的有效評測指標;金義富等(2016)探討了大數據環(huán)境下的學業(yè)預警系統設計框架,提出了一種基于離群數據挖掘與分析的課程、課堂、課外“三位一體”預警信息發(fā)現與生成模型LAOMA(Model of Learning Alert Based on Outlier Mining and Analysis),構建了學業(yè)預警兩類六級信號系統及反饋機制;張家華等(2017)基于傳統RTI模式構建了在線學習干預模型,通過分析技術及時預測可能出現學習風險的學習者,并為其提供適當的學習干預。
3. 學習分析的方法與工具
對學習分析工具與方法的介紹與分析是學習分析文獻的第三大主題內容。這可能與學習分析作為一個新興領域,人們的關注點還集中于該領域技術與工具的引入和選擇有關。文獻多從工具和方法的介紹以及在實際案例中的具體應用入手,對其適用性、優(yōu)缺點進行評價和分析。如劉三
學習分析工具和方法直接影響學習分析效率與效果?,F有文獻主要以介紹某個工具和方法為主,未來需要更多聚焦于在實證檢驗基礎上對多類學習分析工具和方法進行對比研究,以支持實踐中工具和方法的選擇。
4. 學習分析的基本理論
學習分析基本理論的文獻占比不高,且主要集中在早期,對學習分析定義、一般學習分析系統構成與設計的理論探索較多,涉及內容包括學習分析概念界定、系統構成和基本框架、理論模型構建等。在概念界定方面,許多研究都將學習分析概念與其他相關概念,如教育數據挖掘、學術分析、預測分析等進行辨析,幫助人們明確學習分析概念的內涵與外延。有的學者對特定領域的學習分析模型進行了理論探索,國內研究者多聚焦于對國外已有模型理論的分析和評價,本土原創(chuàng)的學習分析模型較少。整體上,已有學習分析框架有兩種建構方式,一是以某種邏輯順序呈現學習分析要素,二是以時間順序呈現學習分析過程(魏順平, 2016)。祝智庭等(2013)從學習分析學的視角探討其設計框架和學習分析的資源過程模型與重要環(huán)節(jié);鄭婭峰等(2017)從知識加工、社交關系、行為模式三個維度構建了面向計算機支持的協作學習分析模型。該分析模型用于自動測量協作過程中知識水平與知識發(fā)展,深入挖掘協作過程中交互模式的序列與規(guī)律,有效識別群組成員的交互結構。也有研究從學習分析系統要素及要素間的關系出發(fā),從大數據下學習分析理論的視角研究教學的新范式(楊現民, 等, 2017; 祝智庭, 等, 2013)。整體上,該主題的文獻缺乏對學習分析應用所需理論創(chuàng)新與理論模型的探索,隨著學習分析實踐的快速發(fā)展,這類研究的需求將日趨強勁。
5. 自適應和個性化學習
自適應和個性化學習是學習分析最具潛力的應用領域,然而該主題下的研究卻是最少的?,F有文獻從用戶模型與資源推薦模型、個性化和自適應算法與技術、自適應學習系統等方面對基于學習分析的自適應和個性化學習進行了初步探索。在用戶模型與資源推薦模型方面,研究大都基于學生相對穩(wěn)定的個人信息和動態(tài)變化的學習過程數據來發(fā)掘學習者的學習特點、學習動機、學習興趣和認知風格等深層次信息,并提供個性化的學習支持服務(岳俊芳, 等, 2017)。陳海建等(2017)選取上海開放大學的一門課程開展實驗驗證,以標簽化的形式構建用戶畫像,利用學習者的基本信息,在線學習行為和課堂表現,挖掘學習者個人興趣、愛好、學習能力等特點,以有效服務于個性化教學;韓建華等(2016)構建了智能導學系統結構模型和個性化學習過程模型,通過實證研究驗證了該模型的應用效能:能夠創(chuàng)建學習者個性化學習路徑,根據因果圖編輯過程和結果給出個性化指導和建議,對學習者的學習過程進行干預,根據學習者的測試結果生成個性化評價;在算法和方法層面,方海光等(2016)構建了量化自我學習算法QSLA(Quantified Self Learning Algorithm)作為實現基于教育大數據的自適應學習的基礎;黎孟雄等(2012)基于模糊聚類的方法,并結合協同過濾、智能分詞和移動Agent技術,建立了教學資源的自適應推薦模型,對目標用戶的檢索期望進行了預測和體檢;張馳等(2009)使用EM算法對移動學習中的學生進行聚類分析,發(fā)現學生的群體分布特點,結合學生群體特征及差異對移動學習課程資源設計和教學設計進行改進。未來,隨著人們個性化學習需求進一步釋放,各類教育機構都將更加重視教育教學產品與服務在滿足學生個性化需求方面的能力,自適應與個性化學習方面的應用研究將成為學習分析研究的核心內容。
五、結論與展望
本研究基于對2007—2017年十年間國內五本教育技術與遠程教育領域核心期刊中學習分析相關研究文獻的計量分析與內容分析,對我國學習分析研究進展與現狀進行了系統梳理與評述。研究發(fā)現,近十年來學習分析領域發(fā)展迅猛,形成了多個學術研究團隊與中心,關注熱點從早期的學習分析定義、理論框架、技術引進和綜述,逐漸轉向學習分析在MOOC、高等教育等領域的應用研究,研究主題多元化,在教學規(guī)律探索、學習監(jiān)控與評價、技術工具研發(fā)、理論研究、自適應與個性化學習等研究領域都取得了一定進展。然而值得注意的是,已有研究也存在一些問題和局限,如相關實證研究在數據來源多樣性和豐富性上、在研究視角與方法的多元性和新穎性上略顯不足,本土化理論研究以及學習分析應用所需的理論模型研究整體缺乏,學習分析的應用研究領域以高等教育為主,實證研究報告不夠規(guī)范與完整,等等。在文獻分析基礎上,本研究認為未來我國學習分析相關研究將呈現如下趨勢:
1. 從技術驅動和數據驅動轉向教育需求驅動
在學習分析興起和應用之初,學習分析的教育應用以技術驅動和數據驅動為主,由此導致研究和實踐可能偏離真實的教育問題(韓錫斌, 等, 2017)。早期關注的焦點是突然劇增的教育數據,以及各種能夠挖掘這些數據中隱含的學習知識和教育知識的技術,教育大數據成為新的教育生產要素,數據分析和技術發(fā)展倒逼教育教學服務的創(chuàng)新(李爽, 2016)。隨著教育數據日益豐富、數據規(guī)范和標準的建立與推行、數據挖掘技術不斷成熟,教育各類相關利益群體基于數據的決策與服務意識以及個性化需求不斷增強,學習分析研究與應用將不再從數據和技術出發(fā),而是回歸教育需求,實現從數據和技術驅動向教育需求驅動的轉變。
2. 多元化、多模態(tài)、高質量的數據采集
隨著生物識別技術、傳感器技術、可穿戴設備、物聯網技術等技術的發(fā)展,各種學習場景、技術平臺、系統、工具及其數據的全面聯通與便捷共享,學習分析所采集和分析的數據將呈現多元化和多模態(tài)的發(fā)展趨勢,以支持對學習經歷進行全方位的分析與監(jiān)控。近幾年來,非正式學習空間和情境的學習數據、學習過程中學生的生物信號數據、學習情境數據開始受到更多關注。此外,在數據采集中人們越來越重視采集那些能夠體現學習質量和心理體驗的數據,而不再只關注訪問量、點擊率等淺層次的行為數據。
3. 跨學科合作與技術融合
跨學科合作研究和技術融合是未來學習分析的重要趨勢。未來幾年,學習分析研究所應對的是處于不斷創(chuàng)新變革的教育系統中的教育教學問題,問題的復雜性和數據的多元化都需要突破單一的研究視角和技術方法,從教育學、信息科學、系統科學、腦認知科學、工程學、心理學等多學科中汲取營養(yǎng),開展多學科合作,只有這樣才能掌握更加全面的數據信息,認識和探索更為復雜的教學和學習問題,掌握和評估學生的學習,提供個性化的精準教學服務(牛敏娜, 2017)。
4. 學習分析研究在教育各領域全面開展
前十年的學習分析研究主要以高等教育、正式學習為主,基礎教育、職業(yè)教育等領域以及非正式學習的學習分析研究較少。隨著我國“互聯網+教育”改革的推進,基礎教育、職業(yè)教育、成人與繼續(xù)教育等領域的在線教育將獲得顯著發(fā)展,非正式學習也將迅速崛起,成為人們學習的重要途徑。在此背景下,學習分析的研究與應用將在教育各領域全面展開,以響應教育各領域以及終身教育在新教育教學形態(tài)下對教學規(guī)律、方法、技術探索的需求。
[參考文獻]
曹帥,王以寧,徐鵬. 2016. 學習分析技術的研究現狀與未來趨勢——基于2011—2015年LAK會議論文的分析[J]. 中國電化教育(05):78-84.
柴陽麗. 2016. 社會化批注對大學生數字化深閱讀影響的實證研究[J]. 現代遠程教育研究(02):107-112.
陳海建,戴永輝,韓冬梅,等. 2017. 開放式教學下的學習者畫像及個性化教學探討[J]. 開放教育研究,23(03):105-112.
方海光,羅金萍,陳俊達,等. 2016. 基于教育大數據的量化自我MOOC自適應學習系統研究[J]. 電化教育研究,3(11):38-42,92.
顧小清,張進良,蔡慧英. 2012. 學習分析:正在浮現中的數據技術[J]. 遠程教育雜志,30(01):18-25.
郭炯,鄭曉俊. 2017. 基于大數據的學習分析研究綜述[J]. 中國電化教育(01):121-130.
韓建華,姜強,趙蔚,等. 2016. 智能導學環(huán)境下個性化學習模型及應用效能評價[J]. 電化教育研究,3(07):66-73.
韓錫斌,黃月,馬婧,等. 2017. 學習分析的系統化綜述:回顧、辨析及前瞻[J]. 清華大學教育研究,38(03):41-51,124.
胡水星. 2016. 教師大數據應用學習[M]. 杭州:浙江教育出版社:12.
黃淑敏. 2011. 中國遠程教育領域核心期刊的學術影響力報告——基于2006—2010年載文被引特征分析[J]. 廣州廣播電視大學學報,11(05):13-18,107-108.
黃志南,陸星兒,胡賀寧,等. 2016. 學習分析主題結構研究及可視化分析[J]. 開放教育研究,22(05):102-111.
金義富,吳濤,張子石,等. 2016. 大數據環(huán)境下學業(yè)預警系統設計與分析[J]. 中國電化教育(02):69-73.
蘭國帥,張一春. 2013. 合理利用超媒體注釋技術促進英語閱讀理解及詞匯習得——梅耶多媒體信息設計“臨近原則”的實驗驗證[J]. 中國遠程教育(09):40-45.
黎孟雄,郭鵬飛. 2012. 基于模糊聚類的教學資源自適應推薦研究[J]. 中國遠程教育(07):89-92.
李爽. 2016. 基于學習分析的在線學生支持[M]. 北京:中央廣播電視大學出版社.
李爽,王增賢,喻忱,等. 2016. 在線學習行為投入分析框架與測量指標研究——基于LMS數據的學習分析[J]. 開放教育研究,22(02):77-88.
李香勇,左明章,王志鋒. 2017. 學習分析的研究現狀與未來展望——2016年學習分析和知識國際會議述評[J]. 開放教育研究,23(02):46-55.
李艷燕,馬韶茜,黃榮懷. 2012. 學習分析技術:服務學習過程設計和優(yōu)化[J]. 開放教育研究,18(05):18-24.
劉三,彭晛,劉智,等. 2016. 基于文本挖掘的學習分析應用研究[J]. 電化教育研究,7(02):23-30.
劉三,石月鳳,劉智,等. 2017. 網絡環(huán)境下群體互動學習分析的應用研究——基于社會網絡分析的視角[J]. 中國電化教育(02):5-12.
馬婧,韓錫斌,周潛,等. 2014. 基于學習分析的高校師生在線教學群體行為的實證研究[J]. 電化教育研究,35(02):13-18,32.
孟玲玲,顧小清,李澤. 2014. 學習分析工具比較研究[J]. 開放教育研究,20(04):66-75.
牟智佳,俞顯. 2016. 知識圖譜分析視角下學習分析的學術群體與熱點追蹤——對歷年“學習分析與知識國際會議”的元分析[J]. 遠程教育雜志,35(02):54-63.
牛敏娜. 2017. 基于大數據視角分析學習變革[J]. 時代教育(04):105.
石磊,程罡,李超,等. 2017. 大規(guī)模私有型在線課程學習行為及其影響因素研究——以國家開放大學網絡課程學習為例[J]. 中國遠程教育(04):23-32,80.
孫鴻飛,劉洪沛,上官右黎. 2007. 電子學檔在在線學習監(jiān)控中的應用研究[J]. 中國遠程教育(02):57-60.
孫洪濤. 2013. 開源工具支持下的社會網絡分析——NodeXL介紹與案例研究[J]. 中國遠程教育(02):14-20.
王洪江,穆肅,黃潔,等. 2017. 自主學習投入度實時分析方法及應用研究[J]. 電化教育研究,38(10):44-50.
王良周,于衛(wèi)紅. 2015. 大數據視角下的學習分析綜述[J]. 中國遠程教育(03):31-37.
王敏娟,克里斯蒂娜·塞拉,趙曉楠. 2007. 在線學習中的性別差異、對話風格和平等參與[J]. 中國遠程教育(02):25-29.
王紫琴,彭嫻,吳砥. 2017. 學習分析技術規(guī)范比較研究[J]. 開放教育研究,23(01):93-101.
未來工廠. 2016-11-17. 《EDAI:2016—2020年在線教育邁向智能時代》[EB/OL]. http://www.imxdata.com/archives/16839
魏順平. 2016. 在線教育學習分析研究[M]. 北京:中央廣播電視大學出版社.
吳青,羅儒國. 2015. 學習分析:從源起到實踐與研究[J]. 開放教育研究,21(01):71-79.
吳永和,曹盼,邢萬里,等. 2014. 學習分析技術的發(fā)展和挑戰(zhàn)——第四屆學習分析與知識國際會議評析[J]. 開放教育研究,20(06):72-80.
楊現民,駱嬌嬌,劉雅馨,等. 2017. 數據驅動教學:大數據時代教學范式的新走向[J]. 電化教育研究(12):13-20,26.
楊現民,王懷波,李冀紅. 2016. 滯后序列分析法在學習行為分析中的應用[J]. 中國電化教育(02):17-23,32.
郁曉華,江紹祥. 2016. 在線教與學集體智慧的有效利用:學習分析的視角與架構[J]. 開放教育研究,22(03):98-106.
岳俊芳,陳逸. 2017. 基于大數據分析的遠程學習者建模與個性化學習應用[J]. 中國遠程教育(07):34-39.
張馳,陳剛,王敏娟,等. 2009. 移動學習中使用EM算法的學生聚類分析[J]. 中國遠程教育(05):68-71.
張家華,鄒琴,祝智庭. 2017. 學習分析視角下在線學習干預模型應用[J]. 現代遠程教育研究(04):88-96.
張婧婧,楊業(yè)宏,安欣. 2017. 彈幕視頻中的學習交互分析[J]. 中國遠程教育(11):22-30,79-80.
鄭婭峰,徐唱,李艷燕. 2017. 計算機支持的協作學習分析模型及可視化研究[J]. 電化教育研究,38(04):47-52.
祝智庭,沈德梅. 2013. 學習分析學:智慧教育的科學力量[J]. 電化教育研究,34(05):5-12,19.
Johnson L, Adams S. Cummins M. (2012, September 16). The NMC Horizon Report:2012 Higher Education Edition[EB/OL]. http://www.org/publicatopns/horizon-report-2012-higher-ed-edition
Romero C, Venturcl S. (2007). Educational data mining: A survey from 1995 to 2005[J]. Expert systems with applications,33(1), 135-146.
收稿日期:2018-03-03
定稿日期:2018-07-26
作者簡介:李夢蕾,碩士研究生;李爽,本文通訊作者,博士,副教授,碩士生導師。北京師范大學遠程教育研究中心(100875)。
沈欣憶,博士,助理研究員,北京教育科學研究院(100029)。
責任編輯 劉 莉 張志禎