李鳳霞,徐玉曉
(華南師范大學(xué) 教育信息技術(shù)學(xué)院,廣東 廣州510631)
本文以Web of Science(WOS) 數(shù)據(jù)庫為基礎(chǔ),使用“TS=education AND big data”檢索式,時(shí)間跨度為2000 -2018年,國家/地區(qū)排除中國,檢索文件類型為ARTICLE 以及REVIEW,檢索出1 255 篇文獻(xiàn)并按“相關(guān)性”排序,篩選出與“教育大數(shù)據(jù)”高度相關(guān)的500 篇文獻(xiàn)。利用WOS 數(shù)據(jù)庫中自帶分析檢索結(jié)果功能統(tǒng)計(jì)文獻(xiàn)相關(guān)數(shù)量信息,將統(tǒng)計(jì)數(shù)據(jù)導(dǎo)入Excel 繪制可視化圖表;將文獻(xiàn)信息導(dǎo)入可視化文獻(xiàn)分析軟件Citespace,對(duì)研究熱點(diǎn)進(jìn)行聚類分析。此外還借助Google Earth 可視化呈現(xiàn)文獻(xiàn)空間分布情況。
根據(jù)國際教育大數(shù)據(jù)文獻(xiàn)數(shù)量變化情況(見圖1) ,可大致將其發(fā)展軌跡劃分為起步階段(2000 -2011) 、快速發(fā)展階段(2012 -2017) 、平緩發(fā)展階段(2018 至今) 。2000 -2011 年間,大數(shù)據(jù)相關(guān)研究并不深入,還停留在數(shù)據(jù)處理技術(shù)實(shí)現(xiàn)及大數(shù)據(jù)在教育領(lǐng)域應(yīng)用可行性探討層面。2011年,麥肯錫全球研究院首次提出“大數(shù)據(jù)時(shí)代”的概念[1]。2012 年大數(shù)據(jù)研究熱點(diǎn)由教育數(shù)據(jù)應(yīng)用可行性探討轉(zhuǎn)向了教育大數(shù)據(jù)實(shí)踐應(yīng)用,開啟了教育大數(shù)據(jù)由“發(fā)現(xiàn)數(shù)據(jù)”到“挖掘數(shù)據(jù)”的初步嘗試,較多關(guān)注教育大數(shù)據(jù)與教育應(yīng)用的決策支撐與學(xué)習(xí)預(yù)測等[2]。2012 年,美國發(fā)布了《大數(shù)據(jù)研究與發(fā)展倡議》[3],與《通過教育數(shù)據(jù)挖掘與學(xué)習(xí)分析促進(jìn)教與學(xué)》教育大數(shù)據(jù)報(bào)告,拉開大數(shù)據(jù)在教育領(lǐng)域的研究熱潮[4]。2017 年是國外教育大數(shù)據(jù)發(fā)展最火熱時(shí)期,2018年教育大數(shù)據(jù)研究逐漸邁進(jìn)相對(duì)平緩階段。
圖1 國外教育大數(shù)據(jù)文獻(xiàn)時(shí)間分布
本文將文獻(xiàn)信息導(dǎo)入Cit espace 軟件,結(jié)合Google Earth工具,生成文獻(xiàn)空間分布地理位置圖。
從圖2 -4 可看出,教育大數(shù)據(jù)研究主要分布在歐洲、北美洲、亞洲等區(qū)域,且歐洲數(shù)量最多。歐洲教育大數(shù)據(jù)研究主要分布在西歐國家; 北美洲教育大數(shù)據(jù)相關(guān)文獻(xiàn)主要分布在美國東部地區(qū); 亞洲教育大數(shù)據(jù)相關(guān)研究主要以日本、韓國兩地為中心。由此可見,教育大數(shù)據(jù)發(fā)展水平與所在國家或地區(qū)經(jīng)濟(jì)發(fā)展水平、綜合國力等密切相關(guān)。
圖2 歐洲研究分布
圖3 北美洲研究分布
圖4 亞洲研究分布
本文統(tǒng)計(jì)了國外教育大數(shù)據(jù)相關(guān)文獻(xiàn)涉及的研究領(lǐng)域,表1 是文獻(xiàn)數(shù)量排名前8 的研究領(lǐng)域。由表1 數(shù)據(jù)可知,國外教育大數(shù)據(jù)相關(guān)文獻(xiàn)研究方向主要集中在計(jì)算機(jī)科學(xué)與教育研究兩大領(lǐng)域,除此之外,工程、社會(huì)、心理、通信、科學(xué)技術(shù)等相關(guān)領(lǐng)域也有涉及。由此可見,教育大數(shù)據(jù)是綜合性較強(qiáng)的領(lǐng)域,需要融合多個(gè)相關(guān)學(xué)科領(lǐng)域開展跨學(xué)科研究。
表1 研究方向文獻(xiàn)數(shù)量及比例
本文將文獻(xiàn)信息導(dǎo)入CiteSpace,將時(shí)間跨度設(shè)為“2000-2018”,time slice 設(shè)為1,node type 選擇Keyword,topN =10。最終得到了節(jié)點(diǎn)數(shù)為112,連線數(shù)為183,密度為0.029 4的研究關(guān)鍵詞分析圖譜(見圖5) 。由圖5 可知,教育大數(shù)據(jù)研究熱點(diǎn)主要集中在“大數(shù)據(jù)”、“教育”、“云計(jì)算”、“學(xué)習(xí)分析”、“高等教育”、“數(shù)據(jù)挖掘”、“分布式計(jì)算”及“行為”等方面,且關(guān)鍵詞聯(lián)系緊密、分布集中,一些邊緣化關(guān)鍵詞出現(xiàn)次數(shù)相對(duì)較少且與核心概念關(guān)聯(lián)度較低。這表明國外教育大數(shù)據(jù)相關(guān)研究熱點(diǎn)較為集中,對(duì)“云計(jì)算”、“學(xué)習(xí)分析”、“數(shù)據(jù)挖掘”等教育大數(shù)據(jù)核心領(lǐng)域研究較為豐富,但缺乏對(duì)教育大數(shù)據(jù)新興方向的深入探索。
圖1 國外教育大數(shù)據(jù)關(guān)鍵詞知識(shí)圖譜
教育大數(shù)據(jù)理論研究主要包括教育大數(shù)據(jù)概念與內(nèi)涵、應(yīng)用價(jià)值與前景、未來挑戰(zhàn)等。國外關(guān)于大數(shù)據(jù)的概念與構(gòu)成并未達(dá)成一致,總體趨向于按數(shù)據(jù)量大小定義大數(shù)據(jù)。Daniel 等于2013 年提出了教育大數(shù)據(jù)構(gòu)成的理論框架,該框架將大數(shù)據(jù)分為機(jī)構(gòu)分析、信息技術(shù)分析、成績分析以及學(xué)習(xí)分析。美國獨(dú)立研究機(jī)構(gòu)Brookings Institution[5]認(rèn)為大數(shù)據(jù)預(yù)測與決策功能可在教育教學(xué)中得到良好應(yīng)用。Aleksandra[6]等提出了教育領(lǐng)域中數(shù)據(jù)科學(xué)以及大數(shù)據(jù)與學(xué)習(xí)分析的總結(jié)性意義,認(rèn)為可通過大數(shù)據(jù)技術(shù)構(gòu)建高質(zhì)量、多功能教育平臺(tái)。AZ Bhat[7]等探索了在教育機(jī)構(gòu)中大數(shù)據(jù)利用的各種可能性及其影響。一些學(xué)者從不同角度闡述了教育大數(shù)據(jù)未來所面對(duì)的挑戰(zhàn),包括研究人員與大數(shù)據(jù)分析從業(yè)者的培養(yǎng)與發(fā)展[8]、數(shù)據(jù)安全與隱私問題[9]、資金投入問題[10]等。
(1) 數(shù)據(jù)采集技術(shù)。如Edu-graph 從學(xué)習(xí)內(nèi)容、學(xué)習(xí)活動(dòng)、操作行為及學(xué)習(xí)者或教師參與數(shù)據(jù)等方面采集教育數(shù)據(jù)[12]。在數(shù)據(jù)采集方式上,一般通過在線學(xué)習(xí)環(huán)境自動(dòng)采集、攝像頭等檢測設(shè)備獲取、問卷等測量工具收集等形式
(2) 數(shù)據(jù)存儲(chǔ)技術(shù)。數(shù)據(jù)存儲(chǔ)一般運(yùn)用關(guān)系型數(shù)據(jù)庫與非關(guān)系型數(shù)據(jù)庫[13]。隨著數(shù)據(jù)類型與數(shù)據(jù)量變化,數(shù)據(jù)存儲(chǔ)也出現(xiàn)多種技術(shù),如Hadoop 技術(shù)、云存儲(chǔ)技術(shù)等。但采用Hadoop 存在安全管理與數(shù)據(jù)分析等問題,有學(xué)者使用包括內(nèi)容中心網(wǎng)絡(luò)(CCN) 與軟件定義網(wǎng)絡(luò)(SDN) 在內(nèi)的未來互聯(lián)網(wǎng)模型,對(duì)研究與教育網(wǎng)絡(luò)(REN) 上的大數(shù)據(jù)架構(gòu)(Hadoop) 進(jìn)行了改進(jìn),旨在提供高性能與可擴(kuò)展的大數(shù)據(jù)分析技術(shù)[14]。此外,數(shù)據(jù)倉庫也是教育大數(shù)據(jù)存儲(chǔ)解決方案之一[15-16]。
(3) 數(shù)據(jù)挖掘技術(shù)。數(shù)據(jù)挖掘是對(duì)大數(shù)據(jù)實(shí)現(xiàn)關(guān)聯(lián)化探索的過程,通過對(duì)教育大數(shù)據(jù)挖掘相關(guān)的算法、挖掘工具進(jìn)行梳理如圖6 所示。
(4) 數(shù)據(jù)可視化技術(shù)。數(shù)據(jù)可視化是從數(shù)據(jù)中挖掘相關(guān)信息,將其轉(zhuǎn)為清晰、直接、有效的圖形可視化模式,目前多采用動(dòng)態(tài)數(shù)據(jù)可視化分析工具。
圖6 教育大數(shù)據(jù)挖掘技術(shù)算法及工具
(1) 應(yīng)用大數(shù)據(jù)技術(shù)對(duì)教育數(shù)據(jù)進(jìn)行分析與預(yù)測,能夠幫助教師實(shí)時(shí)診斷教學(xué)過程,不斷改進(jìn)教學(xué)模式與策略,促進(jìn)新型教學(xué)模式的產(chǎn)生。
(2) 應(yīng)用大數(shù)據(jù)技術(shù)開發(fā)自適應(yīng)學(xué)習(xí)系統(tǒng),實(shí)時(shí)記錄學(xué)習(xí)者學(xué)習(xí)行為與路徑,為其提供個(gè)性化學(xué)習(xí)資源、活動(dòng)、路徑、工具與服務(wù)等,實(shí)現(xiàn)個(gè)性化學(xué)習(xí)。
(3) 應(yīng)用教育大數(shù)據(jù)改變了傳統(tǒng)的基于經(jīng)驗(yàn)的單一評(píng)價(jià),使其走向基于數(shù)據(jù)的綜合評(píng)價(jià)。
(4) 應(yīng)用教育大數(shù)據(jù)技術(shù)采集與分析教育管理過程中教學(xué)活動(dòng)、人員、學(xué)校等信息,及時(shí)發(fā)現(xiàn)教育系統(tǒng)中存在問題,為學(xué)校教育管理與決策工作提供科學(xué)數(shù)據(jù)支撐。
通過上述分析可對(duì)國際教育大數(shù)據(jù)形成如下判斷: ①相關(guān)研究發(fā)展迅速;②研究地區(qū)集中于發(fā)達(dá)國家;③跨學(xué)科融合研究; ④研究內(nèi)容覆蓋面廣,涵蓋了理論、技術(shù)以及應(yīng)用等多個(gè)方面。國際教育大數(shù)據(jù)發(fā)展對(duì)我國啟示主要有:①相關(guān)部門應(yīng)提高對(duì)教育大數(shù)據(jù)的重視程度,并加強(qiáng)對(duì)大數(shù)據(jù)發(fā)展的整體規(guī)劃; ②加大教育大數(shù)據(jù)資金、人才投入,提供基本性條件保障; ③鼓勵(lì)跨學(xué)科、跨領(lǐng)域合作,營造開放、融合的教育大數(shù)據(jù)發(fā)展氛圍;④加快對(duì)教育大數(shù)據(jù)多方面的深入研究。