萬 欣,黎 嬋,宋如思,夏火松
(武漢紡織大學(xué) 管理學(xué)院,湖北 武漢 430200)
關(guān)于教育大數(shù)據(jù)的含義,目前為止,國際上尚未確切、公認(rèn)的提法。為了進(jìn)一步理解教育大數(shù)據(jù)的概念,筆者從教育大數(shù)據(jù)的組成與特征兩個方面進(jìn)行剖析。
從教育大數(shù)據(jù)的組成來看,其中最重要的成分是由教育實踐活動產(chǎn)生的。既包括學(xué)生線下的學(xué)習(xí)過程及行為數(shù)據(jù)、作業(yè)練習(xí)和考試成績數(shù)據(jù)等個體數(shù)據(jù),也包括E-Learning和移動學(xué)習(xí)等學(xué)習(xí)形式的過程數(shù)據(jù)、設(shè)備狀態(tài)數(shù)據(jù)、運(yùn)維日志與用戶日志數(shù)據(jù)、教育網(wǎng)絡(luò)輿情數(shù)據(jù)等設(shè)備數(shù)據(jù)。通過整合分析多種形式的教育大數(shù)據(jù),挖掘其規(guī)律及發(fā)展趨勢。[1]
從教育大數(shù)據(jù)的特征看,教育大數(shù)據(jù)在繼承了大數(shù)據(jù)特點(diǎn)的基礎(chǔ)上有所發(fā)展。其數(shù)據(jù)來源大多來自錄音錄像等非結(jié)構(gòu)化數(shù)據(jù),這決定了技術(shù)上有一定的要求。由此可見,教育大數(shù)據(jù)的顯著特征在于它的高復(fù)雜性。[2]
教育大數(shù)據(jù)的組成與特征決定了其需要借助數(shù)據(jù)可視化技術(shù)來摸索數(shù)據(jù)背后隱藏的規(guī)律。到目前為止,數(shù)據(jù)可視化所涵蓋的技術(shù)方法和內(nèi)容在不斷豐富當(dāng)中。對其概念加以寬泛定義,數(shù)據(jù)可視化可視為將大量數(shù)據(jù)以數(shù)據(jù)集的形式借助圖像化的高級技術(shù)挖掘未知信息的方法。
經(jīng)過“科學(xué)可視化—信息可視化—數(shù)據(jù)可視化”的演變過程,數(shù)據(jù)可視化趨向成熟。文本可視化、網(wǎng)絡(luò)(圖)可視化、時空數(shù)據(jù)可視化以及多維數(shù)據(jù)可視化是數(shù)據(jù)可視化最主要的幾種方法。基于這些基本的可視化方法,使經(jīng)過有效整合的海量數(shù)據(jù)能直觀地反映其隱含的內(nèi)在規(guī)律,促使人類更高質(zhì)量地生活與工作。
在中國知網(wǎng)(CNKI)期刊數(shù)據(jù)庫中,以“教育&大數(shù)據(jù)”、“教學(xué)&大數(shù)據(jù)”、“高校&大數(shù)據(jù)”為主題詞,限定期刊來源類別為SCI來源期刊、核心期刊和CSSCI,同時勾選“中英文擴(kuò)展檢索”進(jìn)行高級檢索后得到2012-2016 年期間共 1252 條相關(guān)文獻(xiàn)數(shù)據(jù)(Title、Author、Organ、Source、Keyword、Summary、PubTime、Fund),通過手工剔除CNKI檢索的結(jié)果中重復(fù)文章、訪談、新聞、會議通知等非學(xué)術(shù)文章后,以ENDNOTE、RefWorks、自定義三種格式導(dǎo)出文獻(xiàn)數(shù)據(jù),最終得到2012-2016年的文獻(xiàn)數(shù)量分別為 1、50、174、347、494,總計 1066 條有效數(shù)據(jù)。
數(shù)據(jù)分析過程主要分為三個方面。首先,資源文獻(xiàn)計量分析。自定義格式文獻(xiàn)數(shù)據(jù)利用Excel數(shù)據(jù)統(tǒng)計分析工具,對教育大數(shù)據(jù)領(lǐng)域資源文獻(xiàn)進(jìn)行計量分析,包括科學(xué)研究產(chǎn)出趨勢分析、載文期刊分布與產(chǎn)出趨勢分析以及基金論文數(shù)量與地區(qū)分布情況分析。其次,共詞聚類分析。將ENDNOTE格式文獻(xiàn)導(dǎo)入SATI中,轉(zhuǎn)換成XML格式后抽取關(guān)鍵詞,進(jìn)行詞頻統(tǒng)計,生成關(guān)鍵詞共現(xiàn)矩陣。再導(dǎo)入Ucinet,生成.##h格式數(shù)據(jù)。進(jìn)行高頻關(guān)鍵詞的中心度分析后,利用NetDraw對結(jié)果進(jìn)行可視化,得到社會網(wǎng)絡(luò)圖譜。利用Ucinet層次聚類和SPSS 19.0多維尺度分析,得到聚類樹圖以及多維尺度圖譜,以此來進(jìn)行高等教育大數(shù)據(jù)的熱點(diǎn)研究。最后,知識圖譜分析,通過文獻(xiàn)分析可視化軟件Citespace將Ref-Works格式數(shù)據(jù)進(jìn)行轉(zhuǎn)換后,得到關(guān)鍵詞的時序圖與突變詞、科研機(jī)構(gòu)的合作圖譜等,揭示大數(shù)據(jù)在高校教育領(lǐng)域的熱點(diǎn)遷移及發(fā)展趨勢并做進(jìn)一步的預(yù)測分析。
為探究教育大數(shù)據(jù)文獻(xiàn)的產(chǎn)出趨勢,筆者以2012-2016年期間發(fā)表的相關(guān)文獻(xiàn)為數(shù)據(jù)來源,探索教育大數(shù)據(jù)的科學(xué)研究產(chǎn)出趨勢。自2012年以來,對大數(shù)據(jù)在高校教育領(lǐng)域的研究期刊與論文產(chǎn)出均顯著上升。從論文數(shù)量來看,2012年僅1篇,之后逐年增長,2013年增長至51篇,2014年增長速度加快,2015年增幅達(dá)到頂峰,2016年數(shù)量高達(dá)497篇,占據(jù)2012-2016年總論文數(shù)量的46.62%。[3]相關(guān)的研究期刊與論文數(shù)量呈現(xiàn)的態(tài)勢基本一致。由此可見,大數(shù)據(jù)在高校教育領(lǐng)域的研究始于2013年,2014年開始大規(guī)模涌現(xiàn),并呈現(xiàn)持續(xù)快速發(fā)展趨勢。
筆者選取樣本數(shù)據(jù)中權(quán)重值較大的七個期刊,進(jìn)行分析處理。處理結(jié)果表明,在2012-2016年期間,總發(fā)文數(shù)量排在榜首的期刊為《中國電化教育》,高達(dá)49篇;其次是《現(xiàn)代教育技術(shù)》和《中國成人教育》,數(shù)量均為40篇。同時,Top7期刊所載文獻(xiàn)數(shù)量占據(jù)文獻(xiàn)總數(shù)的25.89%,基于二八定律,表明多數(shù)載文期刊發(fā)表高等教育大數(shù)據(jù)相關(guān)文章數(shù)量逐年增長,《中國成人教育》于2016年就高達(dá)31篇文章之多,可見相比其他研究課題,大數(shù)據(jù)在高等教育領(lǐng)域的研究已呈現(xiàn)出壓倒性優(yōu)勢。即使該方面的相關(guān)論文已處于高產(chǎn)階段,但隨著大數(shù)據(jù)時代的推動,高校教育大數(shù)據(jù)的研究在深度和廣度方面都具備進(jìn)一步的發(fā)展空間。
在海量學(xué)術(shù)研究論文中,基金論文舉足輕重,它往往揭示著當(dāng)前研究領(lǐng)域的重大突破或是新興研究熱點(diǎn)和前沿方向。基金論文數(shù)量的多少,可以從側(cè)面反映出一個學(xué)科的學(xué)術(shù)水平和科研力量以及其研究課題受到政府各部門與社會各界的關(guān)注與支持度。[4]
本文將基金類別分為國家級、教育部、省市級、院校級、其他5種,統(tǒng)計出每年不同級別的基金論文數(shù)量,以及基金支持的組織機(jī)構(gòu)所在省市分布,其中地區(qū)分布共有32個,這里只選取了前10個基金論文數(shù)量多的省市,在總數(shù)中占比74.34%。
從橫向的角度看,很容易直觀地看出2012、2013兩年大數(shù)據(jù)在教育領(lǐng)域的應(yīng)用處于剛剛萌芽時期,國家、社會對新生事物認(rèn)知能力與扶持程度不強(qiáng)。2014、2015是大數(shù)據(jù)迅猛突起與發(fā)展的兩年,可以看到不光是國家、教育部,連各個省市、院校、其他社會組織機(jī)構(gòu),對其扶持力度也都陡然增加。在2016年至今,應(yīng)該可以說是大數(shù)據(jù)發(fā)展進(jìn)入全盛時期,特別是國家等級的基金論文數(shù)量增幅最大,反映出在以網(wǎng)絡(luò)強(qiáng)國托起中國夢的時代背景下,國家對大數(shù)據(jù)技術(shù)在教育領(lǐng)域中掀起的改革浪潮是看好與肯定的。從縱向看,5類基金論文,雖然省市級別是占到最多的,但其每年增幅的多少受國家級基金論文數(shù)量變化的影響,這表明學(xué)科領(lǐng)域的研究方向一定程度受到國家宏觀的調(diào)控,下級省市積極響應(yīng)。
從地區(qū)的分布情況看,基金論文數(shù)量存在著地域差異性。在選取的樣本中,75.13%的論文基金由江蘇、廣東、北京、上海、重慶五個省市提供,其中江蘇省占據(jù)到了23.86%。廣東、北京旗鼓相當(dāng),上海、重慶勢均力敵,這與其經(jīng)濟(jì)發(fā)展有一定關(guān)系。
一篇論文的研究方向與精髓之處大部分可由關(guān)鍵詞反映,因此在大量文獻(xiàn)中統(tǒng)計出關(guān)鍵詞的頻次,就能觀察到這個研究領(lǐng)域的熱點(diǎn)。于是本文選擇了文獻(xiàn)題錄信息統(tǒng)計分析軟件(SATI 3.2),對知網(wǎng)得到的ENDNOTE格式的文獻(xiàn)數(shù)據(jù)進(jìn)行分析。[5]先將表述不同但含義相近的關(guān)鍵詞進(jìn)行統(tǒng)一(如高校思想政治教育、思想政治教育、思想政治理論課、統(tǒng)一為思想政治教育),再進(jìn)行關(guān)鍵詞的詞頻統(tǒng)計,共得到184個關(guān)鍵詞。[6]提取其中詞頻不低于13的關(guān)鍵詞為高頻詞,得到結(jié)果如表1所示。
表1 前28位高頻詞
本文所使用的SATI分析軟件,已采用了Equivalence系數(shù)消除了多值共現(xiàn)矩陣中由于關(guān)鍵詞頻次的懸殊而對統(tǒng)計結(jié)果造成的影響。因此只需使用軟件自帶的Co-Occurrence Matrix(Similarity)方法,設(shè)置行/列的值為 28,即可自動產(chǎn)生高頻詞的共詞相似矩陣,如表2所示。矩陣中的數(shù)值均屬于 [0,1],代表著關(guān)鍵詞之間的共現(xiàn)關(guān)系,數(shù)值越大則二者更有可能出現(xiàn)在同一篇文獻(xiàn)中。
通過Ucinet(社會網(wǎng)絡(luò)分析軟件)對表2的相似矩陣進(jìn)行網(wǎng)絡(luò)中心性分析,再使用NetDraw工具進(jìn)行結(jié)果的可視化,得到圖1。圖中正方形表示高頻詞的節(jié)點(diǎn),正方形越大意味著節(jié)點(diǎn)度中心性越高;節(jié)點(diǎn)的顏色不同表示點(diǎn)接近中心性的高低,值越小,說明此節(jié)點(diǎn)距離其他節(jié)點(diǎn)的最短路平均距離越小,其中心度也越高。一般情況下,多篇文獻(xiàn)同時存在一個相同的關(guān)鍵詞,則此關(guān)鍵詞接近中心度一般比較高。
如圖1所示,可粗略觀察到,大數(shù)據(jù)在教育領(lǐng)域的研究熱點(diǎn)除開大數(shù)據(jù)本身外,突出的還有高校圖書館、數(shù)據(jù)挖掘、思想政治教育、創(chuàng)新、MOOC、學(xué)習(xí)分析等。其中與大數(shù)據(jù)相連距離最短的是數(shù)據(jù)挖掘,說明數(shù)據(jù)挖掘在大數(shù)據(jù)的應(yīng)用中非常核心。從邊緣看,互聯(lián)網(wǎng)思維與其他關(guān)鍵詞聯(lián)系最少,說明此關(guān)鍵詞并不是當(dāng)下有代表性的研究點(diǎn)或研究得還不夠深入。
圖1 高頻詞社會網(wǎng)絡(luò)圖譜
使用Ucinet軟件,對高頻詞進(jìn)行凝聚的層次聚類分析,得到圖2。
多維尺度分析實質(zhì)上就是一個降維但又不改變對象間最初關(guān)系的分析方法。通過不同關(guān)鍵詞在二維平面之間的距離發(fā)現(xiàn)研究主題的結(jié)構(gòu)。由于關(guān)鍵詞的相似矩陣存在太多的0,對多維尺度分析的擬合效果造成一定的影響,于是改用關(guān)鍵詞的相異矩陣,通過SPSS 19.0進(jìn)行多維尺度分析,得到圖3。
將聚類樹圖(圖2)與多維尺度圖譜(圖3)進(jìn)行對照,發(fā)現(xiàn)除了少數(shù)幾個關(guān)鍵詞之外,其余聚集程度基本一致,于是筆者可將大數(shù)據(jù)在教育領(lǐng)域應(yīng)用的研究熱點(diǎn)主題大致歸納為以下四種:
圖2 高頻關(guān)鍵詞聚類樹狀圖
圖3 高頻關(guān)鍵詞多維尺度圖譜
第一,大數(shù)據(jù)時代下高校圖書館建設(shè)的研究。包含高校圖書館、云計算、信息素養(yǎng)、數(shù)據(jù)素養(yǎng)、智慧教育5個高頻關(guān)鍵詞。圖書館作為高校最大的數(shù)據(jù)資源庫,大數(shù)據(jù)加云計算對其作用也更為顯著。通過讀者平時閱讀記錄,分析其興趣偏好,為其提供個性化閱讀服務(wù);管理人員通過數(shù)據(jù)分析與管理,對圖書資源能更有效整合,提高工作效率。這就需要培養(yǎng)高校師生從上到下的信息素養(yǎng)與數(shù)據(jù)素養(yǎng),增強(qiáng)對數(shù)據(jù)與信息的敏感度與處理力,符合時代發(fā)展的需要。該主題旨在研究大數(shù)據(jù)對高校圖書館信息化建設(shè)的作用以及如何運(yùn)用大數(shù)據(jù)實現(xiàn)高校圖書館信息化的實施建議。
第二,大數(shù)據(jù)技術(shù)對教學(xué)模式變革影響的研究。包含MOOC、教學(xué)模式、翻轉(zhuǎn)課堂、教學(xué)改革、在線教育、大數(shù)據(jù)技術(shù)、信息技術(shù)、高等教育8個高頻關(guān)鍵詞。傳統(tǒng)教育模式是一種灌輸式、大眾化教學(xué),它忽視了學(xué)生個性化發(fā)展的需求。隨著互聯(lián)網(wǎng)與大數(shù)據(jù)的迅速發(fā)展,海量數(shù)據(jù)與信息資源能夠達(dá)到共享,于是研究者將目光聚焦在傳統(tǒng)教育模式變革上,一些諸如MOOC的在線教育平臺應(yīng)運(yùn)而生,使學(xué)生能依據(jù)自身興趣選擇學(xué)習(xí)重點(diǎn),達(dá)到個性化的學(xué)習(xí);而且使教師資源能夠充分利用,達(dá)到互通共享。課堂教學(xué)也由教師為主學(xué)生被動接受的模式,轉(zhuǎn)而出現(xiàn)了翻轉(zhuǎn)課堂,教師只是引導(dǎo),學(xué)生主宰課堂,更好地發(fā)揮學(xué)生的能動作用。該主題旨在研究如何充分利用大數(shù)據(jù)技術(shù),產(chǎn)生適應(yīng)人才發(fā)展的教育模式,在基本教學(xué)中學(xué)生與教師能達(dá)到友好的交互。
第三,大數(shù)據(jù)環(huán)境下人才培養(yǎng)的研究。包含學(xué)習(xí)分析、人才培養(yǎng)、數(shù)據(jù)挖掘、教育大數(shù)據(jù)、互聯(lián)網(wǎng)+、教育信息化6個高頻關(guān)鍵詞。大數(shù)據(jù)時代下,人才培養(yǎng)不再是一味地給予更多知識的灌溉,而是教師或?qū)W校當(dāng)局在學(xué)生學(xué)習(xí)過程中萃取學(xué)習(xí)信息,通過數(shù)據(jù)挖掘和分析對其學(xué)習(xí)歷程加以評估,進(jìn)而對其學(xué)習(xí)方法或環(huán)境加以優(yōu)化,從而達(dá)到有針對性和高效的學(xué)習(xí)。該主題旨在研究教育信息化對高校人才培養(yǎng)的啟示與作用,從而使教學(xué)成果有質(zhì)的提升。
第四,大數(shù)據(jù)在高校思想建設(shè)及日常工作中應(yīng)用的研究。包括大數(shù)據(jù)時代、創(chuàng)新、思想政治教育、大學(xué)生、高校、檔案管理、互聯(lián)網(wǎng)思維、數(shù)據(jù)分析8個高頻關(guān)鍵詞。創(chuàng)新意識培養(yǎng)與思想政治教育是每個大學(xué)都必不可少要開展的基礎(chǔ)思想建設(shè)。大數(shù)據(jù)逐漸成熟的背景下,基礎(chǔ)思想教育有了新的契機(jī),通過學(xué)生在學(xué)校學(xué)習(xí)生活產(chǎn)生的龐大數(shù)據(jù),總結(jié)大學(xué)生群體性特征,實現(xiàn)整體行為的一個預(yù)警。學(xué)生多元化發(fā)展,使個性化培養(yǎng)成為大勢所趨。檔案管理是每個高校日常最基本的工作。大數(shù)據(jù)時代下,檔案作為數(shù)據(jù)的一個載體,也具有大數(shù)據(jù)的海量信息,價值密度低、處理速度要求高的特點(diǎn),使其日常的維護(hù)與利用將面臨著更大的挑戰(zhàn)。該主題旨在研究在大數(shù)據(jù)普及之下,高校的基礎(chǔ)工作(思想建設(shè)、日常工作)如何改變其傳統(tǒng)方式,適應(yīng)現(xiàn)代信息化的需求。
可視化軟件CiteSpace中的Timezone view(時序圖)是從時間維度出發(fā)展示學(xué)科或領(lǐng)域的知識演變過程,在此筆者以關(guān)鍵詞為分析對象,探究我國高校教育大數(shù)據(jù)的發(fā)展趨勢。通過CiteSpace聚類關(guān)鍵詞得到關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)后,根據(jù)關(guān)鍵詞最初出現(xiàn)的時間,進(jìn)行Timezone view分析,得到關(guān)鍵詞的時序圖譜(見圖4),由此能直觀地反映出我國高校教育大數(shù)據(jù)的研究趨勢。結(jié)果表明我國高校教育大數(shù)據(jù)的發(fā)展大致可分為兩階段:第一階段是初期成形階段(2012-2013年),大數(shù)據(jù)開始應(yīng)用于學(xué)習(xí)分析、高校圖書館;第二階段是快速發(fā)展階段(2014-2016年),大數(shù)據(jù)主要涉及高校思想政治教育。[7]
圖4 我國高校教育大數(shù)據(jù)研究關(guān)鍵詞時序圖譜
雖然2013年開始大數(shù)據(jù)已應(yīng)用于高校教育領(lǐng)域,但2014年開始才在研究的深度上有所擴(kuò)展。由于大數(shù)據(jù)的快速滲透與發(fā)展,高校教育大數(shù)據(jù)由初期階段進(jìn)入快速發(fā)展階段成為必然結(jié)果。研究表明,初期成形階段注重大數(shù)據(jù)在高校教育理論方面的應(yīng)用,而快速發(fā)展階段則側(cè)重將大數(shù)據(jù)應(yīng)用于高校教育的實踐方面,從而體現(xiàn)了我國高校教育大數(shù)據(jù)研究從理論到實踐的發(fā)展趨勢。
Bursts(突變詞)是具有短期內(nèi)很大變化特征的變量值,該突變信息可用來反映更深層變化,由此探究領(lǐng)域的前沿與趨勢,如圖5所示。[8]結(jié)果表明,“科學(xué)數(shù)據(jù)”、“數(shù)據(jù)”、“學(xué)習(xí)分析”、“教育數(shù)據(jù)挖掘”和“云計算”均為 2012-2013年期間的突變詞,其中學(xué)習(xí)分析的突變指數(shù)為3.5109,明顯大于其他突變詞,說明學(xué)習(xí)分析是未來最可能發(fā)展的一個新興前沿方向。2014-2016年期間,只出現(xiàn)“翻轉(zhuǎn)課堂”這一個突變詞,說明這一時期因為快速發(fā)展,新的研究方向還未成形,仍舊是研究初期階段的主題。大多數(shù)突變關(guān)鍵詞均出現(xiàn)在2013年以前,即初期成形階段,說明初期階段的關(guān)鍵詞在領(lǐng)域研究過渡的過程中起著關(guān)鍵性的作用。同時,學(xué)習(xí)分析的突變指數(shù)最為突出,并且最早出現(xiàn)在2012年,說明學(xué)習(xí)分析是最早將大數(shù)據(jù)應(yīng)用于高校教育領(lǐng)域的主題之一。
圖5 高校教育大數(shù)據(jù)關(guān)鍵詞突現(xiàn)率(跨年度:1年)
一個領(lǐng)域的科研核心競爭力在于不同科研機(jī)構(gòu)是否能發(fā)揮其各自的最大優(yōu)勢,懂得適當(dāng)合作,人才互通,方能達(dá)到雙贏之效。對高校教育大數(shù)據(jù)的研究,從初期至今也有不少科研機(jī)構(gòu)涌現(xiàn)。為了發(fā)掘不同時期主要科研機(jī)構(gòu)的變遷與它們之間的合作情況,本文以機(jī)構(gòu)(institution)為節(jié)點(diǎn)類型進(jìn)行聚類,得到科研機(jī)構(gòu)的分布及之間合作的關(guān)系,再進(jìn)行Timezone view分析,最終得到高校教育大數(shù)據(jù)研究的機(jī)構(gòu)合作圖譜(見圖6)與時序圖譜(見圖 7)。
圖6 高校教育大數(shù)據(jù)研究機(jī)構(gòu)的合作圖譜
圖7 高校教育大數(shù)據(jù)研究機(jī)構(gòu)的時序圖譜
在圖6中,節(jié)點(diǎn)大小表示論文產(chǎn)出數(shù)量多少,節(jié)點(diǎn)之間的連線用來表示機(jī)構(gòu)之間的合作,標(biāo)簽字號大小表示中心性程度高低,字號越大中心性越強(qiáng)。[9]機(jī)構(gòu)合作圖譜中節(jié)點(diǎn)101個,連線 20條,網(wǎng)絡(luò)整體密度顯示為0.004,說明我國教育大數(shù)據(jù)研究機(jī)構(gòu)分布零散,不同機(jī)構(gòu)之間學(xué)術(shù)研究合作較少,尚未形成具有凝聚力的科研群體。從圖7中可發(fā)現(xiàn),這些機(jī)構(gòu)發(fā)表相關(guān)文章大多集中于2014-2016年,即快速發(fā)展階段。華東師范大學(xué)和江蘇師范大學(xué)在初期階段開始高校教育大數(shù)據(jù)的研究,東北師范大學(xué)和北京師范大學(xué)等于2014年成為第二批加入研究的機(jī)構(gòu),西南大學(xué)和武漢大學(xué)參與研究始于2015年。其中,高校教育大數(shù)據(jù)處于初期成形階段時,武漢大學(xué)雖然尚未發(fā)表相關(guān)文章,但在其成為熱點(diǎn)時,載文量驟增,迅速成為引領(lǐng)該領(lǐng)域的龍頭機(jī)構(gòu)。由此可見,我國對大數(shù)據(jù)在高校教育領(lǐng)域的研究,其發(fā)展態(tài)勢不是逐步向前,而是在興起后以爆發(fā)式狀態(tài)呈現(xiàn)。在2014-2016年多數(shù)高產(chǎn)機(jī)構(gòu)在這個時間段展開了教育大數(shù)據(jù)的相關(guān)研究。[7]
本文通過幾種不同分析工具對教育大數(shù)據(jù)領(lǐng)域相關(guān)文獻(xiàn)進(jìn)行了多層次多角度的分析,最終可以簡潔概括為以下幾點(diǎn)結(jié)論:
第一,我國高校教育大數(shù)據(jù)領(lǐng)域資源文獻(xiàn)呈現(xiàn)逐年階梯式增長。從大數(shù)據(jù)萌芽到如今野蠻生長,其發(fā)展過程只用了短短5年。各類科研機(jī)構(gòu)、載文期刊紛紛緊隨時代步伐,從不同角度出發(fā)對大數(shù)據(jù)在高校教育領(lǐng)域的應(yīng)用展開研究,推動教育領(lǐng)域的全面革新。國家、教育部、省市、院校以及其他社會組織機(jī)構(gòu)也不斷加大對其扶持力度,教育大數(shù)據(jù)未來前景可觀。
第二,我國高校教育大數(shù)據(jù)的研究熱點(diǎn)主要集中在高校公共領(lǐng)域建設(shè)(如高校圖書館)、教學(xué)模式變革(如MOOC之類的在線教學(xué)、翻轉(zhuǎn)課堂之類的課堂模式)、人才培養(yǎng)過程(如學(xué)生的學(xué)習(xí)分析)、思想建設(shè)工作(如政治思想教育、創(chuàng)新思維培養(yǎng))以及日常工作處理(如檔案管理)這些方面。雖然研究涉及高校建設(shè)主體的各方面,但在未來的研究發(fā)展中,仍需更加深入與契合實際。
第三,我國高校教育大數(shù)據(jù)的研究趨勢主要分為兩個階段。初期成形時,主要研究大數(shù)據(jù)在學(xué)習(xí)分析與高校圖書館中的應(yīng)用;快速發(fā)展時,研究重心轉(zhuǎn)移至大數(shù)據(jù)在高校思想政治教育中的作用。整體表現(xiàn)為從關(guān)注高校硬件發(fā)展方面回歸到思想教育的軟件方面。另外,相較初期成形時,快速發(fā)展時期新的研究主題明顯偏少,說明這一時期文獻(xiàn)產(chǎn)出與研究成果只是量上面的猛增,并未上升到質(zhì)的飛躍。因此在未來的研究發(fā)展中,應(yīng)在其研究的廣度上加以擴(kuò)大,著眼新的方向,而不是舊的主題上的重復(fù)。
大數(shù)據(jù)掀起的變革浪潮,已席卷了社會的各個領(lǐng)域,高校教育已全面進(jìn)入大數(shù)據(jù)時代。雖然目前大數(shù)據(jù)在高校教育領(lǐng)域的研究,已然達(dá)到一定的高度,但未來發(fā)展趨勢仍不可小覷。在此,筆者通過以上分析,認(rèn)為教育大數(shù)據(jù)的未來有以下方面需要去關(guān)注與思考:
(1)數(shù)據(jù)采集
大數(shù)據(jù)技術(shù)和方法飛速發(fā)展的今天,全樣本性是當(dāng)前科學(xué)研究的一個顯著特點(diǎn),并且研究越來越關(guān)心效率、考慮因果關(guān)系以及相關(guān)的復(fù)雜性等。[10]教育大數(shù)據(jù)以海量的數(shù)據(jù)為依托,以便探索可靠有價值的規(guī)律。然而現(xiàn)今數(shù)據(jù)采集技術(shù)有限、覆蓋面狹窄等原因,使教育數(shù)據(jù)的采集不全面,大數(shù)據(jù)在教育領(lǐng)域多元化的擴(kuò)展與應(yīng)用受到了限制。隨著大數(shù)據(jù)的信息時代來臨,高校紛紛推出校園一卡通,包含了餐飲消費(fèi)、醫(yī)療就診、圖書借閱、選課記錄等數(shù)據(jù),但其涵蓋的數(shù)據(jù)有限,共享數(shù)據(jù)模式尚未形成,難以與學(xué)習(xí)者自身的體質(zhì)數(shù)據(jù)、生活數(shù)據(jù)等其他相關(guān)數(shù)據(jù)整合,形成數(shù)據(jù)鏈?zhǔn)椒治?。因此在今后的研究中,研究者更?yīng)該關(guān)注數(shù)據(jù)的來源采集而不是單純理論上的如何使用,這樣從源頭上提高數(shù)據(jù)的質(zhì)量,才能更好地挖掘其蘊(yùn)涵的價值。
(2)領(lǐng)域?qū)I(yè)性進(jìn)一步加強(qiáng)
對教育大數(shù)據(jù)的研究與分析需要建立在科學(xué)的數(shù)學(xué)模型基礎(chǔ)上進(jìn)行。然而,現(xiàn)今的構(gòu)建模型階段,顯得專業(yè)性不足。一方面,權(quán)威的專業(yè)人士的匱乏,難以將教育大數(shù)據(jù)的研究成果應(yīng)用于教育領(lǐng)域。另一方面,數(shù)據(jù)分析處理技術(shù)的不充分應(yīng)用,使大數(shù)據(jù)給教育領(lǐng)域帶來的機(jī)遇并沒有完全得到利用。教育大數(shù)據(jù),是統(tǒng)計與教育兩大領(lǐng)域的綜合,這種跨學(xué)科的研究就更需要不同領(lǐng)域不同科研組織人才互通、資源共享,而不是孤立地、停留在自己擅長的領(lǐng)域去做研究。教育大數(shù)據(jù)未來的發(fā)展無疑離不開學(xué)科、機(jī)構(gòu)之間的合作,只有這樣才能更具全面性、權(quán)威性。[2]
(3)隱私保護(hù)有待完善
教育大數(shù)據(jù)的主體包括教育者和受教育者,他們的隱私保護(hù)至關(guān)重要。應(yīng)當(dāng)在完善法律的前提下,明確規(guī)定公開數(shù)據(jù)與隱私數(shù)據(jù)的界限。今后的研究者應(yīng)當(dāng)在確保教育大數(shù)據(jù)來源的可靠性、數(shù)據(jù)的合法性等的前提下,再開展教育大數(shù)據(jù)的研究。[2]
綜上所述,教育大數(shù)據(jù)雖已進(jìn)入黃金時期,但其發(fā)展仍有待進(jìn)一步深化與鞏固。在今后的研究中,研究者應(yīng)從表面理論深入到技術(shù)實施層面,應(yīng)拓寬現(xiàn)有研究范圍,不斷挖掘新的研究方向,使大數(shù)據(jù)在教育領(lǐng)域能實現(xiàn)更深層次的影響與作用。
[1]邢蓓蓓,楊現(xiàn)民,李勤生.教育大數(shù)據(jù)的來源與采集技術(shù)[J].現(xiàn)代教育技術(shù),2016(8):14-21.
[2]孫洪濤,鄭勤華.教育大數(shù)據(jù)的核心技術(shù)、應(yīng)用現(xiàn)狀與發(fā)展趨勢[J].遠(yuǎn)程教育雜志,2016(5):41-49.
[3]陳善敏.我國圖書情報領(lǐng)域特色資源論文研究態(tài)勢——基于文獻(xiàn)計量和多元統(tǒng)計[J]情報科學(xué),2017(8):170-176.
[4]相東升.17種圖書情報學(xué)期刊基金資助論文統(tǒng)計分析[J].情報雜志,2006(1):143-144.
[5]劉啟元,葉鷹.文獻(xiàn)題錄信息挖掘技術(shù)方法及其軟件SATI的實現(xiàn)——以中外圖書情報學(xué)為例[J].信息資源管理學(xué)報,2012(1):50-58.
[6]崔曉鸞,趙可云.大數(shù)據(jù)在教育領(lǐng)域的研究熱點(diǎn)及發(fā)展趨勢——基于共詞分析的可視化研究[J].現(xiàn)代遠(yuǎn)距離教育,2016(4):79-85.
[7]王娟,陳世超,王林麗,楊現(xiàn)民.基于 CiteSpace的教育大數(shù)據(jù)研究熱點(diǎn)與趨勢分析 [J].現(xiàn)代教育技術(shù),2016(2):5-13.
[8]陳超美.CiteSpace中的 Burst Detection[EB/OL].http://blog.sciencenet.cn/blog-496649-566289.html.
[9]張子石,吳濤,金義富.基于 CiteSpace的網(wǎng)絡(luò)學(xué)習(xí)知識圖譜分析[J].中國電化教育,2015(8):77-84.
[10]宣小紅,薛莉,熊志剛等.教育學(xué)研究的熱點(diǎn)與重點(diǎn)——對2013年度人大復(fù)印報刊資料《教育學(xué)》轉(zhuǎn)載論文的分析與展望[J].教育研究,2015(2):29-42.