王曉妮,韓建剛
(1.咸陽(yáng)師范學(xué)院 信息中心,陜西 咸陽(yáng) 712000;2.西北機(jī)電工程研究所 生產(chǎn)部電調(diào)室,陜西 咸陽(yáng) 712000)
隨著網(wǎng)絡(luò)通信和計(jì)算機(jī)信息技術(shù)的發(fā)展與應(yīng)用,人類(lèi)社會(huì)已經(jīng)進(jìn)入大數(shù)據(jù)時(shí)代。人們可以感知記錄種類(lèi)繁多和規(guī)模超大的網(wǎng)絡(luò)信息數(shù)據(jù),同時(shí)通過(guò)分析和處理這些海量數(shù)據(jù),能夠?qū)μN(yùn)含其內(nèi)的核心信息進(jìn)行深度挖掘,得到更多的價(jià)值信息。這些知識(shí)已被應(yīng)用于交通運(yùn)輸、銀行保險(xiǎn)、科技醫(yī)療等各個(gè)行業(yè),能夠很好地指導(dǎo)和促進(jìn)企事業(yè)的管理與發(fā)展。目前信息化技術(shù)的迅猛發(fā)展使教育信息化進(jìn)入一個(gè)新階段,隨著網(wǎng)絡(luò)學(xué)習(xí)和各種應(yīng)用系統(tǒng)的普及推廣,教育領(lǐng)域的關(guān)于教師和學(xué)生的各類(lèi)相關(guān)數(shù)據(jù)量增長(zhǎng)速度很快,這些教育大數(shù)據(jù)直接影響學(xué)校的日常管理、教學(xué)效果和師生的工作學(xué)習(xí)生活。智慧校園使大數(shù)據(jù)、云計(jì)算、物聯(lián)網(wǎng)和數(shù)據(jù)挖掘等網(wǎng)絡(luò)技術(shù)與學(xué)校教育深度融合,特別是數(shù)據(jù)挖掘技術(shù)在教育領(lǐng)域的廣泛應(yīng)用,便于從海量教育大數(shù)據(jù)中獲取有利用價(jià)值的隱藏信息。通過(guò)分析研究這些來(lái)自于教師(科研能力、授課情況、個(gè)人信息等)和學(xué)生(基本資料、學(xué)習(xí)行為、課外活動(dòng)、消費(fèi)記錄和社交圈子等)各個(gè)方面的有用的知識(shí),將其合理應(yīng)用到教育教學(xué)的多個(gè)環(huán)節(jié),能夠支持領(lǐng)導(dǎo)決策、改善教育質(zhì)量、促進(jìn)教育公平、指導(dǎo)學(xué)校的日常管理和教學(xué)活動(dòng)等;同時(shí)也能夠彌補(bǔ)數(shù)據(jù)挖掘在教育大數(shù)據(jù)領(lǐng)域中的應(yīng)用研究這一空白。
大數(shù)據(jù)(Big data)又稱(chēng)巨量資料,指在一定時(shí)間范圍內(nèi)無(wú)法通過(guò)常規(guī)軟件工具進(jìn)行采集存儲(chǔ)和分析研究的數(shù)據(jù)集合[1],只有利用新的處理模式才能夠挖掘出其更強(qiáng)的決策力、流程優(yōu)化能力和洞察發(fā)現(xiàn)力的多樣化、高增長(zhǎng)率的海量信息資產(chǎn),能指導(dǎo)企事業(yè)單位管理決策。
教育大數(shù)據(jù)(Educational big data)是指根據(jù)教育研究的需要從整個(gè)教育教學(xué)活動(dòng)過(guò)程中采集而來(lái)的,能夠創(chuàng)造和發(fā)揮其潛在科學(xué)實(shí)用價(jià)值,以此來(lái)促進(jìn)教育事業(yè)的發(fā)展。它主要來(lái)自于政策制度、教學(xué)計(jì)劃、培養(yǎng)方案、學(xué)籍狀態(tài)等教學(xué)管理實(shí)踐;學(xué)習(xí)行為、課堂視頻、師生互動(dòng)等教學(xué)活動(dòng);參考資料、MOOC、教學(xué)課件、試題庫(kù)和Q&A教學(xué)資源;個(gè)人信息、成長(zhǎng)發(fā)展、工作或?qū)W習(xí)記錄等師生的各類(lèi)基礎(chǔ)信息資料[2]。
數(shù)據(jù)挖掘(Data mining)是從大量不規(guī)則和結(jié)構(gòu)復(fù)雜的數(shù)據(jù)中,獲取隱藏的有用信息或知識(shí)的過(guò)程[3]。它以數(shù)據(jù)為基礎(chǔ),通過(guò)各種挖掘算法獲取海量數(shù)據(jù)中所包含的有利用價(jià)值的知識(shí),故數(shù)據(jù)挖掘包括數(shù)據(jù)、算法和知識(shí)這3個(gè)基本要素。
目前我們所謂的關(guān)于學(xué)生的基本信息、課堂記錄、科研信息、課堂實(shí)踐這些數(shù)據(jù)只是教育大數(shù)據(jù)的冰山一角,還有大量與教學(xué)有關(guān)的大數(shù)據(jù)沒(méi)有被采集,例如學(xué)生的家庭狀況、課外活動(dòng)、學(xué)習(xí)行為、經(jīng)濟(jì)狀況、消費(fèi)習(xí)慣、社會(huì)關(guān)系、微信朋友圈、QQ好友、博客、論壇社交圈等數(shù)據(jù)同樣對(duì)我們判斷和研究學(xué)生的學(xué)習(xí)動(dòng)機(jī)和興趣愛(ài)好等作用很大。但是因?yàn)槲覀円郧暗臄?shù)據(jù)挖掘技術(shù)還不夠成熟,因此教育大數(shù)據(jù)已經(jīng)浮現(xiàn)出來(lái),而且利用目前的技術(shù)手段收集到的只是一部分,這就需要利用數(shù)據(jù)挖掘?qū)逃髷?shù)據(jù)進(jìn)一步地挖掘研究。例如哈佛大學(xué)從幼兒園就錄制和保存孩子成長(zhǎng)視頻,通過(guò)長(zhǎng)時(shí)間仔細(xì)觀察和研究孩子的表情和興趣點(diǎn),然后從中挖掘出孩子的興趣愛(ài)好、性格特點(diǎn)和將來(lái)可能從事的職業(yè)及研究方向。數(shù)據(jù)挖掘被合理應(yīng)用于教育大數(shù)據(jù)中,不僅能夠了解學(xué)習(xí)的課堂表現(xiàn)、學(xué)習(xí)興趣和生活習(xí)慣,還能夠深度管理老師的教學(xué)狀態(tài)和科研活動(dòng),這就讓教育管理部門(mén)能夠科學(xué)動(dòng)態(tài)評(píng)估教學(xué)質(zhì)量。改變了以往僅能利用分析學(xué)校資產(chǎn)、財(cái)務(wù)賬目、師生比例、圖書(shū)資料的冊(cè)書(shū)和人均查閱量等這些基礎(chǔ)報(bào)表來(lái)了解辦學(xué)狀態(tài),通過(guò)這類(lèi)缺乏實(shí)時(shí)性的靜態(tài)報(bào)表數(shù)據(jù)很難反映總體教學(xué)質(zhì)量,局限性很大。通過(guò)對(duì)教育大數(shù)據(jù)的分析挖掘,可以合理有效地配置教育資源,實(shí)時(shí)監(jiān)測(cè)教育網(wǎng)路輿情,合理科學(xué)的評(píng)價(jià)教育質(zhì)量,分析學(xué)生個(gè)性特點(diǎn)和興趣愛(ài)好因材施教,提供個(gè)性化的導(dǎo)學(xué)幫助和學(xué)習(xí)狀態(tài)的干預(yù)警告促進(jìn)社會(huì)公平,指導(dǎo)未來(lái)社會(huì)人才培養(yǎng)機(jī)制,能夠提升教學(xué)管理精細(xì)化和現(xiàn)代化。
教育數(shù)據(jù)的挖掘,對(duì)管理部門(mén)、教師、學(xué)生和技術(shù)研發(fā)人員具有重要的意義。學(xué)校的教學(xué)管理數(shù)據(jù)庫(kù)中記錄著所有教師和學(xué)生的工作學(xué)習(xí)、科研活動(dòng)、社會(huì)實(shí)踐、處罰獎(jiǎng)勵(lì)等相關(guān)情況,領(lǐng)導(dǎo)利用數(shù)據(jù)挖掘技術(shù)對(duì)教學(xué)資源和管理數(shù)據(jù)進(jìn)行深入的關(guān)聯(lián)分析,找出師生各種常見(jiàn)行為或活動(dòng)之間的內(nèi)在隱蔽聯(lián)系。并在管理中采取過(guò)程監(jiān)控、風(fēng)險(xiǎn)預(yù)警、分類(lèi)管理、趨勢(shì)預(yù)測(cè)等措施,改變了以前定性和模糊的分析和評(píng)價(jià)老師課堂教學(xué)質(zhì)量的不科學(xué)現(xiàn)象,能夠改善學(xué)校目前的考核管理方式,實(shí)現(xiàn)智能準(zhǔn)確、高效管理學(xué)校的各項(xiàng)工作,為教學(xué)應(yīng)用和學(xué)校發(fā)展提供有效科學(xué)的決策依據(jù)。
在通常情況下,在教師平時(shí)的教學(xué)過(guò)程中采用講授法、調(diào)查法、參觀法、實(shí)驗(yàn)法、實(shí)習(xí)法、分組討論法、計(jì)算機(jī)輔助教學(xué)法等多種教學(xué)方法來(lái)完成自己的教學(xué)任務(wù)。由此通過(guò)運(yùn)用關(guān)聯(lián)規(guī)則或回歸線(xiàn)性分析數(shù)據(jù)挖掘等方法來(lái)分析研究相關(guān)的教育大數(shù)據(jù),選擇有利于學(xué)生知識(shí)吸收和教學(xué)需要的最佳授課方式。又如采用數(shù)據(jù)挖掘技術(shù)通過(guò)智慧校園跨平臺(tái)了解學(xué)習(xí)其他老師的優(yōu)秀課程和教學(xué)方法,研究學(xué)生個(gè)性化學(xué)習(xí)工具、網(wǎng)絡(luò)學(xué)習(xí)過(guò)程、興趣愛(ài)好和學(xué)習(xí)行為,有利于掌握其學(xué)習(xí)規(guī)律和特點(diǎn),能夠?yàn)槠渫扑]合適的學(xué)習(xí)資源,優(yōu)化學(xué)習(xí)方法和改善開(kāi)展自我導(dǎo)向的適應(yīng)性學(xué)習(xí)和提高課堂教學(xué)質(zhì)量。它為教育教學(xué)活動(dòng)提供實(shí)時(shí)科學(xué)的信息數(shù)據(jù),有助于形成關(guān)于教育教學(xué)的智慧決策,提供客觀依據(jù)有利于教育教學(xué)活動(dòng)的有效實(shí)施,盡可能地實(shí)現(xiàn)和完善教育教學(xué)活動(dòng)的價(jià)值與功能。
通過(guò)挖掘教育大數(shù)據(jù),可以對(duì)學(xué)生的學(xué)習(xí)成績(jī)、興趣愛(ài)好、消費(fèi)軌跡、行為記錄及獎(jiǎng)勵(lì)處罰數(shù)據(jù)庫(kù)等相關(guān)信息進(jìn)行分析研究和處理,能夠快速獲取學(xué)生的鑒定結(jié)果,便于及時(shí)禁止和指正學(xué)生不良學(xué)習(xí)行為。這樣既能減輕教師的工作量,又能夠避免教師對(duì)學(xué)生先入為主的缺乏客觀和公正的主觀武斷性評(píng)價(jià)。利用教育大數(shù)據(jù)的挖掘結(jié)果來(lái)科學(xué)評(píng)定學(xué)生的學(xué)習(xí)行為,其優(yōu)點(diǎn)是合理地反饋學(xué)生信息、激發(fā)學(xué)生學(xué)習(xí)興趣、發(fā)現(xiàn)學(xué)生的個(gè)性需求和實(shí)現(xiàn)因材施教。根據(jù)學(xué)生的個(gè)人信息、學(xué)習(xí)成績(jī)、網(wǎng)上學(xué)習(xí)軌跡、性格特點(diǎn)、知識(shí)結(jié)構(gòu)等相關(guān)信息,挖掘出學(xué)生的基本特征,宏觀指導(dǎo)和微觀幫助學(xué)生不斷修正其學(xué)習(xí)行為。學(xué)生不再局限于本校的某位老師的課堂教學(xué),可以自主選擇全球范圍內(nèi)的相關(guān)課程的著名學(xué)者的優(yōu)秀課件,根據(jù)自己的時(shí)間和需求來(lái)自由學(xué)習(xí),這樣不但提高了學(xué)習(xí)效率,而且培養(yǎng)了學(xué)習(xí)興趣。有利于教師通過(guò)比較事先制定的學(xué)生行為標(biāo)準(zhǔn)和實(shí)際通過(guò)數(shù)據(jù)挖掘技術(shù)對(duì)學(xué)生個(gè)性特征的分析結(jié)果,可以指導(dǎo)學(xué)生完善人格、修正自己的學(xué)習(xí)行為和提高學(xué)習(xí)能力,有利于學(xué)生綜合素質(zhì)的全面發(fā)展。
在教育大數(shù)據(jù)中借助數(shù)據(jù)挖掘研發(fā)人員發(fā)現(xiàn)智慧校園中各應(yīng)用系統(tǒng)的使用頻率和相關(guān)內(nèi)容,然后根據(jù)師生需求優(yōu)化系統(tǒng)的操作方式和用戶(hù)界面,不斷完善系統(tǒng)以便提高服務(wù)質(zhì)量。挖掘結(jié)構(gòu)化和系統(tǒng)化的教育大數(shù)據(jù),將MOOC,游戲?qū)W習(xí)等新模式和云計(jì)算、虛擬技術(shù)、3D 打印、網(wǎng)絡(luò)計(jì)算、引擎開(kāi)發(fā)等新技術(shù)應(yīng)用于智慧校園建設(shè)中,對(duì)教學(xué)過(guò)程的實(shí)時(shí)監(jiān)控和分析研究來(lái)保障教學(xué)質(zhì)量。
教師的教學(xué)和學(xué)生的學(xué)習(xí)活動(dòng)能夠?qū)崿F(xiàn)的基礎(chǔ)就是教學(xué)資源,以前通過(guò)教師的自主研發(fā)和教育主管部門(mén)的配發(fā)來(lái)建設(shè)教學(xué)資源,而教師的自主研發(fā)極易出現(xiàn)資源技術(shù)含量低、可用性差和重復(fù)率高的弊端,政府配發(fā)的資源只能滿(mǎn)足大部分師生的需要,無(wú)法滿(mǎn)足個(gè)性化需求。挖掘教育大數(shù)據(jù)為教育資源的建設(shè)提供了新的思路,為教學(xué)資源庫(kù)的構(gòu)建提供技術(shù)支持,讓優(yōu)質(zhì)資源的判定有據(jù)可依。它使廣大師生能夠方便地使用和共享存儲(chǔ)在云端的教育資源數(shù)據(jù),還能對(duì)大量非結(jié)構(gòu)化的數(shù)據(jù)資源進(jìn)行分析,挖掘出隱藏的有用信息,享受滿(mǎn)足自身個(gè)性需求的數(shù)據(jù)資源,能夠避免教學(xué)資源的重復(fù)建設(shè)和優(yōu)質(zhì)資源的浪費(fèi)。
學(xué)生在校學(xué)習(xí)的過(guò)程中,課程合理安排的先后順序非常重要,因?yàn)榛A(chǔ)課程沒(méi)有學(xué)的話(huà),那么后繼課程的學(xué)習(xí)就無(wú)法進(jìn)行。即使是同一個(gè)年級(jí)的學(xué)生學(xué)習(xí)同一門(mén)課程,但由于授課老師、班級(jí)學(xué)習(xí)風(fēng)氣和自身的基礎(chǔ)等原因,導(dǎo)致最終的學(xué)習(xí)成績(jī)差別很大。通過(guò)數(shù)據(jù)挖掘的時(shí)間序列和關(guān)聯(lián)分析等方法,仔細(xì)分析存放學(xué)校教學(xué)數(shù)據(jù)庫(kù)中的往屆學(xué)生各個(gè)學(xué)科的試卷和考試成績(jī),挖掘出這些海量教育數(shù)據(jù)的有價(jià)值的信息并分析這些數(shù)據(jù)的回歸性和相關(guān)性性質(zhì),尋找其中的有用規(guī)律和影響學(xué)生學(xué)習(xí)成績(jī)的重要因素,以此合理安排新生的課程??荚囀墙虒W(xué)活動(dòng)的一個(gè)重要環(huán)節(jié),能夠檢驗(yàn)教學(xué)效果。雖然考試成績(jī)能夠反映教學(xué)效果,但無(wú)法說(shuō)明影響成績(jī)的具體因素和影響教學(xué)的直接原因,不能促進(jìn)教學(xué)發(fā)展。加之試題的質(zhì)量也能影響學(xué)生考試分?jǐn)?shù)的高低,探索有效評(píng)價(jià)試題覆蓋知識(shí)點(diǎn)全面度和難易度等質(zhì)量的方法非常重要。如果在試卷分析過(guò)程中采用數(shù)據(jù)挖掘的關(guān)聯(lián)規(guī)則,教師通過(guò)學(xué)生每道試題的實(shí)際得分情況便能分析出試題難易度、相關(guān)度和區(qū)分度等技術(shù)指標(biāo),就能較為合理地評(píng)價(jià)試題質(zhì)量,實(shí)事求是地檢查其的教學(xué)效果和學(xué)生對(duì)知識(shí)的掌握的具體情況,便能指導(dǎo)其今后的教學(xué)活動(dòng)。
隨著教育信息化的推廣應(yīng)用,使學(xué)校多年的教學(xué)管理活動(dòng)積累了大量的非結(jié)構(gòu)化數(shù)據(jù)。
為了合理有效地充分利用這些教育大數(shù)據(jù),本文通過(guò)數(shù)據(jù)挖掘技術(shù)對(duì)教育大數(shù)據(jù)進(jìn)行深度的分析研究,并將其應(yīng)用到了教學(xué)管理、教師授課、學(xué)生學(xué)習(xí)等教育教學(xué)的各個(gè)環(huán)節(jié),有利于優(yōu)化教學(xué)管理、提高教學(xué)質(zhì)量和推動(dòng)教學(xué)改革。但是此類(lèi)研究國(guó)內(nèi)還不成熟,需要研究者投入更多的精力,突破技術(shù)瓶頸和應(yīng)用限制。
無(wú)線(xiàn)互聯(lián)科技2018年18期