■鄭州市現(xiàn)代教育信息技術(shù)中心 曾 濤 王德廣 韓曉鵬
一個信息化、智能化的社會,其顯著特征就是基于信息化方式將生產(chǎn)、生活所產(chǎn)生的各種信息轉(zhuǎn)化為數(shù)據(jù)進(jìn)行存儲與應(yīng)用。大數(shù)據(jù)的應(yīng)用目前已經(jīng)在各行各業(yè)迅速普及。2015年8月,《國務(wù)院關(guān)于印發(fā)促進(jìn)大數(shù)據(jù)發(fā)展行動綱要的通知》明確指出數(shù)據(jù)已成為國家基礎(chǔ)性戰(zhàn)略資源,提出要建設(shè)教育文化大數(shù)據(jù)。2016年,教育部印發(fā)《教育信息化“十三五”規(guī)劃》;2018年,教育部出臺《教育信息化2.0行動計劃》,都對大數(shù)據(jù)的建設(shè)與應(yīng)用提出了具體要求,目標(biāo)也都指向要利用大數(shù)據(jù)推動教育治理能力的現(xiàn)代化。
教育大數(shù)據(jù)目前還沒有統(tǒng)一的定義,其內(nèi)涵特點由一些學(xué)者從自身研究出發(fā)進(jìn)行了初步總結(jié)。如教育大數(shù)據(jù)是信息技術(shù)支持下的教育教學(xué)活動中產(chǎn)生的各種數(shù)據(jù)的總和,包括通過數(shù)據(jù)分析、可視化等技術(shù)進(jìn)行價值挖掘的過程;教育大數(shù)據(jù)是服務(wù)教育主體和教育過程,具有強(qiáng)周期性和巨大教育價值的高復(fù)雜性數(shù)據(jù)集合;等等。總之,教育大數(shù)據(jù)是教育領(lǐng)域內(nèi)各項教育教學(xué)活動伴隨信息化應(yīng)用產(chǎn)生的數(shù)據(jù),具有容量大、多元化、結(jié)構(gòu)復(fù)雜、價值大等特點。
傳統(tǒng)教育決策往往依賴于經(jīng)驗、直覺,缺乏具體數(shù)據(jù)的支撐。在信息化時代,將大數(shù)據(jù)貫穿在教育決策的各個環(huán)節(jié),利用數(shù)據(jù)挖掘與數(shù)據(jù)分析技術(shù)構(gòu)建相關(guān)模型,探索各種教育變量之間的關(guān)系,為教育決策提供支持,已成為促進(jìn)教育事業(yè)科學(xué)發(fā)展的重要力量。
2021年出臺的《教育部關(guān)于加強(qiáng)新時代教育管理信息化工作的通知》要求,加強(qiáng)信息系統(tǒng)規(guī)范管理,按照“一數(shù)一源”的原則,根據(jù)實現(xiàn)處理目的最小范圍,規(guī)范數(shù)據(jù)收集使用范圍,優(yōu)先通過共享獲取數(shù)據(jù),避免重復(fù)采集。面對多樣、復(fù)雜的數(shù)據(jù),建立“統(tǒng)一標(biāo)準(zhǔn)、統(tǒng)一接口”的數(shù)據(jù)規(guī)范,形成共通、共享、共用的態(tài)勢,是教育大數(shù)據(jù)應(yīng)用的根基。其作用是將各業(yè)務(wù)數(shù)據(jù)進(jìn)行整合并形成統(tǒng)一的數(shù)據(jù)庫,完成數(shù)據(jù)的清洗、處理和存儲,打通教育部門橫向業(yè)務(wù)數(shù)據(jù)的融合渠道,消除信息鴻溝,破除“數(shù)據(jù)孤島”。
教育大數(shù)據(jù)的應(yīng)用離不開基礎(chǔ)環(huán)境的建設(shè)。要實現(xiàn)各應(yīng)用系統(tǒng)的有效集成和數(shù)據(jù)共享,為教育決策的科學(xué)制定提供可靠數(shù)據(jù)支撐,就需要建立以教育數(shù)據(jù)管理和利用為核心業(yè)務(wù)的教育大數(shù)據(jù)中心。大數(shù)據(jù)現(xiàn)已成為驅(qū)動教育變革與創(chuàng)新的強(qiáng)勁力量,而平臺建設(shè)是教育大數(shù)據(jù)落地的關(guān)鍵之所在,它覆蓋了從數(shù)據(jù)采集、存儲計算、分析挖掘到具體應(yīng)用的整個生命周期。教育大數(shù)據(jù)平臺的建設(shè)基本可分為大數(shù)據(jù)存儲、計算、管理等多個子系統(tǒng)。
1.數(shù)據(jù)存儲與計算
大數(shù)據(jù)之“大”,首先在于其容量大,有足夠的存儲空間和強(qiáng)大的計算能力,能夠?qū)⒉煌瑘鼍暗母鞣N計算任務(wù)統(tǒng)一在一個平臺上,進(jìn)行TB級(存儲數(shù)據(jù)量為1TB以上的數(shù)據(jù)庫,1TB相當(dāng)于萬億字節(jié))以上數(shù)據(jù)的分布式計算、并行計算,以此保障平臺運(yùn)行的穩(wěn)定。
2.數(shù)據(jù)管理
數(shù)據(jù)的有效管理是保障數(shù)據(jù)完整性、準(zhǔn)確性和安全性的必要措施,便于各系統(tǒng)間進(jìn)行數(shù)據(jù)處理。數(shù)據(jù)管理主要以數(shù)據(jù)交換與集成、數(shù)據(jù)建模和元數(shù)據(jù)管理三種方式進(jìn)行。其運(yùn)行機(jī)制為,通過元數(shù)據(jù)的采集,以及按照不同類型、不同結(jié)構(gòu)關(guān)系、不同模型細(xì)節(jié)自定義元模型庫結(jié)構(gòu),提供標(biāo)準(zhǔn)的數(shù)據(jù)采集接口及標(biāo)準(zhǔn)規(guī)范,將第三方系統(tǒng)與數(shù)據(jù)交換平臺解耦;通過配置生產(chǎn)指標(biāo)和指標(biāo)匯總表、管理維度表、基于業(yè)務(wù)過程的事實表,創(chuàng)建維度和事實模型等方式對數(shù)據(jù)進(jìn)行建模,用于教育基礎(chǔ)數(shù)據(jù)分析、教育主題數(shù)據(jù)分析、綜合數(shù)據(jù)分析、數(shù)據(jù)流轉(zhuǎn)可視化等應(yīng)用場景。
基于大數(shù)據(jù)的業(yè)務(wù)分析是核心部分,體現(xiàn)了大數(shù)據(jù)價值所在。其業(yè)務(wù)主要包含教育基礎(chǔ)數(shù)據(jù)分析、教育主題數(shù)據(jù)分析、綜合數(shù)據(jù)分析、智能數(shù)據(jù)駕駛艙、智能分析報表等。在此基礎(chǔ)上,人們按照不同的業(yè)務(wù)需求,規(guī)劃數(shù)據(jù)項目組合及處理流程,以達(dá)到精準(zhǔn)施策的目的。例如,在疫情防控期間,學(xué)校通過大數(shù)據(jù)中心對師生健康打卡數(shù)據(jù)進(jìn)行分析,生成師生風(fēng)險值,從而為疫情防控和科學(xué)決策提供數(shù)據(jù)支撐。
教育大數(shù)據(jù)既是一筆寶貴的教育資產(chǎn),又涉及廣大師生的隱私,應(yīng)用或保護(hù)不當(dāng)也會帶來嚴(yán)重的安全風(fēng)險。建設(shè)數(shù)據(jù)治理體系和安全保護(hù)機(jī)制是當(dāng)前應(yīng)對數(shù)據(jù)安全問題的必要措施。一是要建立制度體系,規(guī)范數(shù)據(jù)治理工作機(jī)制,確保數(shù)據(jù)在產(chǎn)生、處理、傳遞、應(yīng)用過程中的一致性、完整性和準(zhǔn)確性。建立涵蓋事前預(yù)防、事中監(jiān)測、事后評估改進(jìn)的全生命周期數(shù)據(jù)治理流程,保障數(shù)據(jù)治理的有效推進(jìn)。二是要建立數(shù)據(jù)安全體系,對數(shù)據(jù)實施全面保護(hù)。數(shù)據(jù)安全體系的建立主要從大數(shù)據(jù)服務(wù)平臺安全防護(hù)功能和數(shù)據(jù)生產(chǎn)運(yùn)維安全控制兩個方面進(jìn)行,通過數(shù)據(jù)變形、安全運(yùn)營等措施降低數(shù)據(jù)泄漏風(fēng)險。
教育大數(shù)據(jù)平臺體系化構(gòu)建是一項系統(tǒng)工程。我們要通過教育大數(shù)據(jù)標(biāo)準(zhǔn)規(guī)范和數(shù)據(jù)倉庫的基礎(chǔ)性建設(shè),大數(shù)據(jù)治理與管理、存儲與計算、分析與應(yīng)用的平臺化建設(shè),數(shù)據(jù)治理體系和安全保護(hù)機(jī)制的保障性建設(shè),逐步形成“立標(biāo)準(zhǔn)、定規(guī)范、建平臺、促應(yīng)用、保安全”“五位一體”的實踐模式,為實現(xiàn)教育大數(shù)據(jù)提升教育決策效率、變革管理流程提供經(jīng)驗范式,從而為教育管理從粗放走向精準(zhǔn)打下堅實的基礎(chǔ)。
在大數(shù)據(jù)時代,數(shù)據(jù)治理與應(yīng)用也是一個長期過程。如何提高教育大數(shù)據(jù)深層次價值,拓展數(shù)據(jù)來源渠道,加大數(shù)據(jù)挖掘、分析的廣度,優(yōu)化數(shù)據(jù)分析和決策模型,將是我們今后努力的方向。