摘要:教育信息化建設(shè)日新月異,產(chǎn)生的數(shù)據(jù)愈發(fā)龐大復(fù)雜,由此催生出教育大數(shù)據(jù)管理與應(yīng)用方面的諸多問題,數(shù)據(jù)治理勢在必行。本文針對當(dāng)前教育大數(shù)據(jù)普遍存在的問題,提出教育大數(shù)據(jù)治理的參考框架,以期能夠?yàn)榻逃龜?shù)大據(jù)治理的研究者和實(shí)踐工作者提供參考。
關(guān)鍵詞:教育大數(shù)據(jù);數(shù)據(jù)治理;構(gòu)建框架
中圖分類號:TP309? 文獻(xiàn)標(biāo)識碼:A? 論文編號:1674-2117(2022)06-0000-03
● 引言
2021年9月,習(xí)近平總書記在世界互聯(lián)網(wǎng)大會烏鎮(zhèn)峰會的賀信中強(qiáng)調(diào)“增強(qiáng)數(shù)字政府效能,優(yōu)化數(shù)字社會環(huán)境,構(gòu)建數(shù)字合作格局,筑牢數(shù)字安全屏障”。教育部《教育信息化2.0行動計劃》“智慧教育創(chuàng)新發(fā)展行動”的推進(jìn),明確了數(shù)字資源服務(wù)普及行動要引領(lǐng)智慧校園資源的建設(shè)、應(yīng)用與共享。在充分運(yùn)用云計算、數(shù)據(jù)挖掘、人工智能等計算機(jī)技術(shù)的基礎(chǔ)上,校園信息化應(yīng)用更是趨向數(shù)據(jù)化、服務(wù)化、智慧化,全面助力提升教育信息化發(fā)展水平,真正實(shí)現(xiàn)“互聯(lián)網(wǎng)+信息技術(shù)”與教育創(chuàng)新發(fā)展的深度融合。教育信息化建設(shè)日新月異,產(chǎn)生的數(shù)據(jù)愈發(fā)龐大復(fù)雜,由此催生出教育大數(shù)據(jù)管理與應(yīng)用方面的諸多問題,因此數(shù)據(jù)治理勢在必行。
● 科學(xué)內(nèi)涵
何謂數(shù)據(jù)治理,國內(nèi)外的研究機(jī)構(gòu)或?qū)<覍W(xué)者說法不一。國際數(shù)據(jù)管理協(xié)會(DMA)提出,數(shù)據(jù)治理是通過梳理、控制和應(yīng)用數(shù)據(jù)以實(shí)現(xiàn)頂層設(shè)計目標(biāo)并提供決策支持,是數(shù)據(jù)管理中最重要的部分;國際標(biāo)準(zhǔn)化組織IT服務(wù)管理與IT治理分技術(shù)委員會認(rèn)為,數(shù)據(jù)治理是指建立在數(shù)據(jù)采集、存儲、交換和應(yīng)用之上的一系列程序、標(biāo)準(zhǔn)、評估等,確保數(shù)據(jù)能夠被高效有序利用,實(shí)現(xiàn)其最大商業(yè)價值。國內(nèi)對數(shù)據(jù)治理的概念也眾說紛紜,中國在2014年6月的ISO/IEC JTC1/SC40(IT治理和IT服務(wù)管理分技術(shù)委員會)第一次全會上首次提出“數(shù)據(jù)治理”的概念,引起國際同行很大興趣,在2015年5月召開的SC40/WG1(IT工作治理組)會議上提交了《數(shù)據(jù)治理白皮書》,這份標(biāo)準(zhǔn)研究報告認(rèn)為,數(shù)據(jù)治理是數(shù)據(jù)在產(chǎn)生使用價值的活動中,對其進(jìn)行清理、評估和控制的一系列過程。
● 治理目標(biāo)
數(shù)據(jù)治理的目標(biāo)是通過數(shù)據(jù)治理框架對教育大數(shù)據(jù)進(jìn)行清洗過濾,為教育應(yīng)用平臺應(yīng)用提供合規(guī)完整、準(zhǔn)確及時、正確唯一和風(fēng)險可控的大數(shù)據(jù),實(shí)現(xiàn)數(shù)據(jù)價值最大化。有效的大數(shù)據(jù)治理能夠?qū)崿F(xiàn)大數(shù)據(jù)與應(yīng)用的深入融合,提升服務(wù)效能,避免決策失誤,降低安全風(fēng)險。
● 構(gòu)建教育大數(shù)據(jù)治理框架
教育大數(shù)據(jù)治理要求數(shù)據(jù)應(yīng)用的各個層面都具備治理意識,并根據(jù)校園數(shù)據(jù)應(yīng)用的差異性逐漸形成個性化的數(shù)據(jù)治理氛圍和實(shí)踐。一般情況下,數(shù)據(jù)治理層框架主要包含數(shù)據(jù)標(biāo)準(zhǔn)化、數(shù)據(jù)管理、安全技術(shù)和治理保障四個方面(如下頁圖)。數(shù)據(jù)標(biāo)準(zhǔn)化是基礎(chǔ)部分,其他三個方面貫穿數(shù)據(jù)治理全程。
1.數(shù)據(jù)標(biāo)準(zhǔn)化
在數(shù)據(jù)治理的初期首先要建立一套依據(jù)學(xué)校實(shí)際的統(tǒng)一數(shù)據(jù)標(biāo)準(zhǔn),在數(shù)據(jù)采集、傳輸和使用過程中必須遵循這個標(biāo)準(zhǔn),才有可能建立開放共享的高質(zhì)量數(shù)據(jù)倉庫。數(shù)據(jù)標(biāo)準(zhǔn)可分為基礎(chǔ)層標(biāo)準(zhǔn)和應(yīng)用層標(biāo)準(zhǔn)兩種?;A(chǔ)層標(biāo)準(zhǔn)主要是基礎(chǔ)性的數(shù)據(jù)約束規(guī)范,如在編制數(shù)據(jù)字典、數(shù)據(jù)編碼及數(shù)據(jù)分類等過程中必須嚴(yán)格遵守統(tǒng)一的基礎(chǔ)層標(biāo)準(zhǔn),目的是要保證不同系統(tǒng)中對同一數(shù)據(jù)的理解無歧義,也為不同應(yīng)用平臺之間數(shù)據(jù)交換打下良好基礎(chǔ);應(yīng)用層標(biāo)準(zhǔn)主要是作用于系統(tǒng)功能開發(fā)所涉及的全部數(shù)據(jù)的標(biāo)準(zhǔn)規(guī)范,如元數(shù)據(jù)標(biāo)準(zhǔn)、主數(shù)據(jù)標(biāo)準(zhǔn)和數(shù)據(jù)交換標(biāo)準(zhǔn)等,其目的是確保數(shù)據(jù)在其生命周期中的使用效率和質(zhì)量,它也是保持?jǐn)?shù)據(jù)完整性、規(guī)范性和一致性的基礎(chǔ)。
2.數(shù)據(jù)管理
(1)數(shù)據(jù)質(zhì)量管理。教育大數(shù)據(jù)的數(shù)據(jù)質(zhì)量管理對象是核心業(yè)務(wù)系統(tǒng)中的全部數(shù)據(jù),包括結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù)等,其內(nèi)涵包含兩個層面:一是數(shù)據(jù)本身的質(zhì)量管理;二是數(shù)據(jù)使用過程中的質(zhì)量管理。數(shù)據(jù)治理能否有效推進(jìn)很大程度上取決于高效的數(shù)據(jù)質(zhì)量管理,完善的數(shù)據(jù)質(zhì)量管理能為學(xué)校提供高效的增值服務(wù)。
(2)數(shù)據(jù)安全管理。教育大數(shù)據(jù)應(yīng)用系統(tǒng)中匯集了大量重要且敏感的信息,對數(shù)據(jù)安全使用提出了很高的要求,尤其是數(shù)據(jù)信息的隱私性、訪問權(quán)限和安全審計等方面的管理是極其重要的。在大數(shù)據(jù)治理框架中,有必要通過完善安全策略、建立安全措施等多種手段保障數(shù)據(jù)在存儲、傳輸、使用過程中的安全性。要真正實(shí)現(xiàn)全方位的安全管控,必須做到事前預(yù)判、事中管控和事后溯源。
(3)數(shù)據(jù)生命周期管理。數(shù)據(jù)生命周期指的是數(shù)據(jù)從識別、采集、存儲到傳輸、整合、處理、應(yīng)用、歸檔銷毀的整個過程。數(shù)據(jù)治理是基于數(shù)據(jù)全生命周期的持續(xù)的安全的優(yōu)化管理,主要體現(xiàn)在高效使用數(shù)據(jù)、優(yōu)化數(shù)據(jù)質(zhì)量和實(shí)現(xiàn)數(shù)據(jù)應(yīng)用自治三方面。
(4)交換接口管理。實(shí)現(xiàn)基于元數(shù)據(jù)、主數(shù)據(jù)和數(shù)據(jù)交換等數(shù)據(jù)標(biāo)準(zhǔn)的不同應(yīng)用平臺之間的數(shù)據(jù)交換管理。良好的數(shù)據(jù)標(biāo)準(zhǔn)可以保證基礎(chǔ)數(shù)據(jù)和應(yīng)用數(shù)據(jù)的統(tǒng)一管理,結(jié)合數(shù)據(jù)質(zhì)量管理和數(shù)據(jù)安全管理較好地解決了目前應(yīng)用平臺中普遍存在的數(shù)據(jù)重復(fù)分散、理解歧義、口徑模糊、安全隱患等問題,便于實(shí)現(xiàn)數(shù)據(jù)的開放共享。
3.數(shù)據(jù)安全技術(shù)
安全保障在數(shù)據(jù)治理框架中占有不可或缺的地位,從技術(shù)上做好防護(hù)是教育大數(shù)據(jù)開放共享、消除信息孤島的重要保證。需要重點(diǎn)關(guān)注的安全技術(shù)主要包括安全態(tài)勢感知、數(shù)據(jù)脫敏、訪問策略、溯源管理等,最終實(shí)現(xiàn)對生命周期內(nèi)的數(shù)據(jù)安全感知、管控、追溯。
(1)安全態(tài)勢感知。鑒于教育大數(shù)據(jù)集中化程度高、數(shù)據(jù)量級龐大,在跨校園跨平臺的數(shù)據(jù)開放共享過程中,數(shù)據(jù)和服務(wù)平臺極易受到網(wǎng)絡(luò)黑客的攻擊,尤其是有些APT攻擊的潛伏期很長。因此,需要針對異構(gòu)大數(shù)據(jù)的融合、存儲和運(yùn)維構(gòu)建安全態(tài)勢感知系統(tǒng),實(shí)時監(jiān)測網(wǎng)絡(luò)流量、安全日志等,采取有效的技術(shù)手段預(yù)測、評估當(dāng)前網(wǎng)絡(luò)數(shù)據(jù)安全狀況,對安全事件和安全隱患進(jìn)行預(yù)警與防御處置,提高對數(shù)據(jù)整體安全風(fēng)險的感知和決策能力。
(2)數(shù)據(jù)脫敏。教育大數(shù)據(jù)中存在大量的敏感信息,如個人信息、資產(chǎn)數(shù)據(jù)等。對于這些敏感數(shù)據(jù),數(shù)據(jù)治理過程中需要進(jìn)行脫敏。建立數(shù)據(jù)脫敏的方法和標(biāo)準(zhǔn)需依據(jù)國家相關(guān)法律法規(guī)、數(shù)據(jù)分類分級標(biāo)準(zhǔn)和數(shù)據(jù)開放共享的安全級別。
(3)訪問策略。防止數(shù)據(jù)被非法訪問的關(guān)鍵是建立有效的統(tǒng)一認(rèn)證系統(tǒng)和完善合理的訪問策略。所有用戶都必須通過統(tǒng)一賬號、唯一入口進(jìn)入應(yīng)用平臺,依據(jù)訪問策略實(shí)現(xiàn)分級訪問數(shù)據(jù)資源,并記錄用戶訪問情況。
(4)數(shù)據(jù)溯源。數(shù)據(jù)溯源是在結(jié)果發(fā)生后對歷史痕跡進(jìn)行分析、溯源。例如,發(fā)生網(wǎng)絡(luò)安全攻擊后,可以對網(wǎng)絡(luò)流量、日志和警告信息等進(jìn)行綜合分析,可以追溯攻擊行為類型,通過關(guān)聯(lián)的IP地址等信息,可以追溯到實(shí)施者所在地。在共享數(shù)據(jù)全生命周期中對數(shù)據(jù)的流轉(zhuǎn)過程要加強(qiáng)監(jiān)控、記錄,全程透明可見。為提升對安全事故的追責(zé)能力,所有的留痕記錄必須具備唯一性并不可修改。
4.治理保障
在大數(shù)據(jù)治理實(shí)施的過程中,僅依賴數(shù)據(jù)標(biāo)準(zhǔn)化、數(shù)據(jù)管控以及安全技術(shù)等技術(shù)來支撐是不夠的,還必須通過組織、制度、優(yōu)化流程等保障機(jī)制來提高數(shù)據(jù)治理的效率,降低數(shù)據(jù)治理運(yùn)維成本,并保證數(shù)據(jù)治理風(fēng)險可控。
(1)組織保障。立足學(xué)校的實(shí)際情況,建立合理的數(shù)據(jù)治理組織架構(gòu)和責(zé)任體系,明確數(shù)據(jù)生命周期中所涉及的部門及人員的職權(quán)責(zé)。組織負(fù)責(zé)全面統(tǒng)籌協(xié)調(diào),整體解決數(shù)據(jù)治理中出現(xiàn)的問題,是實(shí)現(xiàn)成功治理的重要保障。
(2)法規(guī)制度。數(shù)據(jù)治理從總體規(guī)劃到落地實(shí)施,內(nèi)容覆蓋廣泛,涉及大量的人物財,為保障治理工程的順利推進(jìn),方方面面都需要制度加以規(guī)范和明確。治理的制度要基于國家法律法規(guī)制定,類型大致可分為章程(確立數(shù)據(jù)治理目標(biāo))、管控辦法(數(shù)據(jù)治理實(shí)施保障制度)、考核辦法(建立激勵機(jī)制)等。
(3)標(biāo)準(zhǔn)流程。流程是項(xiàng)目實(shí)施的落地步驟,大數(shù)據(jù)治理流程的建立需立足學(xué)校實(shí)際、依據(jù)規(guī)章制度建立可操作的標(biāo)準(zhǔn)流程。在數(shù)據(jù)實(shí)施的過程中結(jié)合數(shù)據(jù)治理的技術(shù)和管理工具,建立符合學(xué)校需求的標(biāo)準(zhǔn)流程管理系統(tǒng)。
● 結(jié)語
在數(shù)據(jù)即服務(wù)(DAAS)的時代,教育大數(shù)據(jù)應(yīng)用系統(tǒng)是一項(xiàng)復(fù)雜龐大的工程,每天都有海量的大數(shù)據(jù)流動于各應(yīng)用中,有效的大數(shù)據(jù)治理方案能夠優(yōu)化和提升數(shù)據(jù)的質(zhì)量、安全和價值等,從而高效驅(qū)動校園實(shí)踐應(yīng)用,提高教育管理效率,增強(qiáng)決策科學(xué)性,達(dá)到提升社會教育質(zhì)量的目的。本文針對當(dāng)前教育大數(shù)據(jù)普遍存在的問題,提出教育大數(shù)據(jù)治理的參考框架,從技術(shù)層面、管理層面和保障層面闡述了教育大數(shù)據(jù)治理的可行性操作和實(shí)施步驟,旨在幫助教育數(shù)據(jù)治理研究者能夠更加客觀深入地分析和解決面臨的數(shù)據(jù)問題,使教育大數(shù)據(jù)在不同應(yīng)用平臺間高效流轉(zhuǎn)、良性循環(huán)。
參考文獻(xiàn):
[1]張紹華,潘蓉,宗宇偉.大數(shù)據(jù)治理與服務(wù)[M].上海:上??茖W(xué)技術(shù)出版社,2016.
[2]王永顏.大數(shù)據(jù)時代教育治理能力現(xiàn)代化構(gòu)建與路徑選擇[J].電化教育研究,2017(08):44-49.
[3]賈童舒,劉葉婷.數(shù)據(jù)治理——提升城市現(xiàn)代化治理能力的新視角[J].領(lǐng)導(dǎo)科學(xué),2014(35):4-7.
作者簡介:陳迎春(1971.01—),女,漢族,四川省遂寧市人,高級工程師,學(xué)士,研究方向?yàn)榇髷?shù)據(jù)治理。