• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      數(shù)據(jù)治理:提升教育數(shù)據(jù)質(zhì)量的方法和途徑

      2018-11-10 10:20李青韓俊紅
      中國(guó)遠(yuǎn)程教育 2018年8期
      關(guān)鍵詞:數(shù)據(jù)管理教育

      李青 韓俊紅

      【摘 要】 隨著互聯(lián)網(wǎng)和信息技術(shù)的發(fā)展,數(shù)據(jù)成為關(guān)乎社會(huì)和各行各業(yè)發(fā)展前景的重要資產(chǎn)。如何對(duì)數(shù)據(jù)進(jìn)行有效分析和利用是當(dāng)前亟須解決的問(wèn)題,“數(shù)據(jù)治理”應(yīng)運(yùn)而生。隨著教育信息化建設(shè)的推進(jìn),教育領(lǐng)域也積累了海量數(shù)據(jù),數(shù)據(jù)質(zhì)量管理和治理的需求迫切。為了在教育信息化領(lǐng)域普及數(shù)據(jù)治理的概念,介紹教育數(shù)據(jù)治理的做法,本研究通過(guò)文獻(xiàn)研究和案例研究的方法分析了政府、醫(yī)療健康和金融領(lǐng)域數(shù)據(jù)治理的成功經(jīng)驗(yàn),總結(jié)歸納出數(shù)據(jù)治理的一般方法和途徑。進(jìn)而針對(duì)教育數(shù)據(jù)治理過(guò)程中面臨的問(wèn)題提出相應(yīng)的解決建議,包括:設(shè)置教育數(shù)據(jù)治理的組織機(jī)構(gòu),制定和完善數(shù)據(jù)標(biāo)準(zhǔn),推進(jìn)不同層次和維度的數(shù)據(jù)共享,落實(shí)和健全數(shù)據(jù)隱私保護(hù)機(jī)制,建設(shè)數(shù)據(jù)治理的技術(shù)平臺(tái)。最后,以?xún)蓚€(gè)具體的案例介紹了教育領(lǐng)域數(shù)據(jù)治理的具體做法,以期對(duì)今后的教育數(shù)據(jù)質(zhì)量管理和治理工作提供參考。

      【關(guān)鍵詞】 數(shù)據(jù)治理;大數(shù)據(jù);數(shù)據(jù)質(zhì)量;教育信息化;教育數(shù)據(jù);質(zhì)量管理;數(shù)據(jù)標(biāo)準(zhǔn);組織架構(gòu)

      【中圖分類(lèi)號(hào)】 G420 【文獻(xiàn)標(biāo)識(shí)碼】 A 【文章編號(hào)】 1009-458x(2018)8-0045-09

      引言

      在信息技術(shù)和互聯(lián)網(wǎng)高度發(fā)展的今天,每天都有海量的數(shù)據(jù)產(chǎn)生,人類(lèi)社會(huì)已經(jīng)進(jìn)入大數(shù)據(jù)時(shí)代。各個(gè)行業(yè)領(lǐng)域都擁有數(shù)量龐大的數(shù)據(jù),作為新型的資源,大數(shù)據(jù)具有多樣性、容量大、高速快、價(jià)值高的特點(diǎn)(申孟宜, 等, 2014)。以數(shù)據(jù)為基礎(chǔ)的決策顯著地提升了組織的產(chǎn)出和生產(chǎn)率(Watson, 2011)。與傳統(tǒng)的數(shù)據(jù)集相比,大數(shù)據(jù)不僅包含結(jié)構(gòu)化數(shù)據(jù),還包含海量的半結(jié)構(gòu)化以及非結(jié)構(gòu)化數(shù)據(jù)。如何治理日益龐大的數(shù)據(jù)集,并從中獲取對(duì)人類(lèi)社會(huì)發(fā)展有用的信息是當(dāng)前急需解決的問(wèn)題。為了解決這個(gè)問(wèn)題,“數(shù)據(jù)治理”得到了各行各業(yè)的重視,在通信、金融、銀行、醫(yī)療和電子政務(wù)等領(lǐng)域取得了較大進(jìn)展,形成了一些行之有效的方法和工具。

      同其他行業(yè)一樣,大數(shù)據(jù)技術(shù)在教育行業(yè)的普及和應(yīng)用推動(dòng)了數(shù)據(jù)治理需求的產(chǎn)生。各種教育信息化平臺(tái)中積累的數(shù)據(jù)呈指數(shù)倍增長(zhǎng),對(duì)有效地獲取、存儲(chǔ)、分析和利用數(shù)據(jù)的需求越來(lái)越強(qiáng)烈。教育領(lǐng)域?qū)?shù)據(jù)的管理仍沒(méi)有規(guī)范的治理準(zhǔn)則;無(wú)論是機(jī)構(gòu)內(nèi)、機(jī)構(gòu)間,還是區(qū)域?qū)蛹?jí),均未能夠?qū)?shù)據(jù)進(jìn)行有效的應(yīng)用(許曉東, 等, 2015)。數(shù)據(jù)質(zhì)量管理一直是教育信息化中的薄弱環(huán)節(jié)。如何科學(xué)使用數(shù)據(jù)、盤(pán)活數(shù)據(jù)資產(chǎn)、發(fā)揮數(shù)據(jù)價(jià)值?數(shù)據(jù)治理或許是一劑良方。然而,當(dāng)前關(guān)于教育數(shù)據(jù)治理的研究還很少,主要集中在個(gè)別高校對(duì)其信息管理系統(tǒng)的數(shù)據(jù)治理,或者是高校圖書(shū)館的數(shù)據(jù)治理,缺少全局視野和更高層次的思考。

      本研究采用文獻(xiàn)研究和案例分析等研究方法,以國(guó)內(nèi)外權(quán)威期刊上關(guān)于大數(shù)據(jù)、數(shù)據(jù)治理的文獻(xiàn)為來(lái)源,明確大數(shù)據(jù)、教育數(shù)據(jù)、數(shù)據(jù)治理等相關(guān)概念。同時(shí),借鑒電子政務(wù)數(shù)據(jù)、企業(yè)運(yùn)營(yíng)數(shù)據(jù)和醫(yī)療健康數(shù)據(jù)等領(lǐng)域的治理成果,結(jié)合教育大數(shù)據(jù)的特征和教育領(lǐng)域內(nèi)的現(xiàn)實(shí)問(wèn)題加以討論,梳理出教育數(shù)據(jù)治理的一般方法和途徑。希望本研究能夠?qū)逃龜?shù)據(jù)管理和治理工作有所啟發(fā),并引起學(xué)術(shù)界更多的關(guān)注。

      一、數(shù)據(jù)治理的概念及實(shí)踐

      (一)數(shù)據(jù)治理的概念

      數(shù)據(jù)治理(Data Governance)是特定的組織機(jī)構(gòu)用來(lái)管理數(shù)據(jù)的過(guò)程和方法(Educase, 2017),以及與之對(duì)應(yīng)的依托于特定工具和平臺(tái)的實(shí)踐。它并非一個(gè)全新概念,關(guān)于數(shù)據(jù)治理的相關(guān)理論和實(shí)踐在大型數(shù)據(jù)庫(kù)廣泛應(yīng)用的時(shí)代就已經(jīng)出現(xiàn)。只是大數(shù)據(jù)時(shí)代,數(shù)據(jù)量和復(fù)雜度有了很大的變化,對(duì)數(shù)據(jù)質(zhì)量的需求也被提到了一個(gè)全新的高度。美國(guó)全球數(shù)據(jù)管理協(xié)會(huì)(DAMA)認(rèn)為,數(shù)據(jù)治理是對(duì)數(shù)據(jù)資產(chǎn)管理行使權(quán)利和控制的活動(dòng)的集合(DAMA, 2012)。桑尼爾·索雷斯(2014)提出,數(shù)據(jù)治理是廣義信息治理計(jì)劃的一部分,即制定與大數(shù)據(jù)有關(guān)的數(shù)據(jù)優(yōu)化、隱私保護(hù)與數(shù)據(jù)變現(xiàn)的政策;沈建苗(2007)認(rèn)為,數(shù)據(jù)治理是企業(yè)的責(zé)任,需要統(tǒng)一的解決方案和治理模型來(lái)保護(hù)及共享不同層面的數(shù)據(jù);張一鳴(2012)從標(biāo)準(zhǔn)體系、業(yè)務(wù)范圍、控制范圍、技術(shù)支持范圍等角度對(duì)數(shù)據(jù)治理概念進(jìn)行分析(如表1所示)。

      表1 數(shù)據(jù)治理的不同維度

      [維度 解釋 標(biāo)準(zhǔn)體系 數(shù)據(jù)治理是一種標(biāo)準(zhǔn)體系,通過(guò)數(shù)據(jù)組織、數(shù)據(jù)管控實(shí)現(xiàn)數(shù)據(jù)標(biāo)準(zhǔn)化 業(yè)務(wù)范圍 數(shù)據(jù)治理就是要對(duì)數(shù)據(jù)的產(chǎn)生、處理、使用進(jìn)行監(jiān)督管理,以滿(mǎn)足數(shù)據(jù)和業(yè)務(wù)需要相適應(yīng) 控制范圍 數(shù)據(jù)治理必須對(duì)治理人員、治理流程以及治理系統(tǒng)進(jìn)行整體設(shè)計(jì) 技術(shù)支持范圍 數(shù)據(jù)治理需要前端、后端和終端等各個(gè)環(huán)節(jié)的技術(shù)支撐 ]

      我們常說(shuō)的數(shù)據(jù)管理則是一個(gè)更為寬泛的定義,它涉及任何時(shí)間采集和應(yīng)用數(shù)據(jù)的可重復(fù)流程(Harper, 2017)。DAMA認(rèn)為,數(shù)據(jù)管理是企業(yè)對(duì)數(shù)據(jù)生命周期進(jìn)行管理的體系、策略、實(shí)踐和過(guò)程。該機(jī)構(gòu)發(fā)布的《數(shù)據(jù)管理知識(shí)手冊(cè)(DMBOK)》明確指出,數(shù)據(jù)治理是數(shù)據(jù)管理的一部分(DAMA, 2014)。軟件工程領(lǐng)域的權(quán)威——CMMI研究院在其發(fā)布的數(shù)據(jù)管理成熟度模型(DMM)中也將數(shù)據(jù)治理作為六大數(shù)據(jù)管理業(yè)務(wù)領(lǐng)域之一(CMMI, 2016)。

      綜上所述,數(shù)據(jù)治理是一個(gè)關(guān)于數(shù)據(jù)管理的綜合實(shí)踐領(lǐng)域,它涵蓋了管理體系、標(biāo)準(zhǔn)體系、技術(shù)體系三大組成部分。從管理角度來(lái)看,數(shù)據(jù)治理必須建設(shè)完善的數(shù)據(jù)管理組織機(jī)構(gòu),制定科學(xué)合理的章程,確保數(shù)據(jù)的產(chǎn)生、處理、使用和銷(xiāo)毀都有專(zhuān)業(yè)人員監(jiān)管;從標(biāo)準(zhǔn)化的角度來(lái)看,數(shù)據(jù)治理必須制定規(guī)范的標(biāo)準(zhǔn)體系,使得數(shù)據(jù)的存儲(chǔ)、使用、生命周期管理都能做到統(tǒng)一和規(guī)范,避免機(jī)構(gòu)內(nèi)和機(jī)構(gòu)間的差異;從技術(shù)角度來(lái)看,數(shù)據(jù)治理必須以信息技術(shù)為基礎(chǔ),通過(guò)數(shù)據(jù)庫(kù)和信息系統(tǒng)的完善使得數(shù)據(jù)的質(zhì)量保持穩(wěn)定,數(shù)據(jù)的價(jià)值得以充分發(fā)掘。

      (二)先發(fā)領(lǐng)域的數(shù)據(jù)治理研究和實(shí)踐

      國(guó)內(nèi)不同行業(yè)關(guān)于數(shù)據(jù)治理的研究和實(shí)踐有很大差異。起步較早的行業(yè)已經(jīng)取得顯著的進(jìn)展。例如,電子政務(wù)領(lǐng)域在如何進(jìn)行數(shù)據(jù)治理以強(qiáng)化服務(wù)管理、推動(dòng)社會(huì)發(fā)展方面有較多的研究。對(duì)于政府而言,數(shù)據(jù)是公共服務(wù)創(chuàng)新和策略?xún)?yōu)化的客觀依據(jù)。數(shù)據(jù)治理工作可以幫助政府挖掘大數(shù)據(jù)中隱含的深層次信息,形成基于大數(shù)據(jù)的產(chǎn)業(yè)鏈和價(jià)值鏈(范靈俊, 等, 2016)。目前,電子政務(wù)涉及的管理數(shù)據(jù)來(lái)源分散、缺乏共享標(biāo)準(zhǔn)和規(guī)范接口。李文彬等(2016)認(rèn)為改變這種局面,應(yīng)在以下方面提升政府?dāng)?shù)據(jù)治理能力:轉(zhuǎn)變治理理念,增強(qiáng)大數(shù)據(jù)意識(shí);整合數(shù)據(jù)信息,建設(shè)公共大數(shù)據(jù)平臺(tái);完善制度保障,構(gòu)建大數(shù)據(jù)法律體系;強(qiáng)化技術(shù)研發(fā),掌握大數(shù)據(jù)核心技術(shù);重視人才培養(yǎng),優(yōu)化大數(shù)據(jù)培養(yǎng)機(jī)制。陳真勇等(2014)提出了一種數(shù)據(jù)治理的分層互聯(lián)框架,將治理工作劃分為數(shù)據(jù)存儲(chǔ)層、數(shù)據(jù)轉(zhuǎn)換層、數(shù)據(jù)互聯(lián)層和數(shù)據(jù)共享層四個(gè)層次,用于解決智慧城市大數(shù)據(jù)的共享和融合問(wèn)題。國(guó)外的一些政府部門(mén)在局部領(lǐng)域也已經(jīng)部署了一些數(shù)據(jù)治理工具,如新加坡政府就部署了OneService一站式治理平臺(tái),通過(guò)信息匯聚提升社區(qū)服務(wù)質(zhì)量。

      現(xiàn)代金融業(yè)是嚴(yán)重依賴(lài)數(shù)據(jù)運(yùn)行的行業(yè)之一,雖然經(jīng)歷了多年的發(fā)展和完善,仍存在數(shù)據(jù)基礎(chǔ)薄弱、數(shù)據(jù)不完整、一致性較差、管理體制不健全等問(wèn)題。國(guó)外的銀行較早認(rèn)識(shí)到了這個(gè)問(wèn)題,并采取了相應(yīng)的措施。例如,美洲銀行建立了較為完善的數(shù)據(jù)治理框架,明確了信息技術(shù)部門(mén)、業(yè)務(wù)部門(mén)和管理部門(mén)的分工,規(guī)定了數(shù)據(jù)管理、數(shù)據(jù)訪問(wèn)、數(shù)據(jù)質(zhì)量、元數(shù)據(jù)等數(shù)據(jù)治理主體。中信銀行在數(shù)據(jù)治理中提出了數(shù)據(jù)標(biāo)準(zhǔn)化、提高數(shù)據(jù)基礎(chǔ)質(zhì)量、構(gòu)建數(shù)據(jù)治理管理體系等措施(佚名, 2012)。還有學(xué)者建議銀行在治理數(shù)據(jù)時(shí),明確數(shù)據(jù)來(lái)源、劃分信息系統(tǒng)、找到數(shù)據(jù)流向、確定數(shù)據(jù)治理關(guān)鍵節(jié)點(diǎn)、依據(jù)數(shù)據(jù)生命周期劃定治理職責(zé)(許文, 等, 2012)。通過(guò)數(shù)據(jù)治理,銀行可以實(shí)現(xiàn)精準(zhǔn)化的客戶(hù)營(yíng)銷(xiāo),強(qiáng)化、精細(xì)化內(nèi)部管理,保障數(shù)據(jù)口徑標(biāo)準(zhǔn)基本一致,方便業(yè)內(nèi)統(tǒng)計(jì)和國(guó)家監(jiān)管。

      醫(yī)療領(lǐng)域也有海量的數(shù)據(jù)應(yīng)用。醫(yī)療行業(yè)的數(shù)據(jù)分布廣泛而無(wú)序,利用率低,大量累積的數(shù)據(jù)未能產(chǎn)生真正的價(jià)值。常朝娣等(2016)提出了“醫(yī)療健康大數(shù)據(jù)治理體系框架”,其中包含基本原則、核心指標(biāo)、關(guān)鍵組件、技術(shù)及大數(shù)據(jù)治理評(píng)估等內(nèi)容。還有研究構(gòu)建了“醫(yī)療大數(shù)據(jù)生命周期模型”,提出要精確化醫(yī)療數(shù)據(jù)治理目標(biāo),落實(shí)醫(yī)療數(shù)據(jù)治理主題,包括數(shù)據(jù)標(biāo)準(zhǔn)制定、數(shù)據(jù)質(zhì)量管理及數(shù)據(jù)生命周期管理等(高漢松, 等, 2013)。通過(guò)醫(yī)療健康數(shù)據(jù)的治理,實(shí)現(xiàn)節(jié)約醫(yī)療成本、提高醫(yī)療質(zhì)量等目標(biāo)。

      通過(guò)對(duì)以上三個(gè)領(lǐng)域的觀察,可以看出數(shù)據(jù)治理在產(chǎn)業(yè)領(lǐng)域中已經(jīng)開(kāi)始從研究進(jìn)入到實(shí)踐。集中治理工作有利于發(fā)揮大數(shù)據(jù)在日常管理和業(yè)務(wù)創(chuàng)新上的推動(dòng)力,但也暴露出一些問(wèn)題,具體如下:一是缺乏完善全面的數(shù)據(jù)管理體系。當(dāng)前的數(shù)據(jù)管理機(jī)制上存在較多漏洞,各部門(mén)自成管理體系、自定標(biāo)準(zhǔn),遇到數(shù)據(jù)問(wèn)題時(shí)也是自行解決。在這種情況下,只能給出臨時(shí)解決方案,無(wú)法從根源上杜絕數(shù)據(jù)問(wèn)題。二是數(shù)據(jù)治理的方法和技術(shù)有待提高。數(shù)據(jù)治理涉及數(shù)據(jù)標(biāo)準(zhǔn)化、數(shù)據(jù)融合共享、數(shù)據(jù)質(zhì)量管理及數(shù)據(jù)隱私管理等領(lǐng)域的專(zhuān)業(yè)知識(shí),若不能將相關(guān)部門(mén)的業(yè)務(wù)能力上升到專(zhuān)業(yè)高度,數(shù)據(jù)治理將收效甚微。三是缺少統(tǒng)一的數(shù)據(jù)治理平臺(tái)支撐。平臺(tái)的開(kāi)發(fā)與建設(shè)是數(shù)據(jù)治理的關(guān)鍵環(huán)節(jié),目前數(shù)據(jù)治理平臺(tái)過(guò)于分散,無(wú)論是結(jié)構(gòu)上或者是功能上都不能滿(mǎn)足大數(shù)據(jù)時(shí)代對(duì)數(shù)據(jù)治理的需要。

      二、數(shù)據(jù)治理的方法和技術(shù)

      數(shù)據(jù)治理是一項(xiàng)系統(tǒng)性的工作。表面上看,數(shù)據(jù)治理的問(wèn)題是由數(shù)據(jù)基礎(chǔ)薄弱、數(shù)據(jù)不完整和不一致造成的,實(shí)際上分析深層原因,是數(shù)據(jù)管理體制不健全、內(nèi)部管理職能不清造成的(佚名, 2012)。因此,數(shù)據(jù)治理需要從管理機(jī)制、治理體系、技術(shù)平臺(tái)各方面齊頭并進(jìn),從上而下進(jìn)行治理與改善。其中,最根本的是管理體系,需要確立數(shù)據(jù)治理組織架構(gòu),這是推動(dòng)數(shù)據(jù)治理實(shí)施的原動(dòng)力;數(shù)據(jù)治理的體系和過(guò)程也是治理過(guò)程中應(yīng)該厘清的問(wèn)題;最后才是數(shù)據(jù)治理的實(shí)現(xiàn)技術(shù)和管理平臺(tái),這是數(shù)據(jù)治理落地與實(shí)施的關(guān)鍵。

      (一)確立數(shù)據(jù)治理的管理機(jī)制

      專(zhuān)業(yè)化的團(tuán)隊(duì)是項(xiàng)目開(kāi)展的有力保障。在數(shù)據(jù)治理工作正式開(kāi)展之前,應(yīng)成立專(zhuān)門(mén)的工作小組,并對(duì)其工作職責(zé)進(jìn)行詳細(xì)的規(guī)劃。從已有的行業(yè)實(shí)踐來(lái)看,可自上而下建立如圖1所示的數(shù)據(jù)治理組織。首先,由高層領(lǐng)導(dǎo)組成數(shù)據(jù)治理委員會(huì),這些高層領(lǐng)導(dǎo)對(duì)于業(yè)務(wù)的發(fā)展和實(shí)施應(yīng)非常熟悉,對(duì)數(shù)據(jù)管理也有一定的認(rèn)識(shí)。數(shù)據(jù)治理委員會(huì)的主要職責(zé)是:從戰(zhàn)略角度統(tǒng)籌規(guī)劃,制定治理的規(guī)章制度,提出一系列管控方法,協(xié)調(diào)各部門(mén)有序、有效工作。它是最高決策機(jī)構(gòu),對(duì)于治理工作承擔(dān)最終審查和監(jiān)督的職能。治理工作組是治理委員會(huì)的常設(shè)辦事機(jī)構(gòu),按照具體的業(yè)務(wù)下設(shè)多個(gè)專(zhuān)項(xiàng)小組,如業(yè)務(wù)分析組、標(biāo)準(zhǔn)委員會(huì)、研發(fā)小組和考核小組等,每個(gè)專(zhuān)項(xiàng)小組具有不同的職責(zé)。專(zhuān)項(xiàng)小組的成員不需要是“萬(wàn)事通”的全才,但必須是領(lǐng)域?qū)<摇?/p>

      圖1 數(shù)據(jù)治理組織架構(gòu)

      (二)建立數(shù)據(jù)治理體系和過(guò)程

      雖然在不同領(lǐng)域中數(shù)據(jù)的管理和使用存在差異,但是數(shù)據(jù)生命周期基本是相同的,可分為數(shù)據(jù)收集、數(shù)據(jù)處理、數(shù)據(jù)分析和數(shù)據(jù)發(fā)現(xiàn)等(丁寧, 等, 2013)。數(shù)據(jù)治理工作貫穿于數(shù)據(jù)生命周期的全過(guò)程,只有在每個(gè)環(huán)節(jié)上保持高效和高質(zhì)量,整個(gè)數(shù)據(jù)治理才能取得卓越的成績(jī)。在實(shí)踐中,數(shù)據(jù)治理包含標(biāo)準(zhǔn)化、融合共享、質(zhì)量管理及隱私保護(hù)等具體的主題,這些主題的治理工作成果優(yōu)劣決定了整個(gè)數(shù)據(jù)治理的效果。下面對(duì)各個(gè)治理主題加以說(shuō)明和討論。

      數(shù)據(jù)的標(biāo)準(zhǔn)化。大數(shù)據(jù)的基本特征就是數(shù)據(jù)量大、類(lèi)型多樣且差異明顯。若沒(méi)有統(tǒng)一的標(biāo)準(zhǔn),海量的數(shù)據(jù)在存儲(chǔ)、使用時(shí)會(huì)成為一團(tuán)亂麻,難以對(duì)數(shù)據(jù)進(jìn)行加工和分析。數(shù)據(jù)標(biāo)準(zhǔn)化是按照預(yù)定規(guī)程對(duì)共享數(shù)據(jù)實(shí)施規(guī)范化管理的過(guò)程,分為業(yè)務(wù)建模、數(shù)據(jù)規(guī)范化、文檔規(guī)范化三個(gè)階段。其中,業(yè)務(wù)建模是數(shù)據(jù)標(biāo)準(zhǔn)化的基礎(chǔ);數(shù)據(jù)規(guī)范化是數(shù)據(jù)標(biāo)準(zhǔn)化的關(guān)鍵和核心;文檔規(guī)范化是數(shù)據(jù)規(guī)范化成果實(shí)際應(yīng)用的關(guān)鍵(吳志剛, 等, 2003)。標(biāo)準(zhǔn)化是數(shù)據(jù)融合的前提,也是保證數(shù)據(jù)質(zhì)量的重要條件(孫廣芝, 等, 2015)。

      數(shù)據(jù)的融合共享。在傳統(tǒng)的數(shù)據(jù)管理方式下,數(shù)據(jù)繁雜而分散,既浪費(fèi)了軟硬件資源,也不利于關(guān)聯(lián)各種局部數(shù)據(jù)得到完整的信息。實(shí)現(xiàn)數(shù)據(jù)共享和融合,不僅可以提高大數(shù)據(jù)的處理性能,加深語(yǔ)義處理的深度,還擴(kuò)展了數(shù)據(jù)處理和分析的廣度,使數(shù)據(jù)的分析和處理不再局限于少量孤立數(shù)據(jù)集內(nèi),將關(guān)聯(lián)數(shù)據(jù)有機(jī)整合,極大地提高了數(shù)據(jù)的利用率(陳真勇, 等, 2014)。

      數(shù)據(jù)的質(zhì)量管理。高質(zhì)量的數(shù)據(jù)是大數(shù)據(jù)發(fā)揮效能的前提和基礎(chǔ)。大數(shù)據(jù)具有的多樣性及快速變化的特點(diǎn)會(huì)使數(shù)據(jù)沖突、不一致、互相矛盾或者“過(guò)期”等問(wèn)題更加尖銳。從技術(shù)層面看,可以通過(guò)數(shù)據(jù)庫(kù)技術(shù)、數(shù)據(jù)檢測(cè)和識(shí)別技術(shù)、數(shù)據(jù)分析技術(shù)保證數(shù)據(jù)質(zhì)量(宗威, 等, 2013);從管理層面看,企業(yè)高層、專(zhuān)業(yè)管理和技術(shù)分析人員應(yīng)對(duì)數(shù)據(jù)質(zhì)量高度重視,貫徹和落實(shí)數(shù)據(jù)質(zhì)量管理的各項(xiàng)規(guī)章制度。

      用戶(hù)數(shù)據(jù)的隱私保護(hù)。個(gè)人數(shù)據(jù)中常見(jiàn)的姓名、電話、身份證信息等個(gè)人信息涉及數(shù)據(jù)隱私,醫(yī)療信息、金融信息及任職情況等也可能是隱私數(shù)據(jù)。若這些數(shù)據(jù)被非法使用,則有可能造成巨大損失。為應(yīng)對(duì)隱私保護(hù)風(fēng)險(xiǎn),數(shù)據(jù)治理不僅要加強(qiáng)業(yè)務(wù)規(guī)范與監(jiān)管,利用信息技術(shù)手段隔離和保護(hù)個(gè)人敏感信息,而且要建立主動(dòng)的隱私保護(hù)機(jī)制,如隱私監(jiān)控體系、隱私評(píng)估體系、隱私問(wèn)責(zé)機(jī)制等(孟小峰, 等, 2015)。

      (三)數(shù)據(jù)治理平臺(tái)的建設(shè)

      治理平臺(tái)是數(shù)據(jù)治理活動(dòng)開(kāi)展和實(shí)施的技術(shù)基礎(chǔ)和支撐環(huán)境。一個(gè)技術(shù)先進(jìn)、功能完善的治理平臺(tái)能有效提高數(shù)據(jù)治理的效率,強(qiáng)化治理效果。在搭建數(shù)據(jù)治理平臺(tái)時(shí),技術(shù)管理者應(yīng)考慮如何將大數(shù)據(jù)的需求和管理融入已有的技術(shù)架構(gòu)。美國(guó)知名的數(shù)據(jù)治理專(zhuān)家桑尼爾·索雷斯(2014, pp. 233-235)給出一個(gè)較為完整的大數(shù)據(jù)參考架構(gòu)(如圖2所示)。這個(gè)架構(gòu)主要分為以下幾個(gè)層次:①系統(tǒng)基礎(chǔ)層包括大數(shù)據(jù)源、開(kāi)源的基礎(chǔ)組件、數(shù)據(jù)庫(kù)、大數(shù)據(jù)整合等幾個(gè)層次;②公用服務(wù)層包括元數(shù)據(jù)、信息政策管理和主數(shù)據(jù)管理、文本分析、大數(shù)據(jù)發(fā)現(xiàn)、大數(shù)據(jù)質(zhì)量等服務(wù);③系統(tǒng)應(yīng)用層包括數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)集市以及分析和報(bào)告工具;④數(shù)據(jù)的生命周期管理和數(shù)據(jù)隱私安全則是貫穿平臺(tái)的各個(gè)層次。

      圖2 一種數(shù)據(jù)治理的參考架構(gòu)

      針對(duì)數(shù)據(jù)治理的需求,各大數(shù)據(jù)軟件和企業(yè)級(jí)關(guān)鍵開(kāi)發(fā)商也推出了相應(yīng)的平臺(tái)和解決方案。例如,甲骨文公司的數(shù)據(jù)治理平臺(tái)采用Oracle Database11g關(guān)系型數(shù)據(jù)庫(kù)和Oracle NoSQL非關(guān)系型數(shù)據(jù)庫(kù)相結(jié)合,以此實(shí)現(xiàn)不同種類(lèi)數(shù)據(jù)的存儲(chǔ)及查詢(xún),并保證數(shù)據(jù)的安全性。同時(shí),為實(shí)現(xiàn)數(shù)據(jù)整合,使用Oracle DataIntegrator和Oracle GoldenGate兩個(gè)工具相結(jié)合,用于整合和轉(zhuǎn)換Hadoop中的數(shù)據(jù);使用結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)的搜索和發(fā)現(xiàn)工具Oracle Endeca Information Discovery實(shí)現(xiàn)結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)的搜索和發(fā)現(xiàn);使用Oracle Enterprise Data Quality系列產(chǎn)品保障大數(shù)據(jù)質(zhì)量。SAP公司也發(fā)布了類(lèi)似的解決方案,將SAP HANA(內(nèi)存數(shù)據(jù)庫(kù))和SAP Sybase IQ(針對(duì)商業(yè)智能和分析優(yōu)化的縱列數(shù)據(jù)庫(kù))相結(jié)合,實(shí)現(xiàn)對(duì)本地的非結(jié)構(gòu)化和準(zhǔn)結(jié)構(gòu)化數(shù)據(jù)集的文本操作以及與Hadoop的互操作;利用SAP Business Objects Data Services完成數(shù)據(jù)剖析、元數(shù)據(jù)和文本分析以及與Hadoop的數(shù)據(jù)整合。這些業(yè)界知名廠商提供的成熟的技術(shù)和解決方案可以供我們?cè)诮ㄔO(shè)數(shù)據(jù)治理平臺(tái)時(shí)借鑒。

      三、教育數(shù)據(jù)治理

      (一)教育大數(shù)據(jù)的來(lái)源和特征

      隨著教育信息化工作的逐步推進(jìn),各級(jí)教育主管部門(mén)以及學(xué)校都在致力于進(jìn)行數(shù)字化校園、智慧校園的建設(shè),各種信息化管理系統(tǒng)以及在線學(xué)習(xí)平臺(tái)的部署和應(yīng)用使得教育行業(yè)也積累了多元化的海量數(shù)據(jù)。教育大數(shù)據(jù)是教育領(lǐng)域的大數(shù)據(jù),它既是面向特定教育主題的多類(lèi)型、多維度、多形態(tài)的數(shù)據(jù)集合,也是面向教育全過(guò)程的數(shù)據(jù),通過(guò)數(shù)據(jù)挖掘和學(xué)習(xí)分析支持教育決策和個(gè)性化學(xué)習(xí)(杜婧敏, 等, 2016)。教育數(shù)據(jù)根據(jù)其作用范圍可分為個(gè)體層面的數(shù)據(jù)、課程層面的數(shù)據(jù)、學(xué)校層面的數(shù)據(jù)、區(qū)域?qū)用娴臄?shù)據(jù)和國(guó)家層面的數(shù)據(jù)(楊現(xiàn)民, 等, 2015)。

      除了大數(shù)據(jù)的一般特征之外,教育大數(shù)據(jù)具有自身的一些特點(diǎn)(王帆, 2015):一是泛在性,教育大數(shù)據(jù)無(wú)處不在,越來(lái)越多的數(shù)字化設(shè)備和傳感器采集了各種數(shù)據(jù),記錄了學(xué)習(xí)活動(dòng)的過(guò)程和結(jié)果;二是持續(xù)性,數(shù)據(jù)系統(tǒng)可以跟蹤學(xué)生學(xué)習(xí)過(guò)程中不同層次的不同軌跡,可以使各種教育數(shù)據(jù)連貫起來(lái);三是互聯(lián)性,各種數(shù)據(jù)系統(tǒng)相互關(guān)聯(lián),互相共享和交換教育數(shù)據(jù)。此外,教育大數(shù)據(jù)在數(shù)據(jù)類(lèi)型上更加多元,除了包括成績(jī)、學(xué)籍、出勤記錄等常規(guī)的結(jié)構(gòu)化數(shù)據(jù)之外,圖片、視頻、教案、交互活動(dòng)記錄等非結(jié)構(gòu)化數(shù)據(jù)占據(jù)更大比重。

      (二)教育數(shù)據(jù)治理的現(xiàn)狀及問(wèn)題

      同其他行業(yè)一樣,教育領(lǐng)域也正在經(jīng)歷大數(shù)據(jù)時(shí)代帶來(lái)的機(jī)遇和挑戰(zhàn)。然而,對(duì)教育數(shù)據(jù)治理的研究卻還只是剛剛起步,嚴(yán)重影響了數(shù)據(jù)對(duì)教學(xué)和教育管理的支撐。即便有一些統(tǒng)計(jì)數(shù)據(jù)可用,其真實(shí)性和有效性也有待驗(yàn)證,對(duì)動(dòng)態(tài)教育信息的掌握也非常困難(嚴(yán)智雄, 等, 2011),更談不上利用數(shù)據(jù)科學(xué)決策了。

      教育研究者、探索者和管理部門(mén)已經(jīng)認(rèn)識(shí)到數(shù)據(jù)驅(qū)動(dòng)教育的重要性,并開(kāi)展了局部的實(shí)踐。目前,教育數(shù)據(jù)治理的研究集中在高校。例如,上海海洋大學(xué)在數(shù)字化校園建設(shè)中根據(jù)數(shù)據(jù)治理準(zhǔn)則將原本分散在不同信息系統(tǒng)的數(shù)據(jù)與業(yè)務(wù)流程進(jìn)行整合,集中在統(tǒng)一的公共數(shù)據(jù)庫(kù)中(李勇軍, 等, 2016)。還有一部分研究針對(duì)圖書(shū)館數(shù)據(jù)管理,包冬梅等(2015)提出了CALib數(shù)據(jù)治理框架,涵蓋了高校圖書(shū)館數(shù)據(jù)治理領(lǐng)域所包含的基本組件及其關(guān)系,從促成因素、范圍、實(shí)施與評(píng)估三個(gè)維度討論了高校圖書(shū)館數(shù)據(jù)治理原則。但是,尚未有人從區(qū)域的層面和整個(gè)教育行業(yè)的層面,以更全局的視野探討在大數(shù)據(jù)時(shí)代教育數(shù)據(jù)應(yīng)該如何治理的問(wèn)題。

      和其他行業(yè)數(shù)據(jù)應(yīng)用中遇到的問(wèn)題類(lèi)似,教育數(shù)據(jù)存在以下一些治理需求:

      其一,標(biāo)準(zhǔn)缺失,數(shù)據(jù)雜亂無(wú)章。大多數(shù)學(xué)校在信息管理系統(tǒng)建設(shè)時(shí)只考慮本單位的應(yīng)用,未考慮數(shù)據(jù)共享和交換,而區(qū)縣一級(jí)主管部門(mén)又未對(duì)信息數(shù)據(jù)統(tǒng)籌規(guī)劃,缺少統(tǒng)一的數(shù)據(jù)標(biāo)準(zhǔn)。集中表現(xiàn)為數(shù)據(jù)名稱(chēng)、數(shù)據(jù)長(zhǎng)度、數(shù)據(jù)規(guī)格不一致,以及關(guān)鍵數(shù)據(jù)缺失(吳志剛, 等, 2003)。

      其二,數(shù)據(jù)融合困難。學(xué)校是教育數(shù)據(jù)的主要生產(chǎn)者和使用者,也是數(shù)據(jù)價(jià)值鏈的源頭。由于管理層級(jí)的限制以及各校信息化發(fā)展水平差異,每個(gè)學(xué)校只掌握校內(nèi)的部分?jǐn)?shù)據(jù);各區(qū)縣教育局也只掌握了本區(qū)上報(bào)的部分?jǐn)?shù)據(jù),對(duì)于本區(qū)域的其他數(shù)據(jù)或是其他區(qū)域的基準(zhǔn)數(shù)據(jù)難以獲取。即便是已有的教育數(shù)據(jù),也只是海量數(shù)據(jù)中極少的一部分,如學(xué)籍、升學(xué)率、畢業(yè)率、考試成績(jī)等管理數(shù)據(jù),并未形成對(duì)教育數(shù)據(jù)的全局把控(許曉東, 等, 2015)。大量的教學(xué)過(guò)程數(shù)據(jù)無(wú)法獲取,成為數(shù)據(jù)孤島,無(wú)法進(jìn)行深度加工。

      其三,數(shù)據(jù)質(zhì)量存在挑戰(zhàn)。由于數(shù)據(jù)體量急劇擴(kuò)大,非結(jié)構(gòu)化數(shù)據(jù)猛增,教育大數(shù)據(jù)在存儲(chǔ)、分析、使用的過(guò)程中都面臨全新的挑戰(zhàn)。來(lái)源的復(fù)雜性導(dǎo)致數(shù)據(jù)定義的一致性、元數(shù)據(jù)定義的統(tǒng)一性無(wú)法得到保證,變化速度較快使得數(shù)據(jù)很容易過(guò)期,數(shù)據(jù)存儲(chǔ)方式的不合理會(huì)產(chǎn)生錯(cuò)誤、無(wú)效的數(shù)據(jù),動(dòng)態(tài)數(shù)據(jù)處理不及時(shí)會(huì)降低其價(jià)值(宗威, 等, 2013)。這些都給教育數(shù)據(jù)質(zhì)量帶來(lái)了極大的挑戰(zhàn)。

      四、教育數(shù)據(jù)治理的方法和案例

      (一)教育數(shù)據(jù)治理的方法

      通過(guò)對(duì)我國(guó)教育數(shù)據(jù)治理現(xiàn)實(shí)狀態(tài)以及存在問(wèn)題的分析,結(jié)合領(lǐng)先行業(yè)在數(shù)據(jù)治理方面的先進(jìn)經(jīng)驗(yàn),筆者提出一個(gè)可用于教育數(shù)據(jù)治理的框架(如圖3所示)。教育數(shù)據(jù)治理工作應(yīng)從組織機(jī)制、業(yè)務(wù)領(lǐng)域及關(guān)鍵技術(shù)三個(gè)方面推進(jìn)。核心業(yè)務(wù)領(lǐng)域包括教育數(shù)據(jù)標(biāo)準(zhǔn)化、教育數(shù)據(jù)的融合共享和教育數(shù)據(jù)隱私保護(hù)。完善這三個(gè)業(yè)務(wù)領(lǐng)域需要兩個(gè)基礎(chǔ)條件:一是建立數(shù)據(jù)治理的組織架構(gòu),科學(xué)的組織機(jī)構(gòu)設(shè)計(jì)和明確的職責(zé)分工是數(shù)據(jù)治理的制度基礎(chǔ);二是依據(jù)技術(shù)規(guī)范和實(shí)施辦法建立數(shù)據(jù)治理平臺(tái),并通過(guò)多種技術(shù)手段和工具實(shí)現(xiàn)對(duì)數(shù)據(jù)的治理。

      1. 設(shè)置教育數(shù)據(jù)治理的組織機(jī)構(gòu)

      從組織機(jī)構(gòu)來(lái)說(shuō),可以根據(jù)業(yè)務(wù)需要設(shè)置“教育數(shù)據(jù)治理委員會(huì)”及其執(zhí)行機(jī)構(gòu)“教育數(shù)據(jù)治理小組”。按行政層級(jí),可設(shè)置國(guó)家級(jí)、區(qū)域級(jí)和學(xué)校級(jí)的教育數(shù)據(jù)治理委員會(huì);從數(shù)據(jù)來(lái)源考慮,可對(duì)課程教學(xué)數(shù)據(jù)、學(xué)生數(shù)據(jù)、教師數(shù)據(jù)、基礎(chǔ)設(shè)施數(shù)據(jù)等建立專(zhuān)門(mén)的業(yè)務(wù)小組。數(shù)據(jù)治理委員會(huì)由各級(jí)領(lǐng)導(dǎo)和管理層組成,職責(zé)如下:①制定教育數(shù)據(jù)治理的原則、方針和政策,建立并更新相關(guān)規(guī)章制度,批準(zhǔn)和發(fā)布相關(guān)標(biāo)準(zhǔn)及業(yè)務(wù)指南;②實(shí)施和推進(jìn)教育數(shù)據(jù)治理工作。

      數(shù)據(jù)治理小組由負(fù)責(zé)具體業(yè)務(wù)的專(zhuān)業(yè)人員組成,可包括數(shù)據(jù)系統(tǒng)管理員、系統(tǒng)開(kāi)發(fā)和維護(hù)人員、業(yè)務(wù)專(zhuān)家和數(shù)據(jù)分析員等角色。小組成員需要鑒別和解決各自業(yè)務(wù)領(lǐng)域內(nèi)的數(shù)據(jù)問(wèn)題,并相互配合協(xié)作。例如,數(shù)據(jù)分析師可以和業(yè)務(wù)專(zhuān)家合作,通過(guò)分析學(xué)生成長(zhǎng)情況的大數(shù)據(jù),及時(shí)監(jiān)控學(xué)生的心理健康和生理健康狀況,從而提出相應(yīng)的決策建議。再如,教學(xué)專(zhuān)家和數(shù)據(jù)分析師合作通過(guò)對(duì)學(xué)生個(gè)體數(shù)據(jù)分析其差異性,設(shè)計(jì)多種個(gè)性化教學(xué)方案。

      圖3 教育數(shù)據(jù)治理框架

      2. 制定、完善數(shù)據(jù)標(biāo)準(zhǔn)和使用規(guī)范

      數(shù)據(jù)標(biāo)準(zhǔn)化是推進(jìn)數(shù)據(jù)治理時(shí)首先需要解決的問(wèn)題。統(tǒng)一的數(shù)據(jù)標(biāo)準(zhǔn)使得教育機(jī)構(gòu)的信息系統(tǒng)建設(shè)有據(jù)可依,不再出現(xiàn)因?yàn)楣?yīng)商不同而使數(shù)據(jù)無(wú)法讀取、共享和交換的情況。數(shù)據(jù)治理委員會(huì)應(yīng)從教育業(yè)務(wù)實(shí)際需求出發(fā),組織完成各類(lèi)標(biāo)準(zhǔn)的編制,包括技術(shù)標(biāo)準(zhǔn)、業(yè)務(wù)標(biāo)準(zhǔn)、管理標(biāo)準(zhǔn)、數(shù)據(jù)質(zhì)量標(biāo)準(zhǔn)等(覃炯聰, 2016)。標(biāo)準(zhǔn)的編制既要滿(mǎn)足上級(jí)部門(mén)的管理與統(tǒng)計(jì)需求,也要為校內(nèi)外的數(shù)據(jù)交換與共享服務(wù)(李勇軍, 2016)。標(biāo)準(zhǔn)化是一個(gè)長(zhǎng)期、持續(xù)的過(guò)程,在編制新標(biāo)準(zhǔn)時(shí)應(yīng)注意盡量吸納已有國(guó)家標(biāo)準(zhǔn)、行業(yè)標(biāo)準(zhǔn),并和已發(fā)布的標(biāo)準(zhǔn)保持一致。

      3. 推進(jìn)不同層次和不同維度的數(shù)據(jù)共享

      教育主管部門(mén)應(yīng)通過(guò)教育數(shù)據(jù)的共享和融合建立起對(duì)教育數(shù)據(jù)的全局把控。各個(gè)學(xué)校也可以此獲得區(qū)域教育發(fā)展水平的各項(xiàng)基準(zhǔn)數(shù)據(jù)作為組織教學(xué)的參考。教育數(shù)據(jù)共享是多層次、多維度的,不僅包括在教育系統(tǒng)內(nèi)的共享,還涉及對(duì)外信息公開(kāi)。為實(shí)現(xiàn)數(shù)據(jù)的整合和共享,需要建立統(tǒng)一的數(shù)據(jù)開(kāi)放平臺(tái)。

      在學(xué)校內(nèi)部,可利用統(tǒng)一數(shù)據(jù)平臺(tái)整合各個(gè)二級(jí)單位的管理數(shù)據(jù)、學(xué)生基本信息和行為數(shù)據(jù)、教學(xué)數(shù)據(jù)甚至是后勤管理數(shù)據(jù),這樣既可以提升管理的便捷性和有效性,強(qiáng)化管理,也可以分析教學(xué)過(guò)程的優(yōu)勢(shì)與不足,提升教學(xué)水平。校際之間則可以通過(guò)數(shù)據(jù)整合加強(qiáng)合作,如課程數(shù)據(jù)的共享、學(xué)習(xí)檔案的交換和共享等(王薇娜, 2016)。區(qū)域性的教育數(shù)據(jù)共享也是教育發(fā)展的趨勢(shì)之一。美國(guó)科羅拉多州教育部門(mén)開(kāi)發(fā)了全州綜合數(shù)據(jù)系統(tǒng),把178個(gè)學(xué)區(qū)和28所公立高校的學(xué)生數(shù)據(jù)與福利、收入和勞動(dòng)力整合起來(lái),用于分析學(xué)生從幼兒園到大學(xué)的成績(jī)。讓行政官員和任課教師都能夠通過(guò)該系統(tǒng)比較學(xué)生與該州基準(zhǔn)水平的差距,并且能夠分析家庭收入、學(xué)前教育和基礎(chǔ)教育供給水平對(duì)學(xué)生大學(xué)升學(xué)或就業(yè)的影響。

      4. 落實(shí)和健全數(shù)據(jù)隱私保護(hù)機(jī)制

      大數(shù)據(jù)蘊(yùn)含的巨大價(jià)值得到了業(yè)界的高度關(guān)注,挖掘大數(shù)據(jù)給我們帶來(lái)了巨大價(jià)值。然而,大數(shù)據(jù)在帶來(lái)便利的同時(shí),也會(huì)對(duì)個(gè)人隱私造成巨大風(fēng)險(xiǎn)(黃劉生, 等, 2015)。在教育領(lǐng)域,數(shù)據(jù)保護(hù)措施已經(jīng)落后于實(shí)踐的需要,數(shù)據(jù)隱私尚未得到廣泛的重視,缺乏合理、可行的措施和懲處機(jī)制。結(jié)合其他行業(yè)的成熟經(jīng)驗(yàn),數(shù)據(jù)隱私保護(hù)機(jī)制應(yīng)包括以下內(nèi)容:①隱私風(fēng)險(xiǎn)主動(dòng)監(jiān)測(cè),在處理大數(shù)據(jù)時(shí)要主動(dòng)監(jiān)測(cè)那些不正當(dāng)?shù)幕蛘哂袗阂獾牟僮?;②隱私風(fēng)險(xiǎn)主動(dòng)評(píng)估,能夠主動(dòng)分析出隱私風(fēng)險(xiǎn)大小,并選擇合理的隱私保護(hù)技術(shù);③問(wèn)責(zé)機(jī)制,當(dāng)某個(gè)實(shí)體的行為違反了策略和規(guī)則時(shí)應(yīng)當(dāng)受到規(guī)定的懲罰(孟小峰, 等, 2015)。

      5. 建設(shè)數(shù)據(jù)治理的技術(shù)平臺(tái)

      數(shù)據(jù)治理工作的落實(shí)依賴(lài)于信息技術(shù)平臺(tái)。各級(jí)教育部門(mén)的數(shù)據(jù)治理平臺(tái)建設(shè)應(yīng)以已有的信息系統(tǒng)為基礎(chǔ),引入業(yè)界的先進(jìn)技術(shù)和經(jīng)驗(yàn)。從滿(mǎn)足功能應(yīng)用出發(fā),以數(shù)據(jù)架構(gòu)為基礎(chǔ),加強(qiáng)數(shù)據(jù)庫(kù)設(shè)計(jì),建立區(qū)域級(jí)的數(shù)據(jù)中心,搭建數(shù)據(jù)質(zhì)量監(jiān)控平臺(tái),實(shí)施數(shù)據(jù)安全工作(高亮, 2014)。數(shù)據(jù)中心可以集聚零散數(shù)據(jù)、形成教育數(shù)據(jù)資源,然后基于先進(jìn)的分析軟件深度挖掘其中的價(jià)值;應(yīng)能夠直接與各單位自有的數(shù)據(jù)平臺(tái)無(wú)縫連接,直接匯總各單位的原始數(shù)據(jù);應(yīng)包括數(shù)據(jù)挖掘和分析及評(píng)估管理信息系統(tǒng),對(duì)數(shù)據(jù)挖掘分析的統(tǒng)計(jì)結(jié)果,并通過(guò)長(zhǎng)期的數(shù)據(jù)分析,對(duì)教育現(xiàn)狀輔助評(píng)估(許曉東, 等, 2015)。

      (二)教育數(shù)據(jù)治理的案例

      1. 新南威爾士大學(xué)的數(shù)據(jù)治理項(xiàng)目

      新南威爾士大學(xué),作為澳大利亞名校聯(lián)盟“八大名校”之一,是一所世界知名的研究型大學(xué)。為了改善數(shù)據(jù)資產(chǎn)管理,降低運(yùn)營(yíng)和管理風(fēng)險(xiǎn),該校于2017年發(fā)起了“數(shù)據(jù)治理”項(xiàng)目。這個(gè)項(xiàng)目對(duì)該校的數(shù)據(jù)政策和治理組織進(jìn)行了規(guī)劃和實(shí)踐,制定了包括人員分配、職責(zé)規(guī)定、數(shù)據(jù)整合規(guī)范、數(shù)據(jù)分類(lèi)和數(shù)據(jù)隱私保護(hù)方法等一系列數(shù)據(jù)治理政策,奠定了該校實(shí)現(xiàn)數(shù)據(jù)整合、保護(hù)數(shù)據(jù)安全、改善數(shù)據(jù)質(zhì)量以及提高數(shù)據(jù)使用效率的指導(dǎo)原則。該項(xiàng)目建立了一個(gè)較為完整的數(shù)據(jù)治理組織架構(gòu),描述了相關(guān)的角色及其職責(zé)(UNSW, 2017),如圖4所示。

      該項(xiàng)目確立了數(shù)據(jù)治理指導(dǎo)委員作為最高管理機(jī)構(gòu),負(fù)責(zé)指導(dǎo)項(xiàng)目決策,制定原則和標(biāo)準(zhǔn)。數(shù)據(jù)治理執(zhí)行委員會(huì)是該指導(dǎo)委員會(huì)的執(zhí)行部門(mén),監(jiān)督各項(xiàng)政策和規(guī)則的貫徹實(shí)施,并保障項(xiàng)目執(zhí)行過(guò)程和數(shù)據(jù)管理生命周期一致,同時(shí)負(fù)責(zé)檢查數(shù)據(jù)質(zhì)量,為問(wèn)題解決提供操作性指導(dǎo)。各部門(mén)的數(shù)據(jù)專(zhuān)員負(fù)責(zé)各自部門(mén)的數(shù)據(jù)質(zhì)量、數(shù)據(jù)整合及數(shù)據(jù)管理的實(shí)施執(zhí)行,監(jiān)督數(shù)據(jù)使用者的身份,識(shí)別和修復(fù)各自部門(mén)的數(shù)據(jù)問(wèn)題。業(yè)務(wù)專(zhuān)家包括數(shù)據(jù)庫(kù)管理員、系統(tǒng)管理員、業(yè)務(wù)領(lǐng)域?qū)<摇④浖_(kāi)發(fā)人員和業(yè)務(wù)分析師等,他們?yōu)閷W(xué)校數(shù)據(jù)信息治理的各項(xiàng)業(yè)務(wù)提供一線的支持和幫助。

      新南威爾士大學(xué)的數(shù)據(jù)治理項(xiàng)目建立了體系完善的數(shù)據(jù)治理組織架構(gòu),自上而下的管理層級(jí)保證了數(shù)據(jù)治理工作的推進(jìn)有執(zhí)行力,在整個(gè)體系中吸收了各類(lèi)人員的參與保證了具體的業(yè)務(wù)問(wèn)題能夠得到關(guān)注和解決。該案例中有三點(diǎn)具體經(jīng)驗(yàn)特別值得我們借鑒:①確立了數(shù)據(jù)治理的制度和流程,將過(guò)程和規(guī)則制度化,設(shè)定了清晰的邊界,使得各項(xiàng)和數(shù)據(jù)相關(guān)的業(yè)務(wù)有了清楚的依據(jù),并且以此為基礎(chǔ)優(yōu)化了數(shù)據(jù)治理的各項(xiàng)環(huán)節(jié)。②明確了整個(gè)數(shù)據(jù)治理工作的組織架構(gòu),以及各個(gè)層級(jí)和各類(lèi)人員的職能和責(zé)任,在組織架構(gòu)層面以制度為保證,較好地支持了數(shù)據(jù)治理工作,使得各類(lèi)數(shù)據(jù)項(xiàng)目能夠有序執(zhí)行。同時(shí),在出現(xiàn)數(shù)據(jù)問(wèn)題時(shí)也可以精確地找到責(zé)任人員,改善了原來(lái)數(shù)據(jù)管理工作中各個(gè)崗位工作職責(zé)不清的問(wèn)題。③建立了業(yè)務(wù)操作人員、技術(shù)專(zhuān)家和管理人員的協(xié)同和會(huì)商機(jī)制。數(shù)據(jù)治理工作往往是全局性的,某項(xiàng)數(shù)據(jù)管理和使用會(huì)涉及多個(gè)部門(mén)的多個(gè)崗位,這種協(xié)同機(jī)制使得治理業(yè)務(wù)中暴露出來(lái)的問(wèn)題能夠得到所有相關(guān)方的關(guān)注,并及時(shí)地識(shí)別、定位和解決。

      2. 美國(guó)堪薩斯州的數(shù)據(jù)治理項(xiàng)目

      教育數(shù)據(jù)交換網(wǎng)絡(luò)(Education Data Exchange Network, EDEN)是美國(guó)學(xué)校、州教育部門(mén)及聯(lián)邦教育部門(mén)進(jìn)行數(shù)據(jù)報(bào)送和交換的信息系統(tǒng)。長(zhǎng)期以來(lái),美國(guó)堪薩斯州教育部門(mén)在向EDEN提交數(shù)據(jù)時(shí)飽受各種問(wèn)題困擾,如數(shù)據(jù)不連續(xù)、數(shù)據(jù)質(zhì)量差、數(shù)據(jù)缺乏一致性、數(shù)據(jù)格式多樣等。解決這些問(wèn)題需要花費(fèi)大量的時(shí)間,且效果不理想。為了改善這種狀況,他們意識(shí)到對(duì)數(shù)據(jù)進(jìn)行治理的重要性,因此發(fā)起了一項(xiàng)數(shù)據(jù)治理項(xiàng)目(Kathy, 2007),通過(guò)近十年的努力逐步建立了州教育數(shù)據(jù)治理的流程和規(guī)范,用于保障教育數(shù)據(jù)的質(zhì)量。

      在整個(gè)數(shù)據(jù)治理流程中,數(shù)據(jù)部門(mén)進(jìn)行數(shù)據(jù)匯總和上報(bào)EDEN的主要業(yè)務(wù)流程和關(guān)鍵節(jié)點(diǎn)如圖5所示。整個(gè)過(guò)程可分為兩步:第一步,從數(shù)據(jù)源采集原始數(shù)據(jù),根據(jù)元數(shù)據(jù)倉(cāng)庫(kù)定義的轉(zhuǎn)換規(guī)則將從數(shù)據(jù)源采集到的數(shù)據(jù)轉(zhuǎn)換為滿(mǎn)足EDEN格式的數(shù)據(jù),并存儲(chǔ)到數(shù)據(jù)倉(cāng)庫(kù);第二步,到數(shù)據(jù)倉(cāng)庫(kù)提取數(shù)據(jù)并生成向EDEN提交的文件,并將文件提交到EDEN數(shù)據(jù)系統(tǒng)。數(shù)據(jù)治理工作涉及四個(gè)角色的技術(shù)人員:

      · EDEN協(xié)調(diào)員。負(fù)責(zé)從EDEN數(shù)據(jù)庫(kù)下載文件規(guī)范,并依據(jù)文件規(guī)范建立元數(shù)據(jù)庫(kù)。

      · 數(shù)據(jù)管理員。根據(jù)元數(shù)據(jù)倉(cāng)庫(kù)制定數(shù)據(jù)從數(shù)據(jù)源倉(cāng)庫(kù)下載存儲(chǔ)到數(shù)據(jù)倉(cāng)庫(kù)時(shí)的轉(zhuǎn)換規(guī)則,檢查數(shù)據(jù)質(zhì)量。

      · 數(shù)據(jù)倉(cāng)庫(kù)(ETL)程序員。根據(jù)數(shù)據(jù)管理者制定的數(shù)據(jù)轉(zhuǎn)換規(guī)則將數(shù)據(jù)從數(shù)據(jù)源系統(tǒng)抽取出來(lái),并以EDEN存儲(chǔ)格式存儲(chǔ)到數(shù)據(jù)倉(cāng)庫(kù)。

      · XML程序員。負(fù)責(zé)將單純的數(shù)據(jù)轉(zhuǎn)換為向EDEN提交的文件,并將文件提交到EDEN數(shù)據(jù)庫(kù)。

      在這個(gè)過(guò)程中,堪薩斯州的教育數(shù)據(jù)管理部門(mén)依據(jù)EDEN的數(shù)據(jù)文件規(guī)范,制定統(tǒng)一的數(shù)據(jù)采集和轉(zhuǎn)換規(guī)則,保障數(shù)據(jù)的一致性和標(biāo)準(zhǔn)化。同時(shí),教育部門(mén)的數(shù)據(jù)委員會(huì)還定期評(píng)估數(shù)據(jù)質(zhì)量。數(shù)據(jù)治理工作不僅需要建立各種基礎(chǔ)設(shè)施,如數(shù)據(jù)源采集系統(tǒng)、數(shù)據(jù)倉(cāng)庫(kù)、元數(shù)據(jù)倉(cāng)庫(kù)等,還要建立和維護(hù)項(xiàng)目文檔,包括EDEN提交計(jì)劃文檔、項(xiàng)目分解計(jì)劃文檔、通信文檔、角色職責(zé)分配文檔等。為了保證良好的工作溝通還要開(kāi)展工作交流會(huì),包括數(shù)據(jù)治理委員會(huì)會(huì)議、數(shù)據(jù)管理會(huì)議及EDEN現(xiàn)狀核心小組會(huì)議等。

      該案例具體介紹了堪薩斯州教育部門(mén)在數(shù)據(jù)管理和治理方面的經(jīng)驗(yàn)。主要有三個(gè)亮點(diǎn)可供我們參考:①數(shù)據(jù)治理的技術(shù)平臺(tái)和業(yè)務(wù)過(guò)程。其中涉及了數(shù)據(jù)源、數(shù)據(jù)倉(cāng)庫(kù)、外部數(shù)據(jù)庫(kù)等各種系統(tǒng),以及數(shù)據(jù)元描述,數(shù)據(jù)格式規(guī)范、轉(zhuǎn)換規(guī)則等技術(shù)規(guī)格。②技術(shù)人員的崗位職責(zé)。數(shù)據(jù)治理過(guò)程涉及數(shù)據(jù)管理員、程序員和協(xié)調(diào)人等不同的角色,他們的工作具有很強(qiáng)的專(zhuān)業(yè)性,相互銜接,各司其職,以保障整個(gè)治理工作得以有序進(jìn)行。③有序迭代的數(shù)據(jù)治理方案。該州的數(shù)據(jù)治理工作是逐年完善的,從一個(gè)較小的滿(mǎn)足EDEN數(shù)據(jù)提交的需求開(kāi)始,經(jīng)歷了多次迭代,直到實(shí)現(xiàn)全州教育數(shù)據(jù)的統(tǒng)合。在歷次迭代中,數(shù)據(jù)治理覆蓋的范圍逐步擴(kuò)大,涉及的人群和相關(guān)方也逐漸增加。通過(guò)持續(xù)的數(shù)據(jù)治理,堪薩斯州教育部門(mén)的數(shù)據(jù)管理水平有了顯著提升,在提高工作效率的同時(shí)減輕了工作人員的負(fù)擔(dān),較好地保證了數(shù)據(jù)的質(zhì)量和數(shù)據(jù)的一致性,實(shí)現(xiàn)了數(shù)據(jù)共享,數(shù)據(jù)安全性也得到了極大保障。

      五、總結(jié)

      大數(shù)據(jù)在教育領(lǐng)域內(nèi)有著廣泛的應(yīng)用前景和不可替代的作用。然而,傳統(tǒng)的數(shù)據(jù)分析、管理和利用方法在大數(shù)據(jù)時(shí)代不再適用,其局限性日益顯著。數(shù)據(jù)治理已經(jīng)成為教育數(shù)據(jù)管理中亟須解決的問(wèn)題。對(duì)教育數(shù)據(jù)進(jìn)行合理、有效的治理,對(duì)于教育發(fā)展和推動(dòng)教育改革有重大意義。首先,能夠幫助教育管理者做出更智能化、更綜合的教育管理決策,實(shí)現(xiàn)教育實(shí)踐和教育戰(zhàn)略的統(tǒng)一;其次,通過(guò)教育數(shù)據(jù)治理體系的建設(shè)可以將教育資源整合,并優(yōu)化教育資源配置,在某種程度上改善教育資源分配不公的情況;再次,通過(guò)教育數(shù)據(jù)治理體系的建設(shè)可以提升教育質(zhì)量,促進(jìn)教育個(gè)性化;最后,通過(guò)教育數(shù)據(jù)治理體系的建設(shè)可以從海量的教育數(shù)據(jù)中發(fā)現(xiàn)模式及規(guī)律,診斷現(xiàn)存問(wèn)題,預(yù)測(cè)教育發(fā)展趨勢(shì)。

      本研究通過(guò)對(duì)電子政務(wù)、金融及醫(yī)療健康等先發(fā)領(lǐng)域內(nèi)數(shù)據(jù)治理經(jīng)驗(yàn)的梳理,介紹了教育領(lǐng)域內(nèi)數(shù)據(jù)治理的現(xiàn)狀和存在的問(wèn)題,給出了相應(yīng)的建議,包括:制定和完善數(shù)據(jù)標(biāo)準(zhǔn)和使用規(guī)范,推進(jìn)不同層次和不同維度的數(shù)據(jù)共享,強(qiáng)化教育數(shù)據(jù)的質(zhì)量管理以及落實(shí)和健全數(shù)據(jù)隱私保護(hù)機(jī)制。當(dāng)然,本研究也存在一些不足。一方面,研究主要基于文獻(xiàn)研究和案例分析,借鑒其他行業(yè)中數(shù)據(jù)治理的經(jīng)驗(yàn)提出解決方案,這些建議在教育行業(yè)中落地和應(yīng)用可能會(huì)存在適應(yīng)性的問(wèn)題,未來(lái)應(yīng)通過(guò)教育數(shù)據(jù)治理實(shí)踐進(jìn)一步完善;另一方面,本研究更偏重理論的研究,對(duì)于數(shù)據(jù)治理的具體方法、步驟以及涉及的相關(guān)技術(shù)未作詳細(xì)介紹,這也將是筆者進(jìn)一步研究的起點(diǎn)。

      [參考文獻(xiàn)]

      Harper, J. 梁銘圖,譯. [2017-08-24]. 數(shù)據(jù)管理與數(shù)據(jù)治理的區(qū)別[EB/OL]. [2018-01-23]. http://www.cicpa.org.cn/Column/hyxxhckzl/xxjsyqy/qyjs/201708/W020170802478861099722.pdf

      包冬梅,范穎捷,李鳴. 2015. 高校圖書(shū)館數(shù)據(jù)治理及其框架[J]. 圖書(shū)情報(bào)工作(18):134-141.

      陳真勇,徐州川,李清廣,呂衛(wèi)鋒,熊璋. 2014. 一種新的智慧城市數(shù)據(jù)共享和融合框架——SCLDF[J]. 計(jì)算機(jī)研究與發(fā)展,51(02):290-301.

      常朝娣,陳敏. 2016. 大數(shù)據(jù)時(shí)代醫(yī)療健康數(shù)據(jù)治理方法研究[J]. 中國(guó)數(shù)字醫(yī)學(xué)(09):2-5.

      丁寧,馬浩琴. 2013. 國(guó)外高??茖W(xué)數(shù)據(jù)生命周期管理模型比較研究及借鑒[J]. 圖書(shū)情報(bào)工作,57(06):18-22.

      杜婧敏,方海光,李維楊,仝賽賽. 2016. 教育大數(shù)據(jù)研究綜述[J]. 中國(guó)教育信息化(19):1-4.

      范靈俊,洪學(xué)海,黃晁,華崗,李國(guó)杰. 2016. 政府大數(shù)據(jù)治理的挑戰(zhàn)及對(duì)策[J]. 大數(shù)據(jù),2(03):27-38.

      高漢松,桑梓勤. 2013. 醫(yī)療行業(yè)大數(shù)據(jù)生命周期及治理[J]. 醫(yī)學(xué)信息學(xué)雜(09):7-11.

      高亮. 2014. 數(shù)據(jù)治理:讓數(shù)據(jù)質(zhì)量更好[J]. 中國(guó)教育網(wǎng)絡(luò)(12):64-66.

      黃劉生,田苗苗,黃河. 2015. 大數(shù)據(jù)隱私保護(hù)密碼技術(shù)研究綜述[J]. 軟件學(xué)報(bào)(04):945-959.

      李文彬,陳醉. 2016. 大數(shù)據(jù)時(shí)代的地方政府?dāng)?shù)據(jù)應(yīng)用[J]. 行政論壇(06):13-19.

      李勇軍,彭琳,林成,陸秋玉,夏月芳. 2016. 大數(shù)據(jù)治理在高校信息化管理中的探究[J]. 中國(guó)管理信息化,19(03):185-187.

      孟小峰,張嘯劍. 2015. 大數(shù)據(jù)隱私管理[J]. 計(jì)算機(jī)研究與發(fā)展,52(02):265-281.

      覃炯聰. 2016. 大數(shù)據(jù)背景下的數(shù)據(jù)治理模式. 信息與電腦(16):155-156.

      沈建苗. 2007. 數(shù)據(jù)治理成功的六個(gè)步驟[N]. 計(jì)算機(jī)世界(B07).

      佚名. 2012. 商業(yè)銀行數(shù)據(jù)治理體系構(gòu)建思考[J]. 中國(guó)金融電腦(02):23-27.

      沈建苗. 2012. 大數(shù)據(jù)應(yīng)用:理想照進(jìn)現(xiàn)實(shí)[N]. 計(jì)算機(jī)世界(020).

      桑尼爾·索雷斯. 2014. 大數(shù)據(jù)治理[M]. 北京:清華大學(xué)出版社.

      申孟宜,谷彬. 2014. 論大數(shù)據(jù)時(shí)代的政府監(jiān)管[J]. 中國(guó)市場(chǎng)(36):32-40.

      孫廣芝,朱會(huì)彥,張立芬,孫兆洋. 2015. 數(shù)據(jù)標(biāo)準(zhǔn)在稅務(wù)數(shù)據(jù)治理中的應(yīng)用初探[J]. 中國(guó)標(biāo)準(zhǔn)化(09):73-76.

      吳志剛,林寧. 2003. 信息共享、業(yè)務(wù)協(xié)同的前提——數(shù)據(jù)標(biāo)準(zhǔn)化[J]. 信息技術(shù)與標(biāo)準(zhǔn)化(Z1):43-44.

      王帆. 2015. 從智慧教育視角論教育數(shù)據(jù)的變遷與潛能[J]. 中國(guó)電化教育(08):10-15.

      王薇娜. 2016. 大數(shù)據(jù)時(shí)代的教育管理變革[J]. 教師(32):109-110.

      許文,潘明道,徐明圣,王昭. 2012. 結(jié)合銀行業(yè)務(wù)特點(diǎn)開(kāi)展數(shù)據(jù)治理工作[J]. 銀行家(12):125-128.

      許曉東,王錦華,卞良,孟倩. 2015. 高等教育的數(shù)據(jù)治理研究[J]. 高等工程教育研究(05):25-30.

      嚴(yán)智雄,馬和民. 2011. 政府教育問(wèn)責(zé)與治理對(duì)策[J]. 南京社會(huì)科學(xué)(05):113-118.

      楊現(xiàn)民,王榴卉,唐斯斯. 2015. 教育大數(shù)據(jù)的應(yīng)用模式與政策建議[J]. 電化教育研究,36(09):54-61,69.

      張一鳴. 2012. 數(shù)據(jù)治理過(guò)程淺析[J]. 中國(guó)信息界(09):15-17.

      宗威,吳鋒. 2013. 大數(shù)據(jù)時(shí)代下數(shù)據(jù)質(zhì)量的挑戰(zhàn)[J]. 西安交通大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版),33(05):38-43.

      CMMI. (2016, May 12). Why Is Measurement of Data Management Maturity (DMM) So Important? Retrieved January 23, 2018, from http://cmmiinstitute.com/sites/default/files/resource_asset/DMM_White_paper_web%202016.pdf

      DAMA. (2012). The DAMA guide to the data management body of knowledge. Technics Publications, LLC,45-47.

      DAMA. (2014, March 17). DAMA-DMBOK2 Framework. Retrieved January 23, 2018, from https://dama.org/sites/default/files/download/DAMA-DMBOK2-Framework-V2-20140317-FINAL.pdf

      EDUCASE. (2017, November 14). Data governance. Retrieved November 24, 2017, from https://library.educause.edu/topics/information- systems-and-services/data-governance

      Gosa, K. (2007, May 4). Data governance: the Kansas approach. Retrieved November 24, 2017, from https://www.slideshare.net/Aamir97/data-governance-the-kansas-approach-ppt

      UNSW. (2017, February 20). Data governance policy. Retrieved November 21, 2017, from https://www.gs.unsw.edu.au/policy/documents/datagovernancepolicy.pdf

      Watson H. J. (2011). Business analytics insight: hype or here to stay, Review of Business intelligence, 16(1):4-8.

      收稿日期:2017-12-27

      定稿日期:2018-01-29

      作者簡(jiǎn)介:李青,博士,教授,碩士生導(dǎo)師;韓俊紅,碩士研究生。北京郵電大學(xué)教育技術(shù)研究所(100876)。

      責(zé)任編輯 韓世梅

      猜你喜歡
      數(shù)據(jù)管理教育
      國(guó)外教育奇趣
      企業(yè)級(jí)BOM數(shù)據(jù)管理概要
      題解教育『三問(wèn)』
      定制化汽車(chē)制造的數(shù)據(jù)管理分析
      軟件工程教育與教學(xué)改革
      海洋環(huán)境數(shù)據(jù)管理優(yōu)化與實(shí)踐
      CTCS-2級(jí)報(bào)文數(shù)據(jù)管理需求分析和實(shí)現(xiàn)
      什么是“好的教育”?
      教育有道——關(guān)于閩派教育的一點(diǎn)思考
      列控?cái)?shù)據(jù)管理平臺(tái)的開(kāi)發(fā)
      克山县| 皋兰县| 峨边| 元阳县| 临清市| 崇阳县| 固阳县| 崇仁县| 黄平县| 吉首市| 青河县| 德钦县| 游戏| 巴楚县| 美姑县| 宝兴县| 桂阳县| 沽源县| 七台河市| 灵川县| 横峰县| 乾安县| 铜山县| 温宿县| 台南县| 环江| 达孜县| 盘锦市| 龙井市| 萨迦县| 凯里市| 柳江县| 永登县| 上饶县| 大丰市| 浦北县| 漾濞| 正蓝旗| 凤阳县| 吴江市| 梨树县|