文/陳偉
近些年,不少高校陸續(xù)進(jìn)行了專項(xiàng)數(shù)據(jù)治理工作,在促進(jìn)數(shù)據(jù)質(zhì)量的完整性、準(zhǔn)確性等方面取得了一定成效的同時(shí),也暴露了一些問題。本文總結(jié)了目前的高校常見數(shù)據(jù)治理模式、方法、路徑,探討了如何利用互聯(lián)網(wǎng)+的思想重塑整個(gè)數(shù)據(jù)治理體系,提出了以大數(shù)據(jù)、人工智能等新技術(shù)構(gòu)建用戶自治理模式的校園數(shù)據(jù)治理體系,從而有效提升數(shù)據(jù)質(zhì)量,滿足下一代智慧校園建設(shè)的需要。
從數(shù)字校園到智慧校園建設(shè)演進(jìn)的過程中,數(shù)據(jù)質(zhì)量問題成為困擾廣大教育信息化工作者的一個(gè)難題。數(shù)據(jù)治理(Data Governance)是保證數(shù)據(jù)質(zhì)量的必需手段,加強(qiáng)數(shù)據(jù)治理提升數(shù)據(jù)質(zhì)量已成為教育信息化工作者的重要任務(wù)。如何通過數(shù)據(jù)治理解決數(shù)據(jù)的完整性(Completeness)、規(guī)范性(Conformity)、準(zhǔn)確性(Accuracy)、唯一性(Uniqueness)、關(guān)聯(lián)性(Integration)等多方面的問題,從技術(shù)層面到管理層面多個(gè)方面,先行者已經(jīng)做了很多探索。
數(shù)據(jù)治理是指在數(shù)據(jù)資產(chǎn)價(jià)值創(chuàng)造的過程中,治理團(tuán)隊(duì)對(duì)數(shù)據(jù)資產(chǎn)管理的評(píng)價(jià)、指導(dǎo)和控制,核心是加強(qiáng)對(duì)數(shù)據(jù)資產(chǎn)的管控,通過深化數(shù)據(jù)服務(wù),持續(xù)創(chuàng)造價(jià)值。數(shù)據(jù)治理工作包括:數(shù)據(jù)生命周期管理、數(shù)據(jù)安全管理、數(shù)據(jù)質(zhì)量管理、元數(shù)據(jù)及數(shù)據(jù)模型管理、數(shù)據(jù)標(biāo)準(zhǔn)管理。
在大數(shù)據(jù)時(shí)代,高校數(shù)據(jù)治理的范疇包括主數(shù)據(jù)、業(yè)務(wù)數(shù)據(jù)、分析數(shù)據(jù)等全量數(shù)據(jù)。新一代的數(shù)據(jù)治理,需要用更智能化、現(xiàn)代化的方法實(shí)現(xiàn)服務(wù)廣大師生的目標(biāo),幫助學(xué)校實(shí)現(xiàn)數(shù)據(jù)標(biāo)準(zhǔn)構(gòu)建、數(shù)據(jù)模型設(shè)計(jì)、數(shù)據(jù)協(xié)同機(jī)制、數(shù)據(jù)服務(wù)的全過程。
目前高校數(shù)據(jù)治理框架主要包含三方面內(nèi)容:
第一,有效的高校內(nèi)部數(shù)據(jù)標(biāo)準(zhǔn)體系,包括數(shù)據(jù)標(biāo)準(zhǔn)、管理標(biāo)準(zhǔn)、質(zhì)量標(biāo)準(zhǔn)等內(nèi)容,并保證各業(yè)務(wù)部門、各業(yè)務(wù)系統(tǒng)能得到落實(shí)與管控。落實(shí)到治理工具上,主要體現(xiàn)在元數(shù)據(jù)管理功能是否得到詳細(xì)認(rèn)真的設(shè)計(jì)、應(yīng)用,助力于業(yè)務(wù)系統(tǒng)。例如,元數(shù)據(jù)中除了應(yīng)設(shè)有國(guó)標(biāo)、行業(yè)標(biāo)體系(如地理、行政區(qū)劃,學(xué)科門類、專業(yè)等)的數(shù)據(jù)之外,還應(yīng)涉及應(yīng)用系列校標(biāo)數(shù)據(jù),如建筑物、樓宇體系等。
第二,完成各業(yè)務(wù)系統(tǒng)的整合工作。完成用戶集成、數(shù)據(jù)集成、業(yè)務(wù)集成工作,消除信息孤島,完善數(shù)據(jù)中心建設(shè)。首先,盡可能在被集成的業(yè)務(wù)系統(tǒng),即產(chǎn)生數(shù)據(jù)的源系統(tǒng)中解決數(shù)據(jù)質(zhì)量問題,這對(duì)于整個(gè)體系的數(shù)據(jù)治理來說是非常高效的措施。其次,在各業(yè)務(wù)系統(tǒng)及平臺(tái)的建設(shè)過程中,描述核心業(yè)務(wù)實(shí)體的數(shù)據(jù),如教師、學(xué)生、教學(xué)、科研、資產(chǎn)、財(cái)務(wù)等,交換、共享性要求較高,均要被納入到主數(shù)據(jù)范圍,形成全校范圍內(nèi)一致的、完整的、準(zhǔn)確的核心業(yè)務(wù)數(shù)據(jù),由數(shù)據(jù)中心統(tǒng)一對(duì)外提供數(shù)據(jù)服務(wù)。最后,落實(shí)到數(shù)據(jù)治理平臺(tái)上,集中反映在主數(shù)據(jù)管理是否完備,是否能以多種數(shù)據(jù)共享形式服務(wù)于各類應(yīng)用。
第三,評(píng)估數(shù)據(jù)質(zhì)量,生成數(shù)據(jù)質(zhì)量報(bào)告。以數(shù)據(jù)標(biāo)準(zhǔn)體系為基準(zhǔn),以數(shù)據(jù)治理平臺(tái)為工具,數(shù)據(jù)管理員對(duì)整個(gè)主數(shù)據(jù)(或者全量數(shù)據(jù))質(zhì)量檢測(cè),根據(jù)實(shí)際需求,利用檢測(cè)數(shù)據(jù)進(jìn)行單一主題或者整體進(jìn)行數(shù)據(jù)質(zhì)量分析,生成數(shù)據(jù)質(zhì)量報(bào)告。在數(shù)據(jù)質(zhì)量報(bào)告的基礎(chǔ)上,結(jié)合系統(tǒng)配置好的數(shù)據(jù)管控體系,生成針對(duì)部門、業(yè)務(wù)數(shù)據(jù)管理員的各子數(shù)據(jù)集整改報(bào)告。
在治理驅(qū)動(dòng)路徑選擇上,目前很多高校認(rèn)同自上而下的驅(qū)動(dòng)形式,成立分管領(lǐng)導(dǎo)甚至主要領(lǐng)導(dǎo)牽頭的工作小組,以強(qiáng)大的行政力強(qiáng)力推動(dòng),取得了不錯(cuò)的成效;也有的學(xué)校以信息部門為主進(jìn)行驅(qū)動(dòng),聚焦于解決具體問題由點(diǎn)帶面自下而上的形式,從而在較小的投入下取得成效。
對(duì)于信息部門來說,數(shù)據(jù)治理就是把系統(tǒng)生成的數(shù)據(jù)質(zhì)量報(bào)告分發(fā)給各部門,因?yàn)椴挥|及業(yè)務(wù),在其他方面也很難著力。對(duì)于業(yè)務(wù)部門來說,數(shù)據(jù)治理就是按照信息部門交付的整改報(bào)告,錄入、審核、調(diào)整數(shù)據(jù);此外,要求廣大師生在各業(yè)務(wù)系統(tǒng)終端錄入、核驗(yàn)個(gè)人數(shù)據(jù),核驗(yàn)用戶數(shù)據(jù)是否真實(shí)準(zhǔn)確也非常繁復(fù)。
治理工作階段性完成后,通過數(shù)據(jù)平臺(tái)以多樣化的數(shù)據(jù)服務(wù)形式提供給廣大師生使用。數(shù)據(jù)治理受益最明顯、最直接的是廣大師生,數(shù)據(jù)治理也往往先從師生聚焦的共享性高的數(shù)據(jù)子集開始,如教學(xué)、科研、人事信息等等。但在數(shù)據(jù)治理過程中,參與感最低的卻是師生。師生在具體業(yè)務(wù)場(chǎng)景使用數(shù)據(jù)的過程中,發(fā)現(xiàn)的數(shù)據(jù)質(zhì)量問題,又很難有及時(shí)、有效的機(jī)制,完成從反饋到整改的整個(gè)業(yè)務(wù)閉環(huán),從而使用戶體驗(yàn)很差(如圖1 所示)。
圖1 傳統(tǒng)數(shù)據(jù)治理過程
因?yàn)閮?nèi)生驅(qū)動(dòng)力不足,目前高校數(shù)據(jù)治理主要方式可以形象地稱為“運(yùn)動(dòng)式”。領(lǐng)導(dǎo)動(dòng)員強(qiáng)調(diào),信息部門三令五聲要求,業(yè)務(wù)部門加班加點(diǎn)落實(shí),數(shù)據(jù)質(zhì)量得到有效提升。但是,治理周期一過,數(shù)據(jù)質(zhì)量馬上下滑。這個(gè)問題不可避免,因?yàn)闃I(yè)務(wù)數(shù)據(jù)不斷產(chǎn)生,數(shù)據(jù)治理工作無法一蹴而就,如果沒有長(zhǎng)效機(jī)制保障,數(shù)據(jù)治理永遠(yuǎn)在路上。
數(shù)據(jù)與服務(wù),兩者相輔相成,互為依托。數(shù)據(jù)治理,是一項(xiàng)基礎(chǔ)性、長(zhǎng)期性的工作。在數(shù)據(jù)服務(wù)需求不明確、不突出時(shí),單方面推進(jìn)數(shù)據(jù)治理,困難極大,成效也很難凸顯。有成效一類,解決問題一類,從而逐漸突破,提升數(shù)據(jù)質(zhì)量。
目前數(shù)據(jù)治理工作均基于傳統(tǒng)數(shù)字化校園體系開展,由相關(guān)人員圍繞業(yè)務(wù)系統(tǒng)、數(shù)據(jù)中心進(jìn)行數(shù)據(jù)治理,各系統(tǒng)均為傳統(tǒng)管理信息系統(tǒng)設(shè)計(jì)思路,以面向管理的方式開展工作。在下一代智慧校園建設(shè)過程中,業(yè)務(wù)系統(tǒng)開始逐步被微服務(wù)體系解構(gòu)、替代,廣大師生更加注重于基于大數(shù)據(jù)、人工智能等新技術(shù)環(huán)境下面向服務(wù)體系架構(gòu)的用戶體驗(yàn)。新的技術(shù)架構(gòu)、新的服務(wù)場(chǎng)景,數(shù)據(jù)治理如何開展,也到了亟待變革的時(shí)候。
數(shù)據(jù)治理,從名稱上看就是典型的管理信息系統(tǒng)思維模式的產(chǎn)物。治理就是一項(xiàng)管理工作,就需要管理部門的介入,被治理的,就是廣大普通用戶,在高校就是廣大師生。
在各種服務(wù)使用的過程中,互聯(lián)網(wǎng)公司不知不覺的完成了數(shù)據(jù)治理工作,以To C 將龐大的數(shù)據(jù)采集需求分散到各種微小的服務(wù)中,并且馬上讓用戶有獲得感,潤(rùn)物無聲地完成數(shù)據(jù)治理工作。
高校信息化產(chǎn)品、服務(wù)的設(shè)計(jì),傳統(tǒng)To B 思維居多,買單的是學(xué)校管理部門,設(shè)計(jì)思路自然也圍繞管理人員展開,也導(dǎo)致了上述許多問題。數(shù)據(jù)治理最終受益的是廣大師生,數(shù)據(jù)治理產(chǎn)品是To B 模式還是To C 模式設(shè)計(jì),這是根源性的問題。只有以用戶為中心設(shè)計(jì)產(chǎn)品、體系乃至整個(gè)解決方案,才能真正獲得用戶的認(rèn)同(如圖2 所示)。
智慧校園的數(shù)據(jù)治理產(chǎn)品、方案設(shè)計(jì),也應(yīng)該以業(yè)務(wù)需求為牽引,在微服務(wù)應(yīng)用的過程中便可以完成數(shù)據(jù)采集、修訂等工作,同時(shí)在數(shù)據(jù)管理人員支持下,以大數(shù)據(jù)、人工智能的技術(shù)手段為依托,厘清個(gè)人數(shù)據(jù)、業(yè)務(wù)數(shù)據(jù)、主數(shù)據(jù)的關(guān)系,適時(shí)寫入主數(shù)據(jù),形成業(yè)務(wù)閉環(huán),實(shí)現(xiàn)圍繞師生為核心的需求、治理、服務(wù)的全業(yè)務(wù)閉環(huán)體系,完成整個(gè)治理過程。業(yè)務(wù)的應(yīng)用每時(shí)每刻在進(jìn)行,數(shù)據(jù)的治理工作也一直在進(jìn)行,從而杜絕運(yùn)動(dòng)式的數(shù)據(jù)治理模式,保持?jǐn)?shù)據(jù)質(zhì)量穩(wěn)定。
目前,已經(jīng)有從事高校信息化領(lǐng)域的公司開始以To C 模式,圍繞廣大師生需求為核心設(shè)計(jì)、推廣相關(guān)產(chǎn)品,取得了不錯(cuò)的效果。
如何圍繞廣大師生需求,做好數(shù)據(jù)治理工作,相關(guān)運(yùn)營(yíng)體系的建立是必然趨勢(shì)。構(gòu)建起從廣大用戶、業(yè)務(wù)系統(tǒng)管理者、數(shù)據(jù)中心管理者多角色參與的運(yùn)營(yíng)指標(biāo)體系,從問題解決率、解決時(shí)效、數(shù)據(jù)質(zhì)量等方面建立關(guān)于以上多角色的評(píng)價(jià)指標(biāo),通過系統(tǒng)記錄、跟蹤數(shù)據(jù)治理整個(gè)過程,持續(xù)進(jìn)行整改優(yōu)化,必要時(shí)進(jìn)行一定的考核,持續(xù)促進(jìn)數(shù)據(jù)質(zhì)量提升。
圖2 服務(wù)引領(lǐng),用戶自治理的數(shù)據(jù)治理模式
在數(shù)據(jù)采集、填報(bào)的過程中,傳統(tǒng)形式均為手工錄入方式,由用戶或者管理人員錄入相關(guān)信息,形成最初的數(shù)據(jù)來源。實(shí)際上,因?yàn)榧夹g(shù)方法的進(jìn)步,很多數(shù)據(jù)可以用更方便的方法獲取、組織管理起來,從而大大節(jié)省工作量,提高治理效率。如元數(shù)據(jù)信息,通過網(wǎng)絡(luò)爬蟲、自然語言處理、人工智能等算法,實(shí)現(xiàn)知識(shí)提?。晃磥砜勺詣?dòng)構(gòu)建成起知識(shí)圖譜,利用智能搜索、關(guān)聯(lián)查詢手段,為師生自動(dòng)化提供更加精確的數(shù)據(jù),高效率、智能化完成數(shù)據(jù)治理工作。
2018 年4 月,教育部正式印發(fā)《教育信息化2.0 行動(dòng)計(jì)劃》,推動(dòng)教育信息化從融合應(yīng)用向創(chuàng)新發(fā)展轉(zhuǎn)變。不同于以信息技術(shù)(Information Technology)為基礎(chǔ)的教育信息化1.0,教育信息化2.0以數(shù)據(jù)技術(shù)(Data Technology)為基礎(chǔ),將一切參與主體、教育元素、教育行為數(shù)據(jù)化將是教育信息化2.0 的基本特征。我們需要思考,如何推動(dòng)教育信息化從傳統(tǒng)業(yè)務(wù)的融合應(yīng)用向創(chuàng)新發(fā)展進(jìn)行轉(zhuǎn)變。教育信息化作為一個(gè)競(jìng)爭(zhēng)不充分、發(fā)展落后的細(xì)分行業(yè),相關(guān)從業(yè)者一定要認(rèn)真關(guān)注各種新技術(shù)的發(fā)展,思考其在高校落地的具體結(jié)合場(chǎng)景,要打破頭腦中思想的桎梏,吸取優(yōu)秀行業(yè)經(jīng)驗(yàn),探索互聯(lián)網(wǎng)思維在校園信息化中的應(yīng)用與實(shí)踐,這樣才能真正做出師生有感知、有溫度的產(chǎn)品、方案,才能真正提升高校信息化水平。