黃安 鄧明體
作者簡介:黃安,1984年生,廣西南寧人,研究生,講師,研究方向為計算機應用與軟件開發(fā);鄧明體,1986年生,通訊作者,廣西百色人,本科,高級工程師,研究方向為計算機應用與軟件開發(fā)。
摘 要:當前,高職院校的信息管理數(shù)據(jù)日益增長。高職院校要充分利用信息管理數(shù)據(jù),挖掘其潛在價值,可以從管理元數(shù)據(jù)入手,設計一個科學的數(shù)據(jù)治理模型,建設數(shù)據(jù)管理平臺,以此促進高職院校的數(shù)字化轉型發(fā)展。該研究以廣西水利電力職業(yè)技術學院數(shù)據(jù)管理平臺為實例,提出在區(qū)塊鏈視角下的高職院校數(shù)據(jù)治理思路,闡述元數(shù)據(jù)管理、數(shù)據(jù)集成等治理工作的開展方法,認為高職院??苫谀K化思想建設數(shù)據(jù)管理平臺,重點對元數(shù)據(jù)進行管理,開展數(shù)據(jù)管理可視化建設,形成適合高職院校的數(shù)據(jù)治理模式。
關鍵詞:區(qū)塊鏈;數(shù)據(jù)治理;數(shù)字校園建設;高職院校
中圖分類號:G64 文獻標識碼:A 文章編號:0450-9889(2024)09-0079-05
近年來,高職院校對數(shù)據(jù)信息化的要求不斷提高,高職院校各類信息平臺優(yōu)化升級迫在眉睫。構建高職院校數(shù)據(jù)治理平臺成為滿足學校各部門數(shù)據(jù)共享需求的現(xiàn)行主流解決方案。從智慧校園的角度來看,現(xiàn)階段高職院校數(shù)據(jù)治理平臺對數(shù)據(jù)的處理普遍存在隱私性難以保證、缺乏語義、比較零散、缺乏模型復用、體系不夠完善等問題。因此,選擇一種人機交互性更強的語義數(shù)據(jù)治理方式進行高職院校業(yè)務領域中知識共享的相關研究,對高職院校數(shù)據(jù)治理平臺的建設及高職院校數(shù)字化轉型的發(fā)展非常重要。本研究基于區(qū)塊鏈[1]視角,結合當前主流數(shù)據(jù)治理框架構建高職院校數(shù)據(jù)治理模型,嘗試利用區(qū)塊鏈優(yōu)勢并結合Kettle[2]數(shù)據(jù)轉換工具的長處,開發(fā)適合高職院校的數(shù)據(jù)治理平臺,以期為高職院校數(shù)字化轉型提供支持。
一、區(qū)塊鏈和數(shù)據(jù)治理簡述
(一)區(qū)塊鏈
區(qū)塊鏈相當于一個去中介化的數(shù)據(jù)庫,它由一串數(shù)據(jù)塊組成,采用分布式數(shù)據(jù)存儲,是多種技術的創(chuàng)新應用模式。通俗地說,可以把區(qū)塊鏈當成一種分布式“財務記賬本”。這種“財務記賬本”分布在多個網絡節(jié)點中,具有防篡改的功能。
區(qū)塊鏈顛覆了傳統(tǒng)的信息系統(tǒng)建設模式??蓪⒒ヂ?lián)網比作一個可隨時參加的多人交流會,當個人或多人發(fā)生了信息改變,他們會公布信息,交流會成員可以將信息記錄在自己的加密小本子上,任何人均可查閱小本子但不能修改。而當大家需要選擇正確信息時,可以查看所有人的小本子并選擇多數(shù)人記錄相同的信息。每個人的小本子就相當于區(qū)塊,交流會就相當于用鏈條把這些小本子串聯(lián)起來,由此形成了區(qū)塊鏈。這是使用區(qū)塊鏈技術解決方案的優(yōu)勢,利用區(qū)塊鏈沒有中心、沒有隱藏、沒有不信任等特點,實現(xiàn)沒有丟失、沒有操控的模式,從而給高職院校數(shù)字化轉型提供全新的方案。
區(qū)塊鏈包含了公有鏈、聯(lián)盟鏈、私有鏈。公有鏈是由每一個參與其中的人自由組成,任何人都可以隨時進入或者退出,沒有任何限制,但進入或退出期間的信息會被參與的人所知道或記錄。聯(lián)盟鏈是由多個人或多個團體自行組建,參與的人或團體是事先指定或是后期經過審核才能進入,它有一定的準入機制,其信息的寫入與讀取權限由組建的人或團體決定。私有鏈相當于個人或某一單位利用區(qū)塊鏈的技術存儲信息,只有本人或本單位有寫入信息的權限和決定信息是否對外公開的權限。
區(qū)塊鏈具有以下特征:(1)沒有中心[3]。區(qū)塊鏈技術不依賴某一個人或某一方,它沒有中心,也可以說每一個用戶都是中心,因為其信息存在每一個用戶的手中,沒有所謂的信息集中的地方。(2)沒有隱藏。依托區(qū)塊鏈技術,每一個用戶都可以查看、核對、記錄公開的信息。(3)沒有不信任。區(qū)塊鏈技術為每一個用戶都提供了一本相同的小本子,用戶可以通過自己的本子或是其他大部分用戶的本子查看或核對相關信息,無法欺騙,信任問題因此迎刃而解。(4)沒有丟失。區(qū)塊鏈技術解決了信息丟失問題,即便某用戶暫時丟失信息,也可以通過其他用戶找到。(5)沒有操控。只要用戶不能同時掌控記錄信息的大部分的“人”,就不能修改網絡上的數(shù)據(jù)。(6)可匿名性。單從技術上而言,各區(qū)塊節(jié)點之間只是單純的信息公開,身份可選擇隱藏,區(qū)塊鏈中的信息傳遞可以匿名進行。
(二)數(shù)據(jù)治理
數(shù)據(jù)治理(Data Governance)[4]指在管理數(shù)據(jù)資產過程中行使權力和管控,包括計劃、監(jiān)控和實施。高職院校需要依托數(shù)據(jù)進行決策。建立了正式數(shù)據(jù)治理規(guī)程的、有意向性地行使權力和管控的高職院校,能夠從數(shù)據(jù)治理過程中獲得更大的收益。在高職院校中,數(shù)據(jù)治理是指導所有其他數(shù)據(jù)管理領域的活動。
有效的數(shù)據(jù)治理有利于推進高職院校數(shù)字化建設,主要表現(xiàn)在四個方面:其一,數(shù)據(jù)質量提升,通過真實可信的數(shù)據(jù)提升業(yè)務能力;其二,元數(shù)據(jù)管理規(guī)范,建立業(yè)務術語表用于定義和定位組織中的數(shù)據(jù),確保組織中數(shù)量繁多的元數(shù)據(jù)得到有效管理和應用;其三,提升項目開發(fā)效率,在系統(tǒng)生命周期中改進以解決高職院校數(shù)據(jù)管理問題,包括利用數(shù)據(jù)全周期治理來管理特定數(shù)據(jù)的技術債;其四,提高各類資產數(shù)據(jù)管理效率,包括云存儲、外部數(shù)據(jù)采購、數(shù)據(jù)產品銷售和外包數(shù)據(jù)運維。
數(shù)據(jù)治理不是一次性的行為,而是一個持續(xù)性的項目集。數(shù)據(jù)治理可以保證高職院校一直能夠挖掘數(shù)據(jù)價值和降低數(shù)據(jù)風險。高職院校需要建立運轉良好的運營框架,指定專門的部門承擔數(shù)據(jù)治理的責任。此外,在數(shù)據(jù)治理程序中應該考慮到高職院校文化的獨特性問題,以及數(shù)據(jù)管理在高職院校內面對的具體挑戰(zhàn)和機遇。
二、高職院校數(shù)據(jù)治理的思路
目前,很多高職院校存在數(shù)據(jù)時效性偏低、師生參與數(shù)據(jù)治理意識不強、缺乏可執(zhí)行的信息系統(tǒng)平臺支持、數(shù)據(jù)安全措施不到位、數(shù)據(jù)治理標準不統(tǒng)一等問題。分析其原因,主要是部分高職院校在校園數(shù)字化建設中未做好整體規(guī)劃,為了滿足某個院系或者某個部門的業(yè)務需求,形成一個個單獨的業(yè)務系統(tǒng),各系統(tǒng)彼此無法實現(xiàn)數(shù)據(jù)共享,致使“數(shù)據(jù)孤島”現(xiàn)象產生。高職院校應從頂層設計數(shù)據(jù)系統(tǒng)架構,統(tǒng)一數(shù)據(jù)標準,構建數(shù)據(jù)集合以匯集現(xiàn)有數(shù)據(jù)資源,增強師生主動參與學校數(shù)據(jù)治理的意識。本研究嘗試通過高職院校數(shù)據(jù)治理,全面提升數(shù)據(jù)價值,重塑業(yè)務流程,以支撐高職院校數(shù)字化轉型。在技術方面,利用BIM模型、云平臺、物聯(lián)網、移動終端、智能系統(tǒng)等抽取數(shù)據(jù)并進行處理;在方法方面,使用知識推理、流域仿真、業(yè)務協(xié)同、數(shù)據(jù)集成、物聯(lián)感知等;在工具方面,使用數(shù)據(jù)平臺、模型平臺、知識平臺、業(yè)務平臺、服務平臺等。最終形成高職院校數(shù)據(jù)治理的數(shù)字化轉型框架,如圖1所示。
圖1 高職院校數(shù)據(jù)治理的數(shù)字化轉型框架
通過閱讀相關資料發(fā)現(xiàn),目前的主流數(shù)據(jù)治理體系有IBM數(shù)據(jù)治理體系、DGI數(shù)據(jù)治理體系、DAMA數(shù)據(jù)治理體系等[5]。其中,在IBM數(shù)據(jù)治理體系下,數(shù)據(jù)是一種資源,更是組織發(fā)展時的核心資產,數(shù)據(jù)治理可以當成一種數(shù)據(jù)資產來看待。本研究的數(shù)據(jù)治理核心思想是以數(shù)據(jù)治理技術為抓手,反向監(jiān)督、促進業(yè)務數(shù)據(jù)管理規(guī)范化,形成建設與管理的閉環(huán)反饋。在DAMA框架下進行進一步的研究,以解決高職院校數(shù)據(jù)系統(tǒng)架構不統(tǒng)一、數(shù)據(jù)標準不一致、數(shù)據(jù)資源缺乏、師生主動參與數(shù)據(jù)治理意識不強等問題為重點,設計元數(shù)據(jù)管理、數(shù)據(jù)集成、數(shù)據(jù)治理等模塊,構成高職院校數(shù)據(jù)治理框架。由于數(shù)據(jù)具有專業(yè)性,各個部門和院系之間相互獨立,針對此現(xiàn)象,系統(tǒng)設計實現(xiàn)了數(shù)據(jù)在各個職能部門之間的傳遞,形成了數(shù)據(jù)共享環(huán)路。高職院校數(shù)據(jù)共享體系如下頁圖2所示。
三、高職院校數(shù)據(jù)治理的方法
(一)管理元數(shù)據(jù)
元數(shù)據(jù)被定義為“描述數(shù)據(jù)的數(shù)據(jù)”,其表現(xiàn)形式在正常情況下是結構化的文字與數(shù)字,乃至于結構化圖形的形式,其描述的數(shù)據(jù)是多源的。元數(shù)據(jù)不僅可以對信息對象本身進行描述,而且能夠描述信息對象相關方面的信息,如操作人員、版本更新時間等。元數(shù)據(jù)對信息對象進行描述是一個步步深化的過程,在其最開始應用的時候,主要用于描述文獻、圖像、視頻、音頻等資源的屬性信息及其結構信息。其規(guī)定元數(shù)據(jù)內具體內容的描述規(guī)范,例如描述元素的時候應采用固定標準與自定義描述要求等。本研究以系統(tǒng)域的思想組織元數(shù)據(jù),建立系統(tǒng)域與數(shù)據(jù)庫的關系,經歷“注冊數(shù)據(jù)源—采集元數(shù)據(jù)—抽取數(shù)據(jù)管理—構建系統(tǒng)域級關系”的過程,從而得到不同業(yè)務的數(shù)據(jù)。元數(shù)據(jù)管理過程如圖3所示。
(二)數(shù)據(jù)集成
數(shù)字化轉型在高職院校信息化建設過程中產生了大量的異構數(shù)據(jù),如科研數(shù)據(jù)、學生“一卡通”數(shù)據(jù)等,從這些數(shù)據(jù)中提取價值是高職院校實現(xiàn)數(shù)字化轉型的重要任務。如何從產生的異構數(shù)據(jù)中抽取有用的數(shù)據(jù)供大數(shù)據(jù)分析和應用,是高職院校當下面臨的難題。為了提高數(shù)據(jù)質量,實現(xiàn)數(shù)據(jù)共享和交換,高職院??衫脭?shù)據(jù)集成消除數(shù)據(jù)的冗余和矛盾,使數(shù)據(jù)能夠更好地支持高職院校的業(yè)務運作和決策分析。然而,傳統(tǒng)的數(shù)據(jù)集成技術存在復雜度高、易錯性高、性能偏低和不易擴展等問題。這些問題在實際應用中會影響數(shù)據(jù)集成的效率和穩(wěn)定性。相對于傳統(tǒng)的集成技術,Kettle能夠更加高效地完成數(shù)據(jù)集成和轉換任務。由于高職院校數(shù)據(jù)在質量、采集、應用、互通上都有別于其他數(shù)據(jù),因此高職院校數(shù)據(jù)的集成過程與其他數(shù)據(jù)也有所不同。本研究設計了一個Kettle數(shù)據(jù)轉換流程以適應高職院校數(shù)據(jù)的集成過程,解決了現(xiàn)有應用中存在的及時更新慢、集成效率低的問題,如下頁圖4所示。
四、高職院校數(shù)據(jù)治理的實踐案例
采用上述高職院校數(shù)據(jù)治理思路與方法,我們在廣西水利電力職業(yè)技術學院開展高職院校數(shù)據(jù)治理實踐探索。截至2023年10月,廣西水利電力職業(yè)技術學院數(shù)據(jù)管理平臺共接入數(shù)據(jù)源12個,建設數(shù)據(jù)接口52個,數(shù)據(jù)接口共享調用超過23萬次,數(shù)據(jù)下載超過1萬次。數(shù)據(jù)管理平臺較好地滿足了廣西水利電力職業(yè)技術學院對數(shù)據(jù)的需求,打通了監(jiān)控、預警、教學資源等多個業(yè)務系統(tǒng)之間的數(shù)據(jù)壁壘,為其辦事一體化提供了支持。
(一)數(shù)據(jù)管理平臺建設
構建廣西水利電力職業(yè)技術學院數(shù)據(jù)管理平臺,其數(shù)據(jù)采用ETL進行數(shù)據(jù)集成,開展數(shù)據(jù)治理。該平臺采用模塊化思想建設,保證各模塊能脫離其他模塊單獨運行。元數(shù)據(jù)管理以業(yè)務系統(tǒng)為主線,組織元數(shù)據(jù)目錄,支持用戶配置元數(shù)據(jù)抽取策略,定時抽取數(shù)據(jù)庫元數(shù)據(jù),抽取結果可與已發(fā)布的元數(shù)據(jù)版本比較,用戶可以決定是否更新發(fā)布版本。在自動抽取數(shù)據(jù)庫元數(shù)據(jù)的基礎上,用戶還可以根據(jù)實際數(shù)據(jù)情況自行編輯錄入元數(shù)據(jù)之間的關系。該平臺元數(shù)據(jù)管理界面如下頁圖5所示。
目前,該平臺的開發(fā)還有待完善,未來的建設將從以下幾個方面開展。第一,元數(shù)據(jù)在高職院校數(shù)據(jù)管理平臺中的接口應用可以更加豐富。目前,其應用功能的實現(xiàn)是基于元數(shù)據(jù)的語義細粒度數(shù)據(jù)單元接口,暫且只能對基于業(yè)務寫定的數(shù)據(jù)調用方案進行不復雜的語義查詢,下一步可根據(jù)用戶權限范圍內的需求,為用戶生成自定義的查詢語句,以適應實際場景中的查詢需求。第二,根據(jù)高職院校數(shù)據(jù)管理平臺中不斷更新的數(shù)據(jù)主體應用需求,完善數(shù)據(jù)管理平臺元數(shù)據(jù)構建方案,使主體數(shù)據(jù)元數(shù)據(jù)更加符合需求。高校業(yè)務領域具有多變性,需要不定時地針對最新的方針政策更新數(shù)據(jù)融合模型及元數(shù)據(jù)標準。第三,在數(shù)據(jù)管理平臺中運用元數(shù)據(jù)模型和相關技術,及時根據(jù)用戶反饋進行優(yōu)化,同時遷移到其他信息領域中使用。元數(shù)據(jù)規(guī)范和本體構建的可復用性為其他領域的應用提供了可實現(xiàn)的基礎。在數(shù)據(jù)管理平臺中對元數(shù)據(jù)進行本體知識抽取的語義化處理屬于管理應用上的一種創(chuàng)新,充分利用元數(shù)據(jù)在提高數(shù)據(jù)融合時的數(shù)據(jù)資源管理能力,能降低用戶在使用數(shù)據(jù)資源時的理解成本,可見,元數(shù)據(jù)在高職院校數(shù)據(jù)管理平臺中的應用有廣闊的前景。
(二)數(shù)據(jù)管理可視化建設
數(shù)據(jù)治理,除了建設數(shù)據(jù)管理平臺以提供有效的、規(guī)范的數(shù)據(jù)給不同業(yè)務系統(tǒng)調用,可視化建設也必不可少?;诳梢暬夹g的數(shù)據(jù)管理建設在高職院校數(shù)字化轉型中具有重要意義。例如,通過三維建模技術、虛擬現(xiàn)實技術(VR)和可視化技術,可以更直觀地呈現(xiàn)數(shù)據(jù)價值,提高數(shù)據(jù)的可理解性和可接受性,這能為高職院校領導制定決策提供參考。目前,廣西水利電力職業(yè)技術學院數(shù)據(jù)管理平臺采用可視化技術將大量的數(shù)據(jù)通過圖表、圖形等形式呈現(xiàn)出來,以便用戶更好地理解和分析。在建設方案展示和演示中,可以利用數(shù)據(jù)可視化技術展示相關數(shù)據(jù)的變化趨勢、關聯(lián)關系等,幫助高職院校管理者更好地評估建設方案的可行性和效果。例如,通過動態(tài)的柱狀圖展示不同設計方案的成本、效益等指標,可以直觀地比較其優(yōu)勢和劣勢。廣西水利電力職業(yè)技術學院數(shù)據(jù)管理平臺的數(shù)據(jù)集成功能,就是一個很好的數(shù)據(jù)管理可視化建設的應用例子。數(shù)據(jù)集成為跨數(shù)據(jù)庫的數(shù)據(jù)查詢和加工提供數(shù)據(jù)融合功能,為單一數(shù)據(jù)庫內的統(tǒng)計聯(lián)合查詢提供主題表創(chuàng)建功能,數(shù)據(jù)最終集成為多個常用的高職院校數(shù)據(jù)主題,供后續(xù)各業(yè)務系統(tǒng)進行主題分析。
綜上所述,本研究提出利用區(qū)塊鏈技術的特點,結合Kettle工具制作ETL程序將高職院校數(shù)據(jù)進行清洗并裝載到數(shù)據(jù)治理平臺,通過實時調度系統(tǒng)持續(xù)對數(shù)據(jù)進行更新,保證數(shù)據(jù)的可用性,最后通過業(yè)務可視化建設的方式為使用者提供可用的數(shù)據(jù)。所提出的數(shù)據(jù)分析、數(shù)據(jù)抽取、數(shù)據(jù)更新、元數(shù)據(jù)管理等集成流程,成功應用在廣西水利電力職業(yè)技術學院數(shù)據(jù)治理平臺項目中,使用結果顯示,此數(shù)據(jù)治理流程可以解決高職院校的“數(shù)據(jù)孤島”問題,打破了學校各部門之間的信息隔閡,提高了信息安全性,能充分挖掘數(shù)據(jù)的潛在價值,為高職院校數(shù)字化轉型提供了有力支持。
參考文獻
[1]楊艷.區(qū)塊鏈技術在電子檔案管理中的應用路徑研究[J].蘭臺內外,2023(36):39-41.
[2]葉惠仙.基于Kettle構建互聯(lián)互通標準數(shù)據(jù)庫[J].網絡安全技術與應用,2023(11):55-57.
[3]殷紅梅.基于區(qū)塊鏈的政務信息服務研究[J].電腦與電信,2022(9):39-43.
[4]吳衛(wèi)明,陳藝純.合規(guī)視角的銀行業(yè)數(shù)據(jù)治理體系建設[J].金融科技時代,2022(9):43-49.
[5]孫學忠,胡偉.跨境貿易大數(shù)據(jù)平臺數(shù)據(jù)治理及框架研究[J].中國口岸科學技術,2020(10):69-75.
注:本文系2023年廣西高校中青年教師科研基礎能力提升項目“教育數(shù)字化背景下,高校數(shù)據(jù)治理的探索與研究”(2023KY1231)、2024年廣西高校中青年教師科研基礎能力提升項目“基于Spring Boot框架水文遠程測流平臺”(2024KY1202)的研究成果。
(責編 雷 靖)