程廣明
摘 要:介紹了“大數(shù)據(jù)治理”的概念,提出了人與組織、策略和能力的三維架構大數(shù)據(jù)治理模型,并在此基礎上提出了包括初始級、基本級、定義級、管理級和優(yōu)化級五個評價等級的大數(shù)據(jù)治理成熟度評估模型。
關鍵詞:大數(shù)據(jù);數(shù)據(jù)治理;成熟度評估;策略
中圖分類號:TP274 文獻標識碼:A DOI:10.15913/j.cnki.kjycx.2016.09.006
隨著云計算、物聯(lián)網(wǎng)、移動互聯(lián)網(wǎng)等新一代信息技術的快速發(fā)展,人類產(chǎn)生的數(shù)據(jù)量呈指數(shù)級增長。據(jù)資料顯示,2012年,全球數(shù)據(jù)量達到2.8 ZB,預計到2020年,全球數(shù)據(jù)量將達到40 ZB。大數(shù)據(jù)蘊含著巨大的價值,如今,互聯(lián)網(wǎng)、電信和金融等行業(yè)的眾多企業(yè)已將數(shù)據(jù)視作企業(yè)的寶貴資產(chǎn)。然而,數(shù)據(jù)價值密度與數(shù)據(jù)總量成反比。面對巨大的數(shù)據(jù)規(guī)模,如何管理和利用數(shù)據(jù),使其發(fā)揮價值是企業(yè)必須考慮的重要問題。大數(shù)據(jù)的價值所在使其面臨著隱私和安全方面的威脅。大數(shù)據(jù)治理將組織的部門、流程、人等元素與數(shù)據(jù)的整個生命周期聯(lián)系在了一起,對組織數(shù)據(jù)管理和保護有著至關重要的作用。
1 大數(shù)據(jù)治理的定義
“大數(shù)據(jù)治理”不是一個橫空出世的概念,它是在傳統(tǒng)的數(shù)據(jù)治理基礎上提出的適應大數(shù)據(jù)時代的產(chǎn)物。《DGI數(shù)據(jù)治理框架》一文將數(shù)據(jù)治理定義為“數(shù)據(jù)相關事務的決策和授權的執(zhí)行”,并進一步解釋為信息處理過程決策權和職責的策略,約定了由誰負責處理哪些信息,并在什么情況下采用哪種方法,以及何時來執(zhí)行。也有學者將數(shù)據(jù)治理定義為“組織架構、規(guī)則、人員權利和義務、處理信息的信息系統(tǒng)”。
美國學者桑尼爾·索雷斯在《大數(shù)據(jù)治理》一書中這樣定義大數(shù)據(jù)治理:“大數(shù)據(jù)治理是廣泛信息治理計劃的一部分,即制訂與大數(shù)據(jù)有關的數(shù)據(jù)優(yōu)化、隱私保護和數(shù)據(jù)變現(xiàn)的政策。
我們可以對上述大數(shù)據(jù)治理定義作進一步的分解解讀。首先,大數(shù)據(jù)治理是信息治理計劃的一部分,這是其定位。這就要求組織在制訂信息治理框架時,必須將大數(shù)據(jù)納入其中,比如在信息治理委員會中增加數(shù)據(jù)科學家,在信息治理目標中增加大數(shù)據(jù)治理目標等。其次,大數(shù)據(jù)治理主要是數(shù)據(jù)處理的一系列相關政策的制訂,這是其內(nèi)涵。再次,必須優(yōu)化大數(shù)據(jù),這是大數(shù)據(jù)治理的重點。大數(shù)據(jù)體量大、種類繁多,且價值密度低,組織必須對其進行優(yōu)化,比如定義元數(shù)據(jù)、凈化大數(shù)據(jù)、實施數(shù)據(jù)生命周期管理等。從次,大數(shù)據(jù)隱私保護至關重要,這是大數(shù)據(jù)治理的約束??此茮]有任何價值的單一數(shù)據(jù)集合在一起時,會發(fā)現(xiàn)新的價值,這是大數(shù)據(jù)價值體現(xiàn)的重要途徑之一。而大數(shù)據(jù)價值的體現(xiàn)往往會涉及數(shù)據(jù)的隱私,這就要求組織在進行大數(shù)據(jù)價值體現(xiàn)時,必須注重大數(shù)據(jù)的隱私處理。最后,大數(shù)據(jù)必須變現(xiàn),這是大數(shù)據(jù)治理的目的所在。組織將數(shù)據(jù)視作其資產(chǎn)的一種,要將其轉(zhuǎn)化成組織可以使用的現(xiàn)金,而變現(xiàn)的方式可以是單純地出售數(shù)據(jù)本身,也可以是利用數(shù)據(jù)開發(fā)新業(yè)務。
2 大數(shù)據(jù)治理模型
基于以上概念分析,我們可以將大數(shù)據(jù)治理模型理解為人與組織、策略和能力的三維架構。人與組織是數(shù)據(jù)治理的主體,涉及政府、企業(yè)界、學術界、社會組織、自然人等,他們分別承擔著不同的治理職責。策略是大數(shù)據(jù)治理的工具,能力是大數(shù)據(jù)治理的手段。圖1所示為大數(shù)據(jù)治理模型三維架構。
具體來說,人與組織包含利益相關者、治理委員會、管理委員會和內(nèi)部員工。利益相關者指組織內(nèi)部和外部環(huán)境中受組織決策和行動影響的任何相關者,數(shù)據(jù)的產(chǎn)生者、管理者、使用者和監(jiān)督者等;治理委員會是組織治理數(shù)據(jù)的最高機構,負責作出數(shù)據(jù)相關事務的決定,并將數(shù)據(jù)治理標準和措施匯報給數(shù)據(jù)的利益相關者;管理委員會負責具體實施治理委員會制定的各項數(shù)據(jù)治理決定,并將數(shù)據(jù)治理結果匯報給治理委員會;內(nèi)部員工是數(shù)據(jù)治理架構中不可或缺的一部分,貫徹執(zhí)行數(shù)據(jù)治理委員會和管理委員會制定的各項數(shù)據(jù)治理策略。
策略是組織制定的所有與大數(shù)據(jù)有關的數(shù)據(jù)優(yōu)化、隱私保護和數(shù)據(jù)變現(xiàn)的準則和規(guī)范,包括組織數(shù)據(jù)治理的使命和愿景、治理指標、數(shù)據(jù)治理規(guī)則和定義、權利與職責、控制措施。數(shù)據(jù)治理的使命和愿景包括數(shù)據(jù)治理的整體目標,給予數(shù)據(jù)利益相關者持續(xù)與跨界的數(shù)據(jù)保護和服務,不合規(guī)準則引發(fā)的問題的解決方案等;數(shù)據(jù)治理指標定義了數(shù)據(jù)治理目標的衡量方法;數(shù)據(jù)治理規(guī)則和定義包括與數(shù)據(jù)相關的政策、標準、合規(guī)要求、業(yè)務規(guī)則和數(shù)據(jù)定義等;權利和職責規(guī)定了由誰來負責制訂數(shù)據(jù)相關的決策、何時實施、如何實施,以及組織和個人在數(shù)據(jù)治理策略中該做什么;控制措施主要針對數(shù)據(jù)未治理風險防范和數(shù)據(jù)治理過程中可能發(fā)生的各類風險,以及如何做好數(shù)據(jù)隱私保護。
能力則反映了組織進行數(shù)據(jù)治理所具備的條件和水平,包括元數(shù)據(jù)管理、數(shù)據(jù)質(zhì)量管理、業(yè)務流程整合、主數(shù)據(jù)管理和信息生命周期管理。元數(shù)據(jù)是描述數(shù)據(jù)的數(shù)據(jù),即描述數(shù)據(jù)和信息資源的信息。元數(shù)據(jù)管理就是整合大數(shù)據(jù)與企業(yè)的元數(shù)據(jù)庫。數(shù)據(jù)質(zhì)量管理準則包括數(shù)據(jù)識別、采集、測量、提升和論證質(zhì)量、整合組織數(shù)據(jù)的方法,比如具備應對非結構化數(shù)據(jù)占據(jù)數(shù)據(jù)總量絕大部分情況的能力。業(yè)務流程整合要求組織制定的大數(shù)據(jù)治理計劃必須與組織的核心業(yè)務流程相匹配,以便從核心業(yè)務流程中獲取大數(shù)據(jù)治理的關鍵支持政策。主數(shù)據(jù)管理描述了一組規(guī)程、技術和解決方案,用于維護業(yè)務數(shù)據(jù)的一致性、完整性、相關性和精確性。大數(shù)據(jù)治理需要制訂將大數(shù)據(jù)整合到主數(shù)據(jù)管理環(huán)境的政策。信息生命周期管理則要求組織判斷應該將何種數(shù)據(jù)保留在數(shù)據(jù)分析系統(tǒng),何種數(shù)據(jù)需要存檔,何種數(shù)據(jù)需要刪除。
3 大數(shù)據(jù)治理成熟度評估
表1 大數(shù)據(jù)治理成熟度等級評價表
等級 等級描述
初始級 a.沒有定義與數(shù)據(jù)治理相關的架構和角色
b.沒有正式的數(shù)據(jù)治理策略
c.不具備數(shù)據(jù)治理能力
基本級 a.定義了數(shù)據(jù)治理角色和職責,管理者意識到數(shù)據(jù)治理的重要性,但對管理知識知之甚少
b.已有的數(shù)據(jù)治理策略已經(jīng)文件化,但不具有連貫性
c.數(shù)據(jù)治理能力十分有限,只有很少一部分人掌握數(shù)據(jù)治理通用級別的知識
定義級 a.定義了數(shù)據(jù)治理角色和職責,管理者能主動推動數(shù)據(jù)治理計劃實施
b.數(shù)據(jù)策略已經(jīng)文件化,并涵蓋了針對特殊數(shù)據(jù)的治理策略;策略通過公共渠道容易獲取,大多數(shù)利益相關者能夠理解
c.具備數(shù)據(jù)治理的全部要素,一部分人知道詳細的數(shù)據(jù)治理能力
管理級 a.定義了完備的數(shù)據(jù)治理角色和職責,并有專門的數(shù)據(jù)質(zhì)量專家,管理者能主動推動數(shù)據(jù)治理計劃實施
b.所有的數(shù)據(jù)策略都已經(jīng)文件化,并且是審計合規(guī)的,都能通過公用渠道獲取,數(shù)據(jù)治理利益相關者主動關注策略的增添、更新和刪除
c.所有定義的數(shù)據(jù)治理能力層級都有可用的方法,建立了系統(tǒng)化的數(shù)據(jù)治理處理流程
優(yōu)化級 a.定義了完備的數(shù)據(jù)治理角色和職責,管理委員會來自各個部門,擁有元數(shù)據(jù)管理小組、數(shù)據(jù)質(zhì)量技能中心、主數(shù)據(jù)管理委員會等
b.所有的數(shù)據(jù)策略都已經(jīng)文件化,并且是審計合規(guī)的,所有的數(shù)據(jù)治理利益相關者都參與了策略發(fā)展過程;制訂了自動化的政策,以保證數(shù)據(jù)在整個組織內(nèi)保持一致、準確和可靠
c.所有定義的數(shù)據(jù)治理能力層級所指定的部門和關鍵數(shù)據(jù)是固定的,能夠在數(shù)據(jù)處于靜態(tài)和動態(tài)時進行數(shù)據(jù)質(zhì)量修復,數(shù)據(jù)不間斷地被跟蹤檢查,且任何偏離標準的問題都可以立即解決
成熟度評估是組織大數(shù)據(jù)治理狀態(tài)和能力的一種衡量方式。大數(shù)據(jù)治理模型共三個維度,具體涵蓋14個評價指標。每個指標分別以5個等級來衡量其成熟度,然后再統(tǒng)籌考慮評價指標權重,得到組織大數(shù)據(jù)治理的整體成熟度評價。根據(jù)綜合評價結果,組織大數(shù)據(jù)治理成熟度可以分為以下5個等級,即初始級、基本級、定義級、管理級和優(yōu)化級。
4 總結
數(shù)據(jù)體量巨大、種類繁多、價值密度低和處理速度快是大數(shù)據(jù)的四大主要特征。面對爆發(fā)式增長的大數(shù)據(jù),開展大數(shù)據(jù)治理是充分利用數(shù)據(jù)價值、保護數(shù)據(jù)隱私和安全等的重要途徑。結合前期研究,本文提出了人與組織、策略和能力的三維架構大數(shù)據(jù)治理模型,并制定了詳細的成熟度評價指標,對組織的大數(shù)據(jù)治理狀況進行評價,提出了包括初始級、基本級、定義級、管理級和優(yōu)化級5個等級的大數(shù)據(jù)治理成熟度評價模型。
參考文獻
[1]Sunil Soares,著.大數(shù)據(jù)治理[M].匡斌,譯.北京:清華大學出版社,2014.
〔編輯:劉曉芳〕