程廣明 李堯 劉小茵
摘 要:分析了云計算環(huán)境下的數(shù)據(jù)的特點,提出了云端數(shù)據(jù)治理定義,并將該定義分解成三個部分進行深入解讀,最后對比了云端數(shù)據(jù)治理與傳統(tǒng)數(shù)據(jù)治理和大數(shù)據(jù)治理在概念上的區(qū)別與聯(lián)系。
關(guān)鍵詞:數(shù)據(jù)治理 云端數(shù)據(jù)治理 大數(shù)據(jù) 云計算
中圖分類號:TP274 文獻標識碼:A 文章編號:1674-098X(2017)06(a)-0185-02
在傳統(tǒng)數(shù)據(jù)治理領(lǐng)域,國際數(shù)據(jù)管理協(xié)會(DAMA)、數(shù)據(jù)治理研究所(DGI)、IBM、CMMI研究所、Gartner、普華永道等組織提出了多種數(shù)據(jù)治理框架或數(shù)據(jù)治理模型[1]。云計算環(huán)境下數(shù)據(jù)特點發(fā)生了很多的變化,尤其是數(shù)據(jù)在云端的操作給數(shù)據(jù)治理帶來了很多新的內(nèi)容,如云端數(shù)據(jù)來源的多樣性、云端數(shù)據(jù)的遠程存儲與傳輸、云端數(shù)據(jù)的合規(guī)要求更復雜性、云端數(shù)據(jù)面臨的安全威脅更多等,都超越了傳統(tǒng)數(shù)據(jù)治理的范疇。
1 云端數(shù)據(jù)治理定義
云端數(shù)據(jù)治理是以云端數(shù)據(jù)為主要治理對象,制定與云端數(shù)據(jù)戰(zhàn)略、數(shù)據(jù)管理、數(shù)據(jù)優(yōu)化、數(shù)據(jù)安全與隱私保護等相關(guān)策略,指導組織規(guī)劃、構(gòu)建、評估和優(yōu)化數(shù)據(jù)治理體系的活動集合。
我們將上述云端數(shù)據(jù)治理的定義分解為以下三個部分。
(1)云端數(shù)據(jù)治理的主要治理對象為云端數(shù)據(jù)。
隨著云計算的廣泛部署和深入應(yīng)用,現(xiàn)階段及未來相當長一段時間內(nèi),根據(jù)數(shù)據(jù)的存儲位置劃分,數(shù)據(jù)可以分為本地數(shù)據(jù)和云端數(shù)據(jù)。數(shù)據(jù)本地存儲是互聯(lián)網(wǎng)發(fā)展起來之前數(shù)據(jù)存放的主要形式,此時的數(shù)據(jù)量是相對較小的,組織對其管理也相對比較容易。隨著互聯(lián)網(wǎng)、云計算等技術(shù)的廣泛應(yīng)用,越來越多的用戶選擇把數(shù)據(jù)存儲在云平臺上。
云端數(shù)據(jù)主要來源于兩大部分:一是組織本地數(shù)據(jù)向云端的遷移,二是云端自身數(shù)據(jù)的聚合。從數(shù)據(jù)成分上來看,云端數(shù)據(jù)除了是傳統(tǒng)格式化數(shù)據(jù)外,更多的是半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)。
(2)云端數(shù)據(jù)治理關(guān)乎云端數(shù)據(jù)戰(zhàn)略、數(shù)據(jù)管理、數(shù)據(jù)優(yōu)化、數(shù)據(jù)安全與隱私保護等相關(guān)的策略。
云端數(shù)據(jù)治理關(guān)乎策略策的制定,這些策略成為開展數(shù)據(jù)治理的指導文件和措施依據(jù),包括數(shù)據(jù)治理戰(zhàn)略、數(shù)據(jù)管理策略、數(shù)據(jù)優(yōu)化策略、數(shù)據(jù)安全與隱私保護策略等。
戰(zhàn)略是一項活動的宏觀性綱領(lǐng),是一種從全局考慮謀劃實現(xiàn)全局目標的規(guī)劃。數(shù)據(jù)治理戰(zhàn)略是對數(shù)據(jù)治理活動的頂層設(shè)計和遠程規(guī)劃,其目的是在數(shù)據(jù)治理活動得到數(shù)據(jù)治理相關(guān)者的理解和認同前提下,對未來一段時間內(nèi)數(shù)據(jù)治理活動規(guī)劃。
數(shù)據(jù)管理是對數(shù)據(jù)進行基礎(chǔ)規(guī)范以支撐數(shù)據(jù)治理整個活動的實施,涉及業(yè)務(wù)術(shù)語、元數(shù)據(jù)管理和主數(shù)據(jù)管理等。業(yè)務(wù)術(shù)語是數(shù)據(jù)治理的基礎(chǔ),是為了獲得組織對某項事情有個統(tǒng)一的認識。例如,對數(shù)據(jù)治理成本的進行估算時,究竟是采取以“萬元”為單位還是以“元”為單位,又或是當進行數(shù)據(jù)整理時,小數(shù)點后數(shù)值保留幾位,要不要“四舍五入”還是“取整去零”等。
云端數(shù)據(jù)必須優(yōu)化,不是所有數(shù)據(jù)都是可以直接使用的。一方面,云端數(shù)據(jù)擁有大數(shù)據(jù)所具有的特點,數(shù)據(jù)體量大、結(jié)構(gòu)復雜,造成數(shù)據(jù)價值密度低,所以必須對云端數(shù)據(jù)進行優(yōu)化。另一方面,為了最大程度上發(fā)揮數(shù)據(jù)的價值,也必須對數(shù)據(jù)進行整理優(yōu)化,通過數(shù)據(jù)聚合分析發(fā)揮單體數(shù)據(jù)所不能體現(xiàn)出來的價值。數(shù)據(jù)質(zhì)量管理、數(shù)據(jù)操作、數(shù)據(jù)架構(gòu)都是為了實現(xiàn)數(shù)據(jù)優(yōu)化而進行的數(shù)據(jù)治理措施。
(3)云端數(shù)據(jù)治理是一套包含規(guī)劃、構(gòu)建、評估和優(yōu)化的活動集合。
云端數(shù)據(jù)治理是依據(jù)制定的各項策略對云端數(shù)據(jù)進行治理的活動集合,為此組織需要建立一個完整的數(shù)據(jù)治理體系,覆蓋統(tǒng)籌和規(guī)劃、構(gòu)建和運行、監(jiān)督和評估、改進和優(yōu)化四大階段[2],促進云端數(shù)據(jù)治理的落地以實現(xiàn)既定目標。組織云端數(shù)據(jù)治理體系基本框架如圖1所示,該圖展示了云端數(shù)據(jù)治理的四大階段,以及每個階段組織需要開展的主要工作。
統(tǒng)籌和規(guī)劃階段是云端數(shù)據(jù)治理活動的前期準備階段,其目標是要統(tǒng)籌和規(guī)劃數(shù)據(jù)治理目標和任務(wù),謀劃必要的治理環(huán)境,做好數(shù)據(jù)治理實施的準備。構(gòu)建和運行階段是云端數(shù)據(jù)治理策略的實施階段,其目標是構(gòu)建數(shù)據(jù)治理實施的管理機制,確保數(shù)據(jù)治理實施的有序運行。監(jiān)督和評估階段是云端數(shù)據(jù)治理實施效果評估的階段,其目標是監(jiān)督云端數(shù)據(jù)治理的實施過程,評估云端數(shù)據(jù)治理實施的符合性和實施的質(zhì)量。改進和優(yōu)化階段是云端數(shù)據(jù)治理的過程和結(jié)果提升階段,其目標是促進組織持續(xù)改進云端數(shù)據(jù)治理實施的過程,提升治理實施的有效性。通過策劃、實施、檢查和調(diào)整(PDCA)的活動循環(huán),持續(xù)改進云端數(shù)據(jù)治理體系,因此云端數(shù)據(jù)治理是一系列活動的集合。
2 云端數(shù)據(jù)治理與傳統(tǒng)數(shù)據(jù)治理的區(qū)別與聯(lián)系
云端數(shù)據(jù)治理本質(zhì)上也是數(shù)據(jù)治理,是數(shù)據(jù)治理在云計算環(huán)境下的一個新發(fā)展方向,但是由于治理對象特點的差異,二者又存在著諸多的不同。表1簡要概括了云端數(shù)據(jù)治理與傳統(tǒng)數(shù)據(jù)治理和大數(shù)據(jù)治理在概念上的關(guān)系。
3 結(jié)語
云端數(shù)據(jù)治理是數(shù)據(jù)治理理論在云計算環(huán)境下的最新發(fā)展,但是治理對象的差異性特點使得云端數(shù)據(jù)治理被賦予更多新的內(nèi)涵。首先,云端數(shù)據(jù)治理的對象主要為聚集在云端的數(shù)據(jù);其次,云端數(shù)據(jù)治理關(guān)乎云端數(shù)據(jù)戰(zhàn)略、數(shù)據(jù)管理、數(shù)據(jù)優(yōu)化、數(shù)據(jù)安全與隱私保護等相關(guān)的策略;再次,云端數(shù)據(jù)治理是一個包含規(guī)劃、構(gòu)建、評估和優(yōu)化的治理管理體系。
參考文獻
[1] 程廣明.大數(shù)據(jù)治理模型與治理成熟度評估研究[J].科技與創(chuàng)新,2016(9):6-7.
[2] 李堯,程廣明.云端數(shù)據(jù)治理初探[J].科技創(chuàng)新導報,2017 (1):96-97.