王亞寧 魯華杰 李恒 陳黎明
摘 要 元數據由于數據倉庫技術的發(fā)展而變得越來越重要,其不僅能夠定義數據倉庫的具體作用,還能夠實現(xiàn)數據倉庫的有效管理。而由于不同的單位大多采用不同的數據倉庫管理系統(tǒng),并未采用統(tǒng)一的平臺進行管理,使數據之間的交流和傳遞變得十分困難,所以應該建立統(tǒng)一的標準對原數據進行管理和描述。CWM是為了將元數據管理策略進行統(tǒng)一而制定的,其能夠使元數據和數據倉庫在交換工具以及儲存庫時變得更加方便。本篇文章主要針對元數據在數據倉庫中的應用進行了研究。
關鍵詞 元數據;數據倉庫;研究分析;元數據儲存
前言
隨著數據倉庫技術的發(fā)展,元數據對于數據倉庫技術的發(fā)展來說十分重要,其已經運用到了倉庫技術的整個過程當中,成為數據倉庫技術的重要部分。對元數據進行科學的管理,能夠提升數據管理的安全性。目前市場上儲存元數據的格式都存在著明顯的差異,如何通過有效的方式使元數據的集成和理解變得更加容易,已經成為研究的重要問題。本篇文章將針對元數據在數據倉庫中的應用情況進行分析,期望為數據倉庫信息管理提供有效的意見建議。
1基本概念
1.1 數據倉庫
數據倉庫技術是指在多變化的信息需求之下,構建的多維度數據儲存管理系統(tǒng),其主要目的是能夠更好地對信息數據進行管理,使人們能夠將信息數據的應用從較低層次的尾端進行查詢,幫助元數據管理提供更好的決策支持[1]。
1.2 元數據
指對數據的信息化描述,例如對信息結構的數據描述。利用元數據可以找到數據倉庫中所要查詢的具體數據信息,以便于更好地對數據進行管理。對元數據進行有效分類是實現(xiàn)數據倉庫科學管理的前提,但目前并沒有分類的統(tǒng)一標準,大多是從數據的類型、數據抽象程度、系統(tǒng)的用戶、來源、使用目的以及形成時間等幾個方面進行分類。目前元數據管理越來越得到重視,元數據管理不僅能夠廣泛運用,使用戶掌握數據倉庫中的各類信息,還能夠提高生產率,所以元數據的管理十分重要。
2基于CWM的元數據管理
元數據的管理策略主要有搭建元數據交換途徑、元數據儲存庫以及元數據倉庫三種管理策略,而為了使元數據的管理維護問題得以解決,需要構建中央元數據儲存庫,對元數據的生命周期進行統(tǒng)一化的管理[2]。這樣才能夠促進數據倉庫各種工具之間的交換。CWM是集元數據收集、儲存和管理一體化的平臺,其主要由用戶操作層、應用層和儲存數據層三層架構組成。中央元數據儲存庫應該以CWM為統(tǒng)一的標準,再根據管理平臺實現(xiàn)元數據的科學化管理。
元數據儲存的中央元數據儲存庫是整個平臺架構的核心,所有信息數據的流動都需要經過儲存庫,其剛開始是CWM各個包的內和關系映射。所有在儲存庫進行保存的元數據都是通過CWM編碼實現(xiàn)的,能夠使終端用戶對數據倉庫的特定主題進行查詢,中央元數據儲存庫可以實現(xiàn)的功能主要包括瀏覽、查詢、更新、添加以及刪除等基本功能。
3對于元數據儲存庫的設計
3.1 CWM元數據的儲存?zhèn)}庫
對于元數據管理來說,元數據儲存區(qū)是必須具備的,因此建立基于CWM的元數據管理平臺有著重要的意義。應該將元數據儲存結構轉變?yōu)榍袑嵖尚械膬Υ娼Y構。數據庫作為元數據的儲存是一種科學的處理方法。但是由于對象技術和關系數據庫所存在的目標應用不相同,所以兩者之間存在一定的差別,需要使用關系數據庫表結構對對象的CWM原模型進行闡述,而CWM原模型關系模型的映射規(guī)則主要包括數據類型映射模式、內映射模式以及關聯(lián)模式映射三種模式。
3.2 元數據儲存庫的具體數據庫模式
在元數據儲存庫當中可以構建CWM類與關聯(lián)的映射表,但是應該充分考慮到每個工具的特定數據需求。其表格類型主要包括數據倉庫表、包的信息表、各包中類信息表以及內表、關聯(lián)表、關聯(lián)信息表、超類表。
4元數據管理平臺工具的實現(xiàn)
4.1 管理元數據工具的具體功能結構
管理工具能夠對數據儲存庫里的元數據進行科學的管理,其主要的工作原理是登錄元數據管理工具,此時設備會主動連接元數據儲存庫里的數據庫系統(tǒng),在與元數據儲存庫進行連接之后,就能夠得到元數據管理所需要具備的類表和關聯(lián)表,元數據工具主要有元數據查詢、操作、更新幾種功能。
4.2 對于元數據的查詢
元數據的查詢條件主要包括類查詢和關聯(lián)查詢兩種方式,兩種查詢方式都需要首先選定數據倉庫的主題,最后選定每個包或者關聯(lián)名進行具體信息的查詢。查詢流程:元數據的查詢結果通常以數據表格的形式展現(xiàn)出,包括查詢實例的位置屬性以及ID等基礎信息[3]。
4.3 元數據的具體操作
元數據的具體操作過程包括內實例增加、刪除以及關聯(lián)實力刪除等幾種功能,但是由于元數據的實例添加或者刪除與數據庫不一樣,所以必須在整個繼承鏈上進行操作過程的實現(xiàn)。
4.4 對于元數據的更新
因為數據的更新主要包括類實例以及關聯(lián)實例更新兩種功能,但是因為CWM的重用繼承技術,以及繼承鏈在關系數據上實現(xiàn)比較復雜,所以元數據的更新方法與一般的數據庫更新不同[4]。類實例更新:主要是對類實例的具體屬性進行更新,具體屬性又包括特有屬性和超類繼承屬性,特有屬性更新只需要在類相對應的表即可完成整個更新操作,而超類屬性更新則需要更新函數,獲取超類名之后才能夠調用更新函數。
5結束語
綜上所述,對元數據進行數據管理庫的有效管理,需要建立統(tǒng)一的元數據管理平臺,而借助CWM元數據管理策略能夠對元數據進行有效的管理,構建元數據倉庫管理平臺的有效框架,并從中央元數據儲存庫的開發(fā)管理和元數據管理平臺核心組件等兩個方面有效規(guī)劃了管理平臺的組成,搭建數據倉庫中的元數據進行統(tǒng)一儲存建模以及管理的全過程平臺。雖然本篇文章的元數據管理平臺能夠實現(xiàn)數據倉庫的基本功能,但是仍然存在著一些問題,需要進行進一步的探究和實踐工作。
參考文獻
[1] 羅小洪.數據倉庫元數據管理系統(tǒng)[J].神州,2019(17):233-234.
[2] 姚鵬飛.數據倉庫技術在裝備試驗信息集成中的應用研究[J].信息技術,2019(1):146-150.
[3] 王偉,寧麗.數據倉庫技術與信息加工理論鏡像關聯(lián)分析[J].中國教育技術裝備,2018,436(10):38-40.
[4] 程芳,張權,董少林.基于數據集成的質量元數據研究[J].標準科學,2019(5):140-142.