夏傳鯤 劉思青 王穎峰
在“SG186”工程體系的框架下,河南省電力公司已經(jīng)統(tǒng)一建設了省公司數(shù)據(jù)倉庫,但目前使用者的主體對象是省公司的用戶,如何此基礎上構建地市數(shù)據(jù)倉庫,從體系結構和數(shù)據(jù)冗余度等方面來看,我們可以有以下三種形式
第一,集中式。在省公司的機房中再建一套地市綜合數(shù)據(jù)庫系統(tǒng),以實現(xiàn)地市的決策分析需要,采用單個物理數(shù)據(jù)庫中存貯用來查詢和分析的綜合數(shù)據(jù),所有業(yè)務系統(tǒng)網(wǎng)省層次部署,地市不部署任何系統(tǒng)。采用此方式可以降低數(shù)據(jù)抽取的網(wǎng)絡負擔,但數(shù)據(jù)訪問時需要較好的網(wǎng)絡支持,但價格昂貴,開發(fā)周期長,需要解決數(shù)據(jù)抽取、實體化視圖維護等問題。
第二,分布式數(shù)據(jù)倉庫。各數(shù)據(jù)成分分散在多個不同的物理數(shù)據(jù)庫中。即在每個地市建立綜合數(shù)據(jù)庫,每個站點是一個自治的本地數(shù)據(jù)倉庫,決策在本站點內部完成。省公司的中心站點上設有全局數(shù)據(jù)倉庫,可進行全局決策。這種實現(xiàn)方式包含有大量的數(shù)據(jù)冗余,對數(shù)據(jù)的裝載和更新等處理極其復雜。
第三,虛擬數(shù)據(jù)倉庫。類似于分布式數(shù)據(jù)倉庫,其在中心站點上存放的不是各地市供電公司的具體數(shù)據(jù),而是描述這些數(shù)據(jù)的指針。終端用戶通過指針的方式,利用適當?shù)墓ぞ咧苯釉谔摂M的數(shù)據(jù)倉庫中獲取數(shù)據(jù)。它不需要對數(shù)據(jù)進行預先抽取、綜合,也沒有數(shù)據(jù)維護等問題,且建造周期短、投資小。
一、虛擬數(shù)據(jù)倉庫的數(shù)據(jù)理論基礎
(一)%l選擇
%l選擇也稱為限制,即從大的數(shù)據(jù)倉庫集合中進行過濾和篩選。
%lF(R) = {t | t∈R∧F(t) = TRUE}
選擇關系具體的語句的形式如下:
SELECTR.a1,…,R.an
FROMR
WHERER.name =鶴壁(或者R.code =100000033)
(二)%i投影
%i投影是從大的數(shù)據(jù)倉庫集中的關系R中選擇若干屬性組成新的關系。記作如下:
%in(R) = {T[A] | t∈R}
其中A為R中的屬性列。在我們建設地市鶴壁的虛擬數(shù)據(jù)倉庫中,投影關系主要用于以下場合,即是在省公司數(shù)據(jù)倉庫中有一些地市不用關心的屬性,通過投影關系的限定,作為地市的只關注自己范圍內的信息和屬性,極大地保證了省公司數(shù)據(jù)的安全性。
二、虛擬數(shù)據(jù)倉庫的體系結構
虛擬數(shù)據(jù)倉庫通常采用三層結構:
(一)展現(xiàn)層
實現(xiàn)如何把數(shù)據(jù)庫系統(tǒng)中的數(shù)據(jù)和分析結果提供給最終用戶。按照用戶的分析需求,使用報表、即席查詢、多維分析和數(shù)據(jù)挖掘進行數(shù)據(jù)展現(xiàn)。展現(xiàn)層是采用IBMCognos8.1作為前端的展現(xiàn)分析工具。虛擬數(shù)據(jù)倉庫透明地支持各種不同需求的終端用戶,通過語義層在展現(xiàn)層可以實現(xiàn)整個組織的統(tǒng)一視圖。
(二)映射層
1.應用程序接口:采WebService的方式向數(shù)據(jù)的需求者提供基于XML文件接口,實現(xiàn)虛擬數(shù)據(jù)倉庫的跨應用數(shù)據(jù)共享。
2.數(shù)據(jù)庫接口:采用數(shù)據(jù)庫物理視圖實現(xiàn)數(shù)據(jù)映射,通過視圖可方便地對數(shù)據(jù)進行重組。另外,將這些數(shù)據(jù)同業(yè)務規(guī)則捆綁在一起,可滿足機構中某一方面特定應用的查詢。
(三)數(shù)據(jù)層
表示實際的數(shù)據(jù)來源。它們既可以是各種類型的數(shù)據(jù)庫,也可以是文檔、記錄、聲音、圖象數(shù)據(jù)。它們當中既有實時數(shù)據(jù),也有歷史數(shù)據(jù);既有專門的業(yè)務數(shù)據(jù),也有局部綜合數(shù)據(jù);在地市數(shù)據(jù)倉庫的建設中,數(shù)據(jù)源包括省公司數(shù)據(jù)倉庫系統(tǒng)、地市特有數(shù)據(jù)應用。
三、虛擬數(shù)據(jù)倉庫的作用
第一,有利于降低地市數(shù)據(jù)倉庫的建設成本,虛擬數(shù)據(jù)倉庫節(jié)省了服務器、存儲設備和軟件平臺的投資。
第二,虛擬數(shù)據(jù)倉庫有利于省公司數(shù)據(jù)倉庫的實用化建設。
第三,虛擬數(shù)據(jù)倉庫充分利用了省公司的實體數(shù)據(jù)倉庫資源,建設速度快,縮短了建設周期。
第四,維護方便,虛擬數(shù)據(jù)倉庫通過映射和指針技術,保證了與省公司數(shù)據(jù)倉庫的一致性,加強了數(shù)據(jù)集中的管理、保證了數(shù)據(jù)的單一出口和數(shù)據(jù)的正確性,增強了數(shù)據(jù)共享的能力,從而獲得完整的業(yè)務數(shù)據(jù)視圖;
第五,通過跟蹤分析這些業(yè)務數(shù)據(jù)信息,管理層可以預定企業(yè)盈利、生產(chǎn)、安全等方面的計劃,增強企業(yè)領導決策能力。
四、虛擬數(shù)據(jù)庫的應用
自從虛擬數(shù)據(jù)倉庫概念提出以來,它已經(jīng)在金融、保險、軍事等部門得到了廣泛的應用。通過在河南省電力公司鶴壁地市建設虛擬數(shù)據(jù)中心,很好地實現(xiàn)了地市的領導輔助決策支持系統(tǒng),不僅建設周期短,而且建設成本低,維護方便??梢?電力企業(yè)領域特別是在“SG186”工程的推動下,在網(wǎng)省兩級數(shù)據(jù)中心已經(jīng)全面的基礎上,實現(xiàn)數(shù)據(jù)的唯一性與共享性,建立統(tǒng)一的安全體系,保證數(shù)據(jù)及業(yè)務系統(tǒng)的訪問安全,完善數(shù)據(jù)交換體系,實現(xiàn)數(shù)據(jù)中心間的級聯(lián),提升經(jīng)營決策的管理能力等領域,虛擬數(shù)據(jù)倉庫也有廣泛的應用前景。