• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于數(shù)據(jù)倉庫的決策支持系統(tǒng)設(shè)計研究

      2010-07-25 07:16:22閔建虎
      微型電腦應(yīng)用 2010年4期
      關(guān)鍵詞:決策支持系統(tǒng)數(shù)據(jù)倉庫數(shù)據(jù)源

      閔建虎

      0 引言

      根據(jù)對國內(nèi)外一些企業(yè)決策支持系統(tǒng)(DSS)的現(xiàn)狀研究與分析,以及對國內(nèi)外發(fā)表在期刊上介紹 DSS案例的文章分析,初期的 DSS是使用關(guān)系型數(shù)據(jù)庫(RDB)。雖然RDB有許多優(yōu)點,但DSS直接使用下層信息系統(tǒng)所建立的數(shù)據(jù)庫極不方便。綜合數(shù)據(jù)均要經(jīng)過一定加工和通過一定的查詢途徑才能得到,速度慢,實用性差。為解決此問題,中期的DSS多采用在原基層數(shù)據(jù)庫的基礎(chǔ)上,增加DSS專用數(shù)據(jù)庫的方法。該專用數(shù)據(jù)庫是由原內(nèi)源基礎(chǔ)數(shù)據(jù)庫和外源數(shù)據(jù)庫抽取數(shù)據(jù),經(jīng)加工后得到的綜合數(shù)據(jù)組成的。它可滿足快速查詢和顯示要求,系統(tǒng)性能大大改善。但仍未解決DSS的根本性問題,即獲得數(shù)據(jù)是非現(xiàn)實的,不是面向主題、面向分析和面向支持管理層的決策制定。

      一般決策所需的數(shù)據(jù)總是與一些維數(shù)和不同級別的統(tǒng)計和計算有關(guān),以多維數(shù)據(jù)為核心的多維數(shù)據(jù)分析是決策的主要內(nèi)容,DW技術(shù)的出現(xiàn)給DSS數(shù)據(jù)的提取和分析,特別是多維數(shù)據(jù)的分析與處理創(chuàng)造了很好的條件。DW的多維特征滿足DSS對數(shù)據(jù)的分析要求,并且克服數(shù)據(jù)庫的數(shù)據(jù)組織性差、利用率低的缺點。在數(shù)據(jù)庫多年的應(yīng)用中已經(jīng)積累大量數(shù)據(jù),而且目前數(shù)據(jù)庫的數(shù)量和規(guī)模還在迅速增加和擴大,從而出現(xiàn)“數(shù)據(jù)豐富、知識貧乏”的問題。因此,從龐大的數(shù)據(jù)庫中抽出有用的信息已是當(dāng)務(wù)之急,所以 DW 為DSS發(fā)展開辟了新的途徑,并且基于數(shù)據(jù)倉庫的決策支持系統(tǒng)設(shè)計有著十分重要的應(yīng)用價值。

      1 數(shù)據(jù)倉庫

      1.1 數(shù)據(jù)倉庫的概述

      數(shù)據(jù)倉庫是號稱“數(shù)據(jù)倉庫之父”的 W. H. Inmon提出,數(shù)據(jù)倉庫是支持管理決策過程的、面向主題的、集成的、不可更新的、隨時間不斷變化的數(shù)據(jù)集合。換句話說:數(shù)據(jù)倉庫為支持海量存儲和高層決策分析,提供了一種解決方案。它抽取和凈化來自不同應(yīng)用系統(tǒng)的數(shù)據(jù),從事物發(fā)展和歷史的角度進(jìn)行組織和存儲,并通過對這種集成化數(shù)據(jù)的分析和挖掘,為最終用戶提供綜合性和分析性的深層次信息,是基于傳統(tǒng)數(shù)據(jù)庫技術(shù)的一種應(yīng)用拓展。該定義指出了它與數(shù)據(jù)庫的區(qū)別:數(shù)據(jù)倉庫并非是一個僅僅存儲數(shù)據(jù)的簡單信息庫,因為這實際上與傳統(tǒng)數(shù)據(jù)庫沒有兩樣。如果說傳統(tǒng)數(shù)據(jù)庫系統(tǒng)的重點與要求是快速、準(zhǔn)確、安全、可靠地將數(shù)據(jù)存進(jìn)數(shù)據(jù)庫中的話,那么數(shù)據(jù)倉庫的重點與要求就是能夠準(zhǔn)確、安全、可靠地從數(shù)據(jù)庫中取出數(shù)據(jù),經(jīng)過加工轉(zhuǎn)換成有規(guī)律信息之后,再供管理人員進(jìn)行分析使用。

      1.2 數(shù)據(jù)倉庫的系統(tǒng)結(jié)構(gòu)

      數(shù)據(jù)倉庫是存儲數(shù)據(jù)的一種組織形式。從邏輯結(jié)構(gòu)看,其中的數(shù)據(jù)可分為3至4層:最初是從傳統(tǒng)數(shù)據(jù)庫中獲得原始數(shù)據(jù),先按輔助決策的主題要求形成當(dāng)前基本數(shù)據(jù)層;再按綜合決策的要求形成綜合數(shù)據(jù)層(其中又可分為輕度綜合層和高度綜合層);隨著時間的推移,由時間控制機制將當(dāng)前基本數(shù)據(jù)層轉(zhuǎn)為歷史數(shù)據(jù)層。這幾個數(shù)據(jù)層均由元數(shù)據(jù)(Meta Data)組織而成,元數(shù)據(jù)是數(shù)據(jù)倉庫的核心。從物理結(jié)構(gòu)看,可分為多維數(shù)據(jù)庫組織形式(空間超立方體形式)、基于關(guān)系數(shù)據(jù)庫組織形式和虛擬存儲形式。數(shù)據(jù)倉庫系統(tǒng)(DWS)是對進(jìn)入數(shù)據(jù)倉庫的原始數(shù)據(jù),完成抽取轉(zhuǎn)換過濾清洗等處理,最終進(jìn)入數(shù)據(jù)倉庫,機器對數(shù)據(jù)倉庫中存儲的數(shù)據(jù),進(jìn)行更新管理,使用相關(guān)軟件進(jìn)行集合,用以支持管理決策。DWS通常由數(shù)據(jù)倉庫、倉庫管理和分析工具組成。如圖1所示。

      圖1 數(shù)據(jù)倉庫的體系結(jié)構(gòu)

      (1)數(shù)據(jù)源

      如圖1所示,最左邊是數(shù)據(jù)源,包括數(shù)據(jù)庫數(shù)據(jù)源和非數(shù)據(jù)庫數(shù)據(jù)源。數(shù)據(jù)庫一般是異構(gòu)的,通過網(wǎng)絡(luò)互連。數(shù)據(jù)源是數(shù)據(jù)倉庫系統(tǒng)的基礎(chǔ),是整個系統(tǒng)的數(shù)據(jù)來源。在建立數(shù)據(jù)倉庫之前必須對各種不同的數(shù)據(jù)源進(jìn)行抽取、轉(zhuǎn)換等操作。

      (2)數(shù)據(jù)源的集成

      多數(shù)據(jù)源的集成包括抽取、轉(zhuǎn)換、裝載等過程。數(shù)據(jù)集成是構(gòu)建數(shù)據(jù)倉庫的重要一環(huán),用戶從數(shù)據(jù)源抽取出所需的數(shù)據(jù),經(jīng)過數(shù)據(jù)轉(zhuǎn)換和清洗,最終按照預(yù)先定義的數(shù)據(jù)倉庫模型,將數(shù)據(jù)加載到數(shù)據(jù)倉庫中去。

      (3)中心數(shù)據(jù)倉庫

      當(dāng)前數(shù)據(jù)倉庫的核心仍是 RDBMS管理下的一個數(shù)據(jù)庫系統(tǒng),由于數(shù)據(jù)倉庫的數(shù)據(jù)量大,查詢復(fù)雜,因此系統(tǒng)性能的好壞仍然是個嚴(yán)重問題。為了提高性能,在數(shù)據(jù)倉庫中通常采用下列措施:(a)采用并行系統(tǒng)結(jié)構(gòu);(b)對數(shù)據(jù)倉庫中用得多、開銷大的處理;(c)針對數(shù)據(jù)倉庫以讀為主的特點,把查詢中常用的結(jié)果定義為視圖,并將事先計算好的視圖存于數(shù)據(jù)倉庫中,在需要時讀出即可,無需臨時計算。上述3條措施中,并行處理已經(jīng)是數(shù)據(jù)庫中的通用技術(shù),受到各主要RDBMS產(chǎn)品的支持;后兩項措施,主要是隨數(shù)據(jù)倉庫的興起而發(fā)展起來的,目前一些主要的RDBMS產(chǎn)品,都增加了這些方面的功能。

      (4)數(shù)據(jù)集市

      數(shù)據(jù)的最終查詢分析,往往是基于某個主題的,不同的決策主題,所需要的數(shù)據(jù)當(dāng)然也不盡相同。如果每次都從整個中心數(shù)據(jù)倉庫去獲取數(shù)據(jù)的話,其執(zhí)行效率顯然是比較低的;因此可在單位數(shù)據(jù)倉庫之外,再建立若干部門數(shù)據(jù)倉庫,即數(shù)據(jù)集市。

      (5)聯(lián)機分析處理(OLAP)服務(wù)器

      OLAP服務(wù)器位于客戶端與數(shù)據(jù)倉庫之間,負(fù)責(zé)管理數(shù)據(jù)模型及其數(shù)據(jù),實際上是一個功能強大的多維分析引擎。它從數(shù)據(jù)倉庫中抽取數(shù)據(jù),并根據(jù)分析需要,對分析需要數(shù)據(jù)進(jìn)行有效集成按多維模型予以組織,以便進(jìn)行多角度、多層次的分析,并發(fā)現(xiàn)趨勢。

      (6)前端的分析工具

      前端分析工具包括各種查詢工具、數(shù)據(jù)分析工具、報表工具、數(shù)據(jù)挖掘工具以及各種基于數(shù)據(jù)倉庫或數(shù)據(jù)集市的應(yīng)用開發(fā)工具。其中數(shù)據(jù)分析工具主要針對 OLAP服務(wù)器;報表工具、數(shù)據(jù)挖掘工具主要針對數(shù)據(jù)倉庫。以上各種前端分析工具運行于客戶端,主要功能是提供多維數(shù)據(jù)查詢和分析操作以達(dá)到?jīng)Q策支持的目的。

      2 聯(lián)機分析處理(OLAP)與數(shù)據(jù)挖掘(DM)

      2.1 聯(lián)機分析處理(OLAP)技術(shù)

      聯(lián)機分析處理(OLAP, On-line Analytical Processing),是一種針對特定問題進(jìn)行聯(lián)機數(shù)據(jù)訪問和分析的技術(shù)。它是決策人員通過對信息的多種可能的觀察形式進(jìn)行快速、一致和交互式的存取來獲得對數(shù)據(jù)的深入觀察。

      隨著數(shù)據(jù)倉庫的發(fā)展,OLAP也得到了迅猛的發(fā)展。數(shù)據(jù)倉庫側(cè)重于存儲和管理面向決策主題的數(shù)據(jù);而 OLAP則側(cè)重于數(shù)據(jù)倉庫的數(shù)據(jù)分析,并將其轉(zhuǎn)換成輔助決策信息。OLAP的一個主要特點是多維數(shù)據(jù)分析,這與數(shù)據(jù)倉庫的多維數(shù)據(jù)組織正好形成相互結(jié)合、相互補充的關(guān)系。因此,利用 OLAP技術(shù)與數(shù)據(jù)倉庫的結(jié)合,可以較好地解決傳統(tǒng)決策支持系統(tǒng),既需要處理大量數(shù)據(jù)又需要進(jìn)行大量數(shù)值計算的問題。OLAP的多維數(shù)據(jù)分析,主要通過對多維數(shù)據(jù)的維進(jìn)行剖切、鉆取和旋轉(zhuǎn)來實現(xiàn)對數(shù)據(jù)庫所提供的數(shù)據(jù)進(jìn)行深入分析,為決策者提供決策支持。多維結(jié)構(gòu)是決策支持的支柱,也是 OLAP的核心。多維結(jié)構(gòu)中的維突破了三維概念,可以有四維、五維甚至更多維的數(shù)據(jù)結(jié)構(gòu),即超立方體和多立方體的數(shù)據(jù)結(jié)構(gòu)。我們可以利用分析工具對多維數(shù)據(jù)結(jié)構(gòu)進(jìn)行切片、切塊、向上鉆取、向下鉆取、跨越鉆取和旋轉(zhuǎn)等處理,得到所需的決策分析數(shù)據(jù)。

      2.2 數(shù)據(jù)的挖掘(DM)技術(shù)

      數(shù)據(jù)的挖掘(Data Mining)就是從大量的、不完全的、有噪聲的、模糊的、隨機的實際應(yīng)用數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識的過程。準(zhǔn)確的說,數(shù)據(jù)挖掘是數(shù)據(jù)倉庫中的數(shù)據(jù)集合,在面向主題的預(yù)操作的作用下,轉(zhuǎn)化成面向主題的數(shù)據(jù)挖掘集合,然后數(shù)據(jù)挖掘集合,在挖掘算法它數(shù)據(jù)轉(zhuǎn)化操作的作用下,轉(zhuǎn)化成相應(yīng)的信息,最后,在信息輸出時對信息進(jìn)行度量和濾除。在DDS中通過進(jìn)行數(shù)據(jù)挖掘,用以發(fā)現(xiàn)數(shù)據(jù)之間的復(fù)雜聯(lián)系以及這種聯(lián)系對決策的影響。數(shù)據(jù)挖掘的功能有自動預(yù)測趨勢和行為,關(guān)聯(lián)分析、聚類、概念描述和偏差檢測。在數(shù)據(jù)倉庫基礎(chǔ)上挖掘的知識通常以圖表、可視化、類自然語言等形式表示出來,但所挖掘的知識并不都是有意義的,必須進(jìn)行評價、篩選和驗證,把有意義的知識放到知識庫中,隨著時間的推移將積累更多的知識。知識庫根據(jù)挖掘的知識類型包括總結(jié)性知識、關(guān)聯(lián)性知識、分類模型知識、聚類模型知識,這些知識通過相應(yīng)挖掘算法得到。

      3 決策的支持系統(tǒng)(DSS)

      目前沒有普遍接受的決策支持系統(tǒng)(Decision Support System,簡稱為DSS)的定義。一個經(jīng)典的定義是:決策支持系統(tǒng)通過結(jié)合個人的智力資源和計算機的能力來改進(jìn)決策的質(zhì)量。它是一個基于計算機的支持系統(tǒng),服務(wù)于處理半結(jié)構(gòu)化或非結(jié)構(gòu)化問題的管理決策制定者。

      一個決策支持系統(tǒng)將包括如下典型的組件:

      (1)管理的子系統(tǒng)

      DSS的數(shù)據(jù)庫通常包括在數(shù)據(jù)庫中。數(shù)據(jù)倉庫是集成、面向主題的數(shù)據(jù)庫集合,它是用來支持決策支持功能的,其中每個數(shù)據(jù)單元都不隨時間改變。數(shù)據(jù)倉庫的數(shù)據(jù)通常從內(nèi)部和外部數(shù)據(jù)源中抽取。

      (2)模型的管理系統(tǒng)

      一個包含有財務(wù)、統(tǒng)計、運籌和其他定量模型的軟件包,能夠提供系統(tǒng)的分析能力和合適的軟件管理能力。在模型庫中的模型可以分為戰(zhàn)略性的、策略性的、營運性的等。

      (3)知識的管理系統(tǒng)

      許多非結(jié)構(gòu)化和半結(jié)構(gòu)化的問題是如此的復(fù)雜,以至于超出了通常的 DSS能力,它們還需要特別的專業(yè)知識。這些知識可以由專家系統(tǒng)或者其他智能系統(tǒng)提供。因此,更高級的DSS系統(tǒng)還包含成為知識管理的組件。

      (4)用戶界面的子系統(tǒng)

      用戶界面子系統(tǒng)就是用戶與應(yīng)用之間的交流。如交互式界面、報表打印。為了實現(xiàn)組織內(nèi)的信息共享,還應(yīng)包括信息的發(fā)布方式。在目前采用 Web瀏覽器的形式已經(jīng)成為趨勢,用戶可看作系統(tǒng)的一部分。

      決策支持系統(tǒng)作為一門新興的信息技術(shù),能夠為企業(yè)提供各種決策信息支持以及許多商業(yè)問題的解決方案,從而減輕管理者從事低層次信息處理和分析的負(fù)擔(dān),使得他們專注于最需要決策智慧和經(jīng)驗的工作,從而提高決策的質(zhì)量和效率。

      4 設(shè)計的實現(xiàn)

      4.1 基于DW的DSS的構(gòu)建

      針對現(xiàn)在一般企業(yè)用戶范圍廣、流動性大和面對市場需求分析工作量大的特點,在該企業(yè)現(xiàn)有內(nèi)部網(wǎng)(Intranet)的基礎(chǔ)上,本人設(shè)計了一個基于數(shù)據(jù)倉庫的決策支持系統(tǒng),其系統(tǒng)框架結(jié)構(gòu)模型如圖2所示。

      圖2 基于DW的DSS框架模型設(shè)計

      本系統(tǒng)的整個框架結(jié)構(gòu)是建立在基于Web技術(shù)的企業(yè)Intranet應(yīng)用于集成框架之上,其應(yīng)用模型是瀏覽器/服務(wù)器(B/S) 3層結(jié)構(gòu)形式,即客戶端、應(yīng)用(數(shù)據(jù)采集、處理、分析與挖掘)服務(wù)器和數(shù)據(jù)源(數(shù)據(jù)倉庫、數(shù)據(jù)庫與知識庫)服務(wù)器。數(shù)據(jù)倉庫的采集單元(pump)負(fù)責(zé)定期的通過企業(yè)內(nèi)部網(wǎng)通信干線分布在網(wǎng)絡(luò)各站點上的有關(guān)數(shù)據(jù)庫收集最新的數(shù)據(jù),并完成數(shù)據(jù)的凈化與變換。考慮到 DW 中數(shù)據(jù)對象較為復(fù)雜且數(shù)量巨大,決策支持系統(tǒng)其他單元對 DW 的訪問是通過OLAP服務(wù)器來完成的。使用OLAP服務(wù)器的目的是為了得到完善的多維數(shù)據(jù)管理,并提供簡便快速且性能有保證的多維數(shù)據(jù)查詢和分析,大大地降低了系統(tǒng)的數(shù)據(jù)傳輸量,提高了數(shù)據(jù)挖掘和決策分析效率。

      與傳統(tǒng)的 DSS體系結(jié)構(gòu)不同的是:知識庫中的知識除了在系統(tǒng)建立之初輸入之外,還由系統(tǒng)的數(shù)據(jù)挖掘單元不斷地進(jìn)行補充。在數(shù)據(jù)挖掘單元中,盡量使用已有的一些數(shù)據(jù)挖掘軟件工具,如SAS,IBM Intelligent Mines等。在中間層設(shè)置Web服務(wù)器和知識服務(wù)器。用戶通過HTTP協(xié)議訪問Web服務(wù)器上的HTML格式的頁面,而Web服務(wù)器則根據(jù)頁面設(shè)置與用戶要求向知識服務(wù)器提出決策需求。知識服務(wù)器是處理用戶決策需求的綜合服務(wù)單元,它根據(jù)用戶需求向知識庫和數(shù)據(jù)庫要求相應(yīng)的知識和數(shù)據(jù),經(jīng)處理后以Web頁面的形式提供給用戶。在客戶端,用戶通過 Web瀏覽器訪問Intranet上的Web服務(wù)器來進(jìn)行決策咨詢。本系統(tǒng)的用戶可分為兩類:一類是一般人員,他們只需要了解一下企業(yè)總體情況以及決策支持系統(tǒng)對具體的一般性建議,服務(wù)器上的靜態(tài) Web頁面就可以滿足他們要求。另一類是企業(yè)高層管理決策人員,他們除需了解各部門情況與相關(guān)統(tǒng)計以外,還想知道發(fā)展趨勢分析與預(yù)測,進(jìn)行某些專門分析與知識咨詢等,這就需要與系統(tǒng)進(jìn)行動態(tài)交互。系統(tǒng)可以通過 Web頁面上嵌套Java Applet小程序來實現(xiàn)這種用戶和系統(tǒng)的動態(tài)交互,使用戶能動態(tài)地通過知識庫服務(wù)器訪問數(shù)據(jù)倉庫和知識庫,以取得所需要的特殊信息。

      4.2 數(shù)據(jù)倉庫的設(shè)計

      數(shù)據(jù)倉庫與傳統(tǒng)數(shù)據(jù)庫的設(shè)計過程都要經(jīng)歷概念模型、邏輯模型和物理模型3個設(shè)計階段。但數(shù)據(jù)倉庫與數(shù)據(jù)庫在各個設(shè)計階段所采取的方法卻截然不同。本人根據(jù)上述系統(tǒng)數(shù)據(jù)倉庫采用面向主題,即面向?qū)ο笞陨隙碌脑O(shè)計方法。下面分別介紹3個模型設(shè)計階段采用的建模技術(shù)。

      (1)DW概念模型的設(shè)計

      超立方體(Hypercube)可用超出三維的表示來描述一個對象(對象可以是客戶、產(chǎn)品、營銷策略等),它完全可以滿足 DW 的多維特性。使用自上而下的方法設(shè)計一個超立方體的步驟如下:

      (a) 確定模型中需要抓住的關(guān)鍵過程。

      (b) 確定需要捕獲的值。

      (c) 確定數(shù)據(jù)的粒度,即需要獲取最低一級的詳細(xì)信息。

      當(dāng)維數(shù)超過三維后,超立方體在表現(xiàn)上缺乏直觀性,因此我們采用一種稱為信息包圖(Information packed picture)的方法在平面上展開超立方體。使用信息包圖設(shè)計概念模型的具體步驟如下:

      (a) 確定指標(biāo):指標(biāo)是訪問DW的關(guān)鍵所在,是用戶最關(guān)心的信息。它是表示在維度空間衡量商務(wù)信息的一種方法。

      (b) 確定維度:維度提供了用戶訪問DW的信息途徑,對應(yīng)超立方體的每一面,位于信息包圖的第一行的每個欄目中。

      (c) 確定類別:類別是在一個維度內(nèi)為了提供詳細(xì)的分類而定義的,而其中的成員又是為了辨別和區(qū)分特別數(shù)據(jù)而設(shè)的,它表示一個維度包含的詳細(xì)信息。一個維度內(nèi)最低層的可用分類可以又稱為詳細(xì)類別。

      (2) DW邏輯模型的設(shè)計

      DW主要提供的是查詢操作,而最便于執(zhí)行查詢操作的邏輯模型設(shè)計工具是星型圖(star chart),因此我們利用星型圖建模技術(shù),可以為DW建立完善的邏輯模型。從DW的概念模型(信息包圖模型)轉(zhuǎn)換成 DW 的邏輯模型(星型圖模型)的過程,可以分為以下幾個步驟:

      (a) 定義指標(biāo)實體:指標(biāo)實體位于星型圖的中心,是用戶最關(guān)心的基本實體和查詢活動的中心,為用戶的商務(wù)活動提供定量數(shù)據(jù)。每一個指標(biāo)實體代表一系列相關(guān)事實,完成一項指定的功能,在一般情況下代表一個現(xiàn)實事物的綜合水平,僅僅與每個相關(guān)維度的一個點對應(yīng)。

      (b) 定義維度實體。一個維度實體對應(yīng)指標(biāo)實體中的多個指標(biāo),用戶使用維度實體來訪問指標(biāo)實體,其實質(zhì)是對應(yīng)著邏輯數(shù)據(jù)實體。一個維度實體對應(yīng)信息包圖中的一個列。

      (c) 定義詳細(xì)類別實體。一個詳細(xì)類別的實體與現(xiàn)實世界的某一個實體相對應(yīng)。

      (d) 定義邏輯模型。定義邏輯模型的最后一步是將星型模型轉(zhuǎn)換成雪花模型。限于篇幅,轉(zhuǎn)換過程與圖示從略。

      (3) DW物理模型的設(shè)計

      根據(jù)星型模型或雪花模型,就可以方便地定義出DW的物理數(shù)據(jù)結(jié)構(gòu)。一般將指標(biāo)實體和詳細(xì)類別實體轉(zhuǎn)變?yōu)橐粋€具體的物理數(shù)據(jù)庫表,稱為事實表。維度實體通常也轉(zhuǎn)化為數(shù)據(jù)庫表,稱為維表,它包括其每一層次的主碼和對應(yīng)的值。維表和事實表通過維關(guān)鍵字相關(guān)聯(lián)。在物理模型設(shè)計階段,需要確定以下的內(nèi)容:

      (a)規(guī)定數(shù)據(jù)質(zhì)量指標(biāo),規(guī)范數(shù)據(jù)倉庫中的各種數(shù)據(jù)。(b)定義實體、實體特征以及實體所具有的一切屬性。(c)定義規(guī)模,確定數(shù)據(jù)容量和更新頻率。為了獲得物理模型設(shè)計階段完整的文檔資料,可利用自動定義軟件工具進(jìn)行數(shù)據(jù)管理。

      4.3 基于數(shù)據(jù)倉庫的數(shù)據(jù)挖掘

      數(shù)據(jù)挖掘(DM)是DSS應(yīng)用中非常重要的環(huán)節(jié),它是在一些事實或觀察數(shù)據(jù)中尋找合適模式的決策支持過程。DM的對象主要是數(shù)據(jù)倉庫或大型的數(shù)據(jù)庫,也可以是文件系統(tǒng)或其他任何組織在一起的數(shù)據(jù)集合,從簡化的觀點來講,絕大多數(shù)的挖掘算法,可以看成是由少數(shù)幾個基本原則與技術(shù)組成的。本系統(tǒng)的DM算法是由模型、偏好判據(jù)和搜索算法3個部分組合而成的。主要的模型有特征模型、分類模型、聚集模型、關(guān)聯(lián)模型、對比模型、匯總模型和決策模型等。由于篇幅有限有關(guān)它們的具體數(shù)據(jù)挖掘算法的確定與應(yīng)用就不在此一一闡述。

      5 結(jié)束語

      大量數(shù)據(jù)的產(chǎn)生和收集導(dǎo)致了信息爆炸,現(xiàn)代社會的競爭趨勢要求對這些數(shù)據(jù)進(jìn)行實時的和深層次的分析。雖然現(xiàn)在有了更強大的存儲和檢索系統(tǒng)。但是使用者發(fā)現(xiàn)在分析和使用所擁有的信息方面變得越來越困難。數(shù)據(jù)倉庫提供了容納大量信息的場所,但只有和 OLAP技術(shù)、數(shù)據(jù)挖掘技術(shù)的應(yīng)用綜合起來才能最終解決用戶的困惑,使用戶能夠從大量繁雜的數(shù)據(jù)中找出真正有價值的信息和知識。而數(shù)據(jù)倉庫的建立并不是要取代原有數(shù)據(jù)庫,而是在原有的數(shù)據(jù)庫應(yīng)用系統(tǒng)的基礎(chǔ)上建立全面、完善的信息應(yīng)用基礎(chǔ),用于支持高層決策分析。本文主要對數(shù)據(jù)倉庫、OLAP、數(shù)據(jù)挖掘著幾種技術(shù)以及基于DW的DSS構(gòu)建、數(shù)據(jù)倉庫的設(shè)計等方面進(jìn)行了較為深入的分析研究,對于數(shù)據(jù)倉庫技術(shù)的決策支持系統(tǒng)具有十分廣泛的應(yīng)用前景。

      [1]Efrem G.Mallach, Decision Support and Data Warehouse Systems, McGraw-Hill, Companies, Inc, 2000.

      [2]Inmon W H. Building the Data Warehouse[M]. 機械工業(yè)出版社,2003.

      [3]陳文偉.決策支持系統(tǒng)及其開發(fā)[M].北京:清華大學(xué)出版社,2000.

      [4]張維明.數(shù)據(jù)倉庫原理及應(yīng)用[M].電子工業(yè)出版社,2002.

      [5]王珊.數(shù)據(jù)倉庫技術(shù)和聯(lián)機分析處理[M].科學(xué)出版社,1999.

      [6]康曉東.基于數(shù)據(jù)倉庫的數(shù)據(jù)挖掘技術(shù)[M].機械工業(yè)出版社,2004.

      [7]石麗,李堅.數(shù)據(jù)倉庫與決策支持[M].國防工業(yè)出版社,2003.

      [8]王珊,薩師煊.數(shù)據(jù)庫系統(tǒng)概論(第四版)[M].高等教育出版社,2007.

      猜你喜歡
      決策支持系統(tǒng)數(shù)據(jù)倉庫數(shù)據(jù)源
      護(hù)理臨床決策支持系統(tǒng)的理論基礎(chǔ)
      臨床決策支持系統(tǒng)應(yīng)用于呼吸疾病的現(xiàn)狀概述
      基于數(shù)據(jù)倉庫的住房城鄉(xiāng)建設(shè)信息系統(tǒng)整合研究
      電務(wù)維修決策支持系統(tǒng)研究
      Web 大數(shù)據(jù)系統(tǒng)數(shù)據(jù)源選擇*
      基于不同網(wǎng)絡(luò)數(shù)據(jù)源的期刊評價研究
      分布式存儲系統(tǒng)在液晶面板制造數(shù)據(jù)倉庫中的設(shè)計
      電子制作(2016年15期)2017-01-15 13:39:15
      探析電力系統(tǒng)調(diào)度中數(shù)據(jù)倉庫技術(shù)的應(yīng)用
      縣級防汛輔助決策支持系統(tǒng)的設(shè)計與實現(xiàn)
      水利信息化(2015年5期)2015-12-21 12:54:40
      基于數(shù)據(jù)倉庫的數(shù)據(jù)分析探索與實踐
      济源市| 大同县| 宣城市| 马尔康县| 澎湖县| 滦平县| 阳朔县| 台山市| 沙洋县| 龙口市| 金门县| 阳城县| 德惠市| 开鲁县| 酉阳| 武功县| 定安县| 金门县| 措美县| 永城市| 石河子市| 化州市| 汤原县| 吉隆县| 界首市| 永新县| 灵川县| 虎林市| 罗江县| 南康市| 赤峰市| 普安县| 鄄城县| 奈曼旗| 重庆市| 大余县| 尉氏县| 庆阳市| 磐安县| 荣昌县| 广河县|