• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      數(shù)據(jù)集市技術(shù)在高校信息管理中的研究與開發(fā)*

      2014-11-27 12:12:08孫淼洋
      中國教育信息化 2014年5期
      關(guān)鍵詞:關(guān)鍵字數(shù)據(jù)倉庫集市

      陳 鋒,孫淼洋

      (1.遼寧醫(yī)學(xué)院 現(xiàn)代教育技術(shù)中心,遼寧 沈陽121001;2.遼寧鐵道職業(yè)技術(shù)學(xué)院 電氣工程系,遼寧 沈陽121001)

      一、前言

      對于高校以往信息管理中所沉淀的海量歷史信息,亟待一個全新的技術(shù)方案對其進行整合集成以便發(fā)揮其應(yīng)有作用,這種技術(shù)方案一般會以創(chuàng)建數(shù)據(jù)倉庫的方式來實現(xiàn)。

      數(shù)據(jù)倉庫項目結(jié)構(gòu)復(fù)雜、人力物力投入大、開發(fā)周期長,難以滿足高校的實際應(yīng)用需求。與數(shù)據(jù)倉庫理論基礎(chǔ)同出一轍的數(shù)據(jù)集市通過構(gòu)造面向主題的多維數(shù)據(jù)集,進而實現(xiàn)一個或多個部門的決策支持與數(shù)據(jù)挖掘。數(shù)據(jù)集市與數(shù)據(jù)倉庫項目相比具有如下優(yōu)勢:(1)數(shù)據(jù)集市管理的數(shù)據(jù)規(guī)模較??;(2)用戶可根據(jù)需要定制數(shù)據(jù);(3)數(shù)據(jù)集市項目建設(shè)周期短,開發(fā)成本較低;(4)數(shù)據(jù)集市允許用戶根據(jù)需求增減數(shù)據(jù)規(guī)模,具有良好的拓展性能;(5)數(shù)據(jù)集市可將計算任務(wù)部署于多個工作站,實現(xiàn)分布式計算,能夠提升系統(tǒng)穩(wěn)定性和自治性。

      二、方案論證及項目總體架構(gòu)

      信息系統(tǒng)的開發(fā)主要有自頂向下與自底向上兩個基本建設(shè)方案。其中自頂向下建設(shè)數(shù)據(jù)倉庫能最大限度減少信息集成所帶來的技術(shù)問題,是較理想化的技術(shù)解決方案。但自頂向下建設(shè)模式往往導(dǎo)致項目開發(fā)周期過長、難以產(chǎn)生階段性研究成果,且開發(fā)出來的系統(tǒng)靈活性和擴展性都較差。因此,高校在構(gòu)建數(shù)據(jù)倉庫時應(yīng)遵循漸進、分階段、分步驟的建設(shè)策略:即采取自底向上的建設(shè)方案,可先開發(fā)高校內(nèi)部某一主題的數(shù)據(jù)集市,待建設(shè)成功后再陸續(xù)開發(fā)其他主題的數(shù)據(jù)集市,最后通過系統(tǒng)集成構(gòu)建一個相對完整的高校數(shù)據(jù)倉庫體系。

      數(shù)據(jù)集市項目涵蓋信息集成、信息處理、數(shù)據(jù)建模、數(shù)據(jù)挖掘與數(shù)據(jù)展現(xiàn)等諸多復(fù)雜的軟件行為活動。本文結(jié)合高校成本辦學(xué)數(shù)據(jù)集市的具體工程實踐介紹一下有關(guān)數(shù)據(jù)集市項目的創(chuàng)建過程。基于高校辦學(xué)成本的數(shù)據(jù)集市項目具有多層體系架構(gòu)如圖1所示,即分別是數(shù)據(jù)準備層、數(shù)據(jù)處理層、數(shù)據(jù)集市創(chuàng)建層、數(shù)據(jù)展現(xiàn)層及數(shù)據(jù)倉庫與數(shù)據(jù)挖掘?qū)印?/p>

      圖1 項目系統(tǒng)總體結(jié)構(gòu)

      第一層:數(shù)據(jù)準備層,該層主要負責(zé)數(shù)據(jù)集市籌建前期的數(shù)據(jù)準備工作,業(yè)務(wù)信息系統(tǒng)的數(shù)據(jù)庫,外部文檔及殘留系統(tǒng)數(shù)據(jù)要經(jīng)過此層進行收集整理。第二層:數(shù)據(jù)處理層,在整個體系結(jié)構(gòu)中,數(shù)據(jù)處理層起著承上啟下的重要作用,負責(zé)接收從數(shù)據(jù)準備層傳遞過來的數(shù)據(jù),并完成對上一層數(shù)據(jù)的清洗、轉(zhuǎn)換工作,為數(shù)據(jù)集市的創(chuàng)建做數(shù)據(jù)準備。第三層:數(shù)據(jù)集市創(chuàng)建層,該層主要負責(zé)數(shù)據(jù)集市的創(chuàng)建活動,包括維度、基本事實表的生成,數(shù)據(jù)集市邏輯結(jié)構(gòu)的架構(gòu)等。第四層:數(shù)據(jù)展現(xiàn)層,該層通過訪問數(shù)據(jù)集市,并利用軟件工具對其多維數(shù)據(jù)集進行數(shù)據(jù)展現(xiàn),為用戶提供基本的視圖查詢功能,同時也為下一層數(shù)據(jù)倉庫的創(chuàng)建提供數(shù)據(jù)源。第五層:數(shù)據(jù)倉庫與數(shù)據(jù)挖掘?qū)?,該層通過上一層的數(shù)據(jù)匯總與集成,創(chuàng)建數(shù)據(jù)倉庫并在此基礎(chǔ)上開展相關(guān)數(shù)據(jù)挖掘活動。

      三、數(shù)據(jù)集市項目的總體建設(shè)原則

      數(shù)據(jù)集市的創(chuàng)建與設(shè)計應(yīng)遵循如下幾項基本原則:數(shù)據(jù)倉庫體系架構(gòu)中的重要組成部分:(1)開放性:在創(chuàng)建數(shù)據(jù)集市項目過程中,需要規(guī)范完備各類設(shè)計開發(fā)文檔,建立、評估創(chuàng)建數(shù)據(jù)集市的標準化流程,明確創(chuàng)建數(shù)據(jù)集市所需的數(shù)據(jù)源,系統(tǒng)的軟硬件運行參數(shù),保證整個項目活動做到開放、透明。(2)擴展性:數(shù)據(jù)集市的創(chuàng)建應(yīng)具備良好的擴展性,創(chuàng)建數(shù)目可隨工程項目的實際需要動態(tài)剪裁,允許設(shè)計者刪減數(shù)據(jù)集市,而不影響整個項目總體設(shè)計的架構(gòu)及實施進度。(3)可靠性:采取多種手段,保證項目設(shè)計可靠、實施可靠、運行可靠及維護可靠。(4)階段性:在設(shè)計過程中充分發(fā)揮多層體系結(jié)構(gòu)的優(yōu)勢,使系統(tǒng)架構(gòu)中的每個層次都能產(chǎn)生相應(yīng)的階段性成果,保證系統(tǒng)能夠提供不同粒度級別的統(tǒng)計分析及決策支持。

      四、數(shù)據(jù)集市創(chuàng)建的流程與步驟

      目前,學(xué)術(shù)界對于數(shù)據(jù)庫的創(chuàng)建與設(shè)計有成熟的理論基礎(chǔ),但有關(guān)創(chuàng)建數(shù)據(jù)倉庫(集市)的理論和方法學(xué)尚不完善。本文結(jié)合高校成本辦學(xué)數(shù)據(jù)集市的具體工程實踐,整理出一套有關(guān)數(shù)據(jù)集市創(chuàng)建流程。如圖2即是數(shù)據(jù)集市項目創(chuàng)建流程示意。

      圖2 數(shù)據(jù)集市創(chuàng)建流程示意圖

      基于高校信息系統(tǒng)下的數(shù)據(jù)集市在創(chuàng)建過程中主要有如下幾大步驟:(1)首先要確立高校數(shù)據(jù)環(huán)境下數(shù)據(jù)集市的研究主題;(2)尋找高校核心業(yè)務(wù)部門的數(shù)據(jù)源:包括業(yè)務(wù)數(shù)據(jù)庫,外部報表、文檔等;(3)運用ETL及建模軟件將高校已有的聯(lián)機業(yè)務(wù)信息系統(tǒng)轉(zhuǎn)換為聯(lián)機事務(wù)分析系統(tǒng),此環(huán)節(jié)是構(gòu)建數(shù)據(jù)集市項目中的最復(fù)雜、最重要的工程實踐環(huán)節(jié),在實際項目中還可將此步驟分解為具體的五個軟件行為活動:1)分析OLTP的實體關(guān)系圖;2)構(gòu)建數(shù)據(jù)集市邏輯模型;3)劃出數(shù)據(jù)集市中基本事實表、維度關(guān)系表和元數(shù)據(jù);4)評審當(dāng)前邏輯結(jié)構(gòu);5)將OLAP的邏輯結(jié)構(gòu)轉(zhuǎn)換成物理結(jié)構(gòu)。(4)利用商業(yè)智能環(huán)境將聯(lián)機事務(wù)分析系統(tǒng)轉(zhuǎn)換為數(shù)據(jù)集市,并在此基礎(chǔ)上開展相關(guān)數(shù)據(jù)挖掘。

      五、多維數(shù)據(jù)集建模規(guī)范及適用性技術(shù)

      在構(gòu)建數(shù)據(jù)倉庫(集市)過程中,人們注重系統(tǒng)的架構(gòu)、邏輯模型選型,對于數(shù)據(jù)的存儲格式并未給予太多關(guān)注,在實際工程實踐中,數(shù)據(jù)結(jié)構(gòu)類型選取的正確與否,將直接影響到數(shù)據(jù)集市的設(shè)計、實施及日后的維護工作。所以,在籌建項目之初就應(yīng)對數(shù)據(jù)類型的選取加以重視,本文結(jié)合數(shù)據(jù)集市建設(shè)的實際情況,提出有關(guān)數(shù)據(jù)建模的一些基本技術(shù)準則和數(shù)據(jù)規(guī)范。

      1.其中有關(guān)維表的一般通用性適用數(shù)據(jù)準則

      (1)維表的屬性應(yīng)大多是文本型且是可離散化的;(2)維表的關(guān)鍵字最好是數(shù)組型的,以滿足事實表海量數(shù)據(jù)代理關(guān)鍵字要求;(3)維表的關(guān)鍵字必須能夠可維護的;(4)維表的關(guān)鍵字集合必須包含事實表中的代理關(guān)鍵字集合。

      2.有關(guān)事實表的一般通用性適用數(shù)據(jù)準則如下

      (1)事實表的關(guān)鍵字一般應(yīng)是數(shù)值型;(2)事實表的度量一般應(yīng)是數(shù)值型、邏輯型,不宜用字符型;(3)事實表結(jié)構(gòu)應(yīng)盡量簡潔,不應(yīng)存儲冗余文本;(4)事實表中的代理關(guān)鍵字集合必須包含于對應(yīng)維表關(guān)鍵字集合。

      六、結(jié)束語

      數(shù)據(jù)集市技術(shù)在高校信息管理中有獨特的地位和應(yīng)用。首先,數(shù)據(jù)集市技術(shù)能夠?qū)崿F(xiàn)學(xué)校各部門內(nèi)數(shù)據(jù)的集成與匯聚,能夠?qū)⒍鄠€孤立的數(shù)據(jù)源整合為統(tǒng)一的數(shù)據(jù)分析模型;其次,數(shù)據(jù)集市技術(shù)可充分滿足校園用戶定制數(shù)據(jù)的要求,能夠支持不同粒度、不同層級的數(shù)據(jù)查詢與統(tǒng)計報表,能夠顯著提升整個學(xué)校的信息管理水平;再次,隨著高校內(nèi)部的信息資源日益龐大,數(shù)據(jù)挖掘等信息的應(yīng)用將越來越被高校管理層所期待和重視,數(shù)據(jù)集市的介入則能夠為高校開展數(shù)據(jù)挖掘與知識發(fā)現(xiàn)奠定良好數(shù)據(jù)環(huán)境和技術(shù)基礎(chǔ)。

      [1]張雅茜.獨立數(shù)據(jù)集市若干關(guān)鍵技術(shù)的研究[D].沈陽航空工業(yè)學(xué)院,2007.

      [2]楊雪峰.數(shù)據(jù)集市系統(tǒng)的分析與設(shè)計[D].北京郵電大學(xué),2011.

      [3]李原.基于數(shù)據(jù)倉庫的高職院校教學(xué)質(zhì)量評測研究[D].湖南大學(xué),2011.

      [4]潘寶娟.數(shù)據(jù)倉庫/數(shù)據(jù)集市體系結(jié)構(gòu)的改進[J].現(xiàn)代計算機,2006(12).

      [5]李聘.元數(shù)據(jù)在數(shù)據(jù)倉庫中的研究與應(yīng)用[D].西北石油大學(xué),2007.

      [6]楊曉,任清珍,蘇靈.數(shù)據(jù)倉庫、數(shù)據(jù)集市和數(shù)據(jù)挖掘[J].現(xiàn)代計算機,1998,01.

      [7]高亮.高校數(shù)據(jù)倉庫建設(shè)研究[J].武漢大學(xué)學(xué)報(理學(xué)版),2012,S1.

      [8]陳樹勝.數(shù)據(jù)倉庫和OLAP在高校人事信息管理中的應(yīng)用研究[D].上海師范大學(xué),2010.

      猜你喜歡
      關(guān)鍵字數(shù)據(jù)倉庫集市
      履職盡責(zé)求實效 真抓實干勇作為——十個關(guān)鍵字,盤點江蘇統(tǒng)戰(zhàn)的2021
      華人時刊(2022年1期)2022-04-26 13:39:28
      熱鬧的集市
      成功避開“關(guān)鍵字”
      基于數(shù)據(jù)倉庫的住房城鄉(xiāng)建設(shè)信息系統(tǒng)整合研究
      探訪于山“相親集市”
      海峽姐妹(2018年12期)2018-12-23 02:39:20
      分布式存儲系統(tǒng)在液晶面板制造數(shù)據(jù)倉庫中的設(shè)計
      電子制作(2016年15期)2017-01-15 13:39:15
      探析電力系統(tǒng)調(diào)度中數(shù)據(jù)倉庫技術(shù)的應(yīng)用
      基于數(shù)據(jù)倉庫的數(shù)據(jù)分析探索與實踐
      熱鬧的集市
      基于用戶反饋的關(guān)系數(shù)據(jù)庫關(guān)鍵字查詢系統(tǒng)
      澳门| 陇川县| 宁南县| 黄龙县| 布拖县| 玉门市| 延川县| 印江| 格尔木市| 榕江县| 平凉市| 台江县| 镇远县| 凉城县| 北川| 汨罗市| 奎屯市| 嘉义市| 襄垣县| 奇台县| 治多县| 安陆市| 大余县| 辛集市| 京山县| 苗栗市| 县级市| 东辽县| 梨树县| 泾源县| 衡水市| 宁晋县| 浪卡子县| 邢台县| 遂昌县| 玉溪市| 元朗区| 余姚市| 苏尼特右旗| 沽源县| 雷山县|