• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      大數(shù)據(jù)下主題數(shù)據(jù)庫的研究現(xiàn)狀與展望*

      2014-12-18 03:08:21于兆吉
      關鍵詞:數(shù)據(jù)管理實體數(shù)據(jù)庫

      于兆吉, 魏 闖

      (沈陽工業(yè)大學 管理學院, 沈陽 110870)

      大數(shù)據(jù)下主題數(shù)據(jù)庫的研究現(xiàn)狀與展望*

      于兆吉, 魏 闖

      (沈陽工業(yè)大學 管理學院, 沈陽 110870)

      在對數(shù)據(jù)庫和數(shù)據(jù)管理發(fā)展歷程進行梳理的基礎上,提出主題數(shù)據(jù)庫應結合大數(shù)據(jù)時代背景下的數(shù)據(jù)特點進行重新定位和改變的觀點。通過對大數(shù)據(jù)和主題數(shù)據(jù)庫相關文獻的篩選、分類和分析,對大數(shù)據(jù)和主題數(shù)據(jù)庫的概念進行認知和界定,對與主題數(shù)據(jù)庫緊密相連的相關研究,包括主題劃分、信息資源規(guī)劃和大數(shù)據(jù)背景下管理和決策的研究現(xiàn)狀進行評述,最后提出大數(shù)據(jù)時代主題數(shù)據(jù)庫進一步研究的方向。

      大數(shù)據(jù); 數(shù)據(jù)管理; 數(shù)據(jù)分析; 主題數(shù)據(jù)庫; 主題劃分; 信息資源規(guī)劃; 研究綜述

      隨著互聯(lián)網(wǎng)突飛猛進的發(fā)展,數(shù)據(jù)總量呈爆炸式增長,數(shù)據(jù)量從TB級別升到ZB級別,IDC報告稱,未來10年數(shù)據(jù)總量將會增加50倍,應對如此的數(shù)據(jù)總量,相應管理數(shù)據(jù)倉庫的服務器將增加10倍[1]。目前主流的軟件已經(jīng)無法在合理的時間內(nèi)針對如此數(shù)量級別的數(shù)據(jù)進行擷取、管理、處理并整理成能為決策提供幫助的信息。美國政府率先提出并啟動了“大數(shù)據(jù)研究和發(fā)展計劃”,標志著大數(shù)據(jù)已上升到國家意志,大數(shù)據(jù)時代到來。

      一、主題數(shù)據(jù)庫的理論發(fā)展

      1.數(shù)據(jù)庫和數(shù)據(jù)管理的發(fā)展

      維基百科中對數(shù)據(jù)是這樣定義的:“描述事物的符號記錄,是可以定義為意義的實體,它涉及到事物的存在形式。”[2]數(shù)據(jù)逐漸演變?yōu)橹腔鄣牧鞒倘鐖D1所示??v觀數(shù)據(jù)庫和數(shù)據(jù)處理的發(fā)展階段,也是圍繞著數(shù)據(jù)演化流程中的處理、挖掘和分析不斷發(fā)展和完善的。

      圖1 數(shù)據(jù)演化流程圖

      20世紀50年代中期以前,數(shù)據(jù)管理處于人工管理階段,數(shù)據(jù)并不被保存,只在需要使用時輸入。數(shù)據(jù)庫在20世紀50年代產(chǎn)生,此時數(shù)據(jù)管理簡單,通過大量的分類、比較和表格繪制的機器運行數(shù)百萬穿孔卡片來進行數(shù)據(jù)處理。Remington Rand Inc 1950年推出的一秒鐘可以輸入數(shù)百條記錄的磁帶驅(qū)動器,引發(fā)了數(shù)據(jù)管理的革命。20世紀50年代后期到60年代中期,磁盤、磁鼓等存儲設備出現(xiàn),數(shù)據(jù)管理進入到文件系統(tǒng)階段。1969年IBM建立第一個數(shù)據(jù)庫系統(tǒng)IMS,數(shù)據(jù)管理由此進入數(shù)據(jù)庫系統(tǒng)階段。

      由于數(shù)據(jù)獨立性和抽象級別上的欠缺,1970年E.F.Codd在論文《大型共享數(shù)據(jù)庫的數(shù)據(jù)關系模型》中提出關系模型的概念。隨著信息技術不斷發(fā)展,關系數(shù)據(jù)庫系統(tǒng)技術趨向成熟,但是不斷出現(xiàn)的復雜數(shù)據(jù)類型對數(shù)據(jù)庫提出了更新更高的要求,接下來出現(xiàn)了演繹數(shù)據(jù)庫、面向?qū)ο髷?shù)據(jù)庫等新的數(shù)據(jù)庫類型研究,但沒有一個統(tǒng)一的數(shù)據(jù)模型能夠?qū)⑿滦偷臄?shù)據(jù)進行表示和聯(lián)系[3]。數(shù)據(jù)管理隨數(shù)據(jù)特點和外部環(huán)境變化共經(jīng)歷了如表1所示的三個階段。

      由于事務處理環(huán)境的局限性,數(shù)據(jù)庫無法實現(xiàn)高效的數(shù)據(jù)分析決策功能,大量數(shù)據(jù)處于分散狀態(tài),而有效正確分析的前提是需要完整和集成的數(shù)據(jù),這樣所得到的結果更加可靠。新的數(shù)據(jù)庫環(huán)境需求由此出現(xiàn),人們的需求從向數(shù)據(jù)庫中添加信息轉(zhuǎn)變?yōu)閺臄?shù)據(jù)庫中得到有用的信息。Bill Inmon 在《建立數(shù)據(jù)倉庫》中提出被人廣泛接受的概念——數(shù)據(jù)倉庫是一個面向主題的、集成的、相對穩(wěn)定的、反映歷史變化的數(shù)據(jù)集合,用于支持管理決策[4]。數(shù)據(jù)庫與數(shù)據(jù)倉庫的主要區(qū)別如表2所示。

      表1 數(shù)據(jù)管理發(fā)展三個階段

      表2 數(shù)據(jù)庫與數(shù)據(jù)倉庫的主要區(qū)別

      數(shù)據(jù)倉庫是面向主題而不是面向事務的,主題是根據(jù)日常事務處理的業(yè)務進行提取的。主題數(shù)據(jù)庫始于20世紀的70年代末期到80年代初,James Martin在《戰(zhàn)略數(shù)據(jù)規(guī)劃方法學》中提出了“主題數(shù)據(jù)庫”的概念和相關理論方法。主題數(shù)據(jù)庫隨著應用的增多,數(shù)據(jù)庫不再增多,它不是按單證報表原樣去進行數(shù)據(jù)庫的搭建,而是面向業(yè)務主題建立數(shù)據(jù)庫,實現(xiàn)系統(tǒng)的集成,解決數(shù)據(jù)冗余、信息共享程度低等亟需解決的問題[5]。

      數(shù)據(jù)倉庫是集成的、面向主題的數(shù)據(jù)集合,主題數(shù)據(jù)庫就是這個集合中的元素。主題數(shù)據(jù)庫是四類數(shù)據(jù)環(huán)境中的高層次數(shù)據(jù)環(huán)境,經(jīng)過歸納總結,主要有以下幾個方面的優(yōu)點:

      (1) 高度共享集約化的數(shù)據(jù)環(huán)境,易于管理。雖然建設時間長,但是所需維護成本低,信息共享程度高,不再是“自建自用”數(shù)據(jù)庫,而是各個應用系統(tǒng)之間的“共建和共用”。

      (2) 獨立于計算機的具體應用。主題數(shù)據(jù)庫與企業(yè)組織需要解決的主要問題相關聯(lián),建成之后很多應用項目可以此為基礎進行構建,減少冗余。

      (3) 可以保證數(shù)據(jù)庫邏輯結構的穩(wěn)定性。數(shù)據(jù)處于相對穩(wěn)定的環(huán)境之中,以此可以建立相對穩(wěn)定的數(shù)據(jù)模型,通過數(shù)據(jù)模型可以保證信息的準確性和及時性,提供可靠的分析決策。

      大數(shù)據(jù)時代下傳統(tǒng)的數(shù)據(jù)倉庫必須向大數(shù)據(jù)進行靠攏,必須具有如表3所示的重要特性才能滿足目前的大數(shù)據(jù)需求。

      表3 數(shù)據(jù)倉庫系統(tǒng)必須具備大數(shù)據(jù)的重要特性

      面對大數(shù)據(jù)時代的數(shù)據(jù)特點,主題數(shù)據(jù)庫的規(guī)劃方法和數(shù)據(jù)管理方式也應產(chǎn)生新的變化以應對數(shù)據(jù)思維的改變。

      2.相關概念界定

      大數(shù)據(jù)最早在Apache org的項目Nutch中被定義為“更新網(wǎng)絡搜索所需要進行批量處理或分析的大量數(shù)據(jù)”[6]。Grobelnik M給出大數(shù)據(jù)的3V定義,認為大數(shù)據(jù)需要基于以下3個特點:Volume(規(guī)模性)、Velocity(高速型)和Variety(多樣性)[7]。IDC考慮大數(shù)據(jù)價值稀疏性的特點,提出了大數(shù)據(jù)4V的定義,即在3V的基礎上添加了Value(價值性)[8]。由于大數(shù)據(jù)的真實性,IBM的4V定義是在3V的基礎上添加了Veracity(真實性)[9]。目前國內(nèi)外在大數(shù)據(jù)的定義上并沒有達成共識,本文基于主題數(shù)據(jù)庫在大數(shù)據(jù)時代下的應用,把大數(shù)據(jù)定義為:“海量的數(shù)據(jù)規(guī)模已經(jīng)無法通過目前主流的工具在合理的時間范圍內(nèi)對業(yè)務數(shù)據(jù)進行搜集、管理和分析處理?!?/p>

      國內(nèi)高復先最早指出主題數(shù)據(jù)庫是一種數(shù)據(jù)環(huán)境,它獨立于具體的應用,數(shù)據(jù)經(jīng)過設計后的存儲結構與處理過程獨立開來,保持主題數(shù)據(jù)庫的邏輯結構穩(wěn)定性[10]。李俊、趙霽對主題數(shù)據(jù)庫的特點與組織方式進行研究后,定義主題數(shù)據(jù)庫為“一個用于支持企業(yè)或組織的決策分析處理的、面向主題的、集成的數(shù)據(jù)集合”[11]。本文結合大數(shù)據(jù)時代背景重新定義主題數(shù)據(jù)庫,認為主題數(shù)據(jù)庫是在對整體業(yè)務需求分析規(guī)劃的前提下,以面向業(yè)務主題為基準對各類應用數(shù)據(jù)進行綜合管理,消除冗余,抽取主題而建立的穩(wěn)定數(shù)據(jù)庫。

      二、大數(shù)據(jù)下主題數(shù)據(jù)庫的研究現(xiàn)狀

      目前國內(nèi)外的學者對主題數(shù)據(jù)庫的研究主要集中在信息資源規(guī)劃和主題劃分兩個方面。

      1.信息資源規(guī)劃的相關研究

      I.B.Singh最早在《信息資源規(guī)劃方法:案例研究》中以加拿大Albert地區(qū)殺蟲劑的使用和相關管理網(wǎng)建設為例,解釋了IRP產(chǎn)生的時代背景、目的和理論方法,其實施的主要步驟如圖2[12]所示。

      圖2 IRP的實施流程圖

      信息資源規(guī)劃的研究角度主要有以下幾個方面:

      (1) 戰(zhàn)略角度。大數(shù)據(jù)時代信息資源主要是海量的業(yè)務數(shù)據(jù),無論多復雜龐大的信息系統(tǒng)都是以信息資源作為基礎和先導工作。

      陳延壽在《企業(yè)信息資源的開發(fā)和利用》一文中指出了信息資源規(guī)劃的戰(zhàn)略性地位,認為由于信息資源規(guī)劃的復雜性,存在著在規(guī)劃中缺乏相關的理論指導和專業(yè)型人才缺乏的問題[13]。秦艷姣在《信息資源規(guī)劃與企業(yè)信息化》中對我國的信息化發(fā)展現(xiàn)狀進行了分析,認為信息化的首要解決辦法就是信息資源規(guī)劃,闡釋了信息資源規(guī)劃的實施流程和步驟,并對其在企業(yè)信息化中相關的具體應用進行歸納總結[14]。王學穎在《基于生命周期視角的企業(yè)信息資源規(guī)劃研究》中分析了我國企業(yè)信息資源管理和規(guī)劃的現(xiàn)狀,在此基礎上提出了基于生命周期的規(guī)劃方法ILEA,并對其基本構成和開發(fā)的方法進行了闡述[15]。

      大多數(shù)企業(yè)或組織在業(yè)務處理中沒有明確的信息資源規(guī)劃,還有一些企業(yè)形成的信息資源戰(zhàn)略管理的思維是信息資源杠桿戰(zhàn)略,因此信息資源的整合需要相應的戰(zhàn)略制定[16]。S.K.Min指出,數(shù)據(jù)信息是目前企業(yè)或組織在競爭市場中獲得有利地位的決定性資源,提出了戰(zhàn)略系統(tǒng)規(guī)劃的概念,并且介紹了相關的方法論以及實施的具體過程[17]。

      隨著大數(shù)據(jù)時代的到來,數(shù)據(jù)信息共享以及工作的跨領域特性,在交接環(huán)節(jié)中就會導致延遲或者錯誤。許捷關注財務系統(tǒng)在各個組織中的重要地位,并試圖從信息資源規(guī)劃的角度去詮釋建立財務信息系統(tǒng)在數(shù)據(jù)規(guī)劃中的相應模型[18]。李翔認為,信息資源規(guī)劃的工作需要和業(yè)務流程重組聯(lián)系,以業(yè)務流程重組為中心點進行展開[19]。

      (2) 應用角度。信息資源一般可以按照來源分為內(nèi)部資源和外部資源。其中內(nèi)部資源系指與企業(yè)組織內(nèi)部業(yè)務聯(lián)系的各種信息資源,而外部資源就是企業(yè)或組織運營之外產(chǎn)生的但是與其緊密相連的各種信息的集合。

      從內(nèi)部信息資源來看,企業(yè)組織在空間上的跨度越來越大,分布地區(qū)越來越分散,然而對信息共享的要求越來越高,而且每個層次對于信息需求的程度和類型不同。從外部信息資源來看,Asa.Du.Toit在其《南非制造企業(yè)信息管理》一文中對南非制造企業(yè)的信息競爭優(yōu)勢進行了研究分析,討論了通過有效的信息資源,從戰(zhàn)略的眼光來看其競爭優(yōu)勢能否增強[20]。我國學者孫毅通過對遼寧大連圣達公司為某企業(yè)成功實施信息資源規(guī)劃項目的研究,闡釋了如何使IRP適合各種應用系統(tǒng)。

      此外,我國學者對不同行業(yè)IRP進行了研究。其中,吳迪針對建筑行業(yè)闡述了因為采用分散開發(fā)和局部應用系統(tǒng)造成“信息孤島”問題的現(xiàn)實存在,并探討了通過信息資源規(guī)劃的相關方法進行信息系統(tǒng)的集成,進而解決數(shù)據(jù)共享程度低的問題[21]。郭崇針對電信行業(yè),介紹了集成化和網(wǎng)絡化的龐大任務以及采用信息資源規(guī)劃和應用系統(tǒng)進行資源整合、引進先進的軟件和系統(tǒng)開發(fā)間的聯(lián)系[22]。

      (3) 方法模型角度。大多數(shù)學者對信息資源規(guī)劃、管理的模型和框架進行了探討。馬爾香提出了信息資源管理7模塊的理論,包括電子通訊、數(shù)據(jù)管理、文書和記錄管理、圖書館和技術情報中心、辦公系統(tǒng)研究和統(tǒng)計信息管理、信息服務[23]。而我國學者王曉光提出了6I模型,包括信息產(chǎn)品、信息內(nèi)容、信息標準、信息系統(tǒng)、信息流程、信息組織[24]。

      蔡文海重點突出了主題數(shù)據(jù)庫建設在信息組織技術中的核心地位,探討了主題數(shù)據(jù)庫在運輸經(jīng)濟中的應用和重要地位[25]。陳騫在探討主題數(shù)據(jù)庫規(guī)劃的過程中提出了建立主題數(shù)據(jù)庫的相關方法,并闡述了對模型進行遴選的方法[26]。

      2.主題劃分的相關研究

      主題數(shù)據(jù)庫在某種程度上是IRP實施數(shù)據(jù)標準化的支撐,對主題合理的規(guī)劃實施才能保證數(shù)據(jù)庫系統(tǒng)高效率、穩(wěn)定地運行,并能快速適用于多變的應用環(huán)境。在主題數(shù)據(jù)庫的構建中,如何找出實體之間的關系,根據(jù)業(yè)務需求、數(shù)據(jù)需求提取主題是國內(nèi)外學者研究的重要內(nèi)容。

      James Martin在《信息工程》中提出實體和活動之間的內(nèi)在聯(lián)系,親和度的概念以及計算公式也同時被給出,企業(yè)組織可以依據(jù)計算出的親和度值判斷實體之間聯(lián)系的密切程度,然后進行實體劃分,最后可以實現(xiàn)主題數(shù)據(jù)庫的簡單劃分[26]126-127。然而,親和度具有雙向性,也就是說實體A到實體B的親和度并不等同于實體B到實體A的親和度。因此,親和度不能明顯地區(qū)分和確定實體之間的關系,容易造成實體之間緊密程度的混淆,影響業(yè)務活動中對實體關系的分析,這對于主題的劃分并沒有實際的意義。

      周炎濤在親和性分析的基礎上提出了單向性模型,對雙向性的方法進行改進,定義了聚合性分析以及聚合度的概念,以此來區(qū)別親和度和親和性分析的相關概念,通過建立聚合性分析的矩陣,可以清楚地看到實體之間的關聯(lián)程度,規(guī)避了親和性分析中的雙向性問題,更有利于實體分析中對于實體關系的分析和理解[27]。而王思昌通過對實體活動之間關系的研究,建立了E-A矩陣,間接地判斷實體之間的關聯(lián)程度,從而對實體進行規(guī)劃:首先確立核心實體,然后計算核心實體和其他各個實體之間的關系數(shù)值R,當R大于給定的關聯(lián)系數(shù)分界值時,表明兩個實體之間的關聯(lián)程度為緊密,因此這兩個實體組就可以歸為一個實體大組;相反則兩個實體組之間的關系為互相獨立[28]。

      劉文遠在對聚合性分析的研究中發(fā)現(xiàn),一些非核心的實體和核心實體對中的兩個實體之間的聚合度值是相同的,但是遇到聚合度不相等的情形,依然會出現(xiàn)和親和度一樣的雙向性問題,導致無法準確判斷對兩個實體如何進行劃分。為解決此問題,劉文遠在《IRP中基于廣義聚合度的主題數(shù)據(jù)庫劃分技術》一文中給出了廣義聚合度的概念,規(guī)避了核心實體和與其聚合的其他實體具有次要聯(lián)系時的雙向性問題。這樣主題數(shù)據(jù)庫的劃分技術就更具有普遍適用性,實體之間的關系更為清晰且易于理解[29]。

      樊康新等在研究實體之間的關系以及聯(lián)系強度的基礎上,提出了實體閉包的概念,指出可以將有關聯(lián)的實體劃分到一個閉包中,在進行實體分組時,計算實體之間聯(lián)系的緊密程度和使用頻率,認為同一組的所有實體應該都具有較緊密的關聯(lián)并較為頻繁地被使用,與此同時,各個組的實體之間原則上應該沒有關聯(lián)或者關聯(lián)性較弱而且被使用頻率較低。基于這種理論,企業(yè)組織應該根據(jù)實際應用情況確定各個實體之間的關聯(lián)程度,然后根據(jù)實體之間關聯(lián)程度的強弱進行再次調(diào)整[30]。

      綜合主題數(shù)據(jù)庫主題規(guī)劃的研究現(xiàn)狀,主題數(shù)據(jù)庫的規(guī)劃就是從上至下對業(yè)務所涉及的所有實體進行聚類分析,并將全部數(shù)據(jù)劃分成可管理的單元。

      3.大數(shù)據(jù)背景下數(shù)據(jù)的管理決策

      大數(shù)據(jù)時代下的數(shù)據(jù)思維發(fā)生了革命性的變化,國內(nèi)外學者緊跟時代步伐,對大數(shù)據(jù)背景下的管理決策進行研究與探索。包括R.E.Bryant在內(nèi)的三位信息科學領域的資深專家發(fā)表了《大數(shù)據(jù)計算:商務、科學和社會領域的革命性突破》,讓研究人員和業(yè)界認識到,最重要的是大數(shù)據(jù)帶來的用途和見解的新穎性而不是數(shù)據(jù)本身[31]。緊隨其后,包括IBM在內(nèi)的國際知名公司爭先開始了大數(shù)據(jù)戰(zhàn)略的進程,主動跟進大數(shù)據(jù)研究的最新進展和應用。目前的大數(shù)據(jù)研究仍處于初步階段,大部分研究集中于數(shù)據(jù)的挖掘、儲存、處理以及數(shù)據(jù)安全等方面。國內(nèi)外鮮有學者從管理決策的層面對大數(shù)據(jù)帶來的革新和變化進行研究,這個領域是大數(shù)據(jù)背景下亟需關注的研究方向。

      三、總結與展望

      主題數(shù)據(jù)庫概念的提出已有時日,但主題數(shù)據(jù)庫的相關理論和方法并沒有被大規(guī)模地應用到實踐中,因此還存在很多值得深入探討的問題。隨著大數(shù)據(jù)時代的到來,主題數(shù)據(jù)庫也必然產(chǎn)生新的理論和問題,總結歸納起來主要有以下幾個方面:

      (1) 計算機技術隨著時代的發(fā)展飛速變化,IRP中主題數(shù)據(jù)庫的相關劃分方法也將隨之發(fā)生新的改變。如何在海量數(shù)據(jù)的今天,在滿足信息化要求的同時簡化主題數(shù)據(jù)庫流程,提高適用性,統(tǒng)一標準,仍需要對理論方法不斷完善并和IRP結合起來,開展大量的工作。

      (2) 大數(shù)據(jù)背景下,大部分數(shù)據(jù)是非結構化的數(shù)據(jù),數(shù)據(jù)質(zhì)量參差不齊。主題數(shù)據(jù)庫中主題的劃分方法在此時代背景下需要得以完善,如何對實體與實體、實體與活動之間的關系建立合理的模型或者進行計算,快速地將龐大的數(shù)據(jù)量分成合理的數(shù)據(jù)單元,建立起符合業(yè)務需求的主題數(shù)據(jù)庫是擺在面前的首要問題[32]。

      目前大數(shù)據(jù)仍然處于起步探索階段,對于大數(shù)據(jù)的管理決策問題并沒有太多相關的研究成果。主題數(shù)據(jù)庫的建立是為了對數(shù)據(jù)進行管理和通過數(shù)據(jù)進行決策,因此在大數(shù)據(jù)背景下的主題數(shù)據(jù)庫更應該側重于主題數(shù)據(jù)庫的數(shù)據(jù)分析和數(shù)據(jù)管理決策問題。針對大數(shù)據(jù)的幾個特點,哪個特點對數(shù)據(jù)管理決策的影響最大,不同領域的使用人員和不同學科的研究人員之間如何溝通和協(xié)作才能有利于大數(shù)據(jù)背景下主題數(shù)據(jù)庫相關問題的解決,都將是下一步需要研究的方向。

      [1] Gantz J,Reinsel D.2011 digital universe study:extracting value from chaos [EB/OL].[2011-09-01].http://china.emc.com/collateral/analyst-reports/idc-extracting-value-from-chaos-ar.pdf.

      [2] 維基百科.數(shù)據(jù) [EB/OL].[2014-04-05].http://zh.wikipedia.org/w/index.php?title=%E6%95%B0%E6%8D%AE&oldid=28910777.

      [3] 覃雄派,王會舉,李芙蓉,等.數(shù)據(jù)管理技術的新格局 [J].軟件學報,2013(2):175-197.

      [4] 劉喜文,鄭昌興,王文龍,等.構建數(shù)據(jù)倉庫過程中的數(shù)據(jù)清洗研究 [J].圖書與情報,2013(5):22-28.

      [5] 陳騫,劉偉,孟慶久.信息資源規(guī)劃中的主題數(shù)據(jù)庫研究 [J].情報雜志,2006(2):136-137.

      [6] 孟小峰,慈祥.大數(shù)據(jù)管理:概念、技術與挑戰(zhàn) [J].計算機研究與發(fā)展,2013(1):146-169.

      [7] Grobelnik M.Big-data computing:creating revolutionary breakthroughs in commerce,science,and society [EB/OL].[2014-04-05].http://videolectures.net/eswc2012_grobelnik_big_data.

      [8] Barwick H.The “four Vs” of big data:implementing information infrastructure symposium [EB/OL].[2014-04-05].http://www.computerworld.com.au/article/396198/iiis_four_vs_big_data.

      [9] IBM.What is big data [EB/OL].[2014-04-05].http://www-01.ibm.com/software/data/bigdata.

      [10]高復先.信息工程與總體數(shù)據(jù)規(guī)劃 [J].交通與計算機,1988(2):8-14,55.

      [11]李俊,趙霽.主題數(shù)據(jù)庫的特點與組織方式 [J].交通與計算機,2000(3):12-13.

      [12]柯新生.基于網(wǎng)絡的企業(yè)級信息資源規(guī)劃理論與方法研究 [D].北京:北京交通大學,2009:2-15.

      [13]陳延壽.企業(yè)信息資源的開發(fā)與利用 [J].現(xiàn)代情報,2005(7):193-195.

      [14]秦艷姣.信息資源規(guī)劃與企業(yè)信息化 [J].現(xiàn)代情報,2006(7):179-181.

      [15]劉益江,毛寧,陳慶新.一種評估數(shù)據(jù)倉庫設計質(zhì)量的方法 [J].計算機技術與發(fā)展,2012(9):161-165.

      [16]王學穎.基于生命周期視角的企業(yè)信息資源規(guī)劃研究 [J].情報雜志,2011(6):156-160,147.

      [17]Chantrasa R.Decision-making approaches for information sharing in a supply chain [D].USA:Clemson University,2005:5-20.

      [18]許捷.財務信息化與信息資源規(guī)劃 [D].大連:東北財經(jīng)大學,2003:15-32.

      [19]李翔.試論企業(yè)經(jīng)營秘密的保護 [J].科技情報開發(fā)與經(jīng)濟,2003(11):181-183.

      [20]李曉鋼.智慧城市的信息資源規(guī)劃研究 [J].電子政務,2011(4):32-37.

      [21]劉明,高明印,李常建.企業(yè)信息資源規(guī)劃實施研究 [J].價值工程,2004(4):113-116.

      [22]郭崇.應用信息資源規(guī)劃建立電信企業(yè)信息化基礎 [J].東北財經(jīng)大學學報,2004(6):51-53.

      [23]覃雄派,王會舉,杜小勇,等.大數(shù)據(jù)分析:RDBMS與Map Reduce的競爭與共生 [J].軟件學報,2012(1):32-45.

      [24]王曉光.面向信息企業(yè)的信息資源規(guī)劃研究 [D].武漢:武漢大學,2004:21-31.

      [25]蔡文海.信息資源規(guī)劃工具的研制及其在運輸經(jīng)濟中的應用 [D].大連:大連海事大學,2000:6-18.

      [26]詹姆斯·馬丁.戰(zhàn)略數(shù)據(jù)規(guī)劃 [M].北京:清華大學出版社,1994.

      [27]周炎濤,謝東,吳正國.單向性模型下的主題數(shù)據(jù)庫聚合性分析 [J].湖南大學學報:自然科學版,2005(3):101-104.

      [28]王思昌,冀亞林.信息工程中主題數(shù)據(jù)庫的規(guī)劃與設計 [J].價值工程,2005(9):66-68.

      [29]劉文遠,徐麗娜,王寶文,等.IRP中基于廣義聚合度的主題數(shù)據(jù)庫劃分技術 [J].情報雜志,2007(10):70-71,74.

      [30]樊康新,李春明,顧暉,等.MIS戰(zhàn)略數(shù)據(jù)規(guī)劃與主題數(shù)據(jù)庫構造 [J].工業(yè)控制計算機,2002(10):4-7.

      [31]Watts D J.A twenty-first century science [J].Nature,2007,445(7127):489.

      [32]王珊,王會舉,覃雄派,等.架構大數(shù)據(jù):挑戰(zhàn)、現(xiàn)狀與展望 [J].計算機學報,2011(10):1741-1752.

      Statusquoandprospectofresearchesonsubjectdatabaseineraofbigdata

      YU Zhao-ji, WEI Chuang

      (School of Management, Shenyang University of Technology, Shenyang 110870, China)

      Based on summarizing the development process of database and data management, the opinion is proposed that subject database should be repositioned and changed combining with the data features under the background of big data era.Through filtering, classifying and analyzing related literatures of big data and subject database, the conceptions of big data and subject database are recognized and defined, the status quo of related researches closely connected with subject database is reviewed and elaborated including topic partition, information resource planning, and management and decision-making under background of big data, and the further research direction of subject database in era of big data is proposed finally.

      big data; data management; data analysis; subject database; subject partition; information resource planning; research review

      2014-03-22

      國家軟科學研究計劃資助項目(2012GXS4D078); 遼寧省自然科學基金項目(201202169); 遼寧省高等學校優(yōu)秀人才支持計劃項目(WR2012003)。

      基金項目:于兆吉(1975-),男,遼寧遼陽人,副教授,博士,主要從事企業(yè)管理與技術創(chuàng)新等方面的研究。

      * 本文已于2014-05-20 16∶55在中國知網(wǎng)優(yōu)先數(shù)字出版。 網(wǎng)絡出版地址:http://www.cnki.net/kcms/detail/21.1558.C.20140524.2141.016.html

      10.7688/j.issn.1674-0823.2014.03.12

      C 93-0

      A

      1674-0823(2014)03-0263-05

      (責任編輯:吉海濤)

      猜你喜歡
      數(shù)據(jù)管理實體數(shù)據(jù)庫
      企業(yè)級BOM數(shù)據(jù)管理概要
      定制化汽車制造的數(shù)據(jù)管理分析
      海洋環(huán)境數(shù)據(jù)管理優(yōu)化與實踐
      CTCS-2級報文數(shù)據(jù)管理需求分析和實現(xiàn)
      前海自貿(mào)區(qū):金融服務實體
      中國外匯(2019年18期)2019-11-25 01:41:54
      實體的可感部分與實體——兼論亞里士多德分析實體的兩種模式
      哲學評論(2017年1期)2017-07-31 18:04:00
      振興實體經(jīng)濟地方如何“釘釘子”
      兩會進行時:緊扣實體經(jīng)濟“釘釘子”
      數(shù)據(jù)庫
      財經(jīng)(2017年2期)2017-03-10 14:35:35
      數(shù)據(jù)庫
      財經(jīng)(2016年15期)2016-06-03 07:38:02
      建平县| 长宁区| 绍兴市| 宜昌市| 准格尔旗| 鄂州市| 罗平县| 河间市| 宁明县| 禄劝| 澄迈县| 南木林县| 阿瓦提县| 宝清县| 黑龙江省| 葫芦岛市| 新津县| 广水市| 务川| 宣化县| 竹山县| 伊吾县| 威远县| 尤溪县| 马龙县| 鄯善县| 滦南县| 望江县| 尼木县| 和龙市| 巴林右旗| 德清县| 二连浩特市| 田东县| 英山县| 鹤山市| 麟游县| 山西省| 察哈| 东海县| 右玉县|