• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      淺析關(guān)系數(shù)據(jù)庫(kù)、數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘的關(guān)系

      2015-08-15 00:54:11馬麗君
      科技視界 2015年20期
      關(guān)鍵詞:決策分析關(guān)系數(shù)據(jù)庫(kù)數(shù)據(jù)倉(cāng)庫(kù)

      馬麗君

      (白城師范學(xué)院計(jì)算機(jī)科學(xué)學(xué)院,吉林 白城 137000)

      淺析關(guān)系數(shù)據(jù)庫(kù)、數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘的關(guān)系

      馬麗君

      (白城師范學(xué)院計(jì)算機(jī)科學(xué)學(xué)院,吉林 白城 137000)

      關(guān)系數(shù)據(jù)庫(kù)、數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)挖掘是作為三種獨(dú)立的信息技術(shù)出現(xiàn)的,是數(shù)據(jù)庫(kù)研究、開(kāi)發(fā)和應(yīng)用最活躍的分支之一,通過(guò)對(duì)三種技術(shù)的內(nèi)在聯(lián)系性和互補(bǔ)性分析,從而更好的使用數(shù)據(jù)庫(kù)技術(shù)處理各種信息需求,建立更加完善的數(shù)據(jù)庫(kù)應(yīng)用系統(tǒng)或新的決策系統(tǒng)。

      關(guān)系數(shù)據(jù)庫(kù);數(shù)據(jù)倉(cāng)庫(kù);數(shù)據(jù)挖掘;關(guān)系

      0 引言

      關(guān)系數(shù)據(jù)庫(kù)是20世紀(jì)70年代初提出來(lái),經(jīng)過(guò)數(shù)據(jù)庫(kù)專(zhuān)家?guī)资甑呐?,理論和?shí)踐都取得了顯著成果,標(biāo)志著數(shù)據(jù)庫(kù)技術(shù)的日益成熟。但它仍然難以實(shí)現(xiàn)對(duì)關(guān)系數(shù)據(jù)庫(kù)中數(shù)據(jù)的分析,不能很好地支持決策,因此在80年代,產(chǎn)生了數(shù)據(jù)倉(cāng)庫(kù)的思想,90年代,數(shù)據(jù)倉(cāng)庫(kù)的基本原理、架構(gòu)形式和使用原則都已確定。主要技術(shù)包括對(duì)數(shù)據(jù)庫(kù)中數(shù)據(jù)訪(fǎng)問(wèn)、網(wǎng)絡(luò)、C/S結(jié)構(gòu)和圖形界面,一些大公司已經(jīng)開(kāi)始構(gòu)建數(shù)據(jù)倉(cāng)庫(kù)。針對(duì)數(shù)據(jù)倉(cāng)庫(kù)中迅速增長(zhǎng)的海量數(shù)據(jù)的收集、存放,用人力已經(jīng)不能解決,那么數(shù)據(jù)倉(cāng)庫(kù)中有用的知識(shí)的提取就需要數(shù)據(jù)挖掘來(lái)實(shí)現(xiàn)。數(shù)據(jù)挖掘與統(tǒng)計(jì)學(xué)子領(lǐng)域“試探性數(shù)據(jù)分析”及人工智能子領(lǐng)域“知識(shí)發(fā)現(xiàn)”和機(jī)器學(xué)有關(guān),是一門(mén)綜合性的技術(shù)學(xué)科。了解關(guān)系數(shù)據(jù)庫(kù)、數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘三者之間的區(qū)別與聯(lián)系,使之更好的使用這3種技術(shù),處理各種信息需求是非常必要和重要的。

      1 關(guān)系數(shù)據(jù)庫(kù)、數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)挖掘之間的關(guān)系

      1.1 關(guān)系數(shù)據(jù)庫(kù)和數(shù)據(jù)倉(cāng)庫(kù)之間的聯(lián)系與區(qū)別

      關(guān)系數(shù)據(jù)庫(kù)是面向事務(wù)的設(shè)計(jì),數(shù)據(jù)倉(cāng)庫(kù)是一個(gè)面向主題的設(shè)計(jì);關(guān)系數(shù)據(jù)庫(kù)存儲(chǔ)在線(xiàn)事務(wù)數(shù)據(jù),數(shù)據(jù)倉(cāng)庫(kù)通常存儲(chǔ)歷史數(shù)據(jù),關(guān)系數(shù)據(jù)庫(kù)的設(shè)計(jì)將盡量避免冗余,但數(shù)據(jù)倉(cāng)庫(kù)是傾向于引入冗余;關(guān)系數(shù)據(jù)庫(kù)設(shè)計(jì)用于捕獲數(shù)據(jù),數(shù)據(jù)倉(cāng)庫(kù)設(shè)計(jì)用于分析數(shù)據(jù)。傳統(tǒng)的關(guān)系數(shù)據(jù)庫(kù)面向以事務(wù)處理為主的系統(tǒng)應(yīng)用,所以它無(wú)法滿(mǎn)足決策支持系統(tǒng)的分析要求。事務(wù)處理和分析處理有非常不同的性質(zhì),他們有不同的需求數(shù)據(jù)。

      1.2 數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘之間的聯(lián)系與區(qū)別

      數(shù)據(jù)挖掘是基于數(shù)據(jù)倉(cāng)庫(kù)和多維數(shù)據(jù)庫(kù)中的數(shù)據(jù),找到數(shù)據(jù)的潛在模式進(jìn)行預(yù)測(cè),它可以對(duì)數(shù)據(jù)進(jìn)行復(fù)雜處理。大多數(shù)情況下,數(shù)據(jù)挖掘是讓數(shù)據(jù)從數(shù)據(jù)倉(cāng)庫(kù)到數(shù)據(jù)挖掘數(shù)據(jù)庫(kù)中。從數(shù)據(jù)倉(cāng)庫(kù)中直接得到進(jìn)行數(shù)據(jù)挖掘的數(shù)據(jù)有許多優(yōu)點(diǎn),因?yàn)閿?shù)據(jù)倉(cāng)庫(kù)中數(shù)據(jù)的清理和數(shù)據(jù)挖掘中幾乎是相同的,如果數(shù)據(jù)在數(shù)據(jù)倉(cāng)庫(kù)中已被清除,數(shù)據(jù)挖掘中不再被清除,并且數(shù)據(jù)不一致也得到了解決。數(shù)據(jù)倉(cāng)庫(kù)是數(shù)據(jù)挖掘的先期步驟,通過(guò)數(shù)據(jù)倉(cāng)庫(kù)的構(gòu)建,提高了數(shù)據(jù)挖掘的效率和能力,保證了數(shù)據(jù)挖掘中的數(shù)據(jù)的寬廣性和完整性。

      1.3 關(guān)系數(shù)據(jù)庫(kù)與數(shù)據(jù)挖掘之間的聯(lián)系與區(qū)別

      數(shù)據(jù)挖掘的數(shù)據(jù)源不一定是數(shù)據(jù)倉(cāng)庫(kù)。也可以是一個(gè)關(guān)系數(shù)據(jù)庫(kù)中的數(shù)據(jù),但要事先進(jìn)行數(shù)據(jù)預(yù)處理,才能用于數(shù)據(jù)挖掘。數(shù)據(jù)預(yù)處理是數(shù)據(jù)挖掘的關(guān)鍵步驟,并且是數(shù)據(jù)挖掘過(guò)程中的主要工作部分。因此,數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)挖掘沒(méi)有必然的聯(lián)系,有些人簡(jiǎn)單地認(rèn)為,數(shù)據(jù)倉(cāng)庫(kù)是數(shù)據(jù)挖掘的準(zhǔn)備,這種理解是不全面的,也可以使用關(guān)系數(shù)據(jù)庫(kù)中的數(shù)據(jù)作為數(shù)據(jù)挖掘的數(shù)據(jù)源。

      2 三種技術(shù)的應(yīng)用

      2.1 應(yīng)用價(jià)值

      2.1.1 關(guān)系數(shù)據(jù)庫(kù)

      關(guān)系數(shù)據(jù)庫(kù)的主要價(jià)值體現(xiàn)在事務(wù)處理。關(guān)系數(shù)據(jù)庫(kù)已經(jīng)滲透到各行各業(yè)的日常事務(wù),該事務(wù)管理離不開(kāi)關(guān)系數(shù)據(jù)庫(kù)的應(yīng)用系統(tǒng),這是對(duì)傳統(tǒng)事務(wù)管理的一個(gè)重大突破,是社會(huì)甚至家庭不可或缺的工具,它對(duì)社會(huì)的應(yīng)用價(jià)值是100%。

      2.1.2 數(shù)據(jù)倉(cāng)庫(kù)

      數(shù)據(jù)倉(cāng)庫(kù)的主要價(jià)值體現(xiàn)在為決策分析提供數(shù)據(jù)源。一方面,在一個(gè)事務(wù)中,用戶(hù)要求高效的訪(fǎng)問(wèn)系統(tǒng)和數(shù)據(jù)庫(kù),操作時(shí)間應(yīng)該短。在一個(gè)決策分析中,決策問(wèn)題的一些請(qǐng)求可能會(huì)導(dǎo)致系統(tǒng)的操作,解決這一問(wèn)題的決策分析需要遍歷大多數(shù)數(shù)據(jù)庫(kù)中的數(shù)據(jù),這對(duì)一般日常事務(wù)處理系統(tǒng)是困難的,所以操作數(shù)據(jù)和決策分析數(shù)據(jù)應(yīng)該分開(kāi)。另一方面,決策數(shù)據(jù)需求問(wèn)題。在決策分析時(shí),由于不同的應(yīng)用系統(tǒng)中,實(shí)體、字段存在數(shù)據(jù)類(lèi)型、名稱(chēng)和格式的不符,需要在集成時(shí)進(jìn)行轉(zhuǎn)換,這個(gè)轉(zhuǎn)換必須在決策之前完成;一些決策數(shù)據(jù)需要?jiǎng)討B(tài)更新,需要經(jīng)常進(jìn)行匯總和總結(jié),這些需求用事務(wù)處理系統(tǒng)解決比較繁瑣。三是數(shù)據(jù)的操作模式問(wèn)題。決策分析人員要以專(zhuān)業(yè)用戶(hù)身份,使用各種工具以各種形式來(lái)操作數(shù)據(jù),對(duì)數(shù)據(jù)操作的結(jié)果以商業(yè)智能的方式表達(dá)出來(lái)。事務(wù)處理系統(tǒng)不能滿(mǎn)足這一要求,只有數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)能夠滿(mǎn)足數(shù)據(jù)挖掘技術(shù)對(duì)數(shù)據(jù)環(huán)境的要求,所以使用數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)省去了對(duì)數(shù)據(jù)預(yù)處理的步驟。

      2.1.3 數(shù)據(jù)挖掘

      面對(duì)日益激烈的市場(chǎng)競(jìng)爭(zhēng),客戶(hù)對(duì)迅速應(yīng)答各種業(yè)務(wù)問(wèn)題的能力要求越來(lái)越高,對(duì)過(guò)量數(shù)據(jù)的及時(shí)處理要求越來(lái)越高,帶來(lái)的挑戰(zhàn)一方面大規(guī)模、復(fù)雜數(shù)據(jù)系統(tǒng)讓用戶(hù)感覺(jué)漫無(wú)頭緒,無(wú)法開(kāi)始;另一方面,這些大量數(shù)據(jù)背后隱藏很多有意義的有價(jià)值的決策信息。如計(jì)算機(jī)界都熟知的“啤酒與尿布”的故事,就是零售業(yè)巨頭“沃爾瑪”從大量銷(xiāo)售數(shù)據(jù)中分析出來(lái)的規(guī)律:美國(guó)的男士在下班要去超市買(mǎi)嬰兒尿布,同時(shí)他們還會(huì)買(mǎi)啤酒?!拔譅柆敗本桶堰@兩種“毫不相干”的商品擺放在靠近的貨架上,并且還擺放一些下灑小菜,使這些商品銷(xiāo)量大增。所以應(yīng)用數(shù)據(jù)挖掘從大量數(shù)據(jù)中發(fā)現(xiàn)規(guī)律,具有具體的指導(dǎo)意義。

      2.2 應(yīng)用領(lǐng)域

      2.2.1 關(guān)系數(shù)據(jù)庫(kù)

      關(guān)系數(shù)據(jù)庫(kù)應(yīng)用領(lǐng)域非常廣泛,如:證券行業(yè)、醫(yī)院、銀行、銷(xiāo)售部門(mén)、公司或企業(yè),以及政府、國(guó)防工業(yè),科學(xué)和技術(shù)發(fā)展領(lǐng)域等等,這些領(lǐng)域都需要使用數(shù)據(jù)庫(kù)來(lái)存儲(chǔ)數(shù)據(jù)。例如:人事管理系統(tǒng)、工資管理系統(tǒng),xxx部門(mén)信息管理系統(tǒng),手機(jī)話(huà)費(fèi)管理系統(tǒng)等,都需要關(guān)系數(shù)據(jù)庫(kù)作為后臺(tái)提供數(shù)據(jù)源。

      2.2.2 數(shù)據(jù)倉(cāng)庫(kù)

      數(shù)據(jù)倉(cāng)庫(kù)應(yīng)用領(lǐng)域主要有兩個(gè)方面:一是全局應(yīng)用。因?yàn)閿?shù)據(jù)倉(cāng)庫(kù)獲得來(lái)自多方面的數(shù)據(jù),所以在把數(shù)據(jù)向數(shù)據(jù)倉(cāng)庫(kù)輸入時(shí),要進(jìn)行轉(zhuǎn)換、計(jì)算和綜合等集成處理。通過(guò)處理把來(lái)自不同地方的數(shù)據(jù)源轉(zhuǎn)換成統(tǒng)一的格式,以促進(jìn)全局應(yīng)用。二是復(fù)雜系統(tǒng)。信息處理的要求越來(lái)越復(fù)雜,除了數(shù)據(jù)處理操作,如添加、刪除、修改、和統(tǒng)計(jì)匯總,高級(jí)管理層也希望對(duì)歷史的和現(xiàn)在的數(shù)據(jù)進(jìn)行各種復(fù)雜性分析,以支持決策。數(shù)據(jù)倉(cāng)庫(kù)中就是存儲(chǔ)了舊的歷史數(shù)據(jù),方便復(fù)雜分析、應(yīng)用,為高層決策服務(wù)。

      2.2.3 數(shù)據(jù)挖掘

      數(shù)據(jù)挖掘的應(yīng)用領(lǐng)域主要表現(xiàn)在特定應(yīng)用問(wèn)題和應(yīng)用背景。數(shù)據(jù)挖掘技術(shù)已經(jīng)應(yīng)用于各行各業(yè),如電信,保險(xiǎn),交通,學(xué)校、銀行、超級(jí)市場(chǎng)等。例如:數(shù)據(jù)挖掘技術(shù)應(yīng)用在大學(xué)。高校擴(kuò)招,學(xué)生增加到幾萬(wàn)人,但是學(xué)生的學(xué)習(xí)積極性不高,成績(jī)不好,因此引入數(shù)據(jù)挖掘技術(shù)找出影響學(xué)生學(xué)習(xí)積極性和學(xué)習(xí)成績(jī)的原因,制定措施,提高教育和教學(xué)質(zhì)量。分析的數(shù)據(jù)源是考試成績(jī)和成績(jī)之外的影響因素,分析的方法是采用關(guān)聯(lián)規(guī)則、模型庫(kù)、去“噪”處理、粗糙集等進(jìn)行數(shù)據(jù)挖掘,得出的結(jié)論是:傳統(tǒng)的學(xué)習(xí)方法不能完全滿(mǎn)足需要,改進(jìn)教學(xué)方法和教學(xué)模式,從而調(diào)動(dòng)學(xué)生學(xué)習(xí)的積極性,提高教學(xué)質(zhì)量。

      3 關(guān)系數(shù)據(jù)庫(kù)、數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘的融合

      日常事務(wù)處理需要關(guān)系數(shù)據(jù)庫(kù),構(gòu)建分析處理環(huán)境需要數(shù)據(jù)倉(cāng)庫(kù),幫助決策者尋找數(shù)據(jù)之間的潛在的關(guān)聯(lián)需要數(shù)據(jù)挖掘。他們之間是相互聯(lián)系又有區(qū)別的,不能互相取代的,又需要相互融合。數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)并不是最新的,專(zhuān)有的,而是來(lái)源于其他關(guān)系數(shù)據(jù)庫(kù),它是建立在一個(gè)更全面和完善的信息應(yīng)用的基礎(chǔ)上,用于支持高層決策分析的數(shù)據(jù)基地。數(shù)據(jù)倉(cāng)庫(kù)是數(shù)據(jù)庫(kù)新技術(shù),到目前為止,數(shù)據(jù)倉(cāng)庫(kù)仍用關(guān)系數(shù)據(jù)庫(kù)管理系統(tǒng)管理數(shù)據(jù)。數(shù)據(jù)挖掘是從大量存儲(chǔ)在數(shù)據(jù)庫(kù)、數(shù)據(jù)倉(cāng)庫(kù)或其他信息庫(kù)中發(fā)現(xiàn)有趣知識(shí)的過(guò)程。只有這三個(gè)數(shù)據(jù)庫(kù)技術(shù)互相融合,取長(zhǎng)補(bǔ)短,各盡其責(zé),才能更好的為廣大用戶(hù)所使用,為社會(huì)各個(gè)領(lǐng)域所應(yīng)用。

      [1]華冠萍.數(shù)據(jù)倉(cāng)庫(kù)、數(shù)據(jù)挖掘及OLAP之兩兩關(guān)系[J].福建電腦,2007,8.

      [2]牛承珍.馬季蘭.淺談數(shù)據(jù)挖掘應(yīng)用[J].山西科,2008.5.20.

      [3]李軍紅,胡或.淺析數(shù)據(jù)倉(cāng)庫(kù)、聯(lián)機(jī)分析處理和數(shù)據(jù)挖掘[J].科技信息,2007.

      馬麗君(1962—),女,白城師范學(xué)院計(jì)算機(jī)科學(xué)學(xué)院,副教授,研究方向?yàn)閿?shù)據(jù)庫(kù)及應(yīng)用。

      曹明明]

      猜你喜歡
      決策分析關(guān)系數(shù)據(jù)庫(kù)數(shù)據(jù)倉(cāng)庫(kù)
      關(guān)系數(shù)據(jù)庫(kù)在高爐數(shù)據(jù)采集系統(tǒng)中的應(yīng)用
      山東冶金(2022年2期)2022-08-08 01:51:30
      基于大數(shù)據(jù)應(yīng)用的智能公交決策分析平臺(tái)
      基于數(shù)據(jù)倉(cāng)庫(kù)的住房城鄉(xiāng)建設(shè)信息系統(tǒng)整合研究
      當(dāng)前軍事決策分析關(guān)注的幾個(gè)問(wèn)題
      分布式存儲(chǔ)系統(tǒng)在液晶面板制造數(shù)據(jù)倉(cāng)庫(kù)中的設(shè)計(jì)
      電子制作(2016年15期)2017-01-15 13:39:15
      探析電力系統(tǒng)調(diào)度中數(shù)據(jù)倉(cāng)庫(kù)技術(shù)的應(yīng)用
      基于數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)分析探索與實(shí)踐
      基于索引結(jié)構(gòu)的關(guān)系數(shù)據(jù)庫(kù)關(guān)鍵詞檢索
      基于GIS的城市交通流模擬與決策分析
      河南科技(2014年19期)2014-02-27 14:15:46
      一種基于數(shù)據(jù)圖劃分的關(guān)系數(shù)據(jù)庫(kù)關(guān)鍵詞檢索方法
      河源市| 永定县| 新干县| 黔南| 英山县| 萨嘎县| 舞钢市| 伊吾县| 武强县| 平邑县| 合山市| 远安县| 册亨县| 合阳县| 黔江区| 桂阳县| 三门峡市| 禹城市| 崇明县| 峨边| 定结县| 合川市| 三门县| 洛南县| 琼海市| 蓬莱市| 峨山| 新田县| 长乐市| 隆林| 成武县| 凤山市| 革吉县| 海淀区| 永修县| 铜陵市| 天柱县| 永年县| 东乡| 拜泉县| 普安县|