• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      “層次分析法構(gòu)建挖掘模型”的基本內(nèi)涵及應(yīng)用效能研究

      2014-08-15 00:53:29王瑾
      陜西教育·高教版 2014年3期
      關(guān)鍵詞:類別分析法數(shù)據(jù)挖掘

      王瑾

      一般來說,在系統(tǒng)的“層次分析法構(gòu)建挖掘模型”體系結(jié)構(gòu)之中,主要包括數(shù)據(jù)挖掘處理模式、知識(shí)數(shù)據(jù)庫、數(shù)據(jù)挖掘處理方法、數(shù)據(jù)模型學(xué)習(xí)與數(shù)據(jù)模型評(píng)估等幾個(gè)方面的重要內(nèi)容。該系統(tǒng)從整個(gè)戰(zhàn)略的高度、不同層面的技術(shù)水平以及差異化的抽象層面來支撐不同挖掘組件之間的設(shè)置與組合,隨后再重新設(shè)計(jì)、實(shí)施整個(gè)數(shù)據(jù)挖掘過程,最終形成一個(gè)合理的“數(shù)據(jù)挖掘模型結(jié)構(gòu)”。

      具體來說,“層次分析法構(gòu)建挖掘模型”從不同的角度和層次上對(duì)整個(gè)數(shù)據(jù)挖掘的過程進(jìn)行結(jié)構(gòu)化、系統(tǒng)化的處理和改進(jìn)。在層次分析法構(gòu)建挖掘模型流程開始的時(shí)候,為了提升整個(gè)模型的準(zhǔn)確性與高效性,知識(shí)數(shù)據(jù)庫會(huì)與各種挖掘模型方法通過交互或者是互動(dòng)的方式實(shí)施系統(tǒng)模型的自我學(xué)習(xí)。隨后,每一個(gè)模型也會(huì)與知識(shí)數(shù)據(jù)庫的構(gòu)成部分之一Analytical Base通過交互的方式對(duì)現(xiàn)存的模型系統(tǒng)進(jìn)行打分和評(píng)估。在完成了具體的評(píng)估與打分工作之后,它便會(huì)進(jìn)入到挖掘模式環(huán)節(jié),然后對(duì)比分析每一個(gè)“挖掘模型方法”,對(duì)其進(jìn)行聚類、分類、回歸等相關(guān)的處理活動(dòng),最后會(huì)在挖掘模式層之中按照從優(yōu)至劣的順序?qū)⒏鞣N模型進(jìn)行排列,并通過數(shù)據(jù)表格的方式表示出來。一般來說,“優(yōu)秀”的挖掘模型處于結(jié)構(gòu)的最頂端,隨后的是“成功”的挖掘模型。這些以數(shù)據(jù)表格呈現(xiàn)出來的排列結(jié)果會(huì)傳輸給執(zhí)行引擎進(jìn)行相關(guān)的處理,也即是對(duì)“優(yōu)秀”挖掘模型進(jìn)行數(shù)據(jù)的挖掘與預(yù)測(cè)活動(dòng)。在充分使用“Analytical Base”與“Knowledge Engine”的時(shí)候,執(zhí)行條件不同,挖掘模型評(píng)估結(jié)果的質(zhì)量水平也會(huì)呈現(xiàn)出比較大的差異,但是其模式分支可以自由地進(jìn)行插播,因此,不僅大大提升了工作效率,而且準(zhǔn)確性也會(huì)隨之有明顯的提高。這是層次分析法構(gòu)建挖掘模型的優(yōu)良之處。

      “層次分析法構(gòu)建挖掘模型”的數(shù)據(jù)挖掘與處理的流程可以概括為:首先是建立相應(yīng)的層次結(jié)構(gòu);其次是與知識(shí)數(shù)據(jù)庫進(jìn)行相關(guān)的交互活動(dòng);第三是對(duì)既定模型系統(tǒng)的分析和學(xué)習(xí);第四是選擇和評(píng)估合適的模型樣式。在整體的層次結(jié)構(gòu)設(shè)計(jì)過程中,通過先分解、后綜合的思想達(dá)到對(duì)“層次分析法構(gòu)建挖掘模型”系統(tǒng)分析的目的。

      模型學(xué)習(xí)、模型評(píng)估以及模型學(xué)習(xí)與評(píng)估的影響關(guān)系是“層次分析法構(gòu)建挖掘模型”中的三個(gè)重要概念。第一,模型學(xué)習(xí)主要是在M-KPI環(huán)節(jié)實(shí)現(xiàn)的。其核心目的在于通過使用新的數(shù)據(jù)來更新原有模型,從而形成一個(gè)嶄新的模型樣式。模型之間的不同之處就在于新的數(shù)據(jù)建構(gòu)起新的模型,計(jì)算的設(shè)置、類型以及模型的范式都是一樣的。第二,模型評(píng)估是在M-KPI和M-CSF兩個(gè)層面發(fā)生的。輸入“樣品數(shù)據(jù)”,隨后進(jìn)行相關(guān)的評(píng)估和打分活動(dòng),得到相應(yīng)的預(yù)測(cè)結(jié)果之后,通過實(shí)際結(jié)果來評(píng)估模型,并且給其賦予相關(guān)的“權(quán)值”。從而使所有M-KPI都能夠得到相應(yīng)的“權(quán)值”,以此來篩選評(píng)估模型和計(jì)算方法。第三,在模型學(xué)習(xí)與評(píng)估的影響關(guān)系方面,首先是各個(gè)M-KPI刷新模型,由此產(chǎn)生適合于新數(shù)據(jù)內(nèi)容的模型;其次通過“Analytics Data”來評(píng)估各個(gè)模型,因此,輸入迥異的需求數(shù)據(jù),也能夠產(chǎn)生不同的線性結(jié)構(gòu)圖。通過綜合分析各個(gè)KPI的影響,各個(gè)M-CSF也就形成了特定的自適應(yīng)影響的波動(dòng)效果圖。

      層次分析法構(gòu)建挖掘模型中包括諸多的成功關(guān)鍵因素,其中,分類-CSF作為層次分析法構(gòu)建挖掘模型中一個(gè)非常重要的成功關(guān)鍵因素,其目的是學(xué)會(huì)一個(gè)分類模型或者是分類函數(shù),從而把復(fù)雜數(shù)據(jù)庫中的數(shù)據(jù)項(xiàng)映射到特定類別中的某一個(gè)模型之上,由此實(shí)現(xiàn)數(shù)據(jù)信息的聚合、分類與預(yù)測(cè)活動(dòng)。從系統(tǒng)內(nèi)容的角度來說,分類-CSF中包含決策樹算法、Bayes算法等諸多計(jì)算方式。比如Bayes分類算法假設(shè)是在特定的數(shù)據(jù)樣本中通過一個(gè)n維特征的向量來描述n個(gè)屬性特征的值。也即是說,X={x1,x2,x3,……,xm},如果擁有 m個(gè)類別,就可以使用 C1,C2,C3,……,Cm來進(jìn)行表示。預(yù)存一個(gè)未知的數(shù)據(jù)樣本X,也即是沒有類標(biāo)號(hào),如果將其分配給類Ci,也就一定會(huì)存在P(Ci/X)>P(Cj/X),1≤i≤m,1≤j≤m,j≠i。

      根據(jù)此原理,對(duì)于所有類P(X)都為常數(shù),因此P(Ci/X)作為最大化后驗(yàn)概率能夠轉(zhuǎn)換成為P(X/Ci)P(Ci),即最大化先驗(yàn)概率。假設(shè)諸多屬性和元組存在于訓(xùn)練數(shù)據(jù)集之中,核算P(X/Ci)開銷的概率就非常高。因此,大部分情況下假設(shè)各個(gè)屬性的取值都是相互獨(dú)立的。在此情況下,就能夠從訓(xùn)練數(shù)據(jù)庫中獲得先驗(yàn)概率 P(X1/Ci),P(X2/Ci),P(X3/Ci),……P(Xn/Ci)。依據(jù)此種計(jì)算方式,針對(duì)特定的未知樣本X,可以先計(jì)算出X樣本屬于每一個(gè)類別Ci的概率,隨后以概率最大的類別作為該未知樣本的類別。

      為了識(shí)別該模型數(shù)據(jù)預(yù)測(cè)結(jié)果的準(zhǔn)確性,筆者以某醫(yī)院的醫(yī)療數(shù)據(jù)作為數(shù)據(jù)庫樣本來進(jìn)行數(shù)據(jù)挖掘的驗(yàn)證。首先通過DRUG I N系統(tǒng)來建立和學(xué)習(xí)該模型系統(tǒng),隨后采用DRUG4N的真實(shí)數(shù)據(jù)來評(píng)估ACMC建立的諸多模型樣式,最終通過該系統(tǒng)得到Bayes分類算法所構(gòu)建的系統(tǒng)模型作為取得的最優(yōu)模型樣式。在此基礎(chǔ)上,筆者使用該模型來決定特定患者該使用什么樣類型的藥品。

      [1]韓家煒,孟小峰.W eb挖掘研究[J].計(jì)算機(jī)研究與發(fā)展,2011,(4):92-95.

      [2]琚春華,郭飛鵬.基于支持向量機(jī)的分布數(shù)據(jù)挖掘模型DSVM[J].系統(tǒng)工程理論與實(shí)踐,2010,(10):29-32.

      [3]胡文瑜,孫志輝.數(shù)據(jù)挖掘取樣方法研究[J].計(jì)算機(jī)研究與發(fā)展,2011,(1):43-46.

      猜你喜歡
      類別分析法數(shù)據(jù)挖掘
      異步機(jī)傳統(tǒng)分析法之困難及其克服
      探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢(shì)
      基于時(shí)間重疊分析法的同車倒卡逃費(fèi)探析
      基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
      電力與能源(2017年6期)2017-05-14 06:19:37
      層次分析法在SWOT分析法中的應(yīng)用
      服務(wù)類別
      一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
      AHP和SWOT分析法在規(guī)劃編制中的應(yīng)用
      論類別股東會(huì)
      商事法論集(2014年1期)2014-06-27 01:20:42
      中醫(yī)類別全科醫(yī)師培養(yǎng)模式的探討
      邹平县| 封开县| 巫山县| 防城港市| 安乡县| 文登市| 泰来县| 青河县| 亚东县| 莒南县| 赤城县| 宿州市| 石家庄市| 阜康市| 雷山县| 扎赉特旗| 文昌市| 确山县| 祁连县| 烟台市| 大姚县| 凌源市| 隆昌县| 大厂| 克山县| 屏东县| 静安区| 安陆市| 屏山县| 武清区| 嫩江县| 连州市| 三都| 东乡县| 巴青县| 玉田县| 依兰县| 常熟市| 三门县| 永春县| 寿宁县|