• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      一種混合模糊聚類算法

      2018-08-08 13:53:12袁桂蓉
      商情 2018年35期
      關鍵詞:模糊

      袁桂蓉

      【摘要】將傳遞閉包方法與FCM方法結合,提出一種混合模糊聚類算法,使其不需要預先設定聚類數(shù)目,并且能夠降低它對初始化的敏感程度,收斂速度更快,且不用人為給定聚類類別數(shù),不容易受初始化的影響。

      【關鍵詞】傳遞閉包 -統(tǒng)計量 模糊-均值聚類

      聚類是按照一定的要求和規(guī)律對事物進行分類的過程,它根據(jù)研究對象的某些特性,運用數(shù)學方法對給定對象進行區(qū)分和分類。自Zadeh提出模糊集理論以來,人們開始用模糊的方法來處理聚類問題,并稱之為模糊聚類分析。

      現(xiàn)有的模糊聚類算法都是以某種準則來評價一個己給定劃分的特性的,通常在參數(shù)輸入、停機條件上存在諸多人為控制因素,這導致了用戶在使用聚類方法時需要大量的數(shù)據(jù)分析領域知識。另外,有些聚類算法只能對某種分布數(shù)據(jù)聚類效果較好,對其它分布的數(shù)據(jù)聚類效果則很差。許多聚類算法是根據(jù)歐氏距離和Manhattan距離來進行聚類的,基于這類距離的聚類方法一般只能發(fā)現(xiàn)具有類似大小和密度的圓形或球狀聚類。比如現(xiàn)在比較流行的-Means和模糊-Means聚類算法,既需要提供參數(shù)—聚類數(shù)目,而且對非球狀或橢球型分布的數(shù)據(jù)集聚類效果不理想。因而需要設計一種好的聚類算法來提高算法的自主性和適應性,減少用戶的參與。

      一、傳遞閉包法聚類

      (1)建立模糊相似矩陣。設X= {x1,x2,…,xn}為被分類對象的全體,設每一對象xi由一組特征數(shù)據(jù)(xi1,xi2,…,xim)來表征,于是可以得到原始數(shù)據(jù)矩陣Xnxm=[xij]。

      為了使不同量綱的數(shù)據(jù)也能進行比較,常常需要將原始數(shù)據(jù)矩陣進行極差化或標準化。這里先將原始數(shù)據(jù)矩陣統(tǒng)一趨勢化,得到無量綱矩陣X'nxm=(x"ij),其中x.ij=|xij-ui0|/iqr(xij)

      iqr(xij)表示四分位極差。

      按照普通的聚類方法中相似系數(shù)確定方法,建立模糊相似矩陣與,xi與xj的相似程度rij可根據(jù)實際情況采用相似系數(shù)法、距離法以及其它方法。

      (2)由相似矩陣求等價矩陣。因為模糊等價矩陣能對論域進行等價的劃分,這就能滿足聚類分析的需要。然而,通常情況下,由標定過程構造出的模糊關系僅僅能滿足自反性和對稱性,而不滿足傳遞性,所以生成的只是一個模糊相似矩陣R。為了進行分類,需要根據(jù)標定所得模糊矩陣R,求出其傳遞閉包t(R)。R=t(R)為模糊等價矩陣。

      (3)進行聚類。將λ從1依次取到0,依次截得等價關系Rλ,并按Rλ將X分成等價類。

      二、利用FCM算法得到最終分類

      (1)確定FCM的聚類類別數(shù)c。將人從1依次取到0,形成一種動態(tài)聚類,便于全面了解樣本聚類,然后根據(jù)實際需要選擇某閾值λ,確定樣本一種分類。如何合理選擇閾值λ,筆者用F-統(tǒng)計量選擇λ最佳值。F值越大,分類越合理,將這時的分類數(shù)目作為FCM的聚類類別數(shù)c。

      (2) FCM算法。Step1:將F-統(tǒng)計值最大的閾值λ對應的分類數(shù)目r作為聚類類別數(shù)c,2≤c≤n,n是數(shù)據(jù)個數(shù),給定加權指數(shù)m,設定迭代停止閾值ε,初始化聚類中心V(0),設置迭代計數(shù)器b=0;

      Step2:根據(jù)(式1.1)計算或更新劃分矩陣U(b)=[μik];

      其中,dik為無量綱矩陣中X.第k個序列到第i類中心vi的歐氏距離。

      Step3:根據(jù)(式1.2)更新聚類中心V(b+1):

      Step4:如果‖V(b)-V(b+1)‖≤ε,則算法停止并輸出劃分矩陣U和聚類中心V;否則令b=b+1,轉向執(zhí)行Step2。

      若μjk=max{μjk},則xk∈第j類。

      同樣,該算法也具有另一種形式,即從初始化模糊劃分矩陣開始,先用(式1.2)計算聚類中心矩陣,然后用(式1.1)更新模糊分類矩陣,直到滿足停止準則為止。

      對比可知,這種混合模糊聚類法比傳統(tǒng)FCM方法更切合實際,收斂速度更快,且不用人為給定聚類類別數(shù),不容易受初始化的影響。

      三、結論

      本文針對經(jīng)典的模糊C均值聚類算法需要事先確定聚類類數(shù),設定初始聚類中心的缺點,提出改進的FCM算法,即一種混合模糊聚類算法。先利用傳遞閉包法得到一系列分類,再引入F-統(tǒng)計量,根據(jù)F-統(tǒng)計值的大小確定一種分類,以最大的F-統(tǒng)計值對應的一種分類的類數(shù)作為FCM聚類的類別數(shù)C,以這種分類的聚類中心作為FCM算法的初始聚類中心。此方法能夠反映出原始數(shù)據(jù)的真實特性,真正達到聚類分析的無監(jiān)督性;同時也降低了由于人為因素造成的不確定性影響,增強了聚類結果的準確性和可信度。

      參考文獻:

      [1]高新波.模翊聚類分析及其英語[M].西安:西安電子科技大學出版社,2004.

      [2]王洪春,彭宏.一種基于嫡的聚類算法[J].計算機科學,2007.

      [3]路金芳,孫雙全,楊建燕,伍化巖.統(tǒng)計學原理[M].河南:黃河水利出版社,2006.

      [4]HALKIDI M,VAZIRGIANNIS M.A data set oriented approachfor clustering algorithm selection[C]//Proc of the 5th EuropeanConference on Principles of Data Mining and Knowledge Discov-ery.London:Springer Verlag,2001.

      猜你喜歡
      模糊
      資產(chǎn)與費用關系辨析
      財會學習(2017年4期)2017-03-15 17:48:28
      基于模糊綜合評判的網(wǎng)絡受損狀態(tài)評估的設計與實現(xiàn)
      從心理邊界剖析曾奇峰的《中國家庭的十種界限不清》
      青年時代(2016年19期)2016-12-30 17:21:28
      葛浩文的“模糊” 翻譯
      考試周刊(2016年83期)2016-10-31 12:31:09
      西方文學作品中的模糊翻譯策略
      青年文學家(2015年5期)2016-05-09 13:35:42
      淺析人工神經(jīng)網(wǎng)絡在汽車輪軸松曠間隙檢測中的應用
      基于智力資本的高??冃гu價模型研究
      會計之友(2015年14期)2015-07-08 15:47:40
      淺析針線活在《紅字》中的意義
      電影文學(2014年24期)2015-01-07 20:34:06
      P—模糊—PI滑模控制系統(tǒng)設計
      基于模糊聚類分析的草莓圖像分割方法研究
      宁阳县| 铁岭县| 南陵县| 琼海市| 富锦市| 东乌珠穆沁旗| 英德市| 成武县| 齐河县| 沈丘县| 兴隆县| 永登县| 进贤县| 兰考县| 义马市| 喀喇沁旗| 呼伦贝尔市| 淮安市| 东丽区| 盘锦市| 宜良县| 抚宁县| 宜兴市| 太原市| 电白县| 尼玛县| 东港市| 来安县| 芷江| 维西| 石景山区| 奇台县| 定安县| 双桥区| 华容县| 贵定县| 金平| 内丘县| 金沙县| 措美县| 同心县|