• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      近鄰傳播聚類算法研究

      2020-01-01 03:56:15李林陽李高明
      數字通信世界 2020年10期
      關鍵詞:歐氏高維偏向

      李林陽,李高明,劉 祥,李 笑

      (1.武警工程大學基礎部,陜西 西安 710086;2.武警工程大學信息學院,陜西 西安 710086)

      AP算法是基于距離的聚類算法,Frey等于2007年在《Science》上發(fā)表了一篇論文,首次提出了近鄰傳播聚類算法。該算法具有很多優(yōu)點,比如聚類速度快、精確度高等,同時也存在一些問題。

      1 AP算法存在的問題

      (1)偏向參數的選擇問題。偏向參數往往需要人工設置,然而事實上這種設置未必能找到最合理的聚類結果。因此考慮p值的自適應,避免人工設置的麻煩和因此導致的聚類結果的不合理,從而使算法更加便捷和準確,提升聚類性能。人工設置比較繁瑣,若采用合適的策略,自適應調整阻尼因子,則可以加快算法收斂速度。

      (2)相似度函數的選擇問題。不同結構的數據其相似度函數的選擇也不同,如對于球形數據,選擇歐氏距離可以取得好的效果,但對于結構復雜的非球狀簇,選擇基于密度的相似度計算方法的效果會比較理想;對于多重尺度的數據,存在奇異數據的數據集,以及高維數據,歐氏距離不能準確刻畫數據之間的距離。

      (3)相似度函數的選擇問題。不同結構的數據其相似度函數的選擇也不同,對于多重尺度的數據,奇異數據,以及高維數據,歐氏距離不能準確反映數據之間的距離,且相似度矩陣會以根據維數的增加而呈幾何倍數增長。

      (4)其他問題。其他問題包括該算法的集成研究較少的問題,半監(jiān)督的問題,對于大規(guī)模數據集,該算法的時間復雜度高的問題等。

      2 AP算法發(fā)展現狀

      近鄰傳播聚類算法(Affinity Propagation Clustering Algorithm,AP)于2007年由Frey等 在《Science》雜志上第一次提出。作為一種有效的聚類算法,AP算法此后得到了較大發(fā)展。2008年,肖宇等 將半監(jiān)督思想與近鄰傳播聚類算法結合在一起,詳細介紹了近鄰傳播算法,根據成對約束先驗信息提出了基于約束的半監(jiān)督近鄰傳播聚類算法,該研究成果得到了廣泛的認可,該文獻一度被數百篇論文引用,證實了半監(jiān)督AP算法的科學性和可行性。然而,該算法在聚類過程中存在相似度適用范圍不夠廣泛、偏向參數和阻尼因子(也叫阻尼系數或者迭代因子)需要人工篩選、處理大規(guī)模復雜數據集時算法復雜度高、不適用于高維數據和多尺度數據等問題,針對以上問題,專家學者進行了一系列改進。

      2.1 AP算法負歐氏距離的問題研究

      董俊等 提出了可變相似性度量的方法,其基本思想是根據數據在觀測空間中的流形分布規(guī)律,對不同分布的數據采取不同的處理策略;對于全局數據,采取函數變換策略對不同流形分布的數據對進行相似度的縮放,而對于局部數據,則采取映射的策略,搜索識別數據的不同流形分布并將其映射成超球形或超橢球形,再使用AP算法進行處理,從而提出了基于可變相似性度量的AP算法(AP-VSM),取得了良好的聚類效果。周世兵等 構造了樣本聚類距離和樣本離差聚類距離。邢艷等根據K-最近鄰的內含提出了互近鄰的概念,繼而提出了互近鄰一致性的定義并將其作為相似度度量的調整依據,最后提出了基于互近鄰一致性的AP算法。同樣采用最近鄰概念和最近鄰的傳遞性的還有蘇亞然等 ,他們提出了近鄰傳播的快速掃描算法,優(yōu)化搜索過程并嘗試簡化最近鄰居的判定過程和計算過程,從而實現了更加快速的聚類。廖予良 通過分析路徑相似度,提出了基于最短路徑的聚類方法,用最短路徑取代傳統的歐氏距離,實現了對不同形狀數據集的有效聚類。胡晨曉等 借助稀疏表示來作為樣本數據的相似度度量,提出了基于稀疏表示的AP算法。張利 基于模糊函數提出了將距離貼近度引入相似度函數的算法,很好解決了奇異樣本數據的量綱和過大過小值干擾問題,得到了良好的聚類結果。姬強 通過構造一個采用核低秩表示的優(yōu)化問題,挖掘數據的低維度流形結構,從而構造出結構相似度,作為歐氏距離的替代相似度度量,一定程度上解決了復雜結構數據的內部結構不易識別和挖掘的問題。唐丹 采用改進的馬氏距離來替代歐氏距離。趙昱 通過求解鄰域半徑得出鄰域密度并最終計算出鄰域相似度,作為近鄰傳播聚類算法的新的相似度度量,不僅提高了算法對復雜數據集的適應能力,也提高了算法的自適應特性。房驍 提出了量子近鄰傳播聚類算法,為解決高維數據的聚類問題,引進高斯核函數來構造相似度函數。

      2.2 偏向參數的選擇問題和阻尼因子的使用問題研究

      有關學者也提出了一些解決方案。張利 針對偏向參數需要人工選擇的問題,提出了基于布谷鳥優(yōu)化算法的自適應尋找最優(yōu)偏向參數的方法,提出了CS-SAP算法。周治平等 利用Silhouette聚類有效性指標來確定偏向參數。姬強 針對偏向參數難以調節(jié)的問題,提出了基于煙花爆炸智能優(yōu)化算法的最佳偏向參數選擇算法。覃華等 提出采用概率無向圖模型來解決偏向參數的自適應問題。趙昱 采用聚類有效性指標和下降步幅相結合的方法,實現了偏向參數的自適應,提出了PGZC-AP算法,提高了算法的運行效率。房驍 采用量子智能優(yōu)化算法對偏向參數進行優(yōu)化,參數初始化階段采用量子編碼方法,參數的更新階段使用旋轉量子門,最后獲得近優(yōu)參數,將其代入算法運行過程,從而解決了偏向參數的篩選問題,提高了聚類精度,減少了迭代次數。鄭凱月 采用布谷鳥優(yōu)化算法對偏向參數和迭代因子同時進行優(yōu)化,提高了算法的自適應性;還采用人工蜂群智能優(yōu)化算法對偏向參數進行了自適應計算的優(yōu)化。

      2.3 近鄰傳播聚類算法的聚類有效性指標研究

      周世兵等 采用近鄰傳播聚類算法作為聚類的研究對象,比較了6中聚類有效性指標,并改進了IGP指標作為最佳聚類數確定的方法。周世兵等 提出了BWP聚類有效性指標。

      2.4 高維數據的聚類問題復雜的大數據集具有高復雜度的問題研究

      多種不同類型的并行近鄰傳播聚類算法、一些與層級聚類相結合的近鄰傳播聚類算法以及多階段近鄰傳播聚類算法等被相關專家學者分別提出。劉曉楠等 提出了專門針對大規(guī)模數據集的分層聚類方案,文章將原始數據集劃分為多個較小的獨立子集,對各個子集進行算法執(zhí)行,得到每個子集的聚類中心,而后將得到的聚類中心集合再次進行算法執(zhí)行,得到全部數據集的類代表點,最后用得到的全局類代表點實現原始數據集的劃分,從而解決了大數據集聚類效率的優(yōu)化問題。錢雪忠等 根據先驗約束實現高維數據投影矩陣的獲取,在低維空間中進行聚類,從而實現了高維空間數據的近鄰傳播聚類。其中,高維數據投影到低維數據時,要求原來的數據集結構不能改變。周治平等 同樣提出了基于局部投影方法實現對復雜結構數據和高維數據的聚類,減少了信息冗余,保持了數據內部的結構。張利 使用熵權法和主成分分析法對高維數據進行降維,而后在低維空間中進行聚類。

      3 結束語

      AP算法還有較大的改進空間。可以與半監(jiān)督方法結合。AP算法針對相似度的改進可以考慮與密度聚類的研究成果相結合,提高算法對于復雜結構數據的適應度,采用基于密度的近鄰傳播聚類算法。對于高維數據的處理還需要進一步加強。對AP算法聚類集成的研究比較少,可以進一步加強。

      猜你喜歡
      歐氏高維偏向
      8~12歲兒童抑郁與認知重評的關系:悲傷面孔注意偏向的中介作用*
      心理學報(2022年1期)2022-01-21 02:50:24
      “偏向”不是好導向
      當代陜西(2020年23期)2021-01-07 09:25:24
      考核偏向:錯把經過當結果
      當代陜西(2019年12期)2019-07-12 09:12:02
      一種改進的GP-CLIQUE自適應高維子空間聚類算法
      測控技術(2018年4期)2018-11-25 09:46:48
      基于加權自學習散列的高維數據最近鄰查詢算法
      電信科學(2017年6期)2017-07-01 15:44:37
      一般非齊次非線性擴散方程的等價變換和高維不變子空間
      國內研發(fā)、對外開放與偏向性技術進步:以我國工業(yè)行業(yè)為例
      高維Kramers系統離出點的分布問題
      基于多維歐氏空間相似度的激光點云分割方法
      麗江“思奔記”(上)
      探索地理(2013年5期)2014-01-09 06:40:44
      仁寿县| 绥中县| 晋城| 吉水县| 陆丰市| 盐边县| 黄陵县| 高碑店市| 吉林市| 嵊泗县| 舞阳县| 上思县| 陕西省| 扎囊县| 盈江县| 施秉县| 武隆县| 仁化县| 南城县| 舞阳县| 永清县| 共和县| 夹江县| 修武县| 新巴尔虎左旗| 阿拉善盟| 苗栗县| 沅陵县| 莱阳市| 太仆寺旗| 应城市| 临城县| 囊谦县| 原阳县| 行唐县| 达州市| 赞皇县| 岚皋县| 新巴尔虎左旗| 郧西县| 福泉市|