摘? 要:為解決傳統(tǒng)FCM算法存在對初始值過度依賴問題,提出一種基于多策略改進花朵授粉算法優(yōu)化的FCM算法,基于多策略改進FPA算法在初始化階段及搜索階段分別引入混沌映射、慣性權(quán)重因子和黃金正弦算法,使其尋優(yōu)能力及速度均得到提高;最后,通過多策略改進FPA算法得到的最優(yōu)解作為FCM算法的初始聚類中心進行聚類分析,從而解決傳統(tǒng)FCM算法對初始中心敏感及陷入局部最優(yōu)等問題。
關(guān)鍵詞:多策略;混沌映射;FPA;FCM
中圖分類號:TP183; 文獻標識碼:A? 文章編號:2096-4706(2023)09-0014-04
Abstract: In order to solve the problem that the traditional FCM algorithm is excessively dependent on the initial value, an improved multi-strategy Flower Pollination Algorithm (FPA) is proposed to optimize the FCM algorithm. Based on the multi-strategy improvement of FPA algorithm, chaos mapping, inertia weighting factor and golden sine algorithm are added in the initialization phase and the search phase respectively, which improves the optimization searching ability and the speed. Finally, the FCM algorithm is used as the initial cluster center to cluster and analyze the optimal solution obtained by the multi-strategy FPA algorithm, thus solving the problems of the traditional FCM algorithm sensitive to the initial center and falling into the local optimum.
Keywords: multi-strategy; chaos mapping; FPA; FCM
0? 引? 言
FCM算法在數(shù)據(jù)挖掘領(lǐng)域里已然成為當前的研究熱點,并被廣泛地應(yīng)用于信息檢索、人工智能、圖像處理等領(lǐng)域。但是也存在對算法的初始值過度依賴、模糊指數(shù)m和聚類數(shù)目k需人為設(shè)定等問題。目前國內(nèi)外許多研究人員對該算法進行了優(yōu)化改進:ZHAO等利用不動點定理和Banach壓縮映射原理,提出了一種適用于使用閔可夫斯基度量作為相似性度量的模糊聚類算法,拓寬了傳統(tǒng)模糊聚類算法的應(yīng)用范圍,同時也在算法的全局搜索能力和收斂速度上有了明顯提升[1]。PANTULA等為提高聚類效率,將人工神經(jīng)網(wǎng)絡(luò)引入模糊聚類之中,提出了神經(jīng)模糊C均值聚類算法[2]。呂冰垚等將粒子群算法與遺傳算法結(jié)合進行全局搜索優(yōu)化模糊聚類算法的聚類中心[3]。董發(fā)志等針對模糊聚類算法的缺陷,將遺傳算法優(yōu)化用于優(yōu)化初始聚類中心,從而達到優(yōu)化聚類的目的[4]。KUMAR等在工蜂群算法的幫助下使模糊聚類算法跳出了局部最優(yōu),利用常見的UCI數(shù)據(jù)集對改進后算法的性能進行了驗證[5]。
花朵授粉算法(FPA)作為智能優(yōu)化算法,具有尋優(yōu)能力強、適用性強等特點[6]。但該算法存在尋優(yōu)精度低、易陷入局部最優(yōu)等問題,因此許多學(xué)者對該算法進行改進:陶志勇等提出了一種在全局階段利用正態(tài)分布縮放因子和局部階段引入變異策略優(yōu)化FPA算法[7]。陸克中等提出了一種自適應(yīng)變異的量子花授粉算法進行優(yōu)化改善[8]。賀智明等提出了一種基于動態(tài)全局搜索指導(dǎo)尋優(yōu)方向利用和柯西變異增加種群多樣性并幫助算法跳出局部最優(yōu)等問題[9]。
基于以上算法的優(yōu)缺點,本文使用改進的花朵授粉優(yōu)化模糊聚類算法(WGF-FCM)。該算法首先在初始化種群時,引入混沌映射來優(yōu)化種群的初始位置,使得算法提高全局的搜索種群解的概率,確保種群多樣性;其次使用慣性權(quán)重因子和黃金比例系數(shù)改善收斂精度以及尋優(yōu)的能力,然后使用改進的花朵授粉算法優(yōu)化模糊聚類算法,解決模糊聚類算法存在的問題,以此達到更好的聚類效果。
1? 花朵授粉算法
花朵授粉算法通過模擬自然界花朵授粉的過程進行建模,實現(xiàn)花朵授粉算法主要有兩個階段:
基于以上三點對傳統(tǒng)的FPA算法進行優(yōu)化提出了一種基于改進的花朵授粉優(yōu)化的模糊聚類算法。該算法的基本思想是:首先,在FPA初始化階段引入混沌映射序列進行花粉初始最優(yōu)化解的位置;其次,再通過在全局授粉階段和局部授粉階段分引入權(quán)重系數(shù)和黃金比例系數(shù)對進行迭代尋優(yōu)輸出最優(yōu)解,將得到的最優(yōu)解更新FCM算法的聚中心及隸屬度矩陣,得到新的聚類中心點,直至滿足算法終止條件,輸出聚類結(jié)果。如圖2所示。
WGFFCM算法實現(xiàn)步驟如下:
Step1:混沌映射初始化種群并產(chǎn)生初始花粉種群S;
Step2:根據(jù)式(11)和式(12)得到隸屬度矩陣聚類中心和當前的初始聚類中心;
Step3:計算每個花粉的適應(yīng)度值進行計算,找到當前的最優(yōu)解;
Step 4:當轉(zhuǎn)換概率rand<p條件時,在全局授粉階段引入慣性權(quán)重因子優(yōu)化花粉位置,對解進行越界處理;
Step5:當轉(zhuǎn)換概率rand>p條件時,在局部授粉階段引入黃金正弦算法進優(yōu)化花粉位置,對解進行越界處理;
Step 6:根據(jù)步驟4或者步驟5得到更新之后的解和歷史全局最優(yōu)解進行比較,更新或保留歷史全局最優(yōu)解;
Step7:判斷是否達到WGFFCM算法的終止條件,如果不滿足則執(zhí)行步驟4繼續(xù)迭代,否則輸出最優(yōu)解;
Step 8:對WGFFCM算法的隸屬度矩陣及聚類中心進行更新;
Step9:是否達到WGFFCM算法的迭代條件,若滿足則輸出最終的聚類結(jié)果,否則執(zhí)行步驟8。
4? 實驗結(jié)果與分析
本文將WGFFCM算法與FCM、FPAFCM算法在UCI數(shù)據(jù)集上和人工數(shù)據(jù)集D31上進行實驗對比,數(shù)據(jù)集信息如表2所示。實驗結(jié)果如表3所示,3種算法的結(jié)果對比圖如圖3所示。實驗參數(shù)設(shè)定如下:模糊指數(shù)m=2,種群規(guī)模n=20,迭代次數(shù)20次,Levy飛行參數(shù)λ=1.5,種群轉(zhuǎn)換概率p=0.8,編程運行環(huán)境為Python 3.8。
本文分別使用ACC(準確率)和ARI(調(diào)整蘭德系數(shù))這2個聚類評價指標對WGFFCM算法的聚類效果進行比較與分析。ARI越接近1則表明聚類效果越好。分析表2中的數(shù)值可以得出,3種算法中WGFFCM算法的ACC和ARI優(yōu)于另外2種算法。在數(shù)據(jù)集D31上,WGFFCM算法的ACC相比于FCM、FPAFCM分別提升了9.7%、7.29%,且ARI接近于1,表明WGFFCM算法比其他2種算法聚類效果更佳;雖然WGFFCM算法在數(shù)據(jù)集Iris中的ARI低于FPAFCM算法,圖3中WGFFCM算法在3個1數(shù)據(jù)集上的ACC、ARI及穩(wěn)定性優(yōu)于其他2種算法。
5? 結(jié)? 論
本文提出的多策略優(yōu)化FPA算法使得WGFFCM算法快速找到最優(yōu)的初始聚類中心,提高了模糊聚類的聚類準確率以及聚類效果。仿真實驗結(jié)果證明:WGFFCM算法相較于FCM、FPAFCM算法,在聚類效果、穩(wěn)定性及聚類準確率均得到了顯著提升。
參考文獻:
[1] ZHAO K X,DAI Y P,JIA Z Y,et al. General Fuzzy C-Means Clustering Algorithm Using Minkowski Metric [J].Signal Processing,2021,188:108161.
[2] PANTULA P D,MIRIYALA S S,MITRA K. An Evolutionary Neuro-Fuzzy C-Means Clustering Technique [J].Engineering Applications of Artificial Intelligence,2020,89(C):103435-103435.
[3] 呂冰垚,姜志翱,寧春玉.基于PSO和GA混合優(yōu)化的FCM算法 [J].長春理工大學(xué)學(xué)報:自然科學(xué)版,2021,44(6):125-130.
[4] 董發(fā)志,丁洪偉,楊志軍,等.基于遺傳算法和模糊C均值聚類的WSN分簇路由算法 [J].計算機應(yīng)用,2019,39(8):2359-2365.
[5] KUMAR A,KUMAR D,JARIAL S K. A Hybrid Clustering Method Based on Improved Artificial Bee Colony and Fuzzy C-Means Algorithm [J].International Journal of Artificial Intelligence,2017,15(2):40-60.
[6] 高翻翻,丁正生.融合動態(tài)收斂因子與黃金正弦的花朵授粉算法 [J].河南科技大學(xué)學(xué)報:自然科學(xué)版,2022,43(2):47-53+7.
[7] 陶志勇,崔新新.混合改進的花朵授粉算法 [J].傳感器與微系統(tǒng),2019,38(10):139-142+145.
[8] 陸克中,章哲慶,劉利斌.自適應(yīng)變異的量子花授粉算法 [J].控制工程,2020,27(4):683-691.
[9] 賀智明,李文靜.基于動態(tài)全局搜索和柯西變異的花授粉算法 [J].計算機工程與應(yīng)用,2019,55(19):74-80+222.
[10] TANYILDIZI E,DEMIR G. Golden Sine Algorithm:A Novel Math-Inspired Algorithm [J].Advances in Electrical and Computer Engineering,2017,17(2):71-78.
作者簡介:吳晴(1997—),女,漢族,河南商丘人,碩士研究生在讀,研究方向:模式識別與人工智能。