穆華平+焦長(zhǎng)義
摘 要 引入多子群動(dòng)態(tài)演化的結(jié)構(gòu)改善PSO算法的收斂性能,在對(duì)數(shù)據(jù)樣本進(jìn)行預(yù)處理的基礎(chǔ)上,構(gòu)造了一種適合多子群PSO算法的分類(lèi)規(guī)則編碼和適應(yīng)度函數(shù)。通過(guò)對(duì)UCI的四個(gè)數(shù)據(jù)集的分類(lèi)實(shí)驗(yàn),驗(yàn)證了該分類(lèi)方法的性能優(yōu)勢(shì)。
關(guān)鍵詞 多子群 PSO算法 數(shù)據(jù)分類(lèi) 自組織
中圖分類(lèi)號(hào):TP183 文獻(xiàn)標(biāo)識(shí)碼:A
3仿真實(shí)驗(yàn)
3.1數(shù)據(jù)來(lái)源與參數(shù)設(shè)置
為了驗(yàn)證新算法的數(shù)據(jù)分類(lèi)性能,本文選用UCI 數(shù)據(jù)庫(kù)中常用的3個(gè)數(shù)據(jù)集進(jìn)行仿真實(shí)驗(yàn),并將其與PSOC、復(fù)合粒子群分類(lèi)算法和MPSO-HLC的性能進(jìn)行比較。算法參數(shù)設(shè)置如下:種群規(guī)模 N= 40,Gmax= 500,擇優(yōu)連接概率p取0.4,適應(yīng)度方差的閾值取0.01,實(shí)驗(yàn)數(shù)據(jù)集的樣本數(shù)量和特征如表1所示。
3.2實(shí)驗(yàn)結(jié)果分析
數(shù)據(jù)分類(lèi)過(guò)程包括規(guī)則提取和數(shù)據(jù)分類(lèi)兩個(gè)階段,因此實(shí)驗(yàn)中將數(shù)據(jù)集隨機(jī)分成訓(xùn)練數(shù)據(jù)集和測(cè)試數(shù)據(jù)集兩部分,試驗(yàn)中二者的比例取2:3。表2顯示了新算法與復(fù)合粒子群分類(lèi)算法以及PSOC在上述四個(gè)數(shù)據(jù)集的分類(lèi)結(jié)果。
從表2的實(shí)驗(yàn)結(jié)果可以看出,除了MPSO-HLC分類(lèi)算在Pima數(shù)據(jù)集上的分類(lèi)準(zhǔn)確率更高以外,本文提出的基于多子群的PSO算法的數(shù)據(jù)分類(lèi)方法在準(zhǔn)確率上都要明顯高于其它三種算法,并且標(biāo)準(zhǔn)差低于較小,這說(shuō)明該算法具有較好的穩(wěn)定性。這一方面歸功于多子群的引入使得PSO算法的群體多樣性得到提高,有利于算法后期的“勘探”和“開(kāi)采”,提高了算法的收斂精度;另一方面,在分類(lèi)規(guī)則的提取上,采用的是各個(gè)子群的最優(yōu)個(gè)體的編碼映射,相當(dāng)于對(duì)提取的分類(lèi)規(guī)則進(jìn)行了擇優(yōu)篩選,因而能夠以更高的準(zhǔn)確率覆蓋數(shù)據(jù)集。然而,實(shí)驗(yàn)中也發(fā)現(xiàn),由于算法增加了算法搜索停滯的判斷和群體的動(dòng)態(tài)聚合過(guò)程,一定程度上增加了算法的時(shí)間復(fù)雜度。
4結(jié)論
設(shè)計(jì)了一種適合多子群PSO算法的規(guī)則編碼,并構(gòu)造了合適的適應(yīng)度函數(shù),引入多子群動(dòng)態(tài)聚合模型改善算法,以提高數(shù)據(jù)分類(lèi)的準(zhǔn)確度。通過(guò)UCI的4個(gè)標(biāo)準(zhǔn)數(shù)據(jù)集的實(shí)驗(yàn)表明,新算法能夠明顯提高數(shù)據(jù)分類(lèi)的準(zhǔn)確率,且穩(wěn)定性很好。
基金項(xiàng)目:河南省高等學(xué)校重點(diǎn)科研項(xiàng)目(項(xiàng)目編號(hào):15B520014)。
參考文獻(xiàn)
[1] 張紅蕊,張永,于靜雯.云計(jì)算環(huán)境下基于樸素貝葉斯的數(shù)據(jù)分類(lèi)[J].計(jì)算機(jī)應(yīng)用與軟件,2015,32(3):27-30.
[2] 張曉賀.決策樹(shù)分類(lèi)器的實(shí)現(xiàn)及在遙感影像分類(lèi)中的應(yīng)用[D].蘭州交通大學(xué),2013.
[3] 黃宇棟.BP神經(jīng)網(wǎng)絡(luò)在信息系統(tǒng)數(shù)據(jù)分類(lèi)中的應(yīng)用研究[D].中國(guó)地質(zhì)大學(xué),2013.
[4] Kennedy J,Eberhart R C.Particle Swarm Optimization [C].Proceedings of the 1995 IEEE International Conference on Neural Networks. Piscataway, Perth,NJ,USA:IEEE service center,1995:1942-1948.
[5] 王旸,劉曉東,徐小慧,等.基于粒子群優(yōu)化的數(shù)據(jù)分類(lèi)算法[J].系統(tǒng)仿真學(xué)報(bào),2008,20(22):6158-6162+6168.
[6] 曾正良,羅可,鄒瑞芝.基于復(fù)合粒子群的數(shù)據(jù)分類(lèi)方法[J].計(jì)算機(jī)工程與應(yīng)用,2009,45(7):156-158.
[7] 王利霞.改進(jìn)的粒子群優(yōu)化算法及其在數(shù)據(jù)分類(lèi)中的應(yīng)用[D].西安電子科技大學(xué)碩士學(xué)位論文,2014.