王 杰, 劉向晴
(鄭州大學(xué) 電氣工程學(xué)院 河南 鄭州 450001)
圖像分割就是根據(jù)圖像中有意義的特征把圖像分成若干具有獨(dú)特性質(zhì)的區(qū)域,它是圖像識(shí)別和計(jì)算機(jī)視覺(jué)至關(guān)重要的預(yù)處理,但是圖像分割至今尚無(wú)通用的自身理論.傳統(tǒng)的圖像分割方法有閾值分割、邊緣分割、區(qū)域分割、直方圖法等,這些方法大都存在過(guò)度分割,分割速度低下的特點(diǎn)[1].近年來(lái)隨著各種理論方法的發(fā)展交叉結(jié)合,出現(xiàn)了很多圖像分割方法.文獻(xiàn)[2]是利用改進(jìn)的Mean-shift算法產(chǎn)生初始聚類中心,再采用KFCM聚類算法進(jìn)行圖像特征聚類來(lái)實(shí)現(xiàn)區(qū)域分割,但算法中牽涉多個(gè)參數(shù),運(yùn)算復(fù)雜,分割耗時(shí)嚴(yán)重.文獻(xiàn)[3]采用模糊理論構(gòu)造模糊集,再輸入BP人工神經(jīng)網(wǎng)絡(luò)進(jìn)行迭代運(yùn)算,相對(duì)有效地降低了分割時(shí)間,但是在分割精度方面有待提高.文獻(xiàn)[4]對(duì)彩色圖像求其形態(tài)學(xué)梯度,然后對(duì)分水嶺的過(guò)分割區(qū)域進(jìn)行合并,但該算法只能應(yīng)用于RGB彩色空間,使得應(yīng)用存在一定的局限性,而且其存在分割效率不高的問(wèn)題.文獻(xiàn)[5]用稀疏性最小二乘支持向量機(jī)分割圖像,分割的準(zhǔn)確度取決于參數(shù)的選擇,對(duì)復(fù)雜的彩色圖像分割效果遜于支持向量機(jī),但分割速度有所提升.文獻(xiàn)[6]采用K均值聚類選取訓(xùn)練樣本,再用粒子群優(yōu)化參數(shù)獲得優(yōu)化的多核支持向量機(jī)來(lái)分割彩色圖像,與單核支持向量機(jī)相比,分割精度有一定的提升,但效果并不明顯,分割時(shí)間延長(zhǎng).因此研究尋找選擇性能優(yōu)良的算法對(duì)圖像分割具有重要的意義.
極限學(xué)習(xí)機(jī)(extreme learning machine,ELM)由黃廣斌教授[7]等提出,是一種單隱含層前饋神經(jīng)網(wǎng)絡(luò)模型.與BP人工神經(jīng)網(wǎng)絡(luò)相比,ELM具有更快的學(xué)習(xí)速度、更高的訓(xùn)練精度以及更簡(jiǎn)單的操作方式,從而被廣泛地應(yīng)用于分類、識(shí)別領(lǐng)域[8-9].2012年黃廣斌教授[10]提出將核函數(shù)引入極限學(xué)習(xí)機(jī),構(gòu)成核極限學(xué)習(xí)機(jī)(KELM),核極限學(xué)習(xí)機(jī)具有更好的分類性能.
目前,將核極限學(xué)習(xí)機(jī)應(yīng)用到彩色圖像分割方面的文獻(xiàn)很少,考慮到核極限學(xué)習(xí)機(jī)作為分類器在分類方面具有極大的優(yōu)勢(shì)[9],本文在探究FCM聚類算法與核極限學(xué)習(xí)機(jī)原理的基礎(chǔ)上探討實(shí)現(xiàn)了3種具有FCM預(yù)分類的核極限學(xué)習(xí)機(jī)及其在彩色圖像分割中的應(yīng)用,取得了很好的效果,具有一定的應(yīng)用價(jià)值.
極限學(xué)習(xí)機(jī)是單隱含層神經(jīng)網(wǎng)絡(luò),它是一種求解神經(jīng)網(wǎng)絡(luò)的算法,學(xué)習(xí)速度快,泛化能力強(qiáng),具有良好的全局搜索能力.
極限學(xué)習(xí)機(jī)的算法可簡(jiǎn)單分為4步.
設(shè)定訓(xùn)練樣本集合N={(xi,ti)xi∈Rn,ti∈Rm},隱含層神經(jīng)元的激活函數(shù)為g(x),隱含層節(jié)點(diǎn)數(shù)為L(zhǎng).
第1步:隨機(jī)初始化輸入層與隱含層之間的初始權(quán)重W和隱含層偏置值b.
第2步:計(jì)算出極限學(xué)習(xí)機(jī)隱含層的輸出矩陣H.
第3步:計(jì)算出隱含層輸出權(quán)值β.
可以得到
(1)
從而解決了極限學(xué)習(xí)機(jī)的核心問(wèn)題,得到輸出權(quán)值β,極限學(xué)習(xí)機(jī)的輸出方程就可以寫為
(2)
利用極限學(xué)習(xí)機(jī)解決二分類問(wèn)題時(shí),決策方程為
(3)
類似于支持向量機(jī)的核函數(shù)引入方法,滿足Mercer定理的函數(shù)[11]都可以作為ELM的核函數(shù),從而構(gòu)成核極限學(xué)習(xí)機(jī).因此我們可以在H未知的情況下,將h(x)HT和HHT用相同的核函數(shù)K(u,v)代替,這樣就可以得到
(4)
式中:ΩELM就是樣本核函數(shù)的矩陣,可表示為
(5)
常見的核函數(shù)有LINE(線性)核函數(shù)、POLY(多項(xiàng)式)核函數(shù)、RBF(高斯)核函數(shù).
FCM-KELM對(duì)彩色圖像進(jìn)行分割即是具有FCM預(yù)分類的核極限學(xué)習(xí)機(jī)在彩色圖像分割上的應(yīng)用,分割算法可以分為3個(gè)步驟.
第1步:在本步驟中將詳述FCM算法對(duì)彩色圖像進(jìn)行預(yù)分類訓(xùn)練樣本的過(guò)程.FCM算法的全稱是模糊C均值聚類算法,它是通過(guò)隸屬度來(lái)確定聚類關(guān)系,不斷迭代更新隸屬度、聚類中心以及最小化目標(biāo)函數(shù)來(lái)對(duì)數(shù)據(jù)進(jìn)行分類.與FCM算法直接對(duì)像素點(diǎn)進(jìn)行聚類不同,一些學(xué)者提出了中央像素與鄰域窗口像素的局部灰度信息相似性度量Sij[12],之后又有學(xué)者提出了將核函數(shù)引入相似性度量之中以改進(jìn)FCM算法,得到了局部灰度相似性度量之中包含有中央像素與鄰域窗口中像素的空間距離SFGFCM算法[13].本文在研究SFGFCM算法基礎(chǔ)上將中央像素點(diǎn)與鄰域窗口中的歐氏距離以及它們的局部灰度信息相似性度量相結(jié)合求得新的相似性度量Rij,然后線性加權(quán)可求得中央像素點(diǎn)的灰度值Xi,它不但包含了中央像素點(diǎn)與鄰域窗口的局部灰度信息,也包含了相應(yīng)的空間距離.然后采用FCM算法對(duì)Xi進(jìn)行聚類,這樣得到的兩類訓(xùn)練樣本會(huì)更加準(zhǔn)確.方法如下.
1) 設(shè)定聚類數(shù)目分為前景與背景兩類,設(shè)定容許誤差ε.
(6)
(7)
(8)
式中:cj為第j類中心點(diǎn)的灰度值;μij是隸屬度函數(shù);Xi表示線性加權(quán)得到的中央像素點(diǎn)i的灰度值.
2) 本文采用像素點(diǎn)的四鄰域窗口來(lái)求取位于窗口中央像素點(diǎn)的相似性度量Rij.
Gij=exp(-De(i,j)),
(9)
(10)
其中:Gij表示中央像素點(diǎn)i的局部空間信息;De(i,j)表示中央像素點(diǎn)i與鄰域像素的歐氏距離;Sij即是文獻(xiàn)[12]表述的中央像素與鄰域窗口像素的局部灰度信息相似性度量;xi是中央像素點(diǎn)i的灰度值;xj是中央像素點(diǎn)鄰域窗口的灰度值;NR是四鄰域窗口內(nèi)像素點(diǎn)個(gè)數(shù);Ni是中央像素i的四鄰域窗口像素集.
(11)
3) 通過(guò)式(6)~(7)更新聚類中心c、隸屬度函數(shù)矩陣μ,重復(fù)這一過(guò)程直到聚類中心與上一次聚類中心的灰度值之差小于容許誤差,算法終止.
4) 根據(jù)隸屬度大小不同,通過(guò)隸屬度函數(shù)將圖像的像素點(diǎn)歸為兩類訓(xùn)練樣本后,每一類樣本隨機(jī)抽取個(gè)數(shù)為nk/t(k=1,2,…,N)像素點(diǎn)作為第k類的訓(xùn)練樣本,nk為第k(k=1,2,…,N)類像素點(diǎn)的個(gè)數(shù).按照上述步驟就完成了FCM對(duì)訓(xùn)練樣本的自選取的過(guò)程,本文選取t=100.
第2步:從第1步中采用FCM算法得到兩類訓(xùn)練樣本后,選取訓(xùn)練樣本的5種特征屬性,本文選取比較基本的圖像特征,包括顏色空間的R、G、B通道的像素值,亮度I,以及LBP紋理特征,將其作為輸入向量來(lái)訓(xùn)練核極限學(xué)習(xí)機(jī)分類器,本文使用的核極限學(xué)習(xí)機(jī)有高斯核極限學(xué)習(xí)機(jī)(RBF-KELM)、線性核極限學(xué)習(xí)機(jī)(LINE-KELM)與多項(xiàng)式核極限學(xué)習(xí)機(jī)(POLY-KELM)3種.
第3步:通過(guò)以上兩步得到具有FCM預(yù)分類的核極限學(xué)習(xí)機(jī)分類器,然后對(duì)原彩色圖像進(jìn)行分割.
綜上所述,F(xiàn)CM-KELM彩色圖像分割算法就是以下3步:第1步是FCM算法對(duì)隨機(jī)選取的彩色圖像進(jìn)行聚類,得到兩類訓(xùn)練樣本;第2步提取訓(xùn)練樣本的特征屬性對(duì)核極限學(xué)習(xí)機(jī)進(jìn)行訓(xùn)練得到相應(yīng)的核極限學(xué)習(xí)機(jī)分類器;第3步是輸入此彩色圖像,利用訓(xùn)練好的核極限學(xué)習(xí)機(jī)分類器就可以對(duì)其進(jìn)行分割,顯示最終分割效果圖.
本文采用具有FCM預(yù)分類的核極限學(xué)習(xí)機(jī)彩色圖像分割算法(FCM-KELM),將它與FCM預(yù)分類的BP彩色圖像分割算法(FCM-BP)以及FCM預(yù)分類的支持向量機(jī)彩色圖像分割算法(FCM-SVM)做對(duì)比,并進(jìn)行性能分析.其中采用了量化共軛梯度算法優(yōu)化的BP網(wǎng)絡(luò),隱含層傳遞函數(shù)采用的是sigmod函數(shù),支持向量機(jī)使用的是臺(tái)灣大學(xué)林智仁教授開發(fā)的libsvm工具包,核函數(shù)選擇的是高斯核函數(shù).
實(shí)驗(yàn)在軟件 MATLAB R2014b中進(jìn)行, 運(yùn)行環(huán)境為Core i5,CPU 2.4 GHz,RAM 4 G,本文的彩色圖像來(lái)源為互聯(lián)網(wǎng)與伯克利圖像數(shù)據(jù)庫(kù)[14](Berkeley segmentation dataset),選取了其中40幅彩色圖像進(jìn)行了實(shí)驗(yàn),其中每一幅彩色圖像均實(shí)現(xiàn)了FCM預(yù)分類的BP、SVM、高斯核極限學(xué)習(xí)機(jī)、線性核極限學(xué)習(xí)機(jī)以及多項(xiàng)式核極限學(xué)習(xí)機(jī)5種分割效果圖,然后對(duì)比分析.現(xiàn)就選擇其中4幅具有復(fù)雜背景的彩色圖像進(jìn)行實(shí)驗(yàn)說(shuō)明與分析,互聯(lián)網(wǎng)上的彩色圖像分辨率大小均為200×200,伯克利圖像數(shù)據(jù)庫(kù)的彩色圖像分辨率為321×481或481×321.
首先作對(duì)比分析說(shuō)明的是人工選取訓(xùn)練樣本與采用FCM算法自選取訓(xùn)練樣本訓(xùn)練線性核極限學(xué)習(xí)機(jī)的測(cè)試結(jié)果,圖1是實(shí)驗(yàn)測(cè)試效果圖.圖1中的a1是互聯(lián)網(wǎng)上的原始圖像,實(shí)驗(yàn)要求FCM自選取樣本點(diǎn)的數(shù)目與人工隨機(jī)選取樣本點(diǎn)數(shù)目一致.從圖1中可以看出,人工隨機(jī)選取樣本點(diǎn)后提取特征用線性核極限學(xué)習(xí)機(jī)訓(xùn)練得到的分類器對(duì)原始圖像的分割效果時(shí)好時(shí)差.這是因?yàn)槿斯みx取樣本點(diǎn).帶有很大的不確定性,不同的選取帶來(lái)的效果也就不一樣,選取樣本點(diǎn)比較恰當(dāng)?shù)臅r(shí)候,分割的效果就會(huì)好一點(diǎn).比如a3這幅圖,選取不當(dāng)就會(huì)出現(xiàn)a2或a4比較差的效果圖.因此本文采用FCM自動(dòng)的選取訓(xùn)練樣本并訓(xùn)練核極限學(xué)習(xí)機(jī),得到的分割效果不但穩(wěn)定而且精度較高(如圖a5).采用FCM自動(dòng)選取訓(xùn)練樣本不但避免了人工選取的費(fèi)時(shí)費(fèi)力,而且也避免出現(xiàn)人工分割所帶來(lái)的適應(yīng)性較低.
圖1 不同選取方式的LINE-KELM分割效果圖Fig.1 Different selection of LINE-KELM segmentation effect diagram
圖2中的a1、b1、c1、d1均是原始圖像,其中a1、b1為互聯(lián)網(wǎng)上的彩色圖像,c1、d1來(lái)源于伯克利圖像數(shù)據(jù)庫(kù).a2、b2、c2、d2均是FCM-BP對(duì)原圖的分割效果圖,從這幾幅圖像來(lái)看,BP神經(jīng)網(wǎng)絡(luò)并不能對(duì)具有復(fù)雜背景的彩色圖像進(jìn)行有效分割,每一幅分割的彩色圖像效果圖雜質(zhì)點(diǎn)過(guò)多,目標(biāo)輪廓分割不準(zhǔn)確.a3、b3、c3、d3均是FCM-SVM對(duì)原圖的分割效果圖.可以看出,F(xiàn)CM-SVM基本完成了對(duì)復(fù)雜彩色圖像的分割,但是對(duì)分割的準(zhǔn)確度仍然不夠高.比如a3分割圖雖然對(duì)蝴蝶基本完成了分割,但蝴蝶細(xì)長(zhǎng)的腿并沒(méi)有分割出來(lái).對(duì)分割的細(xì)節(jié)處理不夠好,b3圖中內(nèi)部出現(xiàn)誤判,c3、d3分割的圖像在圖形邊角處出現(xiàn)誤判.a4、b4、c4、d4均是FCM-RBF-KELM(高斯核參數(shù)σ=5)對(duì)原圖的分割效果圖.與FCM-BP和FCM-SVM相比,分割精度較好,在細(xì)節(jié)處理方面更為準(zhǔn)確.a5、b5、c5、d5均是FCM-LINE-KELM對(duì)原圖的分割效果圖,在分割的準(zhǔn)確度上比高斯核的效果更好一點(diǎn).a6、b6、c6、d6均是FCM-POLY-KELM(多項(xiàng)式核參數(shù)d=1)對(duì)原圖的分割效果圖,分割效果是最優(yōu)的.
圖2 BP、SVM以及不同核函數(shù)的KELM分割效果圖Fig.2 BP, SVM and KELM with different kernel function segmentation diagram
圖3顯示的是伯克利圖像數(shù)據(jù)庫(kù)列出的原圖以及對(duì)應(yīng)的人工分割圖.通過(guò)對(duì)圖2中c1原圖、c2原圖的FCM預(yù)分類的BP、SVM以及不同核函數(shù)的KELM分割效果圖上的每個(gè)像素點(diǎn),與圖3中的人工分割圖c1、人工分割圖c2量化對(duì)比來(lái)計(jì)算分割精度.表1所顯示的是FCM-KELM與FCM-BP、FCM-SVM在分割精度與分割時(shí)間上的對(duì)比.從表中的數(shù)據(jù)可以看出,F(xiàn)CM-KELM在分割精度與分割時(shí)間上表現(xiàn)優(yōu)秀,這與前面求證的核極限學(xué)習(xí)機(jī)的原理有關(guān),核極限學(xué)習(xí)機(jī)的可調(diào)參數(shù)較少,便于快速訓(xùn)練與分類.
相比 FCM-BP、FCM-SVM而言,利用FCM-KELM對(duì)彩色圖像分割的效果也非常符合人們的預(yù)期.對(duì)比FCM-RBF-KELM、FCM-LINE-KELM以及FCM-POLY-KELM,可以看出線性核與多項(xiàng)式核的分割效果比高斯核更好一點(diǎn),這與高斯核的局部核函數(shù)學(xué)習(xí)能力比較強(qiáng),而多項(xiàng)式核的全局核函數(shù)泛化能力比較強(qiáng)有一定的關(guān)系.上述的實(shí)驗(yàn)結(jié)果表明,本文探討實(shí)現(xiàn)的3種具有FCM預(yù)分類的核極限學(xué)習(xí)機(jī)能夠?qū)Σ噬珗D像進(jìn)行高效精確地分割,具一定的應(yīng)用價(jià)值.
圖3 伯克利數(shù)據(jù)庫(kù)列出的原圖以及對(duì)應(yīng)的人工分割圖Fig.3 The original image listed in the Berkeley database and the corresponding artificial segmentation
分割結(jié)果FCM-BPFCM-SVMFCM-RBF-KELMFCM-LINE-KELMFCM-POLY-KELM精度/%時(shí)間/s精度/%時(shí)間/s精度/%時(shí)間/s精度/%時(shí)間/s精度/%時(shí)間/sc1圖79.219.8792.125.4595.462.6196.412.5396.722.57d1圖80.2310.3592.616.1796.522.7297.642.6398.122.66
注:c1、d1指的是圖2中的c1、d1.
本文探討實(shí)現(xiàn)了3種具有FCM預(yù)分類的核極限學(xué)習(xí)機(jī)及其在彩色圖像分割中的應(yīng)用.FCM預(yù)分類保證了自動(dòng)選取訓(xùn)練樣本,避免了人工選取訓(xùn)練樣本的缺陷性,訓(xùn)練得到的核極限學(xué)習(xí)機(jī)能夠?qū)δ繕?biāo)進(jìn)行快速分類,是一種優(yōu)秀的分類器.FCM預(yù)分類的核極限學(xué)習(xí)機(jī)能夠?qū)Σ噬珗D像自動(dòng)進(jìn)行快速有效分割,分割準(zhǔn)確率較高,泛化性能較好,是一種優(yōu)秀的彩色圖像分割算法.就從分割的精度上考慮,該算法還有一定的提升空間,可以從訓(xùn)練樣本的特征提取及算法優(yōu)化兩方面考慮:本文僅選取5種特征屬性訓(xùn)練得到的核極限學(xué)習(xí)機(jī)分類器分割,效果已經(jīng)非常顯著,如果再多選取其他特征屬性,比如紋理特征的對(duì)比度、能量等,相信核極限學(xué)習(xí)機(jī)的分割效果會(huì)更加優(yōu)秀;從多核學(xué)習(xí)的算法上考慮,構(gòu)造高斯核與多項(xiàng)式核線性組合的多核極限學(xué)習(xí)機(jī),進(jìn)行訓(xùn)練與分割,采用智能算法對(duì)一些參數(shù)進(jìn)行優(yōu)化,分割精度上也會(huì)有一定的提升.
參考文獻(xiàn):
[1] 許新征,丁世飛,史忠植,等.圖像分割的新理論和新方法[J].電子學(xué)報(bào),2010,38(S1):76-82.
[2] 汪彥,楊格蘭,何建新.基于改進(jìn)KFCM聚類的圖像分割算法[J]. 控制工程, 2016, 23(11):1857-1860.
[3] 周鵬飛,張?jiān)虑?基于模糊BP神經(jīng)網(wǎng)絡(luò)的圖像分割方法研究[J]. 計(jì)算機(jī)工程與設(shè)計(jì), 2014,35(7):2423-2426.
[4] 徐天芝,張貴倉(cāng),賈園.基于形態(tài)學(xué)梯度的分水嶺彩色圖像分割[J]. 計(jì)算機(jī)工程與應(yīng)用, 2016, 52(11):200-203.
[5] WANG X Y, NING Y L, HE X P. Image segmentation based on least squares support vector machines[J]. Applied mechanics & materials,2014(644/650):4314-4318.
[6] 吳迪,戴芳,郭文艷,等.基于K均值聚類和粒子群優(yōu)化的多核SVM圖像分割[J]. 計(jì)算機(jī)系統(tǒng)應(yīng)用, 2016, 25(4):191-196.
[7] HUANG G B,ZHU Q Y,SIEW C. Extreme learning machine: theory and applications[J]. Neurocomputing,2006,70(1/3):489-501.
[8] ZONG W,HUANG G B. Face recognition based on extreme learning machine[J]. Neurocomputing,2011,74(16):2541-2551.
[9] CHEN C,LI W,SU H,LIU K. Spectral-spatial classification of hyperspectral image based on kernel extreme learning machine[J]. Remote sensing,2014,6(6):5795-5814.
[10] HUANG G B,ZHOU H,DING X,et al. Extreme learning machine for regression and multiclass classification[J].IEEE transactions on systems man & cybernetics part B cybernetics,2012,42(2):513-529.
[11] 王杰,郭晨龍.小波核極限學(xué)習(xí)機(jī)分類器[J].微電子學(xué)與計(jì)算機(jī),2013,30(10):73-76.
[12] CAI W,CHEN S,ZHANG D. Fast and robust fuzzyc-means clustering algorithms incorporating local information for image segmentation[J]. Pattern recognition,2007,40(3):825-838.
[13] 王軍玲,王士同,包芳,等.基于空間距離的快速模糊C均值聚類算法[J].計(jì)算機(jī)工程與應(yīng)用.2015,51(1):177-183.
[14] FOWLKES C C, MARTIN D R, MALIK J. Local figure-ground cues are valid for natural images.[J]. Journal of vision, 2007, 7(8):1-9.