高 博
(中國(guó)電子科技集團(tuán)公司第二十研究所,陜西 西安 710068)
遙感影像被廣泛應(yīng)用于環(huán)境監(jiān)測(cè)[1], 地表覆蓋觀測(cè)[2-3],變化檢測(cè)[4-5]和氣候研究[6]等領(lǐng)域。對(duì)于遠(yuǎn)程遙感應(yīng)用,遙感影像聚類(lèi)是一種重要的技術(shù),它是將給定的遙感影像劃分為幾個(gè)同質(zhì)的區(qū)域,每個(gè)區(qū)域往往表示一種特定地物類(lèi)型[7]。一般地,聚類(lèi)通過(guò)相似度度量,將給定遙感影像劃分為K個(gè)區(qū)域。同時(shí),一般聚類(lèi)在遙感影像中的表現(xiàn)可能會(huì)受到噪聲或者混疊像素的影響。模糊聚類(lèi)對(duì)噪聲或者異常值具有較好的魯棒性,往往能夠取得更好的聚類(lèi)結(jié)果。實(shí)際上,聚類(lèi)是一個(gè)優(yōu)化問(wèn)題,可以通過(guò)最小化特定的目標(biāo)函數(shù)來(lái)實(shí)現(xiàn)[8]。
梳理相關(guān)文獻(xiàn),可以發(fā)現(xiàn),遙感影像聚類(lèi)方法可以歸為兩類(lèi),即有監(jiān)督聚類(lèi)和無(wú)監(jiān)督聚類(lèi)[9]。有監(jiān)督聚類(lèi)需要一個(gè)訓(xùn)練集用于訓(xùn)練分類(lèi)器,而無(wú)監(jiān)督聚類(lèi)則通過(guò)分析給定數(shù)據(jù)來(lái)實(shí)現(xiàn)像素的分類(lèi),無(wú)需訓(xùn)練樣本。聚類(lèi)將一幅圖像劃分為非重疊連續(xù)的區(qū)域,每個(gè)區(qū)域關(guān)于特定的特征是一致的,比如關(guān)于像素強(qiáng)度,紋理或者上下文信息。模糊C均值(FCM)是最著名的聚類(lèi)方法之一,它成功地將模糊邏輯引入到聚類(lèi)中。與傳統(tǒng)的硬聚類(lèi)方法相比,盡管FCM能夠保留更多的信息,但它依然對(duì)噪聲和異常值很敏感,這是因?yàn)樗鼪](méi)有考慮到空間和上下文信息。后來(lái),許多研究者成功地把局部空間信息引入到標(biāo)準(zhǔn)的FCM中,以提高聚類(lèi)表現(xiàn)[10-11]。文獻(xiàn)[11]提出一種廣義的模糊C 均值聚類(lèi)算法(FGFCM),它對(duì)噪聲和異常值不敏感,可以彌補(bǔ)標(biāo)準(zhǔn)FCM的劣勢(shì)。
近年來(lái),基于進(jìn)化優(yōu)化的聚類(lèi)方法受到很多研究者的關(guān)注。與FCM[12]和FGFCM[11]相比,基于進(jìn)化優(yōu)化的聚類(lèi)方法往往具有更強(qiáng)的全局搜索能力,能夠取得一個(gè)最優(yōu)或者近似最優(yōu)的解[8]。多種基于生物激發(fā)的進(jìn)化算法[13-15]被提出來(lái)用于聚類(lèi)任務(wù)。這些方法往往僅優(yōu)化單個(gè)聚類(lèi)評(píng)價(jià)標(biāo)準(zhǔn),但是一個(gè)單一的評(píng)價(jià)標(biāo)準(zhǔn)很難適用于具有不同特征的數(shù)據(jù)[7]。另外,這些方法中的目標(biāo)函數(shù)是兩個(gè)或者多個(gè)沖突的評(píng)價(jià)指標(biāo)的加權(quán)和。因此,可考慮使用多目標(biāo)優(yōu)化來(lái)處理多個(gè)沖突目標(biāo)的求解問(wèn)題。
不同的目標(biāo)函數(shù)可能有其不同的側(cè)重點(diǎn),也許表征了遙感影像的一種特定結(jié)構(gòu)[7]。大部分情況下,一個(gè)單一的目標(biāo)函數(shù)無(wú)法適用于不同類(lèi)型且具有復(fù)雜結(jié)構(gòu)的遙感影像聚類(lèi)問(wèn)題。為了增強(qiáng)聚類(lèi)的推廣能力,本文考慮使用同時(shí)優(yōu)化多個(gè)目標(biāo)以探索給定圖像的不同特征。因此,可以將聚類(lèi)任務(wù)轉(zhuǎn)化為多目標(biāo)優(yōu)化問(wèn)題。最終的解往往包含許多Pareto最優(yōu)解,但是任何一個(gè)目標(biāo)函數(shù)的增大必然伴隨著另一個(gè)目標(biāo)函數(shù)的減小[9]。
一些多目標(biāo)聚類(lèi)算法已經(jīng)被提出并且應(yīng)用于遙感影像聚類(lèi)問(wèn)題[7,9,16]。文獻(xiàn)[7]中,兩個(gè)模糊聚類(lèi)評(píng)價(jià)標(biāo)準(zhǔn)在快速和精英非支配排序遺傳算法(NSGA-II)[17]的框架下被同時(shí)優(yōu)化,其中Xie-Beni指數(shù)和FCM 評(píng)價(jià)函數(shù)Jm被用作兩個(gè)目標(biāo)函數(shù)。2013年,鐘等人提出來(lái)一種兩步聚類(lèi)方法[16],其中一個(gè)由優(yōu)化層和分類(lèi)層組成的兩層系統(tǒng)被建立起來(lái)。 在優(yōu)化層,一個(gè)可行的聚類(lèi)數(shù)可以通過(guò)最小化Jm和Xie-Beni指數(shù)來(lái)確定,然后,在分類(lèi)層聚類(lèi)結(jié)果可以通過(guò)使用非支配和擁擠距離排序來(lái)獲得。2009年,Andrea Paoli等為高光譜圖像聚類(lèi)提出一種多目標(biāo)粒子群優(yōu)化框架[9]。在該方法中,3種不同的優(yōu)化標(biāo)準(zhǔn)(log似然函數(shù),類(lèi)間巴氏統(tǒng)計(jì)距離和最小描述長(zhǎng)度)被同時(shí)優(yōu)化。文獻(xiàn)[11]中,F(xiàn)GFCM被提出并被應(yīng)用于圖像聚類(lèi)任務(wù),它以一種新穎的方式將局部空間信息引入到FCM 中,克服了經(jīng)典的FCM算法的缺點(diǎn),并提升了聚類(lèi)表現(xiàn)。
空間信息是圖像的一個(gè)非常重要特性[18]。FGFCM通過(guò)引入局部空間信息增強(qiáng)了對(duì)噪聲的魯棒性。因此,本文將FGFCM的聚類(lèi)評(píng)價(jià)函數(shù)和其相應(yīng)的XB指數(shù)作為兩個(gè)沖突的目標(biāo)函數(shù)同時(shí)進(jìn)行優(yōu)化。該方法引入了圖像的空間鄰域信息而非僅僅是單個(gè)像素強(qiáng)度,保證了其對(duì)噪聲的魯棒性。
許多算法[7,9,16]使用FCM的聚類(lèi)評(píng)價(jià)函數(shù)作為多目標(biāo)優(yōu)化的一個(gè)目標(biāo)。與FCM相比,F(xiàn)GFCM對(duì)噪聲更魯棒,因?yàn)槠鋵⒕植靠臻g信息和灰度級(jí)信息引入到聚類(lèi)評(píng)價(jià)函數(shù)中,該算法的時(shí)間復(fù)雜度取決于圖像的灰度級(jí)而非圖像尺寸[11]。目標(biāo)函數(shù)可以定義如下
(1)
其中,γl是指灰度值為l的像素個(gè)數(shù),l=1,2,3,…,q,而且
(2)
uil表示在條件為
(3)
對(duì)任意l成立的情況下,灰度值l屬于第i類(lèi)的模糊隸屬度。q(q?N)表示測(cè)試圖像的灰度值的個(gè)數(shù),vi是第i個(gè)聚類(lèi)的聚類(lèi)中心,xi是新產(chǎn)生的圖像xi的第i個(gè)像素,其計(jì)算方式如下
(4)
其中,ξi表示圖像ξ的第i個(gè)像素的灰度值,xi是窗口中心像素xi的鄰域的灰度值,Ni是中心像素xi的鄰域,Sij是第i個(gè)像素與第j個(gè)像素之間的局部相似度度量[11]。
由文獻(xiàn)[19]可知,XB指數(shù)可以通過(guò)下式進(jìn)行計(jì)算
(5)
其中,Js表示給定數(shù)據(jù)的c個(gè)類(lèi)別的類(lèi)內(nèi)緊密程度,反映出所有類(lèi)別上的類(lèi)內(nèi)方差。Js的值越小,聚類(lèi)結(jié)果越好。XB指數(shù)是給定數(shù)據(jù)的類(lèi)內(nèi)緊密程度與其劃分之比。容易發(fā)現(xiàn)XB指數(shù)與Js非常相似。但是XB指數(shù)的分母包含了一個(gè)附加項(xiàng),這個(gè)附加項(xiàng)表示任意兩個(gè)不同聚類(lèi)的間隔。大多數(shù)情況下,這兩個(gè)目標(biāo)函數(shù),即Js和XB指數(shù)對(duì)同一種劃分方式不會(huì)同時(shí)達(dá)到各自的最優(yōu)解。
本文提出了一種應(yīng)用于遙感影像的多目標(biāo)模糊C均值的聚類(lèi)算法(MOFCM)。MOFCM使用了多目標(biāo)優(yōu)化的框架,并應(yīng)用到了遙感影像的分類(lèi)問(wèn)題中。該框架的詳細(xì)描述在表1中。
在種群的初始化過(guò)程中,初始種群P是隨機(jī)生成的,在P中的每個(gè)個(gè)體x=(x1,x2,…,xc)可以表示為一個(gè)c維的一個(gè)向量,其中,c是聚類(lèi)中心的數(shù)量。然后,種群的適應(yīng)度值分別通過(guò)式(1)和式(3) 計(jì)算得到。
表1 MOFCM算法流程
變異操作可以表示為
(6)
x′=λ1x+λy
y′=λ1y+λ2x
(7)
其中,x和y是種群P中的兩個(gè)個(gè)體,x′和y′表示兩個(gè)新的子代,λ1和λ2分別是兩個(gè)[0,1]的隨機(jī)數(shù)。
經(jīng)過(guò)交叉和變異操作之后,子代種群的適應(yīng)度值就可以通過(guò)式(1)和式(5)計(jì)算得到。父代種群P與子代種群childpop結(jié)合,構(gòu)成新的種群Pcombine。然后通過(guò)精英保留策略[17],從Pcombine中選出最優(yōu)的N個(gè)個(gè)體,作為下一代的父代。
本文進(jìn)行了兩個(gè)實(shí)驗(yàn),仿真數(shù)據(jù)實(shí)驗(yàn)和真實(shí)數(shù)據(jù)實(shí)驗(yàn),并與傳統(tǒng)的聚類(lèi)算法FCM和FGFCM進(jìn)行了比較,實(shí)驗(yàn)結(jié)果很好的證明了進(jìn)化多目標(biāo)算法MOFCM的有效性。
算法FCM、FGFCM和MOFCM的實(shí)驗(yàn)結(jié)果展示在圖1中。從圖1(a)中可以看出,使用的大小為282 251的圖像應(yīng)該被分為兩部分,一部分是黑色背景,另一部分是灰色的圖形。為了說(shuō)明算法對(duì)噪聲的魯棒性,本文對(duì)該圖像增加了高斯噪聲(30%)。在FGFCM中,本文通過(guò)采用大小為5×5的窗口來(lái)引入局部鄰域信息。由MOFCM獲得的PF面展示在圖1 中,每一個(gè)點(diǎn)代表一個(gè)解。通過(guò)圖1可以看到,PF面非常光滑,而且解也是具有很好的多樣性,這意味著通過(guò)運(yùn)行MOFCM一次,就獲得不同的聚類(lèi)結(jié)果。
表2 MOFCM與FCM、FGFCM聚類(lèi)精度比較
表2展示了3種不同的算法在包含多個(gè)噪聲水平的圖像上的聚類(lèi)結(jié)果。噪聲越大,聚類(lèi)結(jié)果越差。由圖2可以看出,F(xiàn)CM的聚類(lèi)結(jié)果包含了很多噪聲點(diǎn),F(xiàn)GFCM和MOFCM幾乎不包含多少噪聲點(diǎn)。也就是說(shuō),通過(guò)引入局部鄰域信息,F(xiàn)GFCM和MOFCM獲得了更好的聚類(lèi)效果。此外,MOFCM通過(guò)引入多目標(biāo)框架,只要運(yùn)行一次,就可以獲得很多不同聚類(lèi)精度的結(jié)果。
圖1 MOFCM聚類(lèi)Pareto前沿面
圖2 模擬數(shù)據(jù)集圖像聚類(lèi)結(jié)果
這部分使用的真實(shí)數(shù)據(jù)是Campbell數(shù)據(jù)。Campbell數(shù)據(jù)是由ALOS-PALSAR傳感器于2010年6月在Campbell 河上獲取的合成孔徑雷達(dá)影像數(shù)據(jù)。由于是由合成孔徑雷達(dá)獲取的,這使得這圖像很容易受到斑點(diǎn)噪聲的污染,這給聚類(lèi)結(jié)果帶來(lái)很大的影響。原始圖像和3種不同方法獲得的聚類(lèi)結(jié)果分別展示在圖3中。
由圖3可知,Campbell遙感影像能夠被聚類(lèi)為兩類(lèi),陸地和水域。由于沒(méi)有參考圖,本文在此無(wú)法給出一些定量的分析,但是可以通過(guò)視覺(jué)上的效果來(lái)判斷聚類(lèi)結(jié)果。從圖3中可以看出,這些方法對(duì)Campbell 河水域的聚類(lèi)效果很不錯(cuò),把大片的水域都分出來(lái)了。然而,對(duì)于陸地而言,3種算法的分割結(jié)果就有所差別了。FCM將很多小塊的陸地分成了水域,而且它對(duì)斑點(diǎn)噪聲很敏感。FGFCM和MOFCM通過(guò)引入局部鄰域信息,使得這兩種算法對(duì)噪聲具有很好的魯棒性,得到較好的聚類(lèi)結(jié)果。然而,F(xiàn)GFCM將一陸地中相當(dāng)一部分細(xì)小的水域誤分為了陸地。通過(guò)與FCM和FGFCM比較,MOFCM獲得更好的聚類(lèi)效果。
圖3 Campbell河數(shù)據(jù)聚類(lèi)結(jié)果
本文提出了一種遙感影像多目標(biāo)目標(biāo)聚類(lèi)算法MOFCM,該算法同時(shí)優(yōu)化廣義模糊C均值聚類(lèi)評(píng)價(jià)指標(biāo)Js和XB指數(shù)這兩個(gè)相互沖突的目標(biāo)函數(shù)。由于單一評(píng)價(jià)標(biāo)準(zhǔn)難以將復(fù)雜的遙感影像數(shù)據(jù)進(jìn)行良好的建模,因此本文提出算法MOFCM,將遙感影像聚類(lèi)問(wèn)題建模為多目標(biāo)優(yōu)化問(wèn)題。通過(guò)引入多目標(biāo)優(yōu)化框架,本文提出的算法可以同時(shí)優(yōu)化多個(gè)相互沖突的目標(biāo)函數(shù),從而可以獲取了一組非支配解。模擬數(shù)據(jù)和真實(shí)數(shù)據(jù)上的實(shí)驗(yàn)結(jié)果證實(shí)了本文所提出的多目標(biāo)進(jìn)化聚類(lèi)算法對(duì)于遙感影像分類(lèi)問(wèn)題的有效性。
[1] Weng Q.Remote sensing of impervious surfaces in the urban areas:Requirements,methods and trends[J].Remote Sensing of Environment,2012,11(7): 34-49.
[2] Belward A S,Sk?ien J O.Who launched what, when and why; trends in global land-cover observation capacity from civilian earth observation satellites[J].ISPRS Journal of Photogrammetry Remote Sensing,2014(9):58-66.
[3] Chen J,Chen X,Cui X,et al.Change vector analysis in posterior probability space: A new method for land cover change detection[J].IEEE Geoscience and Remote Sensing Letters,2011,8(2):317-321.
[4] Volpi M,Tuia D, Bovolo F,et al.Supervised change detection in VHR images using contextual information and support vector machines[J].International Journal of Applying Earth Observation,2013,20(6):77-85.
[5] Liu Z G,Mercier G,Dezert J,et al.Change detection in heterogeneous remote sensing images based on multidimensional evidential reasoning[J].IEEE Geoscience and Remote Sensing Letters,2014,11(1): 168-172.
[6] Vinukollu R K,Wood E F,Ferguson C R,et al.Global estimates of evapotranspiration for climate studies using multi-sensor remote sensing data: Evaluation of three process-based approaches[J].Remote Sensing of Environment,2011,115(3):801-823.
[7] Bandyopadhyay S,Maulik U,Mukhopadhyay A.Multiobjective genetic clustering for pixel classifcation in remote sensing imagery[J].IEEE Transactions on Geoscience and Remote Sensing,2007,45(5):1506-1511.
[8] Ma A,Zhong Y,Zhang L.Adaptive multiobjective memetic fuzzy clustering algorithm for remote sensing imagery[J].IEEE Transactions on Geoscience and Remote Sensing,2015,53(8):4202-4217.
[9] Paoli A,Melgani F,Pasolli E.Clustering of hyperspectral images based on multiobjective particle swarm optimization[J].IEEE Transactions on Geoscience and Remote Sensing,2009,47(12): 4175-4188.
[10] Krinidis S,Chatzis V.A robust fuzzy local information c-means clustering algorithm[J].IEEE Transactions on Image Processing,2011,19(5):1328-1337.
[11] Cai W,Chen S,Zhang D.Fast and robust fuzzy c-means clustering algorithms incorporating local information for image segmentation[J].Pattern Recognition,2007,40(3): 825-838.
[12] Bezdek J C,Ehrlich R,Full W.FCM: The fuzzy c-means clustering algorithm[J].Computers & Geosciences,1984, 10(2):191-203.
[13] Das S,Abraham A,Konar A.Automatic clutering using an improved differential evolution algorithm[J].IEEE Transactions on Systems, Man and Cybernetics,Part A: Systems and Humans,2008,38(1): 218-237.
[14] Zhong Y,Zhang L.A new fuzzy clustering algorithm based on clonal selection for land cover classifcation[J]. Mathematical Problems in Engineering,2011(11):198-206.
[15] Bandyopadhyay S,Maulik U.Nonparametric genetic clustering: comparison of validity indices[J].IEEE Transactions on Systems, Man and Cybernetics,Part C: Applications and Reviews, 2001,31(1): 120-125.
[16] Zhong Y,Zhang S,Zhang L.Automatic fuzzy clustering based on adaptive multi-objective differential evolution for remote sensing imagery[J].IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing,2013,6(99):1-12.
[17] Deb K,Pratap A,Agarwal S,et al.A fast and elitist multiobjective genetic algorithm:NSGA-II[J].IEEE Transaction. Evolution Computing,2002,6(2):182-197.
[18] Jin B,Hu W,Wang H.Image classifcation based on pLSA fusing spatial relationships between topics[J].IEEE Signal Processing Letters,2012,19(3): 151-154.
[19] Xie X L,Beni G.A validity measure for fuzzy clustering[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,1991,13(8): 841-847.