李志敏,郝盼超,黃 鴻,黃 文
?
半監(jiān)督復(fù)合核圖聚類在高光譜圖像中的應(yīng)用
李志敏,郝盼超,黃 鴻,黃 文
( 重慶大學(xué)光電技術(shù)與系統(tǒng)教育部重點實驗室,重慶 400030 )
針對圖的半監(jiān)督聚類算法(Semi-Supervised Graph-Based Clustering, SSGC)中出現(xiàn)的對先驗信息利用不充分、不足以應(yīng)對數(shù)據(jù)異構(gòu)、計算耗時大等問題,本文提出一種基于半監(jiān)督復(fù)合核的圖聚類算法,并應(yīng)用于高光譜圖像。該算法首先通過引入半監(jiān)督學(xué)習(xí)方法對徑向基函數(shù)(Radial Basis Function, RBF)進(jìn)行了改進(jìn),以充分利用少量的標(biāo)記樣本和無標(biāo)記樣本;其次將RBF核與光譜角核進(jìn)行融合,構(gòu)造復(fù)合核權(quán)重矩陣。在權(quán)重矩陣的構(gòu)造過程中,K-近鄰方法的引入也簡化了計算過程。在Indian Pine和Botswana高光譜數(shù)據(jù)集上的實驗結(jié)果表明,相對于SSGC算法,本文算法不僅實現(xiàn)了更高的分類正確率,其總體分類精度提升1%~4%,而且有效提升了運算速度。
高光譜遙感圖像;聚類;半監(jiān)督學(xué)習(xí);復(fù)合核
0 引 言
高光譜遙感圖像包含了豐富的空間和光譜信息,具有很高的分辨力,已應(yīng)用到科學(xué)研究的各個領(lǐng)域,特別是國防等涉及國家安全方面[1]。然而,面對高光譜的海量數(shù)據(jù),如何將高光譜圖像的各種特征結(jié)合,研究快速、高效的目標(biāo)識別算法是目前和未來一段時間內(nèi)的一個重點。
聚類分析是數(shù)據(jù)挖掘及機(jī)器學(xué)習(xí)領(lǐng)域內(nèi)的重點問題之一,在數(shù)據(jù)挖掘、模式識別、決策支持、機(jī)器學(xué)習(xí)及圖像分割等領(lǐng)域有廣泛的應(yīng)用。聚類是一個將數(shù)據(jù)分類到不同的類或者簇的過程,屬于同一個簇的樣本或者數(shù)據(jù)的特性具有很大的相似性,屬于不同簇的樣本數(shù)據(jù)有較大的不同點,聚類的這一特性可在高光譜圖像處理中發(fā)揮重要的作用[2]。
在聚類領(lǐng)域中,傳統(tǒng)的方法分為無監(jiān)督聚類和監(jiān)督聚類兩種。前者不需要有標(biāo)記的數(shù)據(jù),但限制了算法性能的提高;監(jiān)督聚類需要大量的有標(biāo)簽樣本的數(shù)據(jù)作為訓(xùn)練集,而有標(biāo)記數(shù)據(jù)的獲取卻是比較困難且昂貴的。由于監(jiān)督聚類和非監(jiān)督聚類的局限性,半監(jiān)督聚類成為一個新興的研究熱點。半監(jiān)督聚類結(jié)合了非監(jiān)督聚類和監(jiān)督聚類的優(yōu)點,充分利用數(shù)據(jù)的類別信息和內(nèi)部結(jié)構(gòu)信息,能夠得到比較好的結(jié)果[3]。冷明偉[4]提出一種基于極少量標(biāo)簽數(shù)據(jù)的半監(jiān)督K-均值聚類算法,它首先利用標(biāo)簽數(shù)據(jù)集選取初始點,對給定的數(shù)據(jù)集進(jìn)行聚類,然后基于影響因子和約束進(jìn)行聚類結(jié)果的合并,該方法在標(biāo)記樣本較少時仍能實現(xiàn)較高的聚類精度。陳小冬等[5]提出一種基于判別分析的聚類算法,迭代執(zhí)行降維和聚類,其不僅能很好地處理高維數(shù)據(jù),還有效地提高了聚類性能。
Camps-Valls[6]等提出一種基于圖的半監(jiān)督聚類算法(Semi-Supervised Graph-Based Clustering, SSGC),將流形學(xué)習(xí)算法應(yīng)用于圖結(jié)構(gòu)的設(shè)計中,能很好的挖掘高光譜遙感數(shù)據(jù)的非線性特性[7],取得了較好的分類效果。SSGC算法相對于支持向量機(jī)(Support Vector Machine, SVM)算法表現(xiàn)出較好的魯棒性和穩(wěn)定性,且當(dāng)標(biāo)記樣本數(shù)較少時,優(yōu)勢更加明顯,這說明該方法在不適定情況下分類的有效性。通過將該方法在高光譜數(shù)據(jù)上運行,發(fā)現(xiàn)此算法能產(chǎn)生較高的分類正確率,但仍有提升空間;然而其耗時巨大,雖然原作者使用Nystr?m方法[8]以提升計算速度,但這種方法又引進(jìn)了兩個需要調(diào)節(jié)的參數(shù)——用于計算核矩陣近似分解的樣本數(shù)和最大本征值的數(shù)量。
鑒于SSGC算法的不足,本文在此算法上進(jìn)行一定的改進(jìn),首先通過引入半監(jiān)督學(xué)習(xí)方法對RBF核函數(shù)進(jìn)行了改進(jìn),更好地利用了樣本的先驗信息和背景知識;同時又融合光譜角核函數(shù),最終提出一種半監(jiān)督復(fù)合核圖聚類算法(Semi-Supervised Graph Clustering with Composite Kernel, SSGCK ),可以提高聚類正確率,而且有效提升運算速度。
1 相關(guān)工作
1.1 半監(jiān)督聚類
聚類是將不同的樣本數(shù)據(jù)按照其本身的特性劃分到各個不同的類或者簇的過程,它能夠很好地反映樣本的分布特點,揭示數(shù)據(jù)結(jié)構(gòu)特征,并表現(xiàn)出一定的優(yōu)勢。較為經(jīng)典和著名的聚類算法有:K-均值(K-means)算法[9-10],一種將樣本以隸屬度為1或0的方式劃分至某一類中的硬劃分聚類算法,已被廣泛使用;模糊C-均值(Fuzzy C-Means,F(xiàn)CM)算法[11-12],Bezdek將模糊因子引入了K-均值算法,提出了FCM算法。
半監(jiān)督聚類[13]利用少部分標(biāo)記的數(shù)據(jù)輔助非監(jiān)督的學(xué)習(xí)。目前,半監(jiān)督的聚類方法大致分為以下兩類:
1) 基于限制的方法。該類算法在聚類過程中,利用標(biāo)簽的數(shù)據(jù)來引導(dǎo)聚類過程,最終得到一個恰當(dāng)?shù)姆指罱Y(jié)果。通過分析給定的標(biāo)記信息和其它相關(guān)的約束條件,得到更多控制聚類過程的信息,減少聚類搜索的次數(shù)或者盲目性,在得到更好聚類效果的同時能適當(dāng)減少聚類的時間。
2) 基于距離測度函數(shù)學(xué)習(xí)的方法。聚類算法必須基于某一距離測度函數(shù)進(jìn)行聚類,在該方法中所使用的距離測度函數(shù)是通過對標(biāo)簽數(shù)據(jù)學(xué)習(xí)得到的。
1.2 SSGC算法
SSGC算法是一種基于圖的半監(jiān)督聚類算法?;趫D的半監(jiān)督聚類算法核心思想在于:構(gòu)造一個圖模型(,),圖中數(shù)據(jù)點作為頂點,數(shù)據(jù)的相似性作為邊權(quán)值。其中數(shù)據(jù)節(jié)點包含了少量有標(biāo)記的數(shù)據(jù)和大量無標(biāo)記的數(shù)據(jù),邊權(quán)值反映了數(shù)據(jù)點之間的相似程度,權(quán)值越大表示數(shù)據(jù)點越相似,反之越不相似。SSGC算法的具體實現(xiàn)為:
假設(shè)存在個維數(shù)據(jù)空間的數(shù)據(jù)組成的數(shù)據(jù)集={1,2, …,,+1, …,}ì以及其對應(yīng)的標(biāo)簽集{1, 2, 3, …,},其中前個數(shù)據(jù)點被標(biāo)記為?,其余數(shù)據(jù)為未標(biāo)記數(shù)據(jù),目標(biāo)算法就是找到這個數(shù)據(jù)點所屬的類別。定義一個的矩陣,若數(shù)據(jù)中第個點被標(biāo)記為=j?,則=1,否則=0;在計算之前,首先引入標(biāo)記樣本信息,即仿照定義的方式定義一個×的矩陣,將數(shù)據(jù)集中已知類別的標(biāo)記信息代入中。
SSGC算法的重點是構(gòu)造近鄰矩陣,其使用的是RBF核函數(shù):
式中令=0以避免自相似。
2 半監(jiān)督復(fù)合核圖聚類算法
SSGC算法在構(gòu)造近鄰矩陣時,必須求出每個點相對于其他所有點的權(quán)重值,這是一個繁瑣而又冗余的操作,而且SSGC算法在此過程沒有應(yīng)用標(biāo)記樣本信息;另外,SSGC算法采用單個核函數(shù)構(gòu)成的核機(jī)器并不能應(yīng)對諸如數(shù)據(jù)異構(gòu)或不規(guī)則、樣本規(guī)模巨大、樣本不平坦分布等實際問題。
本文提出的SSGCK算法在構(gòu)造權(quán)重矩陣時,先對RBF核函數(shù)進(jìn)行一定的改進(jìn),精簡算法步驟,減少計算量,同時加入標(biāo)記信息,增加同類點權(quán)重,構(gòu)造出第一個權(quán)重矩陣;然后又利用光譜角信息,構(gòu)造了一個基于光譜角核函數(shù)的權(quán)重矩陣,最后將兩個權(quán)重矩陣融合,構(gòu)造復(fù)合核函數(shù)權(quán)重矩陣。最后研究基于此復(fù)合核權(quán)重矩陣的聚類,得到了很好地實驗效果。
復(fù)合核函數(shù)的本質(zhì)就是將個核函數(shù)組合起來,事實上任一函數(shù)只要滿足Mercer條件[14-15],就可以看作是一種核函數(shù)。假設(shè)一組基核函數(shù),則總函數(shù)定義如下:
多核函數(shù)利用不同類型的核函數(shù)之間的優(yōu)勢互補(bǔ),可以達(dá)到更好的效果。本文構(gòu)造復(fù)合核權(quán)重矩陣的過程可分為以下流程:
1) RBF核函數(shù)改造
本文繼續(xù)選用經(jīng)典而常用的RBF核函數(shù),不僅考慮到其良好的非線性映射性能,可以處理非線性可分情況,還因為該核函數(shù)也是歐氏距離的一種表示,體現(xiàn)了樣本在特征空間里光譜亮度差異。
本文在RBF核函數(shù)的基礎(chǔ)上進(jìn)行一定的改進(jìn),得到了一種組合核函數(shù)。其具體實現(xiàn)為:
①采用近鄰法構(gòu)建有標(biāo)記樣本和無標(biāo)記樣本的近鄰關(guān)系圖。若與為近鄰,則在近鄰關(guān)系矩陣中有邊連接,否則無邊連接;
②設(shè)置近鄰關(guān)系矩陣中邊的權(quán)值矩陣=[],表達(dá)式如下:
2) 構(gòu)造光譜角核函數(shù)權(quán)重矩陣
光譜角(SAM)是以運算影像像元的光譜與樣本參考光譜之間的夾角來區(qū)分類別。其原理是把像元的光譜(多個波段的像素值)作為矢量投影到維空間上,各光譜曲線被看作有方向且有長度的矢量,而光譜之間形成的夾角叫光譜角,光譜角分類法是依據(jù)光譜角的大小來進(jìn)行分類的,而沒有考慮光譜矢量的長度( 影像的亮度)。光譜角的數(shù)學(xué)表達(dá)式為
其中:θ為影像像元光譜與參考光譜之間的夾角,為影像像元光譜曲線矢量,為參考光譜曲線矢量。光譜角以很小的弧度角θ來表示,它代表了光譜曲線之間大部分的光譜相似性。
本文構(gòu)造光譜角核函數(shù)權(quán)重矩陣的方法為
①計算兩兩樣本點之間的光譜角θ,具體方法參照式(7),得到一個光譜角信息的矩陣;
②設(shè)置近鄰關(guān)系矩陣中邊的權(quán)值矩陣=[],表達(dá)式如下:
3) 構(gòu)造復(fù)合核權(quán)重矩陣
至此,已得出本算法所用的兩個基核分別構(gòu)造的近鄰矩陣:RBF核近鄰矩陣和光譜角核近鄰矩陣,將和加權(quán)構(gòu)造復(fù)合核近鄰矩陣,在此復(fù)合權(quán)重矩陣的基礎(chǔ)上進(jìn)行聚類:
3 實驗與分析
3.1 實驗設(shè)置
在實驗中,選用兩個高光譜遙感數(shù)據(jù)集,即Indian Pine和Botswana數(shù)據(jù)集,每類地物中分別隨機(jī)標(biāo)記5,10,... 50,55個點,每次實驗重復(fù)運行10次,最終取分類精度的平均值。為盡可能減小環(huán)境因素對實驗結(jié)果的影響,每次實驗均將多種方法在同一數(shù)據(jù)集選取的相同樣本點上依次進(jìn)行。實驗中對比的算法有K-means算法,F(xiàn)CM算法,SSGC算法(其參數(shù)設(shè)置為:式(1)中的RBF核寬度置為0.01,式(3)中用到的置為0.99)。最后,本文提出的SSGCK算法參數(shù)設(shè)置為:近鄰點數(shù)設(shè)置為5。
由于本方法中用到了兩個權(quán)重矩陣,兩者的權(quán)重分配可能會影響分類正確率。本文通過調(diào)整子核函數(shù)權(quán)值,得到與分類正確率的關(guān)系圖,如圖1所示。
圖 1 RBF 核權(quán)值系數(shù)?對SSGCK 算法分類正確率的影響
由圖1可以看出,改變系數(shù)會對實驗結(jié)果產(chǎn)生一定的影響,且為0.8~0.9時,分類效果最為理想。本文所用算法中將值設(shè)定為0.85。
3.2 Indian Pine 數(shù)據(jù)集
為了驗證本文算法的有效性,在仿真數(shù)據(jù)中首先采用目前國內(nèi)外廣泛采用的印第安納(Indian Pine)高光譜遙感數(shù)據(jù)集進(jìn)行測試實驗,其假彩色圖像如圖2所示。該數(shù)據(jù)集的大小為145×145,共有220個波段以及17類已知地物類別。去除水汽吸收明顯和低信噪比波段后,剩余200個波段用于實驗,并從數(shù)據(jù)點較多的地物類別中隨機(jī)選擇6類進(jìn)行實驗。
圖2 印第安納高光譜遙感影像
圖3顯示了不同方法在印第安納數(shù)據(jù)集上分類結(jié)果,其中圖3(a)為幾種方法分類正確率與標(biāo)記點數(shù)的關(guān)系,為了對比單核算法與復(fù)合核算法的效果,實驗中也加入了SSGCK(=0)與SSGCK(=1)兩種單核算法;圖3(b)是幾種方法運行時間對比。
由圖3(a)可以看出,增加標(biāo)記點數(shù),SSGC和SSGCK方法分類正確率都穩(wěn)步提升,且SSGCK方法正確率一直高于SSGC方法。同時復(fù)合核的SSGCK算法正確率優(yōu)于單純的RBF核算法(對應(yīng)于圖3中SSGCK(=1))和光譜角核算法(對應(yīng)圖3中SSGCK(=0))。較之于傳統(tǒng)的FCM聚類算法、K-means算法,SSGCK算法正確率有大幅提升。
由圖3(b)中數(shù)據(jù)可以看出,本文提出的SSGCK算法在運行時間上處于中等水平,相對于傳統(tǒng)方法沒有優(yōu)勢,但相對于原來的SSGC方法,時間大大縮短,改善效果顯著。
圖3 不同方法在印第安納數(shù)據(jù)集上分類結(jié)果(a) 不同方法的整體分類精度;(b) 不同方法的運行時間
(a) The overall classification accuracy of different algorithms; (b) Running time of different algorithms.
圖4是使用四種方法對印第安納影像進(jìn)行分類的結(jié)果。
圖4 不同方法在印第安納數(shù)據(jù)集上分類結(jié)果對應(yīng)的假彩色圖
以上實驗結(jié)果顯示,K-means,F(xiàn)CM算法分類結(jié)果較差,較多地物被誤分,主要原因是這兩種算法忽略了數(shù)據(jù)的全局結(jié)構(gòu),損失了較多信息?;赗BF核的SSGC算法在精度上優(yōu)于K-means和FCM算法。而本文提出的半監(jiān)督復(fù)合核圖聚類算法將RBF核與光譜角核融合,取得的效果明顯優(yōu)于基于單一RBF核聚類方法,這是多核相對于單核的優(yōu)勢,單個核函數(shù)構(gòu)成的核機(jī)器并不能應(yīng)對諸如數(shù)據(jù)異構(gòu)或不規(guī)則、樣本規(guī)模巨大、樣本不平坦分布等實際問題,而多核分類卻能應(yīng)對自如。
3.3 Botswana數(shù)據(jù)集
Botswana高光譜遙感影像數(shù)據(jù)集于2001年5月31日由美國宇航局通過EO-1衛(wèi)星上高光譜傳感器獲得,該影像由1 476′256個像素組成,包括波長為400 nm~2 500 nm共有242個波段,空間分辨力達(dá)到30 m,光譜分辨力達(dá)到10 nm,覆蓋了博茨瓦納奧卡萬戈三角洲地區(qū)長7.7 km的帶狀地帶,去除受大氣吸收和噪聲影響的波段,將剩下的145個(10~55,82~97,102~119,134~164,187~220)波段用于實驗研究。圖5為Botswana高光譜遙感影像的假彩色圖及其真實地物分布情況。
圖5 Botswana 高光譜遙感影像
圖6(a)顯示實驗中所用4種方法在Botswana數(shù)據(jù)集上分類正確率與標(biāo)記點數(shù)的關(guān)系,圖6(b)顯示在此數(shù)據(jù)集上不同方法運算時間對比。
由圖6(a)可見,增加標(biāo)記點數(shù),半監(jiān)督算法的準(zhǔn)確率均逐步提升,顯示了半監(jiān)督方法對于先驗知識的利用效果。同時SSGC算法與SSGCK算法準(zhǔn)確率遙遙領(lǐng)先于傳統(tǒng)算法,因為二者都用到了RBF核函數(shù),RBF核能夠進(jìn)行非線性變換,將樣本在一個維度更高的特征子空間中處理,足以應(yīng)對復(fù)雜數(shù)據(jù)。而本文提出的SSGCK算法正確率一直優(yōu)于SSGC算法,可提升1%~4%,能更好地應(yīng)對數(shù)據(jù)異構(gòu)等問題。
圖6(b)中,SSGCK算法相對于SSGC算法,實驗運行時間大大縮短。原因是本文對RBF核函數(shù)進(jìn)行了改造,刪除了不必要的計算環(huán)節(jié),而這些環(huán)節(jié)也是非常耗時的。
圖6 不同方法在Botswana 遙感影像上分類結(jié)果
(a) 不同算法的整體分類精度;(b) 不同方法的運行時間
Fig.6 Botswana hyperspectral data classification results by different methods
(a) The overall classification accuracy of different algorithms;(b) Running time of different algorithms
4 結(jié) 語
本文提出了一種半監(jiān)督復(fù)合核圖聚類算法,該方法在構(gòu)造近鄰矩陣時,使用本文構(gòu)造的組合核函數(shù),取代原有的RBF核函數(shù),實現(xiàn)對先驗信息的高效利用;同時為突破單核函數(shù)的局限,本文又結(jié)合光譜角核函數(shù),構(gòu)造出復(fù)合核權(quán)重矩陣;最后又將K近鄰方法引入近鄰矩陣的構(gòu)造過程,在沒有引入Nystr?m方法的情況下大大提升了運算速度。實驗結(jié)果驗證了本文算法的有效性:在Indian Pine和Botswana數(shù)據(jù)集上分類結(jié)果顯示,相對于傳統(tǒng)K-means,F(xiàn)CM算法,準(zhǔn)確率提升10%~20%,相對于SSGC算法,可以提升1%~4%;且相對于SSGC算法,分類時間下降顯著。
在實驗中還有一些方面值得研究,比如本文中用到的參數(shù)是單核聚類情況下的最優(yōu)值,其在復(fù)合核函數(shù)中可能不是最優(yōu)的,故參數(shù)優(yōu)化問題仍有研究價值。
[1] 李吉明,賈森,彭艷斌. 基于光譜特征和紋理特征協(xié)同學(xué)習(xí)的高光譜圖像數(shù)據(jù)分類 [J]. 光電工程,2012,39(11):88-94.
LI Jiming,JIA Sen,PENG Yanbin. Hyperspectral data classification with spectral and texture features by co-training algorithm [J]. Opto-Electronic Engineering,2012,39(11):88-94.
[2] 趙春暉,齊濱. 基于模糊核加權(quán)C-均值聚類的高光譜圖像分類 [J]. 儀器儀表學(xué)報,2012,33(9):2016-2021.
ZHAO Chunhui,QI Bin. Hyperspectral image classification based on fuzzy kernel weighted c-means clustering [J]. Chinese Journal of Scientific Instrument,2012,33(9):2016-2021.
[3] 李巧蘭. 基于約束的半監(jiān)督聚類的圖像分割算法研究 [D]. 西安:西安電子科技大學(xué),2014:1-2.
LI Qiaolan. Semi-supervised clustering based on constraints for image segmentation [D]. Xi¢an:Xidian University,2014:1-2.
[4] 冷明偉. 主動半監(jiān)督聚類及其在社團(tuán)檢測中的應(yīng)用研究 [D]. 蘭州:蘭州大學(xué),2014:14-23.
LENG Mingwei. Research of active semi-supervised clustering and its application in community detection [D]. Lanzhou:Lanzhou University,2014:14-23.
[5] 陳小冬,尹學(xué)松,林煥祥. 基于判別分析的半監(jiān)督聚類方法 [J]. 計算機(jī)工程與應(yīng)用,2010,46(6):139-143.
CHEN Xiaodong,YIN Xuesong,LIN Huanxiang. Semi-supervised clustering approach with discriminant analysis [J]. Computer Engineering and Applications,2010,46(6):139-143.
[6] Camps-Valls Gustavo,Marsheva Tatyana V. Bandos,ZHOU Dengyong. Semi-supervised graph-based hyperspectral image classification [J]. IEEE Transactions on Geoscience and Remote Sensing(S0196-2892),2007,45(10):3044-3054.
[7] 李亞娥. 基于圖的半監(jiān)督分類算法研究 [D]. 西安:陜西師范大學(xué),2012:15-18.
LI Ya¢e. Research on graph-based semi-supervised classification algorithm [D]. Xi'an:Shanxi Normal University,2012:15-18.
[8] Papadopoulos Dimitris F,Simos Theodore E.A modified runge-kutta-nystr?m method by using phase lag properties for the numerical solution of orbital problems [J]. Applied Mathematics & Information Sciences(S1935-0090),2013,7(2):433-437.
[9] 謝娟英,郭文娟,謝維信,等. 基于樣本空間分布密度的初始聚類中心優(yōu)化K-均值算法 [J]. 計算機(jī)應(yīng)用研究,2012,29(3):888-892.
XIE Juanying,GUO Wenjuan,XIE Weixin,. K-means clustering algorithm based on optimal initial centers related to pattern distribution of samples in space [J]. Applications Research of Computers,2012,29(3):888-892.
[10] 王峰,籍錦程,聶百勝. K-均值聚類模糊邏輯數(shù)據(jù)融合改進(jìn)算法研究 [J]. 中北大學(xué)學(xué)報:自然科學(xué)版,2014,35(6):699-703.
WANG Feng,JI Jincheng,NIE Baisheng. An improved fusion method of fuzzy logic based on k-mean clustering [J]. Journal of North University of China:Natural Science Edition,2014,35(6):699-703.
[11] 張慧哲,王堅. 基于初始聚類中心選取的改進(jìn)FCM聚類算法 [J]. 計算機(jī)科學(xué),2009,36(6):206-209.
ZHANG Huizhe,WANG Jian. Improved fuzzy c-means clustering algorithm based on selecting initial clustering centers [J]. Computer Science,2009,36(6):206-209.
[12] Kannan S R,Ramathilagam S. Effective fuzzy c-means clustering algorithms for data clustering problems [J]. Expert Systems with Applications(S0957-4174),2012,39(7):6292–6300.
[13] ZHAO Weizhong,HE Qing,MA Huifang. Effective semi-supervised document clustering via active learning with instance-level constraints [J]. Knowledge & Information Systems(S0219-1377),2012,30(3):569-587.
[14] Ozer Sedat,CHEN Chi H. A set of new chebyshev kernel function for support vector machine pattern classification [J]. Pattern Recognition(S0031-3203),2011,44(7):1435-1447.
[15] ZHANG Rui,WANG Wenjian. Facilitating the application of support vector machine by using a new kernel [J]. Export Systems with Applications(S0957-4174),2011,38(11):14225-14230.
Semi-supervised Graph Clustering with Composite Kernel and Its Application in Hyperspectral Image
LI Zhimin,HAO Panchao,HUANG Hong,HUANG Wen
( Key Laboratory of Optoelectronic Technology and Systems of the Education Ministry of China, Chongqing University, Chongqing 400030, China )
A semi-supervised graph-based clustering method is presented with composite kernel for the hyperspectral images, mainly to solve the problems existed in an algorithm called Semi-Supervised Graph-Based Clustering (SSGC) and improve its performance. As for the realization, it firstly reforms the Radial Basis Function (RBF) by adopting semi-supervised approach, to exploit the wealth of unlabeled samples in the image. Then, it incorporates the spectral angle kernel with RBF kernel, and constructs a composite kernel. At last, the use of K-Nearest Neighbor (NN) method while constructing the weight matrix has greatly simplified the calculation. Experimental result in Indian Pine and Botswana hyperspectral data demonstrates that this algorithm can not only get higher classification accuracy (1%~4% higher than SSGC, 10%~20% higher than K-means and Fuzzy C-Means (FCM), but effectively improve operation speed compared with SSGC.
hyperspectral remote sensing image; clustering; semi-supervised learning; composite kernel
TP391;TP751
A
10.3969/j.issn.1003-501X.2016.04.006
2015-05-31;
2015-08-25
國家自然科學(xué)基金(61101168);重慶市基礎(chǔ)與前沿研究計劃(cstc2013jcyjA40005)
李志敏(1955-),男(漢族),重慶人。副教授,碩士生導(dǎo)師,主要研究方向為數(shù)字圖像處理、計算機(jī)網(wǎng)絡(luò)、嵌入式系統(tǒng)。
E-mail: lzm@cqu.edu.cn。