文/李光麗 王瑋哲 姚樂(lè)樂(lè) 李霖 馬天舒
基于差異性測(cè)度的遙感自適應(yīng)分類器選擇
文/李光麗 王瑋哲 姚樂(lè)樂(lè) 李霖 馬天舒
遙感影像分類在遙感專題信息提取、動(dòng)態(tài)變化監(jiān)測(cè)等應(yīng)用中都發(fā)揮著重要作用?,F(xiàn)階段遙感分類器與分類方法很多,造成了遙感分類結(jié)果的差異性或多樣性,多分類器組合已成為提高遙感分類精度有效的途徑。但并非所有的分類器組合都能提高分類精度,如何選擇合適的分類器組合非常重要。通過(guò)構(gòu)建基于差異性測(cè)度的啟發(fā)式搜索算法,實(shí)現(xiàn)分類器成員的自適應(yīng)選擇,選用AVIRIS數(shù)據(jù)進(jìn)行試驗(yàn),結(jié)果表明,基于差異性測(cè)度的啟發(fā)式搜索有助于選擇分類器組合,從而提高遙感分類精度。
差異性測(cè)度 遙感分類器 精度
遙感影像分類就是對(duì)地球表面及其環(huán)境在遙感圖像上的信息進(jìn)行識(shí)別和分類,從而達(dá)到識(shí)別圖像信息所對(duì)應(yīng)的實(shí)際地物,提取所需地物信息的目的。對(duì)于特定的遙感影像土地覆蓋分類,常用的遙感分類器包括最大似然分類器,最小距離分類器,馬氏距離分類器,平行六面體分類器,支持向量機(jī)分類器和神經(jīng)網(wǎng)絡(luò)分類器等。但是,每一種遙感分類器都有其自身的優(yōu)勢(shì)和局限性,其精度和適用范圍也有一定限度。多分類器系統(tǒng)指的是利用多個(gè)分類器進(jìn)行分類,然后通過(guò)一定的組合機(jī)制把多個(gè)分類器的結(jié)果進(jìn)行融合,達(dá)到對(duì)目標(biāo)進(jìn)行識(shí)別的目的。一個(gè)好的多分類器系統(tǒng)不僅取決于組合規(guī)則,而且取決于分類器成員選擇的好壞。因而希望找到一種方法來(lái)度量多分類器系統(tǒng)中成員分類器之間的關(guān)系,用于預(yù)測(cè)它們之間相互結(jié)合的能力,并且通過(guò)這種預(yù)測(cè)能力對(duì)多分類器系統(tǒng)的設(shè)計(jì)進(jìn)行指導(dǎo),從而提高組合分類器用于遙感影像分類的精度。本文應(yīng)用基于啟發(fā)式搜索的分類器選擇方法,通過(guò)自適應(yīng)的自動(dòng)搜索選擇合適的分類器組合,試驗(yàn)表明,該方法對(duì)于提高遙感分類精度具有一定指導(dǎo)意義。
多分類器組合方式最突出的優(yōu)點(diǎn)是模型可以綜合不同分類器所得到的分類信息,避免單一分類器可能存在的片面性,以達(dá)到更好的分類效果。一般化的組合多分類器模型如圖1所示。
圖1:組合多分類器模型
如果把組合多分類器看作一個(gè)完整系統(tǒng),則它由系統(tǒng)輸入、分類器設(shè)計(jì)、融合機(jī)制和輸出四部分組成。其中分類器的選擇非常重要,并不是所有的分類器進(jìn)行組合就一定能夠提高分類精度,通常情況我們選擇那些差異性較大的分類器構(gòu)成分類器集合,從而使各分類器之間達(dá)到互補(bǔ)的效果,最終提高組合分類精度。其次,我們還要考慮用于組合的分類器的數(shù)量,過(guò)多和過(guò)少都不一定能符合實(shí)際需求。
啟發(fā)式搜索方法在診斷、智能規(guī)劃、自動(dòng)推理等人工智能領(lǐng)域應(yīng)用廣泛。啟發(fā)式算法是指在可接受的運(yùn)算時(shí)間、占用空間等開(kāi)銷的前提下,給出待解決的組合優(yōu)化問(wèn)題的一個(gè)可行解。
啟發(fā)式搜索是在狀態(tài)空間的搜索對(duì)每一個(gè)搜索位置進(jìn)行評(píng)估,得到最好的位置,再?gòu)倪@個(gè)位置進(jìn)行搜索直到目標(biāo)。啟發(fā)式搜索能夠避免盲目搜索的效率低、運(yùn)算時(shí)間和空間耗費(fèi)過(guò)多的缺點(diǎn)。在啟發(fā)式搜索中,對(duì)位置的評(píng)估函數(shù)很重要。采用不同的評(píng)估函數(shù)可以有不同的效果。評(píng)估函數(shù)的一般表達(dá)式為:
f(n)=g(n)+h(n) (1)
其中f(n)是節(jié)點(diǎn)n的評(píng)估函數(shù),g(n)是狀態(tài)空間中初始節(jié)點(diǎn)到n節(jié)點(diǎn)的最短路徑長(zhǎng)度估計(jì),h(n) 是從n到目標(biāo)節(jié)點(diǎn)最佳路徑的估計(jì)代價(jià),體現(xiàn)了搜索的啟發(fā)信息,當(dāng)選擇合適的h(n) 作為啟發(fā)因子時(shí),可以很好的提高搜索效率。
基于差異性測(cè)度的啟發(fā)式搜索算法構(gòu)建多分類器系統(tǒng),步驟如下:
(1)利用劃分不同特征,不同的樣本集輸入各分類器;
(2)選用合適的差異性測(cè)度方法作為啟發(fā)式搜索的結(jié)點(diǎn);
圖2:AVIRIS影像假彩色合成圖像
(a)集合{2,5,6,11,12}
圖3:AVIRIS影像多分類器組合分類圖
(3)選擇合適的分類器組合策略進(jìn)行多分類器組合;
(4)通過(guò)啟發(fā)式搜索選出最優(yōu)成員分類器集合,組合后評(píng)定精度。
本文中的啟發(fā)式搜索是基于DF差異性測(cè)度的,分類器組合策略為加權(quán)投票法。首先通過(guò)ENVI4.5和Weka3.6.1軟件進(jìn)行單分類器分類,然后在IDL中實(shí)現(xiàn)基于DF的啟發(fā)式搜索。
本文使用AVIRIS數(shù)據(jù),該數(shù)據(jù)于1992年6月12日由NASA飛機(jī)獲得的,該景影像包括拉斐特西部6英里的范圍。該數(shù)據(jù)為經(jīng)過(guò)定標(biāo)的數(shù)據(jù),首先要將數(shù)據(jù)值轉(zhuǎn)換為輻射值。去掉4個(gè)壞波段后為220個(gè)波段。圖2為波段58,15,6假彩色合成圖像。
根據(jù)當(dāng)?shù)氐牡匚锾攸c(diǎn),將該區(qū)域的土地覆蓋類型劃分為:紫花苜蓿、玉米、草、干草、燕麥、大豆、麥子、樹(shù)林、建筑物-草-樹(shù)-車道、石頭-鋼鐵-塔。選擇樣本共10410個(gè)像元,通過(guò)選擇訓(xùn)練樣本進(jìn)行監(jiān)督分類,選用的分類器有:SVM(1)、MLC(2)、Mahal-dist(3)、Min-dist(4)、j48 DT(5)、BPNN(6)、naive bayes(7)、RBFNN(8)、SAM(9)、SID(10)、Random tree(11)、BF tree(12),括號(hào)內(nèi)為分類器序號(hào)。
通過(guò)基于差異性的啟發(fā)式搜索算法選擇最優(yōu)分類器集合,采用的差異性測(cè)度方法為DF,組合方法為加權(quán)投票法,最終選擇的集合為{2,5,6,11,12},組合后分類精度為96%。本試驗(yàn)中搜索部分耗時(shí)10.36。同時(shí),我們將所有其他可能的組合進(jìn)行一一驗(yàn)證,發(fā)現(xiàn)基于差異性的啟發(fā)式搜索算法提供了一組最優(yōu)解。如果不進(jìn)行分類器選擇,將12個(gè)分類器進(jìn)行組合,其精度為90.7%。圖3為兩種組合方法分類結(jié)果圖比較。
本文通過(guò)應(yīng)用啟發(fā)式搜索算法,基于AVIRIS數(shù)據(jù)試驗(yàn),表明啟發(fā)式搜索算法,對(duì)于分類器選擇具有一定指導(dǎo)意義;同時(shí)研究發(fā)現(xiàn),并非用于組合的分類器數(shù)據(jù)越多,分類精度越高。但是本文未考慮但分類器本身的缺陷或能力,分類器組合精度是成員分類器精度和差異性的折中,在實(shí)際分類器選擇過(guò)程中需要綜合考慮二者,但是差異性與精度的組合方式,以及二者的重要程度如何確定需要后續(xù)繼續(xù)研究。
[1]王鵬.基于多樣性度量的多分類器融合研究[D].鎮(zhèn)江:江蘇大學(xué),2007.
[2]Kang HJ,Doermann D.Selection of classifiers for the construction of multiple classifier Systems[C].// Proceedings of the Eight International Conference on Document Analysis and Recognition. Seoul, Korea:IEEE Computer Society,2005:1194-1198.
[3]邢文訓(xùn),謝金星.現(xiàn)代優(yōu)化計(jì)算方法[M].北京:清華大學(xué)出版社, 2005.
[4]王建樹(shù).啟發(fā)式算法在服務(wù)組合中的研究與實(shí)現(xiàn)[D].長(zhǎng)春:吉林大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,2009.
[5]Giacinto G,Roli F.Design of effective neural network ensembles for image classification processes[J]. Image Vision and Computing Journal,2001,19,699-707.
作者單位 航天恒星科技有限公司 北京市 100000
李光麗(1984-),女,山西省陽(yáng)泉市人。碩士學(xué)位?,F(xiàn)為航天恒星科技有限公司系統(tǒng)設(shè)計(jì)師。主要研究方向?yàn)檫b感圖像處理及相關(guān)應(yīng)用。