盧紅洋+魏仲民
摘 要:文章提出一種基于多特征的高光譜遙感影像主動學習方法,從遙感影像中提取形態(tài)學特征,灰度共生紋理和小波紋理描述遙感影像上的空間信息,將獲得的多種空間特征與光譜特征相疊加進行主動學習,結(jié)合MCLU準則選擇最具信息量的樣本進行標記,通過計算機和專家的不斷交互,獲得可靠的分類結(jié)果。在公共數(shù)據(jù)集Pavia University影像上的實驗結(jié)果表明,文章提出的基于多特征的主動學習方法能夠獲得比基于光譜的主動學習方法和結(jié)合單一空間特征的主動學習方法更好的分類結(jié)果。
關(guān)鍵詞:主動學習;多特征;高光譜;遙感;影像分類
中圖分類號:O433 文獻標志碼:A 文章編號:2095-2945(2017)33-0077-03
引言
隨著機器學習的不斷發(fā)展,主動學習的策略被用于解決高光譜遙感影像分類中的訓練樣本獲取問題。眾多研究者針對高光譜遙感影像主動學習展開了研究。根據(jù)樣本信息量評定標準的差異,當前主流的主動學習算法可以分為以下幾類:(1)基于委員會的算法:該算法基于多個分類器結(jié)果的共同決策,選擇在多個分類器中預測標記分歧最大的樣本進行標記并加入訓練樣本集。(2)基于邊界最大化的算法:基于邊界最大化的方式是基于支持向量機(SVM)模型而提出的,它考慮了樣本在高維特征空間中與分類超平面的空間位置關(guān)系,認為在特征空間中最靠近超平面的點信息量最大。(3)基于后驗概率的算法:此類方法使用樣本屬于各個類別的后驗概率來衡量樣本的信息量。若一個樣本屬于兩個最可能的類別的概率差異很小,則該樣本具有較大的信息量。然而,以上方法往往從單個像素自身的光譜特性出發(fā),忽略了遙感影像上像素間的聯(lián)系,對遙感影像的空間信息利用不足。
近年來,光譜-空間聯(lián)合分類方法在遙感影像解譯中受到極大的關(guān)注。大量的研究表明,遙感影像空間信息豐富,利用影像的空間特征,能夠有效地增強高光譜遙感影像的分類精度。因此,文章提出了一種基于多特征的高光譜遙感影像主動學習方法。本研究立足于遙感影像地物分布特點,從高光譜影像中獲取多種空間特征,增強不同類別的光譜可分性,從而提升主動學習的性能。該方法旨在利用多種空間特征的互補信息,克服單一空間特征表達能力不足的問題,利用少量的標記樣本獲得較好的分類結(jié)果。為了驗證提出方法的有效性,文章采用了公用的高光譜遙感影像進行測試,同時,對比了僅考慮光譜的主動學習方法和結(jié)合單一空間特征的主動學習方法。
1 方法描述
文章提出了一種基于多特征的高光譜遙感影像主動學習方法,該方法主要包括兩個部分:多特征提取和主動學習。多特征提取的目的在于從影像中提取多種特征對地物空間分布進行描述,從而便于不同類別地物的區(qū)分。另一方面,主動學習立足于提取到的空間特征和影像的光譜屬性,選擇最具信息量的樣本進行標記。
1.1 多特征提取
(1)形態(tài)學特征
形態(tài)學是基于數(shù)學形態(tài)學提出的用于提取目標結(jié)構(gòu)形態(tài)特征的算法。該方法立足于地物在遙感影像上所呈現(xiàn)的多尺度性,使用形態(tài)學開重構(gòu)和閉重構(gòu),采取一系列不同大小的形態(tài)學算子對獲取地物特征,獲取多個的形態(tài)學輪廓特征全面描述目標的空間結(jié)構(gòu)信息。使用具有不同大小的形態(tài)學算子對基影像進行開重構(gòu)和閉重構(gòu),可以獲得形態(tài)學輪廓。在形態(tài)學輪廓的基礎(chǔ)上,計算結(jié)構(gòu)算子大小變化而引起的灰度變化,獲得差分形態(tài)學特征,用于表示地物在不同尺度下的響應:
(1)
其中,MP和MP分別代表在形態(tài)算子為λ時,所獲得的形態(tài)學開運算和閉運算的結(jié)果。
(2)灰度共生紋理
灰度共生紋理是基于灰度共生矩陣獲取的地物紋理信息。將原始影像映射至特定灰度級,并統(tǒng)計在固定大小窗口中特定方向上的像素間的灰度共生關(guān)系,構(gòu)建灰度共生矩陣表示影像局部的地物分布規(guī)律。影像中不同地物的空間分布往往會對應著不同的灰度共生矩陣,可以使用基于灰度共生矩陣的統(tǒng)計測度表示不同地物的紋理和結(jié)構(gòu)特性。在本研究中,采用對比度和同質(zhì)性作為統(tǒng)計測度來描述影像的紋理特性。對比度表示相鄰像素的灰度差異,同質(zhì)性代表局部區(qū)域的灰度變化,計算方式如下:
(2)
其中,g(i,j)代表灰度級為i和j的共生像素出現(xiàn)的頻率,Ng代表影像灰度級。
(3)小波紋理
小波紋理可以視為將高光譜影像小波分解后所得到的結(jié)果。該方法將原始影像視為一個立體塊,并將其分解為{LxLyLz,LxHyLz,LxLyHz,LxHyHz,HxLyLz,HxHyLz,HxLyHz,HxHyHz}共8個子成分,其中L和H分別代表低通子成分和高通子成分,x和y表示的是影像的空間坐標,而z表示的是光譜維。本研究使用影像小波分解后獲得的低通子成分和高通子成分作為影像的小波紋理,具體的分解方式如下:
(3)
1.2 主動學習
主動學習旨在利用少量的最具信息量的樣本,獲取可靠的分類結(jié)果,從而降低樣本標記所需的代價。其基礎(chǔ)理論在于,利用少量精心選擇的樣本生成的分類器的解譯能力并不弱于大量隨機選擇的樣本生成的分類器,從而能夠減少需要標記的樣本數(shù)量,降低標記過程的消耗。主動學習通過計算機的計算能力,從候選樣本集中選擇最具信息量的樣本并交于專家進行標記,將標記后的樣本加入訓練集重新構(gòu)建分類器,通過計算機和專家的不斷交互,不斷擴充分類樣本集從而提升分類模型的準確性和魯棒性。假設存在僅包含n個標記樣本的訓練集T={Xi,yi},其中,Xi為樣本的特征向量,而yi={1,2,...,K}為樣本Xi的標記。此外,存在包含m個未標記樣本的候選集U={Xi}代表未標記樣本集,并且候選樣本集中的樣本數(shù)量遠遠多于標記樣本集中的樣本數(shù)量。主動學習立足于當前的訓練樣本集T,計算機通過計算候選集U中樣本的不確定性,選擇對分類器最有幫助的樣本并將其反饋給專家,而專家結(jié)合自身的經(jīng)驗及實地調(diào)研或目視解譯的結(jié)果對反饋的樣本進行標記。endprint
本研究將從高光譜遙感中提取到的多種空間特征與光譜特征進行疊加,形成光譜-空間聯(lián)合特征向量用于分類。在選擇樣本的過程中,采用了MLCU準則去衡量未標記樣本的信息量,計算方式如下:
其中,r1max(Xi)和r2max(Xi)分別表示樣本Xi到最近和第二近的超平面的距離。如果cdiff(Xi)的值越小,則樣本的信息量越高,該樣本更可能被認為是對分類模型有益的樣本。
2 實驗分析
2.1 數(shù)據(jù)介紹
實驗采用的高光譜遙感影像為Pavia University數(shù)據(jù)集。Pavia University影像由ROSIS傳感器在意大利帕維亞市上空獲取,共包含9種不同類型的地物。影像大小為610像素×340像素,空間分辨率為1.3米/像素。由于原始影像中部分波段包含較多噪聲,將12個噪聲波段去除后,影像剩余103個波段。實驗中所使用的高光譜影像為測試遙感影像算法的公用數(shù)據(jù)集,其測試樣本由數(shù)據(jù)發(fā)布方提供。Pavia University影像和對應的測試數(shù)據(jù)如圖1所示。
2.2 實驗參數(shù)
在多特征提取中,采用PCA降維后的第一主成分和第二主成分作為提取形態(tài)學特征和灰度共生紋理的基準影像??紤]到遙感影像上地物的多尺度特性,提取形態(tài)學特征所用的結(jié)構(gòu)算子為圓形算子,半徑設置為1到10。提取灰度共生紋理時,灰度等級設置為16,使用的窗口大小為3,5,…,11。而小波紋理的提取窗口大小設置為4,8,16,32。
文章采用的分類器為支持向量機(SVM, support vector machine),使用的核函數(shù)為徑向基函數(shù)(RBF, radial basis function)。懲罰系數(shù)和RBF帶寬均通過交叉驗證的方式獲取。每類的初始訓練樣本個數(shù)為5個,共有9類,共45個樣本。計算機每次選擇信息量最大的5個樣本交于專家標記,共標記50次。為了確保結(jié)果的可靠性,所有實驗使用隨機選擇的初始樣本并重復10次。實驗對比中采用10次結(jié)果的整體精度(OA, overall accuracy)的均值對不同算法進行對比。
2.3 實驗對比
為了驗證算法的有效性,實驗對比了基于光譜的主動學習方法和聯(lián)合單一空間特征的主動學習方法。其中,聯(lián)合單一空間特征的主動學習方法分別結(jié)合了形態(tài)學輪廓,灰度共生紋理,和小波紋理。實驗結(jié)果如圖2所示。
圖中,橫軸代表的是標記樣本的數(shù)量,縱軸代表的是算法取得的精度。從精度曲線中可以看出,結(jié)合了空間特征的算法的結(jié)果明顯優(yōu)于僅依賴于光譜特征的算法,而基于多特征的主動學習方式明顯獲得了最優(yōu)的結(jié)果。
具體而言,對于Pavia University影像,僅依賴光譜的主動學習方法能夠獲得的最優(yōu)精度為89.43%,結(jié)合單一空間特征的方法獲得的最優(yōu)精度分別為94.00%、89.71%和94.62%。而提出的基于多特征的主動學習方法獲得的最優(yōu)精度為97.79%。當使用250個標記樣本時,基于光譜的主動學習方法的精度為88.60%。結(jié)合形態(tài)學特征,灰度共生紋理和小波紋理的主動學習方法所獲得的精度分別為93.14%、88.80%和93.78%,我們提出的算法獲得的精度為97.06%。當獲得90%的分類精度時,基于光譜和結(jié)合灰度共生紋理的主動學習方法需要標記的樣本數(shù)量多于300個,結(jié)合形態(tài)學特征和結(jié)合小波紋理的主動學習方法分別需要135個和145個標記樣本,而提出的算法只需要標記110個樣本,明顯少于其他的對比方法??梢?,基于多特征的主動學習能夠使用較少的樣本獲得更高的精度,實驗結(jié)果證明了所提出方法的有效性。
3 結(jié)論與展望
文章針對高光譜遙感影像分類中的樣本標記問題,提出了一種基于多特征的主動學習方法。該方法有效地挖掘了高光譜遙感影像的空間信息,發(fā)揮不同特征的互補性,增強不同類別的可分性,從而有利于選擇出最具信息量的樣本。文章使用了形態(tài)學特征,灰度共生紋理和小波紋理描述遙感影像的空間信息,同時采用MCLU準則衡量待標記樣本的信息量,選擇對分類模型構(gòu)建最優(yōu)幫助的樣本點進行標記,通過計算機與專家的不斷交互,減少需要標記的樣本數(shù)量,降低樣本標記的消耗。從實驗結(jié)果中可以看出,文章所提出的算法能夠獲得比依賴于光譜的主動學習方式和考慮了單一空間特征的主動學習方法更好的結(jié)果。將來的研究工作將著眼于聯(lián)合半監(jiān)督學習和主動學習的高光譜遙感影像分類方法,進一步減少需要標記的樣本數(shù)量。
參考文獻:
[1]Crawford M M, Tuia D, Yang H L. Active learning: Any value for classification of remotely sensed data[J]. Proceedings of the IEEE,2013,101(3):593-608.
[2]陳建杰,葉智宣.多分類SVM主動學習及其在遙感圖像分類中的應用[J].測繪科學,2009,34(4):97-100.
[3]杜培軍,夏俊士,薛朝輝,等.高光譜遙感影像分類研究進展[J].遙感學報,2016,20(2):236-256.
[4]田彥平,陶超,鄒崢嶸,等.主動學習與圖的半監(jiān)督相結(jié)合的高光譜影像分類[J].測繪學報,2015,44(8):919-926.
[5]李寵,谷瓊,蔡之華,等.改進的主動學習算法及在高光譜分類中的應用[J].華中科技大學學報:自然科學版,2013(S2):274-278.
[6]Benediktsson J A, Palmason J A, Sveinsson J R. Classification of hyperspectral data from urban areas based on extended morphological profiles[J]. IEEE Transactions on Geoscience and Remote Sensing, 2005,43(3):480-491.
[7]Ye Z, Prasad S, Li W, et al. Classification based on 3-D DWT and decision fusion for hyperspectral image analysis[J]. IEEE Geoscience and Remote Sensing Letters, 2014,11(1):173-177.
[8]李智峰,朱谷昌,董泰鋒.基于灰度共生矩陣的圖像紋理特征地物分類應用[J].地質(zhì)與勘探,2011,47(3):456-461.endprint