陳彥橋,張澤勇*,陳金勇,高 峰,柴興華
(1.中國電子科技集團(tuán)公司第五十四研究所,河北 石家莊050081;2.中國電子科技集團(tuán)公司航天信息應(yīng)用技術(shù)重點(diǎn)實(shí)驗(yàn)室,河北 石家莊050081)
極化合成孔徑雷達(dá)(Synthetic Aperture Rader, SAR)數(shù)據(jù)能夠獲取觀測目標(biāo)的幅度信息以及相位信息[1],在各個(gè)領(lǐng)域都得到了廣泛的應(yīng)用,而極化SAR圖像分類又是極化SAR數(shù)據(jù)處理的關(guān)鍵技術(shù)。近些年來,許多極化SAR圖像分類算法被提出,上述可以被劃分成3類:第1類方法是基于極化分解的分類方法,如Freeman分解[2]、Krogager分解[3]、Cloude分解[4]、Huynen分解[5]和Cameron分解[6]等目標(biāo)分解方法;第2類方法是基于統(tǒng)計(jì)特性的分類方法,極化SAR相關(guān)研究學(xué)者已證明極化相干矩陣與極化協(xié)方差矩陣都服從復(fù)Wishart分布[7],J.S.Lee等人[8]提出了Wishart距離并將其應(yīng)用于極化SAR圖像分類;第3類方法是基于機(jī)器學(xué)習(xí)相關(guān)算法的分類方法,例如支持向量機(jī)(Support Vector Machine, SVM)[9]、神經(jīng)網(wǎng)絡(luò)(Neural Network,NN)[10]、K近鄰(K-Nearest Neighbor, KNN)[11]以及隨機(jī)森林分類器(Random Forest Classifier, RFC)[12]等算法。
近些年來,卷積神經(jīng)網(wǎng)絡(luò)(Convolution Neural Network, CNN)[13]在極化SAR圖像分類中也得到了廣泛應(yīng)用。在CNN分類框架中,需要將像素點(diǎn)的鄰域設(shè)置為模型輸入從而得到該像素點(diǎn)的分類結(jié)果。然而,在圖像的類別邊界區(qū)域,單像素點(diǎn)的鄰域區(qū)域的像素點(diǎn)的類別并不一定與該像素點(diǎn)的類別一致,因此CNN在圖像的類別邊界區(qū)域分類效果并不好。RFC算法在極化SAR圖像任務(wù)中表現(xiàn)性能良好,但是在類別非邊界區(qū)域的分類結(jié)果沒有CNN好。在本文中,在類別邊界區(qū)域使用RFC的分類結(jié)果,在類別非邊界區(qū)域使用CNN的分類結(jié)果,通過此種集成方式,得到更好的分類結(jié)果。
通過線性水平和垂直方向發(fā)射和接收極化電磁波的方式,極化散射矩陣[14]可以表示為:
(1)
在滿足互易定理SHV=SVH的情況下,極化散射矩陣可以表示為:
(2)
(3)
根據(jù)特征分解模型,T矩陣可以分解為[14]:
(4)
(5)
本文使用T矩陣(T11,T22,T33, Re(T12), Re(T13), Re(T23), Im(T12), Im(T13), Im(T23)和Cloude分解特征(H,A,α,λ1,λ2,λ3)作為輸入特征,其中Re(Tij)和Im(Tij)代表Tij的實(shí)部和虛部。
CNN主要由卷積層、池化層和全連接層組成[13]。卷積層是用卷積核處理數(shù)據(jù),而且通過卷積提取的特征具有平移不變性。池化層的主要作用是降低特征維度,從而降低計(jì)算量。激活函數(shù)主要作用于卷積層,使模型可以提取數(shù)據(jù)之間的非線性關(guān)系,提取的特征更加抽象。常見的激活函數(shù)有sigmoid函數(shù)、ReLU函數(shù)和tanh函數(shù)。
隨機(jī)森林[15]使用Bagging方法為每棵決策樹生成用于訓(xùn)練的樣本集,而且這些樣本集是獨(dú)立同分布的,每棵決策樹在訓(xùn)練過程中確定的參數(shù)會組成隨機(jī)向量,而且隨機(jī)森林中所有決策樹的隨機(jī)向量也是獨(dú)立同分布的。隨機(jī)森林分類器是由所有決策樹集合而成的分類器,該分類器可以表示為:
h(x,θk),k=1,2,…,n,
(6)
式中,x代表輸入數(shù)據(jù);k代表第k棵決策樹;θk代表第k棵決策樹的參數(shù)向量,可以在bootstrap樣本集上學(xué)習(xí)得到;h(x,θk)則代表第k棵決策樹對輸入數(shù)據(jù)x進(jìn)行分類。對于輸入數(shù)據(jù)x的最終類別由所有決策樹的分類結(jié)果綜合得到。
本文使用信息熵表示CNN分類結(jié)果的不確定性,其可以表示為:
(7)
式中,N表示類別總數(shù);i表示類別i;p(i)表示將樣本x分類為第i類的概率。H(x)的值越大,意味著x的分類不確定性越強(qiáng),x位于類別邊界區(qū)域的概率也就越大。通過此種方式,可以得到圖像的類別邊界區(qū)域。
本文算法(RFC-CNN)流程如下:
① 用RFC得到分類結(jié)果;
② 用CNN得到分類結(jié)果;
③ 根據(jù)式(8)從CNN的分類結(jié)果得到類別邊界區(qū)域;
④ 類別邊界區(qū)域使用RFC的分類結(jié)果,類別非邊界區(qū)域使用CNN的分類結(jié)果。
如第1節(jié)所述,本文使用T矩陣(T11,T22,T33,Re(T12), Re(T13),Re(T23), Im(T12), Im(T13), Im(T23))和Cloude分解特征(H,A,α,λ1,λ2,λ3)。使用精致Lee濾波[1]方法作為濾波方法,使用總體正確率(Overall Accuracy, OA)以及Kappa系數(shù)作為評價(jià)指標(biāo)。RFC的決策樹的數(shù)目為100。CNN架構(gòu)圖如圖1所示,其中Image代表輸入圖像,Conv代表卷積層,Pool代表池化層,F(xiàn)lat代表拉成一列,fc代表全連接層,Result代表分類結(jié)果。
圖1 CNN框架圖Fig.1 CNN framework
Xi’an圖像[14]是全極化C波段的極化SAR圖像,由RADARSAT-2衛(wèi)星獲取,覆蓋中國陜西省西安市渭河部分場景,含有3類地物:Water(水域)、Grass(草地)和Building(建筑區(qū))。Xi’an圖像大小為512 pixel×512 pixel,其分辨率為8 m×8 m,Xi’an圖像的Pauli偽彩色圖、類標(biāo)圖以及配色方案如圖2所示。
(a)Pauli偽彩色圖
(b)類標(biāo)圖
(c)配色方案圖2 Xi’an極化SAR圖像Fig.2 PolSAR image of Xi’an
圖2中有標(biāo)記的樣本數(shù)目為237 416。本文從有標(biāo)記樣本中隨機(jī)選取的比例為0.5%,剩下的有標(biāo)記樣本被設(shè)置為測試樣本。圖3給出了該圖像的分類結(jié)果,表1給出了該圖像的分類正確率以及Kappa系數(shù)。
(a) RFC
(b) CNN
(c)邊界
(d) RFC-CNN圖3 Xi’an圖像分類結(jié)果Fig.3 Classification result of Xi’an image
表1 Xi’an圖像分類正確率Tab.1 Classification accuracy of Xi’an image
由圖3可以看出,RFC-CNN確實(shí)得到了圖像的邊界區(qū)域,而且該方法確實(shí)得到了比RFC和CNN更好的分類結(jié)果,在圖像邊界區(qū)域比CNN分類結(jié)果好,在圖像非邊界區(qū)域比RFC的分類結(jié)果更好。由表1可以看出,本文方法的整體正確率和Kappa系數(shù)都是所有方法中最高的。上述結(jié)果表明,本文方法的集成策略在Xi’an圖像分類中是有效的。
Oberpfaffenhofen圖像[14]是全極化L波段的極化SAR圖像,由E-SAR衛(wèi)星獲取,覆蓋了位于德國Oberpfaffenhofen的部分地區(qū),包含3類地物:Open Areas(開放區(qū)域)、Wood Land(森林)和Built-up Areas(建筑區(qū)),該圖像大小為1 300 pixel×1 200 pixel,其分辨率為3 m×2.2 m,Oberpfaffenhofen圖像的Pauli偽彩色圖、類標(biāo)圖以及配色方案如圖4所示,該圖像的有標(biāo)價(jià)樣本數(shù)目為1 374 298,本文采用0.2%的標(biāo)記樣本作為訓(xùn)練樣本,剩余標(biāo)記樣本作為測試樣本。圖5給出了該圖像的分類結(jié)果,表2給出了該圖像的分類正確率以及Kappa系數(shù)。
(a) Pauli偽彩色圖
(b) 類標(biāo)圖
(c) 配色方案圖4 Oberpfaffenhofen極化SAR圖像Fig.4 PolSAR image of Oberpfaffenhofen
(a) RFC
(b) CNN
(c)邊界
(d) RFC-CNN圖5 Oberpfaffenhofen圖像分類結(jié)果Fig.5 Classification result of Oberpfaffenhofen image
表2 Oberpfaffenhofen圖像分類正確率Tab.2 Classification accuracy of Oberpfaffenhofen image
由圖5可以看出,RFC-CNN成功找到了圖像邊界區(qū)域,相比于RFC和CNN,本文方法也得到了更好的分類結(jié)果。由表2可以看出,RFC-CNN的總體正確率和Kappa系數(shù)確實(shí)比RFC和CNN更高。綜上,本文方法的集成策略在Oberpfaffenhofen圖像分類的有效性得到了證明。
本文提出了一種基于CNN和RFC的集成學(xué)習(xí)方法用于極化SAR圖像分類。CNN在類別非邊界區(qū)域分類性能優(yōu)異,但是在類別邊界區(qū)域分類結(jié)果較差,RFC在類別非邊界區(qū)域分類結(jié)果不如CNN,但是在類別邊界區(qū)域分類性能比CNN優(yōu)異,本文方法的集成策略是使用CNN對類別非邊界區(qū)域進(jìn)行分類,使用RFC對類別邊界區(qū)域進(jìn)行分類,以此取得更好的分類結(jié)果。本文將T矩陣以及Cloude分解特征設(shè)置為輸入特征,使用Xi’an和Oberpfaffenhofen兩幅極化SAR圖像作為測試圖像,與對比方法RFC以及CNN相比較,本文方法在類別非邊界區(qū)域比RFC分類結(jié)果好,在類別邊界區(qū)域比CNN分類結(jié)果好,因此本文方法的集成策略是有效的。