孫 宸,成立業(yè)
(工業(yè)和信息化部電子第五研究所 電子元器件可靠性物理及其應(yīng)用技術(shù)國家級重點實驗室,廣東 廣州 510610)
極化合成孔徑雷達(Polarimetric Synthetic Aperture Radar, PolSAR)圖像分類[1]是極化合成孔徑雷達圖像處理與解譯的重要內(nèi)容.極化合成孔徑雷達圖像的分類結(jié)果可以直接作為土地覆蓋類型圖使用,也可作為后續(xù)處理與解譯的一個中間環(huán)節(jié),在軍事偵察、海面船只檢測、農(nóng)業(yè)應(yīng)用、地質(zhì)研究、植被種類判別等諸多領(lǐng)域有著廣泛的應(yīng)用.極化合成孔徑雷達圖像因為特殊的成像原理,存在大量的相干斑噪聲,數(shù)據(jù)量多,標記樣本少,為分類任務(wù)帶來巨大的挑戰(zhàn).學者們提出的分類方法大致可以分為3類:基于目標分解的方法根據(jù)切合實際的物理約束解譯目標的散射機制,盡管該類方法提供了基本的散射機理模型,但是提供的信息量是片面的;基于統(tǒng)計特性的方法[2]需要區(qū)分同質(zhì)與異質(zhì)區(qū)域,關(guān)于異質(zhì)區(qū)域的描述需要估計大量的參數(shù);基于機器學習的方法從數(shù)據(jù)中學習,處理問題靈活.其中支撐矢量機(Support Vector Machine, SVM)因為夯實的理論基礎(chǔ),在極化合成孔徑雷達圖像的分類問題中得到應(yīng)用[3].最小二乘支撐矢量機(Least Square Support Vector Machine, LS-SVM)是支撐矢量機的最小二乘版本,具有全局最優(yōu)性和良好的泛化能力[4],但是丟失了支撐矢量系數(shù)的稀疏性,在解決大規(guī)模數(shù)據(jù)的分類問題時,其測試時間特別長.
為了對極化合成孔徑雷達圖像進行高效分類,筆者提出了一種基于空間感知矩陣和最小二乘支撐矢量機的分類器.受壓縮感知思想的啟發(fā)[5],將最小二乘支撐矢量機中的適定問題轉(zhuǎn)化成欠定的問題,減小優(yōu)化問題的規(guī)模,增加解的多樣性,從而可以尋找稀疏的支撐矢量系數(shù),提高測試速度.首先設(shè)計了一個與數(shù)據(jù)耦合的判別式測量矩陣,對數(shù)據(jù)進行壓縮測量時,保證了對分類相關(guān)信息的最大化保留,對分類不相關(guān)信息的壓縮;然后,基于極化信息和空間信息,提出威沙特(Wishart)空間核來描述極化合成孔徑雷達數(shù)據(jù),減少相干斑噪聲對分類結(jié)果的影響,并增強空間一致性;最后,構(gòu)造了一個空間感知矩陣,提出了一種一步式剪枝的最小二乘支撐矢量機算法,獲得了一種稀疏的極化合成孔徑雷達圖像的分類器,起到了快速分類的作用.
最小二乘支撐矢量機模型由Suykens提出,使用了等式約束和二次損失函數(shù),而不再是支撐矢量機版本中的不等式約束和ε不敏感損失函數(shù),進而將優(yōu)化模型由凸二次規(guī)劃問題變成了線性規(guī)劃問題,對小規(guī)模樣本的分類問題具有很高的精度.其對偶形式為
(1)
(2)
為了減小優(yōu)化問題的規(guī)模,降低存儲需求,增加支撐矢量系數(shù)的選擇范圍,筆者設(shè)計了測量矩陣.壓縮感知常用隨機測量矩陣進行觀測,但在解決特定問題時,通用的測量矩陣性能往往不是最優(yōu)的.在特定的問題中,筆者更關(guān)心如何快速得到準確的解,而非隨機的測量矩陣比隨機測量矩陣在感知稀疏信號方面更有效.因此,設(shè)計了一個與分類任務(wù)相關(guān)的非隨機測量矩陣.該設(shè)計受線性判別分析(Linear Discriminative Analysis, LDA)啟發(fā),可以增加類間散布,減小類內(nèi)散布.下面介紹線性判別分析,并由此推導出判別式測量矩陣.
1.2.1 線性判別分析
(3)
1.2.2 判別式測量矩陣
受線性判別分析思想的啟發(fā),筆者提出非隨機的判別式測量矩陣.使用非線性映射函數(shù)φ:R→Z,將數(shù)據(jù)由原始空間R映射到高維特征空間Z,其中高維通常是無窮維.定義Φ= [φ(x1),φ(x2),…,φ(xn)],表示數(shù)據(jù)集從原始空間映射到高維特征空間.表示定理wφ=Φβ,其中β是wφ在基Φ下的表示系數(shù),wφ是w在高維空間中的映射.由于最小二乘支撐矢量機的字典包括一個核矩陣,為了處理這種高度的非線性結(jié)構(gòu),對類間與類內(nèi)散布矩陣分別向高維空間作映射,分別有
定義間隔MMargin為類間散布與類內(nèi)散布相減.該間隔對應(yīng)著原始空間中Sb-Sw在高維空間中的映射,使用相減的形式避免了奇異問題的發(fā)生,并對該間隔進行奇異值分解:
(8)
其中,U和V是奇異值分解中的酉矩陣,Λ是對角矩陣,對角線上的元素按奇異值從大到小進行排列.
假定測量數(shù)目為m,將判別式測量矩陣Ψ定義為酉矩陣U的前m列的轉(zhuǎn)置,測量矩陣是一個扁矩陣,則
Ψ=[U(:,1:m)]T.
(9)
該非線性判別式測量矩陣具有明確的物理意義,是一個跟分類任務(wù)有關(guān)的測量矩陣.在對數(shù)據(jù)進行壓縮測量時,測量矩陣還會起到減小數(shù)據(jù)類內(nèi)距離、增大類間距離的作用,保證了對分類相關(guān)信息的最大化保留,對分類不相關(guān)信息的壓縮.關(guān)于測量矩陣的有效性驗證,將在實驗部分給出解釋.
極化合成孔徑雷達數(shù)據(jù)可以用相干矩陣的形式表示,該矩陣是一個3×3的復矩陣,即x=T,則
T
(10)
極化合成孔徑雷達數(shù)據(jù)服從復威沙特分布,文獻[6]在此分布的基礎(chǔ)上,定義了一個對稱的距離測度,用來表示任意兩個樣本間的關(guān)系:
d(Ti,TTj+TTi)-q,
(11)
利用空間信息可以顯著地提高分類性能,加窗法是一種最常見的利用空間信息并且降低相干斑噪聲影響的方法.利用加窗法構(gòu)造威沙特空間核函數(shù)K,k(i,j)表示威沙特空間核的第i行第j列元素:
k(i,T,T∈Nh×h(Ti) ,
(12)
其中,g是核寬參數(shù),i是以目標樣本Ti為中心的矩形窗口內(nèi)所有樣本的加權(quán)平均,Nh×h(Ti)表示目標樣本Ti的鄰域集合,h×h是矩形窗的大?。敶翱诖笮?1×1 時,表示沒有利用空間信息.
Flevoland數(shù)據(jù)集[7]是1989年8月中旬由美國航空航天局的噴氣推進實驗室的機載AIRSAR系統(tǒng)的L波段的傳感器獲取的.該地區(qū)被劃分成15類,分別是干豆、油菜籽、裸地、土豆、甜菜、3類小麥、豌豆、苜蓿、大麥、草地、森林、水域、建筑,背景用白色標記,不包含在15類中.該數(shù)據(jù)是四視的,有精確標記的真實類標圖,廣泛用于極化合成孔徑雷達圖像的地物分類測試中,由 1 024× 750個像素構(gòu)成.
(13)
實驗結(jié)果如表1所示,加窗算法采用的窗口大小為9×9.從表1可以看出,筆者提出的測量矩陣比高斯隨機矩陣和二值隨機矩陣的均方誤差更小,說明了提出的測量矩陣的有效性.
表1 3種測量矩陣關(guān)于均方誤差的對比
圖1 窗口大小對分類器分類精度的影響
圖1為窗口大小對分類器在Flevoland數(shù)據(jù)集中分類精度的影響.分類精度隨著窗口的逐漸變大而提高.當窗口大小從 1×1 變到 3×3 時,分類精度的提升更明顯,說明空間信息的利用可以顯著地提高分類性能.但是隨著窗口大小進一步增大,分類精度略微有所下降,這是因為在較大的窗口中包含了不同類的樣本,影響了窗口中樣本的同質(zhì)性,對分類結(jié)果產(chǎn)生了負作用.因此,窗口大小的調(diào)節(jié)對分類性能有一定的影響,但在一定范圍內(nèi)較為穩(wěn)定.在保證較高分類精度條件時,窗口越小越好,因為較小的窗口所需的計算量更小一些.
筆者提出的算法與不同的極化合成孔徑雷達圖像分類算法進行對比,這些算法是支撐矢量機、最小二乘支撐矢量機、威沙特最大似然[9].筆者提出的算法、支撐矢量機、最小二乘支撐矢量機的實驗結(jié)果均給出兩種:一種是無窗方法,即不利用空間信息;另一種是加窗方法,窗口大小調(diào)整到最優(yōu).對于支撐矢量機和最小二乘支撐矢量機的正則參數(shù)在{10-2, 10-1, …, 103}范圍內(nèi)調(diào)節(jié),高斯核的帶寬參數(shù)在{10-2, 10-1, …, 103}范圍內(nèi)調(diào)節(jié),通過5倍交叉驗證的方法確定.采用的特征向量是 [2A0,B0+B,B0-B,C,H,E,D,G,F]T,該特征廣泛用在了極化合成孔徑雷達圖像的分類算法中.筆者提出算法的正則參數(shù)固定為1,窗口大小調(diào)整到最優(yōu).隨機選取每類真實類標的5%作為訓練樣本,剩余的樣本作為測試樣本.采用的評價指標是整體精度(Overall Accuracy, OA)、平均精度(Average Accuracy, AA)、Kappa系數(shù).
表2 Flevoland數(shù)據(jù)集中不同方法的分類精度和支撐矢量數(shù)目
圖2 不同算法的分類結(jié)果對比
7種算法的數(shù)值結(jié)果如表2所示,視覺分類結(jié)果如圖2所示.可以看出,提出算法的支撐矢量數(shù)目遠遠小于最小二乘支撐矢量機和支撐矢量機,而測試樣本有 759 817 個.由于測試速度和支撐矢量的數(shù)目是線性關(guān)系,因此筆者提出的算法大大地提高了分類速度.文中加窗算法在13個類別(總共15類)中取得了最高的分類精度,其OA、AA、Kappa系數(shù)都是最高的;文中無窗算法在11個類別中取得了最高的分類精度,其OA、AA、Kappa系數(shù)在無窗算法中是最高的.圖2(a)所示的支撐矢量機無窗算法不能很好地區(qū)分裸地、油菜籽,對裸地的分類精度只有 0.051 5,雖然對水域的分類精度達到了 0.938 9,但是黑色方框標出的水域部分出現(xiàn)了嚴重的錯誤.圖2(b)所示的支撐矢量機加窗算法利用了空間信息,除了裸地外其余各類的分類精度較沒有使用空間信息的支撐矢量機算法均有了提高,區(qū)域一致性變好,但是裸地類的分類精度依然很低,只有 0.050 7,黑色方框標出的水域和油菜籽類的分類效果依然不好.圖2(c)所示的最小二乘支撐矢量機無窗算法對建筑類的分類精度只有 0.063 9,黑色方框標出的水域和油菜籽類也出現(xiàn)了較明顯的錯誤.圖2(d)所示的最小二乘支撐矢量機加窗算法較不加窗的最小二乘支撐矢量機算法分類效果提高明顯,但是對于城區(qū)類的分類精度只有 0.1918 .圖2(e)所示的威沙特最大似然算法對水域的分類精度只有 0.517 7.筆者提出的算法中的測量數(shù)目設(shè)置為 1 000,稀疏度設(shè)置為250,加窗算法在水域的分類精度達到了1.圖2(g)為筆者提出的有窗算法,比圖2(f)所示的無窗算法的性能提高了,展示了威沙特空間核中包含的空間信息對分類的幫助.
從剪枝角度入手,筆者提出一種一步式剪枝算法,將尋找最小二乘支撐矢量機的稀疏拓撲轉(zhuǎn)化為對支撐矢量系數(shù)的零范數(shù)約束,并提出一種基于空間感知矩陣學習的分類器.設(shè)計的測量矩陣是一種與數(shù)據(jù)耦合的判別式矩陣,在減小優(yōu)化問題規(guī)模的同時,能夠增加類間散布,減小類內(nèi)散布.該矩陣是為分類任務(wù)服務(wù)的,有著明確的物理意義.針對極化合成孔徑雷達圖像這類特殊的數(shù)據(jù),利用數(shù)據(jù)服從威沙特分布和數(shù)據(jù)在空間鄰域內(nèi)的相似性,設(shè)計了威沙特空間核.對空間信息的利用降低了相干斑噪聲對極化合成孔徑雷達圖像分類的影響,增強了區(qū)域一致性,提高了分類精度.