陳善學(xué) 劉榮華
(重慶郵電大學(xué)通信與信息工程學(xué)院 重慶 400065)
(移動通信技術(shù)重慶市重點實驗室 重慶 400065)
高光譜圖像憑借豐富的光譜信息,在目標識別、圖像分類和礦物勘探等領(lǐng)域都有廣泛的應(yīng)用。然而,由于地面的復(fù)雜情況和空間分辨率的限制,單個像元可能由多種地物組成,導(dǎo)致混合像元現(xiàn)象,這種現(xiàn)象普遍存在于高光譜圖像中,嚴重阻礙了高光譜圖像的應(yīng)用[1]。因此,為了提高高光譜圖像的應(yīng)用性能,通常利用高光譜解混來分解混合像元[2]。高光譜解混的目的是將混合像元分解成一組純光譜的集合,稱為端元,以及每種端元在該像元中的相應(yīng)比例,稱為豐度[3]。
高光譜解混主要依賴于兩種混合模型:線性混合模型(Linear Mixing Model, LMM)和非線性混合模型[4](Nonlinear Mixing Model, NMM)。非線性混合模型難以物理建模和恢復(fù),而線性混合模型因其簡單而有效的混合過程備受關(guān)注?;贚MM,像元分解技術(shù)通??梢苑譃榛趲缀巍⑾∈杌貧w和統(tǒng)計3種方法[5]。
幾何算法假設(shè)高光譜數(shù)據(jù)存在于凸單形體中,端元精確地位于單形體的頂點。最小體積單形體分析算法[6]、最小體積外包單形體算法[7]和迭代約束端元[8]是比較流行的幾何方法。稀疏回歸方法假設(shè)像元可以用光譜庫中已知純光譜的線性組合的形式來表示。在統(tǒng)計框架下,高光譜分解可以表示為盲源分離問題[9]。代表性的算法包括獨立成分分析[10]和非負矩陣分解(Nonnegative Matrix Factorization, NMF)[11]。NMF是盲源分離技術(shù)最常用并廣泛應(yīng)用于高光譜圖像解混的方法。然而,由于NMF目標函數(shù)的非凸性,算法通常陷入局部極小值。為了縮小解空間,徐光憲等人[12]將最小體積單純形約束融入到NMF模型中,展現(xiàn)了高光譜圖像中光譜特性與豐度特性之間的關(guān)系。Wang等人[13]提出了端元相異度約束NMF方法,該方法假定端元信號本身是平滑的。
另一種縮小解空間的策略是對豐度添加約束。Qian等人[14]探索了使用L1/2正則項來限制豐度的稀疏性,不僅提供更稀疏的解,而且計算效率高。Candès等人[15]提出重加權(quán)稀疏約束,證明了通過加權(quán)L1范數(shù)并迭代更新權(quán)值,可以增強豐度的稀疏性并提高L1最小化框架的恢復(fù)性能。文獻[16]提出了多先驗集成約束的NMF方法,引入全變差正則項來捕捉豐度的分段平滑結(jié)構(gòu)。由于流形方法的空間結(jié)構(gòu)學(xué)習(xí)能力,文獻[17]將流形結(jié)構(gòu)引入到NMF模型中來分離相似的相鄰像元。在文獻[18]中,Lu等人提出一種基于子空間聚類約束的稀疏NMF方法,利用聚類來尋找空間結(jié)構(gòu)信息。最近,Zhou等人[19]提出利用子空間結(jié)構(gòu)來捕獲全局空間分布信息。
雖然這些方法取得一定的效果,但由于傳統(tǒng)的NMF應(yīng)用于高光譜解混時,對噪聲和異常值的處理不夠魯棒,其解混效果會受到影響。Huang等人[20]提出了一種融合L21范數(shù)和L12范數(shù)的NMF模型,同時實現(xiàn)了頻帶噪聲和像元噪聲的魯棒性。周昌等人[21]嘗試使用L21NMF模型,將其應(yīng)用于圖像聚類的研究,取得了較好的解混效果。
本文提出一種新的基于子空間結(jié)構(gòu)正則化的L21非負矩陣分解算法(L21Nonnegative Matrix Factorization based on Subspace Structure Regularization, L21NMF-SSR),充分利用了豐度的稀疏性和空間結(jié)構(gòu)信息。首先,利用L21范數(shù)代替標準NMF中的F范數(shù),對模型進行了改進。其次,混合像元僅由幾個端元組成,且每個像元都可以表示為這些端元的線性組合。同時,譜庫的端元數(shù)量遠遠多于混合像元中包含的端元數(shù)量,豐度本身就是稀疏的。因此,引入了雙重加權(quán)稀疏正則項來增強L21NMF模型中豐度矩陣的稀疏性。最后,在此基礎(chǔ)上集成子空間結(jié)構(gòu)正則項,并利用低秩表示(Low-Rank Representation, LRR)方法[22]來學(xué)習(xí)表示所有地物的子空間結(jié)構(gòu)。
在本文提出的算法中,用L21范數(shù)代替標準NMF模型的F范數(shù),即
為了充分利用豐富的先驗信息,提高解混性能,本文在L21NMF模型基礎(chǔ)上,對豐度矩陣增加了兩種約束。在真實高光譜圖像中,混合像元僅由幾個端元組成,且每個像元都可以表示為這些端元的線性組合,同時譜庫的端元數(shù)量遠遠多于混合像元中包含的端元數(shù)量,豐度本身就是稀疏的。因此,本文引入雙重加權(quán)稀疏正則項來提高L21NMF模型的估計性能和稀疏性,可以得到比L1正則項更好的稀疏結(jié)果。雙重加權(quán)L1最小化問題可以定義為
表1 L21NMF-SSR算法(算法1)
本文在模擬數(shù)據(jù)集和真實數(shù)據(jù)集上進行了實驗,以評估L21NMF-SSR算法的有效性,并與L1/2-NMF[14], RSNMF[24], SRRNMF[11], SSRNMF[20]和SSR-NMF[19]等算法進行了比較。對比算法中的參數(shù),均使用原文獻中的選擇。對于所有的實驗,本文使用光譜角距離(Spectral Angle Distance, SAD)和均方根誤差(Root Mean Square Error, RMSE)兩種常用的方法評價算法的性能。SAD用來計算端元估計值e? 與端元真實值e之間的夾角距離,定義為
從式(30)、式(31)中可以看出,SAD和RMSE的值越小,則估計值與真實值差異越小,說明提取的結(jié)果越好。
為了保證算法的有效性,所有實驗在相同條件下重復(fù)20次,取平均值作為最終實驗結(jié)果。
使用MATLAB高光譜合成工具箱[25]生成與真實場景圖像相似的模擬數(shù)據(jù)集。在模擬過程中可以選擇如圖像大小、豐度分布和端元數(shù)量等不同的參數(shù)來生成模擬數(shù)據(jù)集。實驗中所需的端元光譜均來自USGS數(shù)字光譜庫,而相應(yīng)的豐度是根據(jù)球面高斯場生成的。圖1顯示了5種地物的光譜。其中,構(gòu)建的模擬數(shù)據(jù)集像元大小為100×100,光譜波段為224。
圖1 模擬數(shù)據(jù)中的光譜曲線
圖2 L21NMF-SSR在λ1值下的SAD和RMSE
此外,真實高光譜圖像中普遍存在噪聲,為了模擬數(shù)據(jù)采集過程,在模擬圖像中添加不同的噪聲等級,信噪比的定義為
4.1.2 不同端元數(shù)目的魯棒性
本實驗用來探討不同的端元數(shù)目對6種方法解混性能的影響。在本實驗中,將SNR設(shè)置為25 dB,端元數(shù)目P從5變化到10。在此過程中,所有算法均使用相同的模擬數(shù)據(jù)。結(jié)果如圖4所示。綜合比較結(jié)果,L21NMF-SSR的性能最好,而L1/2-NMF的性能最差。由此可以證實L21NMF-SSR具有很強的優(yōu)越性和魯棒性。
圖3 L21NMF-SSR在λ2和α值下的SAD和RMSE
圖4 不同算法在不同端元數(shù)目的性能比較
4.1.3 性能分析
高光譜圖像的獲取過程中很容易受到噪聲的干擾,對于解混這是一個挑戰(zhàn)。本實驗中,設(shè)置了信噪比等級分別為15, 20, 25, 30和35 dB的高斯噪聲。表2和表3顯示了各種算法在不同信噪比級別下的SAD和RMSE結(jié)果值。其中,最佳結(jié)果使用粗體標注。從表2和表3可以看出,在各種噪聲等級下,L21NMF-SSR算法獲得了最低的SAD和RMSE值,說明該算法提取的端元和豐度精度更優(yōu)。與大多只使用稀疏約束或只改進模型的方法相比,集成空間結(jié)構(gòu)信息的SSR-NMF具有更好的性能,這表明了子空間結(jié)構(gòu)捕獲空間信息的有效性。然而,相比SSR-NMF算法,L21NMF-SSR對標準NMF模型進行了改進,同時將雙重加權(quán)稀疏加到L21NMF結(jié)構(gòu)中,使得L21NMF-SSR的性能更優(yōu)。隨著SNR的減小,噪聲對各個算法性能的影響越來越大,我們的算法具有明顯的優(yōu)勢以及較強的魯棒性。
表2 不同算法在不同信噪比級別下的SAD值的比較
表3 不同算法在不同信噪比級別下的RMSE值的比較
(1)Jasper Ridge是一種廣泛應(yīng)用于高光譜解混實驗的高光譜數(shù)據(jù),在380~2500 nm范圍內(nèi)由224個波段組成。為了避免大氣影響和水蒸氣問題,我們?nèi)サ袅?~3, 108~112, 154~166和220~224波段,保留了198個波段,因此本實驗只使用100×100像元的圖像。數(shù)據(jù)集包含的4種端元是水體、土壤、道路和樹木。
表4顯示了不同算法在Jasper Ridge數(shù)據(jù)集下的SAD值,最后一行是在不同算法下所有地物的SAD平均值。其中,最佳結(jié)果使用粗體標注。從表4可以看出,對于水體和道路這兩種端元以及均值,L21NMF-SSR得到更低的SAD值,表明了L21NMFSSR提取的端元整體更接近真實的端元。表5顯示了不同算法下的RMSE值,其中L21NMF-SSR獲得最小的RMSE值,表明了重構(gòu)圖像與真實圖像的差異最小。因此,與其他方法相比,在Jasper Ridge數(shù)據(jù)集下L21NMF-SSR算法有更好的性能。
表4 不同算法在Jasper Ridge數(shù)據(jù)集的SAD值對比
表5 不同算法在Jasper Ridge數(shù)據(jù)集的RMSE值對比
圖5顯示了L21NMF-SSR提取的端元特征與參考特征的對比,從中可以看出提取的端元與真實端元的一致性。不同算法得到的豐度圖如圖6所示??梢杂^察出,L1/2-NMF和RSNMF容易受到噪聲的影響,特別是水體和道路。整體來看,L21NMF-SSR受噪聲的影響較小,對噪聲有良好的魯棒性,取得較好的豐度結(jié)果。
圖5 L21NMF-SSR提取的端元特征與參考特征的對比
圖6 不同算法的豐度圖對比
(2)Urban數(shù)據(jù)集是另一個應(yīng)用廣泛的高光譜圖像數(shù)據(jù)集。它包含了307×307個像元,每個像元有210個光譜波段,將1~4, 76, 87, 101~111, 136~153和198~210的波段移除,得到162個波段的圖像。數(shù)據(jù)集主要包含4種地物:瀝青、玻璃、樹木和屋頂。
表6顯示了在不同算法下不同地物的SAD值。同樣地,最佳結(jié)果使用粗體標注。通過數(shù)值之間的比較可以看出對于瀝青、玻璃、屋頂以及均值,L21NMF-SSR取得更低的SAD值。表7是不同方法在Urban數(shù)據(jù)集下的RMSE值,比較前5種算法,可以看出使用子空間結(jié)構(gòu)的SSR-NMF算法比其他算法取得更低的RMSE值,但是L21NMF-SSR減少了噪聲與異常值的影響,同時獲得更加稀疏的結(jié)果,因此,獲得了更好的解混效果。
表6 不同算法在Urban數(shù)據(jù)集的SAD值對比
表7 不同算法在Urban數(shù)據(jù)集的RMSE值對比
圖7顯示了L21NMF-SSR提取端元與真實端元的一致性。不同方法得到的豐度圖如圖8所示??梢杂^察出,L21NMF-SSR取得更好的豐度結(jié)果。綜上可得,在Urban數(shù)據(jù)集下,L21NMF-SSR算法具有較好的解混性能。
圖7 L21NMF-SSR提取端元特征與真實端元特征的對比
圖8 不同算法在Urban數(shù)據(jù)集的豐度圖對比
本文提出一種新的高光譜解混算法L21NMF-SSR。首先,使用L21范數(shù)替換標準NMF中的F范數(shù),對模型進行了改進。為了充分利用高光譜數(shù)據(jù)的豐度先驗信息和空間結(jié)構(gòu)信息,本文在L21NMF模型中加入了雙重加權(quán)稀疏約束和子空間結(jié)構(gòu)正則項,增強了豐度的稀疏性并捕獲了全局空間結(jié)構(gòu)信息。模擬數(shù)據(jù)、Jasper Ridge數(shù)據(jù)和Urban數(shù)據(jù)的實驗結(jié)果均證明,L21NMF-SSR的性能優(yōu)于其他5種算法,而且該算法具有較好的去噪能力和更強的魯棒性。
然而,該方法仍有上升的空間,比如:(1)L21NMFSSR使用的是單層NMF,未考慮深層結(jié)構(gòu)的信息;(2)算法探索了豐度的先驗信息,卻忽略了對端元的約束。因此在未來的工作中,可以嘗試解決這些問題。