李二森,張保明,楊 娜,楊靖宇,郭曉剛
(信息工程大學(xué)測繪學(xué)院,河南鄭州450052)
非負矩陣分解在高光譜圖像解混中的應(yīng)用探討
李二森,張保明,楊 娜,楊靖宇,郭曉剛
(信息工程大學(xué)測繪學(xué)院,河南鄭州450052)
從線性混合模型與非負矩陣分解的定義出發(fā),分析非負矩陣分解適用于高光譜圖像解混的原因,總結(jié)近年來學(xué)者們提出的基于非負矩陣分解的光譜解混算法,并重點對SC-NMF、MVC-NMF、APS-NMF算法步驟進行介紹與分析,最后總結(jié)非負矩陣分解及其應(yīng)用于混合像元分解所面臨的問題。
混合像元;光譜解混;非負矩陣分解;線性混合模型;端元
混合像元在高光譜圖像中廣泛存在,傳統(tǒng)的硬分類方法可能會產(chǎn)生不準確的分類結(jié)果,而子像元分類方法能夠提供更加精確的分類結(jié)果用于確定細小的特征。如何從混合像元廣泛存在的高光譜遙感圖像中準確地提取端元,并有效地對混合像元進行分解,已成為遙感圖像定量分析的一個重要研究課題。
總的來說,混合像元分解模型可以分為兩類,即線性光譜混合模型(linear spectral mixture model,LSMM)和非線性光譜混合模型(nonlinear spectral mixture model,NLSMM)。其中線性光譜混合模型的原理簡單、效率高、物理意義明確,因而得到廣泛的研究和應(yīng)用。
非負限制下的低階估計問題通常被稱作非負矩陣分解(nonnegative matrix factorization,NMF),NMF的思想可以追溯到1994年P(guān)aatero和Tapper的文章[1]。Lee和Seung在一篇關(guān)于非監(jiān)督學(xué)習(xí)的文章[2]中也獨立地提出了NMF的概念,隨后他們發(fā)表在《自然》上的一篇文章給出了計算NMF的簡化算法[3],用于解決人臉識別和語義分析中的問題,而且他們以矩陣的歐氏距離和K-L散度作為目標函數(shù),證明了NMF算法的收斂性。目前,NMF在人臉識別、數(shù)據(jù)挖掘、數(shù)據(jù)壓縮、非負數(shù)據(jù)的解譯、語音信號處理和神經(jīng)生物學(xué)等領(lǐng)域中得到了廣泛應(yīng)用[4-5]。NMF的數(shù)學(xué)模型與線性光譜混合模型十分相似,為將NMF應(yīng)用于線性混合模型下的光譜解混提供了可能。文獻[6-7]將沒有附加任何限制的NMF直接應(yīng)用于光譜解混,在試驗中取得了一定的成果,文獻[8-10]結(jié)合非負矩陣分解分別提出了平滑限制非負矩陣分解(smoothness constrained nonnegative matrix factorization,SC-NMF)、最小體積限制的非負矩陣分解(minimum volume constraint nonnegative matrix factorization,MVC-NMF)和交互投影子梯度非負矩陣分解(alternating projected subgradients-nonnegative matrix factorization,APS-NMF)應(yīng)用于高光譜混合像元解混,在試驗中取得了較好的結(jié)果。
本文在分析線性光譜混合模型和NMF原理的基礎(chǔ)上,對NMF在光譜解混中的應(yīng)用進行了研究,并對MVC-NMF、APS-NMF和SC-NMF三種算法進行了總結(jié),最后分析了NMF及其應(yīng)用于光譜解混面臨的問題。
線性光譜混合模型的表達式為
式中,x為l(l為影像波段數(shù))維混合像元光譜,是已知觀測量;A為l×p(p為端元數(shù)目)端元矩陣或源矩陣,其中每一列為一個端元的光譜向量;向量s為該像元中各端元的豐度(abundance);ε為l維高斯隨機噪聲或模型誤差。如果將高光譜圖像的n個像元(n為像元個數(shù))均考慮進式(1),則式(1)擴展為
式中,X∈Rl×n,其列向量為每個像元的光譜;S∈Rp×n,構(gòu)成豐度矩陣或混合矩陣。圖1為式(2)表示的線性混合模型示意圖。對于線性混合模型而言,豐度矩陣S存在兩個限制條件:非負性限制(sij≥0,i=1,2,…,p,j=1,2,…,n) 以及其和為1的限制
圖1 線性混合模型示意圖
非負矩陣分解作為一種盲源分解(blind source separation,BSS)算法已經(jīng)廣泛應(yīng)用于人臉識別和語義分析中,其具體過程為:給定非負矩陣X∈Rm×n和正整數(shù)p(p<min(m,n)),非負矩陣分解的任務(wù)是尋找元素均為非負的矩陣A∈Rm×p和S∈Rp×n,滿足
或等價地寫為
式中,Xj為X的第j列列向量;Sj∈Rp;參數(shù)p為矩陣A的期望秩,并且一般情況下p為先驗信息或者可以由數(shù)據(jù)X確定。一般認為A的列向量代表了數(shù)據(jù)X中潛在的信息,如具有物理意義的非負成分。這一特性使得非負矩陣分解廣泛使用于數(shù)據(jù)分析、降維、特征提取、目標識別中。
解決NMF問題的很自然的方法就是通過最小化Y和AS之間的歐氏距離來尋找最優(yōu)化途徑。
式中,符號‖‖2F代表Frobenius模。
對于代價函數(shù)式(6),許多文獻提出了學(xué)習(xí)準則,其中解決這個最優(yōu)化問題的常用方法是文獻[3]中提出的乘法準則。該算法從兩個正矩陣開始,每次迭代過程中,將A和S的元素乘以一些正因子,以證明該方法 Y-AS2F在乘法準則下單調(diào)非增。為了加速NMF的迭代算法過程,文獻[4]提出了一種投影梯度限制的優(yōu)化算法。非負矩陣分解經(jīng)常遇到的問題就是局部最優(yōu),很明顯的是,如果矩陣D為可逆矩陣,則AS=(AD)(D-1S),因此NMF主要依賴于初始化和特定的學(xué)習(xí)策略。在很多應(yīng)用中,需要通過增加限制條件來減輕NMF結(jié)果的非唯一性,將式(2)與式(3)比較不難發(fā)現(xiàn),NMF具有使用于混合像元分解的潛力。
混合像元分解的步驟主要包括數(shù)據(jù)降維、端元提取和豐度估計三部分,其中端元提取是混合像元分解的關(guān)鍵。端元提取算法的分類方法較多:根據(jù)是否假定光譜數(shù)據(jù)中存在純像元,端元提取算法可分為兩類:端元識別算法(endmember identification algorithm,EIA)和端元生成算法(endmember generation algorithm,EGA),EIA直接從光譜數(shù)據(jù)中提取端元(即假定影像中存在純像元),算法的理論一般比較簡單,而EGA是從光譜數(shù)據(jù)中產(chǎn)生端元,算法的過程較為復(fù)雜。對于多(或高)光譜數(shù)據(jù)而言,由于地面分辨率等因素的限制,在大多數(shù)情況下,數(shù)據(jù)中并不存在純像元,因此,相對而言EGA提取的端元精度較高。NMF與線性混合模型具有一定的相似性:NMF通過線性結(jié)合尋找近似原始數(shù)據(jù)的非負基向量集,這些基向量的作用類似于端元?;贜MF的光譜解混算法不需要假定純像元的存在,并且在提取端元的同時可以獲取相應(yīng)的豐度矩陣,屬于EGA算法。NMF適合應(yīng)用于高光譜數(shù)據(jù)解混,主要原因包括[5]:
1)高光譜數(shù)據(jù)的空間維數(shù)和光譜維數(shù)都很高;
2)高光譜數(shù)據(jù)本身、端元光譜及其豐度均為非負;
3)高光譜圖像中,波段數(shù)大于圖像中端元的個數(shù)。
文中重點對近年來學(xué)者們提出的 SC-NMF、MVC-NMF、APS-NMF算法步驟進行總結(jié)和分析。
SC-NMF算法將平滑限制引入NMF中用于光譜解混、空間目標識別與分類。SC-NMF構(gòu)建的目標函數(shù)為
SC-NMF算法的更新準則為
1) 初始化矩陣 Ai,j> 0 ,hi,j> 0 ,?i,j;
2) 當 t=1,2,…(取最大迭代次數(shù))時則
由此可見,SC-NMF采用的是乘法更新準則,與非負矩陣分解的梯度下降算法、交互最小二乘算法相比,其效率不高。文獻[8]將SC-NMF算法應(yīng)用于空間目標識別并與LEE的NMF算法[3]結(jié)果進行了比較,試驗結(jié)果表明SC-NMF算法光譜解混的結(jié)果更優(yōu)。
MVC-NMF通過將體積限制加入到NMF中將最小二乘分析和凸面幾何結(jié)合起來。其提出的代價函數(shù)包括兩部分,一部分為估量觀測數(shù)據(jù)與端元和豐度重建數(shù)據(jù)之間的近似誤差,另一部分由最小體積限制組成。文獻[9]把這兩部分作為兩種力:外力(最小化近似誤差)使估計結(jié)果向點云外部移動,內(nèi)力(最小化單體體積)在相反方向上使端元盡可能地相互靠近。算法具體過程為:
1)構(gòu)建目標函數(shù)
式中,1p為元素全是1的p維列向量;1n為元素全是1的n維列向量;J(A)為懲罰項,計算用估計的端元構(gòu)成的單體體積;λ∈R。
2)初始化:從點云數(shù)據(jù)中隨機選擇p個點并將它們構(gòu)成A的初始值,S矩陣也可以隨機初始化,文獻[9]在試驗中將矩陣S初始化為零矩陣。
3)利用虛擬維(VD)估計端元數(shù)目p。
4)停止準則:給定迭代次數(shù)和誤差閾值。
5)根據(jù)一定準則計算能夠最小化目標函數(shù)的矩陣A、S,如果滿足停止準則,則迭代停止,否則,更新矩陣A、S,繼續(xù)尋找最小化目標函數(shù)的矩陣。
APS-NMF算法認為鄰域像素具有相似的豐度信息作為懲罰項引入NMF用于高光譜圖像解混。APS-NMF的目標函數(shù)為
式中,Si表示豐度矩陣 S的列向量;表示第i個像素的鄰域像素集。APSNMF利用交互投影梯度算法求解函數(shù)f(A,S)的最優(yōu)解。文獻[10]將APS-NMF算法應(yīng)用于 AVIRIS高光譜數(shù)據(jù),取得了一定的試驗成果。
因為高光譜圖像空間分辨率較低,鄰域像素或許會差別比較大,將每個像素均同樣考慮鄰域像素的豐度相似性似乎不妥。
本文分析了線性混合模型與非負矩陣分解的定義及特點,總結(jié)了NMF適合應(yīng)用于高光譜圖像解混的原因,重點對近年來的 SC-NMF、MVC-NMF、APS-NMF算法步驟進行了介紹與分析。雖然人們針對非負矩陣分解開展了不少的研究,并且在實際中取得了很好的應(yīng)用,但非負矩陣分解及其應(yīng)用于光譜解混仍然面臨一些問題。
1)初始化方法:好的初始化方法能夠提高算法運行的速度、加快算法收斂,目前大多數(shù)算法還只是采用隨機初始化方法進行初始化;
2)子空間選擇:到目前為止,還沒有確定最優(yōu)p值(非負矩陣分解的最低階數(shù))的方法,該問題比較困難且常取決于實際應(yīng)用;
3)最優(yōu)化問題:目前,所有的NMF方法都存在該缺點,即求取的結(jié)果并非全局最優(yōu),而是局部最優(yōu)解;
4)并行算法研究:由于大多數(shù)NMF方法存在雙線性特性,因此可以研究非負矩陣分解的并行算法,提高算法的效率。
[1]PAATERO P,TAPPER U.Positive Matrix Factorization:A Non-negative Factor Model with Optimal Utilization ofError Estimates of Data Values[J].Environmetrics,1994(5):111-126.
[2]LEE D D,SEUNG H S.Unsupervised Learning by Convex and Conic Coding[J].Advances in Neural Information Processing Systems,1997(9):515-521.
[3]LEE D D,SEUNG H S.Learning the Parts of Objects by Nonnegative Matrix Factorization[J].Nature,1999,401(10),788-791.
[4]GILLIS N,GLINEUR F.Using Underapproximations for Sparse Nonnegative Matrix Factorization[J].Pattern Recognition,2010,43(4):1676-1687.
[5]賈森.非監(jiān)督的高光譜圖像解混技術(shù)研究[D].杭州:浙江大學(xué),2007.
[6]MASALMAH Y M.Unsupervised Unmixing of Hyperspectral Imagery Using the Constrained Positive Matrix Factorization[D].Puero Rico:The University of Puerto Rico Mayaguez Campus,2007.
[7]PARRA L C,SAJDA P,DU S.Recovery of Constituent Spectra Using Non-negative Matrix Factorization[J].SPIE Proceedings,2003,5207(11):321-331.
[8]PAURA V P,PIPER J,PLEMMONS R J.Nonnegative Matrix Factorization for Spectral Data Analysis[J].Linear Algebra and Applications,2006,416(7):29-47.
[9]MIAO L,QI H.Endmember Extraction from Highly Mixed Data Using Minimum Volume Constrained Nonnegative Matrix Factorization[J].IEEE Transactions on Geoscience and Remote Sensing,2007,45(3):765-777.
[10]ZYMNIS A,KIM S J,SKAF J,et al.Hyperspectral Image Unmixing via Alternating Projected Subgradients[C]∥Proceeding of 41st Asilomar Conference on Signals,Systems,and Computers.Pacific Grove,CA:[s.n.],2007.
Discussion of the NMF’s Application for Hyperspectral Imagery Unmixing
LI Ersen,ZHANG Baoming,YANG Na,YANG Jingyu,GUO Xiaogang
0494-0911(2011)03-0007-04
P237
B
2010-01-08;
2010-06-23
礦山空間信息技術(shù)國家測繪局重點實驗室(河南理工大學(xué),河南省測繪局)開放基金資助項目(KLM200904)
李二森(1984—),男,河南新安人,博士生,主要研究方向為高光譜圖像處理和模式識別。