變形L1正則化的高光譜圖像稀疏解混

2021-05-11 01:13:02吳朝明張紹泉鄧承志

激光與紅外 2021年4期

李璠,吳朝明,張紹泉,胡蕾,鄧承志

(1.南昌工程學(xué)院江西省水信息協(xié)同感知與智能處理重點(diǎn)實(shí)驗(yàn)室,江西南昌330099； 2.江西師范大學(xué)計(jì)算機(jī)信息工程學(xué)院,江西南昌330022)

1 引言

高光譜遙感具有光譜分辨率高、圖譜合一和光譜波段數(shù)目多等特點(diǎn),已成為地質(zhì)制圖、植被調(diào)查、海洋遙感、環(huán)境監(jiān)測(cè)等領(lǐng)域的重要技術(shù)[1]。然而,受成像光譜儀空間分辨率的限制和自然界地物復(fù)雜多樣的影響,混合像元普遍存在于高光譜遙感圖像中,其極大地限制了高光譜圖像的應(yīng)用范圍[2]?；旌舷裨纸馐墙鉀Q混合像元問題有效的方法,是保證高光譜遙感技術(shù)向定量化發(fā)展的前提[3]。

隨著端元光譜庫的普及以及稀疏表示理論[4]的迅速發(fā)展,Iordache等用已知端元光譜庫替代從圖像中選取端元集合,將稀疏約束引入到混合像元分解中,提出了稀疏解混的理論與方法[5]。稀疏解混不需要假設(shè)圖像中有純端元存在,同時(shí)不需要估計(jì)圖像中包含的端元數(shù)目,是當(dāng)前解混的研究熱點(diǎn)[6]。稀疏解混的基本模型是一個(gè)非凸的組合優(yōu)化問題,通常采用非平滑項(xiàng)“L0范數(shù)”表示。近年來,針對(duì)“L0范數(shù)最小化問題”提出了近似求解方法,最常見的是用L1范數(shù)代替L0范數(shù)[5]。對(duì)于L1稀疏正則化問題,變量分裂與增廣拉格朗日方法(Sparse unmixing by variable splitting and augmented lagrangian,SUnSAL)[7]被證實(shí)是有效的求解方法,可以得到較滿意的結(jié)果。然而,由于光譜庫中的端元數(shù)量與通常參與混合像元的組分?jǐn)?shù)量之間的不平衡,導(dǎo)致L1正則化解混的稀疏性和穩(wěn)健性并不好。為了更好地表征稀疏度,目前已涌現(xiàn)出一些方法,如吳澤彬等[8]采用迭代加權(quán)L1正則化方法、Sun等[9]采用L1/2稀疏正則化方法、Deng等[10]采用平滑L0稀疏正則化方法、Chen等[11]采用Lp稀疏正則化等。這些方法雖然改善了稀疏性,但當(dāng)p<1時(shí),Lp范數(shù)函數(shù)不是Lipschitz連續(xù)的,因此對(duì)于較小的p值存在數(shù)值求解問題。針對(duì)該問題,有學(xué)者提出利用指數(shù)函數(shù)、對(duì)數(shù)函數(shù)或sigmoid函數(shù)等Lipschitz連續(xù)函數(shù)逼近L0范數(shù)[12-13]。

TransformedL1(TL1)正則化函數(shù)[14]是一個(gè)由絕對(duì)值函數(shù)組成的雙線性變換的單參數(shù)族,與Lp(p∈(0,1])范數(shù)類似,通過控制參數(shù)a∈(0,∞)可任意表征L0和L1之間的范數(shù),并滿足無偏、稀疏和Lipschitz連續(xù)的性質(zhì)。鑒于TL1正則化函數(shù)具有的這些優(yōu)勢(shì),本文利用TL1正則化函數(shù)建立稀疏解混模型,并提出凸函數(shù)差分(Difference of Convex,DC)算法求解,即DCATL1算法。DCATL1算法收斂于滿足一階最優(yōu)條件的駐點(diǎn),對(duì)端元光譜庫矩陣是否滿足有限等距條件(Restricted Isometry Property,RIP)不敏感。

2 稀疏解混模型

線性混合模型假設(shè)在任何給定的光譜波段中,每個(gè)像元光譜是該像元中所有端元光譜的線性組合[2]。假設(shè)具有l(wèi)個(gè)光譜波段,線性混合模型可描述成如下形式:

y=Mx+n

(1)

其中,y∈Rl×1表示某個(gè)像元的測(cè)量光譜；M∈Rl×q表示端元矩陣,q為端元數(shù)；x=[x1,x2,…,xq]T表示豐度向量；n∈Rl×1表示系統(tǒng)噪聲。

Iordache等[5]提出用已建立的地物光譜庫取代端元矩陣,以避免圖像中純凈像元不存在時(shí)無法提取完備的端元光譜。用已知的端元光譜庫A代替端元集合M,線性混合模型轉(zhuǎn)化為:

y=Ax+n

(2)

其中,A∈Rl×m是包含m條光譜曲線的端元光譜庫;x∈Rm×1為對(duì)應(yīng)A中各端元的豐度向量。

光譜庫A中的端元光譜數(shù)m遠(yuǎn)遠(yuǎn)大于式(1)中的實(shí)際端元個(gè)數(shù)q,經(jīng)稀疏分解獲取的豐度向量x也是稀疏的,即x中非零值的個(gè)數(shù)q?m,由此得到L0優(yōu)化問題:

(3)

其中,第一項(xiàng)為重構(gòu)誤差項(xiàng),第二項(xiàng)為稀疏性約束項(xiàng)；λ是平衡保真項(xiàng)和正則項(xiàng)之間權(quán)重的參數(shù)；‖x‖0表示x的L0范數(shù),用L0范數(shù)來統(tǒng)計(jì)x中非零元素的個(gè)數(shù)；x≥0和1Tx=1分別表示ANC和ASC。由于該問題是典型的非凸優(yōu)化NP難問題,求解困難。2006年,Tao和Candès[14]合作證明了在滿足有限等距條件時(shí),L0范數(shù)問題等價(jià)于L1范數(shù)凸優(yōu)化問題:

(4)

因此,本文提出了一種比L1范數(shù)更稀疏且易于求解、對(duì)端元光譜庫是否滿足有限等距條件不敏感的函數(shù)作為豐度稀疏約束項(xiàng)。

3 TL1正則化稀疏解混模型

TL1正則化函數(shù)ρa(bǔ)(x)[15]的定義:

(5)

ρa(bǔ)(x)是一個(gè)由絕對(duì)值函數(shù)組成的雙線性變換的單參數(shù)族,具有無偏性、稀疏性和連續(xù)性[16-17]。隨著參數(shù)a的變化,ρa(bǔ)(x)可以準(zhǔn)確表征L0和L1之間的任意范數(shù),近似Lp(p∈(0,1])范數(shù)。

從圖1中可看出,a的值越大,曲線越接近|x|,a的值越小,曲線越趨于坐標(biāo)軸。從圖2中可看出,當(dāng)a→∞,p=1時(shí),ρa(bǔ)(x)和xp近似,逼近L1范數(shù)；當(dāng)a→0,p→0時(shí),ρa(bǔ)(x)和xp均趨于指示函數(shù),逼近L0范數(shù)；在0≤x≤1范圍內(nèi),ρa(bǔ)(x),a∈(0,∞)和xp,p∈(0,1]可以相互近似。

圖1 參數(shù)a=0.01,a=0.1,a=1,a=100時(shí),ρa(bǔ)(x)的曲線

圖2 參數(shù)a和p取不同值時(shí),ρa(bǔ)(x)與xp曲線對(duì)比

將TL1的定義擴(kuò)展到向量空間,向量x=(x1,x2,…xN)T∈RN,定義:

(6)

通過調(diào)整參數(shù)a,用TL1代替L0范數(shù)來解決高光譜稀疏解混問題,得到TL1正則項(xiàng)最小化模型:

(7)

4 TL1正則化解混數(shù)值求解

本文采用凸函數(shù)差分(DC)算法求解TL1正則化稀疏解混變分問題,即DCATL1算法。DCATL1求解算法包括外層和內(nèi)層循環(huán)迭代,外層循環(huán)采用DC算法,將非凸的TL1正則化函數(shù)表示為兩個(gè)凸函數(shù)之差,每步迭代求解一個(gè)強(qiáng)凸的L1正則化子問題,內(nèi)層循環(huán)采用交替方向乘子法(Alternating Direction Method of Multipliers,ADMM)[7]求解L1最小化問題。

將TL1正則化函數(shù)ρa(bǔ)(·)表示為兩個(gè)凸函數(shù)之差:

(8)

(9)

(10)

在迭代點(diǎn)xn,用函數(shù)h(x)近似表示其仿射函數(shù)hn(x)[19]:

hn(x)=h(xn)+〈x-xn,vn〉,vn∈?h(xn)

?h(xn)=λ?φa(xn)+2cxn

次微分?h(x)在x∈dom(h)是閉凸集,可做如下等價(jià)變換[19]:

inf{g(x)-hn(x):x∈RN}?inf{g(x)-〈x,vn〉:x∈RN}

定義上式的最優(yōu)解為xn+1,則每步迭代解決以下強(qiáng)凸的L1正則化子問題:

(11)

使用ADMM方法求解式(11),引入變量z,并定義增廣拉格朗日函數(shù):

(12)

其中,uT是拉格朗日乘子;δ>0是罰參數(shù)。

對(duì)目標(biāo)函數(shù)L(x,z,u)求偏導(dǎo),分別得到x,z,u的最優(yōu)解表達(dá)式:

xk+1=B-1W

(13)

(14)

uk+1=uk+δ(xk+1-zk+1)

(15)

其中,B=ATA+2cI+δI,W=ATy+vn+δzk-uk。

shrink(·,·)是軟閾值算子,定義如下:

shrink(x,r)i=sgn(xi)max{|xi|-r,0}

考慮ANC和ASC條件,最優(yōu)化問題轉(zhuǎn)換為:

(16)

相應(yīng)地,求最優(yōu)解xn+1的子問題轉(zhuǎn)換為:

(17)

使用ADMM方法求解式(17),可得:

xk+1=B-1W-C(1TB-1W-1)

xk+1=max(xk+1,0)

其中,C=B-11(1TB-11)-1。

綜上所述,TL1正則化稀疏解混模型在ANC和ASC約束下的DC求解算法DCATL1如下:

5 實(shí)驗(yàn)與分析

5.1 模擬數(shù)據(jù)實(shí)驗(yàn)

模擬實(shí)驗(yàn)端元光譜庫A由USGS光譜庫splib06(包括498條光譜,每條光譜224個(gè)波段)中任意選擇240條光譜曲線構(gòu)成,即A∈R224×240,光譜范圍0.4～2.5 μm。每個(gè)模擬高光譜圖像由100個(gè)混合像元構(gòu)成。豐度系數(shù)矩陣隨機(jī)生成,且滿足Dirichlet分布。生成3組高光譜模擬數(shù)據(jù)SD1、SD2、SD3,端元數(shù)k分別為2、4、6。在高斯白噪聲污染的情況下進(jìn)行實(shí)驗(yàn),信噪比分別為30 dB、40 dB、50 dB。

采用信號(hào)重建誤差比(Signal-to-Reconstruction Error,SRE),進(jìn)行定量分析,其定義如下:

(18)

明算法的解混精度越高。同時(shí),采用稀疏度(sparsity)[20]評(píng)價(jià)各解混算法豐度系數(shù)的稀疏性。稀疏度越小,表明得到的解越稀疏,解混效果越好。

表1給出不同信噪比和端元數(shù)情況下,SUnSAL和DCATL1算法獲得的SRE(dB)和sparsity值(均為100次平均值),以及相應(yīng)的正則化參數(shù)取值?？梢钥闯鯠CATL1算法在所有情況下都獲得了比SUnSAL算法高的SRE(dB)值,表明DCATL1算法的解混精度優(yōu)于SUnSAL。在端元數(shù)量較少時(shí)(k=2),DCATL1的性能優(yōu)勢(shì)更加明顯。同時(shí),與SUnSAL算法相比,DCATL1算法獲得更稀疏的結(jié)果,表明TL1正則化模型能夠增強(qiáng)解的稀疏性。

表1 各解混算法得到的SRE(dB)(a=100)和sparsity值

為進(jìn)一步說明DCATL1的性能,圖3給出在信噪比為30 dB的模擬數(shù)據(jù)集SD1上,兩種解混算法的估計(jì)豐度圖及真實(shí)豐度圖。從圖中可以看出,DCATL1估計(jì)出的豐度圖比SUnSAL更接近于真實(shí)的豐度。SUnSAL估計(jì)出的豐度圖中存在較多干擾豐度或者噪聲,而DCATL1消除了大部分干擾,體現(xiàn)了TL1正則化模型比L1模型具有更好的稀疏性和更高的解混精度。

在稀疏解混算法中正則化參數(shù)λ可以平衡解的精確性和稀疏性。為分析參數(shù)λ對(duì)DCATL1算法的影響,圖4繪制了信噪比分別為30 dB、40 dB和50 dB的情況下,端元數(shù)分別為2、4和6時(shí),SRE(dB)值隨參數(shù)λ的變化曲線。從圖4中可以看出,隨著信噪比的增大,λ最優(yōu)取值越小,隨著端元數(shù)減少,λ最優(yōu)取值越大。在這幾種不同的情況下,λ最優(yōu)取值趨勢(shì)基本類似,且參數(shù)的可選范圍較大。

5.2 真實(shí)數(shù)據(jù)實(shí)驗(yàn)

為了驗(yàn)證DCATL1算法在真實(shí)高光譜圖像場(chǎng)景下的有效性,采用美國(guó)內(nèi)達(dá)華州的AVIRIS Cuprite(赤銅礦)遙感圖像數(shù)據(jù)進(jìn)行實(shí)驗(yàn)。選取250×191的像元子集,包括224個(gè)光譜波段,波長(zhǎng)范圍0.4～2.5 μm。去除1～2、105～115、150～170和223～224等低信噪比和水蒸氣的吸收波段,剩下188個(gè)光譜波段數(shù)。圖5顯示了1995年通過USGS拍攝得到的礦物圖,利用Tricorder 3.3軟件[21]產(chǎn)品反映Cuprite礦區(qū)數(shù)據(jù)中各礦物的分布情況。在實(shí)驗(yàn)中,圖5顯示的礦物圖作為各算法定性分析的參考,用它來判斷各算法是否將該數(shù)據(jù)中的礦物分解出來了。

圖3 SNR=30 dB時(shí),模擬數(shù)據(jù) SD1的反演豐度與原始豐度對(duì)比

實(shí)驗(yàn)利用SUnSAL和DCATL1算法分別對(duì)該Cuprite高光譜數(shù)據(jù)進(jìn)行混合像元分解,估計(jì)出各端元的豐度圖像并進(jìn)行展示。選擇Alunite(明礬石)、Buddingtonite(水銨長(zhǎng)石)和Chalcedony(玉髓)三種礦物的Tricorder 分類圖作為定性分析的參考,分析兩種算法的性能。實(shí)驗(yàn)中,SUnSAL和DCATL1算法的正則化參數(shù)經(jīng)驗(yàn)性地分別設(shè)置為λ=0.001,λ=0.2。

如圖6所示,兩種算法分解出來的效果與Tricorder分類圖都較相似,表明了稀疏解混算法的有效性。

圖4 不同信噪比和端元數(shù)情況下,DCATL1算法

圖5 USGS獲得的內(nèi)華達(dá)州赤銅礦區(qū)不同礦物所在的位置

然而,從圖6中可以看出,DCATL1算法估計(jì)的豐度圖(如Alunite明礬石)噪聲較少,更接近于真實(shí)的參照?qǐng)D。此外,也計(jì)算了SUnSAL和DCATL1算法獲得的稀疏度(sparsity),分別為0.0718和0.0459。從這些小的差異可以得出結(jié)論,本文提出的DCATL1算法使用了更少數(shù)量的像元來表達(dá)數(shù)據(jù),具有更高的稀疏性。通過真實(shí)數(shù)據(jù)實(shí)驗(yàn)得到的結(jié)果表明,DCATL1算法能夠提高解混精度。

圖6 在真實(shí)數(shù)據(jù)實(shí)驗(yàn)下SUnSAL和 DCATL1算法分別得到的礦物豐度圖

6 結(jié) 論

本文提出TL1正則化的高光譜圖像稀疏解混模型及其求解算法DCATL1,用稀疏、Lipschitz連續(xù)的TL1正則項(xiàng)代替稀疏回歸模型中的L0范數(shù),利用DC算法將非凸的TL1正則項(xiàng)函數(shù)分解為兩個(gè)凸函數(shù)之差,再運(yùn)用ADMM算法解決凸的子問題。TL1正則化模型比L1正則化模型具有更好的稀疏性和更高的解混精度。通過模擬和真實(shí)的高光譜數(shù)據(jù)集進(jìn)行實(shí)驗(yàn),驗(yàn)證了該方法的有效性和準(zhǔn)確性。參數(shù)a依賴先驗(yàn)知識(shí)進(jìn)行初始化。下一步將研究參數(shù)a的自適應(yīng)選取,使目標(biāo)函數(shù)由近似L1范數(shù)開始,當(dāng)算法收斂到初始最優(yōu)解時(shí),通過迭代更新得到L0范數(shù)最小化的精確近似值,以提高算法自適應(yīng)能力。