何 春,郭 科
(1.西華師范大學(xué) 教育信息技術(shù)中心,四川 南充637009;2.數(shù)學(xué)地質(zhì)四川省重點(diǎn)實(shí)驗(yàn)室(成都理工大學(xué)),四川 成都610059)
隨著遙感技術(shù)的不斷發(fā)展,高光譜圖像的光譜分辨率可達(dá)納米數(shù)量級,在獲得地物圖像信息的同時(shí),也獲得其豐富的光譜信息,真正做到了圖像與光譜的結(jié)合,具有圖譜合一的重要特性[1]。高光譜圖像具有光譜分辨率高、波段多、相鄰波段間互相關(guān)性強(qiáng)等特點(diǎn)。但是,由于高光譜圖像的波段眾多,波段數(shù)據(jù)之間勢必存在大量冗余。龐大的數(shù)據(jù)量對圖像的存儲、傳輸和處理造成了很多困難。為了更好地實(shí)現(xiàn)高光譜圖像的地物識別和分類等應(yīng)用目的,其數(shù)據(jù)的預(yù)處理過程就顯得尤為重要[2],保留重要信息、去除圖像噪聲和減少數(shù)據(jù)冗余是預(yù)處理的主要目的。
主成分分析(PCA)已在高光譜遙感領(lǐng)域得到了廣泛應(yīng)用,是一種常見的對高光譜數(shù)據(jù)進(jìn)行降維的處理方法,但其在降維時(shí),需要先將波段圖像轉(zhuǎn)換成一維向量,這樣不但會破壞圖像的結(jié)構(gòu)信息,還由于維度的增加,加大了計(jì)算量[3]。2004年,Yang Jian等[4]提出了二維主成分分析(2DPCA),它無需將波段圖像轉(zhuǎn)換成一維向量,直接利用二維圖像矩陣提取特征,既保留了圖像的結(jié)構(gòu)信息,也使計(jì)算時(shí)間大大縮短。但是2DPCA只是在圖像矩陣的行方向上提取特征,降低維數(shù),而忽略了對列方向的操作,導(dǎo)致其降維效果還不夠理想。針對上述問題,Zhang等[5]在2005年提出了雙向2DPCA算法((2D)2PCA),該方法在圖像的行和列方向上同時(shí)進(jìn)行二維主成分分析,即同時(shí)降低了圖像矩陣在行和列方向上的維數(shù),其降維效果得到了極大的提升。
然而,雙向2DPCA方法在高光譜圖像降維中的應(yīng)用卻見刊極少,目前對高分五號衛(wèi)星圖像的研究也相對較少。本文擬將雙向2DPCA降維算法應(yīng)用于高分五號衛(wèi)星圖像,既是為檢驗(yàn)該算法對高分五號衛(wèi)星圖像的降維性能,同時(shí)也為該衛(wèi)星圖像的后續(xù)處理做好準(zhǔn)備。實(shí)驗(yàn)證明,雙向2DPCA算法對于高分五號衛(wèi)星圖像具有極好的降維效果。
假設(shè)某高光譜遙感圖像A具有p個(gè)波段(A1,A2,…,Ap),圖像矩陣尺寸為m×n像素。X∈Rn×n1(n≥n1)是由相互正交的列向量組成的投影矩陣,將圖像矩陣A通過Score=AX的線性變換投影到X上,得到m×n1的矩陣Score,Score即為圖像A在X上的投影特征矩陣,X即為投影矩陣,2DPCA的思想就是尋找最優(yōu)投影矩陣[6]。算法步驟如下:
(1)
b)計(jì)算高光譜圖像A在行方向上的協(xié)方差矩陣C1(維度為n×n):
(2)
c)求解協(xié)方差矩陣C1的特征值和特征向量,選擇C1的前n1個(gè)最大特征值λ1,λ2,…,λn1,以及對應(yīng)的特征向量X1,X2,…,Xn1,則X=[X1,X2,…,Xn1]即是最優(yōu)的投影矩陣(維度為n×n1)。
d)將各波段圖像Ai(i=1,2,…,p)投影到投影矩陣X上,得到各波段圖像在行方向上的主成分,也即投影特征矩陣Scorei(維度為m×n1):
Scorei=AiX。
(3)
二維主成分分析只是在圖像矩陣的行方向?qū)?shù)據(jù)進(jìn)行分析,即對p個(gè)m×n樣本矩陣從行方向降維后,得到投影矩陣X=[X1,X2,…,Xn1],以及樣本的投影特征矩陣Scorei=AiX(i=1,2,…,p)。這樣,m×n的圖像矩陣降維到了m×n1(n≥n1)[7]。雙向二維主成分分析繼續(xù)對樣本矩陣的列方向進(jìn)行降維分析,同理得到投影矩陣Y=[Y1,Y2,…,Yn2] ,以及樣本的特征矩陣Si=YTScorei=YTAiX(i=1,2,…,p)。這樣,m×n的圖像矩陣降維到了n2×n1(m≥n2,n≥n1)。算法步驟如下:
ɑ)計(jì)算高光譜圖像A在列方向上的協(xié)方差矩陣C2(維度為m×m):
(4)
b)求解協(xié)方差矩陣C2的特征值和特征向量,選擇C2的前n2個(gè)最大特征值λ1,λ2,…,λn2,以及對應(yīng)的特征向量Y1,Y2,…,Yn2,則Y=[Y1,Y2,…,Yn2]即是最優(yōu)的投影矩陣(維度為m×n2)。
c)將各波段圖像Ai(i=1,2,…,p)同時(shí)投影到投影矩陣Y和X上,得到各波段圖像在行和列方向上的主成分,也即投影特征矩陣Si(維度為n2×n1):
Si=YTScorei=YTAiX。(i=1,2,…,p)
(5)
d)提取了各波段圖像矩陣在行、列方向上的主成分Si后,可以通過下式重構(gòu)每個(gè)波段的圖像Bi:
Bi=YSiXT=YYTAiXXT。 (i=1,2,…,p)。
(6)
相比2DPCA,(2D)2PCA進(jìn)一步將圖像矩陣m×n的主成分從m×n1(n≥n1)壓縮到了n2×n1(m≥n2,n≥n1),從而實(shí)現(xiàn)了在行和列上都對圖像數(shù)據(jù)進(jìn)行了降維[8]。
對高光譜遙感圖像A進(jìn)行了降維后,可以通過圖像信息保持率μ(等同于特征值的累計(jì)貢獻(xiàn)率)、圖像壓縮率φ以及峰值信噪比PSNR三個(gè)指標(biāo)對其降維性能進(jìn)行評價(jià)[9]。
a)圖像信息保持率(μ1表示行方向上特征值的累計(jì)貢獻(xiàn)率,μ2表示列方向上特征值的累計(jì)貢獻(xiàn)率)
(7)
b)圖像壓縮率
(8)
對于高光譜圖像而言,波段數(shù)值p一般都比較大,在這種情況下,圖像壓縮率φ可用
近似代替。
c)峰值信噪比(PSNR)
圖像在經(jīng)過壓縮處理之后,輸出的圖像都會在某些程度上與原始圖像不同,峰值信噪比就是用來評價(jià)一幅圖像壓縮后和原圖像相比質(zhì)量的好壞,單位為dB。PSNR值越高,圖像壓縮后失真越小,其有效信息保留越多[10],反之亦然。在本文中,使用峰值信噪比對經(jīng)過主成分提取后重構(gòu)的波段圖像與原圖像進(jìn)行評價(jià)和對比。
對于一幅大小為m×n的原始圖像A和經(jīng)過降維處理后的圖像B,PSNR的計(jì)算公式為:
(9)
(10)
本文實(shí)驗(yàn)軟件環(huán)境為MATLAB R2014a以及ENVI Classic 5.1。
本文采用的高光譜圖像來源于高分五號衛(wèi)星圖像。高分五號衛(wèi)星于2018年5月9日在我國太原衛(wèi)星發(fā)射中心成功發(fā)射, 作為全球首顆大氣和陸地綜合高光譜觀測衛(wèi)星,高分五號衛(wèi)星 “上可看大氣、中可觀地表、下可探地礦”,同時(shí)高分五號也是世界上第一顆能對陸地和大氣進(jìn)行綜合觀測的衛(wèi)星[11]。本文研究的圖像尺寸為361×429像素,具有330個(gè)波段。拍攝地點(diǎn)位于我國東北某地。下圖1為該遙感圖像的真彩色顯示。
圖1 實(shí)驗(yàn)圖像
在對330個(gè)波段圖像提取了行和列的主成分后,通過特征值的累計(jì)貢獻(xiàn)率可以看出,行和列的第1主成分就包含了原圖像85%的信息。429個(gè)行主成分中,前167個(gè)主成分包含了原圖像99%的信息;361個(gè)列主成分中,前123個(gè)主成分包含了原圖像99%的信息。表1列舉了行和列的前1~10個(gè)主成分所包含的圖像信息比例。圖2提供了行列主成分包含的信息保持率趨勢圖。從趨勢圖可以看出,行和列前面的主成分都已包含了圖像的絕大部分信息,后面的主成分對圖像信息貢獻(xiàn)極小,趨勢也逐漸平緩。
表1 行和列前1~10個(gè)主成分包含的圖像信息保持率(%)
圖2 行列主成分信息保持率趨勢圖
為了獲得更詳細(xì)的降維數(shù)據(jù)和結(jié)果,表2 對比分析了2DPCA算法以及雙向2DPCA算法,給出了不同信息保持率對應(yīng)的主成分大小以及圖像壓縮率的具體數(shù)值。從表中可以看到,隨著信息保持率的增加,兩種算法的主成分尺寸以及對應(yīng)的圖像壓縮率均在逐漸變大,但是在相同的信息保持率下,雙向2DPCA算法的主成分尺寸小于2DPCA算法,其對應(yīng)的圖像壓縮率也遠(yuǎn)遠(yuǎn)小于2DPCA算法。這是因?yàn)?DPCA僅僅對圖像的列進(jìn)行降維,而行并沒有改變,故主成分尺寸更大,其圖像壓縮率也更大。這也證明了雙向2DPCA算法的降維能力更強(qiáng)。同時(shí)從表中可以看到,即使是信息保持率高達(dá)99.9%時(shí),雙向2DPCA算法的主成分尺寸也能夠降維到274×341,對應(yīng)的圖像壓縮率只有60.33%,而2DPCA算法的圖像壓縮率高達(dá)79.49%,這表明雙向2DPCA算法的降維效果極好,能夠大大節(jié)省計(jì)算機(jī)存儲數(shù)據(jù)的空間,極其有利于對數(shù)據(jù)的后期處理。
表2 2DPCA算法與雙向2DPCA算法的降維效果對比
在提取了主成分后,需要對波段圖像進(jìn)行重構(gòu)。由于高光譜圖像波段較多,故本實(shí)驗(yàn)從330個(gè)波段圖像中選取了5個(gè)噪聲小、圖像表現(xiàn)較好的波段進(jìn)行圖像重構(gòu),分別是第90、120、150、180、210波段。表3繼續(xù)對比分析了2DPCA算法以及雙向2DPCA算法,顯示了這5個(gè)波段分別在信息保持率為98%、99%、99.9%時(shí),原圖像與重構(gòu)圖像的峰值信噪比。從表3可以看出,兩種算法的共同趨勢是,這5個(gè)波段在相同信息保持率下的PSNR值比較接近,而同一波段的PSNR值隨信息保持率的增加而增加,這證明了信息保持率越高,所提取的主成分就越多,獲取的圖像有效信息也就越多,那么相應(yīng)的PSNR值也就越高[12]。同時(shí),從表中數(shù)據(jù)對比可以看出,在相同的信息保持率下,5個(gè)波段對應(yīng)的2DPCA算法的PSNR值均略高于雙向2DPCA算法,這是因?yàn)?DPCA算法的主成分尺寸更大,圖像壓縮率更高。然而用比雙向2DPCA算法大得多的主成分尺寸和圖像壓縮率來換取只比雙向2DPCA算法略高的PSNR值,再次證明雙向2DPCA算法的降維性能遠(yuǎn)遠(yuǎn)超出2DPCA算法。
表3 2DPCA算法與雙向2DPCA算法在不同信息保持率下的PSNR對比(dB)
圖3~圖7分別顯示了這5個(gè)波段的原圖像以及利用2DPCA算法和雙向2DPCA算法在信息保持率為98%和99.9%時(shí)對其重構(gòu)的圖像。從各波段原圖像可以看出,波段90的灰度變化較多,結(jié)構(gòu)比較復(fù)雜,具有更多的細(xì)節(jié)信息,而波段210灰度變化較少、過渡比較平穩(wěn),圖像整體結(jié)構(gòu)較為簡單,相對提供的細(xì)節(jié)信息更少。
當(dāng)信息保持率為98%時(shí),可以看出兩種算法的重構(gòu)圖像其整體清晰度都不高,圖像的大部分細(xì)節(jié)和紋理信息都已丟失。其中2DPCA算法的重構(gòu)圖像充斥著豎條紋,雙向2DPCA算法的重構(gòu)圖像則充斥著橫豎條紋,這是因?yàn)?DPCA算法只對圖像的行向量進(jìn)行降維,故經(jīng)降維重構(gòu)后的圖像在行方向上會丟失一些信息,導(dǎo)致圖像中出現(xiàn)了豎條紋,而雙向2DPCA算法同時(shí)對行和列進(jìn)行降維,所以其重構(gòu)圖像在行和列方向上都會丟失一些信息,故圖像會出現(xiàn)橫豎條紋。在5個(gè)波段中,第90波段的條紋最多,第210波段的條紋相對最少。而從表3數(shù)據(jù)得知,當(dāng)信息保持率為98%時(shí),兩種算法在波段90的PSNR值均比波段210稍高一些。出現(xiàn)這種情況是因?yàn)?DPCA算法和雙向2DPCA算法的圖像重構(gòu)效果和圖像壓縮率都對遙感圖像的灰度值比較敏感[13],對于灰度變化較多,灰度值變化范圍較大的圖像重構(gòu)效果相對較差,而對灰度值變化范圍小,圖像結(jié)構(gòu)更為簡單的圖像重構(gòu)效果相對較好。
當(dāng)信息保持率為99.9%時(shí),兩種算法的5張重構(gòu)圖像都能較好的保留地物的邊緣和紋理信息,圖像中的條紋明顯減少,其中又以圖像結(jié)構(gòu)較為簡單的210波段重構(gòu)圖像效果最好。從肉眼判斷兩種算法的重構(gòu)效果基本一致。在2DPCA算法與雙向2DPCA算法的處理過程中,圖像的大部分低頻信息集中在前面的主成分中,而大部分高頻信息集中在后面的主成分中[14]。地物的邊緣和紋理屬于高頻信息,所以相較于98%的信息保持率而言,99.9%的信息保持率提取了更多的高頻主成分,所以其重構(gòu)圖像能夠較好的保持地物的邊緣和紋理信息[15],圖像整體更為清晰、干凈,對原圖像的還原能力更強(qiáng)。
圖3 選取波段的原圖像
圖4 2DPCA算法在信息保持率為98%時(shí)的重構(gòu)圖像
圖5 雙向2DPCA算法在信息保持率為98%時(shí)的重構(gòu)圖像
圖6 2DPCA算法在信息保持率為99.9%時(shí)的重構(gòu)圖像
圖7 雙向2DPCA算法在信息保持率為99.9%時(shí)的重構(gòu)圖像
本文通過對2DPCA算法與雙向2DPCA算法的實(shí)驗(yàn)比較,對高分五號衛(wèi)星圖像進(jìn)行了降維研究,結(jié)論如下:
在行和列方向上,雙向2DPCA算法提取的第1主成分均能包含原圖像85%的信息,行方向39%的主成分以及列方向34%的主成分就能包含原圖像99%的信息。主成分提取后對應(yīng)的圖像壓縮率比較低,有效的節(jié)省了數(shù)據(jù)存儲的空間,同時(shí)充分說明了所提取主成分的高效性。另外,重構(gòu)圖像的PSNR值也比較理想。
由于雙向2DPCA算法需要計(jì)算圖像數(shù)據(jù)的協(xié)方差的特性,導(dǎo)致了該算法對圖像的灰度值變化范圍比較敏感。相對而言,灰度值變化范圍較小的波段,其圖像重構(gòu)效果更好。由于圖像的高頻信息更多集中在提取主成分的后半部分,故較大信息保持率對應(yīng)的重構(gòu)圖像能更好的保留其邊緣和紋理信息,圖像整體更為清晰。
總體而言,雙向2DPCA算法對于高分五號衛(wèi)星圖像降維的效果比較好,具有普適性,可以推廣應(yīng)用于其他高分五號衛(wèi)星圖像。
樂山師范學(xué)院學(xué)報(bào)2020年12期