孫偉偉,常明會(huì),孟祥超,楊 剛,任 凱
1.寧波大學(xué)地理與空間信息技術(shù)系, 浙江 寧波 315211; 2.寧波大學(xué)信息科學(xué)與工程學(xué)院, 浙江 寧波 315211
高光譜影像具有較高的光譜分辨率,在地物精細(xì)識(shí)別中具有巨大的應(yīng)用潛力[1]。然而,由于傳感器設(shè)計(jì)無(wú)法同時(shí)兼顧高空間分辨率、高光譜分辨率和高信噪比指標(biāo),高光譜影像通常具有較低空間分辨率[2]。這導(dǎo)致了影像單個(gè)像元中存在兩種及以上地物即混合像元[3],進(jìn)而嚴(yán)重影響了高光譜遙感技術(shù)的應(yīng)用效果。光譜解混算法將混合像元分解為端元光譜和相應(yīng)的豐度比例,從而為解決這一問(wèn)題提供了重要的技術(shù)支撐。其中端元提取在整個(gè)解混過(guò)程中占據(jù)重要地位,對(duì)于確保解混結(jié)果的準(zhǔn)確性具有重要的意義[4]。
端元提取是從高光譜影像中提取純凈的地物光譜曲線。目前高光譜端元提取算法主要分為以下5大類[5]:幾何單形體體積法、統(tǒng)計(jì)誤差法、空間投影法、融合空間信息的端元提取算法、稀疏回歸算法。
幾何單形體體積法基于圖面幾何體理論,利用高光譜點(diǎn)云數(shù)據(jù)在特征空間中呈現(xiàn)的凸面單形體結(jié)構(gòu),尋找頂點(diǎn)作為高光譜影像中的端元,典型方法包括內(nèi)部最大體積分析(N-FINDR)[6]、迭代誤差法(iterative error analysis,IEA)[7]、頂點(diǎn)成分分析(vertex component analysis,VCA)[8]等。統(tǒng)計(jì)誤差法通過(guò)引入幾何約束,利用統(tǒng)計(jì)分析的最小誤差來(lái)提取端元,典型方法包括非負(fù)矩陣分解(non-negative matrix factorization,NMF)[9]、穩(wěn)健性協(xié)同非負(fù)矩陣分解(robust collaborative non-negative matrix factorization,RC-NMF)等??臻g投影法根據(jù)單形體向量投影進(jìn)行端元提取,典型方法包括純凈像元指數(shù)(pixel purity index,PPI)[10]、子空間投影(orthogonal subspace projection,OSP)[11]、支持向量機(jī)(support vector machine,SVM)[12]等。融合空間信息法將高光譜影像中的空間信息約束引入求解過(guò)程目標(biāo)函數(shù)中實(shí)現(xiàn)端元提取,典型方法包括自動(dòng)形態(tài)學(xué)端元提取(automated morphological endmember extraction,AMEE)[13]、空間預(yù)處理算法(spatial preprocessing,SPP)[14]等。稀疏回歸算法假設(shè)影像中的光譜信息由幾種純凈像元的光譜曲線組合而成,從光譜庫(kù)中尋找與影像中每一個(gè)混合像元的光譜最接近的光譜子集,可同時(shí)得到端元矩陣和豐度矩陣,代表性方法包括L1/2稀疏約束非負(fù)矩陣分解算法(L1/2-NMF)等。當(dāng)前方法取得了較好的效果,但是并未考慮端元光譜的空間變異和地物分布的復(fù)雜特性,較難實(shí)現(xiàn)復(fù)雜空間格局下地物的純凈端元提取。
VCA算法具有較高的計(jì)算效率,對(duì)于相對(duì)簡(jiǎn)單的地物可進(jìn)行精確的端元提取,是當(dāng)前端元提取算法中較優(yōu)的一種。然而,當(dāng)高光譜影像噪聲較大,地物分布較復(fù)雜時(shí),VCA會(huì)出現(xiàn)嚴(yán)重的端元估計(jì)誤差。為此,本文提出一種空譜協(xié)同的多尺度VCA(collaborative vertex component analysis,CVCA)端元提取方法。首先,對(duì)高光譜影像進(jìn)行預(yù)處理;其次,對(duì)影像進(jìn)行多特征提取,利用多特征對(duì)影像進(jìn)行聚類分割,通過(guò)對(duì)分割圖進(jìn)行降采樣,利用VCA對(duì)低分辨率分割圖進(jìn)行端元提??;然后,將該端元的坐標(biāo)信息映射到高分辨率影像,計(jì)算兩個(gè)端元間的光譜角,確定該端元是否為純凈端元;最后,采用上述步驟對(duì)所有分割圖進(jìn)行操作以得到最終的端元集合。該方法充分利用地物分布的空間異質(zhì)性信息,并考慮噪聲對(duì)端元提取的影響,進(jìn)而提升端元提取的精度。
本文的創(chuàng)新之處在于充分利用原始高光譜影像與降質(zhì)影像的分割圖塊中提取VCA端元的一致關(guān)系來(lái)優(yōu)化選取純凈端元,可以推廣應(yīng)用到其他方法。
VCA算法的基礎(chǔ)為線性混合模型[8]?;谕姑鎺缀螌W(xué)對(duì)高光譜影像進(jìn)行單形分析,該算法認(rèn)為單形體的頂點(diǎn)與端元相一致,在無(wú)先驗(yàn)條件的情況下提取端元。因此,利用線性混合模型對(duì)像元矢量進(jìn)行如下描述
p=αEz+n
(1)
式中,p為B×1維的像元矢量,B為高光譜影像的波段數(shù);Ε=[e1,e2,…,em]代表B×m的端元矩陣,m為端元數(shù)量;α是數(shù)學(xué)形態(tài)學(xué)比例因子;z=[z1,z2,…,zm]T代表m×1維的系數(shù)向量,該向量表示各個(gè)端元在任一像素中所占的成分比例;n為高斯白噪聲。
基于以上模型,觀測(cè)向量集合可形成一個(gè)凸錐,Dp={p∈RB:p=aEz,1Tz=1,z≥0,a≥0}。其中RB表示B維像元集合,當(dāng)α=1時(shí),凸錐可形成簡(jiǎn)單的單形體Vy={y∈RB,y=Ez,1Tz=1,z≥0},單形體的頂點(diǎn)即為端元向量。
凸錐Dp投影到超平面pTv=1形成單形體Vm={γ∈RB:γ=p/(pTv),p∈Dp}。當(dāng)Vm確定后,VCA算法將數(shù)據(jù)反復(fù)正交投影到已知端元構(gòu)成的子空間上,其中最大投影向量為端元。VCA將數(shù)據(jù)首先投影于第一個(gè)方向f1得到第一個(gè)端元,之后將數(shù)據(jù)投影于與第一個(gè)端元正交的方向f2得到下一個(gè)端元,重復(fù)以上過(guò)程,直到滿足所需端元數(shù)。
目前,大多數(shù)算法僅利用光譜信息來(lái)進(jìn)行端元提取,忽略了地物光譜的空間聯(lián)系,導(dǎo)致端元提取不準(zhǔn)確,對(duì)后續(xù)的豐度估計(jì)影響較大。例如,受周圍地理環(huán)境如濕度、光照和地物分布等綜合因素的影響,同一地物可能表現(xiàn)出不同的光譜響應(yīng)特性,從而對(duì)常規(guī)的VCA方法提取端元造成了較大的困難。因此,本文基于傳統(tǒng)的VCA方法,提出了一種空譜協(xié)同的多尺度頂點(diǎn)成分分析方法(CVCA),拓展VCA方法的應(yīng)用范圍,實(shí)現(xiàn)復(fù)雜地表高光譜影像的端元提取(圖1),具體如下。
圖1 CVCA用于端元提取的技術(shù)流程
輸入:高光譜影像數(shù)據(jù),端元數(shù)量。
步驟1:預(yù)處理。主要包括正射校正、輻射定標(biāo)、大氣校正及壞波段剔除,此外,基于低秩分解去噪方法對(duì)高光譜影像進(jìn)行噪聲去除,消除噪聲對(duì)端元提取的影響。
步驟2:影像聚類分割。提取影像的光譜特征(PCA)、紋理特征(LBP)、形狀特征(Canny算子),并通過(guò)K-means方法對(duì)影像多特征進(jìn)行聚類分割。
輸出:提取的純凈端元。
首先對(duì)高光譜影像進(jìn)行空間預(yù)處理,主要包括正射校正、輻射校正、大氣校正、去除壞波段。此外,考慮噪聲對(duì)端元提取的影響,利用低秩矩陣分解[15]對(duì)高光譜影像進(jìn)行去噪,消除噪聲對(duì)后續(xù)端元提取的影響。
高光譜遙感的噪聲模型為
Y=X+S
(2)
式中,Y為高光譜圖像;X為低秩的清晰圖像;S為噪聲,具有稀疏性。低秩矩陣分解表示為
(3)
現(xiàn)實(shí)地理空間包含復(fù)雜的地物類型,通過(guò)影像分割可將空間異構(gòu)區(qū)域進(jìn)行區(qū)分,提升端元提取的精度。同時(shí),為了獲得更好的聚類結(jié)果并提升計(jì)算效率,提取影像的光譜、形狀和紋理特征,并采用多特征融合進(jìn)行聚類分割。
通過(guò)對(duì)影像進(jìn)行主成分變換,提取變換后包含99.5%光譜信息的前5個(gè)主成分分量作為光譜特征[16];利用Canny算子提取影像的形狀特征[17];采用性能較好的局部二值模式(local binary pattern,LBP)算法對(duì)影像的紋理特征進(jìn)行提取[18]。將提取得到的光譜、形狀、紋理特征進(jìn)行疊加,可以較好地提升地物聚類分割的精度,然后采用K-means算法對(duì)影像進(jìn)行聚類分割。通過(guò)對(duì)分割圖像進(jìn)行端元提取,一方面在同質(zhì)區(qū)域進(jìn)行端元提取,較大程度上提升了端元提取的精度,另一方面可以較好地避免場(chǎng)景中出現(xiàn)的“同物異譜”和“異物同譜”的問(wèn)題。
不同空間分辨率下的遙感影像存在不同程度的光譜混合現(xiàn)象,本文認(rèn)為通過(guò)原始高光譜影像空間降采樣,如在降采樣后的影像上選取到的端元與原始影像的端元一致,則說(shuō)明選取的端元足夠純凈以至于在更低分辨率下依舊能夠被提取。
x′=r×x-1
(4)
y′=r×y-1
(5)
式中,(x′,y′)為高分辨率影像端元的空間坐標(biāo)。(x,y)為端元對(duì)應(yīng)的降采樣后低分辨率尺度影像的空間坐標(biāo)。
然后,采用SAM計(jì)算降分辨率影像提取端元與原始影像提取端元間的誤差,通過(guò)對(duì)降采樣后提取的端元與原始地物光譜迭代計(jì)算光譜角,將提取到的每一類端元中最接近真實(shí)地物的SAM取平均值作為端元提取的閾值來(lái)優(yōu)化選取端元
(6)
(7)
式中,ε為閾值;SAM取值區(qū)間為[0,1]。
最后,通過(guò)SAM、SID、CC這3個(gè)指標(biāo)來(lái)評(píng)定端元提取結(jié)果
(8)
(9)
式中,CC的取值區(qū)間為[-1,1]。
試驗(yàn)使用兩個(gè)模擬數(shù)據(jù)集(圖2)和一個(gè)真實(shí)數(shù)據(jù)集(圖3),其參數(shù)見(jiàn)表1。模擬高光譜數(shù)據(jù)使用分形生成來(lái)模擬自然界中的真實(shí)地物分布情況。從USGS光譜庫(kù)中隨機(jī)選取8種地物端元,包括綠泥石、斜綠石、白云石、陽(yáng)起石、鼠尾草、白楊、松樹(shù)和冷杉,然后構(gòu)造不同端元的線性混合以形成合成圖像。使用K-means方法將初始分形圖像劃分為多個(gè)簇分區(qū),其中聚類數(shù)大于圖像的端元數(shù)量。然后,使用高斯濾波器生成每個(gè)簇分區(qū)中像素的豐度比例,確??拷謪^(qū)邊界的像素高度混合。每個(gè)像素的豐度滿足非負(fù)和為1約束,確保所有像素滿足完全限制線性混合模型。最后,將零均值高斯噪聲以30∶1至90∶1的不同信噪比(SNR)添加到合成圖像中。
圖2 模擬數(shù)據(jù)
圖3 真實(shí)數(shù)據(jù)集
表1 試驗(yàn)數(shù)據(jù)集的參數(shù)一覽表
真實(shí)數(shù)據(jù)為高分五號(hào)衛(wèi)星高光譜傳感器于2019年11月14日獲取的黃河口區(qū)域影像,空間分辨率為30 m,波長(zhǎng)范圍為400~2500 nm,通過(guò)剔除水汽吸收嚴(yán)重的22個(gè)波段,共308波段用于試驗(yàn)。黃河口地區(qū)12種地物端元:海洋、河流、養(yǎng)殖池、坑塘、蘆葦、互花米草、檉柳、旱地、水田、灘涂、鹽沼、建筑,參考端元光譜曲線來(lái)源于實(shí)地采樣,獲取每類地物的10個(gè)樣本的均值作為真實(shí)光譜。
試驗(yàn)采用7種對(duì)比方法,包括AMEE、VCA、EEBQ(endmember extraction using band quality)[19]、ECSO(entropy-based convex set optimization)[20]、SPP、IEA和N-FINDR。采用光譜角(SAM)、光譜散度指標(biāo)(SID)和相關(guān)系數(shù)(CC)對(duì)端元進(jìn)行定量評(píng)估。SID與SAM、CC在數(shù)值相差一個(gè)量級(jí),模擬數(shù)據(jù)集結(jié)果圖中對(duì)SID增加了一個(gè)量級(jí)來(lái)凸顯不同方法的指標(biāo)差異。
圖4、圖5展示了模擬數(shù)據(jù)集1的端元評(píng)估結(jié)果。所有方法在綠泥石、白云石、鼠尾草和冷杉的端元提取中取得了較好的結(jié)果,但對(duì)于斜綠石、陽(yáng)起石、白楊和松樹(shù)的端元識(shí)別存在明顯差異。AMEE、EEBQ、N-FINDR和VCA結(jié)果較好,IEA、SPP和ECSO的端元識(shí)別結(jié)果較差。CVCA在所有地物都與參考端元光譜曲線最接近,效果最優(yōu)。
圖4 模擬數(shù)據(jù)集1端元對(duì)比結(jié)果
圖5 模擬數(shù)據(jù)集1端元精度定量評(píng)估結(jié)果
圖6、圖7展示了模擬數(shù)據(jù)集2的端元對(duì)比結(jié)果。提取的8種地物端元為方解石、石灰石、融雪、冰水、尼龍纖維、玻璃纖維、橡樹(shù)、苔蘚。所有方法在方解石、融雪、尼龍纖維、玻璃纖維的端元提取中取得了很好的結(jié)果,但是石灰石、冰水、橡樹(shù)、苔蘚的端元識(shí)別結(jié)果存在較大差異,多數(shù)方法都取得了較差的結(jié)果,尤其是N-FINDR和ECSO。相比而言,CVCA仍然在所有地物的端元提取中取得了最好的結(jié)果。
圖6 模擬數(shù)據(jù)集2端元結(jié)果
為了探究不同尺度降采樣對(duì)端元提取的影響,在真實(shí)數(shù)據(jù)集中將降采樣系數(shù)分別設(shè)置為:3、5、7、9,對(duì)不同系數(shù)下CVCA提取的12類端元的SAM、SID、CC及計(jì)算時(shí)間計(jì)算平均值,結(jié)果見(jiàn)表2,降采樣系數(shù)為3的情況下,端元提取的各項(xiàng)評(píng)價(jià)指標(biāo)結(jié)果最優(yōu)。
表2 不同尺度降采樣的定量評(píng)估結(jié)果
為了驗(yàn)證CVCA在真實(shí)數(shù)據(jù)集中的應(yīng)用性能,采用高分五號(hào)黃河口高光譜數(shù)據(jù)進(jìn)行驗(yàn)證。以黃河口真實(shí)采樣數(shù)據(jù)與實(shí)測(cè)的地物光譜信息作為先驗(yàn)知識(shí),對(duì)黃河口進(jìn)行聚類,為了探究最適合的聚類類別,對(duì)真實(shí)數(shù)據(jù)集中聚類分別設(shè)置為:1、2(水體、其他地物)、3(水體、植被、其他地物)、4(水體、植被、土地、建筑4類)、5(水體、植被、耕地、建筑、未利用地)、6(天然水體、人工水體、植被、耕地、建筑、未利用地),計(jì)算對(duì)應(yīng)聚類情況下提取得到的12類端元的SAM、CC與SID計(jì)算平均值,定量結(jié)果見(jiàn)表3,聚類類別設(shè)置為4的情況下穩(wěn)健性最好。
表3 不同聚類類別下的定量評(píng)估結(jié)果
試驗(yàn)中,CVCA方法將真實(shí)數(shù)據(jù)聚類為水體、植被、土地、建筑4類。結(jié)合先驗(yàn)知識(shí),對(duì)各分割圖進(jìn)行端元提取,在分割圖中共提取得到12類端元,分別為:海洋、河流、養(yǎng)殖池、坑塘(水體分割圖);蘆葦、互花米草、檉柳(植被分割圖);水田、旱地、灘涂和鹽沼(土地分割圖);建筑(建筑分割圖)。
圖8和表4展示出了8種方法的端元提取結(jié)果??梢钥闯觯捎谡鎸?shí)地物的復(fù)雜性,所有方法所提取的端元與真實(shí)端元存在一定差異。N-FINDR、IEA和ECSO取得了較差的結(jié)果,AMEE、SPP、EEBQ和VCA次之,CVCA方法在提取的所有地物的端元中取得了最好結(jié)果。綜上所述,CVCA方法端元提取精度總體優(yōu)于其他方法,并且能較好地用于復(fù)雜場(chǎng)景中。
表4 真實(shí)數(shù)據(jù)集的端元定量評(píng)估結(jié)果
圖8 不同方法與真實(shí)數(shù)據(jù)集的端元對(duì)比結(jié)果
在解混的過(guò)程中,端元提取產(chǎn)生的誤差會(huì)傳遞到豐度反演中。因此,本文通過(guò)豐度估計(jì)方法SUNSAL(sparse unmixing by variable splitting and augmented Lagrangian)[21]對(duì)各種方法的端元實(shí)現(xiàn)影像重構(gòu)以驗(yàn)證端元。圖9展示了重組結(jié)果與原始影像的SAM圖。AMEE和IEA、ECSO在與不同的豐度估計(jì)方法組合時(shí)得到了最差的重構(gòu)結(jié)果,SPP、N-FINDR、EEBQ和VCA次之,CVCA方法的重構(gòu)誤差最小,同樣證明了本方法的有效性。
圖9 SUNSAL重組影像光譜角評(píng)估結(jié)果
為了進(jìn)一步探究噪聲對(duì)端元提取的影響,本文進(jìn)行了去噪前后端元提取的對(duì)比試驗(yàn),如圖10所示,通過(guò)CVCA方法對(duì)真實(shí)數(shù)據(jù)集提取了8個(gè)端元。同時(shí)在未經(jīng)去噪處理的CVCA方法上進(jìn)行端元提取,通過(guò)表5中的SAM、SID、CC指標(biāo)對(duì)去噪前后提取的端元精度進(jìn)行評(píng)估??梢钥吹?,噪聲存在的情況下同樣的方法提取的端元有較大差異,因此,噪聲在端元提取過(guò)程中的影響不應(yīng)該被忽視。
圖10 去噪前后的端元對(duì)比結(jié)果
表5 真實(shí)數(shù)據(jù)集去噪前后的端元定量評(píng)估結(jié)果
本文針對(duì)當(dāng)前VCA端元提取方法較難對(duì)復(fù)雜地物環(huán)境的端元進(jìn)行精確提取的問(wèn)題,提出了一種基于空-譜協(xié)同的多尺度CVCA端元提取方法。該方法充分利用地物分布的空間異質(zhì)性信息,并考慮噪聲對(duì)端元提取的影響,提升端元提取的精度。通過(guò)模擬數(shù)據(jù)和真實(shí)數(shù)據(jù),利用定量分析和重構(gòu)分析的試驗(yàn)表明,該方法比其他7種主流方法的提取結(jié)果更加準(zhǔn)確,并且端元光譜更接近真實(shí)地物光譜。在后續(xù)的研究中,筆者將用星空一體的真實(shí)高光譜影像數(shù)據(jù)來(lái)進(jìn)行正向有監(jiān)督驗(yàn)證,同時(shí)將利用后續(xù)發(fā)射的國(guó)產(chǎn)高光譜衛(wèi)星,采用更多研究試驗(yàn)區(qū)來(lái)綜合驗(yàn)證本文方法。