宇 潔 葉 勤 林 怡
(1.同濟(jì)大學(xué)測繪與地理信息學(xué)院, 上海 200092; 2.同濟(jì)大學(xué)環(huán)境科學(xué)與工程學(xué)院, 上海 200092)
混合像元普遍存在于中低分辨率的遙感影像中,給圖像定量化解譯造成困擾[1]。因此,如何準(zhǔn)確獲取組成混合像元的端元類型及其在像元中的豐度值成為定量遙感的研究熱點(diǎn)[2]?;旌舷裨S度值解算精度的高低很大程度上取決于端元信息獲取的準(zhǔn)確性[3]。目前,針對(duì)混合像元端元提取和選擇問題,國內(nèi)外學(xué)者展開了大量研究。
常見獲取端元信息的方法可分為:利用地物光譜儀實(shí)地采集光譜數(shù)據(jù)[4-5]、從典型地物光譜庫中獲取[6-7]和直接在影像上選取[8-9]。前兩種方法多適用于高光譜數(shù)據(jù),而針對(duì)多光譜數(shù)據(jù)時(shí),現(xiàn)有的研究多采用直接從數(shù)據(jù)本身獲取的方法。在大多數(shù)傳統(tǒng)混合像元端元提取和選取算法中,假設(shè)不同端元的光譜特征具有類別間差異性和時(shí)空穩(wěn)定性,即不同地物具有絕對(duì)不同的光譜特征曲線和同類地物的光譜曲線不會(huì)受外在因素的影響而變化。然而,受到傳感器、大氣、周圍環(huán)境等因素的影響,影像上普遍存在同物異譜和同譜異物的現(xiàn)象[10]。同時(shí)對(duì)于狀態(tài)會(huì)隨時(shí)間發(fā)生變化的地物,同一遙感數(shù)據(jù)中可能包含同類地物多種狀態(tài)的不同光譜特征(如同種植被不同生長狀態(tài))。當(dāng)影像中存在上述端元差異問題時(shí),將極大影響影像中典型端元提取的準(zhǔn)確性和混合像元分解的精度。此時(shí),傳統(tǒng)端元提取與選擇的方法將不再適用。目前國外學(xué)者對(duì)端元問題已經(jīng)展開了許多研究,而在國內(nèi),對(duì)此問題的研究尚不多。本文將針對(duì)中低分辨率多光譜遙感影像上端元差異問題展開深入研究。
端元差異問題主要包含端元類內(nèi)差異(Intra-class variability)和類間差異(Inter-class variability)[11]。各類算法通過在一定程度上縮小類內(nèi)差異、擴(kuò)大類間差異來達(dá)到提高解混精度的目的。SOMERS等[12]將現(xiàn)有的解決端元差異的算法分成5大類:迭代混合分析、光譜特征選擇、光譜波段加權(quán)、光譜轉(zhuǎn)換和光譜建模。
(1)迭代混合分析類算法首先需要定義由所有可能端元組合組成的端元組合候選庫。然后針對(duì)每個(gè)混合像元,通過循環(huán)迭代的方法從候選的端元組合庫中選出適合該像元的最優(yōu)端元組合作為該像元的解混結(jié)果。多端元光譜混合分析(Multiple endmember spectral mixture analysis, MESMA)[13]是其中應(yīng)用最為廣泛的一種算法[14-16]。雖然此類算法能夠有效地解決端元類內(nèi)差異問題,但也大大增加了算法的計(jì)算量。同時(shí)此類算法在波段較少的多光譜數(shù)據(jù)中的應(yīng)用也存在局限性。
(2)光譜特征選擇則是選取某個(gè)特定指數(shù)作為評(píng)定指標(biāo),對(duì)各個(gè)波段的指標(biāo)值進(jìn)行排序后選擇能使類內(nèi)差異最小和類間差異最大的光譜特征組合。常用算法包括主成分分析(Principle component analysis, PCA)[17]、最佳指數(shù)因子(Optimal index factor, OIF)[18]、互信息(Mutual information, MI)[19]、不穩(wěn)定指數(shù)(Instability index, ISI)[20]等。此類算法雖然能有效避免計(jì)算量過大的問題,但在波段篩選過程中會(huì)有部分信息丟失。
(3)光譜波段加權(quán)是在傳統(tǒng)各波段等權(quán)參與解混的基礎(chǔ)上,對(duì)與類內(nèi)端元差異相關(guān)性較小、與類間端元差異相關(guān)性大的波段賦予更高的權(quán)重。此類算法雖在一定程度上減小端元差異帶來的影響[21-22],但目前權(quán)重設(shè)置沒有統(tǒng)一理論模型,常常需要根據(jù)研究區(qū)域?qū)嶋H情況和專家知識(shí)來確定。
(4)光譜轉(zhuǎn)換是將原始波段數(shù)據(jù)經(jīng)過一系列小波變換[23]、求導(dǎo)[24]、歸一化變換[25]等,獲得具有更小類內(nèi)差異和更大類間差異的新特征值來進(jìn)行混合像元解混。轉(zhuǎn)換過程雖然降低了數(shù)據(jù)冗余度,但數(shù)據(jù)容易受到噪聲及其它不確定因素污染,影響最終解混結(jié)果準(zhǔn)確性。
(5)光譜建模算法則建立在各種輻射傳輸模型理論基礎(chǔ)上,根據(jù)研究區(qū)域具體環(huán)境、氣候因素,構(gòu)建相應(yīng)的地物波譜庫。但模型的準(zhǔn)確構(gòu)建需要一定的先驗(yàn)知識(shí)。
5類算法中,光譜特征選擇算法因?yàn)橛?jì)算簡單、易于實(shí)現(xiàn)的優(yōu)點(diǎn)而被廣泛用于解決端元差異問題。本文針對(duì)普遍存在的端元差異問題,為了避免端元因在不同波段的光譜值的數(shù)值尺度相差很大帶來的影響,將變異系數(shù)(Coefficient of variation, CV)[26]的概念引入光譜波段選擇研究中。結(jié)合特征選擇類和加權(quán)類算法的優(yōu)點(diǎn),基于不等權(quán)思路提出一種能夠自動(dòng)定權(quán)的加權(quán)變異系數(shù)分析法(Weighted CV analysis, WCVA),盡可能減小端元差異問題帶來的影響。并從理論基礎(chǔ)和真實(shí)數(shù)據(jù)驗(yàn)證兩方面論證WCVA在解決端元差異問題中的可行性。以多光譜影像(TM影像)作為實(shí)驗(yàn)數(shù)據(jù),采用對(duì)應(yīng)更高空間分辨率的多光譜影像(Geoeye影像)作為參考豐度值進(jìn)行定量精度評(píng)定。將WCVA的結(jié)果與常用的OIF方法的結(jié)果進(jìn)行比較,并驗(yàn)證其優(yōu)越性。
遙感數(shù)據(jù)最佳波段組合的定量分析原理是根據(jù)所包含的信息量最大或類間可分性最大的原則,選擇最佳的波段組合,更利于影像解譯。目前應(yīng)用比較廣泛的選取方法有最佳指數(shù)因子法(OIF)、波段熵比較法、協(xié)方差矩陣特征值法等。為了驗(yàn)證本文提出的WCVA算法的可行性,實(shí)驗(yàn)中同時(shí)設(shè)計(jì)了定量和定性兩個(gè)對(duì)比實(shí)驗(yàn),將WCVA結(jié)果與OIF結(jié)果做比較。
在解決端元差異問題的光譜特征選擇類別方法中,OIF[27]同時(shí)兼顧了單個(gè)波段影像的信息量和波段間的相關(guān)性,且計(jì)算簡單、易于實(shí)現(xiàn)。因此,采用OIF結(jié)果與本文提出的算法進(jìn)行對(duì)比。OIF計(jì)算公式為
(1)
式中σi——第i波段對(duì)應(yīng)的標(biāo)準(zhǔn)差
rij——波段i和波段j間的相關(guān)系數(shù)
OIF指數(shù)越大,則相應(yīng)波段組合包含的信息量就越大。
為了消除端元差異問題,需要盡可能減小類內(nèi)端元間離散度和擴(kuò)大類間端元的離散度。通過地物光譜曲線分析,發(fā)現(xiàn)研究區(qū)域內(nèi)不同端元在不同波段的光譜數(shù)值尺度相差很大,此時(shí)單純僅用標(biāo)準(zhǔn)差已經(jīng)不能準(zhǔn)確描述數(shù)據(jù)的離散程度。為了消除測量尺度的影響,研究中引入了CV的概念。
在概率論和統(tǒng)計(jì)學(xué)中,CV常常被用于描述數(shù)據(jù)分布的離散程度[28]。它是由標(biāo)準(zhǔn)差和均值的比值構(gòu)成,表達(dá)式為
Cv=σ/μ×100%
(2)
其中
μ=∑xi/n
(3)
(4)
式中,σ和μ分別表示數(shù)據(jù)集X={x1,x2,…,xn}的標(biāo)準(zhǔn)差和均值。
CV能夠有效消除測量尺度和量綱的影響,并已廣泛應(yīng)用于物理學(xué)、分析化學(xué)、工程學(xué)等領(lǐng)域。CV值越大,數(shù)據(jù)集的離散程度越大。
同時(shí),因?yàn)椴煌ǘ螌?duì)于端元差異問題的敏感程度不同,將對(duì)不同波段按照重要性差異設(shè)置不同的權(quán)值
(5)
其中
∑wi=1
(6)
式中Cvi——第i波段對(duì)應(yīng)的CV值
基于以上公式,為了盡可能減小端元差異問題的影響,最小化端元類內(nèi)差異、最大化端元類間差異,提出一種新的基于CV的加權(quán)波段選取策略(WCVA):
(1)計(jì)算所有類間和類內(nèi)候選端元在各光譜波段對(duì)應(yīng)CV值。
(2)根據(jù)所得各波段CV值按照類間和類內(nèi)分別進(jìn)行重要性從高到低排序。
(3)選取類間CV值大且類內(nèi)CV值小的波段組成新的波段組合。
(4)根據(jù)類間端元CV值計(jì)算新波段組合中各波段的權(quán)值,完成WCVA。
選用空間分辨率為30 m的TM數(shù)據(jù)(獲取時(shí)間為2009年8月28日)作為待分析圖像,研究區(qū)域位于廣西壯族自治區(qū)合浦縣東部北海市沙田半島,該半島屬于南亞熱帶季風(fēng)型海洋性氣候,主要由3類地物組成:水域、桉樹林和裸地,如圖1a所示。而研究區(qū)域內(nèi)的桉樹林由于砍伐原因處于不同生長階段(圖中已標(biāo)出,S1、S2、S3為對(duì)應(yīng)3個(gè)生長狀態(tài)),導(dǎo)致在光譜上也存在差異,即桉樹林存在類內(nèi)差異。同時(shí),選用空間分辨率為2 m的GeoEye影像(獲取時(shí)間為2009年10月16日)作為分解結(jié)果精度評(píng)定的參考影像。TM每個(gè)像素在GeoEye中對(duì)應(yīng)15×15個(gè)像素。實(shí)驗(yàn)中TM和GeoEye數(shù)據(jù)均使用FLAASH模型進(jìn)行預(yù)處理。
圖1 研究區(qū)域多光譜假彩圖像Fig.1 Multispectral false colour images
實(shí)驗(yàn)中的解混參考圖由GeoEye影像處理后得到,設(shè)定原始GeoEye影像中所有像元均為純像元。首先使用SVM將GeoEye影像分成3類(水域、桉樹林和裸地);然后用一個(gè)15×15的窗口進(jìn)行逐行移動(dòng),統(tǒng)計(jì)窗口中各類地物的像元數(shù);根據(jù)統(tǒng)計(jì)結(jié)果計(jì)算各類地物在15×15的窗口中所占百分比;最后按照百分比繪制豐度值參考圖。
圖2是WCVA算法與對(duì)比實(shí)驗(yàn)整體流程圖。實(shí)驗(yàn)將WCVA結(jié)果與OIF結(jié)果進(jìn)行比較,并從定性對(duì)比、定量效率和精度3方面對(duì)WCVA進(jìn)行精度評(píng)定:
(1)對(duì)所有可能的候選波段組合(考慮到研究區(qū)域內(nèi)端元數(shù)量和解混算法的限制,本文候選波段組合由原始6個(gè)波段和所有可能的5個(gè)波段構(gòu)成)進(jìn)行主成分分析,以第一、二主成分作為橫、縱坐標(biāo)軸繪制樣本點(diǎn)二維空間分布,根據(jù)不同類內(nèi)及類間樣本點(diǎn)分布情況對(duì)WCVA結(jié)果與OIF結(jié)果進(jìn)行定性比較分析。
(2)統(tǒng)計(jì)OIF和WCVA運(yùn)算時(shí)間,定量比較兩種方法的效率。
(3)分別用多項(xiàng)式后非線性混合模型(Polynomial post-nonlinear model, PPNM)和模糊C均值(Fuzzy c-mean, FCM)模型對(duì)所有可能的候選波段組合進(jìn)行混合像元解混。使用均方根誤差(Root mean square error, RMSE)對(duì)各候選波段組合進(jìn)行精度評(píng)定,定量比較分析WCVA與OIF的結(jié)果。
圖2 WCVA算法與對(duì)比實(shí)驗(yàn)整體流程圖Fig.2 Flow chart of WCVA approach
表1給出了不同波段對(duì)應(yīng)水域、桉樹林和裸地3類地物間和桉樹林3個(gè)不同生長狀態(tài)內(nèi)的CV和OIF值,其中Bi表示第i波段。為了使類內(nèi)(3個(gè)不同生長狀態(tài))差異最小、類間(水域、桉樹林和裸地)差異最大,應(yīng)盡可能選取類間高CV/OIF值、類內(nèi)低CV/OIF值波段組成最優(yōu)波段組合。
表1 各波段對(duì)應(yīng)類內(nèi)、類間端元差異的CV和OIF結(jié)果Tab.1 CV and OIF results of intra- and inter-class variability for different band combinations
根據(jù)最優(yōu)波段選取準(zhǔn)則將類內(nèi)和類間各光譜的重要性按從高到低的順序進(jìn)行排序,結(jié)果見表2。通過分析可以發(fā)現(xiàn),在CV結(jié)果中波段4的類內(nèi)CV值高而類間CV值低,不利于減小端元差異,應(yīng)當(dāng)刪除,故最優(yōu)波段由波段1~3、波段5和波段7組成。而在OIF結(jié)果中,波段7或5更不利于減小端元差異,從而得出最優(yōu)波段組合為:波段1~5,或者波段1~4+7兩種組合。
表2 WCVA和OIF結(jié)果中各波段對(duì)應(yīng)于類內(nèi)差異和類間差異問題重要性排序Tab.2 Optimal band order of WCVA and OIF for intra- and inter-class variability
為了更直觀比較各個(gè)波段組合結(jié)果,圖3給出了所有可能的波段組合經(jīng)PCA處理后各類間及類內(nèi)端元的二維可視化分布圖,并在圖中標(biāo)識(shí)出了桉樹林類內(nèi)的3個(gè)生長狀態(tài)分布疏密情況。分布圖分別以PCA變換后的第一和第二主成分作為橫、縱坐標(biāo)。很顯然,CV結(jié)果給出的最優(yōu)波段組合的類內(nèi)端元分布更緊密,離散度更小,說明它在減小類內(nèi)差異問題上更具有優(yōu)勢。同時(shí),為了擴(kuò)大類間差異,WCVA中各波段按照類間CV值結(jié)果進(jìn)行波段加權(quán),然后利用PPNM和FCM對(duì)加權(quán)后的各波段組合進(jìn)行混合像元解混并計(jì)算解混結(jié)果的RMSE值(表3)。從表3可以看出,PPNM和FCM均在B1+B2+B3+B5+B7組合處獲得最高解混精度,與WCVA結(jié)果一致。WCVA運(yùn)算時(shí)間為0.942 s,明顯比OIF的1.859 s短,其運(yùn)算效率是OIF的2倍左右。
因此,WCVA與傳統(tǒng)OIF方法相比,能夠更快速、有效地減小類內(nèi)差異問題并相對(duì)擴(kuò)大類間差異,提高了最終的混合像元解混精度。
圖3 各波段組合PCA變換后端元分布可視化圖Fig.3 Visualization diagrams of different band combinations based on PCA
解混方法波段組合B2+B3+B4+B5+B7B1+B3+B4+B5+B7B1+B2+B4+B5+B7B1+B2+B3+B5+B7B1+B2+B3+B4+B7B1+B2+B3+B4+B5B1+B2+B3+B4+B5+B7PPNM0.2140.2140.2180.1830.2180.2190.213FCM0.1630.1630.1640.1600.1670.1670.162
端元差異問題普遍存在于中低分辨率的多光譜影像中,大大降低了端元提取的準(zhǔn)確性和混合像元分解精度。為了減小端元差異問題對(duì)地物信息提取精度的影響,本文從特征選擇及設(shè)置不同特征權(quán)重兩方面出發(fā),提出一種能自動(dòng)定權(quán)的加權(quán)變異系數(shù)法(WCVA)。在WCVA中首先引入變異系數(shù)(CV),避免了測量尺度和量綱的影響。然后,結(jié)合加權(quán)理論,以CV作為度量各波段對(duì)端元差異問題敏感程度的指標(biāo)進(jìn)行自動(dòng)定權(quán),提高了定權(quán)過程的自動(dòng)化程度。最后根據(jù)最小化端元類內(nèi)差異和最大化端元類間差異的原則構(gòu)建解決端元差異問題的最優(yōu)波段組合。同時(shí),為了驗(yàn)證WCVA的可行性與有效性,選取OIF作為對(duì)比算法,設(shè)計(jì)了精度和效率兩方面的對(duì)比實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果表明:通過 WCVA獲得的最優(yōu)波段組合在PPNM和FCM模型中的解混精度均明顯高于OIF,而耗時(shí)僅為OIF的一半。因此WCVA在處理多光譜影像端元差異問題時(shí)具有精度高、計(jì)算量小的優(yōu)勢。