房 森,曹文杰,完 誠(chéng)
(中國(guó)船舶集團(tuán)有限公司第八研究院,江蘇 揚(yáng)州 225101)
高光譜遙感技術(shù)是在遙感技術(shù)的基礎(chǔ)上發(fā)展并成長(zhǎng)起來的一種新型的對(duì)地觀測(cè)技術(shù),是20世紀(jì)80年代開始興起的一種新的遙感技術(shù),其主要的特點(diǎn)是能夠提供較多的地物光譜波段,以較高的光譜分辨率解決大多在全色和多光譜遙感中無法解決的問題。高光譜圖像有效地綜合了代表地物輻射特性的光譜信息和反映空間幾何關(guān)系的圖像信息,有效實(shí)現(xiàn)了“圖譜合一”。高光譜圖像在光譜分辨率方面擁有其他圖像無可比擬的優(yōu)勢(shì),但是其空間分辨率相對(duì)較低,因此在圖像中很容易出現(xiàn)混合像元現(xiàn)象?;旌舷裨傅氖歉吖庾V圖像中某些像元對(duì)應(yīng)的地面區(qū)域中包含多種不同的地物,它是遙感成像空間尺度有限性和自然界地物復(fù)雜程度的無限性之間矛盾的體現(xiàn)。混合像元成為影響高光譜圖像處理精度進(jìn)一步提升的重要因素,限制了遙感圖像處理的進(jìn)一步發(fā)展。因此,如何有效解決高光譜圖像中存在的混合像元問題以提高遙感圖像處理精度是一個(gè)重要的研究方向。
線性光譜混合模型和非線性光譜混合模型是高光譜圖像處理中較為常用的2種模型。線性光譜混合模型比較簡(jiǎn)單,該模型假設(shè)高光譜圖像中混合像元的端元組成是以線性比例完成的,即到達(dá)成像光譜儀的光子在傳播過程中只與成像區(qū)域中的一種地物發(fā)生作用,而不考慮光子在多種地物之間的多重散射作用。當(dāng)光子在地物之間發(fā)生多重散射作用時(shí),就需要考慮使用非線性光譜混合模型對(duì)像元進(jìn)行建模。非線性光譜混合模型更符合實(shí)際的高光譜圖像成像原理,但是與線性光譜混合模型相比,非線性光譜混合模型使用起來較為麻煩,因此在大多數(shù)高光譜圖像混合像元解混文章中均使用線性光譜混合模型對(duì)混合像元進(jìn)行建模。
使用線性光譜混合模型對(duì)混合像元進(jìn)行建模主要分為2個(gè)步驟:第一首先建立針對(duì)特定研究區(qū)域的高光譜圖像端元集,然后使用特定的混合像元解混算法對(duì)高光譜圖像中的所有像元進(jìn)行解混,得到所在區(qū)域每種地物在每一個(gè)像元中所占的比例,即豐度。端元集中的端元可以從已有的光譜庫中提取或經(jīng)過野外實(shí)地測(cè)量得到,還可以利用N-FINDR、PPI、IEA等端元提取算法從指定的高光譜圖像中提取。端元提取的精度對(duì)后續(xù)的高光譜圖像解混有著重要的影響。在傳統(tǒng)的線性光譜混合模型中,每種地物類別均采用一個(gè)端元來表示,并沒有考慮到端元光譜的變異現(xiàn)象以及由該現(xiàn)象引起的端元個(gè)數(shù)的變化。由于高光譜圖像的空間幅度較廣,導(dǎo)致每種地物端元內(nèi)部光譜變化一般很大,在這種情況下很難用一個(gè)單一固定的端元準(zhǔn)確地表示一個(gè)地物類別。在需要準(zhǔn)確知道各個(gè)端元在混合像元中所占比例的應(yīng)用中,傳統(tǒng)的固定端元的線性光譜混合模型會(huì)引起較大的解混誤差。針對(duì)這個(gè)不足,Roberts等人提出了一種新型的高光譜圖像混合像元解混算法,即多端元光譜混合分析(MESMA)。MESMA考慮到端元光譜曲線可能出現(xiàn)的變異情況,迭代地調(diào)整像元中端元的種類和數(shù)量。然而,對(duì)于高光譜圖像中的每一個(gè)像元,MESMA需要使用光譜庫中所有的端元組合來對(duì)混合像元進(jìn)行解混,然后根據(jù)最小重構(gòu)誤差準(zhǔn)則為每個(gè)像元建立一系列的候選端元集,最后將重構(gòu)誤差最小的端元集作為該像元最佳的端元組合,所得的豐度向量就是該端元集中的每一個(gè)端元在該混合像元中所占的比例。MESMA能夠克服端元變異現(xiàn)象,得到的解混精度較高,但是該方法所需要的計(jì)算量較大。為此,文獻(xiàn)[3]提出一種基于分組尋優(yōu)的多端元高光譜解混算法,該方法最終所得的計(jì)算精度與MESMA相當(dāng),但是該算法所需的計(jì)算量相對(duì)較小。
由于大部分高光譜圖像所覆蓋的實(shí)際地理范圍較廣,所以在高光譜圖像中存在大量由于光照和地形因素引起的地物端元變異現(xiàn)象,這會(huì)嚴(yán)重影響高光譜圖像的解混精度。為此本文在基于分組尋優(yōu)的多端元高光譜解混算法的基礎(chǔ)上提出一種基于擴(kuò)展線性模型的多端元高光譜圖像解混算法。擴(kuò)展線性模型能夠有效應(yīng)對(duì)地物端元變異現(xiàn)象,提高高光譜圖像的解混精度。
解決高光譜圖像中存在的混合像元問題需要建立一定的模型,目前主要存在2種光譜混合模型:線性光譜混合模型和非線性光譜混合模型。
線性光譜混合模型是假設(shè)太陽光子只與一種地物發(fā)生相互作用,并將其光譜信號(hào)疊加到像元光譜中,地物之間沒有相互作用。相反地,非線性光譜混合模型由于同一場(chǎng)景內(nèi)多種地物之間反射光的相互作用,可以認(rèn)為是一個(gè)迭代乘積過程,是非線性的。非線性混合模型的建立和求解都相對(duì)比較困難,因此基于非線性混合模型的光譜解混研究較少。相比之下,線性混合模型因其物理意義明確而容易建立模型,因此,對(duì)其研究的相對(duì)較多。本文正是基于線性光譜混合模型對(duì)高光譜圖像進(jìn)行研究。
光譜解混技術(shù)作為混合像元處理的最主要技術(shù),要求得各個(gè)端元在其中所占的比例,是一種更為精確的分類技術(shù)。
傳統(tǒng)的線性光譜混合模型假設(shè)太陽光子在到達(dá)成像光譜儀之前只與一種地物發(fā)生作用,而沒有與其它地物發(fā)生作用。如果1幅高光譜圖像中包含有個(gè)地物端元,且每個(gè)地物端元有個(gè)波段,假設(shè)這幅高光譜圖像具有個(gè)像元,那么其中的每一個(gè)像元均是由這個(gè)地物端元以不同的比例組合而成的,這種組合過程即線性光譜混合模型:
(1)
式中:是地物端元在某一像元中所占的比例,也被稱之為豐度,通常被理解為端元在像元對(duì)應(yīng)地面區(qū)域中的面積比例;為誤差項(xiàng),反映了由環(huán)境引起以及成像系統(tǒng)產(chǎn)生的隨機(jī)誤差。
式(1)表示的是單個(gè)像元的線性組合過程,將所有像元的線性組合過程寫在一起可以得到線性光譜混合模型的矩陣形式:
=+
(2)
式中:表示的整個(gè)高光譜圖像矩陣,矩陣中的每一列代表一個(gè)像元;表示該圖像中包含的所有地物端元的矩陣,其中每一列代表一個(gè)地物端元;表示豐度矩陣,它的每一行表示不同地物端元在不同像元中所占的比例;表示誤差矩陣。
傳統(tǒng)的線性光譜混合模型的優(yōu)點(diǎn)是它的建立和求解比較簡(jiǎn)單,但是該模型并不能考慮到某種地物在高光譜圖像中所有的變異情況。本文在線性光譜混合模型的基礎(chǔ)上使用了一種被稱為擴(kuò)展的線性光譜混合模型,該模型可以將地物端元所有的變異情況表示出來,具體表示如下:
(3)
式中:是一個(gè)以某地物端元為參數(shù)的函數(shù),然后對(duì)進(jìn)行變換,變換的結(jié)果相當(dāng)于端元發(fā)生了變異。
令()=,則式(3)可以寫成:
(4)
式中:是一個(gè)元素值非負(fù)的×維對(duì)角矩陣;表示端元矩陣中的所有端元在像元中的變異情況。
同樣也可以得到式(4)的矩陣形式:
=(°)+
(5)
式中:為×維矩陣,為假設(shè)高光譜圖像的像元個(gè)數(shù),包含了端元矩陣中所有端元在所有像元中的變異因子,變異端元為原始端元乘上對(duì)應(yīng)的變異因子。
豐度反演就是將每個(gè)端元在像元中所占比例精確地計(jì)算出來。大多數(shù)文獻(xiàn)均以最小二乘豐度反演方法為基礎(chǔ),并在此基礎(chǔ)上做進(jìn)一步的改進(jìn)。如果端元矩陣共有個(gè)端元,即=[,,…,],單個(gè)像元的豐度向量表示為=[,,…,],代表噪聲向量。將高光譜圖像中的任意混合像元表示為個(gè)端元在豐度值,,…,下的線性組合,即:
=+
(6)
如果高光譜圖像的波段數(shù)較大,那么端元矩陣為列滿秩矩陣。若將式(6)看成是方程組,即為超定方程組。通過最小二乘法求誤差的方式可以將上式求解出來,具體的求解公式可以表示成:
(7)
由于端元豐度代表的是端元在像元中所占的比例,以及所有端元在某一像元中的豐度之和為1,因此通過給式(7)加上不同的約束條件可以得到不同約束條件下的最小二乘法,使獲得的豐度結(jié)果更滿足實(shí)際條件。不同條件下的最小二乘法如下:
(1) 無約束最小二乘算法
當(dāng)不對(duì)可能得到的豐度解施加任何約束條件時(shí),運(yùn)用最小二乘法所得到的豐度的無約束解為:
(8)
(2) “和為1”約束最小二乘算法
由于各個(gè)端元在任一像元中的比例之和為1,當(dāng)施加這個(gè)條件時(shí),式(7)變成:
(9)
使用最小二乘法對(duì)式(9)進(jìn)行求解時(shí),可得部分解為:
(10)
式中:為階單位矩陣;[1,1,…,1],是元素全是1的維列向量。
(3) “非負(fù)”約束最小二乘法
由于最終所得豐度值必須是非負(fù)的,因此需要求解的豐度值施加非負(fù)約束:
(11)
(4) 全約束最小二乘法
為了獲得更加真實(shí)的豐度解,需要在式(11)中加上和為1的約束條件:
(12)
如果端元在像元中所占的比例較小,并且圖像信噪比不高,那么使用傳統(tǒng)的混合像元解混算法會(huì)受到噪聲的影響,導(dǎo)致小豐度地物在該像元中的檢測(cè)受到影響,使小豐度地物可能被噪聲湮沒,影響高光譜圖像混合像元解混的精度。分組尋優(yōu)算法提高混合像元解混精度的思想是將一種地物的端元分成1組,在進(jìn)行混合像元解混時(shí),可以利用端元光譜曲線之間的相關(guān)性充分?jǐn)U大該種地物在像元中的存在。分組尋優(yōu)算法的優(yōu)點(diǎn)是對(duì)小信噪比的地物檢測(cè)具有較好的效果。
如果1幅高光譜圖像中有4種地物,分別記為、、和,為了考慮端元變異的情況,每種地物包含3種地物光譜曲線,分別記為[,,]、[,2,2]、[,3,3]和[,4,4]。每種地物的光譜曲線既可以從光譜庫中提取,也可以使用端元提取算法從所要研究的高光譜圖像中提取。下面簡(jiǎn)單敘述基于分組尋優(yōu)的高光譜圖像混合像元解混[]算法的過程:
() 先使用全約束最小二乘法對(duì)高光譜圖像中的每一個(gè)像元分別使用類地物的端元集做混合像元解混處理,得到類地物的豐度向量,分別記為[,,]、=[,,]、=[,,]和=[,,]。
(2) 將每種地物的端元集對(duì)應(yīng)乘上(1)中得到的豐度向量,得到反混像元,然后求取原始像元和反混像元的均方根誤差,記為RMSE,假設(shè)各類地物中的最小均方根誤差值對(duì)應(yīng)的端元向量分別是、、和,且這4個(gè)端元向量對(duì)應(yīng)的均方根誤差值的大小順序?yàn)椋?span id="j5i0abt0b" class="subscript"><<<。然后選取(2)中RMSE值比較小的2個(gè)端元,并將它們組成二端元組合,即=[,],并重新對(duì)指定像元使用全約束最小二乘算法進(jìn)行混合像元解混處理,將得到的豐度結(jié)果記為=[,],計(jì)算此次解混結(jié)果的均方根誤差,記為,如果>,那么可以確定該像元只包含端元,對(duì)應(yīng)的豐度為1,否則進(jìn)入下一步。
(3) 從(2)中選取第3個(gè)均方根誤差值較小的端元,即,在的基礎(chǔ)上組成三端元組合,記為=[,,],用對(duì)指定像元做解混處理,將豐度結(jié)果記為=[,,],然后計(jì)算此次解混結(jié)果的均方根誤差,記為。如果>,則該像元最佳的端元組合為,豐度結(jié)果為,否則進(jìn)入下一步。
(4) 在的基礎(chǔ)上添加第4個(gè)端元,構(gòu)成四端元組合,即=[,,,],用做混合像元解混處理,將得到的解混豐度結(jié)果記為=[,,,],然后計(jì)算本次解混結(jié)果的均方根誤差,記為,如果>,那么最佳端元組合為,將豐度結(jié)果記為,否則最佳端元組合為,豐度結(jié)果為,然后結(jié)束實(shí)驗(yàn),并對(duì)實(shí)驗(yàn)結(jié)果進(jìn)行分析。
基于分組尋優(yōu)的多端元高光譜混合像元解混算法的優(yōu)點(diǎn)是對(duì)小豐度地物的解混有好處,該算法能夠擴(kuò)大某種地物在像元中的存在,使小豐度地物不至于被圖像中存在的噪聲所掩蓋,提高混合像元解混精度。但是該算法所用的變異端元有限,并不能完全代表所有高光譜圖像中的變異端元。本文在基于分組尋優(yōu)多端元高光譜圖像混合像元解混算法的基礎(chǔ)上提出一種基于擴(kuò)展線性模型的多端元高光譜圖像分組尋優(yōu)算法,該算法與分組尋優(yōu)算法的不同在于對(duì)像元的建模,傳統(tǒng)的高光譜圖像建模采用的是普通的線性模型,而本文算法使用的是擴(kuò)展線性模型。從公式(1)和(3)可以看出,擴(kuò)展線性模型使用的是類似于一個(gè)函數(shù)的形式對(duì)像元進(jìn)行建模,能夠更好地反映像元變異現(xiàn)象,尤其是對(duì)于由光線和地勢(shì)引起的光譜變異。基于擴(kuò)展線性模型的多端元高光譜圖像混合像元解混算法的主要步驟:
(1) 求取每一種地物端元集的平均值,以此平均值為基準(zhǔn)端元,對(duì)該基準(zhǔn)端元做函數(shù)變換,即(),這個(gè)過程相當(dāng)于對(duì)各個(gè)地物的端元光譜曲線做變異處理;
(2) 使用第一步做過變異處理后的端元集合對(duì)像元做混合解混處理,并求取各個(gè)端元所對(duì)應(yīng)的RMSE,根據(jù)RMSE確定每組端元組合中所對(duì)應(yīng)的最佳端元;
(3) 對(duì)上一步中所得到的每種地物對(duì)應(yīng)的最佳端元的RMSE進(jìn)行排序,選出RMSE最小的端元,并以此為基準(zhǔn),將該端元與RMSE第2個(gè)較小的端元組合成兩端元組合模型,并比較兩端元組合模型與RMSE最小的端元的均方根誤差,如果該組合的RMSE比(1)中RMSE最小端元的RMSE還小,則依次組合三端元、四端元等;
(4) 重復(fù)步驟(1)和(2);
(5) 最后將每次解混處理所得到的均方根誤差進(jìn)行比較排序,選出這幾次處理中均方根誤差最小的端元組合,并將對(duì)它們解混處理所得的豐度作為最后的解混結(jié)果。
本文里所采用的數(shù)據(jù)是美國(guó)的一塊試驗(yàn)田數(shù)據(jù),圖像尺寸大小為144×144,具有100個(gè)光譜波段,真實(shí)圖像如圖1所示。
圖1 試驗(yàn)田圖像數(shù)據(jù)
這里使用了4類地物端元,分別是大豆、玉米、草地和由其它地物所組成的背景,每類地物端元的數(shù)量分別為3、3、3和7,具體如圖2所示。
圖2 實(shí)驗(yàn)中使用的端元個(gè)數(shù)及種類
本次實(shí)驗(yàn)結(jié)果如圖3、圖4所示,該結(jié)果主要展現(xiàn)基于分組尋優(yōu)的高光譜圖像混合像元解混算法與基于擴(kuò)展線性模型的高光譜圖像分組尋優(yōu)解混算法的區(qū)別,這種區(qū)別不很明顯,因?yàn)?種算法的解混效果相似性極大,具體的差別表現(xiàn)為2種算法的解混均方根誤差及算法執(zhí)行時(shí)間,如表1所示。
圖3 基于分組尋優(yōu)的多端元高光解混算法
圖4 基于擴(kuò)展線性模型的多端元高光譜分組尋優(yōu)解混算法
表1 2種算法之間的比較
從表1可以看出,雖然基于擴(kuò)展線性模型多端元高光譜分組尋優(yōu)解混算法的執(zhí)行時(shí)間比常規(guī)的分組尋優(yōu)解混算法要長(zhǎng),以及算法迭代次數(shù)也要比常規(guī)的分組尋優(yōu)解混算法多一點(diǎn),但是本文算法在解混精度上取得了較好的結(jié)果,從表格數(shù)據(jù)計(jì)算得到解混精度大概提高了27.7%左右,取得了預(yù)期的效果,在以后的算法改進(jìn)中可以考慮從提高算法計(jì)算效率出發(fā),在提高解混精度的同時(shí)保證解混效率。