楊鵬飛,廖秀英,徐啟恒,程 輝
(1. 湖南科技大學資源環(huán)境與安全工程學院,湖南 湘潭 411201; 2. 東莞市測繪院,廣東 東莞 523129; 3. 湖南科技大學先進礦山裝備教育部工程研究中心,湖南 湘潭 411201)
絕大多數(shù)遙感影像中單個像元不僅僅只包含某一單純的地物光譜信息,而是由某一種或某幾種不同的地物光譜混合而成。當多種光譜信息混合出現(xiàn)在同一像元時稱為混合像元?;旌舷裨钠毡榇嬖谝呀?jīng)成為制約高光譜遙感影像廣泛運用的關鍵因素[1]?;旌舷裨纸庾钪匾牟襟E之一就是端元提取,端元提取之后對各個端元比例的求解稱為豐度反演[2]。目前,運用最為廣泛的提取端元的算法主要有純凈像元指數(shù)(PPI)[3]、單形體最大體積法(N-FINDR)[4]、頂點成分分析(VCA)[5]、迭代誤差分析(IEA)[6]等。丁海勇[7]提出利用卡方分布改進N-FINDR端元提取算法,在給定的概率水平下,利用卡方分布來構造候選端元集合。楊可明等[8-9]提出了基于光譜最小信息熵改進的N-FINDR端元提取算法,根據(jù)信息論的概念將信息熵引入到端元提取中。但仍有許多其他層面上的改進,如張兵[10]、路漫漫[11]等為了提高光譜非線性混合時的端元提取精度,提出了融合離散粒子群(PSO)的N-FINDR改進端元提取算法;唐曉燕[12]等針對單形體體積(GSVM)算法效率較低、對噪聲點比較敏感的缺點,提出了采用自適應局部切空間排列算法來計算嵌入低維坐標的方法來提高端元提取精度。
針對純凈像元指數(shù)算法隨著迭代次數(shù)的增加時間效率大大降低,而N-FINDR在端元提取的過程中初始端元值的不確定性會導致最后得到的結果有可能和實際地物的類型不符等問題,本文利用兩種算法的各自優(yōu)勢,提出一種基于純凈像元指數(shù)改進N-FINDR端元提取算法,通過純凈像元指數(shù)算法限定一個更小范圍內候選端元集合,在給定的候選端元范圍內運用N-FINDR算法提取端元。通過試驗和分析發(fā)現(xiàn),改進后的算法在端元提取的準確率及精度上均優(yōu)于傳統(tǒng)的N-FINDR算法。
純凈像元指數(shù)是將所有的像元視為一個N維向量。初始的隨機向量是由N維散點圖不斷迭代映射產(chǎn)生的,分別記錄對應的映射像元及其個數(shù),統(tǒng)計像元值及其對應的個數(shù)。隨著迭代次數(shù)的不斷增加,端元的數(shù)值也會相應增加,找到極值的概率也會增大。將概率最大像元定義為較純的像元,這些隨機分布的較純的端元構成一個頂點數(shù)為N+1的凸面體,求得組成該凸面體的頂點即為純凈像元。
純凈像元指數(shù)算法的不足之處為:它屬于一種監(jiān)督算法,需要對應的操作人員具有相關的專業(yè)知識作為背景,并且操作過程復雜;更重要的是由于初始向量的選擇完全是隨機選擇,導致提取結果會出現(xiàn)各種偏差,尤其當數(shù)據(jù)的分布并不是正態(tài)分布且數(shù)據(jù)中夾雜噪聲影響的時候,PPI的算法受到的影響較大。但是PPI算法在像元個數(shù)確定上相較于其他算法穩(wěn)定性較高。
N-FINDR[13-15]算法是在特征空間上由所有的像素組成一個高維度的凸錐結構。遍歷多個凸錐結構找到形成最大體積的凸錐頂點并求解凸錐頂點,求解的凸錐的頂點表示的就是待分地物的屬性信息,而凸錐定點的內部則全部是混合像元。n個像素e1,e2,…,en形成的凸錐結構體積計算公式如下
(1)
(2)
N-FINDR對端元提取的過程中,由于在對矩陣E進行行列式運算過程中要求E矩陣必須為方陣,因此必須采用適當?shù)慕稻S方法對矩陣降維。降維會導致在待分類出的目標地物較小的情況下該細小地物被忽略。因此在實際求解的過程中常設置迭代的終止次數(shù),以保證在有限的條件下能夠得到最優(yōu)解,但是這樣的設置會導致最后得到的結果有可能與實際地物的類型不符。這就表明初始端元的選擇對實際結果會有很大的影響,因此結合純凈像元指數(shù)的N-FINDR的算法被提出。
在前述兩種算法的基礎上提出基于純凈像元指數(shù)改進的N-FINDR的算法。由傳統(tǒng)的N-FINDR的理論可知,預先確定端元的個數(shù)為N,對高光譜數(shù)據(jù)降至N-1維,能否準確地確定初始端元N的個數(shù)對于N-FINDR算法最終的精度具有很大的影響。實際情況下地物的端元數(shù)目和初始端元N的個數(shù)相差太多或太少都會導致分類精度的下降,這就說明分類的結果有可能會出現(xiàn)多項分為同一類端元或分類端元不完整的情況。然而純凈像元指數(shù)算法在這方面相對表現(xiàn)更好,其依靠點云識別原理,而點云識別則可以有效地幫助找出相似性很高的一塊散點區(qū),從而進一步找到所需要提取的端元。改進后的算法具體流程如下:
(1) 首先對高光譜數(shù)據(jù)進行降維變換,降維[13]變換主要采用最小噪聲分離降維,降維后的數(shù)據(jù)表明元數(shù)據(jù)后面部分主要是噪聲。
(2) 確定純凈像元指數(shù),即在計算PPI的過程中設定迭代次數(shù)和閾值。
(3) 構建n維可視化窗口,確定n維散點圖,初步獲得備選端元數(shù)目,也即端元分類結果。
(4) 以純凈像元指數(shù)求解的端元個數(shù)作為N-FINDR算法的最初始端元,求解最大體積頂點并完成豐度估計。改進的N-FINDR算法的流程如圖1所示。圖中N為根據(jù)純凈像元指數(shù)計算的備選端元數(shù)目。
試驗采用機載可見光/紅外成像光譜儀(airborne visible infrared imaging spectrometer,AVIRIS)高光譜數(shù)據(jù),AVIRIS數(shù)據(jù)可提供20 m的空間分辨率和224個譜段,光譜范圍為0.2~2.4 um,光譜分辨率為10 nm。首先對數(shù)據(jù)進行輻射定標、剔除無效波段及信噪比較低的波段、大氣校正、研究區(qū)范圍剪裁等,經(jīng)過預處理后遙感影像保存有50個波段,圖幅的大小為400×350像元。分別采用經(jīng)典的N-FINDR和改進后的N-FINDR算法對研究區(qū)進行端元提取。研究區(qū)如圖2所示。
圖1 改進的N-FINDR算法流程
圖2 內華達州AVIRIS高光譜遙感影像
首先對遙感影像進行MNF降維處理,對數(shù)據(jù)維數(shù)進行判斷,波段特征值小的波段舍去,MNF變換后波段特征值小的基本上可以判定為噪聲。計算純凈像元指數(shù),由純凈像元指數(shù)計算出純凈像元個數(shù)并以該數(shù)作為N-FINDR算法的初始端元。在高維空間構成的單形體用傳統(tǒng)的N-FINDR算法搜索構成的最大單形體體積的頂點作為最終像元,根據(jù)最大體積的頂點取出了5個端元,端元光譜曲線如圖3所示。改進后求解的各端元豐度如圖4所示。
利用改進后的N-FINDR算法提取出5種地物類型,確定5種地物光譜曲線圖。與USGS光譜庫進行光譜匹配,采用光譜特征擬合對端元相似度進行分析。光譜特征擬合更加具有普適性,匹配的值越高則代表光譜曲線的擬合程度越好,根據(jù)擬合程度的高低進一步確定相應的地物類型。
圖3 改進算法提取的端元光譜曲線
分別對改進后的N-FINDR算法與傳統(tǒng)的純凈像元指數(shù)算法進行端元提取。改進后的N-FINDR算法設置的迭代次數(shù)為50,將改進后的N-FINDR算法與純凈像元指數(shù)算法提取的5個端元結果相比較,根據(jù)純凈像元指數(shù)算法提取的端元光譜曲線如圖5所示,其提取的5種地物類型分別為赤土石、明礬石、高嶺土、黃鉀鐵及方解石。利用純凈像元指數(shù)提取的端元線性光譜解混結果如圖6所示。由兩幅光譜曲線圖與原始影像像元值的對比可知,改進后的N-FINDR算法與USGS光譜庫線性擬合效果更好。對比表1的SAM(spectral angle mapping)波譜角值,可知改進后的算法提取的端元地物曲線與光譜庫匹配程度均得到了提高。RMS表示改進后算法與原始算法的光譜角差值,對比差值可知,改進后的算法較原始算法而言在精度上有了較大提高。
圖4 改進后N-FINDR提取端元豐度
圖5 純凈像元指數(shù)提取端的光譜曲線
端元編號地物類別改進后SAM原始SAM精度提高比/(%)1赤土石0.8830.8642.22高嶺土0.8180.8130.63黃鉀鐵0.8760.8256.04明礬石0.8710.8186.45方解石0.8540.8144.9
圖6 改進后N-FINDR提取端元豐度
本文通過對混合像元端元提取問題進行研究與分析,分別對兩種不同端元提取算法進行了混合像元分解試驗,對比了兩種不同端元提取算法的精度。由于純像元指數(shù)(PPI)提取端元的方法需要事先人工干預,在操作步驟上相較于傳統(tǒng)的N-FINDR算法簡單,其精度有待考究。但是考慮到傳統(tǒng)的N-FINDR算法初始端元數(shù)目選擇的任意性會導致精度不一的問題,而純凈像元指數(shù)算法在端元數(shù)目的確定上有較大的優(yōu)勢,采用純凈像元指數(shù)算法確定初始端元數(shù)目,然后采用N-FINDR算法精確的對端元進行提取。純凈像元指數(shù)確定端元數(shù)目時,計算機自動分類的數(shù)目較多,需要根據(jù)N維可視化界面對散點圖較多的端元優(yōu)先確定,這也在一定程度上幫助了N-FINDR提取端元,操作人員只需要預設好端元數(shù)目就可以快速進行提取,因此端元提取的結果更趨向于真實結果,精度較高。相對于傳統(tǒng)的N-FINDR算法,改進后的算法整體上提高了端元提取的精度。
[1] 李劍萍, 鄭有飛. 氣象衛(wèi)星混合像元分解研究綜述[J]. 中國農(nóng)業(yè)氣象, 2000, 21(2): 44-47.
[2] 成寶芝, 趙春暉, 王玉磊. 結合光譜解混的高光譜圖像異常目標檢測SVDD算法[J]. 應用科學學報, 2012, 30(1): 82-88.
[3] KESHAVA N, MUSTARD J F. Spectral Unmixing[J]. IEEE Signal Processing Magazine, 2002, 19(1): 44-57.
[4] BOARDMAN J W, KRUSE F A, GREEN R O. Mapping Target Signatures via Partial Unmixing of AVIRIS Data[C]∥Proceedings of the 5th JPL Airborne Earth Science Workshop. Pasadena, USA: JPL, 1995: 23-26.
[5] NASCIMENTO J M P, DIAS J M B. Vertex Component Analysis: A Fast Algorithm to Unmix Hyperspectral Data[J]. IEEE Transactions on Geoscience and Remote Sensing, 2005, 43(4): 898-910.
[6] NEVILLE R A, STAENZ K, SZEREDI T, et al. Automatic Endmember Extraction from Hyperspectral Data for Mineral Exploration[C]∥Proceedings of the 21st Canadian Symposium on Remote Sensing. Ottawa, Canada: [s.n.], 1999: 21-24.
[7] DING H Y, SHI W Z. Fast N-FINDR Algorithm for Endmember Extraction Based on Chi-square Distribution[J]. Journal of Remote Sensing, 2013, 17(1): 130-137.
[8] 楊可明, 魏華鋒, 劉飛, 等. 以光譜信息熵改進的N-FINDR高光譜端元提取算法[J]. 地球信息科學學報, 2015, 17(8): 979-985.
[9] 楊可明, 劉士文, 王林偉, 等. 光譜最小信息熵的高光譜影像端元提取算法[J]. 光譜學與光譜分析, 2014, 34(8): 2229-2233.
[10] 張兵, 孫旭, 高連如, 等. 一種基于離散粒子群優(yōu)化算法的高光譜圖像端元提取方法[J]. 光譜學與光譜分析, 2011, 31(9): 2455-2461.
[11] 路漫漫. 融合PSO的N-FINDR改進端元提取算法研究[D]. 大連: 大連海事大學, 2014.
[12] 唐曉燕, 高昆, 倪國強, 等. 基于流形學習和空間信息的改進N-FINDR端元提取算法[J]. 光譜學與光譜分析, 2013, 33(9): 2519-2524.
[13] 齊濱. 高光譜圖像分類及端元提取方法研究[D]. 哈爾濱: 哈爾濱工程大學, 2012.
[14] WINTER M E. A Proof of the N-FINDR Algorithm for the Automated Detection of Endmembers in a Hyperspectral Image[C]∥Proceedings of the SPIE Volume 5425, Algorithms and Technologies for Multispectral, Hyperspectral, and Ultraspectral Imagery X, Defense and Security. Orlando, Florida, United States: SPIE, 2004: 31-41.
[15] 朱述龍, 齊建成, 朱寶山, 等. 以凸面單體邊界為搜索空間的端元快速提取算法[J]. 遙感學報, 2010, 14(3): 482-292.