于 宏,黃樹桃,劉京晶
(1.核工業(yè)北京地質(zhì)研究院,遙感信息與圖像分析技術(shù)國家級重點實驗室,北京 100029;2.國家衛(wèi)星氣象中心,北京 100081)
基于光譜知識庫對高光譜影像目標快速識別方法
于 宏1,黃樹桃1,劉京晶2
(1.核工業(yè)北京地質(zhì)研究院,遙感信息與圖像分析技術(shù)國家級重點實驗室,北京 100029;2.國家衛(wèi)星氣象中心,北京 100081)
針對國內(nèi)引進的機載高光譜成像儀(CASI/SASI)數(shù)據(jù)采集系統(tǒng),介紹了利用先驗知識建立的多種地物目標光譜庫,以及高光譜影像目標快速識別的技術(shù)方法研究;同時還闡述了其數(shù)據(jù)處理流程、目標識別原理和應(yīng)用開源代碼編程實現(xiàn)過程,并對其結(jié)果與應(yīng)用進行了簡要的分析。
目標識別;知識庫;成像光譜系統(tǒng)
高光譜遙感作為遙感技術(shù)的重大成就之一,近年來取得了重大進展。高光譜影像目標識別技術(shù)是利用空間維和光譜維信息進行目標定位和定性的技術(shù)方法;利用高光譜圖像(Hyperspectral Images)進行目標識別是當前國內(nèi)、外遙感圖像處理和分析的研究熱點之一,尤其是近年涌現(xiàn)出大量星載和機載高光譜數(shù)據(jù)采集系統(tǒng),并獲得了相當豐富的高光譜數(shù)據(jù)資源。因此,國內(nèi)、外科研單位對其的研究日益重視,促使人們?yōu)榭焖購暮A繑?shù)據(jù)中獲取所需信息,開展了大量的研究分析與應(yīng)用工作。其中,利用已知目標的光譜特征,從高光譜影像數(shù)據(jù)中檢索該目標的空間分布是高光譜數(shù)據(jù)分析應(yīng)用的重點之一。
CASI/SASI是加拿大 ITRES公司生產(chǎn)的機載成像光譜儀,為兩個獨立的成像系統(tǒng),可在同一平臺進行數(shù)據(jù)采集,其中CASI波長為 350~1 100 nm,最高光譜分辨率為 10 nm; SASI波長為900~2 500 nm,光譜分辨率為10 nm。當前的數(shù)據(jù)處理與分析應(yīng)用的工作過程是:利用設(shè)備數(shù)據(jù)預(yù)處理軟件,進行輻射校正和幾何校正,然后采用 “黑/白布標”同步測試的方法或利用FLASH在ENVI平臺中進行大氣校正,最終進行光譜角填圖、地物目標分類等分析應(yīng)用。由于采集的數(shù)據(jù)量都相當大,數(shù)據(jù)處理方式流程繁雜、工作效率偏低,為此,筆者針對該系統(tǒng)的數(shù)據(jù)特點和當前的主要應(yīng)用任務(wù),對高光譜圖像的目標進行高速、有效和智能化的識別,設(shè)計了一套規(guī)范實用的數(shù)據(jù)處理流程,并基于開源代碼編程開發(fā)了高光譜圖像目標快速識別系統(tǒng),從而實現(xiàn)對高光譜影像中地物目標的準確定位與快速定性。
高光譜影像的分類和目標識別,主要有兩種方法:即基于地物光譜特征的分類識別方法和基于統(tǒng)計的分類識別方法?;诮y(tǒng)計特征的分類,可采用非監(jiān)督和監(jiān)督分類兩種方法,非監(jiān)督方法一般不需要具備對數(shù)據(jù)的先驗知識,也可以直接應(yīng)用原始高光譜遙感圖像數(shù)據(jù)來進行分類,雖然精度有所欠缺,但簡單易行,也是常用的方法之一。由于地物光譜特征分類識別方法是利用光譜庫中已知的光譜數(shù)據(jù),采用匹配算法來鑒別和識別圖像中的地物類型,因而該種方法既可采用全波長的比較和匹配,也可用感興趣的光譜特征或部分波長的光譜或光譜組合參量進行匹配,達到分類和識別的目的[1-2]。筆者采用該方法,使其整個數(shù)據(jù)處理過程更為系統(tǒng)化,其基本原理是,首先對高光譜影像進行大氣校正,計算反射率,利用光譜數(shù)據(jù)庫中已知目標,在影像中對每個像素點進行光譜匹配檢索,同時獲取該像素點的空間坐標(圖1),反射率計算、空間坐標獲取和光譜匹配過程基本是同步進行。其中光譜數(shù)據(jù)庫中的數(shù)據(jù)來源于美國地調(diào)局(USGS)和近年研究項目的數(shù)據(jù)積累;目標檢索的算法主要是引進現(xiàn)有成熟的算法——光譜角度匹配、相關(guān)系數(shù)、最小距離、約束能量最小化和基于支持向量機的光譜匹配算法等[3];目標的空間定位是利用傳感器、平臺與GPS時間同步,獲取傳感器的姿態(tài)參數(shù),結(jié)合其成像方式,進行空間坐標變換計算獲得。
在高光譜遙感影像數(shù)據(jù)處理中,光譜匹配技術(shù)是高光譜地物目標識別的最為關(guān)鍵技術(shù)之一。經(jīng)過了幾十年的發(fā)展,高光譜遙感圖像數(shù)據(jù)的分析處理技術(shù)取得了巨大進步,在傳統(tǒng)分類算法的基礎(chǔ)上發(fā)展,形成了一系列面向高光譜圖像的目標識別與分類算法。國內(nèi)、外這類算法有數(shù)十種之多,其中的許多算法原理都類同,只是進行了部分改進。光譜角、最小距離匹配等是比較常用的算法。基于光譜間的最小距離匹配算法與最小距離分類法幾乎一致,只是最小距離匹配基于樣本數(shù)據(jù),將未知光譜和參考光譜數(shù)值之間距離進行計算,再根據(jù)最小二乘法進行分類匹配,光譜可以采用歐氏、馬氏和巴氏距離等。SAM方法是把光譜看作多維矢量,通過計算測量光譜(像元光譜)與目標光譜之間的 “角度”來確定它們兩者之間的相似性。SVM是最近幾年因計算機性能的極大提高而引入至高光譜影像數(shù)據(jù)分類的方法,SVM是Cortes和Vapnik于1995年首先提出的,建立在統(tǒng)計學習理論的VC維理論和結(jié)構(gòu)風險最小原理基礎(chǔ)上,它在解決小樣本、非線性及高維模式識別中表現(xiàn)出許多特有的優(yōu)勢,并能夠推廣應(yīng)用到函數(shù)擬合等其他機器學習問題中,其本質(zhì)上是一種對問題真實模型的逼近[4-5]。本文并沒有對上述算法的具體內(nèi)容作過多的研究,而是直接引用了這些成熟的算法和開源代碼。
根據(jù)上述原理和算法,實現(xiàn)基于光譜知識庫的高光譜影像目標的快速識別系統(tǒng)由3個主要部分組成,即地物波譜信息管理系統(tǒng)、高光譜影像地理編碼和高光譜影像目標檢索模塊,其工作流程如圖2所示。地物波譜信息管理系統(tǒng)是一個集波譜測量數(shù)據(jù)、地物目標先驗知識數(shù)據(jù)于一體的信息管理系統(tǒng),為高光譜影像目標識別提供地物目標先驗知識的平臺。其建立方法是首先在MS Access中建立數(shù)據(jù)結(jié)構(gòu),光譜數(shù)據(jù)以BLOB存儲;其后通過ADO.Net接口應(yīng)用C++編程開發(fā),實現(xiàn)對光譜數(shù)據(jù)及輔助信息的綜合管理。當前該數(shù)據(jù)庫中包含有來自USGS及近年積累的波譜數(shù)據(jù)(ASD測量),總計約5 000多個樣本。其基本功能包括:數(shù)據(jù)入庫、查詢、光譜圖形可視化和數(shù)值分析等。
高光譜影像地理編碼是利用CASI/SASI成像光譜系統(tǒng)的傳感器、POS和GPS的時間同步及其空間幾何關(guān)系進行空間投影變換,對影像中每一像素進行空間定位。CASI和SASI在進行輻射校正后產(chǎn)生兩個文件,一個為文件記錄每像素的輻亮度值 (單位為SUR,1 SUR=1 μW·cm-2·sr-1·nm-1)的高光譜影像數(shù)據(jù);另一文本文件存儲每一掃描行的特征描述信息,包括了系統(tǒng)時間、傳感器坐標、姿態(tài)等輔助數(shù)據(jù),須與GPS進行同步以獲取機下點像素精確的坐標與姿態(tài)數(shù)據(jù),其時間同步方法參照成像光譜系統(tǒng)所附技術(shù)說明書。掃描線的其他像素坐標依據(jù)飛行高度及空間變換矩陣計算獲得[6]。
高光譜影像目標檢索模塊是依據(jù)用戶輸入?yún)?shù),從高光譜影像中提取相應(yīng)的目標空間分布,具體功能包括:利用黑/白布標計算反射率,從地物波譜庫中獲得一組光譜數(shù)據(jù)(單個或多個樣本),并自動提取目標,圖像的基本操作與處理功能包括顯示、放大、縮小、濾波、直方圖和閾值設(shè)置等。可自選光譜匹配算法和任選不同的波段組合,目前只有光譜角和相關(guān)性兩種算法。SVM算法尚在進行測試中,還未取得好的結(jié)果。程序的實現(xiàn)是基于GDAL、Open CV等開源代碼,應(yīng)用C++編程調(diào)用其動態(tài)庫功能函數(shù)實現(xiàn)的。
首先,對不同匹配算法進行比較測試,從光譜庫中隨機抽取20個樣本,即應(yīng)用3種算法(SAM、相關(guān)性和SVM)對一組光譜數(shù)據(jù)20個樣本進行實驗循環(huán)測試,即,使用其中一個作為檢測對象,同時對樣本的相似性進行排序,前兩者獲取結(jié)果基本一致,重疊率達95%,但SVM算法與前兩者的差異較大,重疊率僅為70%。而在使用SVM算法進行高光譜影像目標檢索時,沒有獲得預(yù)期的結(jié)果,究其原因,初步認為是C++調(diào)用Open CV動態(tài)庫過程中的參數(shù)設(shè)置存在錯誤。該方法已在兩個實際應(yīng)用課題中取得了良好的效果。在其后的工作中將完善SVM算法的測試,并引進更多的算法進行應(yīng)用。
[1]童慶禧,張 兵,鄭蘭芬.高光譜遙感:原理、技術(shù)與應(yīng)用[M].北京:高等教育出版社,2006.
[2]耿修瑞,趙永超.高光譜遙感圖像小目標探測的基本原理[J].中國科學D輯:地球科學,2007,37(8):1 081-1 087.
[3]Claudio Persello.Advanced techniquesforthe classification of very high resolution and hyperspectral remote sensing images[D].Trento:DISI-University of Trento,2010.
[4]Marconcini M, Camps-Valls G, Bruzzone L.A composite semisupervised SVM for classification of hyperspectral images[J]. IEEE Geoscience and Remote Sensing Letters, 2009, 6(2):234-238.
[5]Gualtieri J A,Chettri S.Support vector machines for classification ofhyperspectral data [C]//Proc.of IEEE-IGARSS 2000.Hawaii:IEEE-IGARSS,2000:813-815.
[6]Skaloud J,Lichti D.Rigorous approach to bore-sight self-calibration in airborne laser scanning [J].ISPRS JournalofPhotogrammetryand Remote Sensing, 2006, 61(1):47-59.
Technique of identifying speedy hyperspectral images object based on spectrum repository
YU Hong1,HUANG Shu-tao1, LIU Jing-jing2
(1.National Key Laboratory of Remote Sensing Information and Image Analysis Technology,Beijing Research Institute of Uranium Geology, Beijing 100029, China;2.National Satellite Meteorological Center, Beijing 100081, China)
Aimed at the imported airborne hyperspectral data collection system (CASI/SASI) , the authors first introduce the knowledge based spectral repository for multi ground objects,the study on the technique approaches to identifying object at speed with hyperspectral images,and then expound the principle of object identification,the flow of data processing and the programming procedure with open code,finally make a brief analysis for the results and its application.
object identification; knowledge repository; spectral imaging system
TP73
A
1672-0636(2011)01-0029-03
10.3969/j.issn.1672-0636.2011.01.006
2011-02-16
裝備預(yù)研項目:可探測目標的光、電特性監(jiān)測評估研究(編號:51303020701-6)
于 宏(1960—),男,河北東光人,高級工程師,長期從事目標光學特性研究工作。E-mail:yh6011@sina.com