廖佳俊,劉志剛,姜江軍,路志勇
?
基于稀疏表示分步重構(gòu)算法的高光譜目標檢測
廖佳俊1,劉志剛1,姜江軍1,路志勇2
(1. 火箭軍工程大學(xué),陜西 西安 710025;2. 96831 部隊,北京 100015)
針對傳統(tǒng)稀疏表示重構(gòu)算法在高光譜目標檢測中表現(xiàn)出運算速度慢的問題,提出了分步重構(gòu)算法(Two Steps Reconstruction,TSR)。該方法先求得個與待測像元最相似的字典原子,然后用這些原子線性表示待測像元以求解稀疏向量,舍棄了傳統(tǒng)重構(gòu)算法的迭代求解的方式,直接通過求解逆矩陣,簡化了運算過程,使運算速度大幅提高。本文給出了方法的具體過程并將其與傳統(tǒng)方法及其改進方法進行比較。實驗結(jié)果表明,TSR在保證檢測精度不下降的同時能夠大幅提升運算速度。
高光譜目標檢測;重構(gòu)算法;稀疏表示
目標檢測是高光譜遙感技術(shù)應(yīng)用的重要方向之一,它涵蓋了環(huán)境監(jiān)測、城市調(diào)查、礦物填圖和軍事偵察等諸多領(lǐng)域。傳統(tǒng)的目標檢測方法有光譜角填圖(Spectral Angle Mapping,SAM)、匹配子空間(Matched Subspace Detector,MSD)、正交子空間投影(Orthogonal Subspace Projection,OSP)等[1]。這些方法在高光譜目標檢測方面有著廣泛的運用,但也存在檢測結(jié)果精度不高、對分布模型假設(shè)準確與否關(guān)系大等不足之處。今年來,稀疏表示理論在圖像處理及目標檢測中取得了較好的發(fā)展[2-3]。2010年,Yi Chen等人將稀疏表示成功應(yīng)用于高光譜圖像分類和目標檢測[4-5],取得了不錯的效果。越來越多的學(xué)者開始關(guān)注將稀疏表示應(yīng)用于高光譜圖像,稀疏表示為高光譜目標檢測提供了一條新的研究思路?;谙∈璞硎镜姆椒m然能克服傳統(tǒng)方法精度不高以及需要假設(shè)分布模型等問題,但由于高光譜圖像光譜分辨率高帶來的海量數(shù)據(jù),使得目前稀疏表示中應(yīng)用比較廣泛的正交匹配追蹤算法(Orthogonal matching pursuit,OMP)[6]在計算時由于迭代次數(shù)過多而造成運算量大、速度慢的問題,特別是當字典中原子數(shù)目過多或者稀疏度過高時會使得計算復(fù)雜度成指數(shù)增長。在壓縮感知領(lǐng)域,不少學(xué)者提出了許多OMP算法的改進形式,包括gOMP、StOMP、SWOMP和CoSaMP[7-10]等;趙春暉等人將StOMP算法應(yīng)用到高光譜目標檢測之中,取得了一定的效果[11]。我們將上述改進方法應(yīng)用在高光譜目標檢測中發(fā)現(xiàn),由于光譜的復(fù)雜性使得高光譜待測像元并不能由字典中的原子精確重構(gòu),有些算法在運行時可能并不是由重構(gòu)誤差達到精度而完成重構(gòu)而是由于達到迭代次數(shù)而完成重構(gòu),所以目標檢測效果并不理想。針對這個問題,本文提出了一種分步重構(gòu)算法,放棄了原來迭代求解的思路,而通過直接求解逆矩陣實現(xiàn)重構(gòu),使運算速度得到大幅提高。
稀疏表示的思想就是將原始信號表示為字典與稀疏向量相乘的形式:
=(1)
式中:是一個過完備字典;稀疏向量是一個只有少數(shù)元素不為零的向量。
在高光譜目標檢測中,一個待測像元可以通過大量端元中部分原子的線性組合表示。對應(yīng)于稀疏表示,可將大量端元構(gòu)成一個超完備字典,由目標子字典t和背景子字典b級聯(lián)構(gòu)成,那么待測像元可以由下式表示:
式中:t和b分別對應(yīng)目標子字典t和背景子字典b的稀疏向量。通過求解稀疏向量并判斷t和b是零向量還是稀疏向量即可判斷該待測像元是目標還是背景。算法基本原理如圖1所示。
該方法關(guān)鍵性步驟之一就是求解稀疏向量的重構(gòu)算法,其中最為常見的就是OMP。其主要思路可以簡單總結(jié)如下:
Step 1:初始化殘差0=,索引矩陣0=?,字典支撐集0=?,迭代次數(shù)=1。
Step 4:更新殘差r=-。
重構(gòu)算法的目標是找到個合適的字典原子以表示待測像元。OMP算法采用逐個求解的思路,由于反復(fù)迭代,運算時間很長。為了提高效率,可否一次性求解個合適的字典原子呢?根據(jù)這一思路,本文提出了一種分步重構(gòu)的算法,舍棄了迭代求解的方式,試圖使運算過程得以簡化。該方法流程圖如圖2所示,具體步驟如下:
第一步:從字典中選取個與待測像元最相似的原子。
在這一步中本文提出兩種求解方法:線性表示法和直接表示法。相對而言,線性表示法在像素點多,稀疏度高的情況下速度更快;直接表示法在稀疏度稍低的情況下速度更快。其方法具體原理如下:
1)線性表示法(Two Steps Reconstruct with Linear Representation,TSR-L)
假設(shè)待測像元可以表示為如下等式:
=11+…+da=(3)
式中:表示待測像元;1, …,d表示字典中的各個原子;1, …,a表示系數(shù)。
由于通常是奇異矩陣,可以通過式(4)求解:
=(D+I)-1x(4)
式中:是一個極小的正則化項;是單位矩陣。
通過式(3)可以發(fā)現(xiàn)每一個原子都對待測像元的表示都做出了貢獻。計算每一個原子與待測像元的殘差:
其中ei可以表示每一個字典原子與待測像元之間的差別,較小的ei對應(yīng)字典原子對待測像元貢獻度越大。那么通過比較ei就能夠確定K個與待測像元最相似的字典原子,記為d1,…,dK,該方法通過逆矩陣一次求出每個原子對應(yīng)的貢獻度,對于稀疏度越高的情況效果越明顯。
Fig.1 Basic principle of Sparse representation
圖2 算法流程圖
Fig.2 Flow chart of algorithm
2)直接表示法(Two Steps Reconstruct with Direct Representation TSR-D)
第一步主要問題是求出個與待測像元相似的字典原子,由于待測信號與字典原子都進行了歸一化處理,假設(shè)字典原子與待測像元的相似度可由下式表示:
L=xd,=1, …,(6)
式中:L越大表示相似度越高,通過排序后,取出前個值,即可求得與待測像元最相似的個字典原子,記為1,…,d,該方法由于計算簡單,在大多數(shù)情況下效果突出。如果待測像元是目標像元,那么1,…,d中全部或者大部分都應(yīng)該屬于目標子字典,否則應(yīng)全部或大部分屬于背景子字典。
第二步:用選出的個字典原子的線性組合進一步表示待測像元,計算稀疏向量。
假設(shè)待測像元滿足如下等式:
=11+…+bd=bD(7)
式中:1,…,d表示與待測像元最相似的字典原子;1,…,b表示系數(shù)。由于通常也是奇異矩陣,那么可以通過式(7)求解:
式中:是一個極小的正則化項;是單位矩陣。
然后,將中原子和根據(jù)式(8)求出來的對應(yīng)的系數(shù)的乘積之和分別求目標和背景的重構(gòu)誤差t和b,如式(9)所示:
式中:t表示目標子字典原子及其對應(yīng)系數(shù)相乘之和;b表示背景子字典原子及其對應(yīng)系數(shù)相乘之和;若待測像元為目標,那么t應(yīng)當越小,b應(yīng)當越大,反之亦然。最后設(shè)置一個閾值,通過求t和b的差值(),如式(10)所示:
根據(jù)上述步驟,即可實現(xiàn)對高光譜圖像的目標檢測處理。可以看出,本方法舍棄了迭代求解稀疏向量的形式,通過直接求逆矩陣的形式求解稀疏向量,簡化了運算。
在本章中,采用3組實測高光譜圖像數(shù)據(jù)對本文提出的算法進行驗證,以接收機特性(Receiver Operating Characteristic,ROC)曲線下的面積(Area Under the Curve,AUC)[12]為檢測結(jié)果的效果指標,將檢測效果和時間與OMP、StOMP、gOMP算法進行對比。本文字典的選取采用文獻[3]提出的方法,其中目標子字典原子個數(shù)依次分別為52,38,38;背景子字典窗口大小為內(nèi)窗7×7,外窗11×11,共計72個原子;稀疏度=16。實驗環(huán)境為Dell Precision T1650圖形工作站;8核處理器,主頻3.30GHz;內(nèi)存16G;操作系統(tǒng):Microsoft Windows7;程序運行平臺:MATLAB 2014a。
第一組實驗數(shù)據(jù)是用地面MSHyperSIS成像光譜儀獲取的一幅高光譜圖像。圖像原始大小為260×336,共256個波段。本實驗中所用的圖像數(shù)據(jù)是從原始圖像中裁取出來的,其大小為80×80,剔除其中的無效波段,保留有效波段181個。實驗數(shù)據(jù)如圖3所示,圖像區(qū)域為一片水泥地,水泥地中放置了一個水杯為待檢測的目標。其中,圖3(a)是第69個波段的灰度圖,圖3(b)是水杯的空間分布圖。
圖3 實驗數(shù)據(jù)圖像
Fig.3 Experimental image
圖4(a)~(e)給出了OMP、StOMP、gOMP、TSR-L、TSR-D的目標檢測效果圖。其目標檢測所對應(yīng)的AUC值以及所消耗的時間如表1所示。
圖4 圖3的檢測結(jié)果對比
表1 圖3用不同重構(gòu)方法所得AUC值及時間
從圖4和表1中可以看出各種算法檢測結(jié)果相差不大,OMP算法運算速度相對較慢;基于OMP算法改進的StOMP算法速度有所提升,但檢測精度略有下降;gOMP算法運算速度不升反降;本文提出的分步重構(gòu)算法對比于OMP算法在檢測精度略有提高的情況下,TSR-D運算速度大幅提升,降低到OMP的15.2%,而TSR-L運算時間則略有增加。
第2組數(shù)據(jù)為機載可見光及紅外成像光譜儀(Airborne Visible/Infrared Imaging Spectrometer, AVIRIS)拍攝的美國圣地亞哥海軍機場的高光譜圖像。該高光譜圖像波長范圍為370~2500nm,空間分辨率為3.5m,大小為400×400個像元。截取其中100×100的子圖像,除去水汽吸收波段和信噪比較低的波段后,保留189個波段。圖5(a)是第204波段的灰度圖,圖5(b)是??匡w機的空間分布圖。
圖6(a)~(e)給出了OMP、StOMP、gOMP、TSR-L、TSR-D的目標檢測效果圖。其目標檢測所對應(yīng)的ROC曲線下面積值以及所消耗的時間如表2所示。
圖5 實驗數(shù)據(jù)圖像
從圖6和表2中可以看出OMP算法運算速度相對較慢;基于OMP算法改進的StOMP算法速度有所提升,檢測精度略有下降;gOMP算法運算速度不升反降;本文提出的分步重構(gòu)算法對比于OMP算法在檢測精度略有提高的情況下,運算速度大幅提升,其中TSR-L運算時間降低到OMP的64.2%,TSR-D降低到OMP的29.3%。
圖6 圖5的檢測結(jié)果對比
表2 圖5用不同重構(gòu)方法所得AUC值及時間
第3組實驗數(shù)據(jù)是用地面MSHyperSIS成像光譜儀獲取的一片以樹林為背景的高光譜圖像。圖像原始大小為500×336,共256個波段。本實驗中所用的圖像數(shù)據(jù)是從原始圖像中裁取出來的,其大小為200×200,剔除其中的無效波段,保留有效波段181個。實驗數(shù)據(jù)如圖7所示,圖像區(qū)域為一片樹林,樹林中放置的3件迷彩服為待檢測的目標。其中,圖7(a)是第69波段的灰度圖,圖7(b)是迷彩服的空間分布圖。
圖7 實驗數(shù)據(jù)圖像
圖8(a)~(e)給出了OMP、StOMP、gOMP、TSR-L、TSR-D的目標檢測效果圖。其目標檢測所對應(yīng)的ROC曲線下面積值以及所消耗的時間如表3所示。
圖8 圖7的檢測結(jié)果對比
表3 圖7用不同重構(gòu)方法所得AUC值及時間
從圖8和表3中可以看出OMP算法運算速度也相對較慢;基于OMP算法改進的StOMP算法速度有所提升,檢測精度略有下降;gOMP算法運算速度不升反降;本文提出的分步重構(gòu)算法對比于OMP算法在檢測精度略有提高的情況下,運算速度大幅提升,其中TSR-L運算時間降低到OMP的62.5%,TSR-D降低OMP的28.9%。
對比上述3組實驗結(jié)果可以看到,StOMP算法相比于OMP算法在運算速度上有一定的提升,但精度有少許降低,這可能是因為每次迭代選擇多個原子不如選擇單個原子精確度高。gOMP算法在運算速度上不升反降,這可能是因為運行時不是由重構(gòu)誤差達到精度而完成重構(gòu)而是由于達到迭代次數(shù)而完成重構(gòu)。TSR-D在所有數(shù)據(jù)中均有最好的表現(xiàn),不僅精度高而且運算速度比傳統(tǒng)的OMP算法提升超過70%;TSR-L在像素點比較多的情況下能保持比較高的精度,同時速度也比OMP和gOMP算法快,但相比TSR-D速度上還有一定差距。本文進一步研究發(fā)現(xiàn),當稀疏度越高時,TSR-L相比TSR-D有更快的速度,如圖9所示,這可能是因為TSR-L在第一步時也是通過逆矩陣求解,而相比之下求解逆矩陣對稀疏度的增加更不敏感。進一步對比本文算法以及OMP類算法的原理,我們發(fā)現(xiàn)在進行字典原子的選擇時,由于原理不同各自選出的原子可能并不相同,本文算法選出的原子本身和待測像元更相似,所以該方法是合理的。綜上,本文提出的兩種方法在檢測精度,特別是運算速度上相比傳統(tǒng)算法有明顯提高,并且在稀疏度高低不同的情況下有各自的優(yōu)勢。
圖9 不同稀疏度下TSR-D和TSR-L運行時間對比圖
本文針對傳統(tǒng)稀疏表示重構(gòu)算法在高光譜目標檢測中表現(xiàn)出的運算速度較慢的問題,提出了分步重構(gòu)算法。該算法舍棄了傳統(tǒng)方法使用迭代求解稀疏向量的方法,通過直接求解逆矩陣使得運算簡化,從而達到了大幅提升算法運算速度的效果,并且兩種方法在稀疏度高低不同的情況下有各自的優(yōu)勢。本文提出的方法簡單易行,與傳統(tǒng)算法及其改進算法進行目標檢測實驗對比的結(jié)果表明,該算法在保證檢測精度不下降的同時大幅提升了運算速度。
[1] 張兵, 高連如. 高光譜圖像分類與目標探測[M]. 北京: 科學(xué)出版社, 2011: 223, 248.
ZHANG B, GAO L R.[M]. Beijing:,2011: 223, 248.
[2] 楊春偉, 王仕成, 廖守億,等. 基于核稀疏編碼的紅外目標識別方法[J]. 紅外技術(shù), 2016, 38(3):230-235.
YANG C W, WANG S C, LIAO S Y.An infrared target recognition method based on Kernel Sparse coding[J]., 2016, 38(3): 230-235.
[3] 孫君頂, 趙慧慧. 圖像稀疏表示及其在圖像處理中的應(yīng)用[J]. 紅外技術(shù), 2014, 36(7): 533-537.
SUN J X, ZHAO H H.Sparse representation and applications in image processing[J]., 2014, 36(7):533-537.
[4] CHEN Yi, Nasrabadi N M, Tran T D. Sparsity-based classification of hyperspectral imagery[C]//2010(IGARSS), 2010: 2796-2799.
[5] CHEN Yi, Nasrabadi N M, Tran T D. Sparse representation for target detection in hyperspectral imagery[J]., 2011, 5(3): 629-640.
[6] Pati Y C, Rezaiifar R, Krishnaprasad P S. Orthogonal matching pursuit: recursive function approximation with applications to wavelet decomposition[C]//, 1993, 1: 1-3.
[7] Donoho D L, Tsaig Y, Drori I, et al. Sparse solution of underdetermined systems of linear equations by stagewise orthogonal matching pursuit[J]., 2012, 58(2): 1094-1121.
[8] WANG J, Kwon S, Shim B. Generalized Orthogonal Matching Pursuit[J]., 2011, 60(12): 6202-6216.
[9] Blumensath, T, Davies Mike E. Stagewise weak gradient pursuits[J]., 2009, 57(11): 4333-4346.
[10] Needell D, Tropp J A. CoSaMP: Iterative signal recovery from incomplete and inaccurate samples[J]., 2009, 26(3): 301-321.
[11] 趙春暉, 靖曉昊, 李威. 基于StOMP稀疏方法的高光譜圖像目標檢測[J]. 哈爾濱工程大學(xué)學(xué)報, 2015, 36(7): 992-996.
ZHAO C, JING X, LI W. Hyperspectral imagery target detection algorithm based on StOMP sparse representation[J]., 2015, 36(7): 992-996.
[12] WANG Y, HUANG S, LIU D, et al. A novel band selection method based on curve area and genetic theory[J]., 2014, 43(3): 193-202.
Target Detection in Hyperspectral Image Using Two Steps Reconstruction Based on Sparse Representation
LIAO Jiajun1,LIU Zhigang1,JIANG Jiangjun1,LU Zhiyong2
(1.,710025,; 2.96831,,100015,)
Aiming at the efficiency problem of traditional reconstruction algorithm for target detection in hyperspectral image, a two steps reconstruction algorithm was proposed.nearest atoms with text pixel were calculated for representing the text pixel to calculate sparse vectors. This method solves the problem by calculating inverse matrix instead of iteration, which simplifies the process. The specific process of the method is given and the method is compared with the traditional and improved ones. Experimental results show that this method can improve the computation speed without decreasing the accuracy of detection.
hyperspectral target detection,reconstruction algorithm,sparse representation
TP75
A
1001-8891(2016)08-0699-06
2016-04-08;
2016-05-17.
廖佳?。?992-),男,湖南湘潭人,碩士研究生,主要從事遙感圖像處理研究。
國家自然科學(xué)基金項目(41574008)。