趙春暉, 李佳偉, 閆奕名, 宿 南
(哈爾濱工程大學(xué) 信息與通信工程學(xué)院, 黑龍江 哈爾濱 150001)
高光譜圖像包含豐富的空間與光譜信息,具備對地物精細(xì)化處理和分析的能力,借助其特性能夠區(qū)分地物光譜信息的細(xì)微差異[1].因此,目標(biāo)檢測在高光譜圖像處理領(lǐng)域具有廣泛應(yīng)用.其中,異常目標(biāo)檢測無需先驗信息,更具普適性,成為高光譜目標(biāo)檢測領(lǐng)域的研究熱點[2-4].
Reed等提出的恒虛警率RX檢測算子[5]被稱為異常檢測的經(jīng)典算法.該算法通過求解目標(biāo)與背景均值向量的馬氏距離,構(gòu)造全局似然比檢測算子對高光譜像元逐一進行檢測.RX算法需假設(shè)背景服從高斯正態(tài)分布模型,而實際地物分布是復(fù)雜多變的,因此RX檢測算法的檢測性能受到限制.基于滑動窗模型的局部RX檢測器[6-7],通過利用數(shù)據(jù)的局部背景信息進行檢測,與全局信息相比,局部背景信息更能滿足假設(shè)模型,且可有效檢測出局部異常小目標(biāo).但是對于背景較為復(fù)雜的數(shù)據(jù),局部窗口仍難以表征出正態(tài)分布,且算法需多次求逆運算,算法的執(zhí)行效率較低.根據(jù)背景信息可以由它的空間鄰域信息線性表示,而異常目標(biāo)不能表示的特點,Li等提出了一種基于協(xié)同表示的異常檢測(Collaborative-Representation-Based Detector, CRD)算法[8].該算法得到了較好的檢測性能,但與RXD算法一樣,CRD算法容易受到背景中存在的異常目標(biāo)和噪聲的干擾,從而引起誤判.
Hausdorff距離(HD)是一種極大極小距離, 是由非線性關(guān)系定義的, 具有非線性特性和有向性, 被廣泛應(yīng)用于模式識別領(lǐng)域[9-11]. 因其能較好地反映地物空間分布特征及不同地物間的明顯差別, 近年來也被引進到高光譜圖像處理領(lǐng)域. 文獻[12]提出基于Hausdorff距離的高光譜圖像特征檢索方法, 得到了較高的檢索準(zhǔn)確率. 文獻[13]提出的基于改進的Hausdorff距離(MHD)的異常檢測算法有效降低了虛警率, 提升了檢測性能.
隨著成像技術(shù)的發(fā)展,高光譜數(shù)據(jù)的空間和光譜分辨率逐漸增大,這為高光譜圖像處理的執(zhí)行效率帶來巨大壓力.傳統(tǒng)算法為了提高效率,利用降維或波段選擇等技術(shù)去除冗余信息,雖然取得一定效果,但也存在數(shù)據(jù)信息丟失的弊端.近些年,GPU通用計算能力的壯大,為高光譜圖像處理的高效并行實現(xiàn)帶來了新思路[14-16]. X.Wu等利用GPU設(shè)計改進的PPI混合像元分解算法的并行架構(gòu)[14],解決了傳統(tǒng)算法計算復(fù)雜度高引起的耗時問題.A.Paz等提出基于GPU的自動目標(biāo)檢測和分類算法(ATDCA)[15],結(jié)合OSP、SAD、SID等多種距離計算方式進行檢測,獲得了較高的檢測和分類效率.根據(jù)算法的結(jié)構(gòu)特性,設(shè)計適合算法的并行系統(tǒng)架構(gòu),可顯著提高算法的處理效率.
為了減小背景信息中的噪聲及異常點對檢測性能的影響,以及高斯背景假設(shè)模型對傳統(tǒng)算法的束縛,本文提出一種基于虛擬背景光譜Hausdorff距離的高光譜圖像異常目標(biāo)檢測算法,記為VBS-HD(Virtual Background Spectral Hausdorff Distance)算法.根據(jù)局部空間的相關(guān)性,篩選各光譜波段的中間像素代表整個波段的特征,有效去除位于兩端的噪聲及異常信息,從而虛擬理想化的背景光譜用于異常目標(biāo)檢測.選取Hausdorff度量作為光譜距離測度.由于傳感器、天氣、大氣等因素的影響,數(shù)據(jù)成像過程中可能會在個別波段中產(chǎn)生孤立噪聲點.因此,對待測像元與背景光譜的各波段正反雙向距離的計算后,對其進行升序排列,選取前k個結(jié)果進行均值化,避免由于孤立噪聲點的存在導(dǎo)致結(jié)果的錯判.最終根據(jù)Hausdorff度量判別式實現(xiàn)異常檢測.為高效實現(xiàn)海量數(shù)據(jù)處理過程,本文根據(jù)算法結(jié)構(gòu)特點,設(shè)計基于GPU/CUDA的并行系統(tǒng)架構(gòu),顯著提升算法的執(zhí)行效率.
光譜相似性測度是指通過一定的度量標(biāo)準(zhǔn)來比較形狀間的相似程度.光譜曲線表征了復(fù)雜的光譜成像的非線性過程,因此從目標(biāo)光譜形狀的角度探究非線性空間里的光譜差異,可更好地實現(xiàn)非空集合光譜間的距離測度.德國數(shù)學(xué)家Felix Hausdorff提出的度量準(zhǔn)則----Hausdorff距離,很好地考慮了空間目標(biāo)的形狀差異及相對位置差異.Hausdorff距離是一種定義于2個點集間的極大極小距離,描述非空緊集合間的非線性空間幾何距離,可更加準(zhǔn)確地實現(xiàn)光譜間的相似性度量.
Hausdorff距離(HD)的定義最初是對2組點集相似程度的描述,假設(shè)2組集合A={a1,a2,a3,…,am},B={b1,b2,b3,…,bn},則A、B集合間的Hausdorff距離定義為
HD(A,B)=max{h(A,B),h(B,A)} .
(1)
式中,h(A,B)和h(B,A)分別代表點集A和B之間的單向距離,其定義為
‖·‖表示點集A和B之間的距離范數(shù),如Euclidean距離等.兩個單向距離具有不對稱性,式(2)表示集合A到B的前向距離,即集合A中所有點到集合B的最小距離的最大值,式(3)表示集合A到B的后向距離,即集合B中所有點到集合A的最小距離的最大值.前向與后向距離的較大者構(gòu)成集合A到B的Hausdorff距離.雙向Hausdorff距離表征了兩個集合間的最大不相似程度,距離值越小,代表相似程度越高.
從幾何角度理解Hausdorff距離[17],可假設(shè)集合A和B為2個n維空間中的非空緊致集合,則集合A和B之間的Hausdorff距離可定義為
ρ(A,B)=inf{ε:A?B⊕S(ε),B?A⊕S(ε)}.
(4)
式中:S(ε)代表半徑為ε的封閉球體;⊕表示數(shù)學(xué)形態(tài)學(xué)中膨脹操作;ρ為滿足一定條件下的最小封閉球體S的半徑,條件為A包含在膨脹集合B⊕S(ε)中,B包含在集合A⊕S(ε)中.通過求解集合A的最小膨脹封閉球體半徑εA及集合B的最小膨脹封閉球體半徑εB,整體Hausdorff度量過程轉(zhuǎn)化為
ρ(A,B)=max{εA,εB}.
(5)
式中,封閉球體半徑εA,εB需滿足
Dubuission和Jain匹配被噪聲污染的圖像時,提出了改進的Hausdorff距離(Modified Hausdorff Distance, MHD)[18].其距離定義為
MHD(A,B)=max{mh(A,B),mh(B,A)}.
(8)
式中,單向距離表示為
(9)
與原始Hausdorff距離相比, MHD測度對存在零均值高斯噪聲的圖像具有較好的匹配效果, 但由于其對距離值求取均值, 仍然對遠(yuǎn)離中心的外部點較為敏感,如圖1所示. 因而對于目標(biāo)部分遮擋和存在孤立噪聲點的圖像, 匹配性能較差.
圖1外部點對Hausdorff距離的影響
Fig.1 Effect of the external point of Hausdorff distance
(a)—不存在外部點; (b)—存在外部點.
目前,在高光譜圖像處理中,對于異常目標(biāo)沒有明確的定義,普遍認(rèn)為,一個目標(biāo)在一定程度上偏離了背景分布,即異常的光譜信息明顯不同于背景光譜信息,則稱此目標(biāo)為異常[19].在基于窗口模型的異常檢測中,一般通過背景窗口信息均值化表征局部背景信息,用于與待檢測像元進行光譜相似性度量.然而,局部背景窗口不能保證全部光譜信息都屬于背景信息,若背景窗口信息被較多的異常數(shù)據(jù)污染時,均值化的結(jié)果并不能很好地表征背景信息,因此容易引起誤判.
高光譜圖像異常目標(biāo)像元數(shù)目遠(yuǎn)小于背景像元數(shù)目,通常,異常光譜的反射率位于背景光譜信息的兩端,圖2為AVIRIS飛機場數(shù)據(jù)局部11×11大小區(qū)域內(nèi),隨機選取的10條背景信息與5條異常光譜的光譜反射率分布趨勢圖.
圖2 背景與異常光譜分布圖Fig.2 Background and anomaly spectral distribution
從圖2可看出,異常光譜的反射率明顯不同于背景光譜,大多位于背景光譜的兩端,因此,可選擇各波段的中值來表征局部背景光譜,如式(10)所示.
VB=median{(Dp)L|p∈w2}.
(10)
式中:Dp表示局部區(qū)域內(nèi)的光譜信息;L代表波段數(shù);w2=w×w表示局部窗口大小. 通過選取各波段的中值來構(gòu)造理想化的虛擬背景光譜, 可更大概率去除背景窗口內(nèi)的異常及噪聲, 有效緩解背景信息混入異常點及噪聲對檢測結(jié)果的影響. 如圖3所示, 在異常檢測過程中, 利用窗口的中心像素作為待測像元與背景光譜進行比較, 因此,構(gòu)造虛擬背景光譜時, 應(yīng)去除局部窗口的中心像元.
圖3 檢測窗口模型Fig.3 Detection window model
異常檢測算法可分為確定性算法和統(tǒng)計學(xué)算法.本文所提出的異常檢測算子為確定性算法,通常通過度量背景光譜與待測像元間的距離進行異常檢測.這類算法對噪聲較為敏感,為了能夠更好地去除光譜成像過程中產(chǎn)生的孤立噪聲點對檢測結(jié)果的影響,算法選擇改進的部分Hausdorff度量作為距離判別準(zhǔn)則.
若集合A的少數(shù)元素與集合B的多數(shù)元素距離較近,而A中其他元素遠(yuǎn)離B集合,通過Hausdorff距離的計算,得到的距離將會偏小,而實際上兩個集合的相似度并不高.經(jīng)改進的部分Hausdorff距離很好地解決了上述問題,并有效避免了噪聲及遠(yuǎn)離中心的外部點對距離測度的影響.
該測度需要考慮一個集合中每個元素到另一集合的距離, 并對距離值進行升序排列, 通過閾值k的調(diào)節(jié), 采用部分均值的方法得到點到點集間的距離, 以此方式計算兩集合的正反雙向距離, 通過判別準(zhǔn)則最終得到集合間的Hausdorff距離.
假設(shè)高光譜圖像的待測像元光譜向量表示為A=(a1,a2,…,aL),經(jīng)式(10)構(gòu)造的虛擬背景光譜為VB=(b1,b2,…,bL),L為高光譜波段數(shù),則待測像元A中的任意元素ai到背景光譜VB的距離定義為
(11)
式中:b∈VB;j代表ai到b的距離個數(shù).對距離值進行升序排列,選取前k個值進行均值運算,k∈[1,L].則向量A到向量VB的距離定義為
(12)
同樣,背景光譜VB到待測像元A的距離定義為
最終,待測像元A與背景光譜VB的Hausdorff度量定義為
HVBS-HD=max{hVBS-HD(A,VB),hVBS-HD(VB,A)}.
(15)
VBS-HD算法的實現(xiàn)步驟如下.
(1) 為了便于高光譜圖像邊緣信息檢測,對原始輸入圖像進行邊緣擴充,擴充大小由局部窗口大小決定.
(2) 對背景窗口內(nèi)各波段光譜信息進行排序,根據(jù)式(10)構(gòu)造理想化的虛擬背景光譜.
(3) 根據(jù)式(11)~式(14),對窗口中心待檢測像元與虛擬背景光譜進行正反雙向Hausdorff距離度量.
(4) 比較正反雙向Hausdorff距離hVBS-HD(A,VB)和hVBS-HD(VB,A),如式(15),選取兩距離中最大值作為Hausdorff距離,滑動窗口,重復(fù)步驟(2)~(4),實現(xiàn)整幅圖像的距離測度,以此衡量各像元的異常程度,得到異常檢測灰度結(jié)果圖.
隨著遙感技術(shù)的不斷發(fā)展,高光譜數(shù)據(jù)的光譜、空間、時間分辨率都逐漸增大.高光譜圖像數(shù)據(jù)量呈幾何級數(shù)增長,為高光譜圖像處理的執(zhí)行效率帶來了巨大壓力.為了提升算法的執(zhí)行效率,更加適應(yīng)海量數(shù)據(jù)的處理需求,充分利用GPU的并行計算能力,設(shè)計了VBS-HD算法的并行優(yōu)化模型.
GPU由內(nèi)存、緩存及多個流多處理器(Stream Multiprocessors, SM)陣列組成.其中,SM被看作真正的處理單元,每個SM由多個標(biāo)量處理器核心(Stream Processors, SP)及少量計算單元等構(gòu)成.NVIDIA推出統(tǒng)一設(shè)備架構(gòu)(Compute Unified Device Architecture,CUDA),為GPU并行計算可編程實現(xiàn)提供了便利.CUDA的軟件開發(fā)是基于CPU+GPU異構(gòu)模式的類C語言編程模型.CUDA程序的簡易執(zhí)行過程如圖4所示,主機(CPU)端主要負(fù)責(zé)串行計算及算法流程的控制,設(shè)備(GPU)端負(fù)責(zé)并行任務(wù)的計算.把從CPU端傳遞的并行任務(wù)封裝成Kernel函數(shù),并根據(jù)并行結(jié)構(gòu)配置網(wǎng)格大小,網(wǎng)格由多個線程塊(Block)組成,每個線程塊包含多個線程(Thread).通過式(16)的索引方式將各任務(wù)分配給不同的線程獨立運算,實現(xiàn)計算任務(wù)多線程并行執(zhí)行過程.
(16)
式中:threadIdx.x和threadIdx.y分別代表線程在其線程塊內(nèi)x和y方向的偏移;blockIdx.x和blockIdx.y分別表示線程在網(wǎng)格內(nèi)x和y方向的偏移;blockDim.x和blockDim.y代表線程塊在網(wǎng)格內(nèi)x和y方向的坐標(biāo)維度.
圖4 CUDA程序的執(zhí)行過程Fig.4 The execution process of CUDA program
VBS-HD算法中的數(shù)據(jù)計算、排序等實現(xiàn)過程相對獨立,因此可通過設(shè)計合理的并行架構(gòu),實現(xiàn)高效執(zhí)行過程.CPU與GPU之間通過PCI-E總線進行相互通信,其數(shù)據(jù)帶寬制約著并行效率,因此應(yīng)盡量避免多次的數(shù)據(jù)傳輸.為此,在設(shè)計的VBS-HD并行架構(gòu)中,將高光譜數(shù)據(jù)一次性傳輸?shù)紾PU端,通過相對復(fù)雜的指針?biāo)饕?遍歷各窗口元素,以此代替各窗口數(shù)據(jù)的多次傳輸過程.GPU內(nèi)部的存儲器占用量及調(diào)用過程也會影響并行效果,為了盡量減少不必要的中間變量的存儲調(diào)用過程,在架構(gòu)中將整個過程封裝在一個Kernel函數(shù)內(nèi),將中間變量重復(fù)利用,省去大部分顯存消耗.通過合理的線程調(diào)度,實現(xiàn)各窗口獨立并行,完成待測像元的異常檢測過程.算法并行優(yōu)化模型如圖5所示.
圖5 VBS-HD并行優(yōu)化模型Fig.5 Parallel optimization model of VBS-HD
為了驗證VBS-HD算法的有效性及并行優(yōu)化后的高效性,分別利用2組真實數(shù)據(jù)及3組不同大小的模擬數(shù)據(jù)進行實驗仿真操作.實驗仿真環(huán)境:CPU處理器為Intel Xeon E7-4820,主頻為2.0GHz,內(nèi)存為DDR3 96GB;GPU處理器為NVIDIA Tesla K40m;實驗平臺為Microsoft Visual Studio 2010集成開發(fā)環(huán)境.
3.1.1 ROSIS數(shù)據(jù)
ROSIS數(shù)據(jù)選自于意大利北部的帕維亞中心圖像.該圖像由ROSIS光譜儀拍攝,波長范圍在0.43~0.86 μm之間,原始圖像大小為1 096×715,光譜分辨率為4 nm,空間分辨率為1.3 m.選取115×115的區(qū)域用于算法性能分析.背景主要由橋、水波、影子組成,去除水吸收及信噪比較低的波段,剩余102個波段用于實驗.圖6為ROSIS數(shù)據(jù)第20波段灰度圖像及真實地物分布二值圖像.
圖6 ROSIS數(shù)據(jù)Fig.6 ROSIS data(a)—第20波段灰度圖像; (b)—真實地物分布圖.
3.1.2 AVIRIS數(shù)據(jù)
AVIRIS數(shù)據(jù)選自圣地亞哥海軍基地圖像. 該圖像由AVIRIS光譜儀拍攝, 原始圖像大小為400×400,224個波段, 波長范圍在0.4~1.8 μm之間, 光譜分辨率為10 nm, 空間分辨率為3.5 m. 截取60×60的圖像用于檢測, 圖中的4架飛機作為異常, 去掉水吸收波段及信噪比低的波段后, 剩余126個波段用于實驗. 圖7為AVIRIS數(shù)據(jù)第20波段灰度圖像及真實地物分布二值圖像.
圖7 AVIRIS數(shù)據(jù)Fig.7 AVIRIS data(a)—第20波段圖像; (b)—真實地物分布圖.
3.1.3 模擬數(shù)據(jù)
模擬數(shù)據(jù)的異常目標(biāo)由AVIRIS數(shù)據(jù)中多種地物進行插值得到,共4×4=16個異常目標(biāo),合成數(shù)據(jù)大小為128×128,共128個波段.模擬數(shù)據(jù)的每行目標(biāo)由同種地物構(gòu)成.第1列異常目標(biāo)由純像元構(gòu)成,第2列目標(biāo)由75%目標(biāo)光譜和25%背景光譜構(gòu)成,第3列目標(biāo)包含50%的目標(biāo)像元光譜特性和50%背景光譜特性.第4列目標(biāo)包含25%目標(biāo)像元光譜特性和75%背景光譜特性.圖8為模擬數(shù)據(jù)第20波段灰度圖像及目標(biāo)分布二值圖像.
模擬數(shù)據(jù)用于算法并行性能的分析實驗,為充分展現(xiàn)算法的并行特性,在保證密度不變的情況下,將模擬數(shù)據(jù)擴展成256×256及512×512的圖像數(shù)據(jù).分別利用3組不同尺寸的模擬圖像用于算法的并行優(yōu)化性能分析,其擴展圖像如圖9所示.
圖8 模擬數(shù)據(jù)Fig.8 Synthetic data(a)—第20波段灰度圖像; (b)—真實地物分布圖.
圖9 不同尺寸的模擬數(shù)據(jù)Fig.9 The synthetic data of different size(a)—128×128; (b)—256×256; (c)—512×512.
3.2.1 參數(shù)k對VBS-HD算法的影響
為分析計算部分Hausdorff距離時所選取的前k個距離值對檢測結(jié)果的影響,利用交叉驗證,在ROSIS及AVIRIS數(shù)據(jù)實驗中均選擇11×11的窗口大小,進行不同k值情況下的VBS-HD算法檢測結(jié)果對比實驗.
實驗結(jié)果采用AUC值形式呈現(xiàn),AUC為接收機操作特性曲線(ROC)的下面積,ROC可以定量分析檢測概率與虛警概率間的關(guān)系,其曲線下面積可作為檢測性能的評判標(biāo)準(zhǔn),AUC越接近1,則算法的檢測性能越好.圖10為兩組真實數(shù)據(jù)中不同k值時的檢測結(jié)果對比圖.從圖中可以看出,由于ROSIS數(shù)據(jù)的地物分布相對簡單,因此對參數(shù)k不敏感,當(dāng)k為41時,檢測性能達到最佳.在AVIRIS數(shù)據(jù)中,當(dāng)k值從1升至11時,AUC達到最大值,隨著k值繼續(xù)增大,AUC逐漸降低.
3.2.2 局部窗口w對VBS-HD算法的影響
為分析局部窗口w的大小對VBS-HD算法的影響,通過交叉驗證,在ROSIS數(shù)據(jù)的實驗中,選取參數(shù)k為41,在AVIRIS數(shù)據(jù)的實驗中,選取參數(shù)k為11,在不同窗口大小的情況下進行VBS-HD算法檢測結(jié)果對比實驗.
圖10 兩組真實數(shù)據(jù)中不同k值的AUC曲線圖
如圖11所示,對于ROSIS數(shù)據(jù),由于地物分布相對簡單,局部窗口對其檢測性能影響較小,隨著局部窗口的變化,AUC值相對穩(wěn)定,在窗口大小為11×11時,檢測結(jié)果最佳.在AVIRIS數(shù)據(jù)中,當(dāng)窗口從5×5升至11×11過程中,AUC顯著增大,而窗口繼續(xù)增大時,AUC逐漸降低,在窗口大小為11×11時,AUC達到最大值.
選用ROSIS及AVIRIS 2組真實數(shù)據(jù)進行算法有效性分析.在實驗中,將局部RX算法(LRXD)、協(xié)同表示的異常檢測算法(CRD)、基于改進的Hausdorff距離的異常檢測算法(MHD)及背景選取局部均值的基于改進的部分Hausdorff距離的異常檢測算法(MLTS-HD)作為對比實驗,與VBS-HD算法進行比較,驗證算法的有效性.在ROSIS數(shù)據(jù)實驗中,VBS-HD及MLTS-HD選取參數(shù)k為41,窗口大小w為11×11;LRXD、CRD及MHD的雙窗大小(win,wout)為(3,11).在AVIRIS數(shù)據(jù)實驗中,VBS-HD及MLTS-HD的參數(shù)k為11,窗口大小w為11×11;LRXD、CRD及MHD的雙窗大小(win,wout)為(5,11).由于CRD對參數(shù)λ不敏感[8],因此直接將其設(shè)為1.
圖12 兩組真實數(shù)據(jù)實驗灰度圖Fig.12 The gray images of experiment in two real datasets(a)—LRXD; (b)—CRD; (c)—MHD; (d)—MLTS-HD; (e)—VBS-HD; (f)—LRXD; (g)—CRD; (h)—MHD; (i)—MLTS-HD; (j)—VBS-HD.
圖12為2組真實數(shù)據(jù)的檢測結(jié)果灰度圖,由于LRXD需滿足背景服從高斯分布,而真實地物很難滿足這一特性,因此其檢測出異常個數(shù)相對較少.與其他4種算法比較,VBS-HD算法檢測出的異常目標(biāo)更加凸顯.圖13為2組真實數(shù)據(jù)的檢測結(jié)果灰度峰度圖,其中圖13a~圖13e是ROSIS數(shù)據(jù),圖13f~圖13j是AVIRS數(shù)據(jù).從圖中可看出,CRD檢測出的個別異常信息值較低,容易湮沒在背景噪聲中難以區(qū)分.與MHD、MLTS-HD相比,VBS-HD算法的抑制背景噪聲能力更強,可明顯區(qū)分背景與異常,能夠更好地處理地物較復(fù)雜的數(shù)據(jù).綜合2組結(jié)果圖,VBS-HD算法具有較高的檢測精度,且抑制背景噪聲能力較強,使得異常目標(biāo)更加凸顯.
為了更加客觀地對各算法的檢測性能進行對比,使用接收機特性曲線對異常檢測性能進行定量分析,圖14所示為2組數(shù)據(jù)的各算法ROC曲線圖.
圖14a中,由于ROSIS數(shù)據(jù)地物相對簡單,各算法的檢測精度都很高.其中,VBS-HD算法的檢測性能最佳,當(dāng)虛警率為0.004 5時,檢測概率達到90%,當(dāng)虛警率為0.012時,即可檢測出全部異常.雖然地物較為簡單,但局部背景信息仍難以完全符合高斯分布,因此與其他算法相比,LRXD的檢測精度稍低.圖14b中,由于MHD算法對數(shù)據(jù)局部孤立噪聲點較為敏感,容易引起誤判,因此其檢測虛警率較高.雖然在虛警率大于0.18時,CRD的檢測概率略高于VBS-HD算法,但整體AUC值仍小于VBS-HD算法,且在虛警率為0.06時,VBS-HD的檢測概率就已達到90%.綜合來看,VBS-HD算法的檢測性能更好.由于VBS-HD算法構(gòu)造理想化的虛擬背景光譜進行檢測,更好地避免了背景信息摻雜異常對檢測結(jié)果的影響,因此其檢測性能好于MLTS-HD算法.綜上所述,VBS-HD算法具有較高的檢測性能,且抗噪聲干擾能力較強,抑制背景噪聲能力較好,可適用范圍更廣.
由于真實高光譜圖像數(shù)據(jù)量很大,為后續(xù)的數(shù)據(jù)處理效率帶來很大壓力.因此,為了進一步提升算法的執(zhí)行效率,充分利用GPU的并行計算能力,挖掘VBS-HD算法的并行特性,在GPU/CUDA模型下,設(shè)計算法的并行系統(tǒng)架構(gòu).為驗證并行算法的高效性,利用圖9所示的3組不同尺寸的模擬數(shù)據(jù)進行實驗,實現(xiàn)并行VBS-HD算法與CPU串行版本的VBS-HD算法執(zhí)行效率對比驗證.表1為VBS-HD算法的并行與串行版本執(zhí)行效率對比情況.
為了去除計算機的脈沖誤差,表1中的檢測時間均為10次實驗后的均值.由表1可看出,基于GPU的并行算法執(zhí)行時間明顯低于CPU串行版本.由于算法需進行多次排序等過程,隨著數(shù)據(jù)量的增大,排序、篩選等過程的次數(shù)也逐漸增多,因此算法的執(zhí)行時間將明顯增大,但與CPU串行版本相比,GPU并行算法的執(zhí)行時間隨數(shù)據(jù)量增大而增加的趨勢較為緩慢,其增加的時間多數(shù)源于GPU與CPU間的數(shù)據(jù)傳輸.由表1加速比數(shù)據(jù)可看出,在模擬數(shù)據(jù)為128×128時,加速比為6.101倍,模擬數(shù)據(jù)增大到512×512時,加速比為13.952倍.隨著數(shù)據(jù)量的增大,GPU的加速效果更加凸顯,GPU的并行機制適合海量數(shù)據(jù)的處理,因此基于GPU/CUDA模型下的并行算法可有效緩解高光譜數(shù)據(jù)量大帶來的數(shù)據(jù)處理壓力,更加滿足實際應(yīng)用需求.
圖13 兩組真實數(shù)據(jù)實驗灰度峰度圖Fig.13 The gray kurtosis figures of experiment in two real datasets(a)—LRXD; (b)—CRD; (c)—MHD; (d)—MLTS-HD; (e)—VBS-HD; (f)—LRXD; (g)—CRD; (h)—MHD; (i)—MLTS-HD; (j)—VBS-HD.
圖14 兩組真實數(shù)據(jù)接收機操作特性(ROC)曲線
模擬數(shù)據(jù)總處理時間/sCPUGPU加速比128×128195.67132.0746.101256×256476.58048.2579.876512×512964.45869.12613.952
本文提出一種高光譜圖像異常目標(biāo)檢測算法(VBS-HD),該算法通過在空間鄰域內(nèi)構(gòu)造理想化虛擬背景光譜,有效緩解因背景信息摻雜異常對檢測結(jié)果的影響.同時利用改進的部分Hausdorff度量作為光譜相似性度量準(zhǔn)則,從Hausdorff距離所定義的非線性角度衡量光譜間的關(guān)系,可更加準(zhǔn)確地對像元屬性進行劃分,且通過選取前k個距離值均值化,避免由孤立噪聲點引起的誤判.為了提升算法執(zhí)行效率,充分利用GPU的并行特性,設(shè)計算法的并行優(yōu)化模型.實驗證明,VBS-HD具有較高的檢測精度,且抗噪聲干擾能力較強,其并行優(yōu)化模型顯著提升了算法的執(zhí)行效率,且隨著數(shù)據(jù)量的增大,加速效果更加凸顯,進一步滿足實際應(yīng)用中海量數(shù)據(jù)的高效實現(xiàn)需求.