李 毅 杜 蘭 杜宇昂
(西安電子科技大學雷達信號處理全國重點實驗室 西安 710071)
合成孔徑雷達(Synthetic Aperture Radar,SAR)是一種有源微波傳感器,其利用脈沖壓縮技術提高距離分辨率,同時利用合成孔徑技術提高方位分辨率,從而實現(xiàn)二維高分辨率成像。SAR不僅能夠全天候、全天時對地觀測,并具有一定的地表穿透能力,因此被廣泛應用于軍事和民用領域。作為SAR圖像解譯的重要步驟之一,如何從SAR圖像中快速并準確地檢測出目標,是目前的一個技術研究熱點。
作為目前應用最為廣泛的SAR圖像目標檢測方法,雙參數(shù)CFAR檢測算法[1–3]基于背景雜波服從高斯分布的假設,利用背景雜波的統(tǒng)計分布獲取自適應的門限,然后通過滑動窗口將像素的灰度值與自適應門限進行比較,得到檢測結(jié)果。該方法對于目標與背景雜波具有較高對比度的簡單場景效果較好,但在處理真實復雜場景SAR圖像時會存在大量虛警和漏警。
由于具有卓越的特征學習能力,卷積神經(jīng)網(wǎng)絡(Convolutional Neural Network,CNN)[4–9]受到了廣泛關注與研究,并在多個領域取得了卓越性能。在光學圖像目標檢測領域,可以將現(xiàn)有的深度目標檢測網(wǎng)絡[10–12]按照網(wǎng)絡階段的構成分為兩階段方法和一階段方法。兩階段方法將目標檢測任務分為候選區(qū)域提取和目標分類回歸兩個階段。代表性算法Faster Region-CNN (R-CNN)[11]開創(chuàng)性地使用卷積網(wǎng)絡來預測候選區(qū)域,提出了用來自動獲取候選區(qū)域的區(qū)域提取網(wǎng)絡(Region Proposal Network,RPN),從而提升了兩階段方法的檢測速度和精度。一階段方法不需要進行候選區(qū)域提取,直接利用網(wǎng)絡提取特征來預測目標的類別和位置。代表性算法單步多框檢測器(Single Shot multibox Detector,SSD)[12]利用多尺度特征圖感知不同尺寸的目標,并用不同的檢測器在多尺度特征圖上分別進行目標檢測,最后利用非極大值抑制(Non-Maximum Suppression,NMS)[13]去除所有檢測器中重疊度高的檢測結(jié)果。由于兩階段方法需要進行候選區(qū)域提取,其具有較高檢測精度的同時,也具有較慢的檢測速度,難以滿足部分實際應用場景下的速度需求。而一階段目標檢測器的網(wǎng)絡結(jié)構較為簡單,沒有生成候選區(qū)域的過程,在檢測速度上更具優(yōu)勢。
近年來,在SAR圖像目標檢測領域,基于深度學習的方法也被廣泛研究與應用。王思雨等人[14]提出基于CNN的高分辨率SAR圖像飛機目標檢測方法,該方法首先采用預檢測實現(xiàn)對SAR圖像候選飛機目標的快速粗定位,然后利用CNN實現(xiàn)對候選目標的精確檢測和鑒別,并提出4種適用于SAR圖像的數(shù)據(jù)增強方法來降低由于SAR數(shù)據(jù)量有限而導致的過擬合。Wang等人[15]基于SSD目標檢測框架,聯(lián)合采用遷移學習和數(shù)據(jù)擴充的策略幫助提升SSD在SAR圖像上的目標檢測性能。李健偉等人[16]提出基于CNN的SAR圖像艦船目標檢測的新方法,包括特征聚合、遷移學習、損失函數(shù)設計和其他應用細節(jié),有效提高了檢測準確率和檢測速度。Zhang等人[17]提出一種基于區(qū)域CNN的艦船檢測方法,該方法首先用支持向量機獲得可能包含艦船的感興趣區(qū)域,然后使用改進的Faster R-CNN對感興趣區(qū)域進行目標檢測,有效提高了艦船檢測的性能。陳慧元等人[18]提出一種基于級聯(lián)CNN的大場景遙感圖像艦船目標快速檢測方法,該方法由目標預篩選全卷積網(wǎng)絡和目標精確檢測全卷積網(wǎng)絡兩個全卷積網(wǎng)絡級聯(lián)而成,在保持檢測精度的前提下能顯著提高目標檢測效率,可實現(xiàn)大場景遙感圖像中艦船目標的快速檢測。這些研究證明了基于深度學習的方法在SAR圖像目標檢測領域具有使用價值。
真實場景的高分辨率SAR圖像中包含大量復雜的自然雜波和人造雜波,某些人造雜波的雷達回波強度與感興趣目標的雷達回波強度相當甚至更高,而上述基于深度學習的SAR目標檢測方法都沒有針對這些復雜背景雜波提出有效手段,因此使用上述方法對復雜場景SAR圖像進行目標檢測時,得到的結(jié)果包含大量的虛警和漏警,嚴重影響了SAR目標檢測性能。為了解決這個問題,Wei等人[19]將注意力模塊生成的注意力圖與SSD網(wǎng)絡得到的多尺度特征圖按位置相乘,以期網(wǎng)絡能夠自動地對圖像中的重要區(qū)域進行像素值增強。然而該方法僅利用最終的標簽約束引導注意力圖的生成,缺乏對注意力圖的直接約束,難以保證最終的注意力圖能夠重點關注特征圖中目標區(qū)域的特征。
為提高復雜場景SAR圖像的目標檢測性能,本文提出一種基于特征分解CNN的SAR圖像目標檢測方法,該方法在特征提取模塊之后通過構建兩條并聯(lián)支路組成特征分解模塊,其中,鑒別特征提取支路受檢測損失的約束,以學習對目標檢測有利的鑒別特征;而干擾特征提取支路受兩條支路間的正交損失和重構損失的約束,以學習對目標檢測不利的干擾特征。干擾特征中包括容易造成虛警的復雜背景雜波,經(jīng)過特征分解模塊后將被丟棄。最終,僅將分解后的鑒別特征輸入多尺度檢測模塊實現(xiàn)目標檢測?;趯崪y數(shù)據(jù)集的實驗結(jié)果表明,在對復雜場景SAR圖像進行目標檢測時,本文方法能夠顯著降低虛警和漏警,提高SAR目標檢測性能。
所提方法的算法流程圖如圖1所示。該方法基于SSD目標檢測框架,主要包含3個模塊:特征提取模塊、特征分解模塊、多尺度檢測模塊??紤]到原SSD網(wǎng)絡利用了多尺度特征圖進行目標檢測,且第1個參與檢測的特征圖為conv4_3層輸出的特征圖,而本文方法旨在將輸入的特征分解為對檢測有利的鑒別特征和對檢測不利的干擾特征兩部分,且僅利用鑒別特征完成目標檢測,從而起到降低虛警和漏警的作用,所以本文方法需要在開始檢測之前完成特征分解。另外,特征提取模塊需要具有足夠的特征提取能力,以學習到具有一定語義信息的特征,因此選擇原SSD網(wǎng)絡中的conv3_3及之前的卷積層用于初步的特征提取,conv4_1到conv4_3層用于特征分解。
圖1 基于特征分解CNN的SAR圖像目標檢測流程圖Fig.1 Flow chart of SAR target detection method based on feature decomposition CNN
特征提取模塊的詳細結(jié)構如表1所示,其中,k,s,p,n分別表示核尺寸、步長、填充數(shù)、核個數(shù)。該模塊共有7個卷積層,每個卷積層后面接著修正線性單元(Rectified Linear Unit,ReLU)[20]層,在第2,4,7個ReLU層后面使用最大池化層對特征進行降維。7個卷積層的卷積核尺寸均為3×3,卷積步長均為1,卷積核個數(shù)分別為64,64,128,128,256,256,256,3個最大池化層的池化窗口尺寸均為2×2,池化步長均為2。特征提取模塊對輸入的SAR圖像進行初步的特征提取,以便用于后續(xù)的特征分解模塊。
表1 特征提取模塊的詳細結(jié)構Tab.1 Detailed structure of feature extraction module
特征分解模塊對輸入的特征進行分解,如圖1中被紅色虛線框包圍的特征分解模塊所示,該模塊包含兩條并行支路,依靠兩條支路間的正交約束和重構約束將輸入特征分解為干擾特征和鑒別特征。分解得到的干擾特征是對目標檢測不利的部分,其中包括復雜背景雜波。而鑒別特征是對目標檢測有利的部分,其中包括感興趣目標。作為特征分解模塊的輸出,鑒別特征將被輸入后續(xù)的多尺度檢測模塊進行檢測。特征分解模塊的具體結(jié)構將在2.2節(jié)詳細描述。
多尺度檢測模塊對輸入的鑒別特征進行目標檢測,其總體結(jié)構如圖1中被綠色虛線框包圍的多尺度檢測模塊所示。該模塊包含13個卷積層,用以從網(wǎng)絡的不同層獲取不同尺度的卷積特征圖,其中第1—4卷積層的卷積核大小均為3×3,第5—13卷積層的卷積核大小分別為1×1,1×1,3×3,1×1,3×3,1×1,3×3,1×1,3×3,13個卷積層的卷積核個數(shù)分別為512,512,512,1024,1024,256,512,128,256,128,256,128,256。為了更好地檢測出目標,除了特征分解模塊得到的鑒別特征圖,再選擇多尺度檢測模塊中的第5,7,9,11,13卷積層得到的5個尺度的卷積特征圖,這6個特征圖的尺寸從39×39到1×1逐漸減小。由于網(wǎng)絡中不同層的特征圖具有不同大小的感受野,即不同層特征圖上每個位置對應于原圖上的區(qū)域面積不同,其中低層特征圖對應的感受野較小,而高層特征圖對應的感受野較大,因此不同層的特征圖可以用來感知不同尺寸的目標,選取多尺度特征圖分別進行目標檢測有助于檢測出原圖中各種尺寸的目標。如圖1中被綠色虛線框包圍的多尺度檢測模塊所示,多尺度檢測模塊還包括多個卷積預測器,每個卷積預測器都包括兩個并聯(lián)的卷積層,分別用于邊框回歸和分類。將6個不同的卷積預測器分別應用于選中的6個特征圖,從而得到不同尺度特征圖上的預測結(jié)果。在網(wǎng)絡的訓練階段,需要從所有尺度特征圖的預測結(jié)果中挑選一部分用于計算網(wǎng)絡的邊框回歸損失和分類損失,而在網(wǎng)絡的測試階段,直接使用NMS算法去除所有尺度特征圖的預測結(jié)果中重復的結(jié)果,從而得到待測試圖像的檢測結(jié)果。
為了展示圖1中被紅色虛線框包圍的特征分解模塊的結(jié)構細節(jié),將其詳細展開如圖2所示,該模塊的輸入為特征提取模塊輸出的特征圖,旨在對輸入的特征圖進行特征分解,去除對目標檢測不利的部分,同時保留對目標檢測有利的部分。特征分解模塊包含兩條并聯(lián)支路,分別為干擾特征提取支路和鑒別特征提取支路,兩條支路具有相同的網(wǎng)絡結(jié)構,均包含3個卷積層,每個卷積層后面接著ReLU層,3個卷積層的卷積核尺寸均為3×3,卷積步長均為1,卷積核個數(shù)均為512。由于兩條支路的參數(shù)不共享,由此分別承擔干擾特征提取和鑒別特征提取。最后將得到的干擾特征和鑒別特征相加并輸入解碼器進行圖像重構。解碼器包含5個反卷積層[21],其中前4個反卷積層后面接著ReLU層,5個反卷積層的卷積核尺寸均為3×3,卷積步長分別為1,2,2,2,1,卷積核個數(shù)分別為512,256,128,64,3。
圖2 特征分解模塊結(jié)構圖Fig.2 Structure of feature decomposition module
為了將輸入特征分解為對檢測不利的干擾特征和對檢測有利的鑒別特征兩部分,僅將鑒別特征提取支路的輸出輸入到后續(xù)的多尺度檢測模塊,利用檢測損失約束該支路學習對目標檢測有利的鑒別特征,同時利用兩條支路間的正交損失和重構損失保證干擾特征提取支路學習對檢測不利的干擾特征。
為保證兩條支路所提特征的差異性,定義兩條支路間的正交損失如下:
其中,N表示每個批次的訓練樣本數(shù),fn1表示將第n個樣本分解得到的鑒別特征圖拉成的列向量,fn2表示將第n個樣本分解得到的干擾特征圖拉成的列向量,(·)T表示向量的轉(zhuǎn)置。
為保證兩條支路所提特征的完整性,將兩條支路各自得到的干擾特征和鑒別特征求和后輸入解碼器,定義解碼器輸出的重構圖與輸入網(wǎng)絡的SAR圖像之間的重構損失如下:
其中,∥·∥2表示取2范數(shù)操作,xn表示第n個樣本,表示將第n個樣本經(jīng)過特征分解模塊中的解碼器后輸出的重構圖。
整個網(wǎng)絡的總損失函數(shù)如下:
其中,Lloc表示所提網(wǎng)絡輸出目標框與標記的真實框之間的位置損失,Lcls表示所提網(wǎng)絡輸出目標框的類別損失[12],α表示正交損失函數(shù)的權重,β表示重構損失函數(shù)的權重。
整個網(wǎng)絡采用端到端的訓練方式,利用隨機梯度下降算法,迭代更新網(wǎng)絡的權重值,優(yōu)化網(wǎng)絡的總損失函數(shù)直至其收斂。
本節(jié)首先對實驗中所使用的數(shù)據(jù)集、采用的評價準則以及部分相關的實驗細節(jié)進行介紹;然后將本文所提方法與傳統(tǒng)SAR目標檢測算法及部分基于深度學習的SAR目標檢測算法進行對比分析,證明所提方法的有效性;最后對所提方法的創(chuàng)新點進行了驗證,包括消融實驗以及對特征圖的展示及分析。實驗所用平臺為Ubuntu系統(tǒng),代碼基于Pytorch編寫。
3.1.1 MiniSAR數(shù)據(jù)集
MiniSAR實測數(shù)據(jù)集[22]是美國Sandia國家實驗室在2006年公開的SAR圖像數(shù)據(jù)集。該數(shù)據(jù)集中的SAR圖像為復雜的地面場景,圖像尺寸為1638像素×2510像素,圖像分辨率為0.1 m×0.1 m。該數(shù)據(jù)集的SAR圖像中包含車輛、飛機、建筑物、道路、草地、樹木等。本文實驗將車輛作為感興趣目標,其他物體作為復雜的背景雜波。其中,飛機、建筑物和道路為人造雜波,而草地和樹木為自然雜波。本文從MiniSAR數(shù)據(jù)集中選取了7幅SAR圖像作為訓練數(shù)據(jù),另外選取2幅SAR圖像作為測試數(shù)據(jù)。圖3給出了MiniSAR數(shù)據(jù)集中兩幅圖像的示例。
圖3 MiniSAR數(shù)據(jù)集中的兩幅SAR圖像Fig.3 Two SAR images in the MiniSAR dataset
3.1.2 SADD數(shù)據(jù)集
SADD實測數(shù)據(jù)集[23]是華中科技大學多光譜信息處理技術國家重點實驗室在2022年公開的SAR飛機檢測數(shù)據(jù)集。該數(shù)據(jù)集是由德國TerraSAR-X衛(wèi)星收集的,工作波段為x波段,極化模式為HH極化,圖像分辨率范圍為0.5~3.0 m。數(shù)據(jù)集中共包含2966張224×224的切片,所有切片中共有7835個飛機目標。SADD數(shù)據(jù)集中包含多種尺寸的飛機目標,且目標背景相對復雜,包括各種場景,如機場跑道、機場停機坪、民航機場等。數(shù)據(jù)集中的負樣本主要是在機場周圍,包括空地和森林。圖4展示了SADD中的樣本圖像,圖4(a)為TerraSAR-X衛(wèi)星獲取的真實SAR飛機圖像,圖4(b)為TerraSAR-X衛(wèi)星獲取的干擾目標圖像。本文采用文獻[23]的設置方式,將SADD中的圖像按照5:1的比例隨機劃分為訓練集和測試集,其中訓練集包含796個正樣本和1666個負樣本,測試集包含88個正樣本和416個負樣本。
圖4 SADD數(shù)據(jù)集中的樣本圖像[23]Fig.4 Examples in the SADD[23]
為了驗證本文方法的有效性,本文采用Precision,Recall和F1-score來衡量檢測性能,具體計算公式如下:
其中,Precision是檢測精度,Recall是召回率,TP是正確檢測的目標個數(shù),F(xiàn)P是錯誤檢測的目標個數(shù),即虛警數(shù),F(xiàn)N是未檢測到的目標個數(shù),即漏警數(shù)。Precision越高,代表虛警越少,Recall越高,代表漏警越少,由式(6)可以看出,F(xiàn)1-score綜合了Precision和Recall這兩個指標,能夠更全面地反映檢測結(jié)果的優(yōu)劣,所以本文實驗采用這3個指標綜合衡量各目標檢測算法的性能。
為了適應網(wǎng)絡對輸入尺寸的要求,在訓練過程中,對于實驗中使用的MiniSAR實測數(shù)據(jù),需要先將原始的SAR圖像裁剪為300像素×300像素的子圖像,然后將所有子圖像輸入網(wǎng)絡進行訓練。而在測試過程中,需要先通過滑窗方式將待測試SAR圖像裁剪為300像素×300像素固定大小的子圖像,然后對所有待測試的SAR子圖像進行檢測,最后將所有子圖像的檢測結(jié)果恢復到原始SAR圖像中,并利用NMS去除重復的檢測結(jié)果,從而得到待測試SAR圖像的檢測結(jié)果。
實驗中,每個批次的訓練樣本數(shù)設置為10,初始學習率設置為0.0001,最大迭代次數(shù)設置為120000次,迭代到80000次和100000次時,分別將學習率變?yōu)橹暗?.1。由于網(wǎng)絡的各部分損失值存在量級差異,考慮到過大的損失值會導致網(wǎng)絡無法收斂,且各損失值差距較大也會造成損失失衡,所以我們加入不同的權重調(diào)整各項損失值,將α設置為1,β設置為0.001,保證網(wǎng)絡能較快收斂。
3.3.1 基于MiniSAR數(shù)據(jù)集的實驗結(jié)果
為了驗證所提方法的性能,表2對比了不同目標檢測方法在MiniSAR數(shù)據(jù)集上的實驗結(jié)果,對比方法包括傳統(tǒng)的目標檢測方法如Gaussian-CFAR[1],和基于深度神經(jīng)網(wǎng)絡的目標檢測方法如Faster R-CNN[11],FPN[24],SSD[12],文獻[25]提出的基于矩形不變可旋轉(zhuǎn)卷積的SAR車輛目標檢測網(wǎng)絡和文獻[26]提出的結(jié)合強化學習自適應候選框挑選的SAR目標檢測方法。
表2 不同目標檢測方法在MiniSAR數(shù)據(jù)集上的實驗結(jié)果Tab.2 Experimental results of different target detection methods based on the MiniSAR dataset
從表2可以看出,在對MiniSAR數(shù)據(jù)集進行目標檢測時,Gaussian-CFAR的檢測性能非常差,其檢測精度很低,表示檢測結(jié)果中虛警很多,且召回率也不夠高,表示檢測結(jié)果中漏警也較多;Faster R-CNN雖然具有較高的召回率,即該方法能將實驗數(shù)據(jù)中的大部分目標檢測出來,但是其檢測精度較低,意味著該方法存在較多虛警;FPN和SSD的檢測精度和召回率相當,能將大部分目標檢測出來,但也同樣存在較多虛警和漏警;文獻[25]和文獻[26]的方法都具有較高的召回率,即兩種方法都能將實驗數(shù)據(jù)中的大部分目標檢測出來。但文獻[26]方法的檢測精度較低,即存在較多虛警,且文獻[25]方法的檢測精度依舊低于本文方法。綜合來看,本文方法的檢測精度、召回率和F1-score都較高,相比其他方法有較大優(yōu)勢。具體來說,與表格中的6種對比方法相比,本文方法的F1-score值分別提升了0.4222,0.0634,0.0602,0.0613,0.0077和0.0351,且本文方法的檢測精度和召回率分別為0.9206和0.9512,這表示檢測結(jié)果中的虛警和漏警都較少。表2的實驗結(jié)果證明了在對復雜場景SAR圖像進行目標檢測時,本文方法能夠顯著降低虛警和漏警,提高SAR目標檢測性能。
為了直觀地對比分析不同方法的性能,圖5和圖6分別展示了7種不同方法在MiniSAR數(shù)據(jù)集的兩幅測試圖像上的可視化檢測結(jié)果。圖5和圖6中綠色框表示所使用的目標檢測算法正確檢測出的目標;紅色框表示錯誤檢測的目標,即虛警;藍色框表示未被該算法檢測到的目標,即漏警。由可視化結(jié)果可以看出,在建筑物、樹木和其他軍事目標的區(qū)域中,Gaussian-CFAR的虛警非常多,與之相比,F(xiàn)aster R-CNN,FPN,SSD、文獻[25]的方法和文獻[26]的方法的虛警均大大減少,而在所有方法的檢測結(jié)果中,本文方法的虛警最少;除此之外,在車輛密集的區(qū)域,Gaussian-CFAR存在較多漏警,與之相比,F(xiàn)aster R-CNN,FPN,SSD、文獻[25]的方法和文獻[26]的方法的漏警均有所減少,而在所有方法的檢測結(jié)果中,本文方法的漏警最少,可以將大部分目標檢測出來。綜上,可視化檢測結(jié)果證明了在對復雜場景SAR圖像進行目標檢測時,本文方法擁有更少的虛警和漏警,檢測性能更好。
圖5 不同方法對MiniSAR數(shù)據(jù)集中第1張測試圖片的檢測結(jié)果Fig.5 Detection results of the first test image in the MiniSAR dataset by different methods
本文方法的性能優(yōu)于其他方法的原因主要來自特征分解模塊。本文設計的特征分解模塊能夠?qū)⑤斎氲奶卣鞣纸鉃殍b別特征和干擾特征,其中干擾特征是對目標檢測不利的部分,包括復雜背景雜波,而鑒別特征是對目標檢測有利的部分,包括感興趣目標。經(jīng)過特征分解模塊后,僅將鑒別特征輸入到多尺度檢測模塊進行目標檢測,而干擾特征將被丟棄,從而有效降低虛警和漏警,提高SAR目標檢測性能。
3.3.2 基于SADD數(shù)據(jù)集的實驗結(jié)果
為了進一步驗證所提方法的普適性和有效性,表3對比了不同目標檢測方法在SADD數(shù)據(jù)集上的實驗結(jié)果。由于文獻[25]的方法是基于矩形不變可旋轉(zhuǎn)卷積的SAR目標檢測網(wǎng)絡,該方法僅適用于矩形目標檢測,而飛機并不是矩形目標,所以該方法并不適用于SADD數(shù)據(jù)集,因此表3并不包含文獻[25]方法的實驗結(jié)果。
表3 不同目標檢測方法在SADD數(shù)據(jù)集上的實驗結(jié)果Tab.3 Experimental results of different target detection methods based on the SADD
從表3可以看出,相較于MiniSAR數(shù)據(jù)集的實驗結(jié)果,各方法在SADD數(shù)據(jù)集上的檢測性能都有所下降,這是因為,雖然SADD數(shù)據(jù)集與MiniSAR數(shù)據(jù)集都是復雜場景實測數(shù)據(jù)集,但是與MiniSAR數(shù)據(jù)集相比,SADD數(shù)據(jù)集中不僅包含更多種尺寸的目標,而且其圖像分辨率更低,這些原因增加了對該數(shù)據(jù)集進行目標檢測的難度,從而導致了各方法在SADD數(shù)據(jù)集上檢測性能的下降。然而,即便SADD數(shù)據(jù)集的檢測難度更高,本文方法依然比所有對比方法的檢測性能更好。從表3可以看出,本文方法擁有最高的召回率,即本文方法具有最少的漏警,可以將絕大部分目標正確檢測出來。雖然Faster R-CNN和文獻[26]方法的檢測精度略高于本文方法,但其召回率都明顯低于本文方法,存在很多的漏警。在真實戰(zhàn)場環(huán)境中,以增加少許虛警為代價,降低一些漏警是更有意義的,這有助于發(fā)現(xiàn)較難檢測到的目標,而且本文方法的F1-score最高,也說明本文方法的綜合檢測性能最好。綜上,表3的實驗結(jié)果證明,即便面對檢測難度更高的SADD數(shù)據(jù)集,本文方法依然能夠具有更好的檢測性能,該組實驗結(jié)果更好地驗證了本文方法的普適性和有效性。
圖7展示了不同方法在SADD數(shù)據(jù)集中部分測試切片上的可視化檢測結(jié)果。圖7中綠色框表示所使用的目標檢測算法正確檢測出的目標;紅色框表示錯誤檢測的目標,即虛警;藍色框表示未被該算法檢測到的目標,即漏警。從圖7可以看出,本文方法具有最少的漏警,可以將絕大部分目標正確檢測出來。相較于其他對比方法,本文方法具有更大優(yōu)勢。
圖7 不同方法對SADD數(shù)據(jù)集中部分測試切片的檢測結(jié)果Fig.7 Detection results of some test chips in the SADD by different methods
3.4.1 消融實驗
本文所提特征分解模塊同時使用了正交損失和重構損失,為了驗證這兩個損失的有效性,表4給出了在MiniSAR數(shù)據(jù)集上的消融實驗結(jié)果。
表4 消融實驗結(jié)果Tab.4 Experimental results of ablation experiments
如表4所示,實驗1是不加特征分解模塊的結(jié)果,即原始SSD網(wǎng)絡在MiniSAR數(shù)據(jù)集上的檢測結(jié)果;實驗2是特征分解模塊僅使用正交損失的結(jié)果;實驗3是特征分解模塊僅使用重構損失的結(jié)果;實驗4是特征分解模塊同時使用正交損失和重構損失的結(jié)果,即所提方法在MiniSAR數(shù)據(jù)集上的實驗結(jié)果。從表4的結(jié)果可以看出,特征分解模塊的加入有助于提升目標檢測性能,其中正交損失能夠保證兩條支路所提特征的差異性,重構損失能夠保證所提特征的完整性,兩種損失均有助于特征的學習。由于我們希望的是將輸入網(wǎng)絡的SAR圖像中對檢測不利的特征分解到干擾特征中,如果不加重構約束,只用正交約束,就無法限制干擾特征的范圍,會導致分解到的干擾特征不可控。而如果不加正交約束,只用重構約束,則無法保證鑒別特征和干擾特征的差異性,無法實現(xiàn)特征分解的作用。因此,僅使用單一的損失無法保證將輸入特征完整地分解為互不相同的兩部分,只有同時使用兩種損失,才能保證特征分解模塊將輸入特征完整地分解為對檢測不利的干擾特征和對檢測有利的鑒別特征兩部分,從而進一步提升目標檢測性能。
3.4.2 特征圖展示及分析
為了驗證所提特征分解模塊符合預期,我們基于MiniSAR數(shù)據(jù)集,將特征分解模塊中鑒別特征提取支路得到的鑒別特征圖、干擾特征提取支路得到的干擾特征圖以及解碼器得到的重構圖進行可視化展示,如圖8所示。
圖8 部分SAR子圖像經(jīng)過特征分解模塊得到的鑒別特征圖、干擾特征圖和重構圖Fig.8 The discriminative feature maps and interfering feature maps and reconstruction maps obtained by the feature decomposition module for some SAR sub-images
圖8(a)是輸入網(wǎng)絡的SAR子圖像,尺寸為300×300,其經(jīng)由圖2所示的特征分解模塊可以得到圖2中的干擾特征和鑒別特征,這兩種特征的維度分別為512×38×38,其中512為特征圖通道數(shù),38×38為每張?zhí)卣鲌D的尺寸。將鑒別特征沿通道維取平均即可得到圖8(b)的特征圖,其尺寸為38×38;同理,將干擾特征沿通道維取平均即可得到圖8(c)的特征圖,其尺寸也為38×38。圖8(d)為將干擾特征和鑒別特征求和后輸入圖2所示的解碼器得到的重構圖,其尺寸為300×300。特征圖中的白色區(qū)域表示該區(qū)域的元素值較高,黑色區(qū)域表示該區(qū)域元素值較低。對比圖8(a)—圖8(c)可以發(fā)現(xiàn),不同SAR子圖像經(jīng)過特征分解模塊后,感興趣目標,即車輛,被完整地保留在鑒別特征圖中,而對于背景雜波,其大部分都被分到了干擾特征圖中。不過,也有部分雜波邊緣仍被保留在鑒別特征圖中,如建筑物邊緣、樹木邊緣以及道路邊緣。這是因為雜波邊緣是SAR圖像上兩種類型的雜波區(qū)域交界的地方,在雜波邊緣處像素點的強度變化較大,本文方法并不能完全將這類強雜波邊緣去除。但從圖8(b)的鑒別特征圖中可以看出,雖然鑒別特征圖中保留了部分強雜波的邊緣部分,但邊緣部分與目標的形狀差別很大,相較于完整的雜波區(qū)域來說,并不容易造成虛警。此外,對于車輛目標所處的地面背景,本文方法可以將其全部分到干擾特征圖中,從而實現(xiàn)了凸顯目標的作用。因此,僅利用特征分解模塊得到的鑒別特征圖進行多尺度目標檢測,可以有效降低虛警和漏警,提高目標檢測性能。最后,對比圖8(a)和圖8(d)可以看出,將干擾特征和鑒別特征求和后輸入圖2所示的解碼器,能夠很好地重構出輸入網(wǎng)絡的SAR子圖像,這保證了干擾特征和鑒別特征的完整性。
本文研究了基于特征分解CNN的SAR圖像目標檢測方法,解決了現(xiàn)有方法在對復雜場景SAR圖像進行目標檢測時存在大量虛警和漏警的問題。本文通過構建特征分解模塊,將輸入的特征分解為對目標檢測有利的鑒別特征和對目標檢測不利的干擾特征兩部分,其中,干擾特征中包含容易造成虛警的復雜背景雜波,而鑒別特征中包含感興趣目標,最終僅利用鑒別特征進行多尺度目標檢測。本文提出的特征分解模塊不依賴于具體的目標檢測算法,可以適用于任何基于CNN的目標檢測器?;趯崪y數(shù)據(jù)集的實驗結(jié)果表明,在對復雜場景SAR圖像進行目標檢測時,本文方法能夠顯著降低虛警和漏警,提高SAR目標檢測性能。