王彩云, 吳釔達(dá), 王佳寧, 馬 璐, 趙煥玥
(1. 南京航空航天大學(xué)航天學(xué)院, 江蘇 南京 210016; 2. 北京電子工程總體研究所, 北京 100854)
合成孔徑雷達(dá)(synthetic aperture radar, SAR)具有較好的穿透特性,并且能全天時(shí)、全天候工作,在軍事領(lǐng)域被廣泛使用。通過(guò)自動(dòng)目標(biāo)識(shí)別(automatic target recognition, ATR)技術(shù),可以有效獲取目標(biāo)信息,識(shí)別感興趣的目標(biāo)。主流的ATR方法包括基于模板的方法、基于模型的方法和基于大數(shù)據(jù)深度學(xué)習(xí)的方法。在諸多深度學(xué)習(xí)方法中,卷積神經(jīng)網(wǎng)絡(luò)(convolution neural network, CNN)能有效解決傳統(tǒng)方法中人工特征提取效率低下的問題,并且提高識(shí)別準(zhǔn)確率,已成功應(yīng)用于許多領(lǐng)域。由于CNN的優(yōu)異性能,一大批學(xué)者將其引入SAR圖像目標(biāo)識(shí)別。
文獻(xiàn)[3]在誤差代價(jià)函數(shù)中引入類別可分性度量,提高了網(wǎng)絡(luò)的類別區(qū)分能力,并利用改進(jìn)的CNN對(duì)SAR圖像進(jìn)行特征提取,采用支持向量機(jī)對(duì)特征進(jìn)行分類,實(shí)現(xiàn)了基于CNN的SAR圖像目標(biāo)識(shí)別;文獻(xiàn)[4]采用卷積稀疏編碼進(jìn)行特征提取和數(shù)據(jù)壓縮,融合隨機(jī)森林、樸素貝葉斯和最小值分類器進(jìn)行識(shí)別,提高了識(shí)別精確度,并且對(duì)噪聲具有魯棒性;文獻(xiàn)[5]使用了CNN及其擴(kuò)展模型Fast RCNN和Faster RCNN實(shí)現(xiàn)了SAR圖像的檢測(cè)與識(shí)別;文獻(xiàn)[6]提出了一種ZCA白化與主成分分析相結(jié)合的方法對(duì)SAR圖像進(jìn)行預(yù)處理,并對(duì)CNN的結(jié)構(gòu)參數(shù)進(jìn)行調(diào)整,提高了網(wǎng)絡(luò)訓(xùn)練速度和目標(biāo)分類的準(zhǔn)確率;文獻(xiàn)[7]提出多尺度分解結(jié)合CNN的SAR圖像識(shí)別,解決SAR圖像相干斑造成的識(shí)別率低、耗時(shí)長(zhǎng)等問題;文獻(xiàn)[8]引入遷移學(xué)習(xí),結(jié)合CNN進(jìn)行SAR目標(biāo)識(shí)別,獲得了較好的識(shí)別性能。
然而,在采用CNN進(jìn)行SAR圖像目標(biāo)識(shí)別時(shí),由于SAR圖像存在相干斑點(diǎn)噪聲,可標(biāo)記樣本數(shù)量少,難以采集,對(duì)方位和姿態(tài)的變化較為敏感,因此容易出現(xiàn)過(guò)擬合的問題。針對(duì)該問題,主流方法主要分為對(duì)SAR樣本進(jìn)行數(shù)據(jù)擴(kuò)充和對(duì)神經(jīng)網(wǎng)絡(luò)進(jìn)行優(yōu)化兩種。在數(shù)據(jù)增強(qiáng)方面,文獻(xiàn)[9]通過(guò)裁剪和翻轉(zhuǎn)進(jìn)行數(shù)據(jù)擴(kuò)充,采用比率分批處理使模型收斂更快更好;文獻(xiàn)[10]通過(guò)添加噪聲、多分辨率分析、模擬部分遮擋構(gòu)造了噪聲樣本、多分辨率樣本和不同程度的遮擋樣本,提高了網(wǎng)絡(luò)對(duì)其他擴(kuò)展操作條件的適用性,增強(qiáng)了網(wǎng)絡(luò)的泛化能力。在網(wǎng)絡(luò)優(yōu)化方面,文獻(xiàn)[11]在CNN訓(xùn)練階段引入了Dropout正則化,獲得了更好的識(shí)別率的同時(shí)有效抑制了過(guò)擬合問題;文獻(xiàn)[12]設(shè)計(jì)了基于度量學(xué)習(xí)和深度學(xué)習(xí)的孿生CNN,采用多任務(wù)聯(lián)合學(xué)習(xí)的方法訓(xùn)練模型,有效緩解了相干斑噪聲對(duì)SAR圖像的影響,降低了噪聲過(guò)多引起的過(guò)擬合風(fēng)險(xiǎn)。
上述方法僅考慮數(shù)據(jù)和網(wǎng)絡(luò)優(yōu)化中某個(gè)方面,難以滿足更高的識(shí)別要求。本文提出了基于優(yōu)化CNN和數(shù)據(jù)增強(qiáng)的SAR圖像目標(biāo)識(shí)別方法,為解決SAR樣本不足的問題,采用旋轉(zhuǎn)的數(shù)據(jù)增強(qiáng)方法擴(kuò)充數(shù)據(jù)集,為解決模型泛化性的不足,在訓(xùn)練階段引入Dropout和L2正則化,為解決模型收斂效率低的問題,采用Adam對(duì)網(wǎng)絡(luò)進(jìn)行優(yōu)化。實(shí)驗(yàn)結(jié)果表明,本文方法識(shí)別準(zhǔn)確率高,且具有較好的泛化性。
CNN是一種多層神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),包括輸入層、卷積層、池化層、全連接層和輸出層。其中,卷積層主要用來(lái)提取圖像特征,池化層主要用于特征選擇和信息過(guò)濾,全連接層則是對(duì)提取的特征進(jìn)行非線性組合以得到輸出。在一個(gè)CNN中,一般會(huì)采取多個(gè)卷積層和下采樣層交替設(shè)置,靠近輸出層的最后幾層通常是全連接層。
除了卷積、池化和全連接之外,非線性激活也是CNN的主要操作之一。通過(guò)非線性激活,賦予了網(wǎng)絡(luò)非線性的性質(zhì),從而可避免線性模型表達(dá)不夠的問題。CNN中常用的激勵(lì)函數(shù)包括飽和非線性函數(shù),如Sigmoid函數(shù)和正切函數(shù)等,非飽和非線性函數(shù)如整流線性單元(rectified linear unit, ReLU)和Softplus函數(shù)等,其中ReLU避免了梯度消失問題,收斂快、易于學(xué)習(xí)。不僅如此,它使得網(wǎng)絡(luò)具有稀疏性,能有效緩解過(guò)擬合的問題,因此得到了廣泛的應(yīng)用。
本節(jié)設(shè)計(jì)了一個(gè)7層的神經(jīng)網(wǎng)絡(luò)架構(gòu)并對(duì)其進(jìn)行改進(jìn),引入Dropout結(jié)構(gòu)并在目標(biāo)優(yōu)化函數(shù)中添加正則化項(xiàng),同時(shí)采用Adam作為梯度下降算法,以此構(gòu)建了一個(gè)改進(jìn)的SAR目標(biāo)識(shí)別網(wǎng)絡(luò)。采用數(shù)據(jù)增強(qiáng)方法擴(kuò)充SAR圖像數(shù)據(jù)集后,輸入網(wǎng)絡(luò)進(jìn)行訓(xùn)練。算法框架如圖1所示。
圖1 基于改進(jìn)CNN和數(shù)據(jù)增強(qiáng)的SAR圖像識(shí)別算法Fig.1 SAR image recognition algorithm based on improved CNN and data augmentation
由于SAR圖像數(shù)據(jù)集樣本不足,網(wǎng)絡(luò)模型過(guò)大會(huì)導(dǎo)致過(guò)擬合,故設(shè)計(jì)了7層神經(jīng)網(wǎng)絡(luò)架構(gòu),結(jié)構(gòu)如圖2所示。其中,C1、C3、C4層卷積核大小為5×5,激活函數(shù)為ReLu,C1通道數(shù)為32,C3、C4通道數(shù)為64。S2、S5采樣最大池化,采樣區(qū)域?yàn)?×2。F6采用ReLu作為激活函數(shù),共有512個(gè)節(jié)點(diǎn),F7采用Softmax作為分類函數(shù),共有10個(gè)節(jié)點(diǎn)。
圖2 CNN框架Fig.2 CNN framework
Dropout能夠在一定程度上達(dá)到正則化的效果,有效緩解過(guò)擬合的現(xiàn)象。其思想在于通過(guò)以一定概率將部分神經(jīng)元激活值置為0,從而避免對(duì)局部特征的過(guò)擬合,增強(qiáng)模型的泛化性。有Dropout的神經(jīng)網(wǎng)絡(luò)如圖3所示。
圖3 Dropout CNNFig.3 CNN with Dropout
在運(yùn)動(dòng)和靜止目標(biāo)獲取與識(shí)別(moving and stationary target acquisition and recognition, MSATR)標(biāo)準(zhǔn)工作條件(standard operating condition, SOC)下采集的10類目標(biāo)上,分別用不使用Dropout、Dropout概率為0.3和Dropout概率為0.5進(jìn)行實(shí)驗(yàn),結(jié)果如表1所示。
表1 不同Dropout概率下識(shí)別準(zhǔn)確率
從表1可以看出,當(dāng)Dropout概率為0.3時(shí),SAR圖像識(shí)別準(zhǔn)確率最高,故本文采用Dropout概率為0.3。
正則化方法也稱為貝葉斯正則化,假設(shè)目標(biāo)優(yōu)化函數(shù)為(,),正則化即在目標(biāo)函數(shù)中添加一個(gè)正則化項(xiàng):
(1)
式中:為樣本數(shù)量;為控制正則化程度的超參數(shù)。
采用32×32尺寸圖像下,MSTAR的SOC下采集的10類樣本作為數(shù)據(jù)集,選用不同正則化方法進(jìn)行比較,結(jié)果如表2所示。
表2 不同正則化方案識(shí)別準(zhǔn)確率
從表2可以看出,L2正則化下=0.005的識(shí)別率最高,實(shí)現(xiàn)了抑制過(guò)擬合的效果。
傳統(tǒng)的數(shù)據(jù)增強(qiáng)方法有高斯模糊、圖像裁剪和縮放、圖像鏡面翻轉(zhuǎn)等。
在MSTAR的SOC下采集的10類目標(biāo)上,分別采用5種數(shù)據(jù)增強(qiáng)方法進(jìn)行比較,結(jié)果如表3所示。
表3 不同數(shù)據(jù)增強(qiáng)方法的識(shí)別準(zhǔn)確率
從表3可以看出,采用旋轉(zhuǎn)數(shù)據(jù)增強(qiáng)方法的效果最優(yōu),其識(shí)別率達(dá)到了99%,其旋轉(zhuǎn)角度為-25°~25°。
采用MSTAR的SOC下采集的10類目標(biāo)作為實(shí)驗(yàn)數(shù)據(jù)集,訓(xùn)練集和測(cè)試集的俯仰角分別為17°和15°。設(shè)置Dropout概率為0.3,采用L2正則化,權(quán)重衰減為0.005,采用Adam作為梯度下降算法,選擇旋轉(zhuǎn)-25°~25°進(jìn)行數(shù)據(jù)增強(qiáng),識(shí)別結(jié)果的混淆矩陣如表4所示。
表4 10類目標(biāo)識(shí)別結(jié)果
從表4可以看出,本文設(shè)計(jì)的網(wǎng)絡(luò)在10類目標(biāo)下的最低識(shí)別率為97.95%,平均識(shí)別率為99.2%,有效抑制了過(guò)擬合,取得了較好的識(shí)別效果。
在MSTAR的SOC下采集的10類目標(biāo)上,與其他幾類現(xiàn)有的識(shí)別方法進(jìn)行對(duì)比,分別記為自適應(yīng)CNN法、多分辨率表示法、自注意力多尺度特征融合法,對(duì)比結(jié)果如表5所示??梢钥闯?本文提出的方法平均識(shí)別率高于其他方法。
表5 SOC下結(jié)果對(duì)比
本文提出了一種基于改進(jìn)的CNN和數(shù)據(jù)增強(qiáng)的SAR目標(biāo)識(shí)別方法。針對(duì)SAR圖像樣本不足的問題,采用旋轉(zhuǎn)方法進(jìn)行數(shù)據(jù)增強(qiáng);為了優(yōu)化網(wǎng)絡(luò),引入了Dropout和L2正則化,并采用Adam作為梯度下降算法,有效抑制了過(guò)擬合,增強(qiáng)了網(wǎng)絡(luò)的泛化能力。在MSTAR SOC下的10類目標(biāo)的實(shí)驗(yàn)結(jié)果表明,該方法的平均識(shí)別準(zhǔn)確率達(dá)到了99%以上,有效抑制了過(guò)擬合,識(shí)別性能較好。