王國帥,汪文英,魏 耀,鄭玄玄,雷志勇
(南京電子技術研究所,江蘇南京 210039)
隨著高分辨率寬帶雷達技術的興起,HRRP目標識別成為國內外研究的熱點[1-2]。HRRP能夠提供目標的距離結構信息,包括目標散射點沿雷達徑向分布的強弱特征,數據容易獲取和處理[3]?;贖RRP目標識別傳統(tǒng)的方法包括支持向量機[4](SVM)、模板匹配[5]等。隨著深度神經網絡的飛速發(fā)展,其可以充分挖掘數據更深層次的特征,顯著提高了目標識別精度[6-7]。張等[8]使用自編碼器與SVM相結合的方式將HRRP識別率提高到95%,殷等[9]直接使用卷積神經網絡將HRRP識別率提高98%左右。
為了了解深度學習的遷移性能。Yosinski等[10]研究表明CNN的卷積層得到的是目標的通用特征,遷移學習可有效提升深度網絡的收斂速度,提高網絡的泛化性能。微調作為最簡單深度網絡遷移方法被廣泛地使用[11-12]。但是這個過程是需要目標域數據標簽信息,而且不適用于源域數據與目標域數據分布不同的情況,因此深度網絡自適應方法被提出來。Ghifary 等[13]在特征層添加了一層自適應層,但由于網絡層數有限,表征能力差,并沒有解決數據分布不同的問題。Tzeng 等[14]提出了DDC (Deep Domain Confusion),改善了當數據分布不同時深度網絡的遷移性能。Long 等[15]提出了深度適配網絡DAN,在DDC的基礎上增加了自適應層的數量,并使用表征能力更好的多核MMD(Multi-Kernel MMD,MK-MMD)替代DDC中的MMD。該方法在Office-31數據集上效果比DDC高5%,使模型獲得更優(yōu)的泛化性能。
本文將DAN引入到HRRP目標識別中,并對其作了一些改進。實驗中使用CNN提取目標特征,為了解決識別模型的泛化性能差的問題,在模型的全連接層增加自適應層,創(chuàng)新性地提出了混合核函數MMD方法來度量數據之間的差異。利用不同海情下的仿真數據進行實驗,驗證了該方法可以有效地提高識別模型在復雜環(huán)境下的識別率。
泛化能力的好壞決定了神經網絡對新鮮樣本的適應能力。實驗中發(fā)現當HRRP數據被外部環(huán)境、設備等影響時,基于CNN的HRRP識別模型不能有效地提取特征,識別率下降。為了提高識別模型在實際應用時對這些新鮮樣本的識別能力,本文受遷移學習的啟發(fā),將DAN應用到HRRP目標識別來提高模型的泛化能力。
圖1 深度網絡自適應原理
DAN是深度網絡自適應的一種方法,其結構如圖2所示。它是在AlexNet模型上被提出來的。因為AlexNet的全連接層得到的特征更加的Task-specific[10],所以Long 等對AlexNet模型的fc6、fc7、fc8層都添加了自適應層。MMD距離作為深度網絡自適應中最常用的度量方式,它可以將源域和目標域特征映射到再生希爾伯特空間,度量兩個分布在再生希爾伯特空間中的距離。兩個向量的MMD 距離大小可表示為
(1)
式中,m和n分別為X、Y中元素的個數,k(·)為核函數。DAN方法采用了表征能力更好的MK-MMD,其中k(·)選擇高斯核,表達式為
(2)
MK-MMD中σ可取多個值,MK-MMD距離是使用不同σ計算MMD距離的和。DAN使用分類損失和MK-MMD距離作為損失函數來更新參數,極大地提高了模型的泛化能力。
圖2 DAN結構示意圖
常規(guī)的DAN在訓練時不需要Dt的類別信息,極大地提高了模型的遷移性能和泛化性能,但是它的核函數的選取比較單一。現有的基于深度學習的HRRP目標識別,當訓練環(huán)境和應用環(huán)境發(fā)生變化時,會導致模型的識別性能下降。針對這些問題,本文提出了一種基于混合核DAN的HRRP識別模型,如圖3所示。模型中包含了2個卷積層、池化層和3個全連接層,在fc3層和輸出層分別加了自適應層,使用混合核MMD度量不同域間的分布差異。
圖3 基于混合核DAN的HRRP識別模型
DAN最開始是針對AlexNet設計的,對二維圖像遷移學習自適應問題有明顯改善。本文使用一維CNN來提取目標特征。一維CNN不需要將HRRP轉換成二維圖像進行卷積,更有利于提取特征,而且訓練的參數少,訓練速度快,在實際應用時可以減少反應時間,提高效率。
MMD中核函數的選擇極其重要,這會影響自適應層對模型的改善效果。核函數分為全局核函數(多項式核、線性核等)和局部核函數(高斯核),前者的泛化能力更好,而學習能力方面則是后者較好。為了結合兩者的優(yōu)勢,提出了使用高斯核和多項式核相結合的混合核函數作為MMD的核函數?;旌虾薓MD定義為
MMDl=a×MK-MMD(fl(Ds),fl(Dt))+
(1-a)×MMD(fl(Ds),fl(Dt))
(3)
等式右側第一項是MK-MMD距離,第二項是使用多項式核計算得到的MMD距離,fl(Ds)和fl(Dt)分別是源域、目標域數據在第l層得到的特征,a的取值為0到1之間。其中多項式核為
k(x,y)=(xTy)d
(4)
該模型的損失函數定義為
(5)
等式右邊第一部分代表的是Ds的分類損失,第二部分代表的是混合核MMD距離。在本模型中l(wèi)為全連接層3和輸出層。
損失函數中的分類損失和混合核MMD距離都是權重W和偏置b的函數。根據損失函數可以使用隨機梯度下降的方法逐層更新模型的W和b,使用學習率η控制更新速度:
(6)
(7)
該模型使用常規(guī)海情下的數據作為源域,使用加入海雜波的數據作為目標域。通過不斷地訓練、迭代,使識別模型即使在雜波影響下也可以有效地提取到目標特征,從而達到更好的識別效果。
采用仿真的常規(guī)海情下的10型艦船的HRRP作為實驗數據,每一型艦船數據有32 000幀,每幀包含256個距離單元(如圖4所示)。實驗中按照4∶6的比例將艦船HRRP數據分為Ds和Dt。從中隨機挑選一批數據構成訓練集和測試集,如表1所示。實驗中通過對Dt加不同強度的服從瑞利分布的海雜波的方式構造不同海情的HRRP數據。Dt訓練集沒有標簽。
表1 數據集劃分 (幀)
(a) 第1型艦船
(b) 第4型艦船
(c) 第6型艦船
(d) 第10型艦船圖4 艦船HRRP
HRRP具有平移敏感性、幅度敏感性和方位敏感性,所以預處理是進行目標識別前重要的步驟。當目標相對于雷達平移時,目標在距離窗中的位置也會發(fā)生變化。為了減小平移敏感性的影響,文中選取重心對齊的方法對HRRP的時域信號進行對齊。某幀HRRP數據的重心W為
(8)
式中,xn為該幀數據中第n個距離單元的幅度值大小,N在本文中為256。計算得到重心后,將HRRP數據進行平移,平移長度d為
(9)
選取包絡對齊的方式對HRRP的頻域信號進行對齊。
從圖4可以看出,每一型艦船的HRRP幅度差異明顯,為了減小幅度敏感性對目標識別帶來的影響,對HRRP進行了能量歸一化,隨后對歸一化后的數據進行減均值除以標準差的處理。這樣做更能捕捉到HRRP數據中的個性而非共性,更有利于深度模型使用隨機梯度優(yōu)化方法更新參數,減少網絡訓練時的震蕩,提高網絡模型穩(wěn)定性。
實驗中,HRRP數據的仿真和預處理,數據集的劃分以及海雜波的仿真是通過MATLAB完成的。網絡模型的構建和訓練是在Pytorch框架完成的。實驗中使用圖3所示的模型,其參數設置如表2所示。每個卷積層使用的卷積核大小都是 1×5,卷積時不使用填充。訓練時學習率為 0.003,學習率衰減率為0.99,dropout為0.3,批次大小是150。模型中的激活函數均為Relu函數。訓練流程如圖5所示。
表2 網絡模型參數設置
圖5 訓練流程
因為Dt所加的海雜波強度(SCR=15,20,25,30 dB)不同,所以要針對它們各訓練一個識別模型。在訓練過程中Ds和Dt共享模型的參數,在fc3層將源域和目標域特征按照批次大小分開,并計算它們之間的混合核MMD距離。在輸出層計算Ds的分類損失以及源域和目標域之間的混合核MMD距離。式(3)中a為0.6,式(5)中λl為0.5。利用計算得到的Loss不斷調整、更新網絡中的W和b,來達到減少域之間差異的目的。實驗中MK-MMD的高斯核中σ的取值為:10-6,10-5,10-4,10-3,10-2,10-1,1,5,10,15,20,25,30,35,100,103,104,105和106。多項式核中的d為2。迭代次數滿足一定條件,測試和記錄Dt識別率。
可視化是理解CNN過程最直觀的方法。從表2可知,卷積層2池化后的特征長度為61,卷積核的通道數是50,所以每一幀HRRP數據卷積后得到的特征張量為1×50×61。將Ds測試集輸入到訓練好的識別模型,并對第二層卷積,池化后的前3層特征進行可視化,如圖6所示。從圖中可以看出,卷積層對不同型號艦船HRRP數據提取了有明顯差異的特征,增大了不同型號艦船的可分性。這也說明CNN通過不斷迭代、學習,可以挖掘到目標更深層次的特征。
(a) 第1型艦船
(b) 第2型艦船
(c) 第6型艦船圖6 卷積層2前三層特征
圖7(a)在訓練的時候沒有使用域自適應方法,所以總的損失函數中只有分類損失沒有MMD損失,圖7(b)是使用混合核DAN方法的訓練過程。從圖中可以看出,在使用傳統(tǒng)方法時,MMD損失可以達到2.5左右,此時Dt的識別率只有78%?;旌虾薉AN 方法的加入將MMD損失減小到0.25左右,降低了源域和目標域特征間的分布差異,并把識別率提高到了90%,顯著改善了識別模型的性能。圖7(c)是對fc3層特征降成二維后(Tsne降維法)的可視化結果,源域中同種型號艦船的特征都比較集中,但是海雜波的影響使得目標域與源域分布不一致,模型提取Dt特征的能力降低。對比圖7(c)中左右兩圖可以看出,混合核DAN方法改善了模型提取特征的能力。
從表3可看出,即使是很小的海雜波(SCR=30 dB)也會對模型的識別率有很大的影響,混合核DAN方法改善了不同強度海雜波下的Dt識別 率。且本文提出的方法優(yōu)于原始的DAN方法,減小了引入的雜波對識別的影響。當海雜波較大時,該方法對識別率的提高在5%~10%;隨著加入海雜波強度的減少,該方法可將識別率提高15%左右,識別率可以達到82%。在實驗中還發(fā)現在使用DAN方法時,MMD損失的加入會對模型中共享的參數產生影響,但是這并不會降低模型對Ds的識別率。所以該方法在不改變Ds識別率的情況下提高了模型對含雜波目標的識別率,的確提高了模型對新鮮樣本的識別能力。
(a) 使用傳統(tǒng)方法時訓練時的損失函數和準確率
(b) 使用混合核DAN訓練時的損失函數和準確率
(c) 使用混合核DAN方法前后特征分布圖圖7 訓練數據大小為2 000,加入SCR=30 dB海雜波時訓練過程(頻域)
表3 時域上不同信雜比、數據量下的識別率 (%)
表4是在頻域上所測的不同條件下的目標域測試數據的識別率。通過與表3結果對比可以看出,在頻域的識別率均優(yōu)于時域的識別率。當海雜波強度較小時,使用混合核DAN方法識別率可以達到90%左右,比時域識別率高了8%。因此可以優(yōu)先選擇從頻域角度出發(fā)對目標進行識別。如果Dt類別信息存在的話,還可以對混合核DAN模型再進行微調來達到更好的效果。在實際應用時,可以同時使用在不同強度雜波下訓練的模型對目標進行識別,然后綜合它們的識別結果,得出更可信的結論??偟膩碚f,使用混合核DAN模型的識別效果要比只使用傳統(tǒng)方法或DAN模型的效果要好。
表4 頻域上不同信雜比、數據量下的識別率 (%)
由于測量數據設備等各種因素的影響,再加上所測物體所處環(huán)境復雜多變等因素,需要高性能的算法來改善深度神經網絡的泛化能力,提高復雜環(huán)境下HRRP目標識別的準確率。本文創(chuàng)新性地提出了基于混合核DAN的HRRP目標識別方法,與直接進行權重遷移或DAN方法相比,該方法顯著提高了模型的識別率,提升了泛化能力和魯棒性。此方法可以用來訓練性能更好的識別模型。