(山東大學(威海) 機電與信息工程學院,山東 威海 264209)
在雷達自動目標識別領域,高分辨率距離像(High Range Resolution Profile,HRRP)因具有實時性強、運算量小、容易獲取與存儲等優(yōu)點而受到了廣泛的研究。目前基于HRRP的目標識別大致分為兩個階段:對HRRP進行特征提取,如FFT幅度譜、功率譜、差分譜、中心矩特征、雙譜特征和高階譜特征等;對特征進行分類識別,如模版匹配法、基于統(tǒng)計學模型的分類算法、支持向量機(Support Vector Machine,SVM)和神經(jīng)網(wǎng)絡等[1]。
在HRRP目標識別研究中,如何提取性能更優(yōu)良的特征一直是研究的難點。近十年來,隨著深度學習在圖像分類、目標檢測、自然語言處理、語音識別及語義分析等領域取得了巨大成功[2],許多研究者嘗試使用深度學習算法來解決HRRP目標識別問題。文獻[3]把基于長短期記憶單元的循環(huán)神經(jīng)網(wǎng)絡應用于HRRP識別任務中,文獻[4]使用深度置信網(wǎng)絡解決HRRP的分類問題,文獻[5]提出了基于堆棧自編碼器的深層網(wǎng)絡識別方法,它們都取得了很好的識別結(jié)果。卷積神經(jīng)網(wǎng)絡(Convolutional Neural Network,CNN)作為深度學習模型的一種,通過局部連接和權(quán)值共享機制不僅可以降低網(wǎng)絡的復雜度,還抑制了網(wǎng)絡訓練過程中的過擬合,通過池化操作使CNN具有一定程度的平移不變性[2]。CNN在雷達目標識別領域的研究工作方面,文獻[6]構(gòu)建了一個基于CNN的SAR圖像目標檢測算法架構(gòu),文獻[7]提出一種基于CNN的深度學習算法用于多基站雷達的HRRP目標識別。
由于CNN具有分層學習特征的能力,可以訓練CNN自動地從HRRP中學習有用特征并分類。為了解決手工提取高質(zhì)量特征困難的問題,本文把深度學習領域中的CNN應用于HRRP識別,通過仿真實驗確定網(wǎng)絡的配置與重要參數(shù),研究CNN的目標識別性能。
CNN的網(wǎng)絡結(jié)構(gòu)通常由一系列可重復的卷積層、池化層和全連接層組成,卷積層通過局部連接和權(quán)值共享機制減少網(wǎng)絡參數(shù),降低網(wǎng)絡復雜度。池化層可以降低特征圖的分辨率,使CNN對輸入在一定程度上具有平移不變性,提高了CNN的魯棒性。全連接層可以把卷積層學習到的特征匯聚起來用于分類。圖1給出了一維CNN的基本結(jié)構(gòu)圖。
圖1 一維卷積神經(jīng)網(wǎng)絡Fig.1 One-dimensional convolutional neural network
本文重點研究CNN網(wǎng)絡不同的激活函數(shù)、卷積核、學習率、權(quán)值衰減系數(shù)以及網(wǎng)絡結(jié)構(gòu)對HRRP識別性能的影響。在深度學習算法研究中,參數(shù)調(diào)優(yōu)是一件沉重而繁瑣的事情,迄今為止還沒有固定的方法來選擇合適的參數(shù),需要通過重復實驗積累經(jīng)驗進行調(diào)整。
首先初始化一個如圖2所示的網(wǎng)絡結(jié)構(gòu),然后逐個優(yōu)化相關(guān)參數(shù)。該網(wǎng)絡結(jié)構(gòu)包括3個卷積層、3個池化層和2個全連接層,3個卷積層的特征圖個數(shù)分別為16、32和64,2個全連接層的神經(jīng)元個數(shù)分別為50和4。
圖2 用于雷達距離像識別的卷積神經(jīng)網(wǎng)絡Fig.2 Convolutional neural network for radar HRRP recognition
通過仿真實驗,確定網(wǎng)絡的相關(guān)參數(shù):卷積核大小為3,移動步長為1;池化域的大小為2,移動步長為2,池化方法采用最大值法;學習率為0.01,權(quán)值衰減系數(shù)為0.000 5,網(wǎng)絡的訓練方法采用批量梯度下降法,批量大小為64,最大迭代次數(shù)為2 000;權(quán)值初始化采用文獻[8]中的Xavier初始化方法,權(quán)值更新的動量項因子為0.9,學習率的更新機制采用公式(1)計算。
r=rb·(1+γ·c)-β。
(1)
式中:r表示更新后的學習率;rb表示初始學習率;c表示迭代次數(shù);γ與β為學習率的控制參數(shù),分別取值為0.000 5和0.75。
網(wǎng)絡的損失函數(shù)為SoftmaxWithLoss函數(shù):
(2)
本文借助深度學習庫caffe實現(xiàn)CNN搭建、訓練與測試[9],硬件上使用單塊NVIDIA GeForce GT620M GPU和Intel Core i5 CPU。HRRP數(shù)據(jù)來自飛機縮比模型的暗室成像,4種飛機分別為B2(1:35)、F117(1:13)、J6(1:8)和YF22(1:12)。從數(shù)據(jù)集中抽取200個作為訓練樣本,剩余1 000個作為測試樣本。
Sigmoid函數(shù)、Tanh函數(shù)和ReLU函數(shù)是人工神經(jīng)網(wǎng)絡常用的激活函數(shù),如公式(3)~(5)所示:
(3)
(4)
ReLU(x)=max(0,x) 。
(5)
對3種激活函數(shù)進行仿真,測試不同激活函數(shù)的性能,實驗結(jié)果如圖3所示。從圖3可以看出,Sigmoid函數(shù)的性能最差,誤差曲線沒有下降,整個網(wǎng)絡幾乎沒有被訓練;與ReLU函數(shù)相比,使用Tanh函數(shù)的CNN的誤差曲線快速收斂到0且非常穩(wěn)定。因為本文使用的網(wǎng)絡結(jié)構(gòu)相對較淺且Tanh函數(shù)比ReLU函數(shù)具有更好的非線性,所以選擇Tanh函數(shù)作為激活函數(shù)。
圖3 不同激活函數(shù)的訓練誤差Fig.3 Training errors for different activation functions
通過仿真實驗依次優(yōu)化卷積核、初始學習率和權(quán)值衰減系數(shù)3個重要參數(shù)。在仿真實驗中設定3個卷積層的卷積核大小相等,變化區(qū)間為[3,11],學習率的變化區(qū)間為[0.1,0.001],權(quán)值衰減系數(shù)的變化區(qū)間為[0.5,0.000 05]。表1~3分別給出了不同的卷積核、學習率和權(quán)值衰減系數(shù)的識別率。
表1 不同卷積核的識別率 Tab.1 Recognition rates for different kernel sizes
從表1可以看出,隨著卷積核的增加,網(wǎng)絡的識別性能在總體上呈現(xiàn)下降趨勢,當卷積核大小為3時網(wǎng)絡性能最佳。該結(jié)果與文獻[10]使用小卷積核替代大卷積核的思想不謀而合。當卷積核增大時,導致網(wǎng)絡中的權(quán)值數(shù)目增多,訓練CNN所花費的時間也不斷增加。
表2 不同學習率的識別率Tab.2 Recognition rates for different learning rates
從表2可以看出,當學習率為0.01時識別性能最好。學習率過大或過小時識別率都會變差,因為學習率過大會導致網(wǎng)絡不收斂,而學習率過小會導致權(quán)值更新慢,網(wǎng)絡訓練效果差。
表3 不同權(quán)值衰減系數(shù)的識別率Tab.3 Recognition rates for different decay coefficients
從表3可以看出,當權(quán)值衰減系數(shù)為0.000 5時識別性能最好。衰減系數(shù)過大或過小會使網(wǎng)絡性能變差,因為衰減系數(shù)過大導致權(quán)值衰減嚴重,網(wǎng)絡不能被訓練,衰減系數(shù)過小又起不到防止過擬合的作用。
參考文獻[10],在設計網(wǎng)絡結(jié)構(gòu)時,為了避免數(shù)據(jù)在網(wǎng)絡前向傳播過程中的急劇壓縮,遵守經(jīng)過pooling層時特征圖的數(shù)目增加2倍的原則。另外,由于本文使用的HRRP訓練樣本的數(shù)目與種類較少,CNN的規(guī)模不必設計太大,文中最深為4層。通過調(diào)整網(wǎng)絡的層數(shù)與特征圖的數(shù)目來控制CNN的深度與廣度,在調(diào)整過程中,保持全連接層不變。表4給出了不同網(wǎng)絡結(jié)構(gòu)下4種飛機目標的識別率。
表4 不同網(wǎng)絡結(jié)構(gòu)的識別率Tab.4 Recognition rates for different network structures
由表4可以看出:
(1)從總體上看,隨著網(wǎng)絡層數(shù)的增加,目標識別率開始上升,當網(wǎng)絡達到3層時識別性能最好。但隨著網(wǎng)絡層數(shù)的繼續(xù)上升,目標的識別性能會出現(xiàn)下降趨勢。
(2)當網(wǎng)絡層數(shù)相同時,合理地控制網(wǎng)絡的廣度可以提高網(wǎng)絡的識別性能,如G、H與I所示的識別率。
(3)隨著網(wǎng)絡規(guī)模的增大,訓練網(wǎng)絡花費的時間逐步增加。
因此,設計網(wǎng)絡結(jié)構(gòu)時,它的復雜度應該與數(shù)據(jù)集的大小相匹配,網(wǎng)絡規(guī)模過大或太小都達不到最好的識別性能。另外,還要考慮到訓練網(wǎng)絡所花費的時間成本,網(wǎng)絡越復雜,花費的時間越多。在以上各網(wǎng)絡結(jié)構(gòu)中,網(wǎng)絡H表現(xiàn)最好。
為了驗證CNN應用于HRRP特征提取和分類的有效性,用BP(Backpropagation)網(wǎng)絡、SVM分類器和K-最近鄰(K-Nearest Neighbor,KNN)分類器與CNN進行比較。BP網(wǎng)絡采用256×50×50×4的網(wǎng)絡結(jié)構(gòu),訓練方法為批量梯度下降法,最大迭代次數(shù)為6 000。SVM分類器使用LIBSVM開源工具箱[11],核函數(shù)采用徑向基函數(shù),懲罰系數(shù)c和徑向基函數(shù)中參數(shù)γ基于網(wǎng)格搜索法進行尋優(yōu);KNN分類器中的度量采用歐氏距離,K值取3。實驗結(jié)果如表5所示。
表5 不同分類器的識別率 Tab.5 Recognition rates for different classifiers
從表5可以看出,由于KNN分類器要求訓練樣本具有典型性,且不能處理樣本的平移問題,識別率最低;BP網(wǎng)絡通過調(diào)整網(wǎng)絡權(quán)值與偏置實現(xiàn)輸入到輸出的映射,識別率比KNN分類器大幅度提高;SVM分類器利用核函數(shù)把原始數(shù)據(jù)從不可分的低維空間映射到高維空間實現(xiàn)分類,識別率與BP網(wǎng)絡的識別率接近;CNN利用卷積層提取有用的特征用于分類,識別率最高。從耗時上看,由于SVM分類器的模型只與樣本中少量的支持向量有關(guān),訓練時間最少;KNN分類器雖然不需要經(jīng)過預訓練,但測試樣本需要與每一個訓練樣本作比較,花費時間與樣本集大小有關(guān),當訓練樣本數(shù)目與維度增加時,運算量會急劇增大;CNN和BP網(wǎng)絡分類器把大量時間花費在網(wǎng)絡的訓練上,因為CNN比BP分類器的網(wǎng)絡結(jié)構(gòu)更復雜,所以消耗時間最多。
為了直觀地說明CNN具有良好識別性能的原因,從測試集中選取了3個相似的HRRP像,如圖4所示。當使用CNN來識別這3類目標時,可以通過卷積層自動學習到多種有用的特征,最后匯集到全連接層進行分類。將CNN第二個卷積層中的前7個特征圖可視化,結(jié)果如圖5所示。
(a)F117距離像
(b)JB距離像
(c)YF22距離像圖4 3種飛機目標的距離像Fig.4 HRRPs of three aircraft targets
圖5 3種飛機目標的特征圖Fig.5 The feature maps of three aircraft targets
從圖5可以看出,對于同一個HRRP,7個特征圖學習到的特征互不相同。同一類特征圖從3種不同HRRP中學習到的特征有的相似,有的會存在明顯差別。盡管原始輸入的3種HRRP的差異性不大,但是通過多層的卷積操作,組合多種不同特征,可以把每種特征的差異性逐層積累,學習到易于分辨的特征,最后送給全連接層進行分類,實現(xiàn)良好的識別效果。
本文把深度學習領域中的CNN應用于HRRP的目標識別中,首先介紹了一維CNN的網(wǎng)絡結(jié)構(gòu),重點研究了不同激活函數(shù)、不同參數(shù)、不同網(wǎng)絡結(jié)構(gòu)對CNN識別性能的影響,比較了CNN與BP網(wǎng)絡、SVM和KNN分類器的識別性能,通過可視化特征圖說明了CNN通過卷積層能學習到易于分辨的特征。實驗結(jié)果表明,CNN能夠有效地從原始HRRP中學習到有用的特征并分類,具有很好的識別性能。本文對CNN在HRRP目標識別中的應用進行了初步探索,可為實際工程應用提供參考。今后的研究工作重點是對CNN訓練算法與網(wǎng)絡結(jié)構(gòu)的改進,加強CNN的特征學習能力,進一步提高目標識別率。