基于循環(huán)神經(jīng)網(wǎng)絡的空中目標類型識別

2020-07-15 12:57:54趙佳歡楊海明邱令存

航天控制 2020年3期

趙佳歡楊海明邱令存

上海機電工程研究所，上海201109

0 引言

目標類型識別是防空作戰(zhàn)領域的研究熱點。在現(xiàn)代信息化戰(zhàn)爭中，識別敵方來襲目標的類型是指揮控制系統(tǒng)做出正確決策的重要依據(jù)，準確地識別目標類型有利于精確的威脅評估和合理的火力分配，從而提高我方防空武器系統(tǒng)的作戰(zhàn)效能[1-2]。

面對高動態(tài)不確定性的戰(zhàn)場環(huán)境，空襲目標種類和數(shù)量劇增，如何根據(jù)雷達目標序列數(shù)據(jù)準確而又快速地識別目標類型是一個急需解決的問題。傳統(tǒng)的方法主要依據(jù)目標的高度和速度特性對目標類型進行判斷[3]，文獻[4-5]利用貝葉斯網(wǎng)絡對目標類型進行識別，該方法存在的問題是對于目標高度、速度等一系列非離散的數(shù)據(jù)，需要依據(jù)經(jīng)驗進行離散化，該過程專家主觀因素比重過大。文獻[6]提出一種基于支持向量機(Support Vector Machine, SVM)的目標識別模型，該模型結(jié)構(gòu)簡單，在小樣本訓練集上表現(xiàn)優(yōu)秀，但在面對大規(guī)模樣本時將消耗大量的機器內(nèi)存和運算時間，且經(jīng)典SVM算法很難處理多分類問題。

不同類型的目標，其運動特性、行為特性有所不同，其差異性會體現(xiàn)在目標不同維度的特征中。傳統(tǒng)方法僅僅依據(jù)目標的速度和高度特征進行目標類型的判斷，但有些類型的目標運動特性起伏大，不同類型的目標之間在高度、速度特性上會有重疊，這些因素都降低了識別的準確率。除了目標速度、高度等特征以外，本文考慮引入雷達目標信噪比(Signal-Noise Ratio, SNR)特征用于目標識別，增加識別準確率。而SNR特征起伏大，規(guī)律不明顯，傳統(tǒng)目標識別方法通常不將其作為識別特征之一，而智能化模型循環(huán)神經(jīng)網(wǎng)絡(Recurrent Neural Network, RNN)能從大量的歷史樣本自動學習得到特征，適合處理雷達的時序數(shù)據(jù)。

RNN是一種深度學習模型，深度學習(Deep Learning, DL)通過多層網(wǎng)絡結(jié)構(gòu)和非線性激活函數(shù)的組合，將低層次特征轉(zhuǎn)化為高層次特征[7]。RNN由于其特殊的循環(huán)輸入結(jié)構(gòu)，是眾多深度學習模型中公認的最適合處理時序數(shù)據(jù)的模型，能從大量歷史雷達數(shù)據(jù)中挖掘出隱藏在時間層面的目標特征，并以網(wǎng)絡權值的形式記錄下來。這種方法僅從雷達數(shù)據(jù)層面入手，不需要改良現(xiàn)有雷達的體制，便于實際的工程應用。

1 典型空中目標類型

現(xiàn)代戰(zhàn)爭空襲目標種類和數(shù)量劇增，防空反導作戰(zhàn)面臨的主要威脅可分為2大類：飛機類和導彈類。選擇具有代表性的隱身飛機、常規(guī)飛機、空地導彈、巡航導彈、隨隊掩護電子干擾機這5類典型的空中目標作為研究對象。

隱身飛機利用各種技術手段削弱雷達反射、紅外輻射信息，躲避敵方探測系統(tǒng)的偵測，具有極強的突防及攻擊能力，是各國軍事專家的研究熱點[8-10]。隨著美軍F-35各機型陸續(xù)服役，我國周邊地區(qū)國家諸如日本、澳大利亞等國家訂購的F-35相繼下線交付使用，隱身戰(zhàn)機對我國安全形勢造成極大威脅，反隱身需求越來越迫切。區(qū)分隱身飛機目標與常規(guī)飛機目標具有重要意義。

空地導彈是指從航空器上發(fā)射攻擊地(水)面目標的導彈，與普通的航空炸彈相對，具有目標毀傷概率高、機動性強、隱蔽性好的特點。

巡航導彈是指一類以巡航狀態(tài)在稠密大氣層內(nèi)低空飛行的導彈，美國的戰(zhàn)斧巡航導彈在巡航飛行階段的高度一般在50m左右，掠海飛行高度可達7～15m，能有效避開雷達搜索，躲避攔截。

電子對抗是作戰(zhàn)雙方利用電子設備在電磁維度進行的斗爭，為了削弱甚至破壞對手電子設備的作戰(zhàn)效能，保護己方作戰(zhàn)單位。電子對抗是現(xiàn)代戰(zhàn)爭中一種重要的作戰(zhàn)手段[11-12]，本文以典型的隨隊掩護電子干擾機作為一類研究目標。隨隊掩護干擾是指電子干擾機在指定空域內(nèi)跟隨攻擊編隊戰(zhàn)機飛行，釋放干擾，掩護攻擊編隊。

2 基于循環(huán)神經(jīng)網(wǎng)絡的目標識別

2.1 循環(huán)神經(jīng)網(wǎng)絡結(jié)構(gòu)及原理

RNN是一種以序列數(shù)據(jù)為輸入，且所有循環(huán)節(jié)點按鏈式連接的神經(jīng)網(wǎng)絡。最早由Jordan和Elman分別于1986年和1990年提出，目前RNN在語音識別、機器翻譯等領域有廣泛的應用，但在目標識別領域的研究較少。RNN具有記憶性、參數(shù)共享并且圖靈完備，在學習時間序列非線性特征時具有獨特的優(yōu)勢，而雷達目標數(shù)據(jù)都是大量的時序數(shù)據(jù)，因此應用RNN對目標進行識別具有很大的可行性。

圖1是單向循環(huán)神經(jīng)網(wǎng)絡及其結(jié)構(gòu)展開圖。

圖1 RNN結(jié)構(gòu)圖

圖1中x是多維時間序列數(shù)據(jù)，依次循環(huán)輸入RNN，s為隱藏層輸出，o為輸出層輸出，U是輸入層與隱層全連接權值矩陣，V是隱層與輸出層全連接權值矩陣，W是隱層與隱層之間的循環(huán)權值矩陣。

RNN最大的特點在于引入了隱層自身之間的循環(huán)結(jié)構(gòu)，從其展開圖中可以得到，t時刻隱藏層的輸出st不再僅依賴于U和xt，還依賴于新的權值矩陣W以及上一時刻隱藏層的輸出st-1，正是因為這種特殊的結(jié)構(gòu)，RNN才能有效地處理時間序列數(shù)據(jù)。

隨時間反向傳播(Back Propagation Through Time, BPTT)算法是RNN模型最經(jīng)典的優(yōu)化算法，與傳統(tǒng)的BP算法不同，BPTT算法中計算誤差不僅在空間上傳播，還會在時間尺度上傳播。

BPTT算法主要有以下3個步驟：1)根據(jù)當前時刻的輸入和上一時刻隱層的輸出，計算當前時刻各神經(jīng)元的輸出；2)從最后一個神經(jīng)元開始，在時間尺度和空間結(jié)構(gòu)上分別反向計算各個神經(jīng)元的誤差項；3)計算各個權值的梯度，采用梯度下降法進行權值的更新。

2.2 目標識別算法

基于RNN的目標識別算法如圖2所示。

該算法主要有3大步驟，首先是利用訓練集數(shù)據(jù)對目標識別循環(huán)神經(jīng)網(wǎng)絡進行訓練，在訓練次數(shù)達限后，轉(zhuǎn)入網(wǎng)絡的測試階段，若準確率達標，則進入網(wǎng)絡實時分類識別階段，否則需要重新設置超參數(shù)，再次進行訓練。

其中主要包含了5個核心內(nèi)容：數(shù)據(jù)預處理、網(wǎng)絡結(jié)構(gòu)確定、損失函數(shù)確定、網(wǎng)絡測試評估、實時分類識別。

圖2 RNN目標識別算法

2.2.1 數(shù)據(jù)預處理

首先需要分析樣本數(shù)據(jù)結(jié)構(gòu)，將數(shù)據(jù)集以8∶2的比例劃分為訓練集和測試集，訓練集數(shù)據(jù)用于優(yōu)化循環(huán)神經(jīng)網(wǎng)絡的權值，測試集用于測試訓練完成的模型的識別性能并調(diào)整合適的超參數(shù)。

本文所用的數(shù)據(jù)集中目標特征包含了相對距離R、方位角A、俯仰角E、速度的三軸分量、徑向速度V、高度H以及信噪比。為了消除不同特征屬性之間數(shù)量級差異較大造成的不良影響，提高RNN的收斂速度，增加模型識別的準確率，需要對雷達數(shù)據(jù)進行歸一化處理。本文采用常用的min-max歸一化。min-max歸一化方法對原始數(shù)據(jù)做簡單的線性變換，使得結(jié)果映射到[0,1]區(qū)間上，對于某一維數(shù)據(jù)中的任意x，歸一化公式為

(1)

xmin表示該數(shù)據(jù)集里的最小值，xmax表示該數(shù)據(jù)集里的最大值。

最后需要對樣本標簽轉(zhuǎn)換為獨熱(One-Hot)編碼形式。獨熱編碼能很好地處理離散型屬性的編碼問題，并在一定程度上起到擴充特征的作用，具體編碼如表1所示。

表1 One-Hot編碼形式

2.2.2 網(wǎng)絡結(jié)構(gòu)確定

接著需要確定網(wǎng)絡結(jié)構(gòu)，設置合適的超參數(shù)，比如學習率η、網(wǎng)絡層數(shù)、各層神經(jīng)元數(shù)量、循環(huán)次數(shù)、激活函數(shù)、批處理容量等。超參數(shù)是指在網(wǎng)絡學習過程中不發(fā)生變化，需要事先依據(jù)經(jīng)驗進行設置，并在后續(xù)仿真中具體確定的參數(shù)類型。

學習率η用于控制每次更新時網(wǎng)絡權值調(diào)整的大小，與網(wǎng)絡收斂速度和識別準確率息息相關。如果學習率設置過小，雖然最終能達到較高的識別準確率，但是模型收斂速度慢；如果設置太大，模型的識別準確率波動較大，且不一定能收斂。因此需要確定合適的學習率η，同時保證網(wǎng)絡的收斂速度和識別準確率。據(jù)經(jīng)驗，學習率的典型值在0.001到0.1之間。

網(wǎng)絡層數(shù)和各層神經(jīng)元數(shù)量直接確定了RNN模型的結(jié)構(gòu)。一般而言，網(wǎng)絡層數(shù)越多，神經(jīng)元數(shù)量越多，模型的準確率也會越高，但受限于計算機存儲空間和計算量的限制，往往需要在滿足準確率要求的情況下，確定最簡單的網(wǎng)絡結(jié)構(gòu)，從而減小存儲空間和計算量的消耗。

循環(huán)次數(shù)是指RNN循環(huán)輸入的次數(shù)，一般循環(huán)次數(shù)越多，識別準確率越高，但是實時性會受到影響。

激活函數(shù)一般選擇非線性函數(shù)，可以使神經(jīng)網(wǎng)絡具有表征復雜非線性映射關系的能力。

批處理容量是在網(wǎng)絡權值優(yōu)化過程中，每次迭代訓練所使用樣本數(shù)據(jù)的數(shù)量。一般來說，在合理范圍內(nèi)，越大的批處理容量使梯度下降方向更準確，振蕩越小。若設置過大，可能會陷入局部最優(yōu)；若設置過小，引入的隨機性更大，難以收斂。

2.2.3 損失函數(shù)確定

損失函數(shù)又稱為代價函數(shù)，通過計算當前分類結(jié)果與期望結(jié)果之間的差異，進一步計算出每個神經(jīng)元的誤差，最后根據(jù)BPTT算法優(yōu)化網(wǎng)絡權值。BPTT算法的核心思想是根據(jù)誤差關于網(wǎng)絡權值U,V和W的梯度，用梯度下降法更新U，V和W的值。

這里選擇交叉熵損失函數(shù)，公式為

(2)

其次需要確定訓練過程中給網(wǎng)絡喂數(shù)據(jù)的方式，本文選擇小批量梯度下降法(Mini-Batch Gradient Descent, MBGD)，既可以克服經(jīng)典的梯度下降法需要計算全體樣本損失值導致的計算復雜度高的問題，也可以解決隨機梯度下降法(Stochastic Gradient Descent, SGD)學習過程噪聲多，并不是每一步都向最優(yōu)化進行的問題。

2.2.4 網(wǎng)絡測試評估

在測試數(shù)據(jù)集上對網(wǎng)絡性能進行測試，涉及到的主要評估指標有準確率(Accuracy)、精確率(Precision)、召回率(Recall)及F1得分。下面給出這些指標的具體定義。

準確率：所有被正確識別的樣本數(shù)量占全體樣本的比例。

精確率：每一類都有各自的精確率，即所有識別為X類的樣本中真正屬于X類的比例。

召回率：每一類都有各自的召回率，即所有實際為X類的樣本中被正確識別的比例。

F1得分：每一類的F1得分為該類的精確率和召回率的調(diào)和平均數(shù)，公式為

(3)

其中，PX為X類的精確率，RX為X類的召回率。對于分類模型總的F1得分為各類的F1得分的算數(shù)平均值。

2.2.5 實時分類識別

當戰(zhàn)場傳感器的實時數(shù)據(jù)經(jīng)過預處理之后，直接輸入訓練完成的RNN網(wǎng)絡進行實時的目標識別，識別過程如圖3所示。

圖3 基于RNN的目標識別模型

當雷達探測到來襲目標，對目標數(shù)據(jù)進行預處理，得到9維的目標特征向量，包括了目標的相對距離R、方位角A、俯仰角E、xyz三軸上的速度分量、徑向速度V、高度H和信噪比，然后將每一拍的目標特征向量依次循環(huán)輸入到RNN網(wǎng)絡中，最終網(wǎng)絡輸出目標類型結(jié)果，完成實時目標識別。這里輸入的拍數(shù)需要視具體情況由雷達頻次和識別實時性共同確定，由公式n=f×t計算得到，n為拍數(shù)，f為雷達頻次，t為人為設定預期需要在發(fā)現(xiàn)目標后多久時間內(nèi)給出識別結(jié)果。

3 仿真分析

仿真校驗使用的數(shù)據(jù)集來源于某型號真實檢飛數(shù)據(jù)，數(shù)據(jù)規(guī)模為21276，每條數(shù)據(jù)都包含了40拍的目標狀態(tài)，即RNN模型的循環(huán)次數(shù)為40次，其中各目標種類占比為常規(guī)飛機31.2%、隱身飛機20.9%、空地導彈13.3%、電子干擾機18.2%和巡航導彈16.4%，雷達數(shù)據(jù)包含了目標相對距離、方位角、俯仰角、速度、信噪比等狀態(tài)。

仿真實驗平臺硬件設備：處理器Intel(R) Core(TM) i5-6500 CPU@3.20GHz，內(nèi)存8GB,集成開發(fā)環(huán)境為Spyder3.2.8，編程語言為Python3.6，深度學習框架為Tensorflow1.9.0。

仿真參數(shù)設置如下：RNN循環(huán)次數(shù)40，激活函數(shù)為雙曲正切tanh函數(shù)，批處理容量為128。

3.1 網(wǎng)絡結(jié)構(gòu)確定

本小節(jié)通過仿真實驗確定最優(yōu)的網(wǎng)絡結(jié)構(gòu)，包括網(wǎng)絡的層數(shù)和各層神經(jīng)元的數(shù)量。圖4是不同網(wǎng)絡結(jié)構(gòu)下測試集的識別準確率對比。

圖4 不同網(wǎng)絡結(jié)構(gòu)下模型識別準確率對比

可以看出，單隱層結(jié)構(gòu)下，一定范圍內(nèi)增加神經(jīng)元數(shù)量能顯著提高模型識別準確率，當數(shù)量增加到一定程度，比如從32個增加到64個，識別準確率上升不明顯，但計算量大幅上升；雙隱層結(jié)構(gòu)下，雖然用16～16的結(jié)構(gòu)就能達到單隱層結(jié)構(gòu)32個神經(jīng)元的準確率，但是雙隱層結(jié)構(gòu)相對復雜，需要的計算量大。綜合考慮準確率與計算量，這里選擇單隱層32個神經(jīng)元的網(wǎng)絡結(jié)構(gòu)。

3.2 學習率確定

本小節(jié)通過仿真確定最優(yōu)的學習率，圖5給出了不同的學習率對于模型收斂速度的影響。

圖5 不同學習率模型識別準確率對比

當學習率為0.1時，準確率能很快到達峰值，但準確率僅有0.45，且波動幅度大；當學習率為0.0001，模型在迭代200步后才接近收斂，收斂速度慢，最終準確率為0.85；當學習率為0.01或0.001時，收斂速度快，最終準確率為0.95。

為保證模型收斂的快速性及較高的準確率，本文將學習率設置為0.001。

3.3 目標識別模型性能分析

3.3.1 信噪比的影響

圖6給出了3類不同目標的信噪比特征對比圖。

圖6 不同目標SNR對比

從圖6可以看出，隱身飛機的SNR特征相對于常規(guī)飛機起伏較小，數(shù)值也較低，而空地導彈的SNR特征雖然也有起伏，但是從直觀上看程度比隱身飛機大，比常規(guī)飛機小，在數(shù)值上也小于常規(guī)飛機。可見不同類型目標的SNR特征有一定的區(qū)別，可以將其作為目標識別的特征之一，RNN模型能從大量數(shù)據(jù)中學習得到隱藏在SNR中的特征。下面將研究引入SNR特征對識別模型識別準確率的影響。

首先僅依據(jù)目標的相對距離、方位角、俯仰角、高度、速度特征屬性對目標類型進行識別，并給出模型在測試集上的準確率、F1得分等各項指標。然后研究了雷達目標SNR特征的引入對于目標識別模型性能的影響。表2中①代表引入SNR特征前的模型各項指標，②代表引入SNR特征后識別模型的各項指標。

表2 信噪比對識別準確率的影響

準確率與F1得分是衡量分類模型性能優(yōu)劣的重要指標，可以看到，當目標識別模型的輸入未包含SNR這一特征時，識別準確率為89.9%，F(xiàn)1得分為0.760；當加入SNR這一特征時，識別準確率為95.3%，提高了5.4%，F(xiàn)1得分為0.822，提高了0.062。

從多角度看待問題，能對問題有更全面的認知。根據(jù)表2可得結(jié)論，結(jié)合雷達目標SNR特征，可以有效提高目標識別的準確率，證明空中目標識別過程中，目標相關特征屬性越多，越可能提高識別模型的準確率，為后續(xù)雷達其他相關信號能用于目標識別提供了支撐。

3.3.2 RNN與其他方法的對比

本小節(jié)將基于RNN的目標識別模型與其他傳統(tǒng)目標識別方式進行對比。

貝葉斯網(wǎng)絡是一種概率圖模型，可以解決目標識別過程中不定性和不完整性的問題；SVM是機器學習中最經(jīng)典的分類算法之一。

表3給出了3種模型的識別準確率。

表3 不同目標識別方法準確率

可以看出，RNN模型的識別準確率最高，SVM次之，貝葉斯網(wǎng)絡的準確率最低。構(gòu)建貝葉斯網(wǎng)絡時有分布獨立的假設前提，但在實際目標各屬性之間基本不可能完全獨立，并且構(gòu)建網(wǎng)絡時極其依賴專家經(jīng)驗知識，導致識別準確率較低。經(jīng)典SVM算法是針對二分類問題提出的，對于多分類問題，有其一定的局限性。而RNN模型在選擇了適當?shù)某瑓?shù)后，能自動學習得到目標類型特征，并以網(wǎng)絡權值的形式記錄下來，結(jié)果表明該模型能達到95%的識別準確率。

4 結(jié)語

傳統(tǒng)目標識別方法使用的目標特征單一，往往僅憑目標速度、高度做出判斷，但不同類型目標的速度、高度特性上會有一定重疊，導致傳統(tǒng)目標識別方法準確率低。本文利用智能化算法將雷達目標SNR特征融入到目標識別方法中，構(gòu)建了基于RNN的目標類型識別模型，擴展了使用的目標特征屬性維度，提高了識別準確率。最后應用某型號真實檢飛數(shù)據(jù)，檢驗該方法的有效性，并與樸素貝葉斯網(wǎng)絡模型和SVM模型進行了對比。仿真結(jié)果顯示樸素貝葉斯網(wǎng)絡模型的識別準確率為63.0%，SVM模型的識別準確率為80.8%，而RNN模型的識別準確率達到了95.3%，且引入雷達信噪比特征能提高識別準確率。結(jié)果表現(xiàn)，RNN智能化模型能有效地將SNR特征融入到目標識別過程中，并能得到較高的識別準確率。