朱克凡,王杰貴,吳世俊
(1.國防科技大學(xué)電子對抗學(xué)院,安徽 合肥 230037;2.中國人民解放軍96713部隊,江西 上饒 334100)
雷達目標識別(Radar Target Recognition,RTR)是雷達研究的一個重要方向。由于高分辨雷達研究成本高、周期長、難以普及,現(xiàn)役雷達大部分是低分辨雷達,且隨著脈沖壓縮技術(shù)的普及,傳統(tǒng)低分辨雷達也能擁有很高的徑向分辨力,能夠提取目標一維距離像等細微特征,基于低分辨雷達的目標識別技術(shù)研究仍然是雷達研究的一個重要熱點[1-4]。
在現(xiàn)代戰(zhàn)爭中,當雷達的脈沖重復(fù)頻率較低或者目標是先進的非合作目標或隱身目標時,通常難以獲取足夠多的訓(xùn)練樣本[5]。在進行雷達偵察任務(wù)時,采集到大量無標簽數(shù)據(jù),對其進行半監(jiān)督學(xué)習(xí)能夠有效提高目標識別率。目前,對于雷達目標的半監(jiān)督學(xué)習(xí)方法主要是基于支持向量機(Support Vector Machine, SVM)。文獻[6]基于信號調(diào)制譜特征利用多核直推式支持向量機(TSVM-MKL)算法實現(xiàn)了對飛機目標的分類。文獻[7]基于信號RCS特征通過TSVM-MKL算法實現(xiàn)了對彈道目標的分類,但一方面SVM的核函數(shù)選擇比較困難,另一方面基于SVM的目標識別算法需要先對回波信號進行特征提取,會損失數(shù)據(jù)信息,不利于目標識別率的提高。
隨著深度學(xué)習(xí)理論的出現(xiàn),卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks, CNN)由于能夠自學(xué)習(xí)數(shù)據(jù)深層本質(zhì)特征[8],在各個領(lǐng)域具有廣泛應(yīng)用[9-12],使基于采樣數(shù)據(jù)實現(xiàn)對雷達目標的直接識別成為可能,而生成對抗網(wǎng)絡(luò)(Generative Adversarial Network, GAN)可以生成逼邁真實數(shù)據(jù)頒的生成樣本[13-16],將生成樣本與無標簽樣本組成真假樣本集,通過生成器與判別器的對抗學(xué)習(xí),充分利用無標簽數(shù)據(jù)信息,提高判別器的判別能力。
因此,為解決雷達偵察過程中數(shù)據(jù)庫標簽樣本不足導(dǎo)致目標識別率難以提高的問題,本文將GAN應(yīng)用于低分辨雷達目標識別領(lǐng)域,并引入CNN作為分類器,提出了基于GAN的半監(jiān)督低分辨雷達目標識別算法。
現(xiàn)代雷達輻射源信號常采用線性調(diào)頻(Linear Frequency Modulation, LFM)信號,使用脈沖壓縮技術(shù)可使雷達具有很高的徑向分辨力,當雷達目標的尺寸大于徑向分辨力時,運動目標占據(jù)多個距離單元,此時可以使用多散射點模型來模擬目標回波信號。
當雷達發(fā)射機發(fā)射的是LFM信號時,幅度歸一化后可以表示為:
(1)
(2)
(3)
接收機采用變頻技術(shù)對接收信號進行處理,首先產(chǎn)生一個與發(fā)射信號斜率相同的LFM參考信號:
(4)
(5)
(6)
(7)
將變頻后的信號輸入低通濾波器,對其進行數(shù)字采樣,獲得目標回波采樣數(shù)據(jù):
(8)
GAN由生成器G和判別器D組成,其中生成器G的作用是根據(jù)輸入的噪聲序列z(通常服從正態(tài)分布[10])來盡量產(chǎn)生服從真實數(shù)據(jù)分布Pdata的生成樣本G(z)以欺騙判別器D,而D的作用是判斷輸入樣本是真實樣本x還是G(z),G與D之間相互對抗,互相促進,在不斷的對抗中,兩者會達到納什均衡,最終G能夠捕獲到x的分布并產(chǎn)生能夠以假亂真的G(z),而D則由于無法正確區(qū)分x和G(z),輸出逼近一個固定值。GAN的流程如圖1所示。
圖1 GAN流程圖Fig.1 The flow chart of GAN
GAN的目標函數(shù)V(D,G)可以表示為:
(9)
GAN的判別器D是二分類模型,作用是區(qū)分真假樣本。在半監(jiān)督識別算法中,使用CNN替代判別器,輸出層連接Softmax分類層,實現(xiàn)分類器的作用,分類器C的輸入為標簽樣本、無標簽樣本和生成樣本,并在K個目標類別外,給無標簽樣本和生成樣本賦予第K+1類真假類別,分類器的作用是當輸入標簽樣本時,輸入對應(yīng)的標簽,當輸入無標簽樣本時,在真假類別中輸出1,當輸入生成樣本時,在真假類別中輸出0。此時,分類器對三類樣本的損失函數(shù)如下:
Llabel=-E[logC(x|y)y]
(10)
Lunlabel=-E[log(1-C(x)K+1)]
(11)
Lfake=-E[logC(G(z))K+1]
(12)
式中,Llabel,Lunlabel,Lfake分別是分類器對標簽樣本、無標簽樣本和生成樣本的損失函數(shù),C(x|y)y表示當輸入屬于y類的樣本x時,分類器C識別為y類的概率;C(x)K+1表示當輸入無標簽樣本x時,分類器識別為K+1類的概率;C(G(z))K+1表示當輸入的是生成器產(chǎn)生的生成樣本G(z)時,分類器識別為K+1類的概率。由于分類器使用的是Softmax損失函數(shù),利用Softmax函數(shù)的特性,即輸入各維減去同一個數(shù),Softmax函數(shù)輸出結(jié)果不變??梢粤頒(x)→C(x)-C(G(z))K+1,則C(G(z))K+1=0,此時,分類器的類別可以用K維來替代,分類器對三類樣本的損失函數(shù)調(diào)整為:
Llabel=-E[C(x|y)y-LSE(C(x))]
(13)
Lunlabel=-E[LSE(C(x))-softplus(LSE(C(x)))]
(14)
Lfake=E[softplus(LSE(C(G(z))K+1))]
(15)
在分類器的損失函數(shù)中引入權(quán)重系數(shù)w,則分類器的總體損失函數(shù)為:
(16)
生成器的損失函數(shù)為:
LG=-Lfake
(17)
則基于GAN的半監(jiān)督識別模型的目標函數(shù)V(C,G)可以表示為:
(18)
流程如圖2所示。
圖2 基于GAN的半監(jiān)督識別模型流程圖Fig.2 The flow chart of semi-supervised recognition model based on GAN
在基于GAN的半監(jiān)督低分辨雷達目標識別算法中,生成器產(chǎn)生逼近真實數(shù)據(jù)分布的生成樣本,分類器為區(qū)分生成樣本和真實樣本,需要挖掘無標簽數(shù)據(jù)中深層本質(zhì)特征,然后通過標簽數(shù)據(jù)的監(jiān)督學(xué)習(xí)選取更利于目標分類的特征,最終實現(xiàn)提高分類器識別性能的目的。
將標簽樣本,無標簽樣本和生成樣本輸入GAN中,訓(xùn)練生成器和分類器,然后將訓(xùn)練好的分類器單獨取出作為低分辨雷達目標的識別網(wǎng)絡(luò),實現(xiàn)對雷達目標的有效識別。識別算法流程圖如圖3所示。
識別算法實現(xiàn)步驟如下:
1) 從真實數(shù)據(jù)集中隨機采樣m個標簽樣本(x|y)和m個無標簽樣本x,從正態(tài)分布中隨機產(chǎn)生m個噪聲z作為噪聲樣本;
2) 將標簽樣本、噪聲樣本和無標簽樣本作為一批訓(xùn)練樣本輸入GAN來訓(xùn)練生成器和分類器;
3) 按照預(yù)先設(shè)定的訓(xùn)練批次和迭代次數(shù),循環(huán)步驟1)、步驟2),將GAN訓(xùn)練完畢;
4) 取出GAN的分類器部分,作為低分辨雷達目標識別網(wǎng)絡(luò)實現(xiàn)對低分辨雷達目標的分類識別。
圖3 基于GAN的半監(jiān)督低分辨雷達目標識別算法Fig.3 The semi-supervised low-resolution radar target recognition algorithm based on GAN
實驗數(shù)據(jù)集由仿真軟件Matlab生成,仿真參數(shù)設(shè)置:LFM信號載頻為3 GHz,調(diào)頻周期為0.1 ms,調(diào)頻帶寬為100 MHz,采樣頻率為5 MHz。數(shù)值仿真實驗對3類目標進行目標識別,分別為人,摩托車和卡車。人的速度是0~6 km/h,摩托車是0~40 km/h,卡車是0~80 km/h,取1個調(diào)頻周期內(nèi)的采樣數(shù)據(jù)作為1個樣本,通過計算可知樣本大小為1×500維,并對通過低通濾波器的采樣數(shù)據(jù)進行幅度歸一化和取絕對值處理。在訓(xùn)練樣本集中,每個目標類型產(chǎn)生480個標簽樣本和960個無標簽樣本,共4 320個樣本;測試樣本集中每個目標類型產(chǎn)生400個樣本,共1 200個樣本,其中訓(xùn)練樣本集與測試樣本集分別獨立產(chǎn)生。實驗中采用Adam優(yōu)化器,學(xué)習(xí)率為0.000 5,動量為0.5,每個批次24個樣本,生成器的輸入噪聲序列服從正態(tài)分布。
由于實驗設(shè)備限制,實驗中未使用GPU,設(shè)計的GAN網(wǎng)絡(luò)中生成器使用最簡單的全連接層,采用三層全連接層,網(wǎng)絡(luò)模型結(jié)構(gòu)如圖4(a)所示,將N×100維的噪聲作為生成器的輸入,通過兩層全連接層后維度轉(zhuǎn)換成N×500的生成樣本,其中前兩層全連接層先連接歸一化層,對全連接的結(jié)果做歸一化處理后,再進行非線性運算。前兩層的激活函數(shù)是Softplus函數(shù),第三層的激活函數(shù)是Sigmoid函數(shù)。分類器采用一維CNN結(jié)構(gòu),共包含3個卷積層、3個池化層、1個全連接層及Softmax分類器。各卷積層分別包含6個1×13的卷積核,12個1×11的卷積核和30個1×5的卷積核;各池化層分別采用1×4,1×4及1×2的小窗口對卷積后的特征進行不重疊的下采樣;Softmax分類器輸出1×3的目標識別概率向量。網(wǎng)絡(luò)模型結(jié)構(gòu)如圖4(b)所示。
圖4 生成對抗網(wǎng)絡(luò)結(jié)構(gòu)Fig.4 The structure of GAN
分類器的損失函數(shù)由兩部分組成,包括標簽樣本的分類誤差以及無標簽樣本和生成樣本的真假判別誤差,其中真假判別誤差對分類器損失函數(shù)的影響通過權(quán)值系數(shù)w調(diào)節(jié)。
由于分類器的主要作用是分類,且無標簽樣本數(shù)往往多于標簽樣本數(shù)。為了防止分類器過多的關(guān)注真假判別問題,影響對目標的識別,權(quán)值系數(shù)w通常遠小于1。
為了更好地識別雷達目標,針對不同的權(quán)值系數(shù)w,進行識別實驗。采用信噪比為-6 dB的仿真目標回波采樣數(shù)據(jù)作為網(wǎng)絡(luò)輸入,進行100次蒙特卡洛實驗。不同w值下,三種方法的平均識別率如表1所示。其中,當w等于0時,基于GAN的半監(jiān)督識別算法退化為基于CNN的識別算法。
表1 不同w下的平均識別率Tab.1 Average recognition rate with different w
從表1可以看出,隨著w增加,識別率呈現(xiàn)先增加后減少的趨勢;當w等于0.01時,平均識別率較高,所以本文算法中選取w=0.01作為權(quán)值系數(shù)。
采用信噪比為-2 dB的仿真目標回波采樣數(shù)據(jù)作為網(wǎng)絡(luò)輸入,權(quán)重系數(shù)w為0.01,訓(xùn)練迭代次數(shù)與損失函數(shù)的變化如圖5所示。圖5(a),(b)分別是分類器判別標簽樣本和無標簽樣本的損失函數(shù)隨訓(xùn)練次數(shù)增加而變化的情況。圖5(c)表示生成器的損失函數(shù)變化情況。
圖5 損失函數(shù)隨訓(xùn)練次數(shù)變化圖Fig.5 Loss function changes with training frequency
從圖5可以看出,分類器前期無法正確區(qū)分各類樣本,生成器由于逐漸學(xué)習(xí)到真實樣本的特征,損失函數(shù)在初期有略微下降現(xiàn)象,后期分類器逐漸學(xué)習(xí)到真實樣本特征并通過監(jiān)督學(xué)習(xí)實現(xiàn)對不同樣本的有效識別。生成器和分類器在訓(xùn)練過程中相互對抗,在圖中呈現(xiàn)出大幅度的震蕩,生成器在訓(xùn)練過程中逐漸學(xué)習(xí)到真實樣本的特征,生成樣本分布也逐漸逼近真實樣本分布,但在總體趨勢上,生成器的損失函數(shù)逐漸上升,表明分類器的識別能力強于生成器的生成能力,生成器生成能力的增強促使分類器的識別能力的進一步提高。較單純依靠標簽樣本訓(xùn)練的CNN,基于GAN的半監(jiān)督識別方法的識別能力更強。
當輸入同一噪聲序列時,生成樣本隨迭代次數(shù)Epoch增加產(chǎn)生的變化如圖6所示。可以看出,隨著訓(xùn)練的加深,生成樣本從無意義的噪聲逐漸蘊含真實樣本特征,且毛刺也在逐漸減少,分布上也越來越逼近真實樣本分布,促使分類器挖掘數(shù)據(jù)中更深層本質(zhì)特征以區(qū)分真假樣本。
圖6 相同噪聲在不同迭代次數(shù)下產(chǎn)生的生成樣本Fig.6 Samples generated by the same noise in different iterations
3.5.1 對三類目標的識別效果
為了驗證基于GAN的半監(jiān)督低分辨雷達目標識別算法的可行性,采用信噪比為-2 dB的仿真目標回波采樣數(shù)據(jù)作為網(wǎng)絡(luò)輸入,權(quán)重系數(shù)w為0.01,進行人、摩托車和卡車三類目標的識別實驗。表2是三類目標的識別混淆矩陣,混淆矩陣中每一列表示目標所屬的真實類別,每一行表示一維CNN的識別結(jié)果。
從表2可以看出,雖然三類目標的識別效果有差異,但識別效果最差的摩托車在信噪比為-2 dB時,識別率仍達到了95.5%,說明基于GAN的半監(jiān)督低分辨雷達目標識別方法能夠有效地對人、摩托車和卡車進行識別。
表2 三類目標識別混淆矩陣Tab.2 Recognition confusion matrix of three kinds of target
3.5.2 樣本數(shù)對識別效果的影響
為驗證本文方法在不同樣本數(shù)下的識別性能,采用信噪比為-2 dB的仿真目標回波采樣數(shù)據(jù)作為網(wǎng)絡(luò)輸入,權(quán)重系數(shù)w為0.01,將本文方法與基于CNN的識別方法和文獻[6—7]中基于TSVM-MKL算法的識別方法進行比較。
3.5.2.1 無標簽樣本數(shù)對識別效果的影響
實驗中標簽樣本數(shù)為120,由于偵察過程中會接收到大量無標簽樣本,實驗中無標簽樣本與標簽樣本分別采取(1∶2),(1∶1),(2∶1),(3∶1)和(5∶1)的比例形成訓(xùn)練數(shù)據(jù)集。通過100次蒙特卡洛實驗,三種方法的平均識別率如表3所示,其中基于CNN的識別方法由于不使用無標簽樣本,識別率不變。
表3 不同比例下各方法的識別率Tab.3 The recognition rate of each method with different proportion
從表3可以看出,本文算法的識別率隨著無標簽樣本比例的增大,呈現(xiàn)先增長后降低的現(xiàn)象,這是由于權(quán)值系數(shù)w是固定的,隨著無標簽樣本數(shù)增多,其對分類器識別性能的影響也就增大,太多的無標簽樣本反而會影響分類器的識別性能;且無標簽樣本數(shù)越多,網(wǎng)絡(luò)的訓(xùn)練時間越長。綜合考慮,無標簽樣本與標簽樣本按照2∶1的比例形成訓(xùn)練數(shù)據(jù)集能夠較好的訓(xùn)練識別網(wǎng)絡(luò)。
3.5.2.2 標簽樣本數(shù)對識別效果的影響
實驗中標簽樣本數(shù)分別為120,240,480,960和1 920,無標簽樣本與標簽樣本采取2∶1的比例形成訓(xùn)練數(shù)據(jù)集。通過100次蒙特卡洛實驗,三種方法的平均識別率如表4所示。
表4 不同標簽樣本數(shù)下各方法的識別率Tab.4 The recognition rate of each method with different labeled sample sizes
從表4可以看出,文獻[6—7]算法識別效果受標簽樣本數(shù)影響較小,識別率維持在80%左右,而本文算法和基于CNN的識別方法受標簽樣本數(shù)影響較大。但當標簽樣本數(shù)為120時,本文算法識別率仍達到了91.9%,較文獻[6—7]方法提高了11.8%,較基于CNN的識別方法提高了4.4%,進一步證明了本文算法的有效性。
3.5.3 信噪比對識別效果的影響
為驗證本文方法在不同信噪比下的識別性能,將本文方法與基于CNN的識別方法和文獻[6—7]的識別方法進行比較。用添加高斯白噪聲的方法對數(shù)據(jù)進行加噪處理,信噪比分別是-10 dB,-8 dB,-6 dB,-4 dB和-2 dB。通過100次蒙特卡洛實驗,三種方法的平均識別率如圖7所示。
圖7 3種方法在不同信噪比下的平均識別率Fig.7 The average recognition rates of thethree methods at different SNR
從圖7可以看出, 采用CNN的識別方法由于是基于采樣數(shù)據(jù)的直接識別,保留了數(shù)據(jù)全部信息,當信噪比較大時,現(xiàn)有標簽樣本能夠較好的訓(xùn)練CNN,識別率明顯高于文獻[6—7]算法,而當信噪比為-10 dB時,噪聲較大,基于CNN的識別方法通過現(xiàn)有標簽樣本較難學(xué)習(xí)數(shù)據(jù)深層特征,識別率低于文獻[6—7]算法。而本文所提基于GAN的半監(jiān)督低分辨雷達目標識別算法,在利用CNN實現(xiàn)對采樣數(shù)據(jù)直接識別的同時,利用了大量無標簽樣本,挖掘了數(shù)據(jù)更深層本質(zhì)特征,識別效果明顯優(yōu)于基于CNN的識別方法和文獻[6—7]算法。
3.5.4 算法識別時間對比實驗
對文獻[6—7]算法和本文算法的識別時間進行計算,結(jié)果如表5所示??梢钥闯?,本文算法由于在識別過程中無需對信號進行特征提取,識別時間遠遠少于文獻[6—7]算法的識別時間。
表5 兩種算法的識別時間Tab.5 The recognition time of the two algorithms
本文提出了基于GAN的半監(jiān)督低分辨雷達目標識別算法。該算法將GAN應(yīng)用于低分辨雷達目標識別領(lǐng)域,用CNN替代判別器實現(xiàn)多分類功能,將生成樣本和無標簽樣本形成真假類別屬性,利用GAN的對抗生成特點,提高分類器的識別能力,然后將分類器取出作為低分辨雷達目標識別網(wǎng)絡(luò)。仿真實驗結(jié)果表明,本文所提的基于GAN的半監(jiān)督低分辨雷達目標識別算法較傳統(tǒng)半監(jiān)督低分辨雷達目標識別方法在識別準確度和運算速度上都有明顯優(yōu)勢。