普運偉, 劉濤濤, 郭江, 吳海瀟
(1.昆明理工大學 信息工程與自動化學院, 云南 昆明 650500;2.昆明理工大學 計算中心, 云南 昆明 650500)
雷達輻射源信號(RES)識別是電子偵察的重要組成部分,其技術(shù)水平和雷達對抗系統(tǒng)水平緊密相關(guān)。隨著電子對抗中電磁環(huán)境愈加復雜以及復雜體制雷達的迅速發(fā)展,傳統(tǒng)僅依靠常規(guī)脈沖描述字的5個特征,即到達時間(TOA)、載波頻率(RF)、到達方向(DOA)、脈沖幅度(PA)和脈沖寬度(PW)的分選方法已經(jīng)無法滿足實際戰(zhàn)場的需要,尋找新的分選識別特征參數(shù)已成為解決該問題的重要研究方向。另一方面,隨著對輻射源信號先驗信息認知的增強,利用新型學習算法對RES進行分選識別成為了一種可行的研究方案。
近年來,國內(nèi)外專家學者對提取雷達信號的脈內(nèi)特征進行了重點研究,如時頻特征[1]、小波特征[2]等并獲得了一定的分選效果。但人工提取特征存在耗時長且需要研究者具有較高的知識儲備等問題,因此,基于深度學習(DL)的RES識別不失為一種可行的方案。DL廣泛運用于模式識別[3]、圖像處理[4]等領(lǐng)域,DL通過多層神經(jīng)網(wǎng)絡非線性映射的堆疊來提取數(shù)據(jù)更抽象、更深層次的特征[5]。其中,卷積神經(jīng)網(wǎng)絡(CNN)因其強大的學習能力在信號處理領(lǐng)域已得到成熟應用。文獻[6]通過Choi-William分布(CWD)得到信號的時頻特征圖,將其輸入到調(diào)試好的CNN模型并構(gòu)造Softmax分類器[5]對其多類信號進行分類,取得了較好效果。文獻[7]根據(jù)信號能量在不同分數(shù)階傅里葉變換域角度上的明顯變化對信號進行分離,并通過CNN提取第一分量的平滑偽仿射維格納變換(SPWVD)圖的深層特征,準確率得到了較大提高。文獻[8]提取信號的雙譜信息作為CNN的輸入,結(jié)果表明該方法在識別率、抗噪性上都有所提升。但以上方法存在耗時長、損失的信息較多等問題,同時在低信噪比環(huán)境下的識別率也有待提高。
模糊函數(shù)(AF)提供了對信號結(jié)構(gòu)信息較為完整的描述,包含了信號豐富的時頻域信息。AF主脊(AFMR)作為模糊能量最聚集的部分,其分布信息體現(xiàn)了AF分布特性,因此,對AFMR進行研究有助于RES分選識別。文獻[9]通過對AF三維分布進行投影獲得其等高線,然后提取等高線的正外接矩、縱橫比和方向角作為特征向量,該方法充分利用了一些海拔較高的AF地貌特征,但在低信噪比下AF地貌易受噪聲干擾,導致分選效果不理想。文獻[10]通過提取AFMR的旋轉(zhuǎn)角、原點矩以及中心矩特征進行分選識別,在一定程度上描述了模糊能量分布特性且魯棒性較高,但該方法計算量大、耗費時間長,不適用于實際戰(zhàn)場中雷達信號的復雜環(huán)境。
本文提出一種基于CNN和AFMR極坐標變換的RES識別方法。該方法采用多個神經(jīng)網(wǎng)絡層提取AFMR極坐標域二維時頻圖的深層特征,然后通過反向傳播(BP)算法對網(wǎng)絡內(nèi)部的權(quán)重和偏置進行微調(diào),并通過正交設(shè)計實驗對CNN中的參數(shù)進行優(yōu)化,得到最優(yōu)的參數(shù)組合。最后通過Softmax分類器對雷達信號進行分類識別。仿真結(jié)果表明,本文方法在識別率、耗時上均優(yōu)于傳統(tǒng)的雷達信號識別方法。
任意窄帶RES用s(t)表示,s(t)的AF可以定義[10]為
(1)
式中:χs(τ,ξ)為AF,τ為時延,ξ為頻移;s*(t)為s(t)的共軛,t為時間變量。AF提供了一個信號及其自身經(jīng)時延和頻移后所得信號間的相似性度量,反映了信號本身內(nèi)在結(jié)構(gòu)上的特性。
AF在原點處有最大值,因此過原點至少會有一條模糊能量的主要分布帶,即為AFMR.Akay等[11]定義了AF和分數(shù)自相關(guān)運算的關(guān)系:
[Cα(s,s)](ρ)=χs(ρcosα,ρsinα),
(2)
式中:α為旋轉(zhuǎn)角;Cα為主脊切面所在分數(shù)域uα上的分數(shù)自相關(guān)算子;ρ為uα分數(shù)域的徑向距離。(2)式表明,旋轉(zhuǎn)角為α的分數(shù)域的自相關(guān)等價于該分數(shù)域上AF的徑向切面。因此,通過分數(shù)傅里葉變換的快速離散方法,便可計算AF任意過原點的徑向切面。文獻[10]構(gòu)建了如下檢測量:
(3)
圖1 6類RES AFMR切面對比Fig.1 Comparison of AFMR slices of six types of radar signals
從圖1中可以看出:無論是在信噪比為0 dB還是20 dB情況下,CON、LFM以及BFSK能明顯區(qū)別于其他3類信號,而BPSK、QPSK和MSEQ則發(fā)生了混疊,這是因為該3種信號都為非線性調(diào)制信號,其中BPSK和QPSK僅僅只是相位調(diào)制的階數(shù)不同,頻域上差異不顯著,因此二者的AFMR交疊明顯。且信噪比0 dB時AFMR對噪聲更為敏感,信號嚴重失真,信號間混疊更為嚴重。
為了解決這個問題,本文從坐標轉(zhuǎn)換的角度出發(fā),將笛卡爾坐標系的原圖形映射到極坐標系當中,轉(zhuǎn)換后AFMR為一個封閉的二維圖像。坐標轉(zhuǎn)換公式原理如下:
(4)
式中:xuα、yuα分別為AFMR在橫、縱坐標軸上的值;MRS(·)為模糊函數(shù)歸一化響應,因此,令uα為轉(zhuǎn)換角度,MRS(uα)為半徑。然而轉(zhuǎn)換的二維圖像有許多毛刺與突起,為了不影響圖像的形狀,采用兩次80點滑動平均方法對圖形進行降噪處理。圖2所示為6類RES在信噪比為20 dB和0 dB環(huán)境下去噪后的極坐標AFMR圖像。
圖2 6類RES去噪后極坐標AFMR切面對比Fig.2 Polar coordinate AFMR slices after denoising of six types of radar signals
圖2(a)和圖2(b)與圖1中相對應的圖像對比可以看出,6類RES的形狀、大小有明顯區(qū)別,即使圖像有所交疊,但CNN具有強大的學習和提取圖像深層抽象特征的能力,因此采用AFMR極坐標時頻圖作為CNN輸入的想法是可行的。
CNN由紐約大學LeCun等[12]提出,其本質(zhì)是一個多層感知機,是一種帶有卷積結(jié)構(gòu)的深度神經(jīng)網(wǎng)絡。CNN最大的優(yōu)勢在于局部連接和權(quán)值共享,大大減少了網(wǎng)絡中參數(shù)個數(shù),有效緩解了模型過擬合問題。圖3所示為假設(shè)相鄰神經(jīng)元節(jié)點之間是具有寬度為3的感受野時的局部連接和權(quán)值共享示意圖。CNN由輸入層、卷積層、激活函數(shù)、池化層以及全連接層組成?;灸P腿鐖D4所示。圖4中,m表示當前層數(shù)。
圖3 局部連接與權(quán)值共享Fig.3 Local connection and weight sharing
圖4 CNN基本結(jié)構(gòu)Fig.4 Basic structure of CNN
CNN基本結(jié)構(gòu)如下:
1) 輸入層:用于數(shù)據(jù)的輸入。
2) 卷積層:卷積層是CNN的核心,由多個卷積核組成。卷積核以一定的步長在特征圖上移動來獲取圖片的特征,然后傳遞給激活函數(shù)進行處理,激活函數(shù)將新得到的特征傳遞給下一層,其基本公式為
(5)
f(x)=max (0,x).
(6)
3) 池化層:激活函數(shù)輸出的新特征量通過池化層進行降維,加快了計算速度,提高了模型的能力。常用的池化方法有平均池化和最大池化,由于平均池化能避免過擬合以及提高魯棒性,故本文方法采用平均池化對特征分布進行降維。
4) Dropout層:為防止過擬合,該層使某個神經(jīng)元的激活值以一定的概率停止工作。
5) 全連接層:該層的每一個節(jié)點都與上一層的所有節(jié)點相連,用來把前邊提取到的特征綜合起來,目的是減少特征位置對分類帶來的影響。
6) 輸出層:該層將全連接層整合后的向量作為輸入,其輸出節(jié)點數(shù)等于需要分類的類別數(shù)。本文采用常用的分類器softmax進行分類識別,其不但考慮了輸入的加權(quán)和,還考慮了其他輸出節(jié)點的輸出值,并且更適合解決多標簽的情況。它把多個神經(jīng)元輸出看作概率值,因為輸出被其映射到(0,1)之間,輸出概率的數(shù)學公式如下:
(7)
6)損失函數(shù):CNN采用損失函數(shù)計算預測值和實際輸出值的差值,并通過BP算法和梯度下降算法將該誤差用來更新模型中的權(quán)值和偏置。交叉熵函數(shù)作為最常用的損失函數(shù),其計算公式如下:
E=-dln (y)-(1-d)ln (1-y),
(8)
式中:d為訓練數(shù)據(jù)的正確輸出;y為輸出節(jié)點的輸出。
CNN中存在許多參數(shù),比如學習率、動量、卷積核尺寸等,參數(shù)的選取直接影響到CNN的識別率,所以尋找最優(yōu)的參數(shù)組合是有必要的。
正交設(shè)計是針對多個因子進行研究分析的一種方法,其理論基礎(chǔ)是正交性與數(shù)理統(tǒng)計學。該方法通過科學設(shè)計的正交表進行實驗,從而得到最優(yōu)的參數(shù)組合。其實驗流程如圖5所示。
圖5 正交實驗流程圖Fig.5 Flow chart of orthogonal test
由圖5可知,正交設(shè)計主要包括實驗設(shè)計和數(shù)據(jù)分析兩部分,其基本步驟如下:
1)明確實驗目的與要求;
2)挑選需考察的因子并確定其水平;
3)選定正交表后進行表頭設(shè)計;
4)制定實驗方案,執(zhí)行并記錄結(jié)果;
5)統(tǒng)計分析實驗結(jié)果,確定最優(yōu)組合。
通過CNN學習AFMR極坐標二維時頻特征分布并對信號進行分類識別的算法流程如圖6所示。
圖6 基于CNN和AFMR極坐標圖的識別模型Fig.6 Recognition model based on CNN and AFMR polar diagram
具體步驟如下:
1)數(shù)據(jù)預處理:為保證所有信號相同長度,將RES長度重采樣為N=1 024;為了提高計算速度,對所有極坐標圖像作灰度化處理成維度為300×300×1的統(tǒng)一格式來作為CNN的輸入。
2)模型搭建:CNN提取特征過程中,使用的卷積核大小為(7,7)且滑動步長為1,卷積核個數(shù)分別是6和12. 批歸一化層目的是把每一層的輸出均值和方差歸一化,不僅加快了模型的收斂速度,而且緩解了網(wǎng)絡梯度彌散的問題。池化層均采用大小為(2,2),滑動步長為2的平均池化進行特征降維。在卷積部分完成后,圖像尺寸由300×300壓縮成72×72. 具體按照表1中所示的各層詳細參數(shù)構(gòu)造CNN.
表1 CNN模型的細節(jié)和參數(shù)Tab.1 Details and parameters of CNN model
3)模型預訓練:在前向傳播時,Dropout層使某個神經(jīng)元的激活值以一定的概率停止工作,而不是僅僅依賴某些局部特征;L2范數(shù)是指向量各元素的平方和,然后再求平方根,其將一些參數(shù)值進行縮小,使其影響變小。為了防止過擬合,在全連接層前加一個Dropout層以及在損失函數(shù)中加入L2范數(shù)作為懲罰項。初始化參數(shù)并將生成的訓練集作為輸入,通過BP算法和梯度下降算法對整個網(wǎng)絡的權(quán)值和偏置進行微調(diào)。
4)分類識別:6類預處理好的輻射源信號AFMR極坐標時頻圖輸入到搭建好的CNN網(wǎng)絡中,進行分類識別,并輸出識別結(jié)果。
實驗選取CON、LFM、BPSK、QPSK、MSEQ和BFSK 6類典型RES. 其中,LFM的帶寬為10 MHz,BPSK和BFSK都采用13位Barker碼,QPSK采用16位Frank碼,MSEQ所用偽隨機序列(1011100),所有信號的PW均為10 μs,采樣頻率為60 MHz. 此外,除BFSK信號的兩個頻點分別取10 MHz和2 MHz外,其余信號載頻均為10 MHz. 在-10~20 dB信噪比下,每類信號每隔2 dB產(chǎn)生20個信號樣本,共1 440個信號作為訓練集,每類信號在不同信噪比下各產(chǎn)生100個信號樣本,即每個測試集有600個信號樣本。
表2 正交實驗因素水平Tab.2 Orthogonal test factor level table
表3 實驗結(jié)果分析Tab.3 Test result analysis table
如表3所示,對于準確率指標而言,結(jié)合表2可知,卷積核尺寸位于第3水平、學習率位于第4水平以及動量位于第3水平識別率最高,極差R代表因素的主次關(guān)系,R越大、因素越重要,因此準確率的最優(yōu)方案為A3C3B4,同理運行時間得出的優(yōu)組合為A1B1C4.然而對于RES而言,其分選的準確率最為重要,因此把準確率作為主要指標,運行一次Epoch所需的時間為次要指標。A1與A3、B1與B4、C3與C4在時間上都相差無幾,最大的僅為2.79 s,然而在識別率上卻相差甚遠,其中A1和A3準確率相差有10%以上,考慮到準確率作為主要考察目標。因此,模型的參數(shù)最優(yōu)組合為A3B4C3,將其代入到神經(jīng)網(wǎng)絡中。
本文方法與人工提取信號特征相比,CNN能夠提取輸入數(shù)據(jù)的隱藏抽象特征。為探究本文方法和人工提取方法在不同信噪比下的性能,選取文獻[13]、文獻[14]以及文獻[15]3種人工方法與本文方法進行對比,結(jié)果如圖7所示。
圖7 本文方法與人工方法比較Fig.7 Comparison of the proposed method and manual methods
由圖7可以看出:文獻[13]從主視角、側(cè)視角對AF的三維地貌進行描述,但其在低信噪比下準確率低,因為它無法同時兼顧時域和頻域的信息;文獻[14]使用奇異值分解對AF主脊切片包絡線進行降噪,提取AF主脊切片包絡線的旋轉(zhuǎn)角系數(shù)和對稱Holder系數(shù)作為特征,但該方法計算量大、耗費時間長,信噪比-2 dB時準確率也僅為79%;文獻[15]提出的特征雖然綜合了時頻域的信息,但在低信噪比下其表現(xiàn)也不盡如人意,信噪比-2 dB時準確率為75.3%. 從這3種方法可知,人工分選方法在低信噪比下表現(xiàn)不佳,這是因為人工方法只能提取信號的表面信息,而信號的大部分信息在低信噪比時基本被噪聲給淹沒。DL雖然屬于有監(jiān)督學習,需要先驗信息的支持,但是其能更好的描述輸入信號的內(nèi)在信息且魯棒性強,抗噪性能好,大大提高了信號在低信噪比下的分選識別率。
為進一步探究本文方法的高效性,通過與其他的DL模型進行對比分析,結(jié)果如圖8所示。
圖8 本文方法與其他模型對比Fig.8 Comparison of the proposed method and other models
由圖8可知:本文方法在低信噪比下識別率最高,信噪比-6 dB時也能達到94.17%,這是因為本文在對信號進行處理時幾乎沒有信息的損失;文獻[16]雖然輸入為AFMR,但是本文在此基礎(chǔ)上進行了坐標轉(zhuǎn)換,抗噪性較之有所增強,不過即便不對AFMR進行坐標轉(zhuǎn)換,文獻[16]在信噪比-6 dB下的識別率也遠超另外兩種方法,表明用AFMR進行信號的分選識別是行之有效的;文獻[17]因為使用了主成分分析和隨機投影對信號進行降維,在此過程當中損失的信息較多,所以識別率較低;文獻[18]僅僅改變了分類器,對提高識別率沒有太大效果。由此可見,本文所采取的模型有更好的泛化能力和抗噪性,本文方法是可行和有效的。
通過對AFMR和其他信號輸入形式進行對比,旨在探究AFMR極坐標變換的實用性。選取文獻[6]和文獻[8]進行對比,結(jié)果如圖9所示。
圖9 不同輸入形式對比Fig.9 Comparison of different input forms
由圖9可見,3種輸入形式在信噪比0 dB以上都有90%以上的準確率,而在低信噪比環(huán)境下的表現(xiàn)卻不盡相同。除本文方法外,其余兩種輸入的識別率都不盡如人意,特別是文獻[6]在信噪比-6 dB時的識別率僅在70%左右。這是因為文獻[6]的輸入形式為CWD提取的信號時頻特征圖,在低信噪比下信號幾乎失真,提取到的時頻圖信息不完備,故抗噪性能較差。文獻[8]的輸入則是信號雙譜圖,由于是在傅里葉變換的相位中提取信息,在低信噪比下雙譜信息不足以支持信號的識別。而本文方法在低信噪比下的表現(xiàn)依舊令人滿意,信噪比-6 dB時的識別率在90%以上,可見本文方法的實用性。
為進一步探究一維AF主脊圖經(jīng)過極坐標變換成二維時頻圖后識別性能的增益,構(gòu)造一維AF主脊數(shù)據(jù)集分別作為棧式自編碼機(SAE)、深度信念網(wǎng)絡(DBN)和一維CNN的輸入進行測試,對比結(jié)果如表4所示。
由表4可知,本文采取的二維AFMR+CNN在不同信噪比下的識別精度和平均用時上都遠高于另外3種算法,表明從AFMR的極坐標圖像入手是切實可行的。這是因為6類RES的一維AFMR在低信噪比下嚴重交疊,已經(jīng)完全分辨不出信號的具體類型,而經(jīng)過極坐標變換后的二維AFMR圖比極坐標變換前的AFMR曲線更加形象直觀,凸顯了一維AFMR的細微差別,不同信號間的極坐標圖像有著明顯差異,且信號經(jīng)過極坐標轉(zhuǎn)換后信息沒有受到損耗。其次,通過采用CNN的1組、4組與2組、3組對比可知,在不考慮輸入的前提下,CNN在分類問題中的表現(xiàn)要優(yōu)于其他神經(jīng)網(wǎng)絡,這是因為CNN提取到的特征都是較高質(zhì)量的特征,能夠提升網(wǎng)絡識別率,同時CNN在圖像處理領(lǐng)域有著得天獨厚的優(yōu)勢,能夠捕獲圖像更復雜、更抽象的信息。而SAE和DBN對輸入數(shù)據(jù)的平移不變性有很高的要求,生成模型DBN不關(guān)心不同類別之間的最優(yōu)分類面的劃分,所以用于分類時精度不高。另外3種方法在一次Epoch所需時間上均為本文算法的1.5倍左右,而DL又是需要進行多個Epoch學習的過程,由此可知本文算法大大加快了模型的計算速度。因此本文算法能夠有效彌補其余算法精度低、訓練難度大等不足,進而可以得到相對更為科學的實驗結(jié)果。
表4 不同分類算法訓練情況(識別率)Tab.4 Training of different classification algorithms (recognition rate)
為了進一步驗證本文在實際戰(zhàn)場中的應用價值,采用某外場RES實測數(shù)據(jù)進行實驗,該輻射源信號與本文6類仿真RES脈內(nèi)調(diào)制情況一致。實測數(shù)據(jù)具體參數(shù)如表5所示。將實測數(shù)據(jù)輸入到已經(jīng)調(diào)試好的CNN網(wǎng)絡當中,信號的識別結(jié)果如表6所示。
表5 實測雷達數(shù)據(jù)參數(shù)Tab.5 Measured radar data parameters
表6 實測數(shù)據(jù)分選結(jié)果Tab.6 Sorting results of measured data %
從表5中可以看出,實測數(shù)據(jù)當中的調(diào)制類型都不相同,而且RF和PW還存在抖動和捷變,完全符合實際戰(zhàn)場中復雜的電磁環(huán)境要求。即便如此,本文方法對實測數(shù)據(jù)的識別率仍然能達到93.2%,由此可見本文方法在復雜多變的電磁環(huán)境中仍然具有一定的工程意義,基本滿足實際戰(zhàn)場的需要。
算法復雜度體現(xiàn)在執(zhí)行該算法時所經(jīng)歷的資源消耗上,不同算法所需的資源消耗也不盡相同,體現(xiàn)了各類算法計算量的差異,因此可從信號重采樣長度N和計算規(guī)模的角度出發(fā),分別對極坐標轉(zhuǎn)換前后的AFMR以及文獻[15]的計算量進行分析。本文二維AFMR的提取:首先,利用分數(shù)自相關(guān)計算任意角度對應的AF值,一次分數(shù)自相關(guān)運算包含一個1+P階(P為分數(shù)域階數(shù))的分數(shù)傅里葉變換和一次分數(shù)傅里葉逆變換;其次,需要在[-π/2 rad,π/2 rad]范圍內(nèi)對AFMR進行搜索,搜索精度為0.1°時搜索次數(shù)為1 800次。因此一維AFMR的復雜度為O(18 000NlgN),而經(jīng)過極坐標變換后的二維AFMR的復雜度為O(7N+18 000NlgN)。文獻[15]采用CWD變換作為分形維數(shù)的提取對象,其次采用復雜度為O(N3)的奇異值分解進行矩陣相乘運算,頻譜和CWD變換采用快速傅里葉變換實現(xiàn),所以該文特征算法復雜度為O(N3+2N+2NlgN)。
綜上所述,當信號的采樣長度較長時,二維AFMR的復雜度稍大于一維AFMR,卻要小于分形維數(shù)方法。然而,當信號的采樣長度較短時,文獻[15]的算法復雜度最低,其次是一維AFMR,但是二者在低信噪比下識別率較低,并且本文為了AFMR的搜索精度采用窮舉法,大幅度增加了算法復雜度。因此,本文算法復雜度雖然略高,但是保證了搜索精度和實驗結(jié)果的高準確性。
為克服人工特征提取方法耗時長,對專家知識儲備要求高等問題,本文基于DL能提取信號隱藏抽象特征的優(yōu)勢,提出了一種AFMR極坐標變換和CNN的RES識別方法。通過仿真實驗結(jié)果分析,得出如下主要結(jié)論:
1)本文方法識別率高、抗噪性較強,在信噪比0 dB以上都為100%,即使在信噪比-6 dB時也有90%以上的識別率。
2)與AF各類處理方法相比,AFMR極坐標變換不損耗特征信息,能較好地反映信號間差異,增加了信息的利用率,有助于神經(jīng)網(wǎng)絡提取更加優(yōu)異的特征。仿真實驗和實測數(shù)據(jù)均表明所提方法具有較強的時效性。
本文實驗僅僅在6類RES中進行,對模型的普適性還需要進行下一步的分析研究,而且DL需要先驗信息,但在實際戰(zhàn)場當中大部分都是未知的雷達信號,如何對未知信號構(gòu)建有效分選參數(shù)集以及對CNN進行結(jié)構(gòu)上的優(yōu)化,是下一步需要研究的方向。