張晏合,臧月進(jìn),陳 渤,徐銘晟
(1.西安電子科技大學(xué)雷達(dá)信號(hào)處理國(guó)家級(jí)重點(diǎn)實(shí)驗(yàn)室,陜西西安 710071;2.上海機(jī)電工程研究所,上海 201109)
雷達(dá)作為戰(zhàn)場(chǎng)中的“眼睛”,能夠利用電磁波對(duì)其作用范圍內(nèi)的空中目標(biāo)、陸地目標(biāo)以及海洋目標(biāo)進(jìn)行檢測(cè)、監(jiān)視和識(shí)別?,F(xiàn)代戰(zhàn)爭(zhēng)日益趨向“高技術(shù)化”,如何精準(zhǔn)地進(jìn)行攻防對(duì)抗是關(guān)鍵。隨著遠(yuǎn)程打擊平臺(tái)的作戰(zhàn)范圍越來(lái)越大,僅獲取目標(biāo)的位置信息往往無(wú)法滿(mǎn)足現(xiàn)代軍事需求。如何對(duì)雷達(dá)所獲取的回波信號(hào)進(jìn)行準(zhǔn)確的分析、處理,提取更多有效的信息,并據(jù)此信息做出判斷,實(shí)施精準(zhǔn)反擊,在戰(zhàn)爭(zhēng)的走向中發(fā)揮著重要的作用。因此,雷達(dá)自動(dòng)目標(biāo)識(shí)別技術(shù)(radar automatic target recognition,RATR)受到了極大的重視。
雷達(dá)高分辨距離像(high resolution range profile,HRRP)是寬帶雷達(dá)信號(hào)獲取的關(guān)于目標(biāo)的散射點(diǎn)子回波在雷達(dá)視線(xiàn)上的矢量和,如圖1所示(圖中圓圈代表目標(biāo)散射點(diǎn)),它包含了諸如目標(biāo)尺寸、物理結(jié)構(gòu)等豐富的目標(biāo)結(jié)構(gòu)信息,并且易于獲取,因此被廣泛地用于雷達(dá)自動(dòng)目標(biāo)識(shí)別領(lǐng)域中。
圖1 飛機(jī)目標(biāo)的HRRP樣本圖[2]Fig.1 Representation of HRRP samples from aircraft targets
在RATR 中,有效的特征不僅可以減少系統(tǒng)的復(fù)雜性,也可以顯著提升識(shí)別方法的性能。因此,如何提取有效的特征成為雷達(dá)自動(dòng)目標(biāo)識(shí)別的核心問(wèn)題。針對(duì)這一問(wèn)題,雷達(dá)自動(dòng)目標(biāo)識(shí)別的學(xué)者們進(jìn)行了廣泛的研究。文獻(xiàn)[3]中采用基于雙譜特征的HRRP 識(shí)別方法,有效地減少了噪聲對(duì)識(shí)別的影響。文獻(xiàn)[4]采用了高階譜特征,并提出了基于歐式距離的度量標(biāo)準(zhǔn)提升了識(shí)別性能。文獻(xiàn)[5]利用了平移初相穩(wěn)健的快速傅里葉變換幅度特征,完成了HRRP 的識(shí)別工作。這些方法均取得了不錯(cuò)的識(shí)別性能,但是這些人工設(shè)計(jì)的特征通常依賴(lài)研究人員對(duì)數(shù)據(jù)的認(rèn)知,在缺乏先驗(yàn)知識(shí)的情況下,難以保證這些方法的性能。此外這些模型多為淺層模型,在任務(wù)場(chǎng)景更加復(fù)雜的情況下,并不能提取有效的特征信息。因此,如何自動(dòng)提取有效的特征成為RATR熱門(mén)研究方向。
近年來(lái),經(jīng)網(wǎng)絡(luò)的判別模型方法被廣泛應(yīng)用于機(jī)器學(xué)習(xí)任務(wù),并在RATR中獲得了優(yōu)異的性能表現(xiàn)。這些方法可以分為兩大類(lèi)。第一大類(lèi)中,神經(jīng)網(wǎng)絡(luò)被用于判別模型,直接用于對(duì)HRRP數(shù)據(jù)的識(shí)別工作,如文獻(xiàn)[6]提出了基于注意力機(jī)制的循環(huán)神經(jīng)網(wǎng)絡(luò)高分辨距離項(xiàng)目標(biāo)識(shí)別方法,文獻(xiàn)[7]提出了基于卷積神經(jīng)網(wǎng)絡(luò)的高分辨距離項(xiàng)目標(biāo)識(shí)別方法,但是這些方法的識(shí)別率并不高。第二大類(lèi)中,神經(jīng)網(wǎng)絡(luò)被用來(lái)提取較好的HRRP數(shù)據(jù)表征以提升后續(xù)分類(lèi)器的識(shí)別性能,例如:文獻(xiàn)[8]提出了堆棧糾正自編碼機(jī)(stacked corrective autoencoder,SCAE)的結(jié)構(gòu)提取HRRP特征,該模型不僅考慮了單幀樣本信息,也考慮了平均像信息;文獻(xiàn)[9]對(duì)變分自編碼機(jī)結(jié)構(gòu)進(jìn)行改進(jìn),提出了穩(wěn)健變分自編碼機(jī)(robust variational auto-encoder,RVAE),它相對(duì)于變分自編碼機(jī)能提取更加穩(wěn)健的特征,并能利用這些特征完成后續(xù)的分類(lèi)工作;文獻(xiàn)[10]提出了可學(xué)習(xí)先驗(yàn)變分自編碼機(jī)(variational auto-encoder with learnable prior,LP-VAE),該模型借鑒了訓(xùn)練數(shù)據(jù)的標(biāo)簽信息,其提取的特征信息顯著提升了RATR的識(shí)別率。但是,這些方法在對(duì)隱表征建模的時(shí)候并沒(méi)有考慮各類(lèi)表征間的聯(lián)系。
為了解決上述問(wèn)題,本文提出了解耦表征變分自編碼機(jī)模型來(lái)提取高分辨距離像表征。該模型以變分自編碼機(jī)模型(variational auto-encoder,VAE)作為基本組件,在原有的變分自編碼機(jī)模型基礎(chǔ)上,對(duì)類(lèi)間共性表征和各類(lèi)特性表征分別建模,并采用變分下界進(jìn)行優(yōu)化,使各類(lèi)特性表征有更強(qiáng)的可分性。在實(shí)測(cè)數(shù)據(jù)上的實(shí)驗(yàn)結(jié)果表明,通過(guò)該方式提取的特征能顯著提升雷達(dá)高分辨距離像的識(shí)別性能。
變分自編碼機(jī)是一種概率生成模型。通過(guò)該模型可以得到觀測(cè)數(shù)據(jù)的隱表征。觀測(cè)數(shù)據(jù)與隱表征的聯(lián)合概率分布為
由于式(3)中的期望求解較為復(fù)雜,我們使用采樣的方法對(duì)變分證據(jù)下界進(jìn)行近似的估計(jì),其表達(dá)式如下:
變分自編碼機(jī)由編碼器網(wǎng)絡(luò)和解碼器網(wǎng)絡(luò)兩部分構(gòu)成,其基本結(jié)構(gòu)如圖2所示。
圖2 變分自編碼機(jī)結(jié)構(gòu)Fig.2 The architecture of variational auto-encoder
編碼器代表近似后驗(yàn)分布q(|)的充分統(tǒng)計(jì)量;解碼器代表觀測(cè)數(shù)據(jù)的條件概率分布p(|)的充分統(tǒng)計(jì)量。在訓(xùn)練中,觀測(cè)數(shù)據(jù)通過(guò)編碼器生成q(|)的充分統(tǒng)計(jì)量:均值μ和標(biāo)準(zhǔn)差σ。利用重參法,通過(guò)引入由標(biāo)準(zhǔn)高斯分布產(chǎn)生的,產(chǎn)生對(duì)應(yīng)的表征。最后模型由解碼器得到觀測(cè)數(shù)據(jù)的條件概率分布p(|)的充分統(tǒng)計(jì)量,重構(gòu)出觀測(cè)數(shù)據(jù)。該模型通過(guò)前文所述的最大化證據(jù)下界進(jìn)行網(wǎng)絡(luò)參數(shù)的優(yōu)化。當(dāng)網(wǎng)絡(luò)訓(xùn)練完成后,可以使用編碼器得到觀測(cè)數(shù)據(jù)的表征。
在雷達(dá)HRRP目標(biāo)識(shí)別任務(wù)中,數(shù)據(jù)表征對(duì)于分類(lèi)器的性能影響巨大。由于變分自編碼機(jī)的先驗(yàn)分布被設(shè)計(jì)成一個(gè)較為樸素的標(biāo)準(zhǔn)正態(tài)分布,這會(huì)導(dǎo)致編碼器生成的雷達(dá)HRRP的數(shù)據(jù)表征可分性不高,影響分類(lèi)器的分類(lèi)性能。本文針對(duì)變分自編碼機(jī)的不足,創(chuàng)新性地提出了解耦表征變分自編碼機(jī),該模型假設(shè)觀測(cè)數(shù)據(jù)的隱表征由兩部分獨(dú)立變量構(gòu)成,第一部分為,代表類(lèi)間共性表征;第二部分為,代表各類(lèi)特性表征。
對(duì)于雷達(dá)HRRP 數(shù)據(jù)的類(lèi)間共性表征的先驗(yàn)分布,模型仍遵循變分自編碼機(jī)采用的標(biāo)準(zhǔn)正態(tài)分布建模,其先驗(yàn)分布為
式中:∈R表示經(jīng)過(guò)one-hot 編碼后的樣本類(lèi)別;代表樣本類(lèi)別數(shù);∈R表示一個(gè)可學(xué)習(xí)參數(shù)矩陣,其中表示z的維度。通過(guò)這種方式,不同類(lèi)對(duì)應(yīng)的表征將不再共享同一種先驗(yàn)分布。
因此,解耦變分自編碼機(jī)的似然為
可以看到,目標(biāo)優(yōu)化函數(shù)包含3部分:第1部分為重構(gòu)誤差,此項(xiàng)反映了模型樣本生成點(diǎn)的似然函數(shù);第2項(xiàng)為類(lèi)間共性隱表征誤差;第3項(xiàng)為各類(lèi)隱表征誤差。
在訓(xùn)練過(guò)程中,模型中的各類(lèi)特性表征對(duì)應(yīng)的先驗(yàn)分布在一定迭代訓(xùn)練過(guò)程中往往會(huì)產(chǎn)生互相接近的情況,從而影響后續(xù)提取的各類(lèi)特性隱表征的可分性。針對(duì)以上問(wèn)題,模型對(duì)各類(lèi)特性表征對(duì)應(yīng)的先驗(yàn)分布引入了條件限制,即限制各類(lèi)特性表征的先驗(yàn)分布的距離大于某個(gè)常數(shù)。
通過(guò)完成對(duì)式(8)的優(yōu)化過(guò)程,模型可以得到近似后驗(yàn)分布q(|),并將其用于后續(xù)的分類(lèi)工作。
圖3展示了解耦自編碼機(jī)的基本結(jié)構(gòu)。編碼器代表近似后驗(yàn)分布q(|)與q(|)的充分統(tǒng)計(jì)量;解碼器代表觀測(cè)數(shù)據(jù)的條件概率分布p(|)的充分統(tǒng)計(jì)量。通過(guò)這種對(duì)隱變量解耦建模的方法,模型學(xué)到的雷達(dá)HRRP 數(shù)據(jù)各類(lèi)特性表征有較高的可分性。利用該表征,可以提高分類(lèi)器的分類(lèi)性能。
圖3 解耦變分自編碼機(jī)結(jié)構(gòu)Fig.3 The structure of variational auto-encoder with disentangled representation
本文的實(shí)驗(yàn)結(jié)果均基于西安電子科技大學(xué)數(shù)據(jù)庫(kù)中逆合成孔徑雷達(dá)(inverse synthetic aperture radar,ISAR)的實(shí)測(cè)飛機(jī)數(shù)據(jù)。該雷達(dá)工作時(shí)的中心頻率為5.520 GHz,信號(hào)帶寬為400 MHz。數(shù)據(jù)包含3 類(lèi)飛機(jī)目標(biāo),分別為“雅克(Yark)-42”,“獎(jiǎng)狀(Cessna)”和“安(An)-26”。飛機(jī)具體參數(shù)詳見(jiàn)表1?!把趴?42”,“獎(jiǎng)狀”,“安-26”的飛機(jī)軌跡在地面的投影如圖4 所示。為了保證訓(xùn)練集數(shù)據(jù)基本能覆蓋測(cè)試集數(shù)據(jù)的方位角信息,本文選擇“雅克-42”的第2 段及第5 段,“獎(jiǎng)狀”的第6段及第7段,“安-26”的第5段及第6段數(shù)據(jù)作為模型的訓(xùn)練集,其余段作為測(cè)試集。訓(xùn)練樣本個(gè)數(shù)為140 000 個(gè),測(cè)試樣本個(gè)數(shù)為5 200 個(gè),樣本維度為256。
表1 ISAR實(shí)測(cè)數(shù)據(jù)的飛機(jī)參數(shù)Tab.1 Parameters of aircraft based on ISAR data
圖4 飛行軌跡在地面的投影Fig.4 Projections of target trajectories onto the ground plane
實(shí)驗(yàn)中使用的網(wǎng)絡(luò)模型采用類(lèi)似文獻(xiàn)[10]的結(jié)構(gòu),包含編碼器部分和解碼器部分。編碼器由2 個(gè)卷積層、2 個(gè)池化層、2 個(gè)批量歸一化層和4 部分全連接層組成;卷積層特征圖為32,卷積核大小為9,步長(zhǎng)為1;池化層采用最大池化法;對(duì)于每部分全連接層,隱層輸出維度分別為500、250、60。解碼器部分由全連接部分和反卷積部分兩部分構(gòu)成:全連接部分由兩個(gè)隱單元為64 的全連接層構(gòu)成;反卷積部分分為兩層,第1 層反卷積核為4,步長(zhǎng)為2,特征圖為32,第2 層反卷積核為4,步長(zhǎng)為2,特征圖為1。網(wǎng)絡(luò)采用LeakyRelu 作為激活函數(shù),并采用Adam 優(yōu)化器優(yōu)化模型參數(shù),學(xué)習(xí)率設(shè)置為0.001。
遵循文獻(xiàn)[8-10]的方式,在模型訓(xùn)練完成之后,將解耦表征變分自編碼機(jī)得到的解耦表征作為訓(xùn)練數(shù)據(jù),訓(xùn)練線(xiàn)性支持向量機(jī)(support vector machines,SVM)作為分類(lèi)器,進(jìn)行雷達(dá)HRRP數(shù)據(jù)的識(shí)別工作。圖5 所示為解耦變分自編碼機(jī)網(wǎng)絡(luò)結(jié)構(gòu),其中:μ與σ分別為特性表征的近似后驗(yàn)分布的充分統(tǒng)計(jì)量;μ與σ分別為類(lèi)間共性表征的近似后驗(yàn)分布的充分統(tǒng)計(jì)量。
圖5 解耦變分自編碼機(jī)網(wǎng)絡(luò)結(jié)構(gòu)Fig. 5 The network architecture of variational auto-encoder with Disentangled Representation
圖6 中(a)、(b)、(c)分別展示了三類(lèi)飛機(jī)對(duì)應(yīng)的樣本點(diǎn)在原始HRRP 數(shù)據(jù)、解耦表征變分自編碼機(jī)提取的類(lèi)間共性表征和解耦表征變分自編碼機(jī)提取的各類(lèi)特性表征的主成分分析(principal component analysis,PCA)的二維投影圖。從圖6 可以看出,3 類(lèi)不同飛機(jī)的原始數(shù)據(jù)和模型所提取的類(lèi)間共性表征,其投影點(diǎn)重疊在一起,可分性不強(qiáng)。而模型提取的各類(lèi)特性表征重合度小,可分性強(qiáng)。因此采用該模型提取的各類(lèi)特性表征進(jìn)行分類(lèi)工作可以提升識(shí)別性能。
圖6 解耦表征變分自編碼機(jī)的可視化性能分析Fig.6 The visual performance analysis of variational auto-encoder with disentangled representation
為了驗(yàn)證本文提出的解耦表征變分自編碼機(jī)模型的有效性,將其與MCC、AGC、LDA、PCA、DBN、SDAE、SCAE、TCNN、CNN-LPVAE 等模型進(jìn)行對(duì)比,表2 展示了本文提出的解耦表征變分自編碼機(jī)模型與多個(gè)模型識(shí)別率的對(duì)比結(jié)果。從表2 可以看到,在淺層模型中,PCA 方法識(shí)別率最高,但還是低于深度模型算法。這說(shuō)明深度模型相對(duì)于淺層模型,其提取的特征更具有表達(dá)力。在這些深度模型中,解耦表征的變分自編碼機(jī)模型又取得了最高的識(shí)別率,這也表現(xiàn)了該模型提取的各類(lèi)特性表征的可分性較強(qiáng),驗(yàn)證了模型的有效性。
表2 解耦表征變分自編碼機(jī)與各方法識(shí)別性能對(duì)比Tab.2 Comparison of recognition performance between variational auto-encoder with disentangled representation and other methods
為了分析模型參數(shù)對(duì)識(shí)別性能的影響,圖7 展示了解耦表征的變分自編碼機(jī)模型的識(shí)別性能隨各類(lèi)特性表征維度的變化情況。從圖中可以看出,解耦表征變分自編碼機(jī)在各類(lèi)特性表征維度為60 的時(shí)候識(shí)別性能最優(yōu),為95.32%。這是因?yàn)樵陔[層維度低的時(shí)候,模型參數(shù)較少,不能較好地表現(xiàn)出類(lèi)間特性表征。而如果隱層維度較高,模型又易過(guò)擬合,導(dǎo)致識(shí)別率下降。
圖7 解耦表征變分自編碼機(jī)模型的識(shí)別率與隱層維度的變化曲線(xiàn)Fig. 7 Change curve between recognition rates of variational auto-encoder with disentangled representation and hidden layer dimension
在雷達(dá)高分辨率距離像識(shí)別任務(wù),傳統(tǒng)的深層網(wǎng)絡(luò)通常忽略了HRRP 數(shù)據(jù)內(nèi)部的特性,提取的數(shù)據(jù)表征可分性不強(qiáng),因此在實(shí)際應(yīng)用中不能取得滿(mǎn)意的效果。針對(duì)這一問(wèn)題,為了充分考慮不同高分辨距離項(xiàng)樣本隱空間之間的類(lèi)間共性表征和各類(lèi)特性表征,本文提出了解耦變分自編碼機(jī)模型。該模型利用編碼機(jī)的編碼結(jié)果,提取了樣本隱變量的各類(lèi)特性表征。利用該類(lèi)間特性表征可以顯著提高分類(lèi)器的識(shí)別性能。實(shí)測(cè)數(shù)據(jù)的實(shí)驗(yàn)驗(yàn)證了該算法提取各類(lèi)特性表征的可分性。未來(lái),將進(jìn)一步研究該算法在更為復(fù)雜的環(huán)境中的目標(biāo)識(shí)別性能,以驗(yàn)證算法的穩(wěn)健性。