王顯云,王志峰,黃 山
(中國電子科技集團公司第三研究所,北京 100015)
近年來,現(xiàn)代低空飛行目標??梢劳袕碗s地形進行低空、超低空隱蔽接近和偵查,使得復雜地域對低空飛行目標進行有效的探測和預警越來越引起各個國家的重視。
以往,雷達是監(jiān)視飛行器的主要常規(guī)手段。但對低空飛行的目標,受地球曲率和地形起伏以及地形多徑效應影響,雷達的探測能力會降低,同時,復雜多山地形也多存在遮擋,并不利于雷達探測,效費比也不高。
相對于雷達,聲探測具有一些特有的特點,如無需搜索、掃描即可實現(xiàn)全向探測,不發(fā)射任何電磁波、聲波等,可全被動探測,體積小易于隱蔽,不易受通視條件(遮擋、夜間等)限制,功耗低,可以全天候無人值守等。這些特點使得聲探測技術可以彌補雷達探測手段的不足,在低空探測預警方面具有重要的軍事應用價值。聲探測技術通常首先借助于陣列信號處理技術得到低空飛行目標的方位和運動軌跡等信息[1],然后結合飛行目標的一些固有聲學特性來判別飛行目標的屬性(或類型)。
傳統(tǒng)的低空聲目標識別技術主要側重于直接分析不同目標聲信號特征的固有差異,以此來對不同目標分類。常見的聲信號特征有短時平均能量、短時平均跨零率以及短時自相關系數(shù)等時域特征[2],短時功率譜、短時AR 譜等頻域特征[2],梅爾頻率倒譜系數(shù)(Mel-Frequency Cepstrum Coefficients,MFCC)[3]和伽瑪通功率譜(Gammatone Filterbank spectra,GF)[4]等聽覺感知類特征。傳統(tǒng)方法的識別往往需針對不同的飛行目標的特征進行精心的設計和選擇才能達到較為理想的效果,顯然,這將會耗費較大的時間和精力,同時,應用場景的變化常會降低所提特征的魯棒性,直接影響識別效果。
近年來,深度神經(jīng)網(wǎng)絡(Deep Neural Network,DNN)被研究者們應用到語音增強[5]、語音識別[6]等領域,并取得了較為顯著的效果。DNN 是基于以往淺層BP 網(wǎng)絡的思路發(fā)展而來。相比于BP 網(wǎng)絡,DNN 的網(wǎng)絡結構較為復雜,層數(shù)更多且每層的神經(jīng)節(jié)點數(shù)也較多,能夠更好地擬合各種復雜的非線性關系,使其能夠適應更為復雜的任務。深度神經(jīng)網(wǎng)絡可將輸入信號的先驗信息保存在神經(jīng)元之間的連接權值中,從而表現(xiàn)出較好的特征學習能力。
考慮到人耳對聲音信號不同頻率的不同感知力而表現(xiàn)出的對聲源出色的分辨力,本文將以聲信號的伽瑪通功率譜(GF)[4]、梅爾倒譜系數(shù)(MFCC)、GF 和MFCC 的動態(tài)差分譜以及上述特征的諧波特征譜構成的特征集合作為訓練特征。對于網(wǎng)絡的訓練來說,其目的是利用DNN 來學習不同類別目標的特征譜與訓練目標之間的非線性關系。
本文的主要任務是利用DNN 網(wǎng)絡對低空飛行的聲目標(無人機、直升機和戰(zhàn)斗機)進行識別。圖1 給出了三類低空飛行目標的時頻圖譜,其顏色越深,能量越強[1]。
從圖1 可以看出,三種飛行目標的圖譜具有一定差異,這為下一步的識別提供了可能性。
圖1 不同低空飛行目標的時頻圖譜
圖2 為利用DNN 網(wǎng)絡進行低空聲目標分類的原理框圖。該方法的工作流程包含線下訓練階段和線上測試階段兩個階段。在線下訓練階段,首先提取不同類型飛行目標聲信號的GF、MFCC、GF和MFCC 的動態(tài)差分譜以及上述特征的諧波特征譜參數(shù),并將它們拼接為一個聯(lián)合向量作為DNN的輸入特征。將不同類型飛行目標的最大后驗概率構成的稀疏向量作為DNN 網(wǎng)絡的訓練目標,目的是利用DNN 來構建輸入聲學特征數(shù)據(jù)與訓練目標之間的非線性關系。在線上測試階段,首先提取測試聲信號的聲學特征集,將其輸入到訓練好的DNN 模型中,即可得到對應聲目標的識別標志。
圖2 基于DNN 的低空飛行目標識別
2.2.1 GF 譜的提取
為了利用耳蝸基底膜對聲音信號不同頻率的感知能力,研究人員設計出伽瑪通濾波器組來模擬耳蝸濾波器組的所有特性[7],其脈沖響應可以表示為:
式中;t為采樣時刻,f為濾波器的中心頻率,b(f)為中心頻率為f的濾波器的帶寬,其與中心頻率之間的關系為b(f)=1.019×(24.7+0.108f),φ為相位。
伽瑪通濾波器組中各濾波器與中心頻率之間的關系如圖3 所示。從圖3 可以看出,兩者關系呈現(xiàn)出類似于對數(shù)的分布特性,這種特性與人耳基底膜對頻率的感知類似。
圖3 伽瑪通濾波器組的中心頻率分布
伽瑪通濾波器的頻率響應如圖4 所示,可以明顯看出,該濾波器在低頻區(qū)域的帶寬較窄,使其在低頻區(qū)域會表現(xiàn)出較高的頻率分辨率,而高頻區(qū)域較寬的帶寬使該區(qū)域的頻率分辨率較低,這種現(xiàn)象與耳蝸對聲音頻率的感知機制一致。
圖4 伽瑪濾波器的頻響特性
伽瑪通功率譜的獲取步驟為:首先將聲音信號經(jīng)過伽瑪通濾波器組得到多個濾波通道的輸出信號,其次對每個通道輸出信號進行加窗分幀處理,產(chǎn)生一系列的時頻單元,最后將這些時頻單元在各子帶中求取能量即可得到伽瑪通功率譜。
2.2.2 MFCC 譜的提取
MFCC 是利用梅爾濾波器將輸入的信號頻譜特征集中在一些聽感比較敏感的頻段。它的提取過程可以描述如下:為使頻譜變得平坦并提升音頻信號的高頻成分,首先需對音頻信號做預加重處理;其次計算音頻信號的短時能量譜,并將其通過梅爾濾波器;再次,計算濾波器輸出結果的對數(shù)能量;最后,對獲得的對數(shù)能量做離散余弦傅里葉變換,即得到MFCC。
由于GF 和MFCC 表征的是聲音信號的靜態(tài)特征,因此,計算GF 和MFCC 的差分譜,可用于表征聲音信號的動態(tài)特性。
2.2.3 諧波保護特征的提取
在輸入特征的提取方面,除了直接從輸入的聲信號中提取上述輸入特征之外,還采取另外一種方式,即先將輸入聲信號變成具有諧波保護的人工信號[8],然后從人工信號中提取上述聽覺特征,所提取的特征稱為諧波保護特征。無人機信號的原始信號和經(jīng)諧波處理后的人工信號如圖5 所示。
從圖5 可以明顯看出,經(jīng)諧波處理后的聲信號在高頻處的諧波得到了恢復,這將有利于提升不同聲目標特征的差異。當已知原始的目標聲信號后,其人工信號的頻譜系數(shù)可以表示如下:
圖5 無人機信號的時頻譜
式中:f為頻率索引,表示矩形方波在離散頻率Sa處的傅里葉變換系數(shù),F(xiàn)y(·)表示輸入聲信號的傅里葉變換。對式(2)求取傅里葉反變換可得到人工信號的時域信號。
當輸入的聲音信號是一個周期信號時,式(2)中的人工信號能夠產(chǎn)生諧波再生現(xiàn)象[8]。對于非周期信號,由于其不具有周期特性,使得非周期信號的譜并不會受到諧波再生過程的影響。當提取諧波處理后的聲信號的GF 和MFCC 特征后,將其與原始信號產(chǎn)生的特征相結合來作為DNN 模型的輸入特征。
從計算成本的角度考量,選取多層感知器MLP作為DNN 模型的訓練機器。其網(wǎng)絡結構選為3 個隱層網(wǎng)絡,隱層之間的激活函數(shù)為Sigmoid 函數(shù),優(yōu)化算法選用具有動量項的Adam 算法,其動量因子隨訓練周期從最小的0.5 變化到較大的0.9。Dropout 策略用來解決MLP 的過匹配問題,以提高其泛化能力。交叉熵準則作為MLP 模型的代價函數(shù)。
本節(jié)將檢驗基于DNN 網(wǎng)絡的方法在低空目標識別中的識別效果,選取的識別目標類型包括無人機、直升機和戰(zhàn)斗機。本次實驗所采用的數(shù)據(jù)來源于利用聲傳感器陣列在不同時間和不同地點實際采集到的無人機、直升機和戰(zhàn)斗機的聲數(shù)據(jù),且所有實驗數(shù)據(jù)的采樣頻率被設置成一致。在實驗中,實驗數(shù)據(jù)被分為訓練集和測試集兩部分,以考察識別算法的泛化能力。
基于深度學習的目標識別方法的實驗設置如下:在訓練前期,約兩小時包含三種機型的數(shù)據(jù)集被選取,約20 min 不同于訓練集的數(shù)據(jù)被用于測試。網(wǎng)絡結構中,3 個隱層的節(jié)點數(shù)分別為1 024,1 024 和512,輸入層為拼接后的輸入特征數(shù)據(jù)。為了減少輸入數(shù)據(jù)的動態(tài)范圍過大引起的網(wǎng)絡收斂難的問題,所提取的輸入特征均進行了零均值方差的歸一化處理。
在訓練階段,將無人機、直升機和戰(zhàn)斗機的訓練數(shù)據(jù)進行合并,以得到所提取的輸入特征集合,同時利用設定的訓練目標進行網(wǎng)絡訓練。在測試階段,首先對測試數(shù)據(jù)進行處理獲得特征參數(shù),然后將其輸入到訓練好的模型中得到聲目標識別標簽。圖6 給出了本文方法和參考方法[1](定義為Ref)對3 種低空飛行目標進行處理獲得的識別結果。從圖6 可以看出,基于深度學習的方法對3 種飛行目標的識別率均能超過參考方法,這在一定程度上反映出所提方法可以有效用于對低空飛行目標的分類。
圖6 低空飛行目標的識別率
本文研究了人工智能技術中的深度學習方法在低空聲目標識別中的應用。首先,提取出基于信號Mel 譜和GF 譜等聲音信號的靜態(tài)特征,并利用差分技術獲得上述靜態(tài)特征的動態(tài)特征,其次利用諧波增強技術提取出具有諧波保護能力的上述靜態(tài)特征和動態(tài)特征,并將其與非諧波保護的特征進行合并;再次,將合并后的特征作為深度學習的輸入?yún)?shù)進行網(wǎng)絡訓練;最后,利用訓練好的網(wǎng)絡模型在線對無人機、直升機以及戰(zhàn)斗機進行識別。結果顯示,基于深度學習的方法能夠取得較好的識別結果,這將能夠為人工智能技術在低空探測預警方面的軍事應用提供重要的參考價值。