楊路飛,章新華,吳秉坤
(海軍大連艦艇學院,遼寧 大連 116018)
近年來,很多人研究基于深度學習的水聲目標分類問題,取得了很多重要成果[1]。目前,用于水聲目標分類的深度學習模型主要有深度置信網(wǎng)絡[2]、卷積神經(jīng)網(wǎng)絡、循環(huán)神經(jīng)網(wǎng)絡及其改進或變種[3],而本文使用的長短時記憶網(wǎng)絡(簡稱LSTM)就是其中一種。目標的檢測是目標分類的前提和關鍵。線譜檢測是目標信號檢測的一類方法,而LOFAR(即低頻分析記錄)譜是一種重要的線譜檢測算法。本文通過提取被動聲吶目標信號的LOFAR 譜矩陣,利用LSTM 處理時序數(shù)據(jù)能力強的特性,將LOFAR 譜矩陣輸入長短時記憶網(wǎng)絡,通過訓練深度學習模型,獲取訓練后的LOFAR 譜矩陣,最后繪出訓練后的LOFAR 譜圖。
艦船輻射噪聲中的機械噪聲與螺旋槳噪聲具有一定的周期性,即頻域上包含豐富的線譜。噪聲是一種隨機過程,可以進行頻譜分析。為了獲取目標輻射噪聲信號的時頻特性,可以利用短時傅里葉變換(簡稱STFT)的思想。
STFT 的定義為:
式中,“*”表示復共軛,f(t)是艦船輻射噪聲信號e-jωt用于限制頻域,τ用于限制時域,S(ω,τ)大致反映了f(t)在時刻τ時、頻率為ω的“信號成分”的相對含量。τ和ω是具有范圍的區(qū)域,也就是分辨率。STFT 的參數(shù)決定了這個區(qū)域的大小。每一次STFT 取的信號采樣點數(shù)決定了時域分辨率的大小。采樣點越大,LOFAR 譜圖在時間軸上的分辨率越模糊。
獲得LOFAR 譜圖的流程如下。
(1)預處理水聲輻射噪聲信號的采樣序列,信號序列分成連續(xù)時間幀,為避免相鄰兩幀變化較大,要取一段重疊區(qū)域,一般取一幀的0.3~0.5。對每幀信號做歸一化和中心處理,其中歸一化處理的目的是使接收信號的幅度在時間上均勻,中心化處理是為了使樣本的均值為零。
(2)對信號做短時傅里葉變換(STFT),得到LOFAR 譜圖。
(3)根據(jù)LOFAR 譜圖進行水下輻射噪聲信號的線譜檢測。
LSTM是普通的RNN非常成功的一種結構變種。LSTM 和普通RNN 相比,多出了3 個控制器——忘記控制、輸入控制和輸出控制。典型LSTM 單元內(nèi)部構造如圖1 所示。
LSTM 的3 個控制器對應LSTM 單元的3 個“門”——遺忘門(Forget gate)、更新門(Update gate)、輸出門(Output gate),分別用Gu、Gf、Go表示。輸入為at-1、ct-1、xt,輸出為at、ct、yt,遺忘門和更新門決定ct的值,輸出門決定at的值,具體公式為:
式中,Wc、Wu、Wf、Wo為權值,bc、bu、bf、bo為偏置。
LSTM 深度學習模型的輸入是LOFAR 譜矩陣。LOFAR 譜具有目標信號的時頻特性,將每個時間幀上的頻率點的數(shù)值作為特征輸入到LSTM 模型,可以利用LSTM 模型對時序數(shù)據(jù)學習能力強的特點,學習到LOFAR 譜矩陣之間的深度關聯(lián)。
本文采用的實驗數(shù)據(jù)是海上實測水下目標的輻射噪聲信號。數(shù)據(jù)采樣頻率為25 kHz,時長為6.553 6 s。輻射噪聲信號進行短時傅里葉變換時,滑動窗口大小為1 024 即每個時間幀采樣信號的采樣點數(shù),相鄰時間幀的重疊率為0.5,STFT 的頻率刻度選為10。由于水下目標輻射噪聲信號的頻率主要集中在低頻,信號頻率范圍選為0~4 000 Hz。
對于長短時記憶網(wǎng)絡模型,輸入特征為每個時間幀下的所有頻率點的幅值。為了保證模型的樣本數(shù)量,時間步設為1。隱藏層的個數(shù)為100 個,激活函數(shù)使用“relu”,損失函數(shù)選用均方差函數(shù),優(yōu)化器用“adam”。模型訓練過程的循環(huán)次數(shù)為100次。具體試驗流程如圖2 所示。
試驗中,由目標輻射噪聲時域采樣信號獲得LOFAR 譜圖,如圖3 所示,同時獲得目標的LOFAR譜矩陣,把每個時間幀的頻率特征作為深度學習模型訓練的輸入。最后,由LSTM 模型學習得到的LOFAR 譜矩陣繪出目標信號的LOFAR 譜圖,如圖4 所示。
本文從被動聲吶水下目標輻射噪聲信號著手,提取輻射噪聲的LOFAR 譜圖,同時獲得了LOFAR譜圖對應的LOFAR 譜矩陣。將LOFAR 譜矩陣作為深度學習LSTM 模型的輸入,經(jīng)過雙層LSTM 模型,得到訓練后的水下目標輻射噪聲信號的LOFAR 譜。兩張LOFAR 譜圖進行比較,可以得出結論:經(jīng)過LSTM 模型學習的水下目標輻射噪聲信號的LOFAR譜圖的頻率線性表現(xiàn)更優(yōu)異,線譜檢測能力更好。