張巧力 劉福臣
(聲納技術(shù)重點實驗室 第七一五研究所,杭州,310023)
隨著大數(shù)據(jù)技術(shù)的迅速發(fā)展,基于深度學習的數(shù)據(jù)驅(qū)動方法逐步應用于水聲領(lǐng)域的目標檢測、定位和識別等。水下目標定位是通過水聽器陣列接收到的聲波信號來估計目標聲源的空間位置。該項技術(shù)一直是探索海洋的研究重點和熱點。被動定位技術(shù)以其優(yōu)良的隱蔽性、高安全性,在軍事和民用領(lǐng)域都具有廣闊的應用前景,是聲吶技術(shù)發(fā)展的重要方向之一。經(jīng)過國內(nèi)外研究人員幾十年的深入研究,以MFP為代表的模型驅(qū)動方法相關(guān)理論和技術(shù)取得了豐碩成果[1-3]。此類方法將聲傳播模型與陣列信號處理結(jié)合起來,利用水聲信道特性獲取優(yōu)良的定位性能,但通常受到海深、聲速剖面等因素的影響,存在失配情況,或聲傳播模型參數(shù)未知等情況,影響定位性能。
不同于模型驅(qū)動定位方法,以深度學習為代表的數(shù)據(jù)驅(qū)動方法直接從數(shù)據(jù)中尋找特征,無需海洋環(huán)境先驗信息,避免了環(huán)境聲場理論建模引起的環(huán)境失配的影響。從文獻[4]可知,人工神經(jīng)網(wǎng)絡(luò)第一次應用于水下目標定位是在 1991年,Steinberg和Beran等利用單層神經(jīng)網(wǎng)絡(luò)技術(shù)對均勻介質(zhì)中的點聲源進行深度估計;同年,文獻[5]中 Ozard和Zakarauskas等仿真實現(xiàn)了基于人工神經(jīng)網(wǎng)絡(luò)的聲源距離-深度估計。2017年H Q Niu等人引入了FFNN、支持向量機、隨機森林等方法,將定位問題轉(zhuǎn)化為分類問題,取得了不錯的定位效果[6-7]。
本文利用美國海洋物理實驗室1996年5月在距 Point Loma約 12 km處進行的一次淺海實驗(SWellEX-96實驗)研究垂直陣定位問題[8],詳細分析了該實驗獲取的垂直陣數(shù)據(jù),比較了基于FFNN定位和基于簡正波模型的MFP的定位性能。
常規(guī)匹配場定位屬于模型驅(qū)動方法,它是利用預知海洋環(huán)境參數(shù)與基陣相關(guān)參數(shù),基于聲傳播模型仿真聲場,計算拷貝場向量,利用實際基陣測量數(shù)據(jù)與之匹配,匹配輸出距離-深度模糊表面,從而實現(xiàn)目標的距離和深度估計[9]。MFP的定位的模糊度平面B由互譜密度矩陣R和拷貝向量組成ω:
式中,ω表示拷貝向量,φ表示聲源位置參數(shù),(·)H表示共軛轉(zhuǎn)置;L表示快拍數(shù);Pl表示第l個快拍下基陣頻域數(shù)據(jù)向量。
對于寬帶信號,可采用頻間非相干法,將該信號分為若干個窄帶,對每個窄帶單獨處理得到模糊度平面,再進行累加平均。
FFNN屬于數(shù)據(jù)驅(qū)動方法,由大量的人工神經(jīng)元相互連接進行計算,根據(jù)訓練樣本,通過調(diào)節(jié)神經(jīng)元之間的權(quán)值來輸入數(shù)據(jù)進行建模,最終具備解決實際問題的能力,神經(jīng)網(wǎng)絡(luò)在模式分類、聚類和回歸擬合等領(lǐng)域廣泛應用。本文將目標定位問題轉(zhuǎn)換為分類問題處理。圖1為典型的單隱藏層FFNN結(jié)構(gòu)。
工作原理主要分為兩個過程:工作信號前向傳播和誤差信號的反向傳播。輸入的工作信號從輸入層經(jīng)隱藏層,傳向輸出層,最后產(chǎn)生輸出信號,工作信號前向傳播過程中,層與層之間連接權(quán)值固定不變。網(wǎng)絡(luò)輸出信號與期望信號存在差異,兩者之間差值即為誤差信號[10-11]。誤差經(jīng)代價函數(shù)計算后,由輸出層逐層向輸入層反向傳播,通過誤差反饋來更新調(diào)節(jié)層與層之間連接權(quán)值,更新的權(quán)值用于下一次工作信號前向傳播。通過周而復始的學習,權(quán)值不斷修正使神經(jīng)網(wǎng)絡(luò)實際輸出接近期望輸出。
圖1 FFNN結(jié)構(gòu)示意圖
本文使用實向量化的采樣協(xié)方差矩陣(Sample Covariance Matrices,SCMs)作為FFNN的特征輸入[7]。為了減小聲源振幅的影響,Q個陣元垂直陣接收復聲壓進行范數(shù)歸一化操作:
采樣協(xié)方差矩陣根據(jù)L個快拍數(shù)據(jù)平均計算得到
在文獻[6-7]中,為滿足FFNN實值輸入要求,選取SCMs上三角及對角線的實、虛部值構(gòu)成特征向量X,維度為但由于SCMs是復共軛對稱矩陣,其對角線的虛部始終為 0,因此本文提出了新的實值向量化方案,新的特征向量X由SCMs的對角線實、虛部及對角線實部構(gòu)成,減少了特征向量X長度,則維度變?yōu)槠渲蠳f為頻點數(shù)(窄帶信號取Nf=1;寬帶信號取Nf≥ 2 )。
假設(shè)聲源距離范圍為(rmin,rmax],采用等寬分箱離散化處理,將聲源距離等分為K類,即
則第n個樣本實際距離Rn所屬類別tn,real定義如下
訓練過程:將樣本實際距離所屬類別tn,real以獨熱編碼方式(One-Hot Encoding)處理,映射到1×K的二進制標簽向量,作為FFNN的輸出。
測試過程:測試樣本距離估計結(jié)果,用 FFNN預測距離所屬的類別tn,pred所對應的距離區(qū)間的中間值表示(下文簡稱預測類別距離):
本文構(gòu)建了單隱藏層的 FFNN,隱藏層神經(jīng)元個數(shù)設(shè)為256,選擇Sigmoid和Softmax函數(shù)作為隱藏層和輸出層的激活函數(shù),并在其中加入Dropout層預防過擬合現(xiàn)象,神經(jīng)元丟失率設(shè)為0.5。網(wǎng)絡(luò)以Tensorflow為底層的高級深度學習鏈接庫Keras完成訓練與預測[12],選擇Adam算法作為優(yōu)化器,學習率為0.001,交叉熵(Cross-Entropy)作為損失函數(shù),最大訓練次數(shù)為1 000次。
為了量化定位性能,本文引入平均絕對百分比誤差(Mean Absolution Percentage Error,MAPE)評價指標,定義如下
式中,Nall為總樣本數(shù),ri,pred和ri,real為第i個測試樣本預測距離和實際距離。
2.4.1 仿真條件
仿真采用SWellEx-96實驗的淺海環(huán)境參數(shù),包含海水層、沉積層、泥巖層以及半無限空間,含21個元的垂直陣列布放深度范圍在 94.125~212.25 m之間,陣元采樣率 1.5 kHz,如圖2所示,使用KrakenC數(shù)值計算仿真數(shù)據(jù)。
圖2 SWellEX-96實驗淺海環(huán)境參數(shù)模型
仿真考慮窄帶聲源,中心頻率為94 Hz,信噪比為0 dB,假設(shè)聲源深度固定不變,深度設(shè)為54 m。本次仿真聲源與垂直接收陣范圍為(0,10]km,訓練樣本的距離采樣間隔為5 m,訓練集(包含驗證集,占比20%)共有2 000個樣本;為了測試樣本與訓練樣本不重疊,測試樣本的距離采樣間隔增加到51 m,則測試集共有196個樣本。本次仿真將距離變量離散為100類。
2.4.2 仿真結(jié)果分析
網(wǎng)絡(luò)分別以文獻[6-7]提出的SCMs實向量化方案和本文提出的新方案來構(gòu)建特征向量,建立兩個FFNN,分別訓練和測試。兩個模型的輸入層神經(jīng)元個數(shù)分別設(shè)置為21× 2 2×1= 4 62和21× 2 1×1= 4 41。在其他參數(shù)條件均相同的情況下,兩個模型的所需訓練超參數(shù)(Hyper-Parameters)總量分別為144 228和138 852,一般來說訓練超參數(shù)越大,模型越復雜。圖3展示了上述兩個模型下測試集樣本距離估計結(jié)果,計算MAPE分別等于1.32和1.30。結(jié)果顯示,兩種情況下均有良好的定位性能。相同條件下,本文提出的SCMs實向量化方案在不影響定位效果基礎(chǔ)上,降低了模型的復雜度。
圖3 兩個模型下測試集的定位結(jié)果
SWellEX-96共包含S5和S59兩個航次,實驗環(huán)境參數(shù)如圖2所示。本文使用該實驗S5航次的垂直陣接收的數(shù)據(jù)進行比較和驗證,S5航次一共拖曳了深(54 m)和淺(9 m)兩個聲源,聲源移動速度約為2.5 m/s,共記錄了75 min數(shù)據(jù)。實驗使用的垂直陣有22個水聽器,采樣頻率為1.5 kHz,布放深度在94.125~212.25 m之間,由于有一個水聽器沒有正常工作,僅使用21個水聽器的測量數(shù)據(jù)。
3.2.1 MFP定位
本文考慮深(54 m)聲源定位,選取 235 Hz作為窄帶聲源的中心頻率,{112,235,388}Hz三個頻點作為寬帶聲源頻率,設(shè)搜索海域的距離范圍是0~10 km,間隔為50 m;深度范圍1~200 m,間隔為1 m,使用簡正波模型描述拷貝場,由KrakenC程序進行仿真,聲壓場的互譜密度矩陣使用3個1 s的快拍數(shù)據(jù)計算獲得,利用Bartlett算法估計出水下目標聲源位置。圖4為窄帶和寬帶聲源的距離估計結(jié)果。結(jié)果表明:在環(huán)境匹配條件下,距離 2 km以上的聲源MFP整體定位效果不錯,對于在0~2 km范圍內(nèi)的聲源定位效果較差,主要原因是簡正波模型不適合近場條件下聲場建模。相比較窄帶聲源,寬帶聲源定位性能略優(yōu)。
圖4 MFP在測試集上的定位結(jié)果
3.2.2 FFNN分類器
該實驗共記錄了75 min數(shù)據(jù),每1 min給出了該時刻的GPS定位信息,共76個位置信息作為測試集。相鄰兩個測試樣本之間,每間隔4 s作為一個訓練樣本點,距離值通過插值獲得,共1 050個插值點作為訓練集。對于每個采樣點,各個選取頻率及各位置下的SCMs由3個1 s快拍數(shù)據(jù)平均計算獲得。這里同樣將搜索范圍設(shè)置為0~10 km,此距離范圍內(nèi)等寬分箱為K=100個距離類別。圖 5為窄帶聲源和寬帶聲源在FFNN方法下的距離預測結(jié)果。結(jié)果表明:無論窄帶還是寬帶聲源,相較于MFP,F(xiàn)FNN的定位性能均明顯提升,尤其是在近場條件下的聲源定位。
圖5 FFNN在測試集上的定位結(jié)果
為了更加準確直觀定量比較兩種方法,表1給出了窄帶和寬帶聲源分別在MFP和FFNN兩種方法下的MAPE,無論窄帶還是寬帶聲源,F(xiàn)FNN方法下的MAPE遠遠小于MFP,F(xiàn)FNN定位性能優(yōu)于MFP。通過表1縱向?qū)Ρ瓤梢园l(fā)現(xiàn),無論FFNN還是MFP方法,寬帶聲源的MAPE均小于窄帶聲源,這是由于相較于窄帶聲源,寬帶聲源提供了更多信息,因此會獲得更優(yōu)的定位性能。
表1 窄帶和寬帶聲源分別在不同方法下的MAPE
圖6為0~10 km范圍內(nèi)寬帶聲源在兩種方法下的距離估計結(jié)果的絕對誤差。MFP和FFNN的平均絕對誤差分別為1.26 km和0.12 km,方差分別為2.81和0.04。FFNN大幅度減小了距離估計絕對誤差,除個別誤差較大(1.8 km左右),其余絕對誤差都控制在0.3 km以內(nèi)。相比之下,F(xiàn)FNN較MFP具有更高的定位精度和較好的穩(wěn)定性,尤其是近距離聲源的距離估計。
圖6 0~10 km范圍內(nèi)距離估計結(jié)果的絕對誤差
本文通過 SWellEX-96海試數(shù)據(jù)處理驗證,對比了FFNN為代表的數(shù)據(jù)驅(qū)動定位方法和傳統(tǒng)MFP為代表的模型驅(qū)動定位方法的性能。結(jié)果表明,在海洋環(huán)境已知條件下,無論是窄帶還是寬帶聲源,F(xiàn)FNN具有更好的定位性能,那么當在環(huán)境參數(shù)未知或失配條件下,數(shù)據(jù)驅(qū)動方法提供了非常好的解決思路。
本文方法主要針對單目標問題。對于多目標問題,如果能夠?qū)⒛繕寺曅盘栴l段區(qū)分開來,可以視為多個單目標問題處理,則此方法仍然使用,如果目標頻段重疊嚴重,不能分辨,那么該方法就不適用了。