江均均,黃 敏,肖仲喆
(蘇州大學 光電科學與工程學院,江蘇 蘇州 215006)
艦船航行過程中產生的低頻聲音信號是對其進行檢測和定位的重要信息來源.然而,水聲目標的聲音信號通常由于所處的環(huán)境復雜多變而被能量遠高于目標信號的噪聲所淹沒,使得對于是否存在艦船等目標的檢測變得十分困難.水聲目標檢測是實現(xiàn)水下裝備系統(tǒng)智能化的重要支撐技術,其關鍵是從被強噪聲淹沒的信號中提取出表征水聲目標特性的標志性特征.標志性特征一般應具備以下4個方面的特性: 良好的類間可分性、有明確物理含義和較強的泛化能力、對目標運動工況具有一定的不變性以及對水聲環(huán)境具有良好的寬容性等[1].國內外學者們提出了多種水聲目標檢測的方法,提取了各種形式的特征,如提取水聲目標信號的經(jīng)典聽覺感知梅爾頻率倒譜系數(shù)(Mel Frequency Cepstrum Coefficients, MFCC)特征,包括1階差分MFCC和2階差分MFCC,并利用監(jiān)督學習方法進行分類識別[2-3];采用集成經(jīng)驗模態(tài)分解(Ensemble Empirical Mode Decomposition, EEMD)和希爾伯特-黃變換提取目標信號的最強本征模函數(shù)的中心頻率、高低頻之間的能量差和瞬時能量變化范圍[4];根據(jù)卡爾曼濾波理論和最大似然估計法提取水聲目標輻射噪聲的基頻和各階諧波的特征[5];利用深度神經(jīng)網(wǎng)絡直接提取目標信號的深度特征[6-7];提取水聲目標信號的近似熵、模糊熵和樣本熵這3種非線性特征,輸入到機器學習模型中進行識別[8].雖然基于這些特征的方法在相應測試數(shù)據(jù)上有不錯的表現(xiàn),但由于實驗數(shù)據(jù)少,泛化能力不強,其中部分方法依賴于仿真數(shù)據(jù),并非一定適用于真實數(shù)據(jù),且其抗干擾能力弱.
針對以上問題,本文以某研究所采集的湖泊環(huán)境下的水聲目標信號實測數(shù)據(jù)為基礎,對水聲目標信號的特性進行了分析,提取了若干能夠表征水聲目標特性的標志性特征,并通過機器學習方法對這些標志性特征的性能進行了驗證.
艦船在水面或水下運行時,會產生若干個近似于單頻音的低頻聲音信號,其在不同方向發(fā)出的聲音的頻率響應相同,不過受船身的遮蔽效應影響,不同方向實際接收到的聲音信號會略有差異.對這類信號的自動檢測能夠及時發(fā)現(xiàn)附近水域是否出現(xiàn)運動中的艦船等目標,從而可以對艦船的距離、類型等進行判別.然而,由于風浪等引起的水體自身震蕩,來往其他船只的干擾等因素,水聲目標信號通常都伴隨有各種形式的噪聲和干擾,且這些干擾因素往往隨著時間會發(fā)生顯著的變化,給水聲目標的自動檢測造成了極大的困難.本文提取能夠表征水聲目標特性的若干標志性特征,并通過機器學習算法對這些標志性特征的性能進行驗證的基本流程如圖1所示.
圖1 水聲目標信號的標志性特征提取與 基于機器學習的驗證流程Fig.1 Process chart of signature feature extraction of underwater acoustic target signal and verification by machine learning
本文實驗中采用的水聲目標數(shù)據(jù)樣本來源于某研究所在某湖泊試驗場采集的數(shù)據(jù),使用兩條不同方向的航道,主航道上水深50m以上,試驗場中的主要干擾源包括: 1) 基地處實驗干擾(來自基地處其他實驗團隊所做實驗);2) 來往船只干擾;3) 環(huán)境噪聲.實驗的目標是檢測任意1種艦船等水聲目標,因此本文使用主動聲源模擬了多種水聲目標所發(fā)出的運行低頻聲,通過對主動聲源信號檢測的研究來實現(xiàn)對任意1種水聲目標的檢測.主動聲源共設定5種不同的模式,代表5種不同的目標(A、B、C、D、E),每種目標設定5個頻率的低頻線譜,線譜頻率分布在100Hz到530Hz之間,其中,目標A、B、C兩兩之間有2條相同線譜,目標C、D、E的所有線譜各不相同.主動聲源模擬的信號和真實信號都是線譜,都有若干個,頻率也都在100Hz到600Hz之間,兩者的區(qū)別主要為真實信號在艦船減速時頻率會漸變,不會中斷幾秒,在同樣的距離上,真實信號較模擬信號略弱,因此使用主動聲源模擬的5個單頻音可以較真實地還原真實艦船發(fā)出的水聲信號.為保證實驗設備在實驗過程中保持良好工況,信號的占空比設置為0.625,發(fā)射信號具體形式為發(fā)5s,停3s,5類線譜輪流發(fā)射,1個周期的信號長度為40s.水聲目標的輻射信號的頻率最高為幾千赫茲,由于數(shù)據(jù)采集設備的限制,我們選擇17067Hz的采樣頻率,可以滿足采樣要求.
聲源所發(fā)射的線譜信號通過16元潛標垂直陣進行接收,接收器垂直陣懸掛于固定位置的測量基地.本文實驗選用了聲源發(fā)射器與信號接收器之間的兩種不同位置的信號作為數(shù)據(jù)樣本.情況1: 聲源發(fā)射器也懸掛于測量基地,采集聲源在靜止時候的信號.情況2: 聲源發(fā)射器以某一固定深度懸掛于某船只下方,船只在航道內進行航行,采集聲源在移動時候的信號.
由于各種干擾因素的存在,接收器采集到的數(shù)據(jù)會被干擾信號所淹沒.在船只航行狀態(tài)下實際采集的數(shù)據(jù)中1段20s長的單一通道的數(shù)據(jù)片段如圖2所示.
圖2 接收信號的樣本Fig.2 Sample of received signal灰色虛線為線譜發(fā)射間隙時的信號,黑色實線為線譜發(fā)射過程中的信號.
圖2(a)為原始信號的時域波形,可見由于強干擾信號的存在,時域波形表現(xiàn)為類似于噪聲的特性,沒有明顯規(guī)律.圖2(b)為原始信號的短時頻譜,其中: 灰色虛線為線譜發(fā)射間隙的信號情況(標注為無信號),黑色實線為線譜發(fā)射期間的信號情況(標注為有信號).盡管在這一頻譜對比圖中,能夠發(fā)現(xiàn)線譜發(fā)射時的若干個線譜譜峰,但數(shù)據(jù)中明顯存在低頻(低于100Hz)的噪聲,且幅度顯著高于各線譜.為了去除這一背景噪聲,我們采用高通濾波信號預處理以減少低頻噪聲的干擾,具體濾波過程選用3階橢圓濾波器,高通截止頻率設為100Hz.濾波后的時域波形如圖2(c)所示,可見濾波后的幅度在線譜發(fā)射時和發(fā)射間隙之間出現(xiàn)了明顯的幅度對比.濾波后的信號短時頻譜如圖2(d)所示,標注同圖2(b),可見無論有無線譜發(fā)射,信號頻譜都具有類似的背景走向,而當有線譜發(fā)射時,頻譜中會根據(jù)所在時刻發(fā)射的線譜模式出現(xiàn)明顯的譜峰.
圖3 高通濾波后的長時間信號的時域波形Fig.3 Time domain waveform of high-pass filtered signal on long time scale
然而,由于干擾會隨著時間推移發(fā)生顯著變化,利用圖2所示的時域信號幅度差異或者時域幅度突變信息并不足以作為自動判斷是否處于線譜發(fā)射期間的依據(jù).圖3所示為從1段連續(xù)信號中截取的自2300s 至3000s的持續(xù)時長為700s的長片段.由圖示信號可見,2300s至2400s之間信號整體具有較低幅度,而后信號幅度明顯增強,2800s 之后的線譜間隙幅度甚至高于2300s時有線譜發(fā)射的幅度,而有/無線譜發(fā)射時幅度差異也隨著時間呈現(xiàn)顯著變化,沒有表現(xiàn)出明確規(guī)律.
為更清晰地顯示線譜模式,圖4(a)中顯示了圖2(a)的20s數(shù)據(jù)的聲譜圖,這段數(shù)據(jù)所受的干擾較小,由圖中可見,在線譜發(fā)射期間能看到5條水平條紋,在線譜發(fā)射間隙則不存在對應的線譜條紋,而條紋位置與所發(fā)射的線譜模式對應.圖4(b)為濾波后的信號的聲譜圖,線譜條紋比濾波前的原始信號更加清晰.當環(huán)境發(fā)生變化時,較強的干擾會使線譜條紋的清晰程度嚴重下降,如圖4(c)所示,線譜發(fā)射期間的條紋與背景間的對比很弱,且在某些頻率位置出現(xiàn)了較持續(xù)的干擾條紋(例如圖中110Hz附近、210Hz附近),而干擾條紋是否存在,干擾條紋數(shù)量、頻率、持續(xù)時間等均隨機.
圖4 接收信號的聲譜圖Fig.4 Spectrogram of received signal
在這種情況下,提取能夠有效地表征線譜是否存在的水聲目標信號的特征則成為了能夠以較小的計算復雜度實現(xiàn)對水聲目標信號檢測的關鍵問題之一.
我們的目標是使用數(shù)量很少、計算復雜度低的特征實現(xiàn)對水聲目標的檢測.無論是艦船行駛自然形成的水聲信號,還是所采集的線譜聲源,均表現(xiàn)為若干條頻率為幾百赫茲的線譜.頻譜特性將成為區(qū)分線譜是否存在的重要表征.我們選取了表征頻譜特性的5個基本特性進行研究.線譜發(fā)射期間與線譜發(fā)射間隙信號的短時頻譜如圖5所示.
圖5 信號的短時頻譜Fig.5 Short time spectrum of signal
1.2.1 頻譜全局分析
圖5(a)與(c)分別為線譜聲源發(fā)射間隙與發(fā)射期間的短時頻譜,圖中的點劃線為頻譜幅度均值.兩者均體現(xiàn)出幅度不同的若干個譜峰.比較兩圖可知: 在線譜發(fā)射間隙,即線譜不存在時,頻譜幅度較高的情況大多集中在頻率低于200Hz的頻段;在線譜發(fā)射期間,即線譜存在時,由于存在若干條線譜,頻率較低處的背景幅度相對于線譜而言明顯較低,而在高于200Hz部分也會存在若干條譜線.針對聲源發(fā)射的信號在線譜發(fā)射期間包含5個線譜頻率的情況,我們對信號頻譜選取其最高的5個譜峰,譜峰頻率記為fp(i),i=1,2,…,5,對應的各譜峰幅度記為Ap(i),i=1,2,…,5.定義譜峰重心為
(1)
譜峰重心即為表征頻譜特性的基本特性1(B1).
由圖5(a),(c)中的頻譜均值線可見,由于線譜數(shù)量不多且譜線很窄,線譜的存在對于頻譜幅度均值的影響較小,然而線譜幅度相對于頻譜背景幅度顯著增高,因此,線譜存在時,頻譜最大值與頻譜均值的比值會顯著高于線譜不存在時的情況.這一比值作為表征頻譜特性的基本特性2(B2),如下所示:
(2)
其中mF為頻譜均值.基本特性1,2可視為頻譜的全局特性.
1.2.2 頻譜局部特性分析
基本特性3,4,5為頻譜的局部特性,用于描述局部某個單一譜峰的局部特性.如圖5(b),(d)所示,分別為無線譜與有線譜時的某譜峰的局部頻譜.圖中各標示兩條虛線縱線,左側虛線為譜峰位置,右側虛線為從譜峰位置提升某一固定頻率的位置,圖示頻移為12.5Hz.當譜峰如圖5(b)所示較寬時,兩個頻率點處的幅度比值較小,而當譜峰如圖5(d)所示較窄時,兩個頻率點處的幅度比值較大,定義其為峰側比:
(3)
其中: Δf為從譜峰位置的頻率提升值;F(fp(i)+Δf)為第i個譜峰頻率提升Δf處的頻譜幅度.當線譜存在時,全局分析時所提取的5個最高譜峰均為線譜處的窄峰,因此,5個峰值處的峰側比均為較大數(shù)值,且5個值較為均衡;當線譜不存在時,5個最高譜峰有可能寬窄不一,因此其中會出現(xiàn)較小數(shù)值,且5個峰值處的峰側比數(shù)值會出現(xiàn)明顯差異.基本特性3(B3),4(B4),5(B5)分別定義為5個峰側比的均值、最小值、方差.
1.2.3 標志性特征
在水聲目標檢測任務中,我們定義單一樣本為持續(xù)時間為1s的數(shù)據(jù),共計16個通道.針對水聲目標信號中線譜頻率較低的情況,設定短時頻譜計算使用的幀長為100ms,幀移為50ms,則1s樣本中包含19幀.對任1樣本的任1基本特性Bi,可獲得1個19×16的矩陣Ci:
(4)
對第i個基本特征Bi構成的矩陣Ci,定義3個統(tǒng)計特征用于檢測水聲目標線譜是否處于發(fā)射期間,即矩陣Ci的全局均值,通道間標準差以及幀間標準差.
全局均值定義為
(5)
通道間標準差定義為
(6)
幀間標準差定義為
(7)
從5個基本特性Bi中共提取出15個特征用于機器學習算法,這些特征對于水聲目標信號是否存在具有明顯的區(qū)分能力.圖6為其中特征1與特征11構成的散點圖.圖中,黑色星號為線譜發(fā)射期間的特征值,灰色圓圈代表線譜發(fā)射間隙的特征值,可見在這兩種情況下,所選取的兩個特征的分布具有明顯的不交叉區(qū)域.配合其他特征以及適宜的機器學習算法,能夠對線譜聲源是否在發(fā)射期間進行準確地自動檢測.
圖6 特征1與特征11構成的散點圖Fig.6 Scatter diagram composed of feature 1 and 11
利用前節(jié)所提取的15個水聲目標的標志性特征,本節(jié)使用機器學習的方式對水聲目標線譜是否存在進行了自動識別實驗,實驗結果表明: 在僅有15個特征的情況下,利用傳統(tǒng)機器學習方法即可有效地對水聲目標線譜進行檢出,避免了深度學習方法的極高運算量,能夠達到快速檢測的效果.
本文工作的實驗部分選用4種不同的機器學習算法,分別為: 多層感知機(Multilayer Perception, MLP),支持向量機(Support Vector Machine, SVM),隨機森林(Random Forest, RF)以及邏輯回歸(Logistics Regression, LR).實驗中將水聲目標數(shù)據(jù)集的20%作為開發(fā)集進行模型參數(shù)的調節(jié),通過多次的參數(shù)調節(jié),確定模型參數(shù)如下: 多層感知機的輸入神經(jīng)元15個,隱藏層為1層,隱藏神經(jīng)元25個,激活函數(shù)為S型傳輸函數(shù),輸出神經(jīng)元1個;支持向量機使用線性核函數(shù);隨機森林使用100棵決策樹,每棵樹隨機使用4個特征.為了驗證所提取的標志性特征的效果,所有實驗均使用10折交叉驗證,實驗使用的同一情況下的聲源樣本數(shù)據(jù)來源于不同日期,其面對的背景干擾情況不同.同時,對這些來源于不同日期的聲源樣本數(shù)據(jù)的訓練測試可以解決數(shù)據(jù)的場景依賴性問題,能很好地證明所提出特征的魯棒性.
實驗內容分為兩部分: 靜止目標檢測與移動目標檢測.在靜止目標檢測中,發(fā)聲聲源與16元接收器均懸掛于試驗基地水下,聲源深度具有3種不同深度,所有深度下的數(shù)據(jù)統(tǒng)一使用,且數(shù)據(jù)均為夜晚采集,周邊過往船只較少,環(huán)境噪聲影響較弱.在移動目標檢測中,16元接收器懸掛于試驗基地水下,發(fā)聲聲源以固定長度纜繩懸掛于航行中的船只下方,數(shù)據(jù)采集于白天,受周邊過往船只等影響較多,如圖4(c)所示情況.
2.2.1 靜止目標檢測
靜止目標情況下,共使用水聲目標數(shù)據(jù)36848s,每1s的數(shù)據(jù)作為1個樣本,利用上述4種算法進行10折交叉驗證,實驗結果如表1所示.
由實驗結果可見,在僅提取15個特征且使用傳統(tǒng)機器學習方法的情況下,各種方法對靜止目標均能實現(xiàn)高于98%的識別準確率,且均表現(xiàn)出非常接近于1的AUC(Area Under Curve)面積,證明了本文提取的特征對于水聲目標是否存在具有高度的標志性.
2.2.2 移動目標檢測
移動目標情況下,共使用水聲目標數(shù)據(jù)12560s,每1s數(shù)據(jù)作為1個樣本,利用上述4種算法進行10折交叉驗證,實驗結果如表2所示.
由實驗結果可見,移動目標檢測的準確率能夠達到90%左右,AUC在部分算法中能夠達到0.95以上.
將移動目標檢測和靜止目標檢測的結果進行對比,移動目標檢測的準確率略低于靜止目標檢測,其AUC也低于靜止目標檢測,主要是由于移動目標信號在采集過程中受多種因素的干擾,比如附近過往船只輻射噪聲的干擾、水體自身震蕩的影響等,最關鍵的是由于目標在移動過程中與接收器的距離發(fā)生變化,產生傳播時間的差異,其信號在被接收器接收到之前會進行疊加,導致接收到的信號與聲源發(fā)射的原始信號有所不同.而靜止目標信號采集于晚上,周邊過往船只較少,環(huán)境噪聲影響較弱.這兩個實驗說明我們提取的水聲目標的標志性特征具有良好的抗干擾能力與泛化能力,能夠在不依賴于深度學習方法的情況下,以很低的計算復雜度實現(xiàn)對水聲目標的實時檢測.
表1 靜止目標檢測的實驗結果Tab.1 Results on fixed target detection
表2 移動目標檢測的實驗結果Tab.2 Results on moving target detection
本文利用某研究所提供的湖泊環(huán)境下的水聲目標信號實測數(shù)據(jù),對水聲目標信號的特性進行分析,確定了5個能夠明確表征其頻譜特性的基本特性,并從中提取了15個統(tǒng)計值作為特征,用于基于機器學習的水聲目標的自動檢測.實驗結果表明: 在僅有15個特征的情況下,利用傳統(tǒng)機器學習方法即可有效地對水聲目標線譜進行檢出,避免了深度學習方法的極高運算量,能夠達到快速檢測的效果,且提取的水聲目標的標志性特征具有良好的抗干擾能力與泛化能力,以很低的計算復雜度實現(xiàn)對水聲目標的實時檢測.
在實現(xiàn)了對水聲目標信號的實時檢測的基礎上,下一步的研究目標將是進一步挖掘水聲目標信號所攜帶的細節(jié)信息,用于對目標信號的位置和在水下的深度進行準確定位,實現(xiàn)全方位的水聲目標檢測與位置識別.