李海濤,劉 振,陳 喆,邱家興
(海軍潛艇學(xué)院,山東青島266071)
船舶輻射噪聲分類識別是判別船舶目標(biāo)類型的重要方法。近年來,深度學(xué)習(xí)技術(shù)的發(fā)展為船舶輻射噪聲分類識別提供了一個新的方法。國內(nèi)外許多專家學(xué)者將深度學(xué)習(xí)技術(shù)應(yīng)用于船舶輻射噪聲分類識別上,以提高船舶目標(biāo)分類識別能力。Sabara R基于圖形信號處理和卷積神經(jīng)網(wǎng)絡(luò)研究,開發(fā)了一種基于圖形卷積神經(jīng)網(wǎng)絡(luò)的水聲目標(biāo)識別系統(tǒng)[1]。Kamal S使用深度置信網(wǎng)絡(luò)提取信號時頻信息的深度特征用于分類識別[2]。國內(nèi)也對基于深度學(xué)習(xí)的船舶輻射噪聲分類識別方法進行了深入的研究,主要方法是使用深度神經(jīng)網(wǎng)絡(luò)[3~5]、卷積神經(jīng)網(wǎng)絡(luò)[6~13]、深度置信網(wǎng)絡(luò)[13~16]、自編碼神經(jīng)網(wǎng)絡(luò)[17~19]等模型提取不同輸入數(shù)據(jù)的深度特征,并用于分類識別。
人工聽測判型是船舶輻射噪聲分類識別的重要方法。在此過程中,操作員獲得的信息僅為人耳聽測得到的船舶輻射噪聲。經(jīng)驗豐富的操作員根據(jù)多年積累的先驗知識對聽測的噪聲信號進行分類識別。研究人耳聽覺特性,對于分類識別具有重要意義。張大偉[20]將聽覺中樞上的二維聽覺譜圖作為卷積神經(jīng)網(wǎng)絡(luò)的輸入,提取出深度特征并用于分類識別。楊宏暉[21]使用多尺度卷積濾波器將時域信號分解為具有不同頻率分量的信號,使用卷積神經(jīng)網(wǎng)絡(luò)對每個信號進行特征提取用于分類識別。本文從人耳聽覺的角度出發(fā),提出一種融合人耳聽覺特性與堆疊自編碼神經(jīng)網(wǎng)絡(luò)(Stacked Auto-Encoder Network,SAE)的船舶輻射噪聲分類方法。該方法首先使用Mel濾波器提取船舶輻射噪聲模擬人耳聽覺特性的特征量,然后將該特征量作為堆棧自編碼神經(jīng)網(wǎng)絡(luò)的輸入,逐層提取輸入數(shù)據(jù)的深度特征并用于分類識別。
研究表明,人耳對聲音的選擇不均勻。它在自己關(guān)注的頻率范圍內(nèi)聽測度較高,在其他頻率范圍內(nèi)聽測度較低,人耳的這種選擇可以用一組Mel濾波器來模擬。Mel濾波器在頻率上分布不均勻,它在高頻段分布稀疏,在低頻段分布密集。通過Mel濾波器可以將信號真實頻率轉(zhuǎn)化為人耳聽覺關(guān)注的Mel頻率,Mel頻率與真實頻率近似滿足如下關(guān)系式:
其變化趨勢圖如圖1所示。
圖1 Mel頻率與真實頻率關(guān)系圖Fig.1 Diagram of the relationship between Mel frequency and real frequency
在0~10kHz頻帶設(shè)計的20組Mel濾波器,其頻率響應(yīng)與頻率的關(guān)系如圖2所示。
圖2 Mel濾波器頻率響應(yīng)與頻率關(guān)系圖Fig.2 Diagram of frequency response and frequency of Mel filter
針對某商船信號進行處理,信號時長25s,時域波形如圖3所示。
圖3 某商船信號時域波形圖Fig.3 Time-domain waveform of a merchant ship signal
對信號進行分幀處理,每幀信號時長1s,幀移0.5s。計算每幀信號的人耳聽覺特征量。取第1幀信號,作DFT處理:
得到信號頻域特征如圖4所示。
圖4 商船某幀信號頻域特征Fig.4 Frequency-domain characteristics of a frame signal of merchant ship
針對信號頻域特征,在頻域范圍內(nèi)設(shè)置1000組Mel濾波器,得到如圖5所示的特征譜圖,該特征譜圖即為模擬人耳聽覺獲得的特征量。
圖5 通過 Mel濾波器后的特征譜圖Fig.5 Characteristic Spectrum after Mel filtering
自編碼器由編碼器和解碼器2部分組成,結(jié)構(gòu)如圖6所示。
圖6 自編碼器結(jié)構(gòu)圖Fig.6 Structural diagram of self-encoder
自編碼神經(jīng)網(wǎng)絡(luò)是一種特殊的自編碼器,它通過神經(jīng)網(wǎng)絡(luò)實現(xiàn)自編碼器的功能,其結(jié)構(gòu)如圖7所示。自編碼神經(jīng)網(wǎng)絡(luò)通過訓(xùn)練一個神經(jīng)網(wǎng)絡(luò)來得到一個恒等函數(shù),使得網(wǎng)絡(luò)模型的輸出等于輸入。訓(xùn)練完成的模型具備了的能力。當(dāng)層神經(jīng)元節(jié)點數(shù)小于層神經(jīng)元節(jié)點數(shù)時,為了能夠重構(gòu)輸入數(shù)據(jù),網(wǎng)絡(luò)模型必須自動學(xué)習(xí)輸入數(shù)據(jù)的壓縮表示,這個過程是對輸入數(shù)據(jù)的特征壓縮和提取。
圖7 自編碼神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖Fig.7 Structural diagram of self-coding neural network
圖8 深度特征的逐層提取過程Fig.8 Extraction of depth features layer-by-layer
3.1.1 自編碼網(wǎng)絡(luò)參數(shù)選擇
自編碼神經(jīng)網(wǎng)絡(luò)訓(xùn)練中最重要的參數(shù)是確定隱含層神經(jīng)元節(jié)點數(shù)。目前理論上還不存在普遍的方法用于確定隱含層節(jié)點數(shù),節(jié)點數(shù)的選擇主要是通過經(jīng)驗選擇和實驗確定[23]。訓(xùn)練自編碼神經(jīng)網(wǎng)絡(luò)的目的是為了使輸出數(shù)據(jù)盡可能復(fù)原輸入數(shù)據(jù),因此本文通過計算神經(jīng)網(wǎng)絡(luò)輸入與輸出之間的誤差來確定隱藏層節(jié)點數(shù),計算公式為:
選擇某一幀商船信號的人耳聽覺特征量,將其作為自編碼神經(jīng)網(wǎng)絡(luò)的輸入,網(wǎng)絡(luò)輸入節(jié)點數(shù)為1000,選擇不同的隱含層神經(jīng)元節(jié)點數(shù),計算網(wǎng)絡(luò)輸入與輸出之間的誤差。隨機挑選了5幀信號作為輸入,得到如圖9所示的統(tǒng)計結(jié)果。
圖9 自編碼網(wǎng)絡(luò)輸入與輸出之間的誤差Fig.9 Error between input and output of self-coding network
通過計算可以看出,當(dāng)網(wǎng)絡(luò)隱藏層神經(jīng)元節(jié)點數(shù)選擇為輸入層節(jié)點數(shù)的一半時,網(wǎng)絡(luò)輸入與輸出之間的誤差最小。因此本文設(shè)置網(wǎng)絡(luò)隱藏層節(jié)點數(shù)為輸入神經(jīng)元節(jié)點數(shù)的一半。
3.1.2 深度特征提取
針對船舶輻射噪聲的人耳聽覺特征量,設(shè)置5層自編碼神經(jīng)網(wǎng)絡(luò)提取其深度特征,設(shè)置每一層網(wǎng)絡(luò)節(jié)點數(shù)時,隱藏層節(jié)點數(shù)為輸入神經(jīng)元節(jié)點數(shù)的一半。網(wǎng)絡(luò)模型的訓(xùn)練采取逐層訓(xùn)練的方法,每次只訓(xùn)練一層網(wǎng)絡(luò)模型,上一層網(wǎng)絡(luò)訓(xùn)練完成后,提取隱藏層數(shù)據(jù)作為下一層網(wǎng)絡(luò)的輸入,以此類推。
當(dāng)5層自編碼神經(jīng)網(wǎng)絡(luò)全部訓(xùn)練完成之后,提取每層網(wǎng)絡(luò)的輸入層和隱藏層數(shù)據(jù)堆疊成SAE網(wǎng)絡(luò)模型,則該網(wǎng)絡(luò)模型的節(jié)點數(shù)設(shè)置為1000-500-250-100-50-25。選擇某商船信號進行試驗,提取該信號通過Mel濾波器的平均能量譜圖,使用上述5層自編碼神經(jīng)網(wǎng)絡(luò)提取其深度特征。觀察每一層網(wǎng)絡(luò)的輸入數(shù)據(jù)與輸出數(shù)據(jù)的相似度情況,得到5層自編碼神經(jīng)網(wǎng)絡(luò)輸入數(shù)據(jù)與輸出數(shù)據(jù)的對比圖,如圖10所示。
可以看出,每一層自編碼神經(jīng)網(wǎng)絡(luò)對輸入數(shù)據(jù)都有很好的復(fù)原效果。但是,當(dāng)輸入層網(wǎng)絡(luò)節(jié)點數(shù)較多時,輸出數(shù)據(jù)與輸入數(shù)據(jù)之間相對誤差較大。隨著輸入層網(wǎng)絡(luò)節(jié)點數(shù)的減小,自編碼神經(jīng)網(wǎng)絡(luò)對輸入數(shù)據(jù)的復(fù)原效果越來越好。尤其在第5層自編碼神經(jīng)網(wǎng)絡(luò)中,輸出數(shù)據(jù)與輸入數(shù)據(jù)基本相同。提取每一層自編碼神經(jīng)網(wǎng)絡(luò)的隱藏層數(shù)據(jù),該數(shù)據(jù)即為深度特征的逐層提取過程。
圖10 五層自編碼神經(jīng)網(wǎng)絡(luò)輸入數(shù)據(jù)與輸出數(shù)據(jù)對比圖Fig.10 Contrast diagram of input data and output data of five-layer self-coding neural network
使用實測船舶輻射噪聲信號建立訓(xùn)練集和測試集,信號總數(shù)為913條,每條信號時長在35~60s之間。對所有信號按照船舶類型分類,共分25類。針對每一條信號,以3s為一段劃分樣本,對每一個樣本進行分幀處理。計算每一幀信號模擬人耳聽覺特征量的特征數(shù)據(jù),取平均值作為樣本的特征數(shù)據(jù)。取每條信號前3/4樣本及其對應(yīng)的類別標(biāo)記作為訓(xùn)練數(shù)據(jù)集,后1/4樣本及其對應(yīng)的類別標(biāo)記作為測試數(shù)據(jù)集。
訓(xùn)練過程分2步進行:
第1步為無監(jiān)督訓(xùn)練,使用訓(xùn)練集數(shù)據(jù)對5層自編碼神經(jīng)網(wǎng)絡(luò)進行訓(xùn)練。通過訓(xùn)練獲得一個初始化的網(wǎng)絡(luò)權(quán)值,訓(xùn)練完成后提取每層自編碼神經(jīng)網(wǎng)絡(luò)的輸入層和隱藏層,堆疊得到SAE網(wǎng)絡(luò)模型。
第2步訓(xùn)練過程為有監(jiān)督訓(xùn)練,使用訓(xùn)練數(shù)據(jù)集和其類別標(biāo)記對SAE網(wǎng)絡(luò)進行訓(xùn)練。在此過程中,統(tǒng)計網(wǎng)絡(luò)前向運算與數(shù)據(jù)類型標(biāo)記之間的交叉熵?fù)p失函數(shù),對網(wǎng)絡(luò)模型進行反向傳播訓(xùn)練。當(dāng)訓(xùn)練集所有數(shù)據(jù)訓(xùn)練一遍時,記為迭代一輪。統(tǒng)計每一輪迭代過程中產(chǎn)生平均損失函數(shù)隨迭代輪數(shù)的變化過程,如圖11所示。
圖11 平均損失函數(shù)隨迭代輪數(shù)變化圖Fig.11 Variation diagram of average loss function with the number of iteration rounds
保存訓(xùn)練完成的SAE模型,使用測試數(shù)據(jù)集檢測SAE網(wǎng)絡(luò)模型的識別能力。統(tǒng)計識別結(jié)果發(fā)現(xiàn),針對本實驗所使用的數(shù)據(jù)集,識別正確率為91.19%,結(jié)果表明該方法具有較好的識別效果。
人耳聽測是船舶輻射噪聲分類識別的重要方法,本文從人耳聽覺角度出發(fā),提出一種融合人耳特性與SAE網(wǎng)絡(luò)模型的船舶輻射噪聲分類方法。該方法使用Mel濾波器模擬人耳對噪聲信號頻率的選擇,使用SAE網(wǎng)絡(luò)逐層自動提取艦船輻射噪聲模擬人耳聽特征量的深度特征,并將該特征用于分類識別。針對實測船舶輻射噪聲信號進行試驗,結(jié)果表明,本文提出的方法在試驗數(shù)據(jù)集上的識別正確率為91.19%,具有較好的識別效果。通過本文的研究可以看出,艦船輻射噪聲的人耳聽覺特征量可以用于分類識別,SAE網(wǎng)絡(luò)模型能夠?qū)斎霐?shù)據(jù)進行深度特征提取并用于分類識別。本文的研究對于進一步探索深度學(xué)習(xí)技術(shù)在船舶輻射噪聲分類識別上的應(yīng)用具有重要意義。