廖明熙,張小薊,張 歆
(西北工業(yè)大學(xué)航海學(xué)院,陜西 西安 710072)
一直以來,水下目標(biāo)識(shí)別與分類算法是水下艦船噪聲信號(hào)處理研究的重點(diǎn)及難點(diǎn),其主要方法是通過艦船的發(fā)動(dòng)機(jī)噪聲來判斷艦船的類別。在水下目標(biāo)識(shí)別特征提取方法的研究中,有眾多的特征提取方法[1]:功率譜分析理論[2]、小波及小波包理論[3]、HHT 變 換 方 法、MFCC 方法。其 中 基 于HHT變換具有比較好的特征識(shí)別效果[4-5]。
這些特征提取與分類識(shí)別算法都是使用原信號(hào),受限于水聲系統(tǒng)的帶寬,必須先將數(shù)據(jù)保存在水聲設(shè)備中,然后將信號(hào)傳輸?shù)降孛嬲具M(jìn)行處理,給實(shí)際應(yīng)用帶來不便。因此如何降低數(shù)據(jù)量,并進(jìn)行實(shí)時(shí)處理成為水聲信號(hào)特征提取及分類識(shí)別的新方向。2006年Candès等提出了壓縮感知(Compressed Sensing,簡(jiǎn)稱CS)理論[6-7],該理論的本質(zhì)內(nèi)容是稀疏或可壓縮信號(hào)的少量隨機(jī)的線性投影即包含了重構(gòu)和處理的足夠信息,也就是僅僅利用信號(hào)稀疏或可壓縮的先驗(yàn)和少量的全局線性測(cè)量可以獲得精確的信號(hào)重建,該理論被美國(guó)科技評(píng)論評(píng)為2007年度十大科技進(jìn)展。而一般的語音信號(hào)在DCT基下是可稀疏的[8-9],滿足壓縮感知理論要求,能夠?qū)崿F(xiàn)精確重構(gòu)。因此信號(hào)的稀疏表示必然包括信號(hào)的所有特征信息,因此使用稀疏表示作為信號(hào)特征在理論上可行,并且能夠減輕數(shù)據(jù)處理任務(wù)。
本文提出將CS理論中稀疏表示作為艦船噪聲信號(hào)的特征向量,然后使用支持向量機(jī)(SVM:Support Vector Machine)分類方法進(jìn)行分類識(shí)別,仿真結(jié)果表明該方法與傳統(tǒng)特征提取方法相比,不僅速度得到了大幅度的提高,而且有效提高了識(shí)別率。
壓縮感知理論指出,如果一個(gè)信號(hào)是稀疏的,或者在某個(gè)變換域內(nèi)是稀疏的,那么就可以使用一個(gè)與變換基不相關(guān)的觀測(cè)矩陣將稀疏的高維信號(hào)“壓縮”成低維信號(hào),并且如果稀疏滿足一定的條件,還可以通過“壓縮”之后的低維信號(hào)恢復(fù)成原信號(hào)[10-11]。
設(shè)空間R存在長(zhǎng)度為N的列向量x∈R,且信號(hào)中是K稀疏的,即信號(hào)中只有K個(gè)系數(shù)不為零或明顯大于其他系數(shù),且滿足K≤N。用矩陣表示:
y稱之為x的感知值,長(zhǎng)度為M(M<N)的列向量,稱之為測(cè)量自然數(shù),Φ為M×N的測(cè)量矩陣。
但是在實(shí)際當(dāng)中,這樣稀疏的信號(hào)并不常見,經(jīng)過研究發(fā)現(xiàn),如果一個(gè)信號(hào)在某種正交變換下是稀疏的,那它同樣也適用于壓縮感知理論,用矩陣表示:
其中Ψ′表示正交基變換(N×N),α為稀疏系數(shù),即信號(hào)x經(jīng)過正交變換之后是稀疏的。經(jīng)過大量的實(shí)驗(yàn)研究,得到一個(gè)更廣泛的結(jié)論,即如果一個(gè)信號(hào)在過完備字典下是稀疏的,則該信號(hào)同樣滿足壓縮感知理論,用矩陣表示:
D為冗余字典,α稱之為信號(hào)x在字典D下的稀疏表示。這個(gè)結(jié)論將使得非常多的信號(hào)都適用于壓縮感知理論。
大多數(shù)的信號(hào)本身是不稀疏的,而語音信號(hào)在離散余弦DCT(discrete cosine transform)域上有著近似稀疏性[8],DCT有很強(qiáng)的能量聚焦作用,艦船噪聲的高頻分量很小,根據(jù)實(shí)驗(yàn),發(fā)現(xiàn)艦船噪聲在DCT基下近似稀疏,將DCT系數(shù)取絕對(duì)值并排序得到系數(shù)分布,如圖1所示。
圖1 水聲信號(hào)DCT系數(shù)分布Fig.1 The signal DCT coefficient distribution
從圖1可以看出,水聲信號(hào)在DCT字典下是近似稀疏的。對(duì)于數(shù)字序列信號(hào)x(n),n=0,1,…,N-1,其DCT變換如式(4):
其中DN是大小為N×N的DCT變換矩陣,也就是DCT字典。
水聲信號(hào)在DCT字典下是近似稀疏的,為了能夠在DCT字典下嚴(yán)格稀疏,需要對(duì)DCT字典進(jìn)行稀疏訓(xùn)練。這里使用 K-SVD 算法[8-9]。K-SVD 算法模型:
化簡(jiǎn)得:
其中,Y= {yi|i∈ [1 ,M ],yi∈Rn}為需要進(jìn)行稀疏表示的信號(hào)集,X={xi}為稀疏系數(shù),K為稀疏度。得到稀疏化之后的字典D。K-SVD使用算法求解稀疏字典具體計(jì)算步驟如下:
1)字典為DCT字典。在信號(hào)集中隨機(jī)選取M個(gè)信號(hào)樣本組成初始信號(hào)集Y;
2)固定D,求解X,這是一個(gè)SR的實(shí)現(xiàn)過程,在K-SVD算法中,使用OMP算法實(shí)現(xiàn);
3)根據(jù)已經(jīng)求得的X,求解D,對(duì)Ek使用SVD分解,求解dk,依次更新D中所有的列。
4)循環(huán)步驟2),步驟3),重復(fù)迭代,得到稀疏化之后的冗余字典D。
根據(jù)以上算法得到稀疏化之后的冗余DCT字典,從而可以通過計(jì)算得到艦船噪聲信號(hào)在DCT冗余字典下進(jìn)行的稀疏表示。即求解式(5)中的α:
由于信號(hào)長(zhǎng)度是N,字典尺寸為M×N,M<N,因此該算法是個(gè)NP-h(huán)ard問題,常用的求解算法有基追蹤(BP)[12]、匹配追蹤法(MP)[13]和正交匹配追蹤法(OMP)[14]。結(jié)合 OMP的速度優(yōu)勢(shì),這里采用OMP算法,求解問題如式(9)所示:
其中D= {di|i=1,2,…,M },是已知的字典,X= [x1,x2,…,xN]是待求解系數(shù)信號(hào),OMP算法[14]是針對(duì)基于最小化l0范數(shù)問題而提出來的。
OMP算法步驟如下:
1)初始化殘差r0=y(tǒng),索引集Λ0為空集,t=1。
2)找出信號(hào)殘差rt和字典列dj內(nèi)積中最大值所對(duì)應(yīng)的下標(biāo)λ,即:
3)更新索引集Λt=Λt∪{λt},記錄找到的字典中的重建原子集合:
5)更新信號(hào)殘差
6)t=t+1,判斷是否滿足t>K,若滿足,則停止迭代,否則循環(huán)步驟二到步驟五。得到的Λ即為所求字典D,而α為所求稀疏表示系數(shù)。
經(jīng)過仿真實(shí)驗(yàn)發(fā)現(xiàn),稀疏字典的計(jì)算時(shí)間tdic與測(cè)量次數(shù)M成正比,如圖2所示。
從K-SVD計(jì)算算法當(dāng)中不難看出M的增長(zhǎng)計(jì)算的復(fù)雜度是近似線性增長(zhǎng)的。
圖2 測(cè)量次數(shù)M對(duì)tdic的影響Fig.2 The impact on tdicof measurements M
從壓縮感知理論體系中可知,如果一個(gè)信號(hào)在某個(gè)變換域是稀疏的,則信號(hào)的稀疏表示必然包含了原信號(hào)的大部分信息。所以不同類型的艦船噪聲信號(hào)的稀疏表示必然不一樣,因此可以將稀疏表示直接作為特征向量進(jìn)行分類。根據(jù)稀疏表示中的K個(gè)非0系數(shù)這個(gè)特點(diǎn),非常適合使用SVM分類器進(jìn)行分類。具體步驟如下:
1)生成樣本集:三類實(shí)際艦船噪聲信號(hào)A、B、C。按長(zhǎng)度 N 組成樣本集:XA、XB、XC。
2)設(shè)計(jì)DCT冗余字典:初始化DCT字典,尺寸為M×N,初始化的訓(xùn)練信號(hào)集為A、B、C三類樣本集中任選M個(gè)樣本數(shù)。由于本文著重分類,不對(duì)信號(hào)進(jìn)行重構(gòu),因此稀疏度K可任選,然后使用K-SVD算法進(jìn)行訓(xùn)練得到稀疏化的DCT冗余字典D。
3)求解稀疏系數(shù):使用OMP算法對(duì)XA、XB、XC三類樣本集中每個(gè)樣本求解系數(shù),得到系數(shù)集αA、αB、αC。
4)特征提取:對(duì)XA、XB、XC三類樣本中除去M個(gè)用于訓(xùn)練字典的樣本,然后進(jìn)行特征提取。使用文獻(xiàn)[4]中提到的方法,提取信號(hào)的EMD頻譜峰值,組成特征樣本集TA、TB、TC。
5)訓(xùn)練分類模型:在XA、XB、XC與αA、αB、αC各類樣本集中,隨機(jī)抽取P個(gè)樣本構(gòu)成訓(xùn)練集,進(jìn)行SVM訓(xùn)練,得到分類模型。
6)分類識(shí)別:在剩下的XA、XB、XC以及αA、αB、αC各樣本集中進(jìn)行分類識(shí)別。
對(duì)比實(shí)驗(yàn)結(jié)果,取M =40、64,N =1024,P=20,K取4~20;5),6)重復(fù)100次,實(shí)驗(yàn)結(jié)果如圖3所示。
由圖可知,隨著稀疏度K值的減小,平均識(shí)別率在增加,其原因在于特征數(shù)據(jù)越稀疏,對(duì)于SVM分類器的分類效果越好。當(dāng)足夠稀疏時(shí),識(shí)別率超過了使用EMD頻譜峰值作為特征的識(shí)別率。其中,當(dāng)K=4,M=64,N=1024的時(shí)候,各識(shí)別率如表1所示。
圖3 在不同特征下平均識(shí)別率比較Fig.3 Comparison of recognition rate in different feature
表1 分類識(shí)別率比較Tab.1 Comparison of classification rate
由表1可知,使用稀疏表示作為艦船噪聲信號(hào)分類作為特征,識(shí)別率較好于EMD特征提取方法。
使用EMD頻譜峰值作為特征進(jìn)行分類識(shí)別所需要的總時(shí)間t1,包括特征提取所需要的時(shí)間temd加上分類需要的時(shí)間tsvm1。如式(13)所示:
使用稀疏表示作為特征進(jìn)行分類識(shí)別所需要的總時(shí)間t1,包括稀疏字典求解時(shí)間tdic、特征提取所需要的時(shí)間tspr以及分類需要的時(shí)間tsvm2。由于本算法中使用了三類信號(hào),如式(14)所示:
其中公式(8)(9)中的x表示樣本數(shù)個(gè)數(shù),“3”表示三類信號(hào)需要各計(jì)算一個(gè)字典。經(jīng)過多次仿真實(shí)驗(yàn),在t1中,temd·x達(dá)到了t1的99% 以上。在t2中,當(dāng)x足夠小的時(shí)候,tdic·3遠(yuǎn)大于其他兩項(xiàng),隨著x的增大,占的比重越來越小。由于tsvm1、tsvm2相對(duì)于其他幾項(xiàng)可以忽略,因此在實(shí)驗(yàn)中未計(jì)入t1、t2。針對(duì)x對(duì)t1與t2之間影響仿真結(jié)果如圖4所示。
圖4 信號(hào)長(zhǎng)度與特征提取耗時(shí)倍數(shù)的關(guān)系Fig.4 The relationship between signal length and multiple consuming
由圖可知,使用稀疏表示作為特征的計(jì)算所用總時(shí)間增長(zhǎng)斜率Δt1要遠(yuǎn)遠(yuǎn)小于使用EMD頻譜峰值作為特征的計(jì)算所使用總時(shí)間增長(zhǎng)斜率Δt2。經(jīng)過仿真計(jì)算得到計(jì)算EMD頻譜峰值所需要的時(shí)間是計(jì)算稀疏表示的時(shí)間的20倍。如式(15)所示:
從以上仿真實(shí)驗(yàn)中,可以得出結(jié)論:使用稀疏表示作為信號(hào)特征可以大大縮短使用EMD頻譜峰值作為特征的計(jì)算時(shí)間。
本文提出了一種新型的水聲信號(hào)特征表征方法,即采用壓縮感知中的稀疏表示作為艦船噪聲的特征,以實(shí)現(xiàn)用小量的特征信號(hào)取代大量的原始數(shù)據(jù)信號(hào)。具體實(shí)現(xiàn)中采用K-SVD算法訓(xùn)練得到DCT冗余字典,在某種程度上包含了原信息的主要特征,并使用OMP算法對(duì)實(shí)際信號(hào)樣本進(jìn)行求解稀疏系數(shù)。本文通過使用SVM分類算法對(duì)使用稀疏表示的目標(biāo)特征集進(jìn)行分類識(shí)別,實(shí)現(xiàn)了大幅提高目標(biāo)識(shí)別速度的目的,在水聲信號(hào)分類中有非常重要的實(shí)際意義,實(shí)驗(yàn)仿真結(jié)果表明,在選取合適的參數(shù)時(shí),使用本文所提出的方法在分類識(shí)別率性能上優(yōu)于目前性能較好的特征分類器,具有非常高的實(shí)用價(jià)值。
[1]李新欣.船舶及鯨類聲信號(hào)特征提取和分類識(shí)別研究[D].哈爾濱:哈爾濱工程大學(xué),2012.
[2]史廣智,胡均川.基于小波包和1(1/2)維譜的艦船輻射噪聲頻域特征提取及融合[J].聲學(xué)技術(shù),2004,23(1):4-7.
[3]樊養(yǎng)余,陶寶祺.艦船噪聲的1(1/2)維譜特征提?。跩].聲學(xué)學(xué)報(bào),2002,27(1):71-76.
[4]劉深 ,張小薊,牛奕龍,等.基于IMF能量譜的水聲信號(hào)特征提取與分類研究 [J].計(jì)算機(jī)工程與應(yīng)用,2014(3):203-206.
[5]張小薊,張歆,孫進(jìn)才.基于經(jīng)驗(yàn)?zāi)B(tài)分解的目標(biāo)特征提取與選擇[J].西北工業(yè)大學(xué)學(xué)報(bào),2006,24(4):453-456.
[6]Donoho D L.Compressed sensing[J].IEEE Transactions on Information Theory,2006,52(4):1289-1306.
[7]DONOHO D.Compressed sensing[J].IEEE Trans.Information Theory,2006,52(4):1289-1306.
[8]孫林慧.語音壓縮感知關(guān)鍵技術(shù)研究[D].南京:南京郵電大學(xué),2012.
[9]戴瓊海,付長(zhǎng)軍,季向陽.壓縮感知研究[J].計(jì)算機(jī)學(xué)報(bào),2011,34(3):425-434.
[10]Candès E J.Compressive sampling[C]//Proceedings on the International Congress of Mathematicians.Madrid:IEEE,2006:1433-1452.
[11]Candès E J,Romberg J,Tao T.Robust uncertainty principles:Exact signal reconstruction from highly incomplete frequency information[J].Information Theory,IEEE Transactions on,2006,52(2):489-509.
[12]Chen S S,Donoho D L,Saunders M A.Atomic decomposition by basis pursuit[J].SIAM journal on scientific computing,1998,20(1):33-61.
[13]Needell D,Vershynin R.Greedy signal recovery and uncertainty principles[C]//Electronic Imaging 2008.International Society for Optics and Photonics.2008,68140J-68140J-12.
[14]Tropp J A,Gilbert A C.Signal recovery from random measurements via orthogonal matching pursuit[J].Information Theory,IEEE Transactions on,2007,53(12):4655-4666.