• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      一種視聽融合的水下目標(biāo)識別方法研究

      2015-10-13 17:39:15馬理想曾向陽
      聲學(xué)技術(shù) 2015年3期
      關(guān)鍵詞:響度小波共生

      馬理想,曾向陽

      ?

      一種視聽融合的水下目標(biāo)識別方法研究

      馬理想,曾向陽

      (西北工業(yè)大學(xué)航海學(xué)院,陜西西安710072)

      特征提取是水下目標(biāo)識別研究中最為關(guān)鍵的技術(shù)之一,特征參數(shù)的優(yōu)劣將直接決定分類識別系統(tǒng)的性能。將聲信號的聽覺與視覺感知特征結(jié)合,應(yīng)用于水下目標(biāo)識別,通過實(shí)驗得出如下結(jié)論,相比于單獨(dú)應(yīng)用聽覺特征,融合特征的平均識別率能提高4%~6%以上,特別是將聽覺特征與聲譜圖的Gabor小波變換特征、灰度-梯度共生特征進(jìn)行融合后,分類性能較好,平均達(dá)到87%以上。

      水下目標(biāo)識別;聽覺特征;可視化;圖像特征;特征選擇

      0 引言

      目標(biāo)識別是現(xiàn)代聲吶和水聲對抗的重要組成部分,而特征提取是目標(biāo)識別的關(guān)鍵。經(jīng)過多年的發(fā)展和積累,目前已提出了不少特征提取方法。早期提出的有時域波形結(jié)構(gòu)特征[1],主要參數(shù)有過零率、峰間幅值分布、波長差分布、波列面積等,該方法實(shí)現(xiàn)過程較為容易,但對一些復(fù)雜的水下噪聲信號的分類識別顯得無能為力。后來又發(fā)展了基于譜估計[2,3]的特征提取方法,包括經(jīng)典譜估計、現(xiàn)代譜估計、倒譜分析、DEMON譜、LOFAR譜分析等。功率譜和相關(guān)函數(shù)是二階統(tǒng)計特性,在隨機(jī)過程是正態(tài)分布時,它們能完全代表過程的特性。但實(shí)際的水聲信號或噪聲往往不是理想的高斯分布,用二階統(tǒng)計特性不能全面描述信號特性,只有高階統(tǒng)計特性(Higher-Order Statistics, HOS)才能更全面地反映非高斯信號的特性。

      傳統(tǒng)的傅里葉變換有時間積分作用,平滑了非平穩(wěn)隨機(jī)信號中的時變信息,因而其頻譜只能代表信號中各頻率分量的總強(qiáng)度。采用短時傅里葉變換 (Short-Time Fourier Transform, STFT)對時變信號逐段進(jìn)行分析,雖具有時頻局部化性質(zhì),但其時間分辨力和頻率分辨力是互相矛盾的,不能兼顧。而小波變換通過對原小波的平移和伸縮,能使基函數(shù)長度可變,因而可獲得不同的分辨力?;谄涓叻直媪Φ奶攸c(diǎn),可以提取多種小波特征[4]。

      近年來,隨著人們對人耳聽覺模型研究的深入及人工智能的迅速發(fā)展,基于人耳聽覺特性[5]的特征提取方法成為了研究的熱點(diǎn),由此得到的特征參數(shù)有:梅爾頻率倒譜系數(shù)(Mel Frequency Cepstrum Coefficient, MFCC)、感覺加權(quán)線性預(yù)測(Perceptual Linear Predictive, PLP)、響度、尖銳度、粗糙度以及波動強(qiáng)度等。此外,在對人耳聽覺模型進(jìn)行深入研究后,例如Gammatone基底膜模型、Meddis內(nèi)毛細(xì)胞模型,可以得到更多相關(guān)的聽覺特征參數(shù)。不過,由于人耳聽覺機(jī)理還是一個尚未完全破解的難題,這方面的研究還有很大的空間。

      本文有別于傳統(tǒng)的聲學(xué)特征提取方法,嘗試先將獲得的聲信號轉(zhuǎn)化為圖像,再提取圖像特征[6],然后將提取出的圖像特征與傳統(tǒng)的聽覺特征進(jìn)行融合,最后將融合后的特征用于水下目標(biāo)識別。由于圖像屬于二維信號,相比于一維時間序列可能包含更多的特征信息,且圖像特征提取與識別已有大量成功的應(yīng)用,這種視聽特征融合的方法有望獲得更好的識別性能。

      本文在對三類水下目標(biāo)(A:艦船;B:潛艇;C:UUV)聽覺特征和可視化特征進(jìn)行識別正確率分析的基礎(chǔ)上,最終選擇了識別率較高的三種聽覺特征,即16維響度特征、9維PLP特征和11維MFCC特征,分別與信號聲譜圖的5維Gabor小波特征以及15維的灰度梯度共生矩陣特征融合,比較各融合特征的識別正確率以及魯棒性。

      1 聽覺特征提取

      1.1 響度特征

      響度描述的是聲音的響亮程度,表示人耳對聲音的主觀感受。Zwicker計算方法[7]是經(jīng)典的響度計算方法。在計算響度時要考慮掩蔽效應(yīng),相關(guān)的一個重要物理量是臨界頻帶,單位:Bark。通常把20 Hz~16 kHz的頻率范圍劃分為24個臨界頻帶。頻率小于500 Hz時,臨界頻帶1 Bark帶寬約等于100 Hz;頻率大于500 Hz時,1 Bark帶寬為該臨界頻帶中心頻率的20%。轉(zhuǎn)換公式如下:

      式中:為臨界帶寬的中心頻率;為臨界頻帶的帶寬。

      1.2 PLP特征

      PLP特征參數(shù)是一種基于聽覺模型的特征參數(shù)。該特征參數(shù)是全極點(diǎn)模型預(yù)測多項式的一組系數(shù),等效于一種線性預(yù)測系數(shù)(Linear Prediction Coefficient, LPC)特征。不同之處是PLP技術(shù)將人耳聽覺實(shí)驗獲得的一些結(jié)論,通過近似計算的方法進(jìn)行了工程化處理,將輸入的語音信號經(jīng)聽覺模型處理后所得的信號替代傳統(tǒng)的LPC分析所用的時域信號。這樣處理后的語音頻譜考慮了人耳的聽覺特點(diǎn),因而有利于抗噪特征提取。

      1.3 MFCC特征參數(shù)

      與普通倒譜分析不同的是,MFCC分析與人耳的聽覺特征緊密聯(lián)系,這是因為人耳所聽到聲音的高低與聲音頻率并不呈線性正比關(guān)系,而用Mel頻率尺度則更符合人耳的聽覺特征。Mel頻率尺度的值大體上對應(yīng)于實(shí)際頻率的對數(shù)分布關(guān)系,兩者的具體關(guān)系可用式(2)表示:

      式中:f為頻率;臨界帶寬隨頻率的變化而變化,并與Mel頻率的增長一致,在1000 Hz以下大致呈線性分布,帶寬為100 Hz左右;在1000 Hz以上呈對數(shù)增長。圖1顯示了Mel頻率與線性頻率的關(guān)系。

      2 信號的可視化及可視化特征提取

      2.1 信號聲譜圖

      聲譜圖是一種重要的時頻圖,它反映了聲信號的動態(tài)頻譜特征,在語音信號中被視為可視語言。聲譜圖一般分為寬帶聲譜圖和窄帶聲譜圖,是一張有顏色或灰度變化的二維圖。圖2為某類水下目標(biāo)信號的聲譜圖。圖中橫坐標(biāo)表示時間,縱坐標(biāo)表示頻率,圖像中的灰度值代表某時刻對應(yīng)該頻率處的能量,此處為短時傅里葉變換幅度的平方。

      這種時頻分布圖經(jīng)過灰度處理后,可以利用圖像特征提取方法提取特征參數(shù)。

      2.2 信號的可視化特征

      2.2.1灰度-梯度共生矩陣特征

      基于灰度共生矩陣可以得到灰度-梯度共生矩陣[8],從中提取的特征參數(shù)對于邊界不清晰的圖像具有較好的分類效果[9]。灰度-梯度共生矩陣集中反映了圖像中像素的灰度和梯度的相互關(guān)系,各像素的灰度是構(gòu)成一幅圖像的基礎(chǔ),而梯度則是構(gòu)成圖像邊緣輪廓的要素?;叶?梯度空間可以清晰地表現(xiàn)圖像內(nèi)像素灰度與梯度的分布規(guī)律,同時也體現(xiàn)了各像素與其領(lǐng)域像素的空間關(guān)系,對圖像的紋理能很好地描繪。灰度-梯度共生矩陣紋理分析方法是利用圖像的灰度和梯度的綜合信息提取紋理特征。表1所示為幾種灰度-梯度特征的計算公式。

      表1 灰度-梯度共生矩陣的中部分參數(shù)的數(shù)字特征

      2.2.2 Gabor小波特征

      Gabor小波特征是根據(jù)模擬人類視覺系統(tǒng)而產(chǎn)生的。通過模擬人類視覺系統(tǒng),可以將視網(wǎng)膜成像分解成一組濾波圖像,每個分解的圖像能夠反映頻率和方向在局部范圍內(nèi)的強(qiáng)度變化。通過一組多通道Gabor濾波器,可以獲得紋理特征。

      由于小波變換在數(shù)字圖像中局部區(qū)域的頻率和方向信息提取方面有優(yōu)異的性能,因此,一些學(xué)者們將其用于圖像的紋理特征提取中,并且取得了非常滿意的效果。最為常用的做法就是對圖像進(jìn)行小波變換后,從小波子帶中提取平均值以及方差作為紋理特征。雖然小波分析取得了不錯的效果,然而與Gabor濾波器組相比而言,還存在不足。Gabor變換已被證明是在二維測不準(zhǔn)情況下,對信號空間域和頻率域的最有力描述。這些濾波器可以當(dāng)作方向和尺度都可變化的邊緣和直線的檢測,并且對一個給定區(qū)域中的這些微觀特征的統(tǒng)計,經(jīng)??梢杂脕肀硎炯y理信息的特征。其優(yōu)點(diǎn)在于,能夠很好地模擬哺乳動物視皮層簡單細(xì)胞的感受域,符合視覺生理特點(diǎn),能獲得頻域和空域的最佳聯(lián)合分辨率。

      3 實(shí)驗研究

      3.1 融合特征的實(shí)驗對比

      由所選取的聽覺和可視化特征自由組合可以得到六種融合特征,分別是響度(16維)-灰度梯度共生矩陣特征(15維)、響度(16維)-Gabor小波變換特征(5維)、PLP(9維)-灰度梯度共生矩陣特征(15維)、PLP(9維)-Gabor小波變換特征(5維)、MFCC(11維)-灰度梯度共生矩陣特征(15維)、MFCC(11維)-Gabor小波變換特征(5維)。

      針對A、B、C三類水下目標(biāo)輻射噪聲信號,分別選取100個訓(xùn)練樣本和100個測試樣本,即訓(xùn)練樣本數(shù)與測試樣本數(shù)之比為1:1。分類器為SVM算法。

      實(shí)驗結(jié)果見表2和圖3,表3則是在單聽覺特征情況下系統(tǒng)的識別正確率。

      圖3中系列1、2、3、4、5、6分別代表:MFCC-Gabor小波變換特征、MFCC-灰度梯度共生矩陣特征、PLP-Gabor小波變換特征、PLP-灰度梯度共生矩陣特征、響度-Gabor小波變換特征、響度-灰度梯度共生矩陣特征。

      表2 聽覺特征與聲譜圖可視化特征的融合特征的識別率(%)

      表3 單聽覺特征的識別率(%)

      由以上結(jié)果可以看出,融合特征的識別率基本都在85%以上,其識別率都較單聽覺特征時的識別率高,最高達(dá)到89%,相比于單聽覺特征的最高識別率83%,提高了6%。

      3.2 視聽融合特征的識別性能實(shí)驗研究

      由3.1節(jié)可知,對于融合特征,聽覺特征與可視化特征進(jìn)行融合所得的識別結(jié)果相對更好,其中表現(xiàn)最好的融合特征是PLP-Gabor小波變換特征、PLP-灰度梯度共生矩陣特征和響度-灰度梯度共生矩陣特征。為進(jìn)一步檢驗這三組融合特征的穩(wěn)健性和抗噪性,以下進(jìn)一步開展實(shí)驗研究。

      (1) 訓(xùn)練-測試樣本比對識別結(jié)果的影響

      3.1節(jié)中介紹的融合特征測試時,使用的訓(xùn)練和測試樣本比為1:1,這里再分別對測試樣本和訓(xùn)練樣本為1:2和2:1時進(jìn)行測試。實(shí)驗結(jié)果見表4。

      由表4可知,PLP-Gabor小波變換特征和響度-灰度梯度共生矩陣特征在訓(xùn)練和測試樣本變化的情況下,識別率變化相對較小,說明這兩類特征的魯棒性較好。

      表4 不同訓(xùn)練測試比下融合特征的的識別正確率(%)

      (2) 融合特征的抗噪性能實(shí)驗

      將測試信號分別加上高斯白噪聲,得到信噪比分別為-10、-5、0、5、10 dB的信號,利用測試實(shí)驗得出PLP-Gabor小波變換特征、PLP-灰度梯度共生矩陣特征和響度-灰度梯度共生矩陣特征的分類正確率,結(jié)果見表5,對應(yīng)的曲線如圖4所示。圖4中,1、2、3分別代表PLP-Gabor小波變換特征PLP-灰度梯度共生矩陣特征、響度-灰度梯度共生矩陣特征。

      表5 不同信噪比情況下融合特征的識別正確率(%)

      從圖4可以看出,對各種特征而言,總體呈現(xiàn)出隨信噪比的增加識別率也逐漸增加的趨勢。其中,PLP-Gabor小波變換特征抗噪能力相對更優(yōu)。綜合以上兩方面可以認(rèn)為,PLP-Gabor小波變換特征在視聽融合特征中具有相對更好的識別性能。

      4 結(jié)語

      通過本文的實(shí)驗結(jié)果可以看出,水下目標(biāo)輻射噪聲信號聽覺特征和可視化特征的融合能夠有效地提高目標(biāo)信號的正確識別率。下一步還將深入探討聲學(xué)特征與可視化特征之間的內(nèi)在聯(lián)系,這有助于尋找更加有效的視聽特征。

      [1] 蔡悅斌, 張明之, 史習(xí)智, 等. 艦船噪聲波形結(jié)構(gòu)特征提取及分類研究[J]. 電子學(xué)報, 1999, 27(6): 129-131.

      CAI Yuebing, ZHANG Mingzhi, SHI Xizhi, et al. The feature extraction and classification of ocean acoustin signals baned on wave stucture[J]. Acta Electronica sinica, 1999, 27(6): 129-131.

      [2] 余秋星. 水下目標(biāo)識別的相關(guān)技術(shù)研究[D]. 西安: 西北工業(yè)大學(xué)博士學(xué)位論文, 2004.

      YU Qiuxing. Research on underwater target recognition[D]. Xi’an: Northwestern Polytechnical University dissertation, 2004.

      [3] 余秋星, 李志舜. 艦船輻射噪聲的特征提取方法[J]. 魚雷技術(shù), 2002, 10(6): 23-25.

      YU Qiuxing, LI Zhishun. Characteristics extraction method of ship radiative noise[J]. Torpedo technology, 2002, 10(6): 23-25.

      [4] 章新華. 基于小波變換的艦船輻射噪聲信號特征提取[J]. 聲學(xué)學(xué)報, 1997, 22(2): 139-144.

      ZHANG Xinhua. Feature extraction of ship radiated noises based on wavelet tansform[J]. Acta Acustica, 1997, 22(2): 139-144.

      [5] 王娜. 基于人耳主觀反應(yīng)的聽覺特征量及其在目標(biāo)識別中的應(yīng)用[D]. 西安: 西北業(yè)大學(xué)碩士學(xué)位論文, 2009.

      WANG Na. A feature extraction approach based on auditory properties and psychoacoustic model and its application in targets recognition[D]. Xi’an: Northwestern Polytechnical University dissertation, 2009.

      [6] 何佳若, 曾向陽. 聲信號的可視化特征提取方法[J]. 電聲技術(shù), 2011, 35(7): 61-64.

      HE Jiaruo, ZENG Xiangyang. Method of extracting visualized features for sound signals[J]. Audio Engineering, 2011, 35(7): 61-64.

      [7] Zwicker E, Fastl H. Psychoacoustics facts and models[M]. Spring Verlag Berlin Heidelberg, 1999.

      [8] 洪繼光. 灰度-梯度共生矩陣紋理分析方法[J]. 自動化學(xué)報, 1984, 10(1): 15-18.

      HONG Jiguang. Gray level-gradient cooccurrence matrix texture analysis method[J]. Acta automatica sinica, 1984, 10(1): 15-18.

      [9] ZENG Xiangyang, HE Jiaruo, MA Lixiang. Image representation of acoustic features for the automatic recognition of underwater noise targets[C]// GCIS, 2012.

      Study of underwater targets recognition based on audiovisual feature integration

      MA Li-xiang, ZENG Xiang-yang

      (,,710072,,)

      Feature extraction is one of the most important techniques of underwater targets recognition. Feature parameters directly determine the performances of classification systems. In this paper, a joint method which combines the auditory and visualized feature extraction methods is proposed and applied to underwater target recognition after feature selection and fusion. Experimental resultsshow that fusion features achieve a better performance than a single audio feature, and the enhancement of recognition rate is 4%~6%, and that the fusion of audio feature with gray gradient co-occurrence matrix and Gabor small wave exchange feature can obtain an even better performance and the recognition rate is over 87%.

      underwater targets recognition; auditory feature; visualization; image feature; feature selection

      TB561

      A

      1000-3630(2015)-03-0209-05

      10.3969/j.issn1000-3630.2015.03.004

      2014-02-11;

      2014-03-20

      國家自然科學(xué)基金(11374241)、陜西省自然科學(xué)基金(2012JM1010)資助項目。

      馬理想(1992-), 男, 安徽阜陽人, 碩士, 研究方向為聲信號處理。

      馬理想, E-mail: malixiang1234@163.com

      猜你喜歡
      響度小波共生
      構(gòu)造Daubechies小波的一些注記
      人與熊貓 和諧共生
      共生
      基于MATLAB的小波降噪研究
      電子制作(2019年13期)2020-01-14 03:15:32
      優(yōu)生共生圈培養(yǎng)模式探索
      優(yōu)生共生圈培養(yǎng)模式探索
      響度在節(jié)目制作和播出中的應(yīng)用
      基于改進(jìn)的G-SVS LMS 與冗余提升小波的滾動軸承故障診斷
      數(shù)字時代中節(jié)目響度平衡淺析
      新聞傳播(2016年3期)2016-07-12 12:55:36
      臺內(nèi)音頻響度控制方式
      登封市| 台南市| 崇仁县| 西乌珠穆沁旗| 普宁市| 梁河县| 庆阳市| 沛县| 景泰县| 合肥市| 江都市| 措勤县| 光山县| 昆山市| 锡林浩特市| 塘沽区| 厦门市| 吉木萨尔县| 攀枝花市| 汝城县| 志丹县| 绍兴市| 盐亭县| 永和县| 连平县| 塔河县| 仁布县| 金华市| 扎囊县| 边坝县| 梓潼县| 沛县| 泾阳县| 洞头县| 南安市| 石城县| 友谊县| 昭通市| 宁明县| 宁波市| 涞源县|