• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      低信噪比下語音端點(diǎn)檢測算法改進(jìn)設(shè)計(jì)

      2018-03-06 08:06:12謝俊儀
      關(guān)鍵詞:波包端點(diǎn)高階

      姜 囡 謝俊儀

      (中國刑事警察學(xué)院聲像資料檢驗(yàn)技術(shù)系 遼寧 沈陽 110035)

      1 引言

      近年來,隨著語音信號(hào)的端點(diǎn)檢測技術(shù)的發(fā)展成熟,常用的方法也多種多樣。小波分析(Wavelet Analysis,WA)在時(shí)域和頻域都能夠很好的表現(xiàn)信號(hào)的局部特征,且時(shí)頻分辨率是可變的,能夠滿足語音信號(hào)提取特征量的需求,但是在信號(hào)的高頻段分辨率較差,利用小波變換去噪的關(guān)鍵就是閾值的選取,閾值過小則重構(gòu)信號(hào)中仍有噪聲存在或信號(hào)中有效部分濾掉即信號(hào)失真[1-4]。小波包變換(Wavelet Packet Transform)突破了小波分析對信號(hào)頻帶劃分的局限性,不僅對低通子帶進(jìn)行分析,也對高通分量進(jìn)行分解,可以將頻帶進(jìn)行多層次的劃分,是一種更加精細(xì)的分析方法,但是在最優(yōu)層級的選取上存在困難[5-8]。高階累積量(Higherorder Cumulant)的一個(gè)重要特征是服從高斯分布信號(hào)的高階累積量恒等于零,而非高斯信號(hào)的高階累積量不為零,利用這一特點(diǎn)將非高斯的語音信號(hào)從高斯噪聲中提取出來,但在實(shí)際應(yīng)用中,也常會(huì)遇到非高斯的加性噪聲,僅靠高階累積量來提取語音信號(hào)會(huì)導(dǎo)致準(zhǔn)確率下降[9-12]。

      本文通過提出基于小波包和高階累積量的語音端點(diǎn)檢測技術(shù),幫助提高語音端點(diǎn)檢測的準(zhǔn)確率。改進(jìn)的算法通過結(jié)合小波包變換和高階累積量,避免了小波變換在時(shí)間和頻率方面對信號(hào)分析不全面以及高階累積量在復(fù)雜噪聲環(huán)境下只考慮高斯噪聲的局限性。實(shí)驗(yàn)表明基于小波包和高階積累的語音端點(diǎn)檢測技術(shù)更具有優(yōu)越性,在法庭科學(xué)實(shí)踐領(lǐng)域具有重要的意義[13]。

      2 基于小波變換的語音端點(diǎn)檢測

      小波變換(Wavelet Transform,WT)是一種時(shí)頻分析的數(shù)學(xué)方法,它能夠表征時(shí)間和頻率的局部變換,具有振幅正負(fù)相間的振蕩形式。小波變換在時(shí)間和頻率兩個(gè)方面都有很好的表達(dá)信號(hào)局部特征的能力。在語音信號(hào)的高頻部分有很好的時(shí)間分辨率,在語音信號(hào)的低頻部分則有很好的頻率分辨率,窗函數(shù)的寬度能隨著頻率的變化而變化。它能夠提供一個(gè)隨頻率改變的“時(shí)間-頻率”窗口,使用長寬大小不一的長方形時(shí)頻分析網(wǎng)格。適用于分析具有固定比例帶寬的非平穩(wěn)信號(hào),并能夠從原始信號(hào)中提取出有價(jià)值的部分信號(hào),是進(jìn)行信號(hào)時(shí)頻分析和處理的理想工具。綜合利用小波變換在時(shí)間和頻率上表達(dá)信息的特征,以及在語音信號(hào)中含有有用信息的信號(hào)與背景音信號(hào)的頻譜存在的顯著差異的特點(diǎn),來進(jìn)行語音信號(hào)的端點(diǎn)檢測。

      利用小波變換進(jìn)行語音端點(diǎn)檢測的基本流程如下:

      (1)將原始語音信號(hào)以一定的幀長進(jìn)行預(yù)處理,即分幀處理;

      (2)對分幀后的數(shù)據(jù)及端點(diǎn)檢測的門限值進(jìn)行小波變換處理;

      (3)計(jì)算小波變換后數(shù)據(jù)的均值和方差;

      (4)若某一幀的方差大于門限值,則說明在這一幀之后的語音信號(hào)中包含有效信息,那么這一幀即為起始幀,而在前面存在起始幀的情況下,若某一幀方差小于門限值則這一幀即為結(jié)束幀。

      小波變換在高頻段的頻率分辨率和低頻段的時(shí)間分辨率較差的缺點(diǎn),利用小波變換不能夠準(zhǔn)確、全面地進(jìn)行端點(diǎn)檢測。本文在小波變換的基礎(chǔ)上提出了小波包變換。小波包變換提高了信號(hào)的時(shí)頻分辨率,是一種更精細(xì)的信號(hào)分析方法。

      3 高階累積量理論在語音端點(diǎn)檢測中的應(yīng)用

      高階累積量是一種常用的高階統(tǒng)計(jì)量(Higher-order Statistics),主要應(yīng)用于信號(hào)處理和系統(tǒng)理論領(lǐng)域。

      設(shè){x(n)}為零均值k階平穩(wěn)隨機(jī)過程,則該過程的k階累積量ck,x(m1,m2,…,mk-1)定義為隨機(jī)變量{x(n),x(n+m1),…,x(n+mk-1)}的k階聯(lián)合累積量,即:

      由于{x(n)}是k階平穩(wěn)的,故{x(n)}的k階累積量僅僅是時(shí)延m1,m2,…,mk-1的函數(shù),而與時(shí)刻n無關(guān),其二階、三階和四階累積量分別為:

      可以看出,{x(n)}的二階累積量正好就是其自相關(guān)函數(shù),三階累積量也正好等于其三階矩。而對于{x(n)}的進(jìn)行歸一化處理后的峰度(Kurtosis)K為:

      高斯過程的高階累積量恒等于零,而非高斯信號(hào)的高階累積量不為零。也就是說含有加性高斯噪聲的非高斯信號(hào)的高階累積量理論上等于信號(hào)本身的累計(jì)量。因此,可以借助高階累積量抑制高斯噪聲,建立非高斯信號(hào)模型,從而將非高斯信號(hào)從高斯噪聲中提取出來。

      在實(shí)際語音信號(hào)檢測中,背景噪聲很復(fù)雜,高斯噪聲假設(shè)難以成立。在這種情況下,僅利用高階累積量進(jìn)行語音端點(diǎn)檢驗(yàn)不夠準(zhǔn)確。為了提高語音端點(diǎn)檢測的效率,提出了基于小波包和高階積累的語音端點(diǎn)檢測方法。

      4 基于小波包和高階累積量的語音端點(diǎn)檢測

      本文提出了一種基于小波包變換和高階累積量的檢測算法。該方法利用小波包的正交性和完備性,提高語音信號(hào)高頻段的分辨率;同時(shí)結(jié)合基于高階累積量的高斯判別準(zhǔn)則,用于在小波包域進(jìn)行高斯性檢驗(yàn),最終得到了語音端點(diǎn)的精確檢測。

      4.1 一維離散小波包變換

      小波包(Wavelet Packet)是由Coifman、Meyer、Quaker和Wickerhauser(1989)提出的,小波包分解是一種相對精細(xì)的分解方法,它不僅能分解信號(hào)的低頻部分,并且還能對高頻部分進(jìn)行分解。

      一維小波包分解公式:

      小波包對一維時(shí)間序列的分解特性[14]示意圖如下:

      圖1 小波包對時(shí)間序列的分解

      4.2 基于峰度的高斯判別準(zhǔn)則

      由于高斯性的判斷并不依賴于每個(gè)頻帶的信號(hào)能量大小,所以選擇峰度作為一個(gè)歸一化的四階統(tǒng)計(jì)量。理論上,判斷信號(hào)是否服從高斯分布就是讓信號(hào)的峰度值與0相比。如果等于0,就是高斯性噪聲,反之就是非高斯性噪聲。但由于在實(shí)際中存在誤差,信號(hào)的峰度是通過與一個(gè)置信區(qū)間進(jìn)行檢驗(yàn)的,如果峰度在這個(gè)區(qū)間了,則認(rèn)為信號(hào)是服從高斯性分布的高斯性噪聲,否則認(rèn)為非是高斯性的。這里采用了一種基于概率統(tǒng)計(jì)理論中經(jīng)典的切比雪夫不等式(Tchebychev Inequality)的高斯判別準(zhǔn)則。

      利用切比雪夫不等式,通過隨機(jī)變量X的期望和方差,對X的概率分布進(jìn)行估計(jì)。

      設(shè)隨機(jī)變量X有數(shù)學(xué)期望E(X),方差D(X),則對任意實(shí)數(shù)ε>0,切比雪夫不等式為:

      將式(15)代入式(14),可得:

      由此可得高斯判別準(zhǔn)則:

      4.3 基于小波包和高階累積量的語音端點(diǎn)檢測算法設(shè)計(jì)

      利用確定的高斯判別準(zhǔn)則對小波包分解系數(shù)進(jìn)行高斯性檢驗(yàn)。將原始語音信號(hào)進(jìn)行小波包分解,由于高階累積量是一種基于統(tǒng)計(jì)學(xué)的概念,在處理離散信號(hào)時(shí),采集的信號(hào)越長,統(tǒng)計(jì)的質(zhì)量也就越高,這里通過自下而上的合并準(zhǔn)則將相鄰的4個(gè)具有同一節(jié)點(diǎn)高斯性頻帶合并;合并后,利用基于高階累積量的高斯判別準(zhǔn)則計(jì)算新的系數(shù),并將高斯性系數(shù)剔除即置為零,同時(shí)將分解后最低頻帶上的小波包系數(shù)置為零。這樣去除噪聲之后保留非高斯性系數(shù)重建目標(biāo)。其中,頻帶合并準(zhǔn)則為:

      算法流程圖如下:

      圖2 基于小波包和高階累積量的語音端點(diǎn)檢測算法流程圖

      由圖2可以看出,改進(jìn)的算法是對小波包分解后所有頻帶分析高斯特性,并實(shí)施系數(shù)濾波的。其中,選擇小波包分解層數(shù)時(shí),可結(jié)合以下方法:選擇一段沒有信號(hào)的時(shí)段,分析噪聲在子空間上的小波包變換的峰度與偏差,若不滿足高斯分布要求則繼續(xù)分解,直到滿足高斯分布,并以該層數(shù)作為小波包分解層數(shù)。

      5 實(shí)驗(yàn)分析

      為了驗(yàn)證本文提出的語音端點(diǎn)檢測算法的可行性和有效性,在MATLAB環(huán)境下對算法進(jìn)行實(shí)驗(yàn)分析[15-16],實(shí)驗(yàn)的語音樣本來源為全國普通話水平考試指導(dǎo)用光盤中的語音材料,截取不同發(fā)音情況的30段語音。噪聲使用MATLAB生成的高斯白噪聲、隨機(jī)噪聲,以及 Noise - 92 數(shù)據(jù)庫中的 Pink 噪聲與語音信號(hào)疊加為不同的信噪比(-5、0、5、10、15 dB)的帶噪語音。分別以基于小波變換的語音端點(diǎn)檢測方法和基于小波包和高階累積量的語音端點(diǎn)檢測方法對語音進(jìn)行端點(diǎn)檢測。

      圖3分別給出了小波算法和本算法分別在信噪比為0dB的條件下,原始語音為“藍(lán)天、白云、碧綠的大?!钡募儍粽Z音分別疊加白噪聲和 Pink 噪聲后語音端點(diǎn)檢測的實(shí)驗(yàn)結(jié)果(實(shí)線代表語音起點(diǎn),虛線代表語音終點(diǎn))。從結(jié)果可以看出,在信噪比為0dB的惡劣條件下,基于小波包和高階累積量的語音端點(diǎn)檢測算法可以有效地檢測出每一段語音的起點(diǎn)和終點(diǎn),且在多種噪聲條件下都能有效地工作,具有一定的抗噪魯棒性。

      圖3 分別疊加不同噪聲的端點(diǎn)檢測結(jié)果

      由圖3可見,在信噪比極低的情況下,原始語音信號(hào)中幅度小的部分完全被噪聲覆蓋,尤其體現(xiàn)在一個(gè)語音段的起始和結(jié)束部分。小波變換方法很容易將處于這種狀態(tài)下的語音信號(hào)誤讀,或是連同噪聲部分一起被認(rèn)定為語音段,或是連同語音部分一起被認(rèn)定為噪聲段。且由于閾值選取上的困難,在小波變換中將噪聲段中幅度較小的部分也誤讀成語音段保留在重構(gòu)語音中,可見小波變換的結(jié)果受閾值影響較大,而小波包則改進(jìn)了這一方面的局限性。

      為了驗(yàn)證文中提出的基于小波包和高階累積量的語音端點(diǎn)檢測方法的有效性,將其與基于小波變換的語音端點(diǎn)檢測方法進(jìn)行比較,準(zhǔn)確率的計(jì)算公式[17]為:

      圖4和圖5分別為在信噪比為-5、0、5、10、15db時(shí),噪聲為白噪聲和pink噪聲的兩種算法的端點(diǎn)檢測的準(zhǔn)確率。

      由圖4、圖5和圖6可以清晰地看出本文算法的語音端點(diǎn)檢測準(zhǔn)確率高于傳統(tǒng)的小波算法,尤其是在復(fù)雜噪聲的干擾下,本文算法仍能夠較為準(zhǔn)確的進(jìn)行端點(diǎn)檢測。在白噪聲條件下,本文算法的準(zhǔn)確率遠(yuǎn)高于小波算法,尤其是在信噪比進(jìn)一步減低的情況下,小波算法的檢測效果下降明顯,體現(xiàn)出了高階累積量在抗白噪聲和隨機(jī)噪聲方面突出的準(zhǔn)確性。而在pink噪聲條件下,本文算法的高準(zhǔn)確率則充分說明了改進(jìn)的算法對不同噪聲在低信噪比的干擾下任然具有良好的準(zhǔn)確性和魯棒性。處理后得到的重構(gòu)語音信號(hào)在波形上更加清晰,包絡(luò)線更加明顯。

      圖4 白噪聲下兩種算法端點(diǎn)檢測準(zhǔn)確率

      圖5 隨機(jī)噪聲下兩種算法端點(diǎn)檢測準(zhǔn)確率

      圖6 pink噪聲下兩種算法端點(diǎn)檢測準(zhǔn)確率

      6 結(jié)論

      本文將小波包與高階累積量相結(jié)合,提出一種改進(jìn)的基于小波包和高階累積量的語音端點(diǎn)檢測方法,利用小波包對語音信號(hào)進(jìn)行分解,然后利用高階累量實(shí)現(xiàn)語音信號(hào)的端點(diǎn)檢測。實(shí)驗(yàn)結(jié)果表明,與基于小波變換的語音端點(diǎn)檢測方法相比,該方法能夠較準(zhǔn)確的檢測到語音的起始點(diǎn)和結(jié)束點(diǎn),具有更好的穩(wěn)定性。改進(jìn)的方法既結(jié)合了小波包能夠完全重構(gòu)信號(hào)、提高高頻段分辨率以及利用置信區(qū)間確定高階累積量的判別式準(zhǔn)則的優(yōu)點(diǎn),克服了小波變換只對低頻進(jìn)行遞歸分解、高頻分辨率低以及高階累積量方法只考慮高斯噪聲的缺點(diǎn),該方法具有更加優(yōu)越的端點(diǎn)檢測性能。

      [1]許開宇,等.基于小波分析的漢語語音識(shí)別[J].哈爾濱工程大學(xué)學(xué)報(bào),1996(4):20-26.

      [2]黎林,等.基于小波分析與神經(jīng)網(wǎng)絡(luò)的語音端點(diǎn)檢測研究[J].電子測量與儀器學(xué)報(bào),2013(6):528-534.

      [3]魯遠(yuǎn)耀,等.強(qiáng)噪聲環(huán)境下改進(jìn)的語音端點(diǎn)測算法[J].計(jì)算機(jī)應(yīng)用,2014(5):1386-1390.

      [4]張宇波,等.基于小波分析與PSO-ELM的語音端點(diǎn)檢測算法研究[J].中北大學(xué)學(xué)報(bào)(自然科學(xué)版),2016(1):33-38.

      [5]馮流寶.基于聽覺掩蔽效應(yīng)的小波包語音增強(qiáng)方法研究[J].通信技術(shù),2010(3):139-141.

      [6]王鐘斐,等.基于小波包的語音譜熵端點(diǎn)檢測方法研究[J].計(jì)算機(jī)與數(shù)字工程,2011(4):1-4.

      [7]Ben Messaoud M A, Bouzid A, Ellouze N. Speech enhancement based on wavelet packet of an improved principal component analysis[J]. Computer Speech & Language,2016,(C):58-72.

      [8]Islam M T, Shahnaz C, Zhu W P, et al. Rayleigh modeling of teager energy operated perceptual wavelet packet coefficients for enhancing noisy speech[J]. Speech Communication,2017,(C):64-74.

      [9]王桂琴,王墨林.用高階累積量提取高斯噪聲中信號(hào)的研究[J].數(shù)據(jù)采集與處理,1995(a01):24-27.

      [10]陶立,等.基于高階累積量參數(shù)的語音寂聲段和語音段檢測方法[J].語音、通信及信號(hào)處理,2007(4):209-211.

      [11]羅雅琴.基于獨(dú)立分量分析的語音識(shí)別系統(tǒng)[D].合肥:安徽大學(xué),2015:7-27.

      [12]羅雅琴,等.滑動(dòng)窗累積量的遞推估計(jì)算法及其在語音端點(diǎn)檢測中的應(yīng)用[J].聲學(xué)學(xué)報(bào),2015(5):730-738.

      [13]張翠玲.法庭說話人識(shí)別語音數(shù)據(jù)的構(gòu)建[J].中國刑警學(xué)院學(xué)報(bào),2016(4):61-64.

      [14]宋知用.MATLAB在語音信號(hào)分析與合成中的應(yīng)用[M].北京:北京航空航天大學(xué)出版社,2013:44-45.

      [15]張雪英.數(shù)字語音處理以及MATLAB仿真[M].北京:電子工業(yè)出版社,2010:22-73.

      [16]張賢達(dá).現(xiàn)代信號(hào)處理(第3版)[M].北京:清華大學(xué)出版社,2015:400-430.

      [17]王洋,等.基于時(shí)頻結(jié)合的帶噪語音端點(diǎn)檢測算法[J].黑龍江大學(xué)學(xué)報(bào)(自然科學(xué)版)2016(3):410-415.

      猜你喜歡
      波包端點(diǎn)高階
      非特征端點(diǎn)條件下PM函數(shù)的迭代根
      有限圖上高階Yamabe型方程的非平凡解
      高階各向異性Cahn-Hilliard-Navier-Stokes系統(tǒng)的弱解
      滾動(dòng)軸承壽命高階計(jì)算與應(yīng)用
      哈爾濱軸承(2020年1期)2020-11-03 09:16:02
      不等式求解過程中端點(diǎn)的確定
      基于小波包Tsallis熵和RVM的模擬電路故障診斷
      參數(shù)型Marcinkiewicz積分算子及其交換子的加權(quán)端點(diǎn)估計(jì)
      基于小波包變換的電力系統(tǒng)諧波分析
      基丁能雖匹配延拓法LMD端點(diǎn)效應(yīng)處理
      小波包理論與圖像小波包分解
      溧阳市| 屏山县| 溧阳市| 蛟河市| 丰县| 苗栗县| 九江市| 凌海市| 建始县| 永康市| 买车| 金山区| 祥云县| 黄陵县| 栖霞市| 汉阴县| 射阳县| 彭山县| 泸定县| 南陵县| 平塘县| 荔波县| 松溪县| 江北区| 民权县| 青州市| 沅江市| 抚顺县| 盖州市| 大理市| 南部县| 台南县| 井陉县| 淮南市| 高陵县| 治县。| 南宫市| 英吉沙县| 浠水县| 南靖县| 宁海县|