• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于改進(jìn)小波變換的語(yǔ)音基音周期檢測(cè)

      2017-06-23 13:27:25吳興銓周金治
      自動(dòng)化儀表 2017年6期
      關(guān)鍵詞:基音四階小波

      吳興銓,周金治

      (1.西南科技大學(xué)信息工程學(xué)院,四川 綿陽(yáng) 621010;2.西南科技大學(xué)特殊環(huán)境機(jī)器人技術(shù)四川省重點(diǎn)實(shí)驗(yàn)室,四川 綿陽(yáng) 621010)

      基于改進(jìn)小波變換的語(yǔ)音基音周期檢測(cè)

      吳興銓1,2,周金治1,2

      (1.西南科技大學(xué)信息工程學(xué)院,四川 綿陽(yáng) 621010;2.西南科技大學(xué)特殊環(huán)境機(jī)器人技術(shù)四川省重點(diǎn)實(shí)驗(yàn)室,四川 綿陽(yáng) 621010)

      基音在許多方面都有比較廣泛的應(yīng)用,比如語(yǔ)音編碼、語(yǔ)音識(shí)別、語(yǔ)音轉(zhuǎn)換、音樂(lè)檢索以及發(fā)聲系統(tǒng)疾病診斷等。針對(duì)目前很多小波變換方法在測(cè)量基音周期時(shí)存在的準(zhǔn)確度低、復(fù)雜度高、魯棒性差等缺點(diǎn),以及在帶噪語(yǔ)音環(huán)境下,特別是在非平穩(wěn)噪聲下比較難判斷語(yǔ)音基音周期的問(wèn)題,提出了一種基于改進(jìn)小波變換的語(yǔ)音基音檢測(cè)方法。首先將每幀帶噪信號(hào)進(jìn)行預(yù)處理,提取出有話段的信息,消除直流分量;然后在加窗分幀后先進(jìn)行端點(diǎn)檢測(cè),濾波后再分幀;接著再利用小波分解后取低頻系數(shù)重構(gòu)信號(hào);最后結(jié)合四階累積法對(duì)重構(gòu)信號(hào)進(jìn)行基音檢測(cè)。試驗(yàn)結(jié)果表明,該方法在不同帶噪語(yǔ)音環(huán)境下和低信噪比條件下,提高了帶噪語(yǔ)音基音檢測(cè)的準(zhǔn)確性。與傳統(tǒng)的小波變換法相比,該方法魯棒性好且計(jì)算復(fù)雜度低,有利于語(yǔ)音基音周期檢測(cè)。

      帶噪語(yǔ)音; 基音檢測(cè); 小波變換; 重構(gòu)信號(hào); 三電平中心削波; 端點(diǎn)檢測(cè); 信噪比

      0 引言

      基音是語(yǔ)音信號(hào)的重要參數(shù),語(yǔ)音信號(hào)中的音高由基音頻率[1]得到?;魪V泛應(yīng)用于各個(gè)領(lǐng)域,如語(yǔ)音編碼、語(yǔ)音識(shí)別、語(yǔ)音轉(zhuǎn)換、音樂(lè)檢索以及發(fā)聲系統(tǒng)疾病診斷等[2]。近年來(lái),基音檢測(cè)方法層出不窮,其中具有代表性的方法有自相關(guān)函數(shù)法、平均幅度差函數(shù)法、陰陽(yáng)估計(jì)法、基于濾波器的算法、倒譜分析法、多分辨率法和離散小波變換法[3]等。因?yàn)檎Z(yǔ)音信號(hào)是一個(gè)非平穩(wěn)、非準(zhǔn)周期的信號(hào),會(huì)受到聲道共振峰的影響,所以到目前為止,基音檢測(cè)的準(zhǔn)確性仍較受關(guān)注。上述所列的方法雖然在處理基音檢測(cè)上有一定的可行性,但在穩(wěn)定白噪聲的環(huán)境下信噪比(signal noise ratio,SNR)會(huì)下降到0 dB,基音檢測(cè)的準(zhǔn)確率不高,僅采用小波變換的基音檢測(cè)準(zhǔn)確率能達(dá)到80%[4]。

      宋子榮等提出的小波算法[5-6]能很好地適應(yīng)語(yǔ)音信號(hào)的時(shí)變特性,計(jì)算復(fù)雜度也適中。但小波算法也有不足:它比較容易受到噪聲和共振峰的影響,在基音檢測(cè)的計(jì)算上產(chǎn)生偏差。文獻(xiàn)[7]采用改進(jìn)的小波轉(zhuǎn)換,該方法削弱了噪聲、降低了計(jì)算復(fù)雜度,但是計(jì)算準(zhǔn)確率不高。本文提出了一種改進(jìn)的語(yǔ)音基音周期檢測(cè)的方法,在低信噪比環(huán)境下不僅能大大提高基音檢測(cè)的準(zhǔn)確性,還能提高其魯棒性。

      1 小波變換原理

      小波變換主要包含兩個(gè)部分:連續(xù)小波變換(continuous wavelet transform,CWT)和離散小波變換(discrete wavelet transform,DWT)。CWT主要用于理論分析,通過(guò)伸縮和平移參數(shù)連續(xù)取值,而計(jì)算機(jī)和工程化角度的處理實(shí)現(xiàn)往往采用DWT[8]。

      1.1 連續(xù)型小波變換

      在連續(xù)小波變換[9]中,平方可積分函數(shù)s(t)的連續(xù)小波變換定義為:

      (1)

      式中:s(t)為原始信號(hào);<*,*>為內(nèi)積;a>0為尺度因子;b>0為平移因子;Ws()為信號(hào)s(t)的傅里葉變換;Ψa,b(t)為小波變換基函數(shù)Ψ(t)的尺度伸縮a和時(shí)間平移b所產(chǎn)生的一族解析函數(shù)的結(jié)果,常數(shù)a和b分別為尺度參數(shù)和平移參數(shù)。Ψa,b(t)中尺度參數(shù)a的伸縮和平移參數(shù)b的平移為連續(xù)取值的小波變換稱為連續(xù)小波變換。

      1.2 離散型小波變換

      (2)

      式中:當(dāng)a=2、b=1時(shí),離散小波變換稱為二進(jìn)制離散小波變換[10]。

      2 改進(jìn)的小波變換基音檢測(cè)

      在非平穩(wěn)、非線性的語(yǔ)音信號(hào)中,噪聲的能量明顯低于語(yǔ)音段的能量[11]。在實(shí)際應(yīng)用中,經(jīng)常會(huì)有一些強(qiáng)噪聲的干擾,比如火車、汽車?guó)Q笛、移動(dòng)通信環(huán)境、機(jī)械環(huán)境等。低SNR下的基音檢測(cè)是語(yǔ)音研究中的難點(diǎn),傳統(tǒng)的方法都存在一些不足:基于子帶能量、周期度量的方法只適用于某些噪聲環(huán)境;基于熵的方法對(duì)多路的串?dāng)_噪聲效果不好;基于特征濾波的方法不僅會(huì)增大計(jì)算量,而且會(huì)改變語(yǔ)音語(yǔ)譜結(jié)構(gòu)、丟失原數(shù)據(jù)的部分信息[12]。所以從計(jì)算量,以及在不同特征情況下得分組合權(quán)重參數(shù)的魯棒性考慮,以上方法都無(wú)法從根本上解決噪聲環(huán)境下的基音檢測(cè)問(wèn)題。

      信號(hào)處理中常假設(shè)信號(hào)或噪聲服從高斯分布,即在常規(guī)的信號(hào)處理中,用二階積累量表示隨機(jī)信號(hào)的統(tǒng)計(jì)特性與關(guān)系。任何類型高斯信號(hào)的三階以上高階累積量均為0。高階累積量的這種特性可用于抑制噪聲,所以使用高階累積量作為分析工具,對(duì)抑制噪聲有較好效果[13]。本文在采用小波分解后取低頻系數(shù)重構(gòu)信號(hào),結(jié)合四階累積法對(duì)重構(gòu)信號(hào)進(jìn)行基音檢測(cè)。

      累積量是語(yǔ)音信號(hào)中一種比較重要的統(tǒng)計(jì)特征。現(xiàn)有均值為0的復(fù)平穩(wěn)隨機(jī)語(yǔ)音信號(hào){X(n)},n=0,±1,…,±∞,其二階累積量為:

      C2,x(τ)=E{x(n)x*(x+τ)}

      (3)

      三階累積量為:

      C3,x(τ1,τ2)=E{x(n)x(n+τ1)x*(n+τ2)}

      (4)

      四階積累量為:

      C4,x(τ1,τ2,τ3)=E{x(n)x(n+τ1)x*(n+τ2)x*(n+τ3)}-E{x(n)x(n+τ1)}E{x*(n+τ2)x*(n+τ3)}-E{x(n)x*(n+τ2)}E{x(n+τ1)x*(n+τ3)}-E{x(n)x*(n+τ3)}E{x(n+τ1)}x*(n+τ2)}

      (5)

      由上式可得:任何類型的高斯語(yǔ)音信號(hào),其三階以上的高階累積量均為0。

      假設(shè)語(yǔ)音信號(hào)為s(t),高斯噪聲為n(t),則帶噪語(yǔ)音信號(hào)表示為:

      x(t)=ps(t)+qn(t)

      (6)

      式中:p和q為增益系數(shù)。檢測(cè)二元語(yǔ)音基音時(shí),若采用傳統(tǒng)的基音檢查方法,則能明顯觀察到,當(dāng)SNR下降時(shí),檢測(cè)的準(zhǔn)確性急劇下降。為了實(shí)現(xiàn)即使在SNR很小時(shí),也可以得到較好的檢測(cè)結(jié)果,需要計(jì)算語(yǔ)音信號(hào)四階積累量。在前文所述的高階累積量中可以得出x(t)的四階累積量。因?yàn)槿魏晤愋偷母咚剐盘?hào)其三階以上的高階積累量均為0,所以可以將計(jì)算語(yǔ)音信號(hào)四階積累量的問(wèn)題轉(zhuǎn)換成計(jì)算帶噪語(yǔ)音信號(hào)四階積累量的問(wèn)題。本文采用小波分解后取低頻系數(shù)重構(gòu)信號(hào)結(jié)合四階累積法,對(duì)重構(gòu)信號(hào)進(jìn)行基音檢測(cè),一方面提高了基音檢測(cè)的準(zhǔn)確性,另一方面也控制了計(jì)算量,且不改變語(yǔ)音譜結(jié)構(gòu),保存了完整的語(yǔ)音信息。

      在計(jì)算帶噪語(yǔ)音信號(hào)的時(shí)候,運(yùn)算量非常大,其根本原因就是計(jì)算機(jī)進(jìn)行的乘法運(yùn)算非常耗時(shí)。因此,可以采用三電平中心消波的方法對(duì)中心消波函數(shù)進(jìn)行修正。使用三電平中心消波后,可以有效避免錯(cuò)判為倍頻或分頻的情況。將語(yǔ)音信號(hào)通過(guò)三電平中心削波器削波。三電平中心削波函數(shù)如圖1所示。

      圖1 三電平中心削波函數(shù)

      由圖1可知,其輸出函數(shù)為:

      (7)

      根據(jù)式(6)可知,輸出為x(t)。式(5)則說(shuō)明了四階積累量的值,基于四階積累量的基音檢測(cè)推導(dǎo)出所用的自相關(guān)函數(shù)為:

      (8)

      式中:N為窗長(zhǎng)度。求得R的峰值位置后,將這些峰值的門限進(jìn)行比較,相鄰峰值的時(shí)間差就是基音周期。

      經(jīng)試驗(yàn),在低SNR環(huán)境下,自相關(guān)法根本無(wú)法進(jìn)行基音檢測(cè),得到的結(jié)果也是錯(cuò)誤的,而用高階累積量則可以準(zhǔn)確、可靠地檢測(cè)基音周期。本文就是利用小波分解后取低頻系數(shù)重構(gòu)信號(hào)[14],結(jié)合四階累積法對(duì)重構(gòu)信號(hào)進(jìn)行基音檢測(cè)。該方法的準(zhǔn)確性優(yōu)于帶噪信號(hào)下傳統(tǒng)基音檢測(cè)的方法,解決了在低SNR環(huán)境下無(wú)法得到準(zhǔn)確信號(hào)的問(wèn)題。試驗(yàn)表明,該方法無(wú)論在低信噪比,還是在噪聲分布不均勻的條件下,對(duì)基音周期都具有良好的檢測(cè)效果,且不會(huì)出現(xiàn)試驗(yàn)數(shù)據(jù)準(zhǔn)確率驟然下降的現(xiàn)象,顯示了非常好的魯棒性。

      假設(shè)帶噪語(yǔ)音信號(hào)為x(t),基音檢測(cè)的步驟如下。

      ①對(duì)每幀帶噪信號(hào)進(jìn)行預(yù)處理,提取出有話段的信息,得出語(yǔ)音段[15]。

      ②消除直流分量,設(shè)置信噪比,疊加噪聲;用所提取的有話段的信息作DWT小波變換,用低頻系數(shù)重構(gòu)信號(hào)。引入Cum表示累積量運(yùn)算,則若有λi(i=1,2,…,k)、xi(i=1,2,…,k)為隨機(jī)變量,推導(dǎo)出:

      (9)

      由前一節(jié)可知,s(t)與n(t)獨(dú)立,由式(9)可以得到x(t)的四階累積量:

      Cum[x(k+ξ1)x(k+ξ2)x(k+ξ3)x(k+ξ4)]=a4×Cum[x(k+ξ1)x(k+ξ2)x(k+ξ3)x(k+ξ4)]+b4×Cum[k+ξ1)x(k+9ξ2)x(k+ξ3)x(k+ξ4)]

      (10)

      ③對(duì)判斷出的語(yǔ)音段進(jìn)行基音檢測(cè)。根據(jù)得到的基音周期圖判斷算法的準(zhǔn)確性和魯棒性。

      3 試驗(yàn)結(jié)果與分析

      3.1 試驗(yàn)環(huán)境

      為了檢測(cè)本文方法的可行性和有效性,選擇深夜或相對(duì)比較安靜環(huán)境,在試驗(yàn)室錄制內(nèi)容為“西科大”的一小段語(yǔ)音作為目標(biāo)語(yǔ)音信號(hào)。設(shè)定錄制的采樣頻率為8 kHz,采樣精度為 32 bit;目標(biāo)語(yǔ)音信號(hào)幀長(zhǎng)為 316 ms,幀移為158 ms;采用標(biāo)準(zhǔn)噪聲庫(kù)NOISEX-92中的高斯白噪聲、babble以及 factory作為復(fù)雜干擾噪聲[4]。

      3.2 結(jié)果分析

      對(duì)原始語(yǔ)音波形圖加入信噪比SNR=-10 dB的高斯白噪聲后,對(duì)該加入噪聲的語(yǔ)音信號(hào)進(jìn)行預(yù)處理,提取有話段的信息,得出語(yǔ)音段,消除直流分量,在加窗分幀后先進(jìn)行端點(diǎn)檢測(cè),濾波后再分幀,小波分解后取低頻系數(shù)重構(gòu)信號(hào)。原始信號(hào)、加噪語(yǔ)音信號(hào)和重構(gòu)語(yǔ)音信號(hào)波形圖如圖2所示。

      圖2 原始信號(hào)、加噪語(yǔ)音信號(hào)和重構(gòu)語(yǔ)音信號(hào)波形圖

      令SNR=-5 dB,用四階累積法對(duì)重構(gòu)信號(hào)進(jìn)行基音檢測(cè),其結(jié)果如圖3所示。

      圖3 基音檢測(cè)結(jié)果(SNR=-5 dB)

      為了更好地驗(yàn)證算法的準(zhǔn)確性,也為了進(jìn)一步驗(yàn)證本文方法在低信噪比環(huán)境下的檢測(cè)效果,圖4為采用本文方法、在SNR=-20 dB時(shí)的基音檢測(cè)結(jié)果。

      圖4 基音檢測(cè)結(jié)果(SNR=-20 dB)

      由圖4可以看出,采用本文方法對(duì)小波變換進(jìn)行改進(jìn),大大提高了低信噪比下基音檢測(cè)的準(zhǔn)確性和魯棒性。

      本文通過(guò)大量的樣本訓(xùn)練得出訓(xùn)練結(jié)果,并與文獻(xiàn)[2]中數(shù)據(jù)結(jié)果相比,列出了各種噪聲下的準(zhǔn)確率結(jié)果。表1記錄了采用小波-自相關(guān)函數(shù)加權(quán)平均幅度差函數(shù)的方法和本文方法在不同噪聲環(huán)境下的準(zhǔn)確率。

      表1 不同信噪比下的基音檢測(cè)準(zhǔn)確率

      由表1可知,與文獻(xiàn)[2]方法相比,本文方法的基音檢測(cè)準(zhǔn)確率提高了20%以上。本文方法在低信噪比環(huán)境下,大大提高了基音檢測(cè)準(zhǔn)確性及其魯棒性。

      4 結(jié)束語(yǔ)

      基音檢測(cè)對(duì)語(yǔ)音信號(hào)的后期處理具有至關(guān)重要的作用,準(zhǔn)確檢測(cè)語(yǔ)音信號(hào)的基音周期對(duì)高質(zhì)量的語(yǔ)音分析與合成、語(yǔ)音壓縮編碼、語(yǔ)音識(shí)別與說(shuō)話人確認(rèn)等具有重要意義[16]。本文提出了一種小波分解后取低頻系數(shù)重構(gòu)信號(hào),結(jié)合四階累積法對(duì)重構(gòu)信號(hào)進(jìn)行基音檢測(cè)的方法。試驗(yàn)表明,該方法的基音檢測(cè)準(zhǔn)確率明顯高于目前已有的一些方法,并且在加入高斯白噪聲、低信噪比的情況下,也能得到比較精確的基音周期,提高了整個(gè)系統(tǒng)的魯棒性。

      [1] 唐振民,曹建紅.基于哼唱的音樂(lè)檢索技術(shù)研究[D].南京:南京理工大學(xué),2009.

      [2] 王民,曹繪,要趁紅.一種改進(jìn)的小波變換基音檢測(cè)算法[J].重慶郵電大學(xué)學(xué)報(bào)(自然科學(xué)版),2012,24(3):283-287.

      [3] 張杰,龍子夜,張博,等.語(yǔ)音信號(hào)處理中基頻提取算法綜述[J].電子科技大學(xué)學(xué)報(bào),2010(S1):99-102.

      [4] 章小兵,李燕萍,王雙杰.基于改進(jìn)HHT的語(yǔ)音端點(diǎn)檢測(cè)[J].計(jì)算機(jī)工程,2016(6):171-174.

      [5] HU J L,XU S,CHEN J.A modified pitch detection algorithm[J].IEEE Communications Letters,2001,5(2):64-66.

      [6] 宋子容,袁春,溫啟榮.小波分析法對(duì)多帶激勵(lì)聲碼器基音提取的改進(jìn)[J].重慶郵電學(xué)院學(xué)報(bào),1997(2):33-37.

      [7] 李坤,劉加.基于小波變換和線性預(yù)測(cè)的基音提取[J].計(jì)算機(jī)工程,2010(10):276-278.

      [8] 胡航.現(xiàn)代語(yǔ)音信號(hào)處理[M].北京:電子工業(yè)出版社,2014.

      [9] 張賢達(dá).現(xiàn)代信號(hào)處理[M].北京:清華大學(xué)出版社,2002.

      [10]熱依木汗·熱西提,吐?tīng)柡榻ぐ⒉级伎肆δ?馮惠,等.基于二進(jìn)小波變換的語(yǔ)音基音檢測(cè)[J].科技展望,2016(11):111-112.

      [11]GUO Y M,FU Q,YAN Y H.Speech endpoint detection in real noise environments[J].Chinese Journal of Acoustics,2007,26(1):39-48.

      [12]孫海英.基于倒譜特征和濁音特性的語(yǔ)音端點(diǎn)檢測(cè)方法的研究[D].青島:青島科技大學(xué),2008.

      [13]金晶.短波通信系統(tǒng)中8PSK調(diào)制方式識(shí)別技術(shù)的研究[D].西安:西安電子科技大學(xué),2012.

      [14]史振江,安建龍,趙玉菊.基于MATLAB的小波消噪仿真實(shí)現(xiàn)[J].石家莊鐵路職業(yè)技術(shù)學(xué)院學(xué)報(bào),2008(1):63-66.

      [15]陳煒杰.噪聲環(huán)境下的說(shuō)話人識(shí)別技術(shù)研究[D].杭州:浙江工業(yè)大學(xué),2008.

      [16]張少龍,吳佳鑫.語(yǔ)音信息的內(nèi)容分析技術(shù)研究綜述[J].現(xiàn)代圖書(shū)情報(bào)技術(shù),2007(4):28-31.

      Speech Pitch Period Detection Based on Improved Wavelet Transform

      WU Xingquan1,2,ZHOU Jinzhi1,2

      (1.School of Information Engineering,Southwest University of Science and Technology,Mianyang 621010,China;2.Robot Technology for Special Environment Key Laboratory of Sichuan Province,Southwest University of Science and Technology,Mianyang 621010,China)

      Pitch has been widely used in many areas,such as speech encoding,speech recognition,speech conversion,music retrieval and diagnosis of diseases of vocal system.Aiming at the disadvantages of pitch period measurement based on wavelet transform,e.g.,low accuracy,high complexity and poor robustness,and the problem of the difficulty of judging the speech pitch period under noisy speech environment,especially under non-stationary noising,the speech pitch period detection method based on the improved wavelet transform is proposed. Firstly,each frame of noisy signal is preprocessed to extract the information with speech segments and eliminate the DC component.Then,endpoint detection is conducted after window-added framing,and re-framing after filtering; and then the low frequency coefficient reconstructed signal is extracted after using wavelet decomposition.Finally,the pitch detection for the reconstructed signal is accomplished combining with the fourth order cumulative method.The experimental results show that under different noisy speech environment and low SNR condition,the accuracy of noisy speech pitch detection is improved.Comparing with the method of traditional wavelet transform,this method features better robustness and low computation complexity,these are helpful in speech pitch period detection.

      Noisy speech; Pitch detection; Wavelet transform; Restructured signal; Three-level center clipping; Endpoint detection;SNR

      特殊環(huán)境機(jī)器人技術(shù)四川省重點(diǎn)實(shí)驗(yàn)室基金資助項(xiàng)目(13ZXTK07)

      吳興銓(1992—),男,在讀碩士研究生,主要從事語(yǔ)音識(shí)別、軟件開(kāi)發(fā)等技術(shù)的研究。E-mail:304094795@qq.com。 周金治(通信作者),男,碩士,副教授,主要從事計(jì)算機(jī)網(wǎng)絡(luò)與物聯(lián)網(wǎng)、智能家居、語(yǔ)音識(shí)別等技術(shù)的研究。 E-mail:zhoujinzhi@swust.edu.cn。

      TH-3;TP391.4

      A

      10.16086/j.cnki.issn1000-0380.201706016

      修改稿收到日期:2017-03-16

      猜你喜歡
      基音四階小波
      四階p-廣義Benney-Luke方程的初值問(wèn)題
      構(gòu)造Daubechies小波的一些注記
      基于MATLAB的小波降噪研究
      電子制作(2019年13期)2020-01-14 03:15:32
      基于基音跟蹤的語(yǔ)音增強(qiáng)研究
      基于改進(jìn)的G-SVS LMS 與冗余提升小波的滾動(dòng)軸承故障診斷
      帶參數(shù)的四階邊值問(wèn)題正解的存在性
      樂(lè)理小知識(shí)
      小演奏家(2014年11期)2014-12-17 01:18:52
      一種改進(jìn)的基音周期提取算法
      基于FPGA小波變換核的設(shè)計(jì)
      四階累積量譜線增強(qiáng)方法的改進(jìn)仿真研究
      镇原县| 民和| 长子县| 云梦县| 玉林市| 西丰县| 崇礼县| 独山县| 安泽县| 八宿县| 建水县| 邻水| 舞阳县| 漾濞| 宣威市| 绵竹市| 巨野县| 鄯善县| 富顺县| 全南县| 鞍山市| 公安县| 隆子县| 五莲县| 盐亭县| 巴林左旗| 星子县| 平乐县| 曲靖市| 东明县| 太仆寺旗| 汽车| 东乌| 平安县| 林口县| 句容市| 泰顺县| 策勒县| 石柱| 车险| 共和县|