• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      結合EMD與DWT-ACF的語音基音周期檢測改進算法

      2018-05-11 15:53:11章小兵朱明星
      噪聲與振動控制 2018年2期
      關鍵詞:基音小波分量

      張 濤,章小兵,朱明星

      (安徽工業(yè)大學 電氣與信息工程學院,安徽 馬鞍山 243002)

      基音周期檢測是語音信號處理中的重要步驟之一,它在語音識別、語音情感識別、語音合成以及語音編碼中有著廣泛的應用[1]。于是,精準的基音周期檢測就具有非常重要的意義。目前的基音周期檢測方法有自相關函數法(Auto Correlation Function,ACF)[2]、平均幅度差函數法(Average Magnitude Difference Function,AMDF)[3]、倒譜法[4]、線性預測系數(Linear Prediction Coefficient,LPC)[5]、小波變換[6]以及相衍生的小波加權自相關函數法[7-8]、平均幅度差自相關函數法[9]等。由于語音是一種復雜非平穩(wěn)的信號,受限于人的聲道、基音周期范圍、情感以及單詞的音調等各種因素的影響,因此基音周期的精確檢測實際上是非常困難的,但基于基音在語音識別過程中的重要性,人們提出了各種基音周期檢測算法。而這些方法中自相關函數法(Auto Correlation Function,ACF)即使在完全純凈語音下也會發(fā)生基音的倍頻和半頻錯誤,平均幅度差函數法(Average Magnitude Difference Function,A-MDF)在信號幅度變化較快時會出現均值下降的趨勢,倒譜法對噪聲比較敏感,當遇到受噪聲污染的語音時其檢測誤差會顯著上升[3-4]。由此看出,不同的基音周期檢測方法都有各自的優(yōu)缺點,它們在復雜的語音下并不完善,因此探索一種精確的基音周期檢測方法就顯得尤為重要。

      本文針對傳統(tǒng)的小波-自相關法(DWT-ACF)[10]的缺點提出了一種基于經驗模式分解(EMD)[11]下改進小波-自相關的基音周期檢測算法。該算法先利用經驗模式分解(EMD)處理含噪語音信號,提取基本模式分量IMF3-IMF6以消除含噪信號部分噪聲以及消除趨勢,改善自相關函數法在基音的倍頻和半頻上的錯誤(在語音信號中提取基頻常用的自相關方法中,倍頻和半頻是常見的錯誤。前者是那些低的第1共振峰的干擾;后者出自個人的發(fā)音習慣導致的奇數周期和偶數周期的聲門脈沖的強度的固有變化。這是由語音信號的特性造成的,與漢語‘上聲’結尾有些人發(fā)出的吱嘎聲,基頻很低,難以測量,有同樣的性質。這類錯誤即使在信噪比很高的條件下也會出現。因為言語中基頻是一個有規(guī)律的慢變過程),以及小波法的基音定位偏差[9],再結合小波算法抗噪聲性能與自相關函數法的簡單精準,得出一種精確定位基音周期的新算法(EMDDWT-ACF)。對EMDDWT-ACF算法進行仿真實驗,實驗結果表明,該方法提取的語音基音周期基音軌跡平滑,且相對應的基音頻率能與實際的基音頻率很好吻合。

      1 EMD算法基本原理

      1998年,Norden E.Huang等對非平穩(wěn)信號在瞬時頻率方面進行深入研究,創(chuàng)造性地提出了本征模式函數(Intrinsic Mode Function,IMF)[12]以及將任意信號分解為IMF的經驗模式分解(Empirical Mode Decomposition,EMD)。

      為了得到有意義的瞬時頻率,提出了基本模式分量(IMF)的概念,基本模式分量的提出需要滿足兩個基本條件:

      (1)在語音數據序列中,極值點的個數Ne與過零點的個數Ns要滿足

      (2)在任意時間點ti上,信號局部極大值確定的上包絡線gmax(ti)與局部極小值確定的下包絡線gmin(ti)均值為零,即

      其中:[ta,tb]為語音數據段所在的時間區(qū)間。

      用驗模式分解(EMD)將信號的基本模式分量(imf)提取出來,然后對其分析,這是一個篩選過程,其分解原理如下:

      (1)將原始信號的x(t)的所有局部極值點分別用3次樣條曲線連接起來,使信號的所有數據點都處于這兩條包絡線之間,定義上、下包絡線均值組成的序列為m(t)。

      (2)從原始信號x(t)中減去m(t),得到

      檢測h1(t)是否滿足IMF的兩個基本條件,若不滿足,把h1(t)作為待處理信號,重復式(3),直到找到一個h1(t)是一個基本模式分量,記為

      (3)得到一個基本模式分量后,從原始信號x(t)中減去c1(t),得到剩余值序列r1(t)

      (4)將r1(t)作為新的原始信號重復上述步驟得到各階IMF分量,記為c1(t)、c2(t)、...、cn(t),直到滿足預先設定的停止準則,則停止,最后剩下一個余項為rn(t)。

      該方法的核心思想是將原始信號x(t)分解為若干基本模式分量ci(t)和一個剩余分量rn(t),見式(6)

      具體分解結果見圖1,對一段純凈語音進行EMD分解,得到各階imf分量。

      圖1 EMD分解

      從圖1中可以看出,對純凈語音進行EMD分解后,得到的各階imf分量中imf1到imf6包含語音信號的大部分信息,imf6之后的分量主要是語音趨勢分量。

      1.1 EMD語音增強

      對原始純潔語音x(t)進行加噪得加噪語音信號x′(t),對其進行EMD分解得到一系列基本模式分量imfi,丟掉前 2階模態(tài)分量 imf1、imf2,再重構新的信號x?(t)

      根據文獻[13]提出的方法,EMD分解后的前兩階imf含有高斯白噪聲75%的分量和噪聲的共振峰,實驗中丟棄了前兩階imf相當于對帶噪語音信號進行語音增強處理,但是丟棄的兩階imf中同時也包含語音信號的成分,但這并不影響后續(xù)的基音周期檢測,見圖2。

      從圖2(a)中可見對純潔語音進行重構imf3之后的信號可以保留大部分語音信號,而圖2(b)為對加噪語音進行重構imf3之后的分量,可以明顯看出已去除大部分噪聲,且信噪比SNR從5提升到8.56,足見算法的效果。

      1.2 語音消除趨勢

      通過對EMD分解后的imf分析可知,經過EMD分解處理后的語音信號,其imfj(這里的j針對實驗的語音設定為6)之后的分量以及殘余分量,大多都是低頻分量,這些信號包含語音的趨勢,并不能反應語音的特性,但這些信號中的低頻噪聲和工頻對語音的基音周期檢測又會產生較大的影響,它會干擾到基音周期算法的準確率。故本算法對減噪后的信號進行重構,再進行EMD 2次分解,分解后得到新的cj(t)和剩余分量rm(t),試驗中丟棄c7(t)之后分量以及剩余分量,再次重構得到新處理后的信號f(t)為

      第1次分解和第2次分解是分開進行的,第1次分解后重構的信號用來檢測元音主體。在元音主體的檢測之前是要進行能熵比端點檢測,這里選用能熵比端點檢測而沒選擇其他類型的端點檢測是由于在一般的端點檢測中,為了檢測出一些語音的頭、尾,經常將檢測條件設置稍寬一些,但是語音頭、尾部并不具有聲帶振動那樣的周期性,也就檢測不到相應的基音,而本算法設置的能熵相比端點檢測條件較為嚴格,與傳統(tǒng)的雙門限不同的是本文設置用一個門限閾值Ti作為判斷,判斷能熵比值是否大于Ti,把大于Ti的部分作為有話段的候選值,再進一步判斷該段長度是否大于給定的判定最小值miniL,只有大于最小值的段才能作為有話段。

      本文并不是采用對各元素進行分割方法得到元音主體,而是在能熵比端點檢測判定出有話段后,在每個有話段中尋找能熵比的最大值Emax,設置比例系數r2,使得閾值T2=Emax×r2,這樣對于不同的有話段就有不同的T2值,然后把能熵比大于T2的部分作為元音主體部分。

      第2次分解后重構得到的信號是用來優(yōu)化小波算法的,詳細過程見下一小節(jié)。

      2 改進的EMD小波-自相關函數法

      2.1 基于EMD的小波算法

      小波變換是一個平方可積函數f(t)(對應本文經過EMD處理后的信號f(t))與一個在時頻域上具有良好局部性質的小波函數φ(t)的內積

      式中:<f,φa,b>表示兩函數的內積;a>0為尺度因子;b為位移因子;φ′(t)表示表示小波函數φ(t)的復數共軛。

      實際應用中的小波幾乎都是離散的,本文使用二進離散小波,故對尺度因子a和位移因子b進行離散得:a=2m,b=n2m

      離散小波函數為

      對應的EMD 2次重構后的語音信號f(t)的DWT可以表示為

      對f(t)進行分幀加窗,取來一幀濁音信號進行小波變換,然后用upcoef函數對小波處理的語音低頻系數進行重構,得到重構后的信號x′i(n)。

      糯福鄉(xiāng)有“綠色寶石”之美譽,綠色、生態(tài)、民族、邊疆是糯福的鮮明特點。全鄉(xiāng)轄9個村民委員會,91個村民小組,有國土面積879.67平方公里,占全縣總面積的1/10,是瀾滄縣國土面積第三大鄉(xiāng)。耕地52147畝,其中:水田14185畝,旱地37692畝。

      圖2 EMD分解后重構

      離散小波變換可以被表示成由低通濾波器和高通濾波器組成的“一棵樹”,語音信號通過這樣的一對濾波器進行分解稱為一級分解,在信號分解過程中可以迭代進行多級分解[14]。利用小波變換進行基音周期檢測時,基音周期檢測前已經通過EMD分解濾波和去除低頻信號,而基音的頻率范圍絕大部分都在60 Hz~450 Hz,本文另辟蹊徑嘗試EMD分解后得到模式分量imf3-imf6,采集語音信號后將imf1和imf2高頻部分直接丟棄,得到中頻和低頻信號,但是計算機交流隔離并不理想,經常會產生50 Hz工頻噪聲干擾,所以本算法嘗試丟棄imfi之后的分量,實驗分析丟棄imf7及之后分量實驗效果最佳。如此操作就相當于給語音信號設置了一個截止頻率較低的帶通濾波器,因此只需要進行一次小波變換便可檢測出語音信號的基音周期[15]。

      2.2 短時自相關函數法

      語音信號時間序列為x(n),經過EMDDWT處理后的第i幀語音信號為x′i(n),幀長為N,則x′i(n)的短時自相關函數為

      式(12)中的k是時間延遲量。

      自相關函數(ACF)有一些很特別的性質,其自相關函數Ri(k)與原始信號x′i(n)的周期P是相同的,Ri(k)的峰值特性也是隨著x′i(n)周期P變化在基音頻率整數倍時達到,且Ri(k)是偶函數,有Ri(k)=-Ri(k)。

      本文結合改進的EMDDWT與自相關函數計算得到基音周期估計值,圖3給出一幀帶噪清音信號和基于自相關函數、小波-自相關函數以及本文方法的一幀帶噪濁音的基音周期檢測結果。由圖3(b)可知,一幀帶噪清音在原始自相關函數下會含有大量諧波和噪聲波,而圖3(c)表明小波-自相關函數可以一定程度消弱諧波和噪聲波的影響,但效果不明顯。在圖3(d)中可以看出本文改進的EMD小波算法加權短時自相關法可以有效消除原始信號幀中的諧波與噪聲干擾,很好保留基波的特性。

      圖4給出的是一幀帶噪濁音信號和基于自相關函數、小波-自相關函數以及本文方法的一幀帶噪濁音的基音周期檢測結果。由圖4(b)可知,一幀帶噪濁音在原始自相關函數下會含有較高的第1共振峰的干擾,而共振峰是產生倍頻錯誤的重要因素,所以消弱第1共振峰干擾有利于基音周期檢測準確性,圖4(c)表明小波-自相關函數已經消弱60%左右第1共振峰干擾,但是,算法運用在實際基音周期檢測中不太理想。從圖4(d)可以看出本文算法可以減弱90%左右第1共振峰干擾,故檢測基音周期效果優(yōu)越。因此,本文EMDDWT-AFC算法還是有效且實際可行的。

      3 算法流程

      設帶噪信號為x(t),本文檢測基音周期算法的步驟如下:

      步驟2:在初步預處理后進行EMD分解,提取imf3及之后的分量進行重構;

      步驟3:對EMD重構后的信號進行第1次分幀,第1次分幀是要進行能熵比端點檢測和元音主體檢測;

      步驟4:在步驟2中對信號重構后,對新信號再進行EMD分解,并提取新分解imf1-imf6進行第2次重構,然后對重構信號第2次分幀,為基音周期檢測做準備;

      步驟5:對步驟3檢測到的元音主體部分對應步驟4中的每一加噪語音幀信號先做小波變換,對變換后的數據,用小波低頻系數重構,然后再計算歸一化自相關函數;

      圖3 一幀帶噪清音與幾種函數提取的相關函數值對比圖

      圖4 一幀帶噪濁音段與幾種函數提取的相關函數值對比圖

      步驟6:對上面步驟的結果進行峰值檢測,得到基音周期及其頻率。

      4 實驗結果及分析

      實驗所用的語音為在實驗室安靜環(huán)境下用專業(yè)錄音設備錄制的一段語音,為“媽媽、好嗎、上馬、罵人”的一段包含漢語4個聲調的純凈語音信號,信號樣本為單聲道,采樣頻率為8 kHz,精度為16 bit的量化.wav文件。實驗中加入的噪聲是來自NOISEX-92數據庫中的高斯白噪聲,設置信噪比(SNR)為5 dB,純凈語音與帶噪語音波形如圖5所示。

      對加入噪聲的信號進行EMD分解,提取IMF3及之后的分量,進行重構,設語音分幀的幀長為200 ms,幀移為80 ms,圖6表示為語音的EMD分解第1次重構與第1次分幀后信號能熵比端點檢測。

      將第1次重構后的信號進行EMD 2次分解提取imf1~imf6之間的分量進行2次重構,用重構后的信號進行濾波,再結合元音主體檢測到的語音段進行基音周期檢測(這里的算法只是針對檢測到的語音段進行基音檢測,而沒有檢測到的部分自動忽略,故圖7中的基音周期有部分無信號是正常情況),分別用自相關法、小波-自相關法及本文方法進行基音周期檢測的對比實驗,結果如圖7所示。

      圖7為5 dB White Gaussian噪聲工況下使用橢圓帶通濾波器且在相同端點檢測算法情況下基于傳統(tǒng)自相關法、小波-自相關法和本文EMDDWT-ACF方法的基音周期檢測結果。圖7中的橫坐標為時間刻度幀數,基音周期的縱坐標為采樣點數,基音頻率則表現為語譜圖上的基頻頻率。

      圖7(a)表示基于傳統(tǒng)自相關法的基音周期檢測結果,從基音周期上看,盡管有橢圓濾波器的優(yōu)化,但是依然會出現大量基音周期倍頻和半頻錯誤,從語譜圖上可以看出檢測得到的基音頻率和實際的基音頻率還是有出處,特別在“好嗎、上馬”這一段檢測到的基音頻率明顯有偏差。

      圖7(b)則表示小波-自相關法基音周期檢測結果,與傳統(tǒng)自相關方法相比較,其基音周期的倍頻和半頻有些減少,但并不能從根本上改善其定位偏差的問題,在“上馬”這段語音的語譜圖上可以看出小波-自相關法依然出現錯誤檢測。

      圖5 原始語音與加噪語音的波形圖

      圖6 元音主體檢測

      圖7 基音檢測結果對比圖

      而采用本文提出的EMDDWT-ACF方法時,信號經過EMD分解與重構后一系列增強、濾波過程,從圖7(c)中可以看出基音周期檢測中出現的倍頻、半頻錯誤以及錯誤檢測等都得到極大減少,從語譜圖可以看出,由該算法得到的基音頻率與實際基頻的吻合程度(準確率)高。

      為了驗證本文方法的實際檢測準確率和穩(wěn)定性,選擇50個以中國大小城市的名字及部分城市飛機場的純凈原聲(25個男聲、25個女聲),在原始語音中分別加入信噪比為5 dB、0 dB、-5 dB的高斯白噪聲、粉色噪聲以及人聲,對純凈語音采用平均幅度差自相關函數法結合人工矯正得到的基音周期作為參考標準,允許參考誤差為±8%,對基于文中提出的算法與自相關函數法、小波-自相關法的基音周期檢測正確率進行比較。表1說明本文方法有更好的檢測性能和抗噪能力,即使在低信噪比白噪聲的情況下,準確率都是在80%以上,而小波-自相關方法在75%左右,提高了5個百分點,而自相關方法則更低。從而驗證本文方法的準確率和穩(wěn)定性。

      從表1中的pink噪聲和babble實驗數據可以看出即使在不同噪聲下,本文算法適應性都較為良好。在表1中的-5分貝babble噪聲下,傳統(tǒng)自相關法已經失效,而本文算法依然有75%左右的準確率。

      但是本算法出發(fā)點在于EMD,而更加復雜環(huán)境下的噪聲其頻率范圍各有不同且比較廣泛。當純凈語音與這些噪聲混合,本算法利用分解后的imf3~imf6重構就不是很適用,因為噪聲頻率范圍廣,所以提取imf3~imf6就有一定局限性。本文算法的不足之處在于當被檢測的語音處于復雜噪聲環(huán)境下的時候,算法的適應性較差,而這正是接下來要研究的課題。

      5 結語

      本文以含噪語音的基音周期檢測為研究對象,提出了一種基于EMD改進的小波-自相關的基音周期檢測算法。根據MATLAB軟件仿真實驗結果可知,這種新的基音周期檢測算法有更高的檢測精度和很好的基音周期檢測實用性,當然本算法只是部份解決了基音周期檢測的問題,而想要在更加復雜的環(huán)境下尋找更完美的基音周期檢測算法的道路還很漫長。

      表1 基音周期檢測準確率對比

      參考文獻:

      [1]J S JUNG,J J KIM,M J BAE.Pitch alteration technique in speech synthesis system[J].IEEE Transactions on Consumer Electronics,2001,47(1):163-167.

      [2]DAVID A,KRUBSACK,RUSSELLl J,et al.An autocorrelation pitch detector and voicing decision with confidence measures developed for noise-corrupted speech[J].IEEE Transactions on Consumer Electronics,1991,39(2):319-328.

      [3]ROSS M,SHAFFER H,FREUDBERG R,et al.Average magnitude difference function pitch extractor[J].IEEE Transactions on Acoustics, Speech and Signal Processing,1974,22(5):353-362.

      [4]NOLL A M.Cepstrum pitch determination[J].Journal of theAcoustical Society ofAmerica,1967,41(2):293-309.

      [5]陳磊,吳小培,呂釗.基于線性預測與歸一化互相關的基音周期檢測[J].電子測量技術,2009,32(10):20-23.

      [6]AMIN S L,JALIL S.Pitch detection of speech signal using wavelet transform[J].International Journal of Scientific Engineering and Technology,2015,5(4):322-324.

      [7]楊龍.基于小波變換的自相關基音周期檢測方法[J].信息通信,2015,1(9):72-73.

      [8]陳小利,徐金甫.利用小波變換加權自相關的基音周期檢測法[J].數據采集與處理,2007,22(4):463-467.

      [9]潘崢嶸,戴芮,張寧.改進的基音周期檢測算法研究[J].計算機工程與應用,2015,51(10):223-226.

      [10]宋之用.MATLAB在語音信號分析與合成中的應用[M].北京:北京航天航空大學出版社,2013:251-258.

      [11]宗源,李平,曾毓敏,等.基于EMD的ACF基音周期檢測改進算法[J].南京師大學報(自然科學版),2013,36(3):42-47.

      [12]王建軍,侯盼衛(wèi),蘇新彥,等.EMD去噪法在FMCW雷達信號處理中的應用[J].科學技術與工程,2014,14(27):66-70.

      [13]李曼曼,楊鴻武,洪寧,等.基于EMD的帶噪語音端點檢測[C].第十一屆全國人機語音通訊學術會議,西安,2011:60-64.

      [14]張雪英.數字語音處理及MATLAB仿真[M].北京:電子工業(yè)出版社,2010:220-224.

      [15]李輝,戴李輝,戴蓓蒨,等.基于前置濾波和小波變換的帶噪語音基音周期檢測方法[J].數據采集與處理,2005,20(1):100-104.

      猜你喜歡
      基音小波分量
      構造Daubechies小波的一些注記
      科技風(2021年19期)2021-09-07 14:04:29
      帽子的分量
      基于MATLAB的小波降噪研究
      電子制作(2019年13期)2020-01-14 03:15:32
      一物千斤
      智族GQ(2019年9期)2019-10-28 08:16:21
      基于基音跟蹤的語音增強研究
      論《哈姆雷特》中良心的分量
      基于改進的G-SVS LMS 與冗余提升小波的滾動軸承故障診斷
      分量
      樂理小知識
      小演奏家(2014年11期)2014-12-17 01:18:52
      一種改進的基音周期提取算法
      丰原市| 武陟县| 佛山市| 讷河市| 三门县| 宣化县| 广水市| 滁州市| 阜平县| 绥阳县| 西和县| 呼图壁县| 中牟县| 壤塘县| 崇阳县| 邵武市| 阜阳市| 平山县| 娱乐| 连平县| 宜宾市| 肇庆市| 金沙县| 石狮市| 中超| 龙口市| 平武县| 白水县| 鹿泉市| 台湾省| 方山县| 巴青县| 怀柔区| 舞钢市| 惠州市| 盱眙县| 丰顺县| 曲靖市| 岳池县| 三门峡市| 宿州市|