盧 勇
(中國民用航空飛行學(xué)院 空管中心,四川 廣漢 618307)
語音增強是從帶噪聲的語音中去除噪聲,得到純凈語音的過程。目前,語音增強技術(shù)在語音識別、移動通信和人機對話中有廣泛應(yīng)用[1-2]。語音增強算法有譜減法、維納濾波法、小波變換法等,在這些方法中,小波變換法應(yīng)用得較為廣泛。小波變換在時域和頻域內(nèi)都有較好的局部性質(zhì),而且具有去相關(guān)和多分辨率等特點,適合非平穩(wěn)信號的分析,但是在傳統(tǒng)的小波變換法中,硬閾值函數(shù)在閾值處不連續(xù),使去噪后的信號不平滑,容易產(chǎn)生偽吉布斯現(xiàn)象;軟閾值函數(shù)雖然連續(xù),但是在去噪過程中存在著固定偏差,容易造成重構(gòu)語音信號強度降低[3]?;谝陨蠁栴},本文提出了一種改進的閾值函數(shù),同時將改進的閾值函數(shù)與貝葉斯方法相結(jié)合,解決了因不同層數(shù)閾值恒定的問題。
小波閾值去噪是通過小波對語音信號進行分解得到各層系數(shù),然后構(gòu)造相應(yīng)的閾值,對小波系數(shù)進行處理,將處理完的小波系數(shù)進行重構(gòu)達到語音增強的目的。語音信號中小波變換相當于線性的,隨著分解尺度的增加,有用信號大部分分布在較大的小波系數(shù)上,而噪聲信號則分布在較小的小波系數(shù)上[4],若要去除噪聲,保留有用的語音信號,選擇合適的閾值是至關(guān)重要的。
小波閾值去噪中,去噪效果與小波基函數(shù)、分解層數(shù)、閾值函數(shù)和每層閾值有關(guān),如何結(jié)合相應(yīng)的閾值對小波系數(shù)進行處理也是很重要的,這就需要針對不同的帶噪信號選擇合適的閾值函數(shù)。傳統(tǒng)的閾值函數(shù)主要有硬閾值和軟閾值兩種[5]。
硬閾值函數(shù):
(1)
軟閾值函數(shù):
(2)
由于硬閾值函數(shù)和軟閾值函數(shù)都存在一定的缺陷,導(dǎo)致去噪效果不是太理想。為了得到更好的去噪效果,研究學(xué)者在硬、軟閾值函數(shù)的基礎(chǔ)之上,提出了改進閾值函數(shù)。
PARTHA A等[6]提出的改進閾值函數(shù)為:
(3)
其中λ為每層分解小波系數(shù)中的閾值,k為調(diào)整參數(shù)。該閾值函數(shù)的變化介于軟硬閾值函數(shù)之間,在處理語音信號時,對于高于閾值的小波系數(shù)進行了指數(shù)型的衰減變換,有較好的平滑作用,但是在低于閾值時,并沒有滿足指數(shù)形式,這樣就會導(dǎo)致去噪效果不理想,從而影響重構(gòu)語音信號質(zhì)量。
為了克服軟硬閾值函數(shù)的特點,任永梅[7]提出了一種新的小波閾值函數(shù):
(4)
由以上分析可知,不管是傳統(tǒng)的軟硬閾值函數(shù)還是其他改進的閾值函數(shù),都在一定程度上存在缺陷,導(dǎo)致去噪效果不是很理想。為了更進一步提升小波閾值函數(shù)在高頻語音信號中的去噪效果,本文提出一種新的改進閾值函數(shù)。本文提出的閾值函數(shù)以指數(shù)函數(shù)為載體,不管是對于大于閾值的小波系數(shù)還是小于閾值的小波系數(shù),都能通過不斷地調(diào)整指數(shù)來確定合適的閾值函數(shù),極大地提高了去噪效果,并且該閾值函數(shù)在閾值處也是連續(xù)的,對小波重構(gòu)起到了很好的平滑作用。本文提出的改進小波閾值函數(shù)為:
(5)
當|ωj,k|→λ時:
(6)
(7)
新改進的閾值函數(shù)在閾值處是連續(xù)的,對于小于閾值的小波系數(shù)做了平滑處理,避免了軟閾值函數(shù)下存在的固定偏差問題,且能根據(jù)不同的噪聲自動調(diào)整參數(shù),解決了因濾掉有用信號成分而影響重構(gòu)語音信號質(zhì)量的問題。
(8)
其中:
(9)
密度函數(shù):
(10)
(11)
閾值計算表達式:
(12)
其中:δ2為噪聲方差,δx是子帶系數(shù)標準差,j是代表分層中的某一層。δ2的計算采用DONOHO D L所提出的估計值計算方法:
(13)
式中yj,k表示不同層數(shù)的小波系數(shù)值。
(14)
(15)
通過公式(13)、(14)、(15)即可求出貝葉斯準則下的閾值,由于貝葉斯閾值具有自適應(yīng)性,將它與閾值函數(shù)相結(jié)合去噪即可解決閾值恒定的問題。
運用不同的閾值函數(shù)去噪后會得到不同的結(jié)果,如何驗證這些閾值函數(shù)的去噪效果,需要用到信噪比和均方根誤差兩個評價指標。信噪比和均方根誤差具體公式分別如下:
(16)
(17)
其中y(i)表示原始信號,x(i)表示去噪后的信號,N表示輸入信號的長度。
實驗仿真中所采用的純凈語音信號是在安靜的環(huán)境中,通過Windows系統(tǒng)自帶的錄音軟件,利用話筒錄得的一段語音,語音內(nèi)容為:“謝謝塔臺再見”。仿真中加入的噪聲是高斯白噪聲(white),噪聲來源于Noisex-92標準噪聲庫[9]。具體的仿真過程是:在純凈語音信號中分別加入信噪比為-10 dB、-5 dB、 0 dB、5 dB、10 dB的含噪信號,然后用不同的閾值函數(shù)對含噪信號進行處理,最后根據(jù)信噪比、均方根誤差來分析去噪效果。圖1表示信噪比(SNR)和均方根誤差(RMSE)曲線對比圖,表1和表2分別表示輸出信噪比(SNR)和均方根誤差(RMSE)的具體數(shù)據(jù)。
圖1 不同閾值函數(shù)在不同信噪比輸入下的去噪結(jié)果
SNRin/dB硬閾值函數(shù)軟閾值函數(shù)文獻[6]閾值函數(shù)文獻[7]閾值函數(shù)本文改進的閾值函數(shù)-10-0.931 3-0.394 1-0.676 8-0.541 4-0.476 1-50.482 60.913 81.019 671.050 51.478 302.925 82.888 13.461 43.296 04.261 256.154 35.854 06.875 06.600 37.525 71010.372 99.671 510.783 310.556 411.553 0
從圖1并結(jié)合表1、表2的數(shù)據(jù)可以看出,每種閾值函數(shù)都能去除噪聲,但是對于輸入任意相同信噪比的噪聲,本文提出的改進閾值函數(shù)的去噪效果更好,且隨著輸入信噪比的增加,去噪效果更加明顯。特別是在噪聲輸入信噪比大于-5 dB時,從SNR曲線中可以看出改進閾值函數(shù)的曲線相較于其他幾種閾值函數(shù)的曲線有明顯的上升,說明改進閾值函數(shù)去噪效果更好。同樣從RMSE曲線中可以看出,在相同信噪比輸入下,改進閾值函數(shù)的均方誤差最小,且隨著輸入信噪比的增加,均方誤差越來越小,說明改進的閾值函數(shù)對去噪有更好的效果。
表2 不同輸入信噪比條件下運用不同閾值函數(shù)得到的輸出均方根誤差(RMSE)
本文提出的改進閾值函數(shù)避免了小波變換中產(chǎn)生的固定偏差和閾值處不連續(xù)等問題,并與貝葉斯閾值獲取方法相結(jié)合,解決了不同層數(shù)閾值恒定的問題。本文用純語音信號中加入不同信噪比的高斯白噪聲然后再用不同閾值函數(shù)去噪的方式進行仿真,并從信噪比、均方根誤差對不同閾值函數(shù)的去噪效果進行了對比,結(jié)果表明本文改進的閾值函數(shù)比其他幾種閾值函數(shù)具有更好的去噪效果,使去噪后的語音質(zhì)量整體有所提升,達到了理想的語音去噪效果。