羅俞坤
摘 要:在傳輸?shù)倪^程中無線語音信號往往會受到噪聲干擾,所以,在語音通信中降噪一直是大家重點研究的一個課題。本文研究和綜合分析了語音降噪的關(guān)鍵技術(shù)、三大基本工具與兩大基礎(chǔ)理論,意在提升無線語音傳輸?shù)馁|(zhì)量。
關(guān)鍵詞:語音通信;降噪;關(guān)鍵工具;關(guān)鍵技術(shù)
引言
語音是信息傳遞最重要的手段之一。在無線通信中,噪聲不可避免地對有用語音產(chǎn)生影響,對帶噪語音信號進行降噪處理是仍是當(dāng)今語音通信中的一個重大課題。頻譜減法、遺傳算法、自適應(yīng)濾波算法等,早在上世紀(jì)六十年代,就在相關(guān)學(xué)者對語音靜噪處理的深入研究中提出來。語音降噪的過程如下圖1所示:
1 無線語音噪聲分類
目前還沒有一種降噪處理技術(shù)能夠完美處理任何噪聲,因此對噪聲進行分類并選擇適用的降噪算法顯得尤為重要。噪聲是無法徹底消除的,因為噪聲與純凈語音信號都屬于隨機信號。故而,我們只能盡可能地在語音降噪處理過程中提取出有用語音信號[1]。在進行降噪處理時,選擇適用的技術(shù)很關(guān)鍵,但是必須先根據(jù)分析出的待處理語音中噪聲的種類與特性,再作出選擇。噪聲的分類有很多種。一般而言,加性噪聲與乘性噪聲是無線通信系統(tǒng)中存在的兩大類噪聲。
1.1 乘性噪聲
乘性噪聲:卷積失真是乘性噪聲的另一種稱謂,它是指噪聲在頻域上同純凈語音信號存在相乘的關(guān)系,它是一種由于聲場或信道特性的隨機變化所引起的噪聲。在實際中,乘性噪聲可轉(zhuǎn)化為加性噪聲,如利用同態(tài)濾波變換,然后以加性濾波方式加以處理,便可處理乘性噪聲。
1.2 加性噪聲
加性噪聲:在時域內(nèi),噪聲對純凈通信信號的影響表現(xiàn)為兩種語音信號的疊加。因此,在頻域內(nèi)有用語音信號和噪聲也是疊加的。加性噪聲,從噪聲的來源來看,又可進一步分為無線通訊系統(tǒng)中的外部、內(nèi)部噪聲。通信系統(tǒng)各部件和元件是造成內(nèi)部噪聲的主要原因,而外部噪聲則主要來自于信道。單頻噪聲、脈沖噪聲(源于雷電、電火花感染、電力線感應(yīng)等)和起伏噪聲是加性噪聲的三種基本分類。本文研究的是加性噪聲。
2 降噪處理工具
本研究使用了目前應(yīng)用較為廣泛的三種降噪處理工具,分別為:Adobe Audition軟件、VS99語音工作站與DSG—98 計算機語音分析系統(tǒng)。
2.1 Adobe Audition 軟件
Adobe Audition軟件具有強大的編輯、特效、混音等功能,支持128 條音軌、多種音頻格式、多種音頻特效,可有效地對音頻文件進行修改、合并。該軟件所含的降噪工具和聲相修復(fù)工具可有效對噪聲和語音進行調(diào)整。同時,Adobe Audition軟件還設(shè)計有包括噪聲降低器、爆音修復(fù)器和自動咔噠聲消除器等一系列專門處理噪聲的濾波器。
2.2 VS-99 語音工作站
VS-99是我國自主研發(fā)的一款語音信號處理系統(tǒng)。該系統(tǒng)能實時動態(tài)采集分析語音,利用VS-99系統(tǒng)中的降噪器和頻域編輯功能,能夠在語圖觀察的基礎(chǔ)上將語音信號中的噪聲進行降噪處理并把有用的語音信號放大,提高語音質(zhì)量。
2.3 DSG—98 計算機語音分析系統(tǒng)
DSG—98 計算機語音分析系統(tǒng)是一款有通用微機構(gòu)成的語音分析系統(tǒng)。該系統(tǒng)以FRFT算法為核心,提高了運算速度,還綜合了語音處理、圖像處理和計算機圖形學(xué)等理論和處理技術(shù),為語音分析探索了一條新路。綜合來看,DSG—98 計算機語音分析系統(tǒng)具備低成本、高性能、多功能的優(yōu)點。
3 語音降噪算法
語音降噪,也稱語音增強。語音降噪的目的在于增強語音質(zhì)量,其實現(xiàn)手段為將有用的語音信號在帶噪語音中盡可能分離出來。
3.1 基于語音譜特征的諧波增強算法
利用帶噪語音濁音段所具有的周期性的特性,可利用自適應(yīng)梳狀濾波器將語音分量提取出來,增加語音可懂度。梳狀濾波器的實現(xiàn)形式如下:
在式中,s (n)代表輸出信號,M為常數(shù),Ck為濾波器系數(shù), x (n)為輸入信號,L為基音周期。從上式中可知,s (n)是輸入信號的延時加權(quán)平均。周期性分量在這個平均過程中得以增強,但是其他非周期性分量受到抑制或消除[2]。由此可見,使用諧波增強法的關(guān)鍵是準(zhǔn)確估計基音周期。各種基音估計算法可有效估計基音周期,但如果背景噪聲過強,則難以準(zhǔn)確估計基音周期。并且,由于基音發(fā)生變化,所以在過渡語音段中,也是難以準(zhǔn)確估計基音周期的。
梳狀濾波不僅有增強語音信號的效果,還可對噪聲產(chǎn)生抑制的作用[3]。但如果同時對兩個語音進行處理,準(zhǔn)確估計基音周期也很困難,這時使用濾波方法增強語音的效果也差強人意。
3.2譜減法
語音降噪算法多種多樣。譜減法因其原理簡單、容易實現(xiàn)等優(yōu)點成為語音降噪算法中較為常用的算法。在使用譜減法時,噪聲滿足以下三個假設(shè)條件:
1. 噪聲為加性噪聲,且都是高斯噪聲。
2. 語音信號是短時平穩(wěn)且獨立于噪聲的信號。
3. 因人耳對語音信號相位不敏感,故可用帶噪語音信號的相位代替純凈語音信號的相位。
將x (n)表示為有用語音信號,d (n)表示為加性噪聲,y (n)表示為帶噪信號,則有如下(2)式:
帶噪語音經(jīng)加窗處理后如式(3):
其中0 ≤ n ≤ N-1,i為第i幀,n為樣點數(shù),N是幀長。相應(yīng)的頻域表示為:
k 是頻譜的分離值,假設(shè)純凈語音信號與噪聲信號不相關(guān),從功率譜的角度出發(fā)則有:
若從幅度值的角度考慮,則有:
人耳對語音信號的頻譜相位不敏感,其獲取語音信號主要是通過獲得頻譜分量的幅度來實現(xiàn)的[4]。將原始語音信號的相位加入到降噪后的語音信號中,便可獲得語音信號的估計值。由此,頻譜減法公式一般化后為:
頻譜減法的原理圖如下:
頻譜減法能夠做到有效降噪并且該方法的算法簡單,故獲得廣泛應(yīng)用,但該方法也有其缺點。它主要包含兩個方面的缺點:(1)傳統(tǒng)頻譜減法是依靠噪聲端點檢測的正確性來估計噪聲的正確性。但是,當(dāng)噪聲水平高時,噪聲端點檢測算的的正確性并不高,于是降低了頻譜減法的語音降噪效果;(2)在對噪聲進行估計時,頻譜減法求噪聲均值。于是,在降噪的過程中,又會引入音樂噪聲。然而,人耳對音樂噪聲易產(chǎn)生疲勞,因此會降低人耳對語音的敏感度。
4.結(jié)束語
綜上所述,Adobe Audition軟件、VS99語音工作站以及DSG—98 計算機語音分析系統(tǒng)都可以有效對語音信號進行降噪。實踐證明,傳統(tǒng)頻譜算法和諧波增強算法是兩種比較高效的語音降噪算法。兩種算法各有其優(yōu)勢與不足。在進行降噪處理時,要根據(jù)實際情況選取相應(yīng)的算法。
參考文獻:
[1]趙力. 語音信號處理. 北京:機械工業(yè)出版社 2003:272-273, 282-283.
[2]甄斌 “語音信號的增強相對譜濾波”,聲學(xué)學(xué)報,Vol. 26 No. 3 pp252-258.
[3]樊養(yǎng)余 “加性噪聲抵消的對稱相關(guān)函數(shù)法”,數(shù)據(jù)采集與處理,Vol. 16 No. 3 pp343-347.
[4] 楊行峻,遲惠生等. 語音信號數(shù)字處理. 北京:電子工業(yè)出版社, 1995.