孫鋮成都理工大學信息科學與技術學院
?
基于MATLAB的語音噪聲處理及實現
孫鋮
成都理工大學信息科學與技術學院
摘要:語音信號處理是研究用數字信號處理技術和語音學知識對語音信號進行處理的新興的學科,是目前發(fā)展最為迅速的信息科學研究領域的核心技術之一。通過語音傳遞信息是人類最重要、最有效、最常用和最方便的交換信息形式。本文首先介紹了語音信號的特性,進而闡述了濾波器設計方法以及去噪后語音信號的增強。
關鍵字:信號處理 濾波器 語音增強
語音信號是一種非平穩(wěn)的時變信號,它攜帶著各種信息。在語音編碼、語音合成、語音識別和語音增強等語音處理中無一例外需要提取語音中包含的各種信息。語音信號分析可以分為時域和變換域等處理方法,其中時域分析是最簡單的方法,直接對語音信號的時域波形進行分析,提取的特征參數主要有語音的短時能量,短時平均過零率,短時自相關函數等。由于語音信號是隨著時間變化的,通常認為,語音是一個受準周期脈沖或隨機噪聲源激勵的線性系統的輸出。輸出頻譜是聲道系統頻率響應與激勵源頻譜的乘積。聲道系統的頻率響應及激勵源都是隨時間變化的,因此一般標準的傅立葉表示雖然適用于周期及平穩(wěn)隨機信號的表示,但不能直接用于語音信號。由于語音信號可以認為在短時間內,近似不變,因而可以采用短時分析法。對采集的語音信號進行Fourier等變換,并畫出變換前后的頻譜圖。進而濾除語音信號中的噪音部分,可采用低通濾波、高通濾波、帶通濾波和帯阻濾波,并比較各種濾波后的效果。常用的語音信號增強算法一般可分為基于語音生成模型參數和非基于語音生成模型參數兩大類。基于語音生成模型參數方法的特點是對語音生成模型的參數進行估計和恢復。非基于語音生成模型參數的語音增強方法主要有自適應噪聲濾波法和基于語音短時譜估計的增強方法等。語音信號增強的典型方法有:譜減法、自適應噪聲對消法以及基于語音信號模型的語音增強法。
為了進行數字音頻分析就需要對信號進行FFT變換,FFT即為快速傅氏變換,是離散傅氏變換的快速算法,它是根據離散傅氏變換的奇、偶、虛、實等特性,對離散傅立葉變換的算法進行改進獲得的。
濾波器的設計可以通過雙線性變換法以及窗函數進行實現,雙線性變換法主要是采用非線性頻率壓縮方法,將整個頻率軸上的頻率范圍壓縮到-π/T~π/T之間,再用z=esT轉換到Z平面上。也就是說,先將整個S平面壓縮映射到S1平面的-π/ T~π/T一條橫帶里;再通過標準變換關系z=es1T將此橫帶變換到整個Z平面上去。這樣就使S平面與Z平面建立了一一對應的單值關系,消除了多值變換性,也就消除了頻譜混疊現象;窗函數設計法是一種通過截短和計權的方法使無限長非因果序列成為有限長脈沖應響應序列的設計方法,通常在設計濾波器之前,應該先根據具體的工程應用確定濾波器的技術指標,在大多數實際應用中,數字濾波器常常被用來實現選頻操作。
最后將得到的濾波后音頻利用譜減法進行語音增強,這種方法沒有使用參考噪聲源,但它假設噪聲是統計平穩(wěn)的,即有語音期間噪聲幅度譜的期望值與無語音間隙噪聲的幅度譜的期望值相等。用無語音的間隙測量計算得到的噪聲頻譜的估計值取代有語音的期間噪聲的頻譜,與含噪聲語音頻譜相減的估計值,當上述差值得到負的幅度值時將其置零。由于人耳對語音的感知主要是通過語音信號中各頻譜分量幅度獲得的,對各分量的相位不敏感。因此,此類語音增強方法將估計的對象放在短時譜幅度上。譜減法的設計步驟主要為:①語音信號為準穩(wěn)態(tài)信號,未將其看作穩(wěn)態(tài)信號首先對語音信號進行分幀;②為了減少幀信號起始和結束地方的不連續(xù)性,進而對信號幀加哈明窗;③對加窗后的信號幀進行FFT變換;④對各幀語音信號求功率譜;⑤求信號開始階段的能量平均值;⑥進行譜減運算,得到估計出的語音信號功率譜;⑦插入相位譜,計算出語音譜; ⑧進行IFFT變換,得到還原的語音幀,根據各個語音幀組合為語音信號。
通過MATLAB對采集的錄音進行波形分析及加噪后的信號波形分析,然后通過雙線性變換法設計和用窗函數法設計低通濾波器對加噪的語音信號進行濾波處理。對比濾波前后的語音信號的時域和頻域特性,回放加噪語音信號和去噪語音信號,對比兩種設計方式在信號處理尤其是信號濾波去噪方面的特性及效果,進而通過譜減法實現語音增強。
參考文獻
[1]維納·K·英格爾,約翰·G·普羅克斯.數字信號處理(MATLAB版).西安:西安交通大學出版社,2013.7
[2]任碧蓉,聶小燕,楊紅.信號與系統分析.北京:人民郵電出版社,2011.8
[3]胡廣書.數字信號處理理論算法與實現.北京:清華大學出版社,1997
[4]廖宇,郭黎等.基于MATLAB的數字濾波器的設計[J].高科技與產業(yè)化,2008,09
[5]胡光銳,語音處理與識別[M].上??茖W技術文獻出版社,1994年1月