羅海濤
(廣東外語(yǔ)外貿(mào)大學(xué)信息學(xué)院,廣東 廣州 510420)
數(shù)字語(yǔ)音處理是采用計(jì)算機(jī)對(duì)語(yǔ)音信號(hào)進(jìn)行處理。數(shù)字語(yǔ)音處理涉及到語(yǔ)音、語(yǔ)言學(xué)、認(rèn)知科學(xué)、數(shù)字信號(hào)處理等諸多領(lǐng)域,是一門(mén)跨學(xué)科的新興技術(shù)。隨著集成電路技術(shù)、計(jì)算機(jī)技術(shù)、數(shù)字信號(hào)處理技術(shù)的發(fā)展,語(yǔ)音信號(hào)處理廣泛應(yīng)用于語(yǔ)音識(shí)別、語(yǔ)音合成、語(yǔ)音編碼等方面。
用數(shù)字化的方法對(duì)語(yǔ)音進(jìn)行傳送、存儲(chǔ)、識(shí)別、合成、增強(qiáng)和編碼,已成為整個(gè)數(shù)字化社會(huì)中最重要、最基本的組成部分。數(shù)字電話(huà)通信、窄帶語(yǔ)音通信、語(yǔ)言學(xué)習(xí)機(jī)、聲控打字機(jī)、自動(dòng)翻譯機(jī)、智能機(jī)器人、計(jì)算機(jī)語(yǔ)音智能終端,以及許多軍事上的應(yīng)用等,都要用到信號(hào)處理技術(shù),而隨著集成電路和微電子技術(shù)的發(fā)展,語(yǔ)音信號(hào)處理系統(tǒng)已逐步實(shí)用化。
本文采用濾波的方法,設(shè)計(jì)一個(gè)濾波器,對(duì)語(yǔ)音信號(hào)進(jìn)行處理。處理的語(yǔ)音是經(jīng)過(guò)采樣和量化后的wav格式的音頻文件,這種格式的音頻文件廣泛應(yīng)用在各種數(shù)字音頻文件的存儲(chǔ)。wav格式是微軟公司開(kāi)發(fā)的一種聲音文件格式,具有RIFF(Resource Interchange File Format)格式。RIFF 格式的wav 文件由若干個(gè)塊(Chunk)組成,按先后順序?yàn)镽IFF WAVE Chunk、Format Chunk、Fact Chunk(可選)和Data Chunk。每個(gè)塊的格式都固定且相似,一般一塊的第一部分是該塊的ID,作為標(biāo)識(shí);第二部分是該塊的大小;第三部分略有差異。wav格式文件的壓縮率比較低,比較容易進(jìn)行讀取,以及進(jìn)一步的處理。
濾波器在語(yǔ)音信號(hào)的共振峰估計(jì)、語(yǔ)譜圖等方面有著重要的作用。在語(yǔ)音信號(hào)的頻譜中,低頻分量往往包含了語(yǔ)音信號(hào)的重要特征。這些特征是語(yǔ)音信號(hào)處理、識(shí)別,以及說(shuō)話(huà)人識(shí)別、語(yǔ)譜圖形成等重要依據(jù)。獲得語(yǔ)音信號(hào)的低頻分量有著很大的實(shí)用價(jià)值。本文在Visual C++環(huán)境下設(shè)計(jì)濾波器,再用設(shè)計(jì)的濾波器對(duì)語(yǔ)音采樣數(shù)據(jù)進(jìn)行濾波,以期在后面的工作中用于語(yǔ)譜圖的形成。
按照時(shí)域單位抽樣響應(yīng)h(n)來(lái)分類(lèi),濾波器有兩種,分別是FIR (Finite Impulse Response)濾波器和IIR (Infinite Impulse Response)濾波器。FIR 濾波器在時(shí)域是有限長(zhǎng)的,其系統(tǒng)函數(shù)H(z)可表示為:
如果用時(shí)域沖擊響應(yīng)h(n)來(lái)表示,則可表示為:
其系統(tǒng)函數(shù)H(z)的極點(diǎn)全部位于z=0 處。從結(jié)構(gòu)上看,F(xiàn)IR 濾波器沒(méi)有從輸出到輸入的反饋,即FIR 濾波器屬于非遞歸型。
IIR濾波器在時(shí)域是無(wú)限長(zhǎng)的,其系統(tǒng)函數(shù)H(z)可表示為:
H(z)在有限z 平面(0<|z|<+∞)上存在極點(diǎn)。從結(jié)構(gòu)上看,IIR 濾波器有從輸出到輸入的反饋,即IIR 濾波器屬于遞歸型。
兩者相比較,實(shí)現(xiàn)同樣的幅頻特性時(shí),IIR 濾波器的階數(shù)可以少得多。但I(xiàn)IR 濾波器的相位是非線(xiàn)性的,這限制了IIR濾波器的應(yīng)用。而FIR濾波器可以實(shí)現(xiàn)線(xiàn)性相位,同時(shí),由于其單位抽樣響應(yīng)是有限長(zhǎng)的,因而這種系統(tǒng)一定是穩(wěn)定的。另外,F(xiàn)IR 濾波器的濾波可以采用FFT 算法來(lái)實(shí)現(xiàn),極大地提高了其運(yùn)算和處理的效率。因而,F(xiàn)IR濾波器得到了廣泛的應(yīng)用。
考慮到FIR 濾波器可以實(shí)現(xiàn)線(xiàn)性相位,本文采用頻率抽樣法設(shè)計(jì)一個(gè)FIR 低通濾波器,對(duì)語(yǔ)音采樣數(shù)據(jù)進(jìn)行濾波。頻率抽樣法就是在離散的頻域有:
對(duì)濾波器的每一個(gè)頻域點(diǎn)()的幅度和相位進(jìn)行設(shè)計(jì),再利用離散傅里葉反變換,得到濾波器的時(shí)域單位抽樣響應(yīng)()?;蛘咧苯討?yīng)用頻域響應(yīng)進(jìn)行濾波,再把頻域?yàn)V波結(jié)果利用離散傅里葉反變換得到時(shí)域結(jié)果。
設(shè)計(jì)的濾波器的截止頻率取30Hz,而語(yǔ)音信號(hào)的采樣頻率為44100Hz,這樣可以得到濾波器的數(shù)字截止頻率
為了提高阻帶最小衰減,使阻帶最小衰減δ≥40dB,從通帶到阻帶之間增加一個(gè)過(guò)渡帶點(diǎn),設(shè)定過(guò)渡帶寬Δω=ω/4=0.00034π,濾波器應(yīng)具有第一類(lèi)線(xiàn)性相位。
確定過(guò)渡帶抽樣點(diǎn)數(shù)=1,可以滿(mǎn)足阻帶最小衰減δ≥40dB的條件。
構(gòu)造頻率響應(yīng)函數(shù)H(eω)
上述構(gòu)造的濾波器的相位為:
頻域抽樣求(),先計(jì)算通帶寬度k
k實(shí)際上是通帶對(duì)應(yīng)的頻域抽樣點(diǎn)數(shù),再取一點(diǎn)過(guò)渡帶的值為0.38,則有
上述結(jié)果其實(shí)是根據(jù)FIR 濾波器的特性得到的。FIR濾波器在頻域是共軛對(duì)稱(chēng)的,即有:
進(jìn)一步,當(dāng)取奇數(shù)時(shí),有如下結(jié)論:
這樣就有了式⑻的結(jié)論。根據(jù)該結(jié)論可以進(jìn)一步得到:
=H,=H,即有=1,而=,…,=,故有:H=1,=0,1,…,8,11751,…,11758。
由此得低通濾波器完整的頻率抽樣響應(yīng)為:
根據(jù)其頻率響應(yīng),可以畫(huà)出濾波器的幅頻特性如圖1所示:
圖1 低通濾波器的幅度Hk與離散頻率關(guān)系圖
雖然對(duì)()求離散傅里葉反變換,可以求得時(shí)域單位抽樣響應(yīng)(),但是,實(shí)際上本文直接在頻域應(yīng)用()對(duì)語(yǔ)音信號(hào)采樣數(shù)據(jù)濾波,為下一步處理做準(zhǔn)備。
本文在Visual C++環(huán)境下編程實(shí)現(xiàn),對(duì)幾個(gè)英文單詞的音頻文件數(shù)據(jù)進(jìn)行低通濾波,為后面的工作做準(zhǔn)備。
前面述及的低通濾波器的時(shí)域波形()如圖2所示。
圖2 低通濾波器時(shí)域波形圖
英文單詞“important”的波形如圖3所示。
圖3 “important”的原始音頻波形圖
用低通濾波器濾波的結(jié)果如圖4所示。
圖4 “important”低通濾波后的波形圖
對(duì)比圖3 和圖4 可以清楚地看出,低通濾波后,原來(lái)語(yǔ)音的波形所包含的高頻分量全部被過(guò)濾,只剩下低頻部分,圖4中波形變化頻率明顯很低。
英文單詞“dictionary”的波形如圖5所示。
圖5 “dictionary”的原始音頻波形圖
用低通濾波器濾波的結(jié)果如圖6所示。
圖6 “dictionary”低通濾波后的波形圖
對(duì)比圖5 和圖6 可以清楚地看出,低通濾波后,原來(lái)語(yǔ)音的波形所包含的高頻分量全部被過(guò)濾,只剩下低頻部分,圖6中波形變化頻率明顯很低。
其他語(yǔ)音濾波結(jié)果沒(méi)有一一展示。
本文是在Visual C++環(huán)境下,設(shè)計(jì)低通濾波器,對(duì)語(yǔ)音信號(hào)進(jìn)行低通濾波,生成濾波語(yǔ)音的時(shí)域和頻域波形。數(shù)字濾波器在數(shù)字信號(hào)處理領(lǐng)域有著廣泛的應(yīng)用,數(shù)字濾波器有兩種,分別是FIR 濾波器和IIR濾波器,其中FIR 濾波器由于具有線(xiàn)性相位特征而得到廣泛應(yīng)用。本文采用頻域抽樣法設(shè)計(jì)了一個(gè)低通濾波器,得到了濾波器的頻域抽樣值,并直接在頻域?qū)φZ(yǔ)音采樣數(shù)據(jù)進(jìn)行濾波,得到頻域?yàn)V波結(jié)果,再通過(guò)傅里葉反變換轉(zhuǎn)換為時(shí)域波形,為后面的進(jìn)一步處理做準(zhǔn)備。