沈陽理工大學(xué)信息科學(xué)與工程學(xué)院 孫 博 梅鐵民
復(fù)倒譜去混響研究
沈陽理工大學(xué)信息科學(xué)與工程學(xué)院 孫 博 梅鐵民
語音信號(hào)去混響在通信、語音識(shí)別和聲源定位方面具有重要意義。首先介紹了混響產(chǎn)生的機(jī)理,其次闡述了復(fù)倒譜法去混響的基本原理。該方法利用在復(fù)倒譜域純凈語音信號(hào)和房間沖擊響應(yīng)的復(fù)倒譜分布不同的特點(diǎn)去除混響。通過仿真實(shí)驗(yàn),證明該算法在去混響中取得了較好的效果。本文采用的是逆濾波方法中經(jīng)典的復(fù)倒譜域?yàn)V波方法。聲源信號(hào)和房間沖擊響應(yīng)的復(fù)倒譜所在位置不同,前者主要集中在中間點(diǎn)較近的位置而后者集中在首尾兩端[1]。因此,利用這一差別,在給語音信號(hào)分段后去掉信號(hào)中的混響部分,之后進(jìn)行逆操作,完成去混響。
去混響;復(fù)倒譜;房間沖擊響應(yīng);語音信號(hào)
理論上,延時(shí)50ms以上的反射波產(chǎn)生的效應(yīng)稱為混響,混響不同于噪聲等毫不相干的外來干擾信號(hào),混響信號(hào)來源于聲源信號(hào),是一種有規(guī)律的干擾信號(hào)。
設(shè)s(n)聲源發(fā)出的語音信號(hào),x(n)為麥克風(fēng)收到聲源直接發(fā)射來的語音信號(hào)和經(jīng)過反射后的語音信號(hào):
其中,δ(n)為單位沖激函數(shù),忽略x(n)中的噪聲信號(hào)u(n),則x(n)可以表示為:
其中,*表示卷積計(jì)算,房間沖擊響應(yīng)h(n)是計(jì)算室內(nèi)混響的重要參數(shù)。
同態(tài)處理[2]是將非線性運(yùn)算變換為線性運(yùn)算,將卷積運(yùn)算轉(zhuǎn)化為加法運(yùn)算的技術(shù),對(duì)于一個(gè)線性系統(tǒng)來說,其輸入輸出關(guān)系服從疊加原理,設(shè)語音信號(hào)x(n)由聲源激勵(lì)信號(hào)s(n)和房間沖擊響應(yīng)h(n)的卷積構(gòu)成,則有:
卷積信號(hào)經(jīng)過同態(tài)系統(tǒng)后變換成一個(gè)處理過的卷積信號(hào),如圖1所示。
圖1 同態(tài)系統(tǒng)模型
圖2 沖激響應(yīng)函數(shù)
實(shí)驗(yàn)所用的語音是一段英文錄音,采樣頻率為44100Hz,圖2是采用鏡像法模擬的房間沖擊響應(yīng)函數(shù)。用語音與沖激響應(yīng)函數(shù)做卷積得到混響語音,然后給混響語音分幀,加漢明窗,幀長(zhǎng)1024,幀移為256。設(shè)計(jì)一種倒譜域上的低通濾波器(見圖3),經(jīng)過研究比對(duì),當(dāng)最高截止點(diǎn)為幀長(zhǎng)的1/256,過渡帶帶寬為幀長(zhǎng)的1/16時(shí),得到的去混響效果最好。
圖3 低通濾波器
分幀后,對(duì)每一幀語音信號(hào)的倒譜進(jìn)行濾波。圖4以第10幀信號(hào)的倒譜為例,引入混響后的語音信號(hào)的倒譜圖較之前有了變化,濾波后的倒譜圖的中部變平了。圖5中的波形由上至下依次為原始語音、加混響后語音和去混響后語音的時(shí)域波形,從中可以看出,加混響后的語音波形較原始語音發(fā)生了變化,而去混響后的語音波形還原了原始語音的一些細(xì)節(jié)。
圖4 加混響前后及濾波前后的語音信號(hào)倒譜圖
圖5 去混響前后語音時(shí)域波形對(duì)比圖
表1 去混響性能改善評(píng)測(cè)表
本文采用主觀和客觀兩類評(píng)測(cè)方法,客觀評(píng)價(jià)方法包含時(shí)域和頻域兩類評(píng)測(cè)指標(biāo),分別是信混噪比改善△SRNR,這是一種時(shí)域的評(píng)測(cè)標(biāo)準(zhǔn),還有線性預(yù)測(cè)倒譜系數(shù)距離改善△LPCC和MEL頻率倒譜系數(shù)距離改善△MFCC[3],這是兩種頻域評(píng)測(cè)指標(biāo)。其中,△SRNR反映信號(hào)在時(shí)域波形上的失真度,能夠很直觀的反映問題。△LPCC和△MFCC是從頻域方面模擬人耳的聽覺特性。
表1是采用復(fù)倒譜法去混響實(shí)驗(yàn)中應(yīng)用兩類評(píng)測(cè)方法所得出的結(jié)果,客觀評(píng)測(cè)指標(biāo)數(shù)值越高表明去混響效果越好,主觀評(píng)測(cè)指標(biāo)則是按照優(yōu)、良、中、差、劣五個(gè)等級(jí)來說明,可以看出語音去混響有一定效果。
研究了混響是如何產(chǎn)生的以及混響的特性,論述同態(tài)信號(hào)處理的原理,說明了復(fù)倒譜法去混響的原理和運(yùn)算方法,依據(jù)在復(fù)倒譜域上混響信號(hào)與語音信號(hào)所在位置不同的特征,設(shè)計(jì)出了適用的低通濾波器來減弱房間沖擊響應(yīng)對(duì)聲音信號(hào)的干擾。分析了評(píng)價(jià)去混響效果的主觀和客觀的評(píng)測(cè)指標(biāo),并給出了評(píng)測(cè)結(jié)果,證明復(fù)倒譜去混響的方法起到了一定效果。
[1]張德會(huì),陳光治.復(fù)倒譜域語音信號(hào)去混響研究[J].聲學(xué)技術(shù),2009,28(1).
[2]張雪英.數(shù)字語音處理及MATLAB仿真[M].北京:電子工業(yè)出版社,2016.
[3]宋知用.MATLAB在語音信號(hào)分析與合成中的應(yīng)用[M].北京:北京航空航天大學(xué)出版社,2013.