劉金剛+周翊+馬永保+劉宏清
摘 要:針對語音識(shí)別系統(tǒng)在噪聲環(huán)境下不能保持很好魯棒性的問題,提出了一種切換語音功率譜估計(jì)算法。該算法假設(shè)語音的幅度譜服從Chi分布,提出了一種改進(jìn)的基于最小均方誤差(MMSE)的語音功率譜估計(jì)算法。然后,結(jié)合語音存在的概率(SPP),推導(dǎo)出改進(jìn)的基于語音存在概率的MMSE估計(jì)器。接下來,將改進(jìn)的MSME估計(jì)器與傳統(tǒng)的維納濾波器結(jié)合。在噪聲干擾比較大時(shí),使用改進(jìn)的MMSE估計(jì)器來估計(jì)純凈語音的功率譜,當(dāng)噪聲干擾較小時(shí),改用傳統(tǒng)的維納濾波器以減少計(jì)算量,最終得到用于識(shí)別系統(tǒng)的切換語音功率譜估計(jì)算法。實(shí)驗(yàn)結(jié)果表明,所提算法相比傳統(tǒng)的瑞利分布下的MMSE估計(jì)器在各種噪聲的情況下識(shí)別率平均提高在8個(gè)百分點(diǎn)左右,在去除噪聲干擾、提高識(shí)別系統(tǒng)魯棒性的同時(shí),減小了語音識(shí)別系統(tǒng)的功耗。
關(guān)鍵詞:自動(dòng)語音識(shí)別系統(tǒng);魯棒性;最小均方誤差;語音存在概率;功率譜估計(jì);維納濾波器
中圖分類號: TN912.35
文獻(xiàn)標(biāo)志碼:A
文章編號:1001-9081(2016)12-3369-05