張明 劉祥樓 姜崢嶸
摘要:參數(shù)編碼是針對(duì)提取的語(yǔ)音信號(hào)特征參數(shù)進(jìn)行編碼,主要目的是使重建的語(yǔ)音信號(hào)具有盡可能高的可懂度。線(xiàn)性預(yù)測(cè)編碼(LPC)是一種有實(shí)用價(jià)值的經(jīng)典方法。通過(guò)對(duì)線(xiàn)性預(yù)測(cè)編碼地原理分析,選擇自相關(guān)算法中的萊文遜-杜賓算法求得預(yù)測(cè)系數(shù);在確定預(yù)測(cè)階數(shù)和增益后,對(duì)一段實(shí)際的語(yǔ)音信號(hào)進(jìn)行了預(yù)測(cè)仿真分析。實(shí)驗(yàn)結(jié)果表明,預(yù)測(cè)波形最大殘差小于0.3%。
關(guān)鍵詞:語(yǔ)音信號(hào); 參數(shù)編碼; 線(xiàn)性預(yù)測(cè)編碼; 仿真分析
中圖分類(lèi)號(hào): TN 911.72 文獻(xiàn)標(biāo)志碼: A doi: 10.3969/j.issn.1005-5630.2015.01.015
Abstract:Parameter coding is to extract the characteristic of speech signal. The main purpose is to improve the intelligibility of the reconstruction of speech signal. Linear prediction coding(LPC)is a valuable method. By analyzing the principle of LPC, we choose Levinson-Durbin algorithm for prediction coefficient. After determining the forecast order number and gain, we carry out the prediction simulation of a real speech signal. The experimental results show that maximum residual error of the predicted waveform is less than 0.3%.
Keywords:speech signal; parameter coding; linear prediction coding(LPC); simulation analysis
引 言
語(yǔ)言是人類(lèi)交換信息最為方便快捷的方式,語(yǔ)音信號(hào)處理是信號(hào)處理當(dāng)中的重要內(nèi)容之一[1]。語(yǔ)音信號(hào)的線(xiàn)性預(yù)測(cè)編碼(linear prediction coding,LPC)是在語(yǔ)音信號(hào)處理的基礎(chǔ)上,對(duì)語(yǔ)音信號(hào)線(xiàn)性預(yù)測(cè)模擬的一種分析方法。線(xiàn)性預(yù)測(cè)分析的重要性在于它提供了一種十分簡(jiǎn)潔的語(yǔ)音信號(hào)參數(shù)模型,這一組參數(shù)較精確地表征了語(yǔ)音信號(hào)的頻譜幅度,而且分析這些參數(shù)所需要的運(yùn)算量適中[2]。應(yīng)用這種模型參數(shù)可以降低編碼語(yǔ)音信號(hào)的數(shù)碼率,將LPC參數(shù)形成模板儲(chǔ)存在語(yǔ)音識(shí)別中既可以提高識(shí)別率又可以降低計(jì)算時(shí)間。
1 線(xiàn)性預(yù)測(cè)分析的基本原理
根據(jù)線(xiàn)性預(yù)測(cè)編碼原理,一個(gè)語(yǔ)音采樣序列的當(dāng)前值能夠通過(guò)對(duì)過(guò)去若干個(gè)語(yǔ)音采樣值的線(xiàn)性組合來(lái)逼近,若經(jīng)過(guò)優(yōu)化處理可以使預(yù)測(cè)值在最小均方誤差意義上逼近實(shí)際采樣值。若語(yǔ)音信號(hào)的取樣值序列設(shè)為s(n),n=1,2,…,p,…,信號(hào)當(dāng)前取樣值s(n)可以通過(guò)提取信號(hào)序列的前p個(gè)取樣值進(jìn)行加權(quán)預(yù)測(cè)得出,其預(yù)測(cè)值記為s^(n)。為了實(shí)現(xiàn)線(xiàn)性預(yù)測(cè)編碼,首先用系數(shù){ak}定義一個(gè)p階預(yù)測(cè)器F(z),其數(shù)學(xué)描述為:
2 語(yǔ)音信號(hào)線(xiàn)性預(yù)測(cè)仿真分析
語(yǔ)音信號(hào)的線(xiàn)性預(yù)測(cè)分析可以根據(jù)之前的信號(hào)預(yù)測(cè),仿真出現(xiàn)在的語(yǔ)音信號(hào)。由上面的計(jì)算可知,在選定合適的預(yù)測(cè)系數(shù)階數(shù)和增益G的情況下,可以得到理想的預(yù)測(cè)結(jié)果。為此,針對(duì)一段實(shí)際語(yǔ)音信號(hào)進(jìn)行線(xiàn)性預(yù)測(cè)驗(yàn)證分析。圖2所示為語(yǔ)音信號(hào)原始波形圖,圖中語(yǔ)音波形是由五個(gè)漢語(yǔ)單字組成的,本段語(yǔ)音的取樣點(diǎn)數(shù)很高,有幾萬(wàn)個(gè)取樣點(diǎn),圖3是線(xiàn)性預(yù)測(cè)的結(jié)果。
圖4為兩個(gè)波形的殘差。可以看到線(xiàn)性預(yù)測(cè)的效果較好,由于實(shí)際語(yǔ)音中所用到的抽樣點(diǎn)很多,無(wú)法直觀(guān)的看出各個(gè)點(diǎn)數(shù)的預(yù)測(cè)情況。從上面的語(yǔ)音信號(hào)中截取480個(gè)語(yǔ)音點(diǎn)來(lái)進(jìn)行同樣的預(yù)測(cè)分析,得到圖5所示的曲線(xiàn)圖。其中,深色的曲線(xiàn)代表原始語(yǔ)音波形,淺色的曲線(xiàn)代表估計(jì)語(yǔ)音波形,較為平直的線(xiàn)代表原始語(yǔ)音波形和估計(jì)語(yǔ)音波形之間的殘差。由圖5可以看出,線(xiàn)性預(yù)測(cè)的效果很好,估計(jì)波形已經(jīng)基本接近原始波形,其最大殘差小于0.3%。
3 結(jié) 論
在語(yǔ)音編碼算法中,如果對(duì)語(yǔ)音進(jìn)行直接編碼,則會(huì)導(dǎo)致編碼所需的比特?cái)?shù)較大,編碼所需的速率較高。為此,采用了線(xiàn)性預(yù)測(cè)這一編碼方法。本文在分析線(xiàn)性預(yù)測(cè)編碼器原理基礎(chǔ)上,利用Levinson-Durbin算法求解預(yù)測(cè)系數(shù)。通過(guò)對(duì)實(shí)際語(yǔ)音波形的線(xiàn)性預(yù)測(cè)實(shí)驗(yàn)證明:LPC線(xiàn)性預(yù)測(cè)效果比較理想,不僅大大減少量化比特?cái)?shù),而且降低了對(duì)編碼速率的需求。
參考文獻(xiàn):
[1] 劉云,沈連豐,朱惠芬.語(yǔ)音編碼技術(shù)及其實(shí)驗(yàn)研究[J].電氣電子教學(xué)學(xué)報(bào),2004,26(3):11-16.
[2] 周波,許萌.數(shù)字語(yǔ)音編碼技術(shù)研究[J].科技情報(bào)開(kāi)發(fā)與經(jīng)濟(jì),2008,18(3):165-167.
[3] 葉蕾,楊震,郭海燕.基于小波變換和壓縮感知的低速率語(yǔ)音編碼方案[J].儀器儀表學(xué)報(bào),2010,31(7):1569-1574.
[4] 潘麗娜,莊紫云,王戈,等.運(yùn)用半導(dǎo)體激光器進(jìn)行監(jiān)聽(tīng)以及音源定位的研究[J].光學(xué)儀器,2013,35(1):37-43.
[5] 楊會(huì)彩,樊延虎.幾種低速率語(yǔ)音編碼算法分析[J].延安大學(xué)學(xué)報(bào),2009,28(1):44-46.
[6] 陳立偉,趙春暉,孫玲,等.一種語(yǔ)音信號(hào)線(xiàn)性預(yù)測(cè)系數(shù)的求解新方法[J].應(yīng)用科技,2005,32(8):12-13.
(編輯:張 磊)