劉垚彤
摘要:數(shù)字語音有許多模擬語音不可比擬的優(yōu)點:它便于傳輸和存儲,能夠在噪聲信道中進行可靠傳輸,易于交換,能夠方便地加密傳輸。但由于未經(jīng)任何處理的數(shù)字語音數(shù)據(jù)量很大,若不經(jīng)過處理,那么在傳輸和存儲時會占用大量的信道資源和存儲空間,給系統(tǒng)提出很高的要求,因此數(shù)字語音一般都要進行壓縮編碼。ADPCM采用自適應量化和自適應預測方法,對PCM(脈沖編碼調(diào)制)語音信號進行再壓縮,是一種有效的語音信號波形編碼壓縮方法。自適應差分脈沖調(diào)制技術在語音壓縮編碼中得到廣泛運用。
關鍵詞:語音壓縮? 自適應脈沖編碼調(diào)制(ADPCM)? G.721? matlab
隨著通信、計算機網(wǎng)絡等技術的飛速發(fā)展,語音壓縮編碼技術在移動通信、衛(wèi)星通信、多媒體技術以及電話通信中得到普遍應用,起著舉足輕重的作用。為了減少傳輸碼率,降低傳輸帶寬,提高經(jīng)濟效益,在保證一定的通信質(zhì)量的前提下,國內(nèi)外對壓縮編碼的研究非常重視。
語音編碼就是將模擬語音信號數(shù)字化。如果對語音信號直接采用模/數(shù)(A/D)轉(zhuǎn)換技術進行編碼,則傳輸或存儲語音的數(shù)據(jù)量太大,為了降低傳輸速率或存儲容量,就必須對其進行壓縮編碼。還原時以壓縮的相反過程進行解碼,再經(jīng)過數(shù)/模(D/A)轉(zhuǎn)換合成近似的模擬語音信號。迄今已有各種各樣的語音編解碼技術,有脈沖編碼調(diào)制(PCM)、增量調(diào)制(DM)、差分脈碼調(diào)制(DPCM)和自適應差分脈沖編碼調(diào)制(ADPCM),它們都屬于語音編碼壓縮技術。
其中公認的較好方法是ADPCM編解碼技術。1984年CCITT經(jīng)過研究比較提出了G.721建議,決定以碼率為32kb/s的ADPCM作為語音壓縮的國際標準,它兼顧了通信質(zhì)量和設備的復雜性。該標準并于1986年做了進一步的修改。CCITTG.721建議的ADPCM編解碼算法已由法國中央國家通信研究所研制的數(shù)字信號處理單元TM32010實現(xiàn),它把語音傳輸碼率由64kb/s壓縮到32kb/s,而且體積小,功耗和成本低,使信道容量增加1倍,是數(shù)字通信中的重大突破。
在保證一定的編碼語音質(zhì)量的前提下如何高效率地進行壓縮編碼,或者在給定信息速率的前提下如何提高編碼后的語音質(zhì)量,是語音編碼研究的重點。ADPCM利用了語音信號樣點間的相關性,并正對語音信號的非平穩(wěn)特點,使用了自適應預測和自適應量化,在32kb/s速率上能夠給出網(wǎng)絡等級語音質(zhì)量,從而符合進入公用網(wǎng)的要求。自適應差分脈沖調(diào)制技術是具有可調(diào)參數(shù)的語音壓縮技術,可根據(jù)信號自適應預測和量化,使實際樣本值和預測值之間的差值總是最小,這是其他語音編碼技術不能做到的。研究自適應差分脈沖調(diào)制仿真具有重要意義。
人們把話路速率低于64kbit/s的語音編碼方法,稱為語音壓縮編碼技術。常見的語音壓縮編碼有脈沖編碼調(diào)制(PCM)、差分脈碼編碼調(diào)制(DPCM)、自適應增量調(diào)制(ADM)、自適應差分脈沖編碼調(diào)制(ADPCM)等。
自適應差分脈沖調(diào)制(ADPCM)是用預測編碼來壓縮數(shù)據(jù)量。它結(jié)合了ADM的差分信號與PCM的二進制碼的方法,是一種性能比較好的波形編碼。自適應量化的基本思想就是讓量化階距與輸入信號幅度變化相匹配,即量化階距應當隨著輸入信號幅度變化而增減,從而進一步改善量化效果。
改變量化階大小的方法有兩種:一種稱為前向自適應,另一種稱為后向自適應。前向自適應是根據(jù)未量化的樣本值的均方根值來估算輸入信號的電平,以此來確定量化階的大小,并對其電平進行編碼作為邊信息傳送到接收端。后向自適應是從量化器剛輸出的過去樣本中來提取量化階信息。由于后向自適應能在發(fā)收兩端自動生成量化階,所以它不需要傳送邊信息。
自適應差分脈碼調(diào)制(ADPCM)就是在相同質(zhì)量指標的條件下,降低數(shù)字化語音數(shù)碼,壓縮數(shù)字化語音占用頻帶,提高數(shù)字通信系統(tǒng)的頻帶利用率。我們在詳細分析CCITTG.721標準算法的基礎上,充分利用數(shù)字信號各種數(shù)學運算技巧,盡量壓縮指令執(zhí)行時間,采用計算機模擬標準算法作為調(diào)試手段,使之達到運算精度與G.721完全一致,實現(xiàn)ADPCM的調(diào)制仿真。
通過對標準算法描述的研究后,可以將其按照ADPCM編碼中最重要的兩個方面,把算法分為自適應量化和自適應預測兩個大的功能算法模塊,它們共同作用實現(xiàn)了G.721編碼器算法,如圖4.2所示。
自適應差分脈沖編碼調(diào)制(ADPCM)結(jié)合了DPCM和ADM,可以理解為在差分算法DPCM的基礎上根據(jù)自適應增量ADM編碼原理進行的算法改進。改進的算法環(huán)節(jié)有兩個:①量化器的量化步長隨著輸入信號電平的相關變化而隨時做出調(diào)整,用大的量化步長去量化大的差值,用小的量化步長去量化小的差值。②線性預測濾波器的預測參數(shù)是自適應的隨時調(diào)整的。
以上就是ADPCM的一般編碼流程,因為解碼過程幾乎完全是編碼的逆操作,暫不具體具體說明。
通過編寫matlab的G.721-ADPCM程序的相關程序,采用的G.721-ADPCM算法,通過matlab軟件,導入獲取的語音,為了更好體現(xiàn)效果,可采用一小段歌曲,運用未加噪聲和加了噪聲兩種情況演示,通過ADPCM處理后語音波形的對比,得出如下結(jié)論:
通過載入語音之后,原語音的波形和經(jīng)過G.721ADPCM編碼之后的語音波形對比,音質(zhì)沒什么差別。放大后可以看出經(jīng)過ADPCM處理后的波形與原始波形非常接近,僅在振幅上有很微小的差別。加了噪聲之后查看仿真波形,并且通過改變不同的信噪比,來對比仿真的波形結(jié)果。
通過結(jié)果分析可知:ADPCM可以達到較好的編解碼效果,解碼后信號恢復較好。隨著信噪比的增大,原始語音信號與解碼后信號的相關系數(shù)越來也大,說明恢復的信號與原始信號越來越相近,效果越來越好。在相同比特速率條件下,ADPCM比PCM信噪比也有很大的改善,在改善量化噪聲方面優(yōu)于PCM系統(tǒng)。結(jié)合其他語音編碼分析可知,經(jīng)過ADPCM調(diào)制后的信號,其傳輸?shù)谋忍芈室萈CM的低很多,大大降低了碼元傳輸速率和壓縮傳輸帶寬,從而增加了通信容量。保持了很高語音編碼質(zhì)量。
ADPCM的根本作用是使語音通信數(shù)字化,而語音通信的數(shù)字化將使通信技術的水平提高一大步。對于蓬勃興起的移動通信和個人通信,語音編碼技術就是其中非常重要的支撐技術。ADPCM編碼作為一種經(jīng)典的語音編碼,算法結(jié)構較為簡潔,能夠很好的壓縮語音信號,減小存儲空間,提高傳輸速率,在一般電子通訊系統(tǒng)中有望得到進一步的應用。
參考文獻
[1]蔣青,于秀蘭.通信原理(第二版)[M].人民郵電出版社.2008: 96-128.
[2]高文,等.《數(shù)字視頻編碼技術原理》.科學出版社.2010.
[3]韓紀慶,張磊,等.語音信號處理[M].清華大學出版社.2004:114-158.
[4]吳力勤,基于語音壓縮編碼算法的研究與實現(xiàn)[D].四川大學.2006.
[5]景振毅,等.MATLAB7.0實用寶典[M].中國鐵道出版社.2009 .
[6]張雄偉,等.現(xiàn)代語音處理技術及應用.機械工業(yè)出版社.