張 楊中央人民廣播電臺(tái),北京 100866
音頻編碼技術(shù)及廣播電臺(tái)數(shù)字編碼壓縮傳輸系統(tǒng)建設(shè)
張楊
中央人民廣播電臺(tái),北京100866
摘要隨著廣播電視數(shù)字化技術(shù)的迅猛發(fā)展,數(shù)字音頻壓縮編碼技術(shù)已在廣電領(lǐng)域得到廣泛應(yīng)用。本文介紹了音頻編碼的分類、原理、現(xiàn)行主流標(biāo)準(zhǔn)以及我國(guó)自主研發(fā)的DRA數(shù)字音頻編碼標(biāo)準(zhǔn)。同時(shí)以廣播電臺(tái)為實(shí)例,對(duì)播出音頻信號(hào)的數(shù)字編碼壓縮傳輸系統(tǒng)進(jìn)行了簡(jiǎn)要介紹。
關(guān)鍵詞數(shù)字化;音頻編碼;DRA;壓縮傳輸
隨著我國(guó)廣播電視技術(shù)數(shù)字化的快速推進(jìn)和發(fā)展,模擬信號(hào)在傳輸中存在著帶寬高效果差等問(wèn)題,已不能滿足廣播電視發(fā)展的需要,目前圖像、聲音都采用了較為常見(jiàn)的數(shù)字編碼技術(shù)。為了追求更高的編碼效率,產(chǎn)生了許多音頻編碼標(biāo)準(zhǔn)。不同用戶針對(duì)各自業(yè)務(wù)類型,選用不同的編碼標(biāo)準(zhǔn)實(shí)現(xiàn)音頻信號(hào)的數(shù)字化傳輸。
與傳統(tǒng)模擬音頻技術(shù)相比,數(shù)字音頻具有無(wú)法比擬的優(yōu)點(diǎn),例如傳輸質(zhì)量高、可采用糾錯(cuò)編碼技術(shù)提高抗干擾能力,可實(shí)現(xiàn)大規(guī)模集成等。
通常意義上,數(shù)字音頻編碼主要分為兩大類:
1)無(wú)損壓縮,對(duì)音頻數(shù)據(jù)進(jìn)行編碼后,將信息冗余去除,采用該方式進(jìn)行壓縮,可保證信號(hào)聲音質(zhì)量不受損傷,但壓縮效率不高,通常最高只有一倍左右。目前在互聯(lián)網(wǎng)應(yīng)用中,比較常用的無(wú)損壓縮方式有FLAC,LPAC, APE, WavPack等。
2)有損壓縮,心理聲學(xué)模型是這類算法的核心思想,由于人類對(duì)信號(hào)的不敏感性,壓縮過(guò)程中會(huì)損失一部分信息,但通常能夠獲得較高的壓縮比,常用的有損壓縮方式有MP3,AAC等。
根據(jù)音頻壓縮技術(shù)原理的差異,音頻編碼主要分為如下四種編碼[1]:
1)基于音頻數(shù)據(jù)的統(tǒng)計(jì)特性進(jìn)行編碼,其中對(duì)波形編碼是典型技術(shù)。其目標(biāo)是使重建語(yǔ)音波形保持原波形的形狀。利用音頻抽樣的幅度分布規(guī)律和相鄰樣值具有相關(guān)性的特點(diǎn)。波形編碼適應(yīng)性強(qiáng),音頻質(zhì)量好,但壓縮比不大,因而數(shù)據(jù)率較高。
2)基于音頻的聲學(xué)參數(shù)來(lái)進(jìn)行編碼,可進(jìn)一步降低數(shù)據(jù)率。其目標(biāo)是使重建音頻保持原音頻的特性。常用的音頻參數(shù)有線性預(yù)測(cè)系數(shù)、共振峰、濾波器組等。這種編碼技術(shù)的優(yōu)點(diǎn)是壓縮數(shù)據(jù)率低,但還原信號(hào)的質(zhì)量不好,語(yǔ)音可能不清晰。
3)混合編碼方式即是將波形編碼的高質(zhì)量與參數(shù)編碼的低數(shù)據(jù)率這兩者特性相結(jié)合,這樣就能在較低的碼率上得到較高的音質(zhì)。目前在通訊中用到的大多數(shù)語(yǔ)音編碼器都是采用了混合編碼方式。
4)感知編碼是基于人的聽(tīng)覺(jué)特性來(lái)進(jìn)行:從人的聽(tīng)覺(jué)系統(tǒng)出發(fā),基于心里聲學(xué)模型,利用人耳的聽(tīng)覺(jué)閾值特性和掩蔽效應(yīng),消除不被感知的冗余信息來(lái)實(shí)現(xiàn)對(duì)音頻數(shù)據(jù)進(jìn)行壓縮的編碼方式。
根據(jù)應(yīng)用場(chǎng)合的不同,可以分為如下兩種編碼:
1)語(yǔ)音編碼:針對(duì)語(yǔ)音信號(hào)進(jìn)行的編碼壓縮,主要應(yīng)用于實(shí)時(shí)語(yǔ)音通信中減少語(yǔ)音信號(hào)的數(shù)據(jù)量。典型的編碼標(biāo)準(zhǔn)有3GPP2 QCELP8k、QCELP 13k、3GPPAMRNB、AMR-WB;ITU-T G.711、G.722、G.723.1、G.729;GSMHR、FR、EFR; EVRC、4GV-NB等。
2)音頻編碼:對(duì)頻率范圍比較寬的音頻信號(hào)進(jìn)行的一種編碼方式。主要應(yīng)用于數(shù)字廣播和數(shù)字電視廣播、消費(fèi)電子產(chǎn)品、音頻信息的存儲(chǔ)、下載等。典型的編碼有MPEG1/MPEG2的layer1、2、3和MPEG 4 AAC的音頻編碼,還有最新的ITU-T G.722.1、3GPP AMR-WB+和3GPP 2 4GV-WB。
1)杜比AC-3標(biāo)準(zhǔn)。
杜比AC-3是由美國(guó)杜比實(shí)驗(yàn)室主要針對(duì)環(huán)繞聲開(kāi)發(fā)的一種音頻壓縮技術(shù),它將特殊的心理音響知識(shí)、先進(jìn)的數(shù)字信號(hào)處理技術(shù)與人耳效應(yīng)最新研究成果很好的結(jié)合,形成了“數(shù)字多聲道音頻處理技術(shù)”,該技術(shù)能夠?qū)⒍鄠€(gè)音頻信道的信號(hào)編成一個(gè)碼流,碼率為32~640kbit/s,取樣頻率為48kHz。它具備單聲道、立體聲和5.1環(huán)繞聲功能。
杜比AC-3最早是針對(duì)影院系統(tǒng)設(shè)計(jì)開(kāi)發(fā)的,目前已成為應(yīng)用最為廣泛的環(huán)繞聲壓縮技術(shù)之一,該標(biāo)準(zhǔn)在DVD數(shù)字視盤(pán)機(jī)、數(shù)字電視廣播、院線系統(tǒng)以及直播衛(wèi)星平臺(tái)等方面都得到廣泛應(yīng)用。
2)MPEG-1音頻編碼標(biāo)準(zhǔn)(MP3)。
MPEG-1標(biāo)準(zhǔn)第3部分(IS0/IEC 11172-3《信息技術(shù)具有1.5 Mbit/s數(shù)據(jù)傳輸率的數(shù)字存儲(chǔ)媒體運(yùn)動(dòng)圖像及其伴音的編碼第3部分:音頻》)是第一個(gè)高保真音頻數(shù)據(jù)壓縮標(biāo)準(zhǔn),作為MPEG-1標(biāo)準(zhǔn)的一部分,可以完全獨(dú)立應(yīng)用。MPEG-1是以人類聽(tīng)覺(jué)系統(tǒng)的心理聲學(xué)原理為基礎(chǔ)的感知編碼,采用了MUSICAM(掩蔽型通用子帶綜合編碼和復(fù)用)和ASPEC(自適應(yīng)頻譜心理聲學(xué)熵編碼)算法,利用最小聽(tīng)閾和掩蔽特性創(chuàng)建的編碼模型來(lái)進(jìn)行數(shù)據(jù)壓縮。
3)MPEG-2音頻編碼標(biāo)準(zhǔn)。
MPEG-2的音頻(ISO/IEC 13818-3《信息技術(shù)運(yùn)動(dòng)圖像及其伴音信號(hào)的通用編碼第3部分:音頻》)采用感覺(jué)壓縮編碼技術(shù)的多聲道系統(tǒng),充分利用心理聲學(xué)的掩蔽效應(yīng)和哈斯效應(yīng),將原始音頻信號(hào)中不相關(guān)分量和冗余分量有效的去除,在不影響人耳聽(tīng)覺(jué)閾度和聽(tīng)音效果質(zhì)量的前提下,將音頻信號(hào)進(jìn)行壓縮,與MP3相比,在聽(tīng)感質(zhì)量相同的條件下數(shù)據(jù)率是它的70%,其缺點(diǎn)是兼容性差。
由于MPEG-2的壓縮技術(shù)特點(diǎn),因此特別適用于廣播級(jí)的數(shù)字電視的編碼和傳送。目前我國(guó)的有線數(shù)字電視系統(tǒng)采用的就是MPEG-2編碼標(biāo)準(zhǔn)。
4)WMA音頻編碼標(biāo)準(zhǔn)。
WMA是基于音頻信號(hào)在互聯(lián)網(wǎng)等領(lǐng)域應(yīng)用的數(shù)字音頻壓縮算法。由于其具有更低的碼率,目前已經(jīng)成為網(wǎng)絡(luò)音頻資源的重要標(biāo)準(zhǔn)之一。
目前,有許多在線音頻網(wǎng)站使用的都是WMA格式(通常碼率為64kbps)。
從上述幾個(gè)流行標(biāo)準(zhǔn)看出,全球市場(chǎng)上音頻編碼的核心技術(shù)基本掌握在美國(guó)、歐洲等國(guó)家手中,據(jù)統(tǒng)計(jì),我國(guó)每年需要向前杜比、MPEG2等國(guó)外企業(yè)組織提供數(shù)億美元的數(shù)字音頻技術(shù)專利費(fèi)用。
所以,我國(guó)通過(guò)自己的技術(shù)力量,相繼研發(fā)了具有自主知識(shí)產(chǎn)權(quán)的音頻編碼技術(shù)。
1)DRA標(biāo)準(zhǔn)。
我國(guó)在2009年頒布了具有自主知識(shí)產(chǎn)權(quán)的音頻編碼國(guó)家標(biāo)準(zhǔn)GB/T22726-2008《多聲道數(shù)字音頻編解碼技術(shù)規(guī)范》(DRA)[4]
我國(guó)自主研發(fā)的DRA技術(shù)的主要性能指標(biāo)已經(jīng)達(dá)到國(guó)際先進(jìn)水平,具有音質(zhì)好、壓縮效率高、容錯(cuò)能力強(qiáng)和解碼復(fù)雜度低的顯著優(yōu)點(diǎn),可廣泛應(yīng)用于數(shù)字電視、數(shù)字音頻廣播、寬帶多媒體及移動(dòng)多媒體等領(lǐng)域。
目前,DRA已經(jīng)作為中國(guó)移動(dòng)多媒體廣播(CMMB)的必選音頻標(biāo)準(zhǔn),隨后,在我國(guó)地面數(shù)字電視系統(tǒng)(DTMB)、直播衛(wèi)星系統(tǒng)(ABS-S)中驗(yàn)證了DRA標(biāo)準(zhǔn)的可行性,并且在調(diào)頻頻段數(shù)字音頻廣播(CDR)系統(tǒng)中,采用DRA+標(biāo)準(zhǔn)作為音頻新源編碼算法使用[5]。
2)AVS標(biāo)準(zhǔn)。
AVS是我國(guó)具有自主知識(shí)產(chǎn)權(quán)的的編碼標(biāo)準(zhǔn),它能夠?qū)?shù)字音視頻的海量數(shù)據(jù)進(jìn)行編碼壓縮,達(dá)到了國(guó)際的先進(jìn)水平,AVS音視頻編碼壓縮標(biāo)準(zhǔn)的各類指標(biāo)甚至超過(guò)了MPEG AAC。
4.1數(shù)字壓縮編碼傳輸
廣播電臺(tái)在完成數(shù)字化改造的基礎(chǔ)上,也在實(shí)現(xiàn)從基帶傳輸向數(shù)字壓縮編碼傳輸逐漸過(guò)渡,目標(biāo)是將立體聲廣播的音頻基帶信號(hào)(AES/EBU)進(jìn)行MPEG編碼和MPEG-2 TS復(fù)用,形成1路或多路標(biāo)準(zhǔn)的多節(jié)目流(MPTS),經(jīng)過(guò)傳輸鏈路向下一級(jí)單位提供廣播電臺(tái)的廣播業(yè)務(wù)。
4.2ASI架構(gòu)與IP架構(gòu)的比較
在數(shù)字壓縮編碼復(fù)用系統(tǒng)的選型上,有ASI架構(gòu)與IP架構(gòu)兩種方式,ASI架構(gòu)是廣播電視數(shù)字化改造后的第一代前端架構(gòu),隨著IP技術(shù)與業(yè)務(wù)類型的拓展,有越來(lái)越多的運(yùn)營(yíng)商選擇了IP架構(gòu)前端。但ASI架構(gòu)與IP架構(gòu)由于采用不同的信號(hào)傳輸類型、物理接口、線纜類型,所以在系統(tǒng)特點(diǎn)上有所差異,下面從功能性、集成性、安全性、擴(kuò)展性四個(gè)方面進(jìn)行比較。
1)功能性。
編碼、復(fù)用是一個(gè)數(shù)字前端必備的兩個(gè)功能環(huán)節(jié),數(shù)字化改造后,在有線數(shù)字電視運(yùn)營(yíng)前端機(jī)房、電臺(tái)/電視臺(tái)傳輸機(jī)房,都會(huì)建設(shè)編碼復(fù)用系統(tǒng)。
就ASI架構(gòu)而言,早期是由編碼器、復(fù)用器等獨(dú)立設(shè)備單元組成,編碼器接收各種類型信源信號(hào)(如衛(wèi)星接收機(jī)輸出、電臺(tái)/電視臺(tái)制作輸出、國(guó)干網(wǎng)下傳接收等),輸出ASI碼流至復(fù)用器,經(jīng)過(guò)復(fù)用器,將多路單節(jié)目ASI碼流復(fù)用成1路多節(jié)目ASI碼流輸出,供后端鏈路使用。隨著技術(shù)的進(jìn)步,設(shè)備集成度越來(lái)越高,編碼與復(fù)用功能可以通過(guò)一臺(tái)高集成度設(shè)備完成,減少了設(shè)備數(shù)量、線纜數(shù)量,一定程度上降低了系統(tǒng)復(fù)雜度。
在IP架構(gòu)中,編碼、復(fù)用設(shè)備都是通過(guò)IP以太網(wǎng)連接,目前大多數(shù)系統(tǒng)采用編碼復(fù)用一體機(jī),支持多種信源業(yè)務(wù)輸入,完成功能與ASI架構(gòu)一樣。但I(xiàn)P架構(gòu)中采用的編碼復(fù)用設(shè)備,一般都可支持ASI與IP方式同步雙路輸出。
2) 集成性。
ASI架構(gòu)中,設(shè)備獨(dú)立性強(qiáng),且1個(gè)ASI通道只能傳送1路TS流,在廣播電視業(yè)務(wù)中,1路TS流一般不會(huì)超過(guò)20套節(jié)目,所以,ASI架構(gòu)的集成性較弱。
IP架構(gòu)中,由于IP通道特性,在帶寬允許的情況下,1個(gè)IP通道可以傳送多路TS流,所以1個(gè)通道可以傳送幾十套甚至上百套節(jié)目。
在節(jié)目數(shù)量較多的情況下,IP架構(gòu)的系統(tǒng)結(jié)構(gòu)簡(jiǎn)潔、占用空間小,管理簡(jiǎn)化,集成性優(yōu)于ASI架構(gòu)。
3) 安全性。
ASI架構(gòu)中,設(shè)備之間按照嚴(yán)格的邏輯關(guān)系連接構(gòu)建,每臺(tái)設(shè)備的上下游連接是確定的,每個(gè)通道都是單向傳輸,通道之間完全獨(dú)立;在IP架構(gòu)中,無(wú)需考慮設(shè)備連線之間的邏輯結(jié)構(gòu),直接將IP信號(hào)送至交換機(jī)的任意端口即可,通過(guò)對(duì)信號(hào)IP地址的規(guī)劃配置,實(shí)現(xiàn)信號(hào)流的傳送,因?yàn)镮P為雙向傳輸,通道之間需要通過(guò)VLAN劃分等處理才可實(shí)現(xiàn)通道間的獨(dú)立,同時(shí)由于IP傳輸協(xié)議的特性,在傳輸數(shù)字碼流時(shí)會(huì)出現(xiàn)延遲、抖動(dòng)現(xiàn)象,TS流的傳輸將受到網(wǎng)絡(luò)服務(wù)質(zhì)量的影響,并最終影響接收質(zhì)量。
由此可見(jiàn),ASI架構(gòu)的安全性、穩(wěn)定性更加出色。
4) 擴(kuò)展性。
基于前面幾點(diǎn)的分析,IP架構(gòu)為雙向通道,利用了成熟的IP協(xié)議、路由交換及網(wǎng)絡(luò)技術(shù),不僅可以完美支持ASI平臺(tái)的各種增值業(yè)務(wù),并且可方便的支持基于IP傳輸?shù)母鞣N類型業(yè)務(wù),更加適用于三網(wǎng)融合應(yīng)用。
4.3 電臺(tái)采用ASI架構(gòu)的考慮
在數(shù)字電視大規(guī)模普及的今年,幾乎所有的有線運(yùn)營(yíng)商均采用了IP架構(gòu)的前端,這是因?yàn)樽鳛檫\(yùn)營(yíng)商前端,節(jié)目數(shù)量龐大、業(yè)務(wù)類型繁多,可以采用集成度很高的設(shè)備,在系統(tǒng)擴(kuò)展性、靈活性上都有突出優(yōu)勢(shì)。但I(xiàn)P架構(gòu)在可靠性、安全性方面,則比ASI略遜一籌。
廣播電臺(tái)作為節(jié)目制作單位,有以下幾個(gè)特點(diǎn),一是作為第一級(jí)信源單位,對(duì)信號(hào)傳輸?shù)目煽啃砸笞罡?;二是?jié)目數(shù)量不多;三是業(yè)務(wù)類型單一,為單純的音頻廣播節(jié)目。
在傳統(tǒng)的ASI解決方案中,設(shè)備之間是通過(guò)ASI電纜進(jìn)行連接,它們之間的連接邏輯是十分嚴(yán)格的,每條通道之間相互沒(méi)有交叉,可以完全確保節(jié)目傳輸?shù)陌踩?,ASI架構(gòu)相對(duì)IP架構(gòu),系統(tǒng)的封閉性更好,能夠很好的防止安全播出事故的發(fā)生。所以,針對(duì)廣播電臺(tái),更多采用ASI架構(gòu),能夠達(dá)到最安全最優(yōu)質(zhì)的傳輸。
4.4典型廣播電臺(tái)數(shù)字傳輸系統(tǒng)
1)編碼復(fù)用與應(yīng)急系統(tǒng)。
以典型的廣播電臺(tái)傳輸系統(tǒng)為例,整個(gè)系統(tǒng)由編碼復(fù)用切換系統(tǒng)和應(yīng)急系統(tǒng)組成,其中編碼復(fù)用切換系統(tǒng)包括編碼器1+1備份,復(fù)用器的1+1備份和切換器的1+1備份,經(jīng)過(guò)主、備適配器傳輸?shù)较乱患?jí)單位。自主、備復(fù)用器的MPTS實(shí)現(xiàn)分析和監(jiān)測(cè),在特定的報(bào)警切換條件下,實(shí)現(xiàn)碼流的無(wú)縫切換,并支持?jǐn)嚯娭蓖üδ?。切換條件包括TR101-290標(biāo)準(zhǔn),節(jié)目丟失,比特率異常等。
應(yīng)急系統(tǒng)是編碼復(fù)用切換系統(tǒng)的又一級(jí)保障,通過(guò)編碼器編碼和復(fù)用器的節(jié)目拷貝功能,復(fù)用成1路含有多路音頻的多節(jié)目碼流(MPTS)。發(fā)生故障時(shí),通過(guò)跳線,實(shí)現(xiàn)與編碼復(fù)用切換系統(tǒng)手動(dòng)切換。為了保證下一級(jí)接收單元和終端接收者的正常接收,此MPTS和編碼復(fù)用切換系的MPTS保證完全的一致,包括PSI/SI信息、音頻的PID、總碼率等。
2)碼流監(jiān)測(cè)系統(tǒng)。
根據(jù)業(yè)務(wù)傳輸系統(tǒng)鏈路,在編碼復(fù)用切換系統(tǒng)中共設(shè)置了碼流質(zhì)量監(jiān)測(cè)系統(tǒng),監(jiān)測(cè)節(jié)點(diǎn)包括主備編碼器輸出、主備復(fù)用器輸出、應(yīng)急復(fù)用器輸出、主備切換器輸出,以提供有效的報(bào)警信息及應(yīng)急處理預(yù)案,保證整個(gè)編碼復(fù)用生產(chǎn)系統(tǒng)的穩(wěn)定運(yùn)營(yíng)。
音頻技術(shù)的數(shù)字化時(shí)代早已開(kāi)始,音頻領(lǐng)域的變革在隨時(shí)隨地的發(fā)生,人們對(duì)收聽(tīng)質(zhì)量的要求也越來(lái)越高。廣播電臺(tái)的編碼復(fù)用系統(tǒng)建設(shè),要從業(yè)務(wù)需求出發(fā),選擇適合的音頻編碼技術(shù)與傳輸方案,服務(wù)于廣大聽(tīng)眾。
編碼復(fù)用切換單元將主、備路立體聲數(shù)字音頻基帶信號(hào)(AES/EBU)作為主、備編碼器的輸入源,對(duì)其進(jìn)行MPEG1 Layer2編碼壓縮和MPEG2的碼流封裝,壓縮后的音頻節(jié)目SPTS流,輸入到主、備復(fù)用器。復(fù)用器對(duì)輸入碼流進(jìn)行統(tǒng)一規(guī)劃,包括節(jié)目名稱,節(jié)目號(hào),音頻PID等,復(fù)用成1路標(biāo)準(zhǔn)的多節(jié)目碼流(MPTS)。主、備編碼器和主、備復(fù)用器之間水平和交叉連接,復(fù)用器支持端口1+1熱備份和編碼器的1+1熱備份。
主、備復(fù)用器和主、備切換器采用水平和交叉連接,切換器支持主備復(fù)用器的設(shè)備1+1熱切換。切換器對(duì)來(lái)
參 考文獻(xiàn)
[1]韓憲柱.數(shù)字音頻技術(shù)及應(yīng)用[M].北京:中國(guó)廣播電視出版,2003.
[2]楊震.數(shù)字音頻及其在數(shù)字電視中應(yīng)用[M].北京:信息技術(shù)&標(biāo)準(zhǔn)化,2010(3).
[3]唐峰.數(shù)字音頻壓縮技術(shù)研究[M].北京:中國(guó)傳媒科技,2008(5).
[4]游余立,張新剛,徐茂,等.GB/T 22726-2008多聲道數(shù)字音頻編解碼技術(shù)規(guī)范[S].北京:中國(guó)標(biāo)準(zhǔn)出版社,2008.
[5]高鵬.調(diào)頻頻段數(shù)字音頻廣播(CDR)研究與試驗(yàn).2013.
中圖分類號(hào)G2
文獻(xiàn)標(biāo)識(shí)碼A
文章編號(hào)1674-6708(2015)140-0113-03