• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      DRA標準及未來音頻編碼技術(shù)展望

      2014-07-02 00:29:47數(shù)字音頻編解碼技術(shù)國家工程實驗室閆建新
      電視技術(shù) 2014年22期
      關鍵詞:環(huán)繞聲聲道數(shù)字音頻

      ◎ 數(shù)字音頻編解碼技術(shù)國家工程實驗室 閆建新

      DRA標準及未來音頻編碼技術(shù)展望

      ◎ 數(shù)字音頻編解碼技術(shù)國家工程實驗室 閆建新

      簡單介紹了當前的數(shù)字音頻多聲道編碼國家標準GB/T 22726—2008(DRA),DRA音頻標準可應用于數(shù)字電視、數(shù)字音頻廣播及移動多媒體等領域。同時說明了以DRA技術(shù)為基礎而派生的幾個新編碼算法及典型應用場景。最后對未來數(shù)字音頻編碼技術(shù)進行了展望和預期。

      DRA;數(shù)字音頻廣播;3D音頻

      DRA標準及其應用

      1.DRA標準及相關編碼算法

      DRA是國標GB/T22726—2008《多聲道數(shù)字音頻編解碼技術(shù)規(guī)范》[1]的簡稱,它是基于人耳的聽覺特性對聲音信號進行量化和編碼的一種感覺音頻技術(shù)。圖1給出了編碼框圖,其編碼過程為:數(shù)字音頻信號首先通過自適應時頻分割,實現(xiàn)對音頻信號的最優(yōu)分解;然后進行聯(lián)合立體聲編碼去除聲道間的相關性;通過對當前信號的心理聲學分析給出最佳掩蔽曲線,從而給出全局比特分配實現(xiàn)譜系數(shù)線性量化;依據(jù)量化譜系數(shù)分布進行自適應分區(qū),并通過Huffman熵編碼進一步完成冗余度壓縮,最終所有需要傳輸?shù)男畔凑諛藴室?guī)范格式打包成DRA幀。

      為了滿足各種實際應用的不同需求,以DRA標準編碼技術(shù)為基礎,通過引入近年來新推出的一些增強編碼模塊,并充分利用DRA幀結(jié)構(gòu)中最后定義的輔助數(shù)據(jù)單元,可擴展實現(xiàn)以下幾種編碼算法:

      1)DRA低碼率(DRA-LO)編碼算法

      本編碼算法主要增加了一個帶寬擴展編碼模塊,用以完成高頻部分的參數(shù)編碼,低頻部分仍然采用傳統(tǒng)的DRA標準編碼,從而構(gòu)造了一種波形編碼和參數(shù)編碼的混合編碼技術(shù),可使得立體聲編碼的典型碼率從128 kbit/s大幅度降至32 kbit/s。

      2)DRA超低碼率(DRA-UL)編碼算法

      圖1 DRA編碼流程圖

      由于DRA編碼算法的編碼對象為一般性的聲音信號,在低碼率且對語音類信號編碼時編碼效率比傳統(tǒng)語音編碼算法要低,因此新的DRA超低碼率編碼算法是在DRA低碼率編碼算法的基礎上進一步引入一個語音編碼核。當檢測到輸入信號為語音類信號時啟動語音編碼核替代DRA核壓縮低頻部分;當輸入信號為語音和音樂混合信號時,采用自適應切換編碼核方式工作;當輸入信號為音樂類信號時,仍然只應用DRA編碼;高頻部分仍然采用DRA-LO中的帶寬擴展編碼算法。DRA-UL可以進一步將DRA-LO立體聲編碼的典型碼率從32 kbit/s降低到24 kbit/s。DRA-UL適用于數(shù)字調(diào)幅廣播應用,這是因為數(shù)字調(diào)幅(AM)廣播聲道條件更窄,它的有效凈載荷可能只有20 kbit/s,DRA-UL可使得調(diào)幅廣播獲得接近當前模擬調(diào)頻的主觀聲音質(zhì)量。

      3)DRA分層(DRA-LA)編碼算法[2]

      調(diào)頻頻段數(shù)字音頻廣播信道和調(diào)制規(guī)范提供了分層調(diào)制和不等錯信道編碼技術(shù),為了匹配這一特性而擴展了一種分層編碼算法DRA-LA,可分為兩種:一種是直接對DRA的分層;另一種是DRA-LO的分層。對于單聲道情況,基本層提供基本的單聲道聲音質(zhì)量,增強層可進一步改善聲音質(zhì)量;對立體聲信號,基本層提供基本的立體聲,增強曾進一步改善立體聲質(zhì)量;對環(huán)繞聲信號,基本層提供全質(zhì)量的立體聲,增強層提供環(huán)繞聲道信號。

      4)DRA演播室(DRA-ST)編碼算法

      DRA-ST是一種高保真的音頻編碼算法,通過多次編解碼處理后仍然保持透明的主觀聲音質(zhì)量,主要用于演播室內(nèi)部傳輸應用,且由于DRA-ST的幀長與當前標準幾種視頻幀率匹配,因此當作為視頻信號的伴音時,能夠與圖像邊界對齊,易于音視頻剪輯操作,不會引起同步問題。

      表 1給出 DRA,DRA-LO和DRA-UL各種編碼算法的主要參數(shù),表2給出了DRA-LA的編碼算法的主要參數(shù)。

      2.DRA標準的應用

      為了推廣DRA標準的應用,陸續(xù)開展了一些應用標準的研究,主要包括IEC 61937-12標準定義了DRA碼流打包成適合AES/EBU(或SPDIF)傳輸時的方式;CEA音頻格式擴展標準和HD?MI傳輸標準定義了其他常用傳輸接口的方式;SMPTE和MP4存儲格式標準使得DRA音頻可以同視頻數(shù)據(jù)一起封裝為一個文件;IETF網(wǎng)絡傳輸標準保證了DRA碼流可通過RTP方式傳輸。此外,《地面數(shù)字電視接收機通用規(guī)范》為國家標準(GB/T26686—2011)中規(guī)定了DRA音頻標準為其必選音頻標準;同時DRA也是國際藍光音頻可選標準。目前DRA已經(jīng)廣泛應用于CMMB、藍光、數(shù)字電視、中國調(diào)頻數(shù)字廣播(Chinese Digital Radio,CDR)以及云音樂系統(tǒng)等領域。

      表1 DRA標準、低碼率和超低碼率3種算法的基本參數(shù)

      表2 DRA-LA算法基本參數(shù)

      以DRA在數(shù)字電視上的應用為例:

      1)在芯片方面,支持DRA解碼的數(shù)字電視芯片廠商云集,超過30家著名芯片廠商均支持DRA音頻解碼,覆蓋國內(nèi)市場90%以上,如Intel、東芝、三星和杭州國芯等。

      2)在電視終端方面,全球逾50家終端廠商獲得DRA授權(quán),如三星、TCL、SONY、長虹、康佳和創(chuàng)維等。

      3)在前端播出設備方面,已有大洋、索貝和數(shù)碼視訊等公司支持DRA標準。

      這樣,使得DRA在數(shù)字電視應用方面形成了一條非常完整的產(chǎn)業(yè)鏈。

      另外,在我國調(diào)頻數(shù)字音頻廣播應用上,已經(jīng)完成了CDR音頻信源編碼的行業(yè)技術(shù)規(guī)范,其中包括幾種DRA編碼算法。表3給出了CDR的幾個典型應用場景。

      表3 CDR中各DRA標準的應用場景

      圖2為實際應用中的情況,如果廣播的是立體聲節(jié)目,編碼端壓縮為基本層和增強層,通過廣播信道傳輸?shù)竭_收聽用戶,如果接收環(huán)境很好,則用戶可以解析基本層和增強層碼流,解碼輸出完美的立體聲音質(zhì),而如果用戶受到遮擋或接收信號微弱等,則只能收聽基本層的基本立體聲;如果發(fā)端播出的是環(huán)繞聲節(jié)目,則在有干擾時收聽到完美立體聲節(jié)目,或者無干擾時可收聽真正的環(huán)繞聲節(jié)目。

      未來數(shù)字音頻編碼技術(shù)

      今天,數(shù)字音頻編碼技術(shù)的基本原理已相對成熟,未來幾年主要有兩個方面的研究工作可進一步提升整體的編碼性能:一是對其中一些編碼模塊的改進;另外一個是通過增加一些小的輔助增強模塊。隨著新一代視頻編碼技術(shù)H.265的標準化工作,以及如圖3所示的超大屏幕和超高清晰度視頻的應用[3],使得觀眾有更寬的觀看視角而獲得更好的融入體驗,特別是將來投影3D及激光成像等會為用戶提供更逼真的視頻場景,因此為更好地匹配這些視頻應用需要更高要求的音頻系統(tǒng),以便獲得真實環(huán)境所具有包圍感和空間感的沉浸式聽音效果。

      圖2 DRA分層編碼應用

      圖3 沉浸式場景

      1.未來3D音頻系統(tǒng)布局

      傳統(tǒng)7.1環(huán)繞聲系統(tǒng)(或5.1系統(tǒng))如圖4左側(cè)所示,一般在地面以上且與人耳平行的平面上,并按照ITU規(guī)范來布置5.1和7.1環(huán)繞聲揚聲器,因此實際上這些系統(tǒng)還是二維結(jié)構(gòu),無法提供真實的三維空間聲場效果。未來環(huán)繞聲系統(tǒng)需要提供真正的三維聲場,例如圖4右側(cè)的7.1環(huán)繞聲揚聲器布置,在傳統(tǒng)5.1環(huán)繞聲情況下增加了兩個上左和上右;圖5提供了10.2環(huán)繞聲系統(tǒng),它是在傳統(tǒng)7.1環(huán)繞聲系統(tǒng)下增加了一個正后方的揚聲器、一個超重低音和一對上方左右揚聲器。

      ITU標準規(guī)定了一種更加逼近真實聲場的22.2環(huán)繞聲系統(tǒng)[4],總共分為上中下3層,上層9個聲道,中間層10個聲道,下層3.2個聲道,如圖6所示。IEC和EBU也定義了類似這個系統(tǒng)的標準。圖7為22.2環(huán)繞聲系統(tǒng)分布示意圖。

      2.3 D音頻編解碼

      3D音頻系統(tǒng)可提供更真實的聲場環(huán)境,除了可用于超高清系統(tǒng),也滿足于家庭影院音頻、個人TV音頻、虛擬現(xiàn)實音頻、游戲音頻等需求。3D音頻系統(tǒng)的主要編碼技術(shù)是基于多聲道的感覺音頻編碼算法、基于音頻目標的空間編碼算法和基于場景的編碼算法,此外還有一些引入的新編碼工具,包括更多聲道相關處理算法和各種渲染技術(shù)等。

      幾個月后,據(jù)“線人”說,這名前員工已陸續(xù)換了好幾份工作,每次時間都不長,每次也都無一例外在朋友圈罵老板。大意都是工作沒法弄,老板很變態(tài)。

      圖4 兩種7.1環(huán)繞聲系統(tǒng)

      圖5 10.2環(huán)繞聲系統(tǒng)分布示意圖

      圖6 NHK的22.2環(huán)繞聲系統(tǒng)

      圖7 22.2環(huán)繞聲系統(tǒng)分布示意圖

      1)3D-CO編解碼技術(shù)

      圖8最左列為傳統(tǒng)的基于聲道的感覺音頻編碼,最右列是基于聲音目標的編碼過程,而中間列3D-CO(Chan?nel&Object)[5]是基于聲道和目標的一種編碼算法,其中輸入信號中既有傳統(tǒng)的多個音頻聲道,也有多個聲道加上多種目標。

      圖8 3D-CO編碼類型

      3D-CO編碼技術(shù)框圖如圖9所示,首先通過渲染器/混合器對輸入的聲道和目標進行預處理,輸出給后面通用感覺音頻編碼模塊(如DRA標準編碼)的由3種信號構(gòu)成:(1)原來的獨立音頻聲道被附加了一些渲染的目標后仍然作為一個獨立聲道;(2)某些聲音目標直接作為一個獨立聲道;(3)某些相關的聲音目標通過基于目標的空間編碼器處理,只輸出很少幾個下混的獨立聲道給感覺編碼器,而提取的空間信息以邊信息的方式直接送入復用器。此外針對各個聲音目標還有與之相關的元數(shù)據(jù)需要簡單壓縮后也送入復用器。

      圖9 3D-CO編碼流程框圖

      圖10是更簡化的3D-CO編解碼系統(tǒng)結(jié)構(gòu),對聲道和目標的編碼的碼流輸出給解碼模塊,在解碼模塊中提供了一個用戶接口,用戶可對其中一些目標音頻進行開/關操作,比如在球賽時可以保證球場的環(huán)境聲而僅把解說員的聲音屏蔽掉。此外可根據(jù)播放環(huán)境要求通過渲染技術(shù)在實際系統(tǒng)配置(如7.1環(huán)繞聲)獲得最佳的重放,例如重放系統(tǒng)可能不是標準位置的揚聲器配置,或者用戶不是在最佳聽音位置等等。

      3D-CO解碼是編碼的反過程,如圖11所示。包括傳統(tǒng)的感覺音頻(如DRA)解碼、渲染技術(shù)、基于目標的空間解碼、目標元數(shù)據(jù)解碼等,所有的獨立聲道音頻信號和目標音頻信號最終通過渲染提供直接揚聲器輸出、格式轉(zhuǎn)換器后的下混輸出及耳機輸出。

      2)3D-HOA編解碼技術(shù)

      而3D-HOA解碼技術(shù)框圖如13所示。首先通過多聲道感覺解碼恢復N個聲道信號,通過空間信息信息參數(shù)恢復環(huán)境聲場,通過主方向聲音參數(shù)恢復主方向聲音分量,最后有一個高階聲音合成模塊,恢復出聲音信號,可通過渲染技術(shù)輸出給不同的播放環(huán)境(如揚聲器、耳機等)。

      圖10 簡化的3D-CO編解碼系統(tǒng)結(jié)構(gòu)

      圖11 3D-CO解碼框圖

      圖12 3D-HOA編碼技術(shù)框圖

      圖13 3D-HOA解碼技術(shù)框圖

      3)3D-CO音頻解碼中兩種特別的渲染技術(shù)

      (1)Zooming技術(shù)

      Zooming技術(shù)是3D-CO解碼渲染技術(shù)之一,其工作原理如圖14所示。圖14上圖中右下小塊的視頻是要Zom?ming的區(qū)域,有兩個聲音目標,目標1在它內(nèi)部,目標2在其外部左邊。當Zooming后(圖14下),對于聲音目標需要進行合理渲染使得目標1和目標2出現(xiàn)在合理的位置。

      (2)Panning技術(shù)

      3D-CO的另外一個渲染技術(shù)是Panning,參考圖15。圖左為Panning前,有3個聲音目標:目標1、目標2和目標3;在Panning之后,如圖15中右邊所示,3個聲音目標也合理地調(diào)整到相應的位置。

      4)3D音頻編碼測試

      相比傳統(tǒng)5.1或者7.1環(huán)繞聲編碼系統(tǒng)而言,3D音頻編碼系統(tǒng)的測試應包含更多的指標,比如聲場的包圍感、真實感、分離度等[4],非常復雜,需要進一步的深入研究和標準化。而目前3D音頻編碼的測試主要考慮三個方面:高質(zhì)量、定位和包圍感。

      圖14 Zooming技術(shù)原理

      MPEG在3D音頻編碼研究中的基本測試條件:

      (1)輸入信號:22.2聲道(如果包含目標信號,則需要預處理);

      (2)測試碼率:256 kbit/s,512 kbit/s和1.2 Mbit/s,典型碼率是512 kbit/s;

      (3)測試方法:MUSHA;

      (4)測試條件:揚聲器按22.2標準方式放置時,分為最佳聽音位置和非最佳聽音位置分別測試;渲染后通過揚聲器10.1,7.1,5.1還原測試;已經(jīng)渲染后通過耳機還原測試。

      此外,對3D音頻編碼的低碼率測試評估條件僅需調(diào)整碼率范圍為48~128 kbit/s。

      總結(jié)

      本文首先介紹了DRA基本編碼框架及編碼主要技術(shù)參數(shù),然后簡單說明了基于DRA標準編碼算法擴展的幾種編碼算法及主要技術(shù)參數(shù),同時也給出了各種編碼算法的典型應用領域。最后提出了未來數(shù)字音頻編碼發(fā)展的一個重要方向,即3D音頻編碼,其編解碼基本原理主要包括基于聲道和目標的3D-CO和基于場景的3D-HOA兩種模式,且通過復雜的渲染技術(shù)可提供最佳的聲場還原,同時3D音頻解碼可提供互動功能,并指出了當前的MPEG 3D音頻編碼的測試情況。

      圖15 Panning技術(shù)原理

      [1]GB/T 22726—2008,多聲道數(shù)字音頻編解碼技術(shù)規(guī)范[S].2008.

      [2]閆建新,王磊.DRA分層音頻編碼技術(shù)[J].電視技術(shù),2014,38(17):27-31.

      [3] EBU.The super Hi-Vision demos of EBU technical review [C]//Proc.IBC. Beijing:[s.n.],2008.

      [4] ITU-R BS.2159-3,Multichannel sound technology in home and broadcasting ap?plications[S].2011.

      [5] MPEG.Working draft text of MPEG-H 3D audio CO[EB/OL].[2014-08-20]. http://mpeg.chiariglione.org/standards/ mpeg-h/3d-audio.

      [6]MPEG.RM0-HOA working draft text[EB/ OL].[2014-08-20]. http://mpeg.chiari?glione.org/standards/mpeg-h/3d-audio.

      閆建新,博士,教授級高級工程師,數(shù)字音頻編解碼技術(shù)國家工程實驗室主任。曾參與我國HDTV及DAB等多項數(shù)字音視頻重大項目的研發(fā)工作,是IEC、MPEG等國際標準化音頻專家,現(xiàn)已完成多項國內(nèi)國際音頻相關標準的制定。

      TN912.3

      A

      【本文獻信息】閆建新.DRA標準及未來音頻編碼技術(shù)展望[J].電視技術(shù),2014,38(22).

      猜你喜歡
      環(huán)繞聲聲道數(shù)字音頻
      9.7.8聲道、造價250余萬 James極品影院賞析
      Dirac Live加持!讓好效果來得更容易 ROTEL Rotel RAP-1580MKⅡ AV功放/RSP-1576MKⅡ環(huán)繞聲處理器/RMB-1585五聲道功放
      為發(fā)燒需求打造的11聲道后級 Orisun(傲力聲)OA-S11
      簡潔又輕松的Soundbar環(huán)繞聲解決方案
      更簡單直接的環(huán)繞聲音效體驗 環(huán)繞聲技術(shù)的幾個應用
      實現(xiàn)從7.2到11.2聲道的飛躍 Onkyo(安橋)TX-RZ830
      探尋家用環(huán)繞聲發(fā)展的未來究竟是簡單還是繁瑣
      基于FPGA的多協(xié)議數(shù)字音頻信號發(fā)生方法
      電子制作(2017年10期)2017-04-18 07:22:40
      數(shù)字音頻及其嵌入技術(shù)在廣播電視工程的應用
      數(shù)字音頻廣播信號接收系統(tǒng)及其軟件架構(gòu)
      荆州市| 丹东市| 武冈市| 井陉县| 乌海市| 建湖县| 信丰县| 沁源县| 慈利县| 九龙县| 宝山区| 罗源县| 鸡泽县| 榆社县| 烟台市| 水富县| 体育| 乳山市| 平罗县| 岳西县| 报价| 阳曲县| 太原市| 连州市| 英德市| 特克斯县| 灵寿县| 桃源县| 麻江县| 桐柏县| 沽源县| 民县| 澄江县| 西城区| 昭苏县| 东港市| 西盟| 泾源县| 金寨县| 固原市| 青龙|