王運(yùn)波,卿粼波,王正勇,楊 紅
(四川大學(xué) 電子信息學(xué)院 圖像信息研究所,四川 成都 610065)
基于變換域Wyner-Ziv視頻編碼的有效重建算法
王運(yùn)波,卿粼波,王正勇,楊 紅
(四川大學(xué) 電子信息學(xué)院 圖像信息研究所,四川 成都 610065)
為了減少分布式視頻編碼系統(tǒng)重建值與真實(shí)值之間誤差,提出了基于變換域Wyner-Ziv視頻編碼最小均方誤差(MMSE)重建的一種有效重建算法。該算法充分利用視頻幀間相關(guān)性,對(duì)MMSE重建算法積分區(qū)間做出調(diào)整,當(dāng)邊信處于解碼值對(duì)應(yīng)量化區(qū)間之內(nèi)時(shí),在量化區(qū)間內(nèi)利用MMSE重建;當(dāng)邊信息處于解碼值對(duì)應(yīng)量化區(qū)間之外時(shí),對(duì)量化區(qū)間做出調(diào)整,在改進(jìn)后的區(qū)間利用MMSE重建。實(shí)驗(yàn)結(jié)果表明,與最佳重建最小均方誤差重建算法相比,該算法可以有效提高解碼視頻的平均PSNR。
分布式視頻編碼;Wyner-Ziv視頻編碼;MMSE重建;量化區(qū)間
當(dāng)前常用的視頻編碼標(biāo)準(zhǔn)如MPEG、H.26x是在編碼端做復(fù)雜的運(yùn)動(dòng)估計(jì)補(bǔ)償及幀內(nèi)模式的預(yù)測(cè)決定來消除視頻中大量存在的冗余信息,從而獲取壓縮性能,編碼端計(jì)算復(fù)雜度高于解碼端,適用于廣播及一次編碼多次解碼的視頻系統(tǒng)。然而,隨著視頻傳感器網(wǎng)絡(luò)、無線視頻監(jiān)控系統(tǒng)、多視角視頻等新型應(yīng)用的出現(xiàn),其要求編碼端設(shè)備簡(jiǎn)單、低功耗、低復(fù)雜度,一種新的視頻編碼方案——分布式視頻編碼(DVC)應(yīng)運(yùn)而生,它將編碼端的計(jì)算復(fù)雜度轉(zhuǎn)移到解碼端,在解碼端做運(yùn)動(dòng)估計(jì)補(bǔ)償,其理論基礎(chǔ)是兩大信息理論即Slepian-Wolf理論[1]和Wyner-Ziv理論[2]。這兩個(gè)理論指出:利用獨(dú)立編碼、聯(lián)合解碼的方法對(duì)兩個(gè)統(tǒng)計(jì)相關(guān)信源進(jìn)行壓縮,可以達(dá)到與傳統(tǒng)聯(lián)合編解碼方法相同的壓縮效率。目前,研究者主要以像素域Wyner-Ziv視頻編碼系統(tǒng)和變換域Wyner-Ziv視頻編碼系統(tǒng)作為研究對(duì)象,后者因結(jié)構(gòu)簡(jiǎn)單,性能良好,得到了廣泛關(guān)注。
DVC系統(tǒng)中,重建函數(shù)是解碼端的關(guān)鍵環(huán)節(jié),對(duì)視頻解碼質(zhì)量有很大影響,但對(duì)它的研究有所欠缺。最初的重建方案是文獻(xiàn)[3]提出的邊界重建算法,其原理是:當(dāng)邊信息落于譯碼符號(hào)對(duì)應(yīng)的量化區(qū)間內(nèi)時(shí),直接使用邊信息值作為重建值;否則,使用區(qū)間邊界值作為重建值。文獻(xiàn)[4]提出了一種運(yùn)動(dòng)補(bǔ)償重建算法來減少誤差,對(duì)整幀以簡(jiǎn)單的塊的形式進(jìn)行運(yùn)動(dòng)補(bǔ)償,利用前后向關(guān)鍵幀的信息改進(jìn)重建。文獻(xiàn)[5]在像素域中提出一種可變的重建方案,根據(jù)邊信息與解碼值的差距,通過調(diào)節(jié)變量λ的大小來調(diào)整邊信息對(duì)最終重建的貢獻(xiàn)值。Vatis等[6]提出一種增強(qiáng)重建算法,研究邊信息與原始幀之間關(guān)系,利用最后得到的平均期望值來作重建。文獻(xiàn)[7]提出了一種基于對(duì)稱運(yùn)動(dòng)矢量和HASH碼字的運(yùn)動(dòng)補(bǔ)償內(nèi)插的邊信息生成算法來改善解碼性能。Kubasov等[8]提出一種最小均方誤差重建算法,該算法根據(jù)邊信息與原始幀之間的虛擬相關(guān)噪聲模型求取使得均方誤差最小的期望值作為重建值,以使重建幀的均方誤差最小,受到廣泛的應(yīng)用。文獻(xiàn)[9]提出了一種有效重建方案,在最小均方誤差重建的基礎(chǔ)上,針對(duì)無碼率傳輸?shù)念l帶系數(shù),根據(jù)邊信息幀與原使幀之間拉普拉斯分布參數(shù)α,重構(gòu)最優(yōu)重建值。對(duì)于邊信息落于譯碼符號(hào)對(duì)應(yīng)區(qū)間之外的情況,文獻(xiàn)[8-9]并未更多考慮利用邊信息,此時(shí),邊信息仍有很大的參考價(jià)值,尤其邊信息落入離譯碼符號(hào)對(duì)應(yīng)區(qū)間最近的左、右區(qū)間時(shí),因此,針對(duì)最小均方誤差重建算法本文提出一種有效重建算法,當(dāng)邊信息處于區(qū)間之外時(shí),根據(jù)拉普拉斯分布,刪除一部分小概率區(qū)間,在新的區(qū)間利用最小均方誤差重建,從而改善Wyner-Ziv視頻編碼中幀的重建質(zhì)量。
目前最常用的DVC系統(tǒng)是由斯坦福大學(xué)Aaron等人[3]提出的變換域Wyner-Ziv視頻編碼系統(tǒng),系統(tǒng)框圖如圖1所示。
圖1 變換域Wyner-Ziv視頻編碼系統(tǒng)
(1)
解碼端首先利用與當(dāng)前WZ幀相鄰的已解碼關(guān)鍵幀求出邊信息SI,將得到的SI與編碼端進(jìn)行相同的DCT變換和量化,得到SI的變換系數(shù)Y。然后,對(duì)接收到的校驗(yàn)碼進(jìn)行解碼重構(gòu)得到量化索引值q。最后,根據(jù)量化索引值q及對(duì)應(yīng)的邊信息值y∈Y,重建當(dāng)前WZ幀的DCT系數(shù)x′,設(shè)z(q)表示量化索引值q對(duì)應(yīng)量化之前的最小系數(shù)。重建算法[3]如下
(2)
式中:y表示邊信息值;z(q)為量化索引值q對(duì)應(yīng)的量化區(qū)間的下限值;z(q+1)為區(qū)間上限值,該算法雖然簡(jiǎn)單,但性能較差。文獻(xiàn)[8]對(duì)該算法作出改進(jìn),將邊信息幀與原WZ幀之間虛擬信道的噪聲模型參數(shù)考慮在內(nèi),采用最小均方誤差重建算法
x′=E[x|x∈[z(q),z(q+1)),y]=
(3)
式中:y為邊信息值;[z(q),z(q+1))為量化索引值q對(duì)應(yīng)的量化區(qū)間;x為區(qū)間里的某個(gè)系數(shù);fx|y(x|y)是已知y時(shí)x的條件概率密度函數(shù),其滿足拉普拉斯分布。
圖2 概率密度函數(shù)
邊信息小于下邊界值y
表1 真實(shí)值在預(yù)估區(qū)間比例
3.1 DC頻帶重建
DC頻帶中,系數(shù)值為正數(shù),解碼值q的量化區(qū)間為[z(q),z(q+1)),根據(jù)解碼重構(gòu)得到的量解碼值和邊信息值通過式(3)計(jì)算重建系數(shù)x′,依據(jù)上述分析,對(duì)原WZ幀系數(shù)所在區(qū)間做出調(diào)整,確定在概率高的區(qū)間里重建減少重建誤差,由于邊信息與解碼值區(qū)間有3種關(guān)系,因此,分以下情況討論:
1)當(dāng)邊信息y x′=E[x|x∈[z(q),z(q+1)-d),y]= (4) 2)當(dāng)邊信息y≥z(q+1),如圖3b所示,q為解碼值,[z(q),z(q+1))為量化區(qū)間,縱坐標(biāo)曲線為概率密度函數(shù),根據(jù)概率密度函數(shù)分布,去掉原WZ系數(shù)在區(qū)間中概率較少的一段,即圖3b中陰影部分,該段距離記為d,在區(qū)間[z(q)+d,z(q+1))用最小均方誤差重建,得重建系數(shù)x′ x′=E[x|x∈[z(q)+d,z(q+1)),y]= (5) 圖3 邊信息落于量化區(qū)間之外時(shí)概率密度函數(shù) 3)當(dāng)邊信息y∈[z(q),z(q+1))時(shí),在區(qū)間[z(q),z(q+1))用式(3)重建系數(shù)x′。 3.2 AC頻帶重建 AC頻帶中,系數(shù)有正有負(fù),其量化間隔分布是以0為對(duì)稱中心,量化索引值q對(duì)應(yīng)的量化區(qū)間與DC頻帶有些不同,為了減少系統(tǒng)碼率,對(duì)于落在量化間隔對(duì)稱中心的區(qū)間[-Δk,Δk)里的系數(shù)其量化值均記0,因此,針對(duì)AC系數(shù),為進(jìn)一步確定原WZ幀系數(shù)所在區(qū)間,減少重建誤差,分以下情況討論: 1)當(dāng)解碼值q!=0時(shí),根據(jù)邊信息與解碼值量化區(qū)間的關(guān)系,分邊信息小于區(qū)間下邊界值、邊信息在區(qū)間內(nèi)、邊信息大于區(qū)間上邊界值,其重建同上述DC頻帶系數(shù)重建一樣。 2)當(dāng)解碼值q=0時(shí),此時(shí),量化區(qū)間為[-Δk,Δk),邊信息y可能小于-Δk,可能大于Δk,以及在區(qū)間內(nèi)3種情況,為減少重建誤差,使重建值更精確,對(duì)重建區(qū)間做出改進(jìn),具體如圖4所示。 (1)y<-Δk或y∈[-Δk,-0.5Δk)時(shí),分別如圖4a、圖4b所示,y表示邊信息,[-Δk,Δk)為q=0時(shí)對(duì)應(yīng)的量化區(qū)間,縱坐標(biāo)曲線為概率密度函數(shù),根據(jù)概率密度函數(shù)分布,此時(shí)原系數(shù)在區(qū)間[-Δk,0)概率比較大,在區(qū)間[-Δk,0)用式(3)重建系數(shù)x′。 圖4 解碼值為0時(shí)概率密度函數(shù) (2)y≥Δk或y∈[0.5Δk,Δk)時(shí),分別如圖4c,4d所示,y表示邊信息,[-Δk,Δk)為q=0時(shí)對(duì)應(yīng)的量化區(qū)間,縱坐標(biāo)曲線為概率密度函數(shù),根據(jù)概率密度函數(shù)分布,此時(shí)原系數(shù)在區(qū)間[0,Δk)概率比較大,在區(qū)間[0,Δk)用式(3)重建系數(shù)x′。 (3)y∈[-0.5Δk,0.5Δk)時(shí),重建系數(shù)x′用邊信息y代替。 為了評(píng)估本文提出的算法,選取了常用的幾種視頻序列Foreman@101幀、Hall-monitor@201幀、Coastguard@201幀、Mobile@201幀進(jìn)行測(cè)試,圖像格式為QCIF,圖幀頻為30 f/s(幀/秒),圖像組長(zhǎng)GoP為2,KEY幀采用H.264/AC幀內(nèi)編解碼方式,WZ幀采用Wyner-Ziv編碼,量化方式采用文獻(xiàn)[11]中的Qi={8,7,6,5}4種量化表,所有率失真結(jié)果只對(duì)WZ幀亮度分量進(jìn)行評(píng)估。實(shí)驗(yàn)中參數(shù)值d取相應(yīng)頻帶量化步長(zhǎng)的三分之一。在TDWZ系統(tǒng)平臺(tái)上,將本文提出的算法與最小均方誤差重建算法做了比較。 圖5給出了RD性能比較,從實(shí)驗(yàn)結(jié)果可以看出,與最佳重建MMSE重建算法相比,在相同碼率條件下使用本文提出的重建算法,可有效提高解碼重構(gòu)圖像的PSNR。對(duì)于Foreman序列,恢復(fù)圖像的PSNR平均可以提高0.32 dB;對(duì)于Coastguard序列,恢復(fù)圖像的PSNR平均可以提高0.44 dB。兩個(gè)序列增益不同的原因是:Foreman序列相對(duì)于Coastguard序列運(yùn)動(dòng)平緩,邊信息質(zhì)量好,此時(shí)邊信息落入量化區(qū)間里的比例較大,而運(yùn)動(dòng)較強(qiáng)的Coastguard序列邊信息質(zhì)量相對(duì)較差,落在量化區(qū)間外的比例較大,由于對(duì)落在區(qū)間外時(shí)的重建做出改進(jìn),所以運(yùn)動(dòng)相對(duì)較強(qiáng)的Coastguard序列整體性能增益優(yōu)于Foreman序列。 圖6給出了Hall、Mobile序列中幀的PSNR實(shí)驗(yàn)結(jié)果,可以看出本文算法相對(duì)最佳重建MMSE重建算法對(duì)重建圖像有一定質(zhì)量提升,圖中Hall序列平均PSNR增加的小,而Mobile序列增加的多,是因?yàn)镠all序列整體邊信息質(zhì)量好,邊信息落在量化區(qū)外的情況較少,Mobile序列整體邊信息質(zhì)量差,落在量化區(qū)間外的比例較多,因此,Mobile序列的增益比Hall大。 圖5 RD性能比較 圖6 Wyner-Ziv幀客觀質(zhì)量比較 文中提出了一種基于最小均方誤差重建的新的有效重建算法,該算法主要考慮到當(dāng)邊信息落在譯碼符號(hào)對(duì)應(yīng)量化區(qū)間之內(nèi)或之外時(shí)邊信息的可信度。該算法中,對(duì)于邊信息值落在譯碼符號(hào)對(duì)應(yīng)量化區(qū)間之內(nèi)的值,直接在量化區(qū)間里利用最小均方誤差重建算法重建;對(duì)于邊信息落在譯碼符號(hào)對(duì)應(yīng)量化區(qū)間之外的值,則對(duì)量化區(qū)間做出調(diào)整,再利用最小均方誤差重建算法進(jìn)行重建。在不增加碼率和計(jì)算復(fù)雜度的基礎(chǔ)上,與最小均方誤差重建算法相比,該方案可有效改善視頻序列解碼性能。 [1]SLEPIAN D,WOLF J.Noiseless coding of correlated information sources[J].IEEE Trans.Inform.Theory,1973,19(4):471-480. [2] WYNER A,ZIV J.The rate-distortion function for source coding with side information at the decoder [J].IEEE Trans.Inform.Theory,1976,22(1):1-10. [3]ARON A,ZHANG R,GIROD B.Wyner-Ziv coding of motion video[C]//Proc.36th Asilomar Conference on Signals,Systems and Computers.Pacific Grove:IEEE Press,2002:240-244. [4]SUN J,LI H.Motion compensated Wyner-Ziv video coding[C]//Proc.7th Workshop Conference on Multimedia Signal Processing.Shanghai:IEEE Press,2005:1-4. [5]YANG C L,LIN Y G,PO L M,et al.Variable reconstruction scheme for distributed video decoding[C]//Proc.2008 IEEE Region Conference(TENCON 2008).Hyderabad:IEEE Press,2008:1-5. [6]VATIS Y,KLOMP S,OSTEMANN J.Enhanced reconstruction of the quantised transform confficients for Wyner-Ziv Coding[C]//Proc.IEEE International Conferenceon Multimedia and Expo.Beijing:IEEE Press,2007:172-175. [7]史萍,羅坤.分布式視頻編碼中邊信息的產(chǎn)生[J].電視技術(shù),2010,34(11):27-29. [8]KUBASOV D,NAYAK J,GUILLEMOT C.Optimal reconstruction in Wyner-Ziv video coding with multiple side information[C]//Proc.9th Workshop Conference on Multimedia Signal Processing.Crete:IEEE Press:183-186. [9]WANG Fengqin,F(xiàn)AN Yangyu,JIA Meng.Efficient reconstruction scheme for transform domain Wyner-Ziv video coding[J].The Journal of China Universities of Posts and Telecommunications,2010,17(4):52-57. [10]BRITES C,PEREIRA F.Correlation noise modeling for efficient pixel and transform domain Wyner-Ziv video coding[J].IEEE Trans.Circuits and SysIems for Video Technology,2008,18(9):1177-1190. [11]ARTIGAS X,ASCENSO J,DALAI M,et al.The DISCOVER codec:architecture,techniques and evaluation [J].Picture Coding Symposium,2007,17(9):1103-1120. 王運(yùn)波(1990— ),碩士生,主研圖像處理、視頻編碼; 卿粼波(1982— ),副教授,主要研究方向?yàn)閳D像處理、模式識(shí)別、多媒體通信; 王正勇(1969— ),碩士生導(dǎo)師,主要研究方向?yàn)閳D像處理、模式識(shí)別、多媒體通信; 楊 紅(1983— ),講師,博士生,主要研究方向?yàn)橐曨l通信。 責(zé)任編輯:時(shí) 雯 Efficient Reconstruction Algorithm Based on Transform Domain Wyner-Ziv Video Coding WANG Yunbo,QING Linbo,WANG Zhengyong,YANG Hong (ImageInformationInstitute,SchoolofElectronicsandInformationEngineering,SichuanUniversity,Chengdu610065,China) In order to reducing the error between the reconstructed value and the ture vale in the distributed video coding system,an efficient reconstruction algorithm based on minimun mean square error(MMSE) reconstruction is proposed for transform domain Wyner-Ziv video coding.By making full use of the temporal correlation among the video frame,the reconstruction algorithmmakes an adjustment aiming at the integral interval of MMSE reconstruction.When side information is within the decoded quantization bin, the reconstructed value is derived from using MMSE on the original quantized interval.When the side information is outside the decoded quantization bin,the integral interval is adjusted and the reconstructed value is derivedfrom using MMSE on the adjusted interval.Experimental results show that the proposed scheme can improve the averagePSNRof the reconstructed video effectively,compared with the minimum mean square error reconstruction algorithm. distributed video coding;Wyner-Ziv video coding;MMSE reconstruction;quantized interval 國(guó)家自然科學(xué)基金項(xiàng)目(61201388);高等學(xué)校博士學(xué)科點(diǎn)專項(xiàng)科研基金項(xiàng)目(20110181120009) TN919.81 A 10.16280/j.videoe.2015.05.007 2014-03-24 【本文獻(xiàn)信息】王運(yùn)波,卿粼波,王正勇,等.基于變換域Wyner-Ziv視頻編碼的有效重建算法[J].電視技術(shù),2015,39(5).4 實(shí)驗(yàn)結(jié)果與分析
5 結(jié)論