郭龍盛,殷海兵,徐 寧
(中國(guó)計(jì)量學(xué)院信息工程學(xué)院,浙江 杭州 310018)
隨著視頻技術(shù)的發(fā)展,一系列的視頻編碼標(biāo)準(zhǔn)相繼出現(xiàn),H.264/AVC是目前最成熟的視頻編碼標(biāo)準(zhǔn)。在視頻編碼過(guò)程中,碼率控制和模式選擇已經(jīng)成為一個(gè)研究熱點(diǎn)。碼率控制即通過(guò)R-D模型來(lái)選擇量化參數(shù),分配編碼比特。R-D模型通常包括R-Q模型和D-Q模型,本文主要對(duì)D-Q模型進(jìn)行深入研究。
近幾年來(lái),一些學(xué)者專家基于DCT系數(shù)分布模型提出了許多D-Q模型。文獻(xiàn)[1]基于柯西分布提出D-Q模型;文獻(xiàn)[2-3]提出一種基于拉普拉斯分布的D-Q模型;文獻(xiàn)[4]提出一種基于廣義高斯分布的D-Q模型,文獻(xiàn)[5]對(duì)基于柯西的D-Q模型進(jìn)行了改進(jìn),文獻(xiàn)[6]基于這些失真模型總結(jié)了其在率失真模型中的應(yīng)用。面對(duì)這些主流的D-Q模型,有必要對(duì)其進(jìn)行精確度和復(fù)雜度的比較,分析其優(yōu)缺點(diǎn),目的是在此基礎(chǔ)上對(duì)D-Q模型加以改進(jìn)。
本節(jié)將簡(jiǎn)單介紹目前幾種主流的D-Q模型,包括基于拉普拉斯分布、柯西分布、廣義高斯分布的D-Q模型。
文獻(xiàn)[2]中基于拉普拉斯分布提出了估計(jì)編碼失真的方法,公式為
式中:β是一個(gè)模型參數(shù);p與編碼幀類型有關(guān)。
文獻(xiàn)[1]根據(jù)柯西分布概率密度函數(shù),通過(guò)理論推導(dǎo)簡(jiǎn)化了D-Q模型
式中,參數(shù)b與編碼幀熵值有關(guān)。
文獻(xiàn)[7]根據(jù)QP和PSNR的關(guān)系推導(dǎo)出了一個(gè)新的D-Q模型
趙欣等人在文獻(xiàn)[4]中提出了一個(gè)新的D-Q模型
本節(jié)通過(guò)實(shí)驗(yàn)對(duì)上述4種D-Q模型幀級(jí)精準(zhǔn)度進(jìn)行分析。Model SATD,Model Cauchy,Model MSW,Model GGD分別代表上節(jié)中公式(1)(2)(3)(4)的模型。由于篇幅限制,只給出了對(duì)Foreman和Bus序列的測(cè)試(筆者已經(jīng)證實(shí)對(duì)其他序列的測(cè)試也有相同結(jié)果),如圖1所示。
圖1 幀級(jí)D-Q模型精確度的比較
由圖可見(jiàn),Model GGD可以較好地估計(jì)出實(shí)際失真,但復(fù)雜度也是最高的,對(duì)于硬件實(shí)現(xiàn)是一個(gè)比較大的挑戰(zhàn)。從上節(jié)中的4個(gè)公式也可發(fā)現(xiàn),Model Cauchy的復(fù)雜度是最低的。
由于宏塊級(jí)的D-Q模型對(duì)碼率控制和模式選擇而言非常重要,因此有必要對(duì)宏塊級(jí)的D-Q模型進(jìn)行研究,為了比較宏塊級(jí)D-Q模型的精確度,筆者做了大量實(shí)驗(yàn)。如圖2所示,橫坐標(biāo)表示用模型估計(jì)出的失真和實(shí)際失真的差值(error),縱坐標(biāo)表示宏塊的數(shù)目(nMB),在橫坐標(biāo)為0附近的時(shí)候,縱坐標(biāo)的值越高,說(shuō)明了該模型的精確度越高。該實(shí)驗(yàn)的測(cè)試環(huán)境是foreman和football序列,QP值為36??梢?jiàn),在foreman序列中,基于柯西分布的D-Q模型精確度是最高的;在football序列中,Model Cauchy的精確度要略低于其他D-Q模型,但其復(fù)雜度最低。
圖2 宏塊級(jí)D-Q模型精確度的比較
在對(duì)幾種主流D-Q模型的精確度進(jìn)行比較之后,下面將對(duì)基于柯西分布的D-Q模型加以改進(jìn),以提高其精確度。
如式(2)所示,基于柯西分布的D-Q模型中有兩個(gè)參數(shù)——b和β,它的參數(shù)更新是根據(jù)前一幀相同位置塊的實(shí)際失真來(lái)計(jì)算當(dāng)前塊的參數(shù)。眾所周知,相鄰幀里的宏塊由于運(yùn)動(dòng)會(huì)發(fā)生位移,直接采用前一幀相同位置的宏塊來(lái)計(jì)算當(dāng)前參數(shù)會(huì)產(chǎn)生誤差,因此,本文提出了一種基于運(yùn)動(dòng)補(bǔ)償?shù)腄-Q模型,即通過(guò)補(bǔ)償后的參考幀來(lái)預(yù)測(cè)當(dāng)前塊的模型參數(shù)。結(jié)果如圖3所示,橫坐標(biāo)表示宏塊實(shí)際失真和模型估計(jì)得出的失真的差值,縱坐標(biāo)表示宏塊個(gè)數(shù),本實(shí)驗(yàn)的測(cè)試序列是foreman序列,圖3a和圖3c是原始柯西模型的結(jié)果,圖3b和圖3d是改進(jìn)后模型的結(jié)果,可見(jiàn)改進(jìn)后的模型明顯要比原始模型的精確度要高。為了更加清楚地對(duì)這兩個(gè)模型精確度進(jìn)行比較,在表1中列出不同序列、不同QP下計(jì)算得到
式中:distortion_a(i)和distortion_a(i)分別代表實(shí)際失真和模型估計(jì)的失真。
圖3 改進(jìn)后的模型和原始D-Q模型精確度的比較
表1 原始柯西模型和改進(jìn)后模型error_rate的比較
本文介紹了目前主流的幾種D-Q模型,并且從宏塊級(jí)和幀級(jí)進(jìn)行了精確度的比較,在宏塊級(jí)中,針對(duì)不同的序列,各模型有不同的性能,當(dāng)視頻運(yùn)動(dòng)信息比較少的時(shí)候,基于柯西分布的D-Q模型精確度較高,當(dāng)視頻運(yùn)動(dòng)比較復(fù)雜的時(shí)候,趙欣等人提出的模型精確度較高;在幀級(jí)中,公式(4)中的模型精確度較高。然后在基于柯西分布的D-Q模型基礎(chǔ)上加以改進(jìn),提高了模型精確度。
由于D-Q模型的復(fù)雜度和數(shù)據(jù)依賴關(guān)系,在硬件中實(shí)現(xiàn)是一個(gè)較大的挑戰(zhàn)。在以后的工作中,將重點(diǎn)研究適用于硬件實(shí)現(xiàn)的D-Q模型。
[1]KAMACI N,ALTUNBASAK Y,MERSEREAU R M.Frame bit allocation for the H.264/AVC video coder via cauchy-density-based rate and distortion models[J].IEEE Trans.Circuits Syst.Video Technol.,2005,15(8):994-1006.
[2]KWON D-K,SHEN Mei-yin,KUO C-C J.Rate control for H.264 video with enhanced rate and distortion models[J].IEEE Trans.Circuits Syst.Video Technol.,2007,17(5):517-529.
[3]GUO Liwei.A novel analytic quantization-distortion model for hybrid video coding[J].IEEE Trans.Circuits Syst.Video Technol.,2009,19(5):627-641.
[4]ZHAO Xin,SUN Jun,MA Siwei,et al.Novel statistical modeling,analysis and implementation of rate-distortion estimation for H.264/AVC coders[J].IEEE Trans.Circuits Syst.Video Technol.,2010,20(5):647-660.
[5]HU Sudeng,WANG Hanli,KWONG S,et al.Rate control optimization for temporal-layer scalable video coding[J].IEEE Trans.Circuits Syst.Video Technol.,2011,21(8):1152-1162.
[6]馬宏興,張伶.H.264/AVC率失真優(yōu)化技術(shù)綜述[J].電視技術(shù),2010,34(6):19-22.
[7]MA Siwei,GAO Wen,LU Yan.Rate-distortion analysis for H.264/AVC video coding and its application to rate control[J].IEEE Trans.Circuits Syst.Video Technol.,2005,15(12):1533-1544.