魯小麗
摘 要:本文基于H.264/AVC關(guān)鍵技術(shù)進(jìn)行典型專利分析,以期通過(guò)分析獲得各大主流圖像公司針對(duì)視頻編解碼改進(jìn)路線以及改進(jìn)技術(shù)效果。
關(guān)鍵詞:視頻編碼;H.264/AVC;專利分析
DOI:10.16640/j.cnki.37-1222/t.2018.14.212
視頻編碼標(biāo)準(zhǔn)隨著圖像標(biāo)準(zhǔn)需求而不斷改進(jìn)與修訂,其中非常引人注目是H.264/AVC。H.264/AVC采用 DPCM/變換為基礎(chǔ)的混合編碼模式,在此編碼框架下采用了一系列先進(jìn)的視頻編解碼關(guān)鍵技術(shù),從而使其視頻編碼性能優(yōu)于其他視頻編碼標(biāo)準(zhǔn)。
本文對(duì)專利文件進(jìn)行檢索、閱讀和分析,基于主要研究方向?qū)ο嚓P(guān)專利文獻(xiàn)進(jìn)行分類,并對(duì)各個(gè)分類的特點(diǎn)以及典型方案進(jìn)行分析,獲得各大主流圖像公司針對(duì)視頻編解碼改進(jìn)路線以及改進(jìn)技術(shù)效果,對(duì)研發(fā)方向有所啟發(fā)。
1 研究方向分類
通過(guò)對(duì)專利文獻(xiàn)的閱讀和分析,獲取關(guān)于H.264/AVC的主要研究方向,包括:幀間預(yù)測(cè);幀內(nèi)幀間預(yù)測(cè);整數(shù)變換與量化;熵編碼;率失真優(yōu)化策略;環(huán)路濾波器。
1.1 幀間預(yù)測(cè)
幀間預(yù)測(cè)主要利用視頻序列中幀與幀存在著高度相關(guān)性,通過(guò)運(yùn)動(dòng)估計(jì)和運(yùn)動(dòng)補(bǔ)償?shù)念A(yù)測(cè)編碼過(guò)程來(lái)消除視頻序列中的時(shí)域冗余。視頻序列的鄰近幀之間通常存在時(shí)域相關(guān)性,根據(jù)預(yù)測(cè)塊所在的位置,得到編碼塊與預(yù)測(cè)塊之間的運(yùn)動(dòng)矢量,運(yùn)動(dòng)估計(jì)即通過(guò)搜索得到運(yùn)動(dòng)矢量的過(guò)程,運(yùn)動(dòng)補(bǔ)償則是根據(jù)運(yùn)動(dòng)矢量,在鄰近參考幀中搜索到最相似預(yù)測(cè)塊的過(guò)程[1]。
典型方案:鄭州大學(xué)申請(qǐng)的專利(CN101854534A)公開了一種H.264快速幀間模式選擇方法,對(duì)skip模式優(yōu)先進(jìn)行判斷,并在此基礎(chǔ)上縮小宏塊級(jí)的模式判斷范圍;其次根據(jù)亞宏塊編碼模式與量化參數(shù)的關(guān)系,對(duì)亞宏塊級(jí)模式進(jìn)行集合劃分,對(duì)不同的量化參數(shù)下的宏塊選擇不同的亞宏塊模式集合,縮小亞宏塊級(jí)模式判斷范圍。
1.2 幀內(nèi)預(yù)測(cè)
幀內(nèi)預(yù)測(cè)是利用圖像幀在空間域上相鄰像素間相關(guān)性的特征,由相鄰已重建像素塊來(lái)預(yù)測(cè)當(dāng)前幀像素塊,接著對(duì)實(shí)際當(dāng)前塊和預(yù)測(cè)塊的殘差進(jìn)行變換、量化以及熵編碼,從而有效地去除空域冗余,提高編碼效率[2]。
典型方案:三星電子株式會(huì)社從2004年至2016年提出了從以下三個(gè)方面有針對(duì)性地進(jìn)行改進(jìn):壓縮率、準(zhǔn)確度和計(jì)算量。其中專利(CN1965586A)公開了:根據(jù)已確定的編碼模式確定預(yù)測(cè)方向,基于該方向離目標(biāo)像素最近的像素來(lái)預(yù)測(cè)剩余像素值,并根據(jù)熵編碼技術(shù)對(duì)目標(biāo)像素與預(yù)測(cè)像素的差值進(jìn)行編碼,從而提高編碼壓縮率。專利(CN1921630A)公開了將幀內(nèi)預(yù)測(cè)和幀間預(yù)測(cè)結(jié)合從而提高準(zhǔn)確度,具體為,將圖像分塊為多個(gè)子塊,對(duì)其中的一個(gè)子塊執(zhí)行幀內(nèi)預(yù)測(cè),將該經(jīng)編碼子塊作為參考,對(duì)剩余的圖像子塊進(jìn)行幀間預(yù)測(cè)編碼。專利(CN101578879A)公開了提取已編碼圖像中包含的經(jīng)幀內(nèi)預(yù)測(cè)的圖像塊,從所提取的塊中預(yù)測(cè)當(dāng)前塊。因此,可以利用關(guān)鍵幀和與相鄰畫面的相關(guān)性來(lái)執(zhí)行進(jìn)行編解碼從而提高速度。
1.3 整數(shù)變換與量化
H.264/AVC 標(biāo)準(zhǔn)基本檔次中使用了4×4整數(shù)變換代替了傳統(tǒng)的浮點(diǎn)DCT變換,這種變換在能量壓縮的性能上與DCT變換十分接近。由于變換矩陣中的系數(shù)均為整數(shù),所以不會(huì)產(chǎn)生DCT中存在的由于浮點(diǎn)精度引起的正逆變換間的漂移誤差。
典型方案:高通股份有限公司申請(qǐng)的專利(CN101946516A)公開了一種用于對(duì)多媒體視頻進(jìn)行編碼的系統(tǒng)和方法。在對(duì)視頻進(jìn)行編碼時(shí),針對(duì)每一宏塊選擇一量化參數(shù)。如本文中所描述,可通過(guò)將所有可能量化參數(shù)的總體限于可能量化參數(shù)值的特定范圍而選擇每一宏塊的所述量化參數(shù)。此通過(guò)減少針對(duì)每一視頻宏塊所測(cè)試的量化參數(shù)的數(shù)目而增加視頻編碼的速度。
1.4 熵編碼
H.264/AVC定義了兩種類型的熵編碼方法,基于內(nèi)容自適應(yīng)的變長(zhǎng)編碼(CAVLC)和基于內(nèi)容自適應(yīng)的算術(shù)編碼(CABAC)。兩者相比,CABAC的編碼性能更好,而 CAVLC的編碼更為簡(jiǎn)單快速。
典型方案:高通股份有限公司申請(qǐng)的專利從減低計(jì)算成本以及提高編碼效率兩個(gè)方面進(jìn)行了改進(jìn):其中,專利(CN103181169A)基于上下文進(jìn)行自適應(yīng)熵編碼,設(shè)置聯(lián)合上下文模型,在32×32的變換塊與16×16的變換塊之間共享,第一變化塊具有經(jīng)歸零以產(chǎn)生具有第二大小的所保持系數(shù)塊的系數(shù)。在具有不同大小的變換單元之間共享的聯(lián)合上下文模型執(zhí)行熵譯碼,從而減少存儲(chǔ)量和計(jì)算成本;其中,專利(CN103563378A)公開了確定用于視頻數(shù)據(jù)塊的上下文信息,所述塊為已編碼塊,在已編碼塊的頂部塊行下方,上下文信息去除來(lái)自已編碼單元的上方相鄰塊的信息?;谏舷挛男畔?duì)當(dāng)前塊數(shù)據(jù)進(jìn)行熵譯碼,從而提高效率。
1.5 環(huán)路濾波
H.264/AVC由于量化技術(shù)而帶來(lái)的在視頻圖像碼率高以及圖像快速運(yùn)動(dòng)情況下而不可避免地產(chǎn)生塊效應(yīng),使用去塊濾波技術(shù)來(lái)消除塊效應(yīng),邊界像素的平滑。環(huán)路濾波作為一種典型的去塊濾波技術(shù)而在H.264/AVC中一個(gè)重要特性。主要包括水平邊界濾波和垂直邊界濾波,通過(guò)對(duì)宏塊進(jìn)行閾值判斷,而選擇不同的濾波強(qiáng)度進(jìn)行循環(huán)濾波。
典型方案:三星電子株式會(huì)社申請(qǐng)的專利(CN1189652A)公開了一種環(huán)路濾波,提供水平尺寸以及垂直尺寸的濾波窗口,試用一維梯度運(yùn)算,獲得二值邊緣映射,檢查該窗口內(nèi)是否存在邊緣信息,根據(jù)是否存在邊緣信息來(lái)決定用于由像素相對(duì)應(yīng)濾波窗口的像素濾波的不同強(qiáng)度值。
2 結(jié)語(yǔ)
本文基于H.264/AVC關(guān)鍵技術(shù)進(jìn)行典型專利分析,以期通過(guò)分析獲得各大主流圖像公司針對(duì)視頻編解碼改進(jìn)路線以及改進(jìn)技術(shù)效果。
參考文獻(xiàn):
[1]高樑.視頻編碼的關(guān)鍵技術(shù)及優(yōu)化研究[D].杭州電子科技大學(xué), 2011.
[2]姜明俊.H.264幀內(nèi)幀間預(yù)測(cè)算法的優(yōu)化[D].西安電子科技大學(xué), 2007.