H.264/AVC專利綜述

2018-08-20 09:58:30魯小麗

山東工業(yè)技術(shù) 2018年14期

魯小麗

摘要：本文基于H.264/AVC關(guān)鍵技術(shù)進(jìn)行典型專利分析，以期通過(guò)分析獲得各大主流圖像公司針對(duì)視頻編解碼改進(jìn)路線以及改進(jìn)技術(shù)效果。

關(guān)鍵詞：視頻編碼；H.264/AVC；專利分析

DOI：10.16640/j.cnki.37-1222/t.2018.14.212

視頻編碼標(biāo)準(zhǔn)隨著圖像標(biāo)準(zhǔn)需求而不斷改進(jìn)與修訂，其中非常引人注目是H.264/AVC。H.264/AVC采用 DPCM/變換為基礎(chǔ)的混合編碼模式，在此編碼框架下采用了一系列先進(jìn)的視頻編解碼關(guān)鍵技術(shù)，從而使其視頻編碼性能優(yōu)于其他視頻編碼標(biāo)準(zhǔn)。

本文對(duì)專利文件進(jìn)行檢索、閱讀和分析，基于主要研究方向?qū)ο嚓P(guān)專利文獻(xiàn)進(jìn)行分類，并對(duì)各個(gè)分類的特點(diǎn)以及典型方案進(jìn)行分析，獲得各大主流圖像公司針對(duì)視頻編解碼改進(jìn)路線以及改進(jìn)技術(shù)效果，對(duì)研發(fā)方向有所啟發(fā)。

1 研究方向分類

通過(guò)對(duì)專利文獻(xiàn)的閱讀和分析，獲取關(guān)于H.264/AVC的主要研究方向，包括：幀間預(yù)測(cè)；幀內(nèi)幀間預(yù)測(cè)；整數(shù)變換與量化；熵編碼；率失真優(yōu)化策略；環(huán)路濾波器。

1.1 幀間預(yù)測(cè)

幀間預(yù)測(cè)主要利用視頻序列中幀與幀存在著高度相關(guān)性，通過(guò)運(yùn)動(dòng)估計(jì)和運(yùn)動(dòng)補(bǔ)償?shù)念A(yù)測(cè)編碼過(guò)程來(lái)消除視頻序列中的時(shí)域冗余。視頻序列的鄰近幀之間通常存在時(shí)域相關(guān)性，根據(jù)預(yù)測(cè)塊所在的位置，得到編碼塊與預(yù)測(cè)塊之間的運(yùn)動(dòng)矢量，運(yùn)動(dòng)估計(jì)即通過(guò)搜索得到運(yùn)動(dòng)矢量的過(guò)程，運(yùn)動(dòng)補(bǔ)償則是根據(jù)運(yùn)動(dòng)矢量，在鄰近參考幀中搜索到最相似預(yù)測(cè)塊的過(guò)程[1]。

典型方案：鄭州大學(xué)申請(qǐng)的專利（CN101854534A）公開了一種H.264快速幀間模式選擇方法，對(duì)skip模式優(yōu)先進(jìn)行判斷，并在此基礎(chǔ)上縮小宏塊級(jí)的模式判斷范圍；其次根據(jù)亞宏塊編碼模式與量化參數(shù)的關(guān)系，對(duì)亞宏塊級(jí)模式進(jìn)行集合劃分，對(duì)不同的量化參數(shù)下的宏塊選擇不同的亞宏塊模式集合，縮小亞宏塊級(jí)模式判斷范圍。

1.2 幀內(nèi)預(yù)測(cè)

幀內(nèi)預(yù)測(cè)是利用圖像幀在空間域上相鄰像素間相關(guān)性的特征，由相鄰已重建像素塊來(lái)預(yù)測(cè)當(dāng)前幀像素塊，接著對(duì)實(shí)際當(dāng)前塊和預(yù)測(cè)塊的殘差進(jìn)行變換、量化以及熵編碼，從而有效地去除空域冗余，提高編碼效率[2]。

典型方案：三星電子株式會(huì)社從2004年至2016年提出了從以下三個(gè)方面有針對(duì)性地進(jìn)行改進(jìn)：壓縮率、準(zhǔn)確度和計(jì)算量。其中專利（CN1965586A）公開了：根據(jù)已確定的編碼模式確定預(yù)測(cè)方向，基于該方向離目標(biāo)像素最近的像素來(lái)預(yù)測(cè)剩余像素值，并根據(jù)熵編碼技術(shù)對(duì)目標(biāo)像素與預(yù)測(cè)像素的差值進(jìn)行編碼，從而提高編碼壓縮率。專利（CN1921630A）公開了將幀內(nèi)預(yù)測(cè)和幀間預(yù)測(cè)結(jié)合從而提高準(zhǔn)確度，具體為，將圖像分塊為多個(gè)子塊，對(duì)其中的一個(gè)子塊執(zhí)行幀內(nèi)預(yù)測(cè)，將該經(jīng)編碼子塊作為參考，對(duì)剩余的圖像子塊進(jìn)行幀間預(yù)測(cè)編碼。專利（CN101578879A）公開了提取已編碼圖像中包含的經(jīng)幀內(nèi)預(yù)測(cè)的圖像塊，從所提取的塊中預(yù)測(cè)當(dāng)前塊。因此，可以利用關(guān)鍵幀和與相鄰畫面的相關(guān)性來(lái)執(zhí)行進(jìn)行編解碼從而提高速度。

1.3 整數(shù)變換與量化

H.264/AVC 標(biāo)準(zhǔn)基本檔次中使用了4×4整數(shù)變換代替了傳統(tǒng)的浮點(diǎn)DCT變換，這種變換在能量壓縮的性能上與DCT變換十分接近。由于變換矩陣中的系數(shù)均為整數(shù)，所以不會(huì)產(chǎn)生DCT中存在的由于浮點(diǎn)精度引起的正逆變換間的漂移誤差。

典型方案：高通股份有限公司申請(qǐng)的專利（CN101946516A）公開了一種用于對(duì)多媒體視頻進(jìn)行編碼的系統(tǒng)和方法。在對(duì)視頻進(jìn)行編碼時(shí)，針對(duì)每一宏塊選擇一量化參數(shù)。如本文中所描述，可通過(guò)將所有可能量化參數(shù)的總體限于可能量化參數(shù)值的特定范圍而選擇每一宏塊的所述量化參數(shù)。此通過(guò)減少針對(duì)每一視頻宏塊所測(cè)試的量化參數(shù)的數(shù)目而增加視頻編碼的速度。

1.4 熵編碼

H.264/AVC定義了兩種類型的熵編碼方法，基于內(nèi)容自適應(yīng)的變長(zhǎng)編碼（CAVLC）和基于內(nèi)容自適應(yīng)的算術(shù)編碼（CABAC）。兩者相比，CABAC的編碼性能更好，而 CAVLC的編碼更為簡(jiǎn)單快速。

典型方案：高通股份有限公司申請(qǐng)的專利從減低計(jì)算成本以及提高編碼效率兩個(gè)方面進(jìn)行了改進(jìn)：其中，專利（CN103181169A）基于上下文進(jìn)行自適應(yīng)熵編碼，設(shè)置聯(lián)合上下文模型，在32×32的變換塊與16×16的變換塊之間共享，第一變化塊具有經(jīng)歸零以產(chǎn)生具有第二大小的所保持系數(shù)塊的系數(shù)。在具有不同大小的變換單元之間共享的聯(lián)合上下文模型執(zhí)行熵譯碼，從而減少存儲(chǔ)量和計(jì)算成本；其中，專利（CN103563378A）公開了確定用于視頻數(shù)據(jù)塊的上下文信息，所述塊為已編碼塊，在已編碼塊的頂部塊行下方，上下文信息去除來(lái)自已編碼單元的上方相鄰塊的信息?；谏舷挛男畔?duì)當(dāng)前塊數(shù)據(jù)進(jìn)行熵譯碼，從而提高效率。

1.5 環(huán)路濾波

H.264/AVC由于量化技術(shù)而帶來(lái)的在視頻圖像碼率高以及圖像快速運(yùn)動(dòng)情況下而不可避免地產(chǎn)生塊效應(yīng)，使用去塊濾波技術(shù)來(lái)消除塊效應(yīng)，邊界像素的平滑。環(huán)路濾波作為一種典型的去塊濾波技術(shù)而在H.264/AVC中一個(gè)重要特性。主要包括水平邊界濾波和垂直邊界濾波，通過(guò)對(duì)宏塊進(jìn)行閾值判斷，而選擇不同的濾波強(qiáng)度進(jìn)行循環(huán)濾波。

典型方案：三星電子株式會(huì)社申請(qǐng)的專利（CN1189652A）公開了一種環(huán)路濾波，提供水平尺寸以及垂直尺寸的濾波窗口，試用一維梯度運(yùn)算，獲得二值邊緣映射，檢查該窗口內(nèi)是否存在邊緣信息，根據(jù)是否存在邊緣信息來(lái)決定用于由像素相對(duì)應(yīng)濾波窗口的像素濾波的不同強(qiáng)度值。

2 結(jié)語(yǔ)

本文基于H.264/AVC關(guān)鍵技術(shù)進(jìn)行典型專利分析，以期通過(guò)分析獲得各大主流圖像公司針對(duì)視頻編解碼改進(jìn)路線以及改進(jìn)技術(shù)效果。

參考文獻(xiàn)：

[1]高樑.視頻編碼的關(guān)鍵技術(shù)及優(yōu)化研究[D].杭州電子科技大學(xué)， 2011.

[2]姜明俊.H.264幀內(nèi)幀間預(yù)測(cè)算法的優(yōu)化[D].西安電子科技大學(xué)， 2007.