• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于運(yùn)動(dòng)矢量可分級(jí)的視頻編碼方法*

      2010-06-25 09:38:34袁嘉晟方志軍葉金財(cái)
      電視技術(shù) 2010年4期
      關(guān)鍵詞:預(yù)測(cè)出矢量分級(jí)

      袁嘉晟,方志軍,葉金財(cái)

      (江西財(cái)經(jīng)大學(xué) 信息管理學(xué)院,江西 南昌 330013)

      1 引言

      為適應(yīng)復(fù)雜多變的異構(gòu)環(huán)境,視頻編碼引入了可分級(jí)編碼的概念,可分級(jí)視頻編碼(Scalable Video Coding,SVC)可以使視頻流較好地適應(yīng)各種不同的網(wǎng)絡(luò)環(huán)境和用戶終端,并具有一定的容錯(cuò)性和可分級(jí)性。在編碼后的視頻流中,紋理信息占據(jù)了大部分比特,但是在低碼率下,運(yùn)動(dòng)矢量占據(jù)了大部分的碼流,如在可分級(jí)視頻編碼中,運(yùn)動(dòng)矢量占據(jù)了基本層碼流中的絕大部分[1-2]。因此在可分級(jí)視頻編碼中,對(duì)運(yùn)動(dòng)矢量的可分級(jí)編碼是一個(gè)重要要求,特別是在低碼率或者小圖像中。針對(duì)這一問題,筆者提出了一種基于運(yùn)動(dòng)矢量的視頻可分級(jí)編碼思想。

      2 運(yùn)動(dòng)矢量編碼技術(shù)與可分級(jí)技術(shù)

      2.1 運(yùn)動(dòng)矢量

      視頻編碼是數(shù)字視頻處理的重要應(yīng)用,在許多通信服務(wù)中起著至關(guān)重要的作用。視頻序列在時(shí)間維上有很強(qiáng)的相關(guān)性,即存在著大量冗余,利用運(yùn)動(dòng)估計(jì)和運(yùn)動(dòng)補(bǔ)償技術(shù)可以有效地去除視頻幀間的冗余,實(shí)現(xiàn)編碼壓縮。運(yùn)動(dòng)估計(jì)是視頻處理系統(tǒng)的一個(gè)重要的組成部分,已廣泛運(yùn)用于視頻壓縮的標(biāo)準(zhǔn)中。在運(yùn)動(dòng)估計(jì)中,模擬化運(yùn)動(dòng)的最簡(jiǎn)單形式是用一個(gè)常量位移表示,這個(gè)常量位移就是運(yùn)動(dòng)矢量(MV)。 圖 1是測(cè)試視頻序列“foreman”中第1幀到第2幀的運(yùn)動(dòng)矢量表示圖。

      計(jì)算出的運(yùn)動(dòng)矢量即可用于運(yùn)動(dòng)估計(jì)和運(yùn)動(dòng)補(bǔ)償,圖2是原視頻序列第1幀和第2幀的直接差值效果圖,圖3是用加入運(yùn)動(dòng)矢量的視頻第1幀,來(lái)預(yù)測(cè)第2幀,并將預(yù)測(cè)出的第2幀與原視頻序列第2幀進(jìn)行差值的效果。從圖2和圖3的比較中可以看出,若不加運(yùn)動(dòng)矢量,第1幀和第2幀的差值是明顯的,兩幀之間的變化部分可以清楚得看到;若加入運(yùn)動(dòng)矢量預(yù)測(cè)下一幀,預(yù)測(cè)效果明顯變好,預(yù)測(cè)出的幀圖像與原序列幀相差不大,其中可以根據(jù)搜索匹配塊和精度的大小調(diào)節(jié)預(yù)測(cè)精度。

      2.2 可分級(jí)技術(shù)

      圖1 第1幀到第2幀的運(yùn)動(dòng)矢量表示圖

      圖2 原序列第1幀圖像與第2幀直接差值

      圖3 加入運(yùn)動(dòng)矢量預(yù)測(cè)出的幀圖像和原序列第2幀圖像差值

      可分級(jí)性(Scalable)是指通過(guò)僅解碼一部分壓縮的比特流物理地恢復(fù)有意義的圖像或視頻信息的能力[3]。即視頻圖像經(jīng)過(guò)一次編碼后,其壓縮視頻流的碼率可以根據(jù)網(wǎng)絡(luò)的變化而調(diào)節(jié),生成不同碼率的視頻流,因此在碼率降低后,視頻流也可以解碼后正常播放。因此可分級(jí)編碼一般通過(guò)生成不同碼率的視頻流來(lái)實(shí)現(xiàn),采取的方式有PSNR(質(zhì)量)可分級(jí)、空間可分級(jí)、時(shí)間可分級(jí)或它們的組合。可分級(jí)編碼技術(shù)將視頻編碼成N層可分級(jí)的比特流,第1層為基本層,其他層為增強(qiáng)層,第1層提供了能夠解碼重建最基本圖像視頻的比特流,對(duì)其他層的解碼能提高重建圖像視頻的質(zhì)量,直至最佳效果。目前視頻編碼中常用的可分級(jí)技術(shù)主要有質(zhì)量可分級(jí)[4-6]、空間可分級(jí)[7]、時(shí)間可分級(jí)[8]等。

      質(zhì)量可分級(jí)是利用越來(lái)越精細(xì)的量化步長(zhǎng)產(chǎn)生的圖像信息的損失來(lái)對(duì)每幀圖像進(jìn)行分層。其基本思想是通過(guò)對(duì)原始圖像和第1層重建圖像之間的量化差值進(jìn)行編碼以形成增強(qiáng)層。

      空間可分級(jí)是從改變單幀圖像分辨力的角度來(lái)對(duì)視頻進(jìn)行分級(jí),形成不同分層。其基本思想是通過(guò)解碼第1層,形成一個(gè)低分辨力的圖像版本,隨后解碼第2層,將第1層解碼的圖像內(nèi)插到第2層解碼圖像中,隨后以相同的方式解碼后面的增強(qiáng)層。

      時(shí)間可分級(jí)是從改變視頻幀序列的幀率的角度對(duì)視頻進(jìn)行分級(jí),形成不同分層。其基本思想是先將視頻幀進(jìn)行采樣分割,基本層根據(jù)本身的數(shù)據(jù)編碼以提供基本的幀率,增強(qiáng)層通過(guò)對(duì)基本層或增強(qiáng)層的預(yù)測(cè)編碼,最后產(chǎn)生原始視頻的全時(shí)間分辨力。

      因?yàn)檫\(yùn)動(dòng)矢量是由兩幀幀間的運(yùn)動(dòng)估計(jì)來(lái)表示,所以運(yùn)動(dòng)矢量具有時(shí)間可分級(jí)性,但是不經(jīng)過(guò)編碼的運(yùn)動(dòng)矢量并不具有質(zhì)量可分級(jí)性和空間可分級(jí)性。在目前的大多數(shù)視頻壓縮編碼標(biāo)準(zhǔn)里,如H.263,MPEG-4等,運(yùn)動(dòng)矢量的編碼使用的是預(yù)測(cè)差分編碼,即1個(gè)宏塊的運(yùn)動(dòng)矢量與其空間相臨的3個(gè)宏塊的運(yùn)動(dòng)矢量的中值作差,然后對(duì)差值進(jìn)行編碼;而在MC-EZBC[9]中,提出了一種基于上下文的自適應(yīng)二進(jìn)制算數(shù)編碼對(duì)運(yùn)動(dòng)矢量進(jìn)行編碼,使其具有質(zhì)量可分級(jí)和空間可分級(jí)。

      目前的這些運(yùn)動(dòng)矢量編碼方法本質(zhì)上是對(duì)塊匹配后計(jì)算出的運(yùn)動(dòng)矢量比特流進(jìn)行熵編碼,并能夠?qū)幋a后的比特流進(jìn)行截取,達(dá)到相應(yīng)的可分級(jí)性。然而這些運(yùn)動(dòng)矢量編碼方法并沒有對(duì)運(yùn)動(dòng)矢量本身進(jìn)行分析,筆者針對(duì)這種情況,提出一種對(duì)運(yùn)動(dòng)矢量本身進(jìn)行處理的的思路。

      3 基于運(yùn)動(dòng)矢量模值可分級(jí)編碼方法

      前面提到的運(yùn)動(dòng)矢量編碼方法雖然具有可分級(jí)性,但是這些編碼方法都是編碼所有的運(yùn)動(dòng)矢量,而當(dāng)前視頻編碼標(biāo)準(zhǔn)中的運(yùn)動(dòng)估計(jì)中都是分塊進(jìn)行匹配,因此運(yùn)動(dòng)矢量本身存在著大量冗余,例如:相鄰兩幀塊運(yùn)動(dòng)可能并不劇烈或者沒有運(yùn)動(dòng),其運(yùn)動(dòng)矢量的幅值不大或?yàn)榱?。試?yàn)發(fā)現(xiàn),在運(yùn)動(dòng)矢量比特流中,有一些運(yùn)動(dòng)矢量對(duì)其后的運(yùn)動(dòng)估計(jì)和運(yùn)動(dòng)補(bǔ)償預(yù)測(cè)的影響不大,但是這些運(yùn)動(dòng)矢量所占用的比特流還是一定的,因此可以將這些運(yùn)動(dòng)矢量的比特流進(jìn)行截取以達(dá)到可分級(jí)的效果。

      對(duì)運(yùn)動(dòng)矢量進(jìn)行分析判斷,先設(shè)定閾值T,將運(yùn)動(dòng)矢量的模與閾值比較,若運(yùn)動(dòng)矢量的模值大于閾值,則將該運(yùn)動(dòng)矢量保留,反之則去除。其判斷依據(jù)為

      兩幀之間的運(yùn)動(dòng)矢量存在一個(gè)最大值,因此T可以先取最大值,此時(shí)運(yùn)動(dòng)矢量比特流為0,隨后逐漸減小T,可以逐步得到部分的運(yùn)動(dòng)矢量比特流,直到完全獲取運(yùn)動(dòng)矢量比特流,最后再對(duì)截取出的運(yùn)動(dòng)矢量比特流進(jìn)行相應(yīng)的運(yùn)動(dòng)矢量編碼。圖4是閾值為5時(shí)測(cè)試視頻序列foreman第1幀到第2幀截取后的運(yùn)動(dòng)矢量表示圖。比較圖1可見,一些模值相對(duì)小的運(yùn)動(dòng)矢量被去除了,如背景圖案部分,而保留了模值較大即塊運(yùn)動(dòng)較為劇烈的運(yùn)動(dòng)矢量,如臉部部分。

      圖4 閾值為5時(shí),截取后第1幀到第2幀的運(yùn)動(dòng)矢量表示圖

      4 實(shí)驗(yàn)結(jié)果與分析

      為了評(píng)估文中提出的思想,使用了stefan和foreman視頻序列進(jìn)行測(cè)試。其視頻序列為CIF格式,幀率30 f/s(幀/秒),分塊大小8,搜索范圍4,精度為半像素。對(duì)視頻的前2幀進(jìn)行分析,將第1幀設(shè)為參考幀,第2幀設(shè)為預(yù)測(cè)幀,隨后對(duì)計(jì)算出的運(yùn)動(dòng)矢量由閾值進(jìn)行截取,得到運(yùn)動(dòng)矢量的比特流,計(jì)算其模值大??;然后將截取后的運(yùn)動(dòng)矢量加入到參考幀中,以預(yù)測(cè)下一幀;將預(yù)測(cè)出的幀圖像與原序列第2幀作差值,算出方差和峰值信噪比。圖5為foreman視頻序列第1幀,圖6為foreman視頻序列第2幀,圖7為在設(shè)定閾值為5時(shí),加入截取后運(yùn)動(dòng)矢量比特流的foreman視頻序列第1幀預(yù)測(cè)出的幀圖像,圖8為預(yù)測(cè)出的幀圖像(閾值5)與原序列第2幀圖像的差值圖像。將圖8與第2節(jié)介紹的加入全運(yùn)動(dòng)矢量比特流預(yù)測(cè)出的幀圖像作比較,可以看到差別不是很大;但在一些運(yùn)動(dòng)變化較小的區(qū)域,差值的效果變得明顯,如背景圖案部分,這是因?yàn)榻?jīng)過(guò)閾值判斷后,去除了模值小的運(yùn)動(dòng)矢量。

      圖5 foreman序列第1幀

      圖6 foreman序列第2幀

      圖7 閾值為5時(shí)的預(yù)測(cè)幀

      圖8 預(yù)測(cè)出的第2幀(閾值5)與原序列第2幀的差值圖

      針對(duì)foreman視頻序列,表1顯示的是在不同閾值下,第1幀加入運(yùn)動(dòng)矢量預(yù)測(cè)出的第2幀與原序列第2幀的方差(SE)和峰值信噪比(PSNR)值及待編碼的運(yùn)動(dòng)矢量比特?cái)?shù)。表中閾值為0時(shí),表示運(yùn)動(dòng)矢量全保留,此時(shí)SE最小,PSNR和比特?cái)?shù)最大;其次因?yàn)橄噜弮蓭g的運(yùn)動(dòng)矢量模值必存在一個(gè)最大值,在閾值達(dá)到這個(gè)最大值時(shí),運(yùn)動(dòng)矢量將全被去除,此時(shí)相當(dāng)于第1幀不預(yù)測(cè),而差值正是兩幀之間相減,此時(shí)SE最大,PSNR最小,比特?cái)?shù)為0。

      圖9為stefan視頻序列第1幀,圖10為stefan視頻序列第2幀,圖11為在設(shè)定閾值為5時(shí),加入截取后運(yùn)動(dòng)矢量比特流的stefan視頻序列第1幀預(yù)測(cè)出的幀圖像,圖12為預(yù)測(cè)出的幀圖像(閾值5)與原序列第2幀圖像的差值圖像。

      針對(duì)stefan視頻序列,表2顯示的是在不同閾值下,第1幀加入運(yùn)動(dòng)矢量預(yù)測(cè)出的第2幀與原序列第2幀的方差和峰值信噪比值及待編碼的運(yùn)動(dòng)矢量比特?cái)?shù)。

      表1 foreman視頻序列在不同閾值下的SE和PSNR和比特?cái)?shù)

      圖9 stefan序列第1幀

      圖10 stefan序列第2幀

      圖11 閾值為5時(shí)的預(yù)測(cè)幀

      圖12 預(yù)測(cè)出的第2幀(閾值5)與原序列第2幀的差值圖

      表2 stefan視頻序列在不同閾值下的SE和PSNR和比特?cái)?shù)

      從兩個(gè)實(shí)驗(yàn)結(jié)果可見,隨著閾值的增大,運(yùn)動(dòng)矢量的比特?cái)?shù)也隨之減少,且減少的幅度較大。這樣可以對(duì)運(yùn)動(dòng)矢量的比特流在任意點(diǎn)截取,將截取的運(yùn)動(dòng)矢量加入到參考幀中,以預(yù)測(cè)下一幀。這樣做可以在預(yù)測(cè)時(shí)先傳輸一部分運(yùn)動(dòng)矢量,其后漸進(jìn)傳輸剩下的運(yùn)動(dòng)矢量比特流,以逐步提高預(yù)測(cè)后的視頻幀圖像質(zhì)量,達(dá)到質(zhì)量可分級(jí)的目的。

      5 小結(jié)

      筆者提出了一種基于運(yùn)動(dòng)矢量可分級(jí)的視頻編碼方法,對(duì)運(yùn)動(dòng)矢量模進(jìn)行判斷,截取其比特流,以達(dá)到質(zhì)量可分級(jí),并通過(guò)實(shí)驗(yàn)分析,說(shuō)明了該方法的可行性。但該方法的進(jìn)一步應(yīng)用還有諸多問題需要解決,如截取運(yùn)動(dòng)矢量比特流的方式、與熵編碼的結(jié)合方式等,這也是下一步研究的方向。

      [1]LI Weiping.Overview of fine granularity scalability in MPEG-4 video standard[J].IEEE Trans.Circuits and Systems,2001,11(3):301-317.

      [2]哈力旦·A,方勇.一種改進(jìn)的運(yùn)動(dòng)矢量編碼方法[J].西安電子科技大學(xué)學(xué)報(bào):自然科學(xué)版,2005,32(4):639-642.

      [3]WANG Y,OSTERMANN J,ZHANG YQ.視頻處理與通信[M].候正信,譯.北京:電子工業(yè)出版社,2003.

      [4]朱瑩,郁梅,陳懇,等.H.264標(biāo)準(zhǔn)的新擴(kuò)展——可伸縮性編碼及應(yīng)用[J].電視技術(shù),2006(4):11-13.

      [5]韓濤,王群生,楊春玲.精細(xì)可伸縮性視頻編碼的研究[J].電視技術(shù),2007,31(9):12-14.

      [6]楊雪婷,林其偉.基于H.264的精細(xì)可分級(jí)編碼結(jié)構(gòu)改進(jìn)方案[J].電視技術(shù),2009,33(S1)∶36-37.

      [7]馮璐,鮑衛(wèi)兵,劉峰.基于H.264的空間SVC快速模式選擇算法[J].電視技術(shù),2007,31(12):20-22.

      [8]閻金,全子一,門愛東.基于H.264的時(shí)間可分級(jí)編碼結(jié)構(gòu)的研究[J].電視技術(shù),2006(1):16-18.

      [9]CHEN Peisong.Fully scalable subband/wavelet coding[D].Troy,NY USA:Rensselaer Polytechnic Institute,2003.

      猜你喜歡
      預(yù)測(cè)出矢量分級(jí)
      矢量三角形法的應(yīng)用
      吸引力無(wú)法則
      分級(jí)診療路難行?
      分級(jí)診療的“分”與“整”
      基于矢量最優(yōu)估計(jì)的穩(wěn)健測(cè)向方法
      三角形法則在動(dòng)態(tài)平衡問題中的應(yīng)用
      分級(jí)診療的強(qiáng)、引、合
      “水到渠成”的分級(jí)診療
      量體薦衣
      色料減色混合色矢量計(jì)算
      出版與印刷(2013年3期)2013-01-31 03:26:11
      大兴区| 上栗县| 新宁县| 栾川县| 定陶县| 玛沁县| 普陀区| 馆陶县| 安西县| 苍南县| 靖州| 合作市| 涪陵区| 苏尼特左旗| 西宁市| 延庆县| 尚志市| 临漳县| 屏山县| 江山市| 黄平县| 顺平县| 赤水市| 姚安县| 贵定县| 宁蒗| 潼关县| 沽源县| 襄樊市| 巴里| 巴南区| 个旧市| 娱乐| 保亭| 西丰县| 肥东县| 克拉玛依市| 万山特区| 大连市| 松原市| 巴南区|