• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      立體視頻資源存儲入庫研究

      2016-03-12 07:18:09劉龍濤
      考試周刊 2016年9期
      關鍵詞:鏡頭場景關鍵幀

      劉龍濤

      摘 要: 隨著立體視頻資源數(shù)量的不斷增加,立體視頻資源的存儲和獲取不斷多樣化,為了便于立體視頻資源的高效管理及利用,對立體視頻的鏡頭、場景、關鍵幀三個方面進行研究,建立立體視頻存儲入庫模型,對立體視覺資源進行存儲入庫,實現(xiàn)對立體視頻資源的高效管理及利用,緩解立體視頻資源匱乏的狀態(tài)。

      關鍵詞: 立體視頻資源 鏡頭 場景 關鍵幀

      1.引言

      隨著多媒體技術的快速發(fā)展,立體視頻逐漸融入人們的日常生活中,應用領域不斷擴大,已經(jīng)廣泛應用于軍事、醫(yī)療、虛擬現(xiàn)實、教育科研等領域,尤其是教育領域的應用不斷增加,同時產生大量立體視頻資源。常見的立體視頻以雙目立體視頻為主,通常采用雙路分離、左右合成、上下合成等格式表示,并通過紅藍或者偏光等形式顯示和觀看。隨著立體視頻資源的增多,立體視頻資源存儲入庫成為亟待解決的問題。本文主要解決雙目立體視頻的存儲入庫。

      2.立體視頻的本質特征

      立體視頻幀的本質特征是視頻幀本身所蘊含的特征信息,包括視頻幀的顏色特征、紋理特征、形狀特征、視差特征、深度特征,等等。

      顏色特征是數(shù)字圖像領域中應用最廣的特征之一,提取圖像的顏色特征分為三步:選取顏色空間、顏色區(qū)間量化、相似性計算。顏色空間是一種通過特殊規(guī)則加以說明的顏色集合體,數(shù)字圖像上幾乎任何一種顏色都能在顏色空間找到對應的點,常用的顏色空間:RGB顏色空間,HSV顏色空間,YUV顏色空間。紋理特征是一種不依賴于顏色或亮度的反映圖像中同質現(xiàn)象的視覺特征,是物體表面特性,例如高山、小橋、石頭、衣服等都有各自的紋理特征。紋理特征包含物體表面結構組織排列的重要信息及其與周圍環(huán)境的聯(lián)系。形狀特征是指一個物體的外部輪廓,與顏色特征和紋理特征相比,形狀特征在描述立體視頻內容時更具有語義含義。形狀特征首先需要對圖像分割,把對象提取出來,再用各種方法進行匹配測量。對于形狀特征的描述方法有:邊界特征法、傅里葉形狀描述法、集合參數(shù)法、最小生成樹等[1]。

      與2D視頻相比,立體視頻增加了視差和深度特征。立體電影的制作就是利用了雙目視差的原理。在拍攝時,使用兩臺攝像機相距幾厘米同時進行拍攝。放映時,把兩個影像同時放映在屏幕上,觀眾戴上立體眼鏡使左右兩眼的像落在視網(wǎng)膜上的非對應點,并產生一定的差異,從而產生立體視覺。

      雙目視差是指兩眼注視外界物體時,兩個視網(wǎng)膜上視像之間的差異。距離和深度知覺,主要依賴雙目視差,它是形成立體視覺的最重要的依據(jù)。人的雙眼結構相同,雙眼間的距離大約是6.5cm,當人們觀看三維物體時,物體投射在左右眼睛上的像并不完全落在視網(wǎng)膜上的對應區(qū)域,左眼看物體的左邊多一些,右眼看物體的右邊多一些,三維物體在雙眼視網(wǎng)膜上的像就存在差異,稱為雙目視[2]。深度信息反映了所拍攝物體到相機的距離,獲得深度信息的方式有兩種;第一種是通過拍攝儀器直接獲得,但通過這種方式獲得的深度信息往往分辨率低,并且需要很大的計算復雜度,對硬件設備要求很高,一般情況下難以達到實時拍攝的需求。第二種深度信息的獲取是靠幾何學知識,利用已知參數(shù)的攝像機拍攝出的雙目視頻,利用立體匹配計算出視差后,反推視頻對象的深度信息[2]。隨著立體匹配技術的不斷完善,現(xiàn)在已形成許多各具特色的匹配算法。已有算法根據(jù)匹配準則的不同,大致可以分為兩大類:一類是局部匹配算法;另一類是全局匹配算法。全局匹配算法與局部匹配算法相比,匹配準確性較高,可以獲得較高精度的稠密視差圖,但是往往計算量大、耗時比較長、不易于硬件實現(xiàn),無法應用于實時系統(tǒng)??傊瑑深惲Ⅲw匹配算法各有優(yōu)缺點,適用于不同的情況和空間場景[3]。

      3.建立立體視頻存儲入庫模型

      視頻結構一般分為視頻、場景、鏡頭、視頻幀四個層次[4]。本文主要對立體視頻資源的鏡頭、場景、關鍵幀三個方面進行研究,建立立體視頻資源存儲入庫模型。

      3.1立體視頻鏡頭分解存儲入庫

      鏡頭是由時間上連續(xù)的幀構成,同一個鏡頭內的內容具有一致性。通過判斷連續(xù)幀之間的差異確定鏡頭的邊界。根據(jù)鏡頭邊界的不同,可分鏡頭的突變和鏡頭的漸變。鏡頭突變是指一個鏡頭內容的變化發(fā)生在單個視頻幀上。鏡頭漸變是指相鄰的兩個鏡頭的變換是逐漸完成的,在鏡頭切換的時候加入編輯特效,達到視覺上平滑過渡的效果。根據(jù)編輯特效的不同,鏡頭的漸變可以分為淡入(fade in)、淡出(fade out )、溶解(dissolve)、擦拭(wipe)等不同類型。淡入是指畫面亮度不斷增強;淡出是指畫面亮度慢慢變暗最終消失;溶解是指鏡頭的幀逐漸變淡退出;擦拭是指后一個鏡頭的畫面慢慢代替前面的一個鏡頭的畫面。

      目前立體視頻鏡頭分割算法大多是基于2D視頻的,立體視頻鏡頭分割算法還不成熟,2D視頻的鏡頭邊界檢測算法主要分為兩大類:基于像素域的方法和基于壓縮域的方法。像素域中鏡頭邊界檢測方法主要利用時空域中的顏色、紋理、形狀等特征進行檢測。像素域中的算法主要有像素比較法,基于直方圖的方法,塊匹配法,基于邊緣的方法。由于現(xiàn)在大多數(shù)視頻序列以壓縮格式存儲,對這些壓縮形式的視頻流直接進行邊界檢測,節(jié)省大量解壓縮時間。目前壓縮域中的主要有基于DCT系數(shù)的方法,基于小波變化的方法,時空分析法。

      雖然2D視頻的鏡頭分割算法能完成立體視頻資源存儲入庫的預處理工作,但是運用2D視頻鏡頭分割算法處理雙目立體視頻時,檢測結果往往存在一定誤差,并且不能很好地檢測鏡頭漸變的完整邊界變化,在2D視頻的鏡頭分割算法的基礎上,提取立體視頻的深度特征,進行鏡頭邊界檢測,從而提高鏡頭邊界的檢測精度,實現(xiàn)對立體視頻的鏡頭準的確分割?;诹Ⅲw視頻鏡頭分割算法,對立體視頻資源存儲入庫。

      3.2立體視頻場景分解存儲入庫

      場景是由連續(xù)鏡頭組成的視頻片段,是表達一個完整情節(jié)的邏輯故事單元。

      立體視頻場景分割,以鏡頭作為研究對象,根據(jù)鏡頭的內容相關性和時間上的鄰近性把相似的鏡頭劃分到同一場景中,這樣一段視頻被分割成若干個有意義的邏輯故事單元。

      目前立體視頻場景分割算法大多是基于2D視頻的,立體視頻場景分割算法還不成熟。大體上通過提取鏡頭的視覺特征,把內容相關時間相近的鏡頭聚類成一個場景,或者綜合視覺信息和聽覺信息劃分場景[5]。

      與傳統(tǒng)的2D視頻場景分割不同,立體視頻利用立體視頻鏡頭分割算法的結果,結合立體視頻顏色特征、紋理等本質特征,通過鏡頭聚類,檢測場景邊界,利用立體視頻的深度特征,實現(xiàn)對場景的準確分割,基于立體視頻場景分割算法,對立體視頻資源存儲入庫。

      3.3立體視頻關鍵幀分解存儲入庫

      幀是立體視頻的基本組成單位,立體視頻的每一幀都可以看成空間上獨立、時間上相關的靜止圖像。空間上獨立體現(xiàn)在立體視頻的每一幀都可以進行分析處理,時間上相關體現(xiàn)在時間軸上相鄰的幀一般會有內容上的相似性。

      由于立體視頻中,幀的數(shù)量巨大,可以用關鍵幀描述鏡頭和場景。這樣既充分描述了視頻內容,又減少了冗余信息。關鍵幀就是能描述立體視頻內容主要的幀。根據(jù)立體視頻結構的復雜程度,關鍵幀可以由一幀或者多個幀組成。

      目前立體視頻關鍵幀提取算法主要是:基于鏡頭邊界提取關鍵幀,基于運動分析提取關鍵幀,基于圖像信息提取關鍵幀,基于鏡頭活動性提取關鍵幀,基于聚類的方法提起關鍵幀。

      Zhang,Wu[6]等人依據(jù)幀間的顯著變化來為2D視頻選擇多個關鍵幀,首先把鏡頭的第一幀作為關鍵幀,然后計算前一個關鍵幀與剩余幀之差,如果差值大于某一閾值,則再選取一個關鍵幀。與2D視頻不同,立體視頻依據(jù)幀間的顯著變化,再加上立體視頻的深度信息構建相鄰幀差,實現(xiàn)對關鍵幀的準確提取,基于立體視頻關鍵幀提取算法,對立體視頻資源存儲入庫。

      4.結語

      在2D視頻的鏡頭分割算法上基礎上,增加立體視頻的深度特征,得出立體視頻鏡頭分割算法,進而研究出立體視頻場景分割算法和關鍵幀提取算法,從鏡頭、場景、關鍵幀三個方面實現(xiàn)對立體視頻資源高效的管理及利用。對立體視頻資源存儲入庫的同時,增加了立體視頻素材,緩解了立體視頻資源匱乏的現(xiàn)狀。

      參考文獻:

      [1]印勇,侯海珍.基于直方圖幀差的自適應鏡頭分割算法[J].計算機工程與應用,2010,09:186-189.

      [2]王波.雙目視差的立體視覺及其在技術課程教育中的應用[D].浙江工業(yè)大學,2012.

      [3]楊志榮.雙目視覺立體匹配方法和遮擋問題研究[D].燕山大學,2010.

      [4]Yong Rui,Huang,T.S,Mehrotra, S, “Exploring video structure beyond the shots,”in Multimedia Computing and Systems,1998. Proceedings. IEEE International Conference on,vol,no, pp.237-240,28 Jun-1 Jul 1998.

      [5]王旭軍.視頻場景分割方法研究[D].重慶大學,2010.

      [6]Zhang Z,Wu J, Zhong D,et al. An Integrated System for Content based Video Retrieval and Browsing [J].Pattern Recognition,1997,30(4):643.

      國家科技支撐計劃資助項目(2012BAH37F02)。

      猜你喜歡
      鏡頭場景關鍵幀
      基于改進關鍵幀選擇的RGB-D SLAM算法
      三維場景瀏覽中建筑造型的特點及鏡頭運用
      東方教育(2016年14期)2017-01-16 11:16:05
      場景傳播視閾下的網(wǎng)絡直播探析
      新聞界(2016年15期)2016-12-20 09:46:44
      漢語語篇英譯中詞匯場理論和框架理論的應用研究
      考試周刊(2016年93期)2016-12-12 09:34:00
      以二維動畫短片《回家》為例,談其創(chuàng)作步驟
      場景:大數(shù)據(jù)挖掘的新標準
      今傳媒(2016年9期)2016-10-15 22:08:05
      基于相關系數(shù)的道路監(jiān)控視頻關鍵幀提取算法
      用努力化夢為真
      戲劇之家(2016年5期)2016-04-05 12:56:32
      從小人物看大時代,從平淡中獲成長
      基于聚散熵及運動目標檢測的監(jiān)控視頻關鍵幀提取
      准格尔旗| 湛江市| 安康市| 咸宁市| 永宁县| 古浪县| 敖汉旗| 饶河县| 玉溪市| 广西| 东丰县| 郯城县| 册亨县| 雷波县| 宣威市| 奎屯市| 成安县| 兴城市| 通许县| 十堰市| 大悟县| 贵阳市| 马山县| 西平县| 灵宝市| 建阳市| 大洼县| 玉树县| 台安县| 津南区| 连城县| 桓仁| 凯里市| 高碑店市| 大石桥市| 邳州市| 晋城| 绵竹市| 稻城县| 楚雄市| 昂仁县|