徐文臣,陳前斌
(重慶郵電大學 通信與信息工程學院,重慶 400065)
一部完整的視頻節(jié)目序列一般不會由單一的場景構成。H.264標準中采用了預測編碼算法,在基于同一個場景時,其中的物體變化較小,能有效進行預測;但在不同場景間,差異可能變得很大,即場景的轉換將破壞相鄰兩幀之間的相關性,后一個場景幀如果繼續(xù)依靠前一個場景幀來進行預測編碼,會導致壓縮后圖像質(zhì)量下降和編碼資源浪費,這就需要進行場景轉換檢測并作相應處理,來提高編碼效率和編碼質(zhì)量。
視頻場景轉換主要包括突變、消融和淡入淡出等類型[1]。目前主要的場景轉換檢測方法有基于塊匹配檢測、基于邊緣輪廓檢測和基于灰度直方圖檢測等[2-6]。基于灰度直方圖的方法是通過對比當前幀與參考幀的灰度直方圖來進行檢測的。單一場景下兩幀灰度值差異較小,而當灰度值發(fā)生突變時,就說明可能有場景轉換?;叶戎狈綀D法在檢測時間與準確性上都能取得較好的結果,并且簡單易實現(xiàn),在實際應用中比較常見[7]。筆者也采用灰度直方圖方法對場景轉換進行檢測。
視頻場景轉換檢測一般可采用YUV模型,便于對場景切換點進行準確判斷。由于色度分量U和V的直方圖分布很窄,通常只采用圖像亮度分量Y的直方圖作為尋找鏡頭切換的依據(jù)。
某視頻序列中第n幀和第n+1幀中所有像素點的灰度差值計算公式為
式中:fn(i,j)和 fn+1(i,j)為第 n 和第 n+1 幀中像素(i,j)的灰度值,fd(i,j)為兩幀對應點(i,j)的灰度差。 則相鄰兩幀之間的總幀差為
式中:M,N為圖像的長度和寬度。同一個場景中相鄰兩幀對對應點的灰度差值總和fd較小,而不同場景fd較大。當fd大于某個閾值時,可判斷出鏡頭發(fā)生切變。該方法原理簡單,便于實現(xiàn),對簡單的視頻具有良好的突變檢測效果。
灰度法的不足在于:對場景內(nèi)物體運動、光線條件的劇烈變化很敏感,易導致誤檢,降低了算法的檢測精度。
直方圖可以反映一幅圖像的灰度或者顏色分布情況,也可判斷出圖像之間的相似度,并以此來判斷是否有場景轉換。當發(fā)生場景轉換時,前后兩幀的直方圖往往會發(fā)生明顯變化。
較常用的直方圖有以下幾種:
1)直接使用直方圖差值的絕對值來計算前后兩幀之間的差值。第n幀和第n+1幀的幀間差[4]為
式中:N為圖像的顏色等級數(shù),Hn(i)為第n幀圖像彩色直方圖中顏色值為i的像素的總數(shù)。
2)采用 χ2檢測方法[8],目的是為了強化出場景突變發(fā)生時的差異。
該方法不僅可以有效降低物體運動所造成的影響,而且可以突顯突變的特性。
3)局部區(qū)域直方圖的方法,將一幀分為16個小的區(qū)域,分別和下一幀對應區(qū)域比較差異,并且為了防止區(qū)域內(nèi)因物體移動所造成誤差太大而引起的誤判,在由16個區(qū)域差值中取較小的8個差值計算平均,作為兩幀間的平均差值。再通過實驗得到一個閾值,如果平均差值超過閾值,則判斷發(fā)生了場景轉換[8]。
4)帶權值直方圖
在圖像中,某些顏色分量所占比重很大,在計算幀間差時此顏色分量就應賦予較大的權值。因此有了帶權直方圖
式中:α,β,γ分別代表圖像中紅、綠及藍色分量對應的顏色直方圖的權值。
直方圖反映的是圖像整體的顏色分布,不考慮像素的位置信息,因此它對場景內(nèi)物體的運動并不敏感,在一定程度上克服了灰度法的缺點。但它只是相對于圖像整體顏色信息的一種描述,并沒有表示出顏色的位置信息,即兩副完全無關的圖像也可能擁有完全相同的直方圖信息,這種情況出現(xiàn)時,就無法有效檢測出場景轉換。
綜合對灰度法和直方圖法分析可知,灰度差和直方圖在利用圖像的特征方面具有一定的互補性,因此需要對兩種方法進行綜合考慮制定算法。
筆者采用歸一化的灰度直方圖來對相鄰兩幀進行比較。該算法計算視頻序列中所有視頻幀的灰度直方圖,進行歸一化處理后,再采用了雙閾值進行比較。算法設置2個閾值T1和T2(T1 第n幀與前一幀各像素點灰度值的絕對差值之和為 式中:H(i,j,n)表示第 n 幀的中(i,j)處的灰度值。 對 H(n)進行歸一化處理得 式中:分母表示該幀前面所有幀的灰度值的均值。當判斷發(fā)生了場景轉換時,從轉換后的第一幀開始n就重新計數(shù),即Hl(n)表示在同一個場景中的歸一化值。 式中:G(l)表示相隔為l幀的累積幀差。 當 Hl(n) 當檢測出場景轉換后,把轉換后的第一幀設置為初始幀,重新統(tǒng)計該場景的灰度差值的和,直到檢測出下一個場景轉換。在本算法中,T1設為1.3,T2設為2.3,能得到比較好的檢測效果。 對實驗結果采用兩個通用的檢測效率衡量指標[5,8]進行分析 實驗結果如表1所示??梢?,當片段中場景轉換很快并且是在幾乎同樣昏暗的背景下發(fā)生時,比較難以檢測;當圖像中的物體有較劇烈運動時可能會造成誤判。此外,均取得了較好的效果。 表1 實驗結果統(tǒng)計 筆者在沒有增加太多算法復雜度的情況下,提出了基于灰度直方圖的場景轉換檢測算法,結合雙閾值來進行檢測場景轉換,并且通過實驗取得了比較滿意的準確率和查全率,為以后對視頻序列的分析和處理打下了基礎。與其他算法相比,該算法復雜度較低,易于實現(xiàn),在檢測中能達到一般的視頻檢測要求。但該算法仍無法解決閃光效果引起的誤差及目標運動較大的問題,尚需深入研究,以進一步提高檢測的精準度。 [1]紀志勝,周軍.基于模型的視頻漸變鏡頭檢測方法[J].電視技術,2009,33(1):88-90. [2]LIENHART R W.Reliable transition detection in videos:a survey and practitioner′s guide[J].International Journal of Image and Graphics(IJIG),2001,1(3):469-486. [3]LUPATINI G,SARACENO C,LEONARDI R.Scene break detection:a comparison[C]//SILBERSCHATZ A.Proc.Eighth Int.Workshop on Continuous Media Databases and Applications.Florida:IEEE Press,1998:34-41. [4]朱曦,林行剛.視頻鏡頭時域分割方法的研究[J].計算機學報,2004,27(8):1027-1035. [5]江偉,劉群,吳渝.與紋理和直方圖特征相融合的鏡頭邊界檢測方法[J].重慶郵電大學學報:自然科學版,2009(1):100-104. [6]劉玲玲,張云翔.基于壓縮域的場景變換檢測[J].電視技術,2003(4):13-14. [7]CHOWDHURY M U,RAHMAN R,SANA J,et al.Fast scene change detection based histogram[C]//IEEE/ACIS International Conference on Computer and Information Science,2007.[S.l.]:IEEE Press,2007:229-233. [8]NAGASAKA A,TANAKA Y.Automatic video indexing and full-video search for object appearances[C]//Proc.the IFIPTC2/WG 2.6 Second Working Conference on Visual Database Systems II.Amsterdam,The Netherlands:North-Holland Publishing Co.,1991:113-127. [9]朱興全,薛向陽,吳立德.一種自動門限選取的視頻shot分割方法[J].計算機研究與發(fā)展,2000,37(1):80-85. [10]周藝華,曹元大,張洪欣.一種通用的漸變鏡頭檢測方法[J].計算機應用研究, 2006,23(2):250.4 實驗結果
5 小結