陳雪艷,時 黛
(內(nèi)蒙古民族大學(xué) 機械工程學(xué)院,內(nèi)蒙古 通遼 028000)
隨著三網(wǎng)融合工作的不斷深入推進,媒體業(yè)務(wù)量隨之劇增,一些運營機構(gòu),如地方電視臺,出于商業(yè)利益,在原有電視節(jié)目的基礎(chǔ)上嵌入或插播其他商業(yè)信息的現(xiàn)象比較普遍,另外不法分子對媒體業(yè)務(wù)進行篡改或插播等惡意操作現(xiàn)象也時有發(fā)生。2014 年8 月溫州有線電視臺遭“黑客”攻擊,用戶在收看電視節(jié)目時,屏幕中插播了大量的非法圖文信息,產(chǎn)生不可估量的負面效應(yīng),且造成嚴重的經(jīng)濟損失。由于受眾群體規(guī)模龐大,多媒體業(yè)務(wù)的惡意操作會帶來惡劣的社會影響,已成為一個關(guān)系國家安全的問題。
國外很多學(xué)者針對視頻篡改檢測進行了深入的研究,并取得了一定的成果。Weihong Wang 和Hany Rarid 提出了多種視頻篡改檢測算法:針對MPEG 視頻二次壓縮的篡改檢測[1]、基于灰度向量協(xié)方差的視頻篡改檢測[2]、一種用于隔行掃描和非隔行掃描的視頻篡改檢測[3]、二次量化MPEG 視頻篡改檢測[4]。Michihiro 等人根據(jù)各類型相機的噪聲模式相當于其指紋這一特征,提出通過檢測篡改視頻中隱藏的噪聲特征不一致性判斷視頻是否被篡改[5]。Kancherla 等人根據(jù)篡改視頻和原始視頻幀差異性特征,通過提取幀運動殘留信號,利用Markov 模型提取每幀324 維特征,采用支持向量機進行分類。由于特征維數(shù)較高,計算較復(fù)雜,所以此方法的分類準確率較低[6]。
近年來,國內(nèi)對視頻篡改檢測的關(guān)注度也越來越高,研究范圍也逐漸拓寬。秦運龍等人提出了一種針對MPEG 格式視頻[7],通過判斷視頻P 幀運動矢量幅度與均值運動矢量的偏移量來檢測視頻是否發(fā)生插入或刪除篡改,并定位篡改點。Chao 等人利用視頻光流一致性特點,提出基于光流一致性的篡改檢測算法[8]。根據(jù)成像傳感器像素不均勻的特性,郭琳琳[9]等人采用小波濾波器提取視頻幀中的殘留噪聲,通過分析噪聲的頻譜差異實現(xiàn)摳像視頻的檢測。劉雨青[10]等人針對視頻中運動目標從固定背景中移除的情況,通過篡改前后幀的能量分布連續(xù)性來檢測是否存在幀內(nèi)目標的刪除,并根據(jù)能量可疑度大致對篡改區(qū)域進行定位。
通過提取視頻特征進行篡改檢測也是當前的研究熱點,如提取時空特征、顏色特征及紋理特征[11]等進行視頻篡改檢測。在特征提取的過程當中,每一種特征都有其不足之處,單一特征往往不能全面表達圖像的可視信息。目前已經(jīng)有學(xué)者意識到了多特征融合的重要性,并提出了多特征融合的解決方案。如針對幀內(nèi)插入異源視頻的情況,李富貴等人提出一種多特征融合的異源視頻篡改檢測[12],利用二維相位一致性及噪聲模式,提取視頻特征,并進行特征融合,通過支持向量機分類實驗證明檢測的有效性。多特征融合使得問題得到了較好的解決。如何對視覺特征進行有效融合,從而實現(xiàn)高效準確的視頻篡改檢測,是該領(lǐng)域需要研究的關(guān)鍵問題。本文介紹一種新的多特征融合的篡改檢測算法:結(jié)合LM 算法對BFGS 進行改進,用改進的BFGS 神經(jīng)網(wǎng)絡(luò)對視頻特征進行融合篡改檢測,實現(xiàn)了良好的檢測效果。
為了快速有效地鑒別視頻是否被篡改,應(yīng)選取視頻特征量,平均梯度和信息熵對視頻幀信息的評價較為全面,并且算法簡單,所以本文選擇平均梯度和信息熵作為特征量。
平均梯度[13](average energy gradient)是圖像質(zhì)量的評價函數(shù),指圖像的邊界或影線兩側(cè)附近灰度有明顯差異。它反映了圖像對細節(jié)對比的表達能力。平均梯度Aeg 定義為
式中: F( i,j) 為圖像的第i 行,第j 列的灰度值; M 為圖像的總行數(shù); N 為圖像的總列數(shù)。
熵用來表征圖形灰度分布的聚集特性,也是一種信息量的描述,假設(shè)信息量為I(xk),則I(xk)在離散數(shù)值上的平均值稱之為信息熵(information entropy)。信息熵H(X)定義為
但是一維信息熵不能反映圖像灰度分布的空間特征,為了將這種空間特征有效的表示出來,需要在一維熵的基礎(chǔ)上引進能夠反映灰度分布空間特征的特征量來組成圖像的二維熵,其定義式為
通常,單一特征不能很好地表現(xiàn)出每幅圖像的顯著特征,從而影響檢測效果,多特征融合能夠改善這種情況,進一步提高檢測效率,如圖1 所示。
圖1 單一特征檢測效果
BFGS 神經(jīng)網(wǎng)絡(luò)學(xué)習算法是最優(yōu)化理論中一類典型的擬牛頓法,但該算法計算Hessian 矩陣時很復(fù)雜,雖然精確度高,但代價也很大,而相對于BFGS,LM 算法的收斂速度快,所以本文從Hessian 矩陣入手,在BFGS 算法中的近似Hessian 矩陣不滿足迭代要求時引入LM 算法進行融合改進,以彌補BFGS 算法的不足。
2.1.1 BFGS 算法
BFGS 算法公式為
其中,δk=xk-xk-1,γk=gk-gk-1,gk為函數(shù)f 在xk處的梯度值。
Al-Baali 和Fletcher 提出如下測試公式,用來表征近似的Hessian 和Hessian 之間的誤差。
2.1.2 算法步驟
BFGS 算法收斂所需的步長較小,所以迭代過程中所需要的儲存空間及計算量比LM 大,因此在保證Hessian 矩陣誤差可接受時,選擇LM 算法。采用本算法的結(jié)果可以保證γk比較大時Bk同樣具有對稱正定性,保證結(jié)果可靠性。
步驟1:確定初始點X(0)和初始矩陣B0=In及精確度ε >0;
步驟2:若 Δf(x(0))<ε 停止,返回極小值點;
步驟3:取p(0)=-B0Δf(x(0));
步驟4:通過線性搜索法,不斷迭代求出極小值點x(k);
步驟5:更新Hessian 矩陣
其中:LM(A,λ)=(AAT+λATT),ATT=diag(AAT),λ 為阻尼系數(shù),A 為Jacobian 矩陣。λATT的引入是為了防止BK在極值點的附近出現(xiàn)病態(tài)。
步驟6:返回,繼續(xù)迭代。
為了證明本文算法的優(yōu)越性,選取一簡單二元二次方程作為實驗函數(shù),在不同初值的情況下,通過LM 算法,BFGS 算法和改進的BFGS 算法進行求解,得到的收斂次數(shù)如圖2 所示??梢钥闯?,本文算法要比原有算法收斂快。
圖2 收斂次數(shù)對比圖
神經(jīng)網(wǎng)絡(luò)的工作原理和結(jié)構(gòu)特點決定了它非常適于進行特征融合的檢測。提取特征向量輸入改進的BFGS 神經(jīng)網(wǎng)絡(luò)進行融合分類,使用訓(xùn)練好的BFGS 網(wǎng)絡(luò)對查詢視頻進行篡改檢測。具體流程如圖3 所示。
圖3 檢驗流程圖
首先提取參考視頻的特征,即平均梯度和信息熵,進行融合,并作為測試樣本集訓(xùn)練BFGS 神經(jīng)網(wǎng)絡(luò);對于查詢視頻,采用相同的方法選提取視頻特征,進行特征融合,用訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)對查詢視頻進行訓(xùn)練,得到多特征融合檢測結(jié)果。
本文首先選用一段正常場景的視頻,記為視頻A,將它導(dǎo)入MATLAB2014a 中,然后在Simulink 中進行視頻篡改,在視頻的上方添加游走字幕,得到視頻B,如圖4 所示。
圖4 視頻篡改圖
各提取A、B 視頻的前1 000 幀特征,訓(xùn)練BFGS 神經(jīng)網(wǎng)絡(luò),將訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)用于20 段不同場景所拍攝視頻的篡改檢測。將該算法與文獻[14]中基于SURF 的視頻篡改檢測算法進行比較,實驗結(jié)果如圖5 所示。由此可見,本文算法對視頻篡改進行檢測的效果良好,準確率在98%以上。
圖5 視頻篡改檢測率對比圖
在實驗過程中發(fā)現(xiàn),若采用復(fù)雜光線下拍攝的視頻,會使得篡改檢測率偏低,對此進行深入研究時發(fā)現(xiàn),在提取純色視頻幀和正常視頻幀的特征值時,復(fù)雜光線情況下的視頻特征值變化大,從而使BFGS 神經(jīng)網(wǎng)絡(luò)在篡改檢測時出現(xiàn)較低的檢測率。如表1 所示。該復(fù)雜光線現(xiàn)象因光線短時間內(nèi)發(fā)生急劇變化而導(dǎo)致,對于正常拍攝的視頻,通常不會出現(xiàn)此現(xiàn)象。
表1 視頻檢測率
本文將BFGS 神經(jīng)網(wǎng)絡(luò)進行了改進,并應(yīng)用于視頻篡改檢測,通過不同設(shè)備和不同環(huán)境下的視頻的檢測結(jié)果可知,準確率平均達到98%以上,且該方法可以應(yīng)用于所有情況下的幀內(nèi)復(fù)制-粘貼視頻篡改檢測。
[1]WANG W,F(xiàn)AFID H. Exposing digital forgeries in video by detecting double MPEG compression[C]//Proc. International Multimedia Conference on Proceeding of the 8th Workshop on Multimedia and Security.Geneva,Switzerland:[s.n.],2006:37-47.
[2]WANG W,F(xiàn)ARID H. Exposing digital forgeries in video by detecting duplication[C]//Proc.International Multimedia Conference on Preceeding of the 9th Workshop on Multimedia and Security. Dallas,Texas,USA:[s.n.],2007:35-42.
[3]WANG W,F(xiàn)ARID H. Exposing digital forgeries in interlaced and de-interlaced video[J].IEEE Trans.Information Forensics and Security,2007,2(3):438-449.
[4]WANG W,F(xiàn)ARID H. Exposing digital forgeries in video by detecting double quantization[C]//Proc. the 11th ACM Workshop on Multimedia and Security. Princton,NJ,USA:[s.n.],2009:39-48.
[5]MICHIHIRO K,THKAHIRO O,YOICHI S.Detecting video forgeries based on noise characteristics[C]//Proc. the 3rd Pacific Rim Symposium on Advances in Image and Video Technology.Germany:springer Verlag,2009:306-317.
[6]KANCHERLA K,MUKKAMALA S. Novel blind video forgery detection using Markov models on motion residue intelligent information and database systems[M]. Berlin Heidelberg:Springer,2012.
[7]秦運龍,孫廣玲,張新鵬.利用運動矢量進行視頻篡改檢測[J].計算機研究與發(fā)展,2009,(46):227-233.
[8]CHAO J,JIANG X H,SUN T F. A new video inter-frame tampering detection method based on optical flow consistency[C]//Proc.the 11th International Work-shop on Digital-forensics and Watermarking.Shanghai:Springer,2012:25-27.
[9]郭琳琳,張靜,蘇育挺.一種基于模式噪聲的視頻摳像檢測算法[J].四川大學(xué)學(xué)報:自然科學(xué)版,2011,48(4):777-782.
[10]劉雨青,黃添強.基于時空域能量可疑度的視頻篡改檢測與篡改區(qū)域定位[J].南京大學(xué)學(xué)報:自然科學(xué)版,2014,50(1):61-71.
[11]陳秀新,賈克斌,魏世昂.基于關(guān)鍵幀顏色和紋理特征的視頻拷貝檢測[J].電視技術(shù),2012,36(15):36-39.
[12]李富貴,黃添強,蘇立超,等.融合多特征的異源視頻復(fù)制-粘貼篡改檢測[J].山東大學(xué)學(xué)報:工學(xué)版,2013(4):32-38.
[13]陳超,江濤,徐文學(xué).基于平均梯度的多聚焦圖像融合方法研究[J].山東建筑大學(xué)學(xué)報,2009,2(24):133-137.
[14]譚茂洲.基于時空特征的視頻篡改被動檢測技術(shù)研究[D].上海:上海交通大學(xué),2012.