徐子棟,張 中
(中國(guó)政法大學(xué) 證據(jù)科學(xué)研究院,北京100088)
視頻篡改取證是取證過(guò)程中的一個(gè)重要研究方向。利用視頻水印判斷視頻的真實(shí)性時(shí),需要將數(shù)據(jù)嵌入原始數(shù)據(jù)中,從而破壞原始數(shù)據(jù)的結(jié)構(gòu)[1]。根據(jù)視頻取證的特點(diǎn),可以將其分為3類(lèi):自然視頻統(tǒng)計(jì)特征、偽造痕跡和成像設(shè)備一致性。但大部分視頻取證方法的計(jì)算過(guò)程較為復(fù)雜,且只對(duì)某種篡改偽造視頻有效,在轉(zhuǎn)角、裁減等篡改手段中被動(dòng)取證技術(shù)難以改變固有操作方式,因此是無(wú)效的[2]。在實(shí)際生活中篡改者通常會(huì)采用多種方式對(duì)視頻進(jìn)行篡改,因此需要對(duì)數(shù)字視頻篡改取證方法進(jìn)行分析和研究。
郭繼昌等[3]提出基于馬爾科夫特征和LBP(Local Binary Patterns)的視頻篡改取證方法,采用LBP算子對(duì)視頻進(jìn)行處理,通過(guò)壓縮處理獲取數(shù)字視頻的JPEG(Joint Photographic Experts Group)矩陣,并計(jì)算矩陣在不同方向中對(duì)應(yīng)的一階差分矩陣,在一階差分矩陣的基礎(chǔ)上獲取視頻圖像的馬爾科夫特征,利用支持向量機(jī)完成取證。但該方法無(wú)法消除數(shù)字視頻中存在的噪聲,導(dǎo)致取證結(jié)果的誤差較大使取證偏差大。梅臘臘等[4]提出基于噪聲水平估計(jì)的數(shù)字視頻篡改取證方法,該方法首先利用小波變換處理各視頻幀,其次由傅立葉變換其時(shí)域序列,根據(jù)計(jì)算結(jié)果對(duì)幅頻譜在視頻幀中對(duì)應(yīng)的峰均比進(jìn)行計(jì)算,對(duì)數(shù)字視頻是否被篡改進(jìn)行識(shí)別,實(shí)現(xiàn)數(shù)字視頻篡改取證。但該方法在取證過(guò)程中容易受到噪聲的干擾,提取的視頻證據(jù)缺失值較大。李猛等[5]提出基于TCS-LBP(Temporal Center-Symmetric LBP)算子的數(shù)字視頻篡改取證方法,該方法利用TCS-LBP算子分析不同像素幀在空間中存在的位置關(guān)系,根據(jù)分析結(jié)果對(duì)TCS-LBP特征值進(jìn)行計(jì)算,將其作為判斷值對(duì)數(shù)字視頻中的篡改區(qū)域進(jìn)行檢測(cè),實(shí)現(xiàn)數(shù)字視頻篡改取證。但該方法對(duì)篡改視頻進(jìn)行取證前沒(méi)有消除數(shù)字視頻中存在的噪聲,導(dǎo)致提取的視頻片段變形嚴(yán)重。為解決上述方法中存在的問(wèn)題,筆者提出基于人工免疫的數(shù)字視頻篡改取證方法。
基于人工免疫的數(shù)字視頻篡改取證方法是結(jié)合塊和低秩張量實(shí)現(xiàn)數(shù)字視頻的去噪處理。
張量屬于矩陣和向量的高階推廣,通常情況下最小需要3個(gè)變量描述張量元素所處的位置,高維數(shù)據(jù)的結(jié)構(gòu)可通過(guò)這種多線(xiàn)性的結(jié)構(gòu)得以體現(xiàn)[6]。用D∈RI1×I2…×IN描述N階張量,其大小為I1×I2…×IN。
按照第n維重新對(duì)張量D中存在的元素進(jìn)行排列,獲得大小為In(In+1…INI1…In-1)的n-模式展開(kāi)矩陣D(n)=unfold(D,n),矩陣中(in,j)處的元素與張量中(i1,i2,…,iN)處的元素相對(duì)應(yīng)。
重新對(duì)n-模式展開(kāi)矩陣D(n)中存在的元素進(jìn)行組合,獲得張量D=fold(D(n),n)。
用rankn(D)描述張量D的n-秩矩陣D(n),Tucker秩表示張量D中的N個(gè)n-秩構(gòu)成的集合。
對(duì)低秩張量矩陣進(jìn)行恢復(fù)處理。其中λ為固定常量。在Tucker分解原理的基礎(chǔ)上用凸優(yōu)化問(wèn)題代替張量恢復(fù)問(wèn)題
5)設(shè)定收斂條件‖D-Ak+1-Ek+1‖F(xiàn)/‖Di‖F(xiàn)<ε2,其中參數(shù)ε2為大于零的正數(shù)。
張量D通過(guò)上述過(guò)程分離出低秩部分A和稀疏部分D。
基于人工免疫的數(shù)字視頻篡改取證方法對(duì)數(shù)字視頻去噪的過(guò)程如下。
1)當(dāng)視頻中存在大量噪聲時(shí),噪聲會(huì)對(duì)相似塊的匹配過(guò)程產(chǎn)生干擾[8]。針對(duì)上述問(wèn)題,基于人工免疫的數(shù)字視頻篡改取證方法采用中值濾波器預(yù)濾波處理含噪視頻,提取去噪處理后的視頻序列。
2)設(shè)置di,j為參考?jí)K,其大小為n×n,在參考?jí)K的基礎(chǔ)上選取窗口Ω(i,j)=l×(n×n)×f,其中f為視頻幀數(shù),l為正整數(shù)。在窗口中利用l2范數(shù)獲取與di,j相似度較高的圖像塊dx,y,構(gòu)建集合Γi,j
設(shè)DΓi,j=(dΓi,j(1),dΓi,j(2),…,dΓi,j(m))為三階張量,由相似度較高的m個(gè)圖像塊構(gòu)成,其中di,j為第k個(gè)與參考?jí)K相似的圖像塊。
3)通過(guò)
基于人工免疫的數(shù)字視頻篡改取證方法采用人工免疫算法構(gòu)建數(shù)字視頻篡改取證模型,實(shí)現(xiàn)數(shù)字視頻的篡改取證。
人工免疫系統(tǒng)結(jié)構(gòu)如圖1所示。
圖1 人工免疫系統(tǒng)結(jié)構(gòu)Fig.1 Structure of artificial immune system
處于未成熟狀態(tài)的免疫細(xì)胞經(jīng)過(guò)耐受期后會(huì)進(jìn)化為成熟的免疫細(xì)胞,處于成熟狀態(tài)下的免疫細(xì)胞的生命周期輕易不會(huì)發(fā)生改變,若免疫細(xì)胞在生命周期內(nèi)不能匹配抗原,就會(huì)逐漸死亡;反之,則會(huì)被激活。當(dāng)細(xì)胞處于活化狀態(tài)時(shí),如果不能被共刺激,就會(huì)產(chǎn)生誤認(rèn),即抗原被識(shí)別為自身的抗原,錯(cuò)誤的免疫細(xì)胞需要被清除;反之,處于活化狀態(tài)時(shí),則會(huì)變成記憶細(xì)胞。如果記憶細(xì)胞找到合適的抗原并與之匹配,它們就會(huì)被激活。在免疫過(guò)程中,成熟的免疫細(xì)胞或記憶細(xì)胞與相應(yīng)的抗原匹配,激活取證細(xì)胞,進(jìn)行數(shù)字視頻篡改取證。
基于人工免疫的數(shù)字視頻篡改取證方法通過(guò)集合代數(shù)法描述時(shí)間變化下記憶細(xì)胞集合Mb、抗原集合G、自體集合SSelf、成熟細(xì)胞集合Tb、未成熟細(xì)胞集合Ib和動(dòng)態(tài)取證細(xì)胞的整個(gè)演化過(guò)程。
1)自體動(dòng)態(tài)演化模型。通過(guò)模型
描述自體在時(shí)間變化下的動(dòng)態(tài)演化過(guò)程。其中xi∈D為自體在初始進(jìn)化過(guò)程中構(gòu)成的集合,δ為抗原更新周期。自體集合SSelf在抗原更新周期δ內(nèi)保持不變,新的自體集合在抗原周期δ結(jié)束后會(huì)代替自體集合SSelf。
動(dòng)態(tài)自體模型的主要目的是分析自體在網(wǎng)絡(luò)環(huán)境中的演化情況。
2)抗原動(dòng)態(tài)演化模型
其中集合sG為由一定比例η自體和非自體元素構(gòu)成的,GNonself(t)為非自體抗原,時(shí)在免疫網(wǎng)絡(luò)中獲取的,Mnew(t)為新生的記憶細(xì)胞。
3)數(shù)字視頻篡改取證模型
其中Γnew(t)為t時(shí)刻收集的視頻篡改證據(jù),x為被截獲的數(shù)據(jù),y′為間接證據(jù)呈供,s′為證據(jù)對(duì)應(yīng)的數(shù)字簽名。
為驗(yàn)證基于人工免疫的數(shù)字視頻篡改取證方法的整體有效性,需要對(duì)基于人工免疫的數(shù)字視頻篡改取證方法進(jìn)行測(cè)試,實(shí)驗(yàn)所用的計(jì)算機(jī)配置為Windows7系統(tǒng)、處理器3.6 GHz。分別采用基于人工免疫的數(shù)字視頻篡改取證方法(方法1)、基于馬爾科夫特征和LBP的視頻篡改取證方法(方法2)以及基于噪聲水平估計(jì)的數(shù)字視頻篡改取證方法(方法3)對(duì)相同數(shù)字篡改視頻進(jìn)行取證,測(cè)試結(jié)果如圖2所示。
圖2 不同方法的取證結(jié)果Fig.2 Forensic results of different methods
圖2中虛線(xiàn)框是不同方法的取證結(jié)果。對(duì)圖2進(jìn)行分析可知,采用方法1對(duì)3段視頻進(jìn)行取證時(shí),取證結(jié)果就是視頻被篡改的部分,采用方法2和方法3對(duì)3段視頻進(jìn)行取證時(shí),難以準(zhǔn)確圈定視頻被篡改的區(qū)域。通過(guò)上述分析可知,方法1可以準(zhǔn)確地實(shí)現(xiàn)數(shù)字視頻篡改取證,因?yàn)榉椒?對(duì)數(shù)字視頻進(jìn)行取證前,對(duì)數(shù)字視頻進(jìn)行了去噪處理,可以在無(wú)噪聲干擾下準(zhǔn)確實(shí)現(xiàn)數(shù)字視頻篡改取證。
對(duì)不同方法的有效性進(jìn)行測(cè)試,將視頻缺失值和視頻變形情況作為測(cè)試指標(biāo),測(cè)試結(jié)果分別如圖3和圖4所示。
圖3 視頻缺失值測(cè)試結(jié)果Fig.3 Video missing value test results
圖4 視頻變形情況測(cè)試結(jié)果Fig.4 Video distortion test results
由圖3可知,方法1提取的視頻幀的缺失值均在50以下,對(duì)取證產(chǎn)生的影響極小,可忽略不計(jì),方法2和方法3提取的視頻幀的缺失值在100~150內(nèi)波動(dòng),影響取證結(jié)果。根據(jù)圖4可知,方法1提取的視頻變形系數(shù)在0.2附近波動(dòng),方法2提取的第3幀視頻的變形系數(shù)高達(dá)0.6,方法3提取的第2幀視頻的變形系數(shù)高達(dá)0.7。通過(guò)上述分析可知,方法1提取的視頻證據(jù)存在輕微的變形,可準(zhǔn)確實(shí)現(xiàn)視頻篡改取證。
總之,筆者采用基于張量的增強(qiáng)拉格朗日乘子方法重建視頻稀疏低階部分,將噪聲與數(shù)字視頻分離,避免了取證過(guò)程中的噪聲干擾導(dǎo)致視頻丟失和變形,從而提高了整體性能。
圖像視頻處理軟件功能日益強(qiáng)大,數(shù)碼相機(jī)的質(zhì)量不斷提高,在此背景下,越來(lái)越容易對(duì)數(shù)字視頻進(jìn)行篡改,人眼難以發(fā)現(xiàn)被篡改的數(shù)字視頻,因此需要對(duì)數(shù)字視頻篡改取證方法進(jìn)行研究。目前數(shù)字視頻篡改取證方法存在取證誤差大、視頻缺失值高和視頻變形嚴(yán)重的問(wèn)題,為此,筆者提出了基于人工免疫的數(shù)字視頻篡改取證方法。首先對(duì)數(shù)字視頻進(jìn)行去噪處理,其次采用人工免疫算法構(gòu)建取證模型,完成數(shù)字視頻的篡改取證,解決了目前方法中存在的問(wèn)題,提高了視頻的真實(shí)性。
吉林大學(xué)學(xué)報(bào)(信息科學(xué)版)2022年1期