李鋆路
(山東省實(shí)驗(yàn)中學(xué),山東 濟(jì)南250001)
當(dāng)前,隨著信息化的發(fā)展,特別是伴隨著計(jì)算機(jī)技術(shù)、Internet特別是移動互聯(lián)技術(shù)的普及,在全世界范圍內(nèi),通過論壇、博客、微博、微信、QQ空間等進(jìn)行圖片分享已經(jīng)成為人們的一種生活方式。然而數(shù)字圖片極易被非法拷貝和篡改的特性使得網(wǎng)絡(luò)信息的安全保護(hù)問題日益突出[1]。目前圖片分享的格式以JPEG為主,各種圖像處理算法和圖像處理軟件的出現(xiàn)(如Photoshop等),使得非專業(yè)人士很容易對圖片進(jìn)行后期處理,對圖像進(jìn)行篡改而不留下人眼可以觀察到的痕跡,但圖像潛在的統(tǒng)計(jì)特征已經(jīng)修改。這些篡改有些只是為了娛樂大眾,但也有很大部分給社會帶來危害(如國內(nèi)一些假氣功師的造假照片),因而圖像的真?zhèn)舞b別變得非常重要,偽造的圖片可能成為事實(shí)證據(jù)用于法庭舉證、新聞報(bào)道和學(xué)術(shù)論文發(fā)表等場合,其所導(dǎo)致的誤判、誤報(bào)導(dǎo)和欺詐等問題會引發(fā)難以估量的損失[2]。因此,JPEG圖片的真實(shí)性和完整性鑒別是迫切需要的技術(shù)。
目前,依據(jù)是否事先向圖像中添加信息,JPEG圖片的篡改檢測方法主要分為主動方法和被動方法兩類。主動取證技術(shù)是往圖像中加入數(shù)字水印信息或數(shù)字簽名信息,通過判斷數(shù)字水印信息和數(shù)字簽名信息是否完整來判斷圖像是否被篡改[3]。主動取證技術(shù)的研究較為成熟,但由于事先要向原始圖像中加入水印或簽名,但實(shí)際上需要真?zhèn)舞b定的圖像往往只有它本身,很難得到或無法得到原始圖像,因而限制了主動取證技術(shù)的使用;被動方法又稱“盲取證法”,它不需要圖片在發(fā)布時(shí)嵌入信息,因此具有更為廣泛的實(shí)用價(jià)值,被動檢測方法已經(jīng)成為一個新興的熱點(diǎn)研究方向。
篡改圖像的操作方式很多,文獻(xiàn)[4]中將圖像的篡改手段分成6大類:合成、變形、修整、增強(qiáng)、計(jì)算機(jī)生成和繪制。目前圖片篡改偽造檢測研究成果分為以下三類[5]:(1)通過對復(fù)制粘貼圖片區(qū)域的分析和檢測,進(jìn)而判斷圖片是否經(jīng)過篡改偽造;(2)通過檢測圖片的光照方向來檢查圖片篡改偽造;(3)通過檢測圖片中的可疑數(shù)字圖像處理操作來檢測篡改偽造。Adobe Photoshop,是由Adobe Systems開發(fā)和發(fā)行的圖像處理軟件,該軟件主要處理以像素所構(gòu)成的數(shù)字圖像,可分為圖像編輯、圖像合成、校色調(diào)色及特效制作部分等,可以對圖像做各種變換如放大、縮小、旋轉(zhuǎn)、傾斜、鏡像、透視等;也可進(jìn)行復(fù)制、去除斑點(diǎn)、修補(bǔ)、修飾圖像的殘損等,是目前國內(nèi)圖片篡改者使用的主要軟件之一,因此研究JPEG圖片Photoshop篡改的取證具有很高的現(xiàn)實(shí)意義[6]。經(jīng)過篡改偽造后的數(shù)字圖像,幾乎都需要使用模糊操作對篡改偽造邊緣進(jìn)行潤飾處理,以實(shí)現(xiàn)篡改區(qū)域的不可見性,因此對模糊潤飾操作的檢測可以作為篡改偽造取證的重要依據(jù)之一[5]。
本文針對篡改者對JPEG圖片的Photoshop偽作,提出了一種對JPEG圖片DCT編碼的進(jìn)行Benford驗(yàn)證,檢測是否存在高斯模糊,在此基礎(chǔ)上定義了重采樣塊度量因子,利用塊度量因子的不一致性來檢測篡改痕跡,提供了一種人工篡改痕跡的檢測方法,該方法對JPEG壓縮具有一定的魯棒性。
從信號處理的角度看,對JPEG圖片進(jìn)行篡改偽造可以視為在強(qiáng)背景(即兩幅疊加的原始圖像)下疊加一個視覺上看不到的弱信號(篡改偽造邊緣的潤飾處理),由于人的視覺系統(tǒng)Human Visual System.HVS)分辨率受到一定的限制,只要疊加信號的幅度低于HVS的對比度門限,HVS就無法感覺到信號的存在,這樣HVS系統(tǒng)就把篡改后的圖片看作是未經(jīng)偽造的原始圖片。
典型的圖片篡改偽造示意圖如圖1所示。其步驟通常如下:
1)選用原始圖片B作為背景圖片,其JPEG壓縮因子為Q1;
2)從圖片A中剪裁人所在圖像區(qū)域Z然后經(jīng)過旋轉(zhuǎn)、縮放、顏色調(diào)整和亮度調(diào)整等,粘貼至背景圖片的合適位置;
3)對篡改區(qū)域的邊緣進(jìn)行模糊等潤飾處理,使兩幅圖像合成并具有良好的偽造效果,使HVS系統(tǒng)無法分辨真?zhèn)危哂懈玫囊曈X真實(shí)性;
4)將合成的圖片重新保存為JPEG圖片F(xiàn),壓縮因子為Q2。
圖1 圖片篡改的示意圖
從以上過程可以看出,基于JPEG格式的圖片篡改,一定伴有重采樣過程。為了保持視覺上的一致性,一般要采用模糊處理。糊操作作為一種圖像篡改主要手段,通過對圖像進(jìn)行去噪、美化、模擬自然模糊而達(dá)到偏離、歪曲客觀事實(shí)的目的。因此,檢測到一幅圖像中是否有附加的模糊操作過程,將對圖像真實(shí)性鑒別和進(jìn)一步篡改取證起到關(guān)鍵作用。所以重采樣痕跡、JPEG壓縮效應(yīng)和模糊痕跡可以作為圖像篡改檢測的重要依據(jù)。
ISO國際標(biāo)準(zhǔn)化組織和前CCITT組織在1986年年底成立 “聯(lián)合圖像專家組”JPEG 組(Joint Photographic Experts Group),研究靜止圖像壓縮算法的標(biāo)準(zhǔn)化,至1992年正式完成了用于各種分辨率和格式的連續(xù)色調(diào)圖像的ISO/IEC 10918標(biāo)準(zhǔn)(ITU-TT.81建議),簡稱JPEG標(biāo)準(zhǔn)[7]。
JPEG壓縮一般要經(jīng)過四個步驟:顏色模式轉(zhuǎn)換及采樣、DCT、量化、編碼。對真彩色圖像進(jìn)行JPEG基本壓縮前必須把RGB顏色模式轉(zhuǎn)換為YCbCr模式,對于轉(zhuǎn)換后的數(shù)據(jù)可采取4:1:1比例對Y、Cb和Cr進(jìn)行采樣,采樣后一個16×16塊稱為一個最小編碼單元(MCU)。圖像數(shù)據(jù)采樣分割成8×8的數(shù)據(jù)塊后,以MCU為單位順序?qū)⒚總€8×8塊作二維正向離散余弦變換(2D-FDCT)。
圖2 高斯模糊篡改與模糊篡改取證流程
Photoshop的高斯模糊本質(zhì)是一種低通濾波。文獻(xiàn)[8]發(fā)現(xiàn)并證明了重采樣數(shù)據(jù)的二階方差的統(tǒng)計(jì)方差具有周期性,Rininger和Gibson[9]提出并驗(yàn)證了圖像DCT域AC系數(shù)服從拉普拉斯分布,孫堡壘[10]等驗(yàn)證了沒有經(jīng)過低通濾波的圖像DCT域AC系數(shù)的Benford曲線分布相差度較小,反之,相關(guān)程度較高。同一幅圖像內(nèi)RGB 3個通道DCT域AC系數(shù)的Benford曲線分布具有強(qiáng)一致性。因此,對JPEG圖片進(jìn)行圖2[10]所示的Benford判斷,可首先對JPEG圖片是否進(jìn)行過高斯模糊篡改進(jìn)行檢測。在此基礎(chǔ)上,本文定義了提取可以描述重采樣的塊度量因子,并利用該因子作為檢測圖片篡改的方法。
假設(shè)待檢測圖片P(I,j)的大小為M×N,從水平方向提取塊度量因子。經(jīng)過計(jì)算得到二階差分圖像E(m,n),即
其中,1≤m≤M,1≤n≤N
將E(m,n)的每行進(jìn)行快速傅里葉變換(FDFT),然后將所得到的頻譜圖沿垂直方向取平均值(Davr)得到1維的平均頻譜圖
其中,F(xiàn)DFT代表離散數(shù)據(jù)的快速傅里葉變換,ω是歸一化的頻率。
為了利用重采樣特性進(jìn)行計(jì)算,在頻譜圖EDavr中定義塊度量因子為
式中,ε是不為0的極小量,由于頻譜呈現(xiàn)對稱性,故只需考慮歸一化頻率的1/2之前的頻譜。
通過大量圖片計(jì)算可以看出,ɑ值的大小與是否重采樣相關(guān),原始圖片的ɑ值大于重采樣區(qū)域的圖片的值。因此,采用ɑ值作為塊度量因子可檢測圖片是否存在重采用。
用數(shù)碼相機(jī)隨機(jī)拍攝60個照片,并使用Photoshop進(jìn)行半徑2-5像素的隨機(jī)高斯模糊。對高斯模糊前后的DCT域AC系數(shù)的方差V進(jìn)行對比分析,并使用Matlab7.0平臺進(jìn)行實(shí)驗(yàn)驗(yàn)證,其方差對比數(shù)據(jù)如圖3所示。
圖3 高斯模糊前后V值對比
縱坐標(biāo)是方差V的統(tǒng)計(jì)結(jié)果(縱坐標(biāo)取對數(shù)),設(shè)定閾值T=5×10-6,在虛警率為0.5%的情況下,正確率為98.9%。
隨機(jī)選取Windows系統(tǒng)示例圖片圖4,進(jìn)行高斯模糊和疊加篡改。
圖4 實(shí)驗(yàn)圖片
圖5 疊加圖片
對于圖4高斯模糊進(jìn)行檢測的結(jié)果,檢測值大干設(shè)定的閾值T,對于高斯模糊檢測的可靠性比較高。
圖6 合成篡改圖片
對圖4采用α值作為塊度量因子,并對圖4疊加圖片5后合成圖片6。檢測結(jié)果如圖7所示。
圖7 α值作為塊度量因子檢測
實(shí)驗(yàn)數(shù)據(jù)表明,合成圖片6的檢測結(jié)果明顯分為2塊,較小值對應(yīng)篡改區(qū)域,較大值對應(yīng)原始圖片。
本文提出一種針對JPEG圖片進(jìn)行Photoshop篡改的檢測取證方法。首先對圖片進(jìn)行高斯模糊篡改取證,在此基礎(chǔ)上定義了塊度量因子對圖片局部是否被篡改進(jìn)行檢測。對篡改前后的特征進(jìn)行分析和總結(jié),在此基礎(chǔ)上做了大量取證實(shí)驗(yàn),在一定程度上驗(yàn)證了算法的可靠性和參數(shù)的通用性。
[1]W.Bender,D.Gruhl,N.Morimoto,A.Lu.Techniques for data hiding[J].IBM Systems Journal,1996,35(38.4):313-336.
[2]王俊文,劉光杰,張湛,戴躍偉,王執(zhí)銓.圖像區(qū)域復(fù)制篡改快速魯棒取證[J].自動化學(xué)報(bào),35(12).
[3]Fridrich J.Image watermarking for tamper detection [C]//Proceedings of International Conference on Image Processing.Chicago:IEEE,1998:404-408.
[4]Farid Hany.Creating and detecting doctored and virtual image:implications to the child pornography prevention act[R].Hanover:Department of Computer Science and Center for Cognitive Neuroscience,Dartmouth College,2004.
[5]朱彥,江華.利用Photoshop中高斯模糊進(jìn)行篡改的取證方法[J].電視技術(shù),2013,37(17).
[6]姬敏敏.網(wǎng)絡(luò)傳播中新聞圖片造假的分析及對策研究[D].濟(jì)南:山東師范大學(xué),2012.
[7]吳樂南.數(shù)據(jù)壓縮[M].北京:電子工業(yè)出版社,2004:81-83.
[8]Gallagher A C.Detection of linear and cubic interpolation in JPEG compressed images[C]//Proceedings of the 2nd Canadian Conference on Computer and Robot Vision.Washington DC,USA:IEEE,2005:65-72.
[9]Reining R,Gibson J.Distributions of the Two-dimensional DCT Coefficients for Image[J].IEEE Transactions on Communications,1983,31(6):835-839.
[10]孫堡壘,周琳娜,張茹.基于Benford定律的高斯模糊篡改取證[J].計(jì)算機(jī)研究與發(fā)展,2009(增):211-216.
[11]涂靜芝.基于灰度信息的圖像合成研究[D].北京:華北電力大學(xué),2010.