朱 彥,江 華
(四川理工學(xué)院自動化與電子信息學(xué)院,四川自貢643000)
進入數(shù)字時代以來,隨著數(shù)碼相機的廣泛使用,數(shù)字圖像已經(jīng)成為人們?nèi)粘I钪凶顬槌R姷拿襟w形式。數(shù)字圖像容易獲取、便于編輯和傳輸方便的特性,雖然使得數(shù)字圖像迅速占據(jù)了人們生活的重要部分,但是也給篡改偽造人員提供了便利的偽造環(huán)境。Adobe Photoshop是目前功能強大、使用廣泛的圖像編輯和處理軟件,人們通過Photoshop可以輕松地制作出足以以假亂真的圖像,而無須具有任何圖像處理、攝影等專業(yè)技能。當(dāng)這些篡改偽造的圖像被用于新聞或者司法領(lǐng)域,將會對社會誠信和司法公正造成極大危害。20世紀以來,從新聞到攝影大賽,越來越頻繁地出現(xiàn)各種由篡改偽造數(shù)字圖像所引發(fā)的社會事件。也正因為如此,數(shù)字圖像取證技術(shù)成為了近年來國內(nèi)外媒體內(nèi)容安全研究的熱點[1]。而不對數(shù)字圖像進行水印嵌入或者指紋提取的數(shù)字圖像被動取證技術(shù),由于更符合實際取證的要求,成為了數(shù)字圖像取證研究的重點[2]。
數(shù)字圖像取證技術(shù)的一個重要方面就是篡改偽造圖像的檢測。目前的研究成果大致可分為以下3類:
1)通過對復(fù)制—粘貼圖像區(qū)域的分析和檢測,進而判斷數(shù)字圖像是否經(jīng)過篡改偽造。這類方法主要針對簡單的復(fù)制—粘貼圖像(即拼接圖像),因為圖像復(fù)制粘貼被認為是篡改偽造的第一步。針對同圖的拼接操作,F(xiàn)ridrich和Popescu[3]分別提出了基于量化DCT系數(shù)和基于主成分分析的檢測方法;Khan等人則利用離散小波變換對同圖拼接進行檢測。針對異圖的拼接偽造,文獻[4]和[5]都使用SIFT作為核心算子,通過檢索圖像中是否存在與指定對象相同或者相似的區(qū)域,判斷數(shù)字圖像是否存在篡改偽造。而雙譜、幾何失真和相機響應(yīng)函數(shù)等統(tǒng)計特征,都被用于檢測拼接偽造。
2)通過檢測圖像的光照方向來檢測篡改偽造圖像。Johnson和Farid認為,通過對數(shù)字圖像中物體表面的光照和陰影進行分析,可以對拍攝照片時的光照方向進行估計。由于在篡改偽造過程中,很難保證篡改偽造的局部區(qū)域具有和原始圖像相同的光照方向,因此可以通過分析圖像中景物的光照一致性來對數(shù)字圖像的篡改偽造進行取證。通過計算機圖形學(xué)中對光源成像模型的分析,以及對真實光照環(huán)境下的模型簡化,估計出近似為平行光和點光源的光照方向,并不斷優(yōu)化其模型以提高估計的精度。
3)通過檢測數(shù)字圖像中存在的可疑數(shù)字圖像處理操作來檢測篡改偽造圖像。由于拼接圖像之后會留下顯而易見的統(tǒng)計特征異常,甚至是視覺上的可疑特征。因此篡改偽造者常常會使用Photoshop中提供的典型圖像處理工具如模糊、銳化等,對數(shù)字圖像進行后期的潤飾操作和處理。研究人員認為,通過檢測這類典型的篡改偽造過程中常用的圖像操作,可以鑒別出篡改偽造圖像。
在典型的圖像處理操作中,由于模糊操作對于改變拼接邊緣所引入的像素不一致性具有很好的效果,因此模糊成為了消除拼接邊緣特性的重要操作,也使其成為了真實的篡改偽造圖像中最為常用的操作之一。從而模糊操作的檢測也成為了揭示篡改偽造圖像的重要途徑。文獻[6]分析了高斯模糊的基本模型,并在DCT域定義和計算圖像的模糊度,進而通過閾值判決檢測模糊操作;而通過定義圖像的異常色調(diào)率,也可以檢測和定位模糊圖像[7];而基于小波變換所定義的模糊度,也被用于檢測模糊圖像;除此之外,利用同態(tài)濾波[8]和邊緣模糊矩陣[9],也可以對模糊操作進行檢測。
目前已有的算法雖然在模糊操作的檢測方面取得了一定進展,但主要問題在于這些算法對JPEG壓縮的魯棒性較差,導(dǎo)致上述方法很難區(qū)分篡改偽造操作和JPEG壓縮操作,進而影響對篡改偽造圖像的檢測正確率。
本文針對Photoshop中的高斯模糊,提出了一種利用JPEG圖像的DCT系數(shù)相關(guān)性進行高斯模糊操作檢測的方法,通過計算相鄰DCT系數(shù)的聯(lián)合密度特征,獲得高斯模糊操作前后的圖像統(tǒng)計特征差異,進而對其進行檢測和分類。大量實驗表明,本文算法能夠有效地對利用Photoshop中高斯模糊進行篡改操作的圖像進行取證。
文獻[10]表明,JPEG圖像由于成像過程中的CFA插值操作以及JPEG壓縮的塊效應(yīng),使其相鄰的DCT系數(shù)之間,尤其是JPEG壓縮的基本結(jié)構(gòu)8×8塊內(nèi)的系數(shù),存在較強的相關(guān)性。可以用如下歸一化高斯分布來描述JPEG相鄰DCT系數(shù)間的關(guān)系
設(shè)8×8塊內(nèi)相鄰的兩個DCT系數(shù)分別為x1和x2,用二維高斯分布來描述其聯(lián)合分布函數(shù)P(x1,x2),可以看出,量化DCT系數(shù)的聯(lián)合分布函數(shù)為中心向四周衰減的函數(shù)形態(tài),如圖1和圖2所示。當(dāng)x1>7且x2>7時,P(x1,x2)趨近于0。因此,本文只考慮提取x1∈[-7,7]且x2∈[-7,7]的聯(lián)合密度特征。
圖2 相鄰DCT系數(shù)聯(lián)合分布圖
Photoshop中的高斯模糊,本質(zhì)是利用高斯低通濾波器對圖像局部像素進行低通濾波操作。在這個過程中,由于高斯低通濾波在頻域中反映出來的非均勻性,將會破壞真實JPEG圖像已有的DCT鄰域系數(shù)分布。通過提取聯(lián)合密度特征,擬對這種鄰域系數(shù)分布的變化進行量化描述。
設(shè)量化DCT系數(shù)矩陣為A(本文僅考慮Y通道分量),其具有M×N個8×8塊(塊矩陣Amn,m=1,…,M,n=1,…,N),提取的特征如下:
1)計算每個塊內(nèi)相鄰DCT系數(shù)水平方向的聯(lián)合密度矩陣Ph(x,y)
式中:Bmnij為Amn第i行第j列的DCT系數(shù);δ為0,1沖激函數(shù)。
2)計算每個塊內(nèi)相鄰DCT系數(shù)水平方向的聯(lián)合密度矩陣Pv(x,y)
3)計算聯(lián)合密度特征P(x,y),共225維
利用這225維統(tǒng)計特征,通過分類器可以對高斯模糊進行取證檢測。本文選擇支持向量機作為檢測取證算法的分類器。
作為機器學(xué)習(xí)和模式識別中的重要研究領(lǐng)域,同時也是目前流行、性能優(yōu)異的分類器之一,支持向量機[11](Support Vector Machines,SVM)已經(jīng)在諸多領(lǐng)域得到了廣泛的驗證和應(yīng)用。SVM的基本思想是利用內(nèi)積函數(shù)定義的非線性變換,將輸入的不同類別訓(xùn)練樣本的統(tǒng)計特征轉(zhuǎn)換到高維,使得原本在低維空間中線性不可分的問題變?yōu)楦呔S線性可分,然后在這個高維空間求解最優(yōu)分類面,進而對未知類別的測試樣本進行分類。
圖3為本文提出的針對JPEG圖像的高斯模糊篡改檢測流程圖。
圖3 高斯模糊篡改檢測流程圖
為了對該算法的有效性進行測試和驗證,本文采用了4種不同品牌、不同型號的數(shù)碼相機所拍攝的照片進行實驗。實驗的樣本如表1所示。
表1 實驗中采用的圖像樣本
對于Kodak DC290的測試圖像,由于原始文件格式為TIFF無損圖像,因此將其以質(zhì)量因數(shù)為75的參數(shù)壓縮為JPEG圖像進行實驗。高斯模糊工具采用Adobe Photoshop CS3 Extended,分別對上述4種不同類型的圖像進行高斯模糊篡改,其中分別選取了高斯模糊半徑為0.6 pixel和1.0 pixel進行實驗。在高斯模糊之后,再分別以質(zhì)量因數(shù)75和90存儲為JPEG圖像。
實驗中SVM工具來源于Chang等人研究開發(fā)的支持向量機工具包LIBSVM,選擇的支持向量機核函數(shù)為RBF(徑向基函數(shù))核,格形搜索和交叉校驗參數(shù)的選擇參見文獻[12]。在實驗中,訓(xùn)練和測試的圖像樣本量分別占圖像總數(shù)的2/3和1/3。為了保證實驗的可靠性,實驗中的訓(xùn)練和測試樣本均為隨機選取,實驗結(jié)果為10次測試的平均結(jié)果。實驗結(jié)果如表2所示。
表2 高斯模糊篡改取證結(jié)果
表2中,虛警率表示對原始JPEG圖像進行篡改檢測的錯誤率;漏檢率表示對高斯模糊篡改圖像檢測的錯誤率;平均準確率表示對原始JPEG圖像和高斯模糊篡改圖像取證檢測的平均正確率。
從實驗結(jié)果可以看出,對于不同的圖像,本文算法均能夠以90%以上的平均準確率對原始圖像和經(jīng)過高斯模糊篡改的圖像進行檢測,并且本文所提出的高斯模糊篡改取證特征對JPEG有損壓縮具有較好的魯棒性。同時,在Photoshop中模糊篡改所使用的半徑越大,本文算法所提取的特征越明顯,檢測效果越好;而篡改后保存為JPEG圖像時使用的JPEG質(zhì)量因數(shù)越高,即圖像質(zhì)量越好,特征越明顯,檢測的效果也更好。
數(shù)字圖像的被動盲取證是一項具有挑戰(zhàn)性的工作。由于篡改偽造的典型過程中,往往存在諸如銳化、模糊這樣的潤飾過程,因此對典型潤飾操作的檢測,可以作為鑒別數(shù)字圖像篡改與否的一個重要依據(jù)。
本文針對Photoshop軟件中的典型高斯模糊操作,分析了典型的高斯模糊操作導(dǎo)致量化DCT系數(shù)相關(guān)性被破壞的現(xiàn)象,提出了利用相鄰DCT系數(shù)的聯(lián)合密度特征來描述量化DCT相關(guān)性的方法,對使用Photoshop進行高斯模糊的篡改偽造操作進行了取證檢測。對大量圖像樣本進行實驗,結(jié)果表明該方法可以有效地檢測出使用Photoshop進行高斯模糊篡改的偽造圖像,并對JPEG壓縮具有較好的魯棒性。
篡改偽造中的模糊操作多種多樣,而Photoshop提供的高斯模糊只是諸多模糊操作中的一種,如何尋找更為有效的特征來描述不同模糊操作對原始JPEG圖像的統(tǒng)計特征影響,進而提出適用性更為廣泛的模糊篡改檢測取證算法,是下一步需要研究的工作。
[1]SENCAR H T,MEMON N.Overview of state-of-the-art in digital image forensics[M].Singapore:World Scientific Publishing Co.,Pte.,Ltd.,2009.
[2]MILANIA1 S,F(xiàn)ONTANI M,BESTAGINI P,et al.An overview on image forensics[C]//Proc.Signal Processing Conference(EUSIPCO).Bucharest:IEEE Press,2012:27-31.
[3]POPESCU A C,F(xiàn)ARID H.Exposing digital forgeries by detecting duplicated image regions[R].Hanover:Dartmouth College,2004.
[4]KHAN S,KULKARNI A.An efficient method for detection of copy-move forgery using discrete wavelet transform[J].International Journal on Computer Science and Engineering,2010,2(5):1801-1806.
[5]PAN X Y,LYU S W.Detecting image region duplication using SIFT features[C]//Proc.ICASSP 2010.Dallas,USA:IEEE Press,2010:1706-1709.
[6]AMERINI I,BALLAN L,CALDELLI R,et al.Geometric tampering estimation by means of a SIFT-based forensic analysis[C]//Proc.ICASSP 2010.Dallas,USA:IEEE Press,2010:1702-1705.
[7]王波,孫璐璐,孔祥維,等.圖像偽造中模糊操作的異常色調(diào)率取證技術(shù)[J].電子學(xué)報,2006,34(12):2451-2454.
[8]周琳娜,王東明,郭云彪,等.基于數(shù)字圖像邊緣特性的形態(tài)學(xué)濾波取證技術(shù)[J].電子學(xué)報,2006,36(6):1047-1051.
[9]CAO Gang,ZHAO Yao,NI Rongrong.Edge-based Blur metric for tamper detection[J].Journal of Information Hiding and Multimedia Signal Processing,2010(1):20-27.
[10]LI B,SHI Y Q,HUANG J W.Detecting doubly compressed JPEG images by using mode based first digit features[C]//Proc.IEEE Workshop on Multimedia Signal Processing.[S.l.]:IEEE Press,2008:730-735.
[11]邊肇祺,張學(xué)工.模式識別[M].北京:清華大學(xué)出版社,2000.
[12]HSU C,CHANG C,LIN C.A practical guide to support vector classification[R].Taipei:National Taiwan University,2010.