尚文韜
(河南省實(shí)驗(yàn)中學(xué),河南 鄭州 450002)
一種鑒別數(shù)字圖像真?zhèn)蔚姆椒?/p>
尚文韜
(河南省實(shí)驗(yàn)中學(xué),河南 鄭州 450002)
復(fù)制圖像部分區(qū)域粘貼在同幅圖像的另外一個(gè)地方是圖像偽造的常用形式,針對(duì)這種偽造目前常用檢測(cè)方法是塊匹配方法。這類方法存在檢測(cè)速度慢、魯棒性低等缺陷。為此本文提出了一種新方法,不對(duì)圖像進(jìn)行分塊,直接從圖像中提取SIFT特征,然后通過(guò)特征匹配來(lái)檢測(cè)、定位偽造區(qū)域。特征數(shù)量少,檢測(cè)效率高,而且魯棒性強(qiáng),不僅可以對(duì)付噪聲、壓縮等圖像處理,而且可以對(duì)付旋轉(zhuǎn)、縮放等幾何形變,最后通過(guò)實(shí)驗(yàn)驗(yàn)證了該方法的有效性。
圖像偽造;尺度不變特征變換(SIFT);特征匹配
數(shù)字圖像篡改偽造的一個(gè)常用操作方法就是復(fù)制一幅圖中的一個(gè)區(qū)域粘貼在另外一個(gè)區(qū)域以掩蓋被粘貼區(qū)域中的人或物體。由于在同一幅圖中進(jìn)行復(fù)制粘貼操作不會(huì)引起圖像在亮度、色彩等方面比較明顯的變化,不會(huì)引起人們視覺上的懷疑,所以是目前應(yīng)用較為廣泛的篡改方法。
目前對(duì)復(fù)制粘貼偽造圖像甄別檢測(cè)的依據(jù)是檢測(cè)圖像中存在兩個(gè)或多個(gè)相同的區(qū)域,因?yàn)樵谧匀粓D像中存在大面積相似區(qū)域的概率很小。檢測(cè)方法主要有塊匹配法,此類方法首先對(duì)圖像以像素為單位進(jìn)行滑窗分塊,用一些圖像特征來(lái)描述圖像塊,然后在圖像塊集合中通過(guò)特征匹配搜索相似塊,進(jìn)而檢測(cè)與定位篡改區(qū)域[1]。基于這種塊匹配方法框架,目前研究者研究較多的是如何選取圖像塊的特征,F(xiàn)ridrich等[1]首先利用8×8圖像塊的64個(gè)離散余弦變換(Discrete Cosine Transform,DCT)量化系數(shù)作為特征向量,由于向量維度高,檢測(cè)速度慢,Popescu等[2]對(duì)Fridrich等人的算法進(jìn)行了改進(jìn),利用主成分分析方法(PCA)把特征向量降到32維。隨后很多學(xué)者圍繞如何選取維度低的特征對(duì)檢測(cè)算法進(jìn)行研究,劉美紅等[3]利用圖像塊的分形維數(shù)和3個(gè)統(tǒng)計(jì)量構(gòu)成4維不變特征,歐佳佳等[4]從灰度共生矩陣中選取8個(gè)統(tǒng)計(jì)特征作為特征向量。
除了特征維度,分塊數(shù)量是影響檢測(cè)速度的關(guān)鍵因素。分塊數(shù)量對(duì)應(yīng)尋找相似塊的搜索空間,搜索空間大,算法時(shí)間復(fù)雜度高,對(duì)此一些學(xué)者采用下采樣方法縮小圖像尺寸來(lái)減少分塊數(shù)量。Li等[5]對(duì)待檢測(cè)圖像進(jìn)行一級(jí)離散小波變換(DWT)后,對(duì)僅有原圖像的小波低頻分量進(jìn)行分塊,然后利用奇異值分解(SVD)系數(shù)作為圖像塊的特征。但是這樣做使檢測(cè)精度降低。
當(dāng)前塊匹配方法面臨的主要問(wèn)題是:①每個(gè)像素對(duì)應(yīng)一個(gè)圖像塊,每個(gè)圖像塊提取一個(gè)特征向量,造成特征向量數(shù)量多,搜索空間大,特征匹配效率低;②圖像特征魯棒性不強(qiáng),目前常用特征如DCT系數(shù),PCA降維系數(shù)等,這些特征對(duì)壓縮和噪聲等一般的圖像處理具有一定的魯棒性,但是對(duì)于幾何變換穩(wěn)定性較差,如果圖像或復(fù)制區(qū)域發(fā)生了偏移或旋轉(zhuǎn),很難再匹配。
本文利用尺度不變特征變換(Scale Invariant Feature Transform,簡(jiǎn)稱SIFT)從圖像中提取SIFT特征,通過(guò)特征匹配檢測(cè)圖像中是否有復(fù)制粘貼區(qū)域[6]。SIFT特征魯棒性強(qiáng),可以抵抗一般的圖像處理和幾何變換,而且不需要對(duì)圖像進(jìn)行分塊,避免分塊引起的問(wèn)題。直接從圖像中提取SIFT特征進(jìn)行匹配,特征向量數(shù)量少,可以有效提高匹配效率。
1.1 SIFT特征及其特性
SIFT算法是一種基于高斯尺度空間理論提取圖像局部特征點(diǎn)的算法,在尺度空間尋找局部極值點(diǎn),提取尺度和方向不變的局部特征。SIFT提取圖像局部特征的過(guò)程是:①尺度空間局部極值檢測(cè);②特征點(diǎn)選擇;③指定方向;④局部特征描述[6]。
SIFT特征包括特征點(diǎn)和特征向量?jī)刹糠?,特征點(diǎn)用(x,y,σ,θ)表示,其中(x,y)是在特點(diǎn)圖像平面的位置,σ是高斯尺度空間的尺度維,θ指的是主方向。每個(gè)特征點(diǎn)對(duì)應(yīng)一個(gè)特征向量,特征向量的維數(shù)是128。SIFT特征點(diǎn)和特征向量對(duì)噪聲和壓縮等信號(hào)處理和幾何變換具有穩(wěn)定性。除此之外SIFT特征還具有一些其他特性:
1.1.1 SIFT特征的鑒別性高
特征的鑒別性是指即使紋理特征非常相像,但是不相同的內(nèi)容,提取的特征也是不一樣的。在自然圖像中樹和草地具有相像的紋理特征,但是從不同區(qū)域提取的SIFT特征是不一樣的。
圖1是SIFT特征鑒別性測(cè)試實(shí)例,圖1中樹的紋理特征非常相像,特別是圖像塊A和B、C和D的紋理特征和結(jié)構(gòu)更是相像。為了測(cè)試,從圖1(a)的A、B、C、D四個(gè)區(qū)域分別提取SIFT特征,然后對(duì)A和B、C和D區(qū)域的特征分別進(jìn)行匹配,沒(méi)有得到一個(gè)匹配點(diǎn)對(duì),如圖1(b)所示。由此可以看出SIFT特征的鑒別性強(qiáng),在檢測(cè)復(fù)制和粘貼區(qū)域時(shí),不會(huì)因相似的紋理結(jié)構(gòu)而產(chǎn)生誤判。
1.1.2 SIFT特征的魯棒性強(qiáng)
圖像即使經(jīng)過(guò)平滑、加噪、旋轉(zhuǎn)和尺度縮放,SIFT特征匹配得依然很好,圖2是一個(gè)測(cè)試?yán)?。在圖2(a)中左上角的圖像是從右圖中截取的一部分,但是這部分圖像被旋轉(zhuǎn)了10°并縮小了10%。從這兩個(gè)圖中提取SIFT特征并進(jìn)行匹配,左圖中提取了319個(gè)特征,右圖中提取了3818個(gè)特征點(diǎn),匹配的特征點(diǎn)是185個(gè)點(diǎn)對(duì),匹配率達(dá)60%,匹配結(jié)果如圖2(b)所示。從實(shí)驗(yàn)可以看出,即使經(jīng)過(guò)幾何變形,SIFT特征也可以很好匹配,可以有效對(duì)付幾何變換,魯棒性強(qiáng)。
1.2 基于SIFT的復(fù)制-粘貼偽造鑒別方法
1.2.1 方法步驟
基于SIFT特征匹配的復(fù)制-粘貼偽造鑒別方法的主要步驟包括:①?gòu)拇龣z測(cè)圖像中提取SIFT特征;②對(duì)這些特征進(jìn)行相互匹配;③根據(jù)匹配結(jié)果確定復(fù)制-粘貼區(qū)域。如果兩個(gè)SIFT特征匹配,則在對(duì)應(yīng)的兩個(gè)特征點(diǎn)之間進(jìn)行連線,同時(shí)在特征點(diǎn)周圍3×3區(qū)域進(jìn)行標(biāo)注。
特征匹配就是針對(duì)某一特征搜索它的最近鄰和次近鄰,因此高效的搜索算法是非常必要的。搜索算法有窮舉搜索、kd-tree搜索和BBF(Best-Bin-First)搜索。窮舉搜索是一種最簡(jiǎn)單的搜索方法,但是搜索效率低,其計(jì)算量和特征點(diǎn)的個(gè)數(shù)為指數(shù)關(guān)系。kd-tree能夠高效搜索最近鄰的一般規(guī)則是:如果特征向量的維數(shù)是d,特征點(diǎn)個(gè)數(shù)是N,只有滿足條件N>>2d才能達(dá)到高效的搜索。而SIFT特征是128維,一幅圖像提取的特征點(diǎn)的數(shù)量一般是幾千到幾萬(wàn),無(wú)法滿足這個(gè)條件。針對(duì)高維數(shù)據(jù)BBF算法[6]對(duì)kd-tree搜索算法進(jìn)行了改進(jìn),主要改進(jìn)了樹結(jié)構(gòu)的遍歷策略,確保優(yōu)先檢索包含最近鄰點(diǎn)可能性較高的空間,因此其搜索效率高,本文選用BBF算法作為搜索算法。
1.2.2 與同類方法比較
基于特征匹配的偽造鑒別算法,在設(shè)計(jì)算法時(shí)不僅考慮檢測(cè)精度,而且要考慮檢測(cè)速度。特征提取和匹配占用整個(gè)算法過(guò)程的大部分時(shí)間。本文提出的方法和經(jīng)典的算法在512×512大小的圖像上進(jìn)行了比較,比較內(nèi)容包括選用特征、特征向量的個(gè)數(shù)和維數(shù)以及檢測(cè)精度,具體內(nèi)容見表1。
從表1可以看出本方法的特征向量數(shù)量遠(yuǎn)遠(yuǎn)小于其他算法,這將大大減少算法的運(yùn)行時(shí)間,而且檢測(cè)精度較其他算法高。
為了驗(yàn)證本方法的有效性,對(duì)一些圖像進(jìn)行復(fù)制-粘貼修改,然后用本文方法進(jìn)行檢測(cè),檢查結(jié)果如圖3和圖4所示。圖3中分別是原始圖像、修改圖像、匹配結(jié)果和檢測(cè)結(jié)果。修改圖像是對(duì)原始圖像進(jìn)行了兩處復(fù)制-粘貼,匹配結(jié)果圖是復(fù)制粘貼區(qū)域特征的匹配情況,對(duì)于匹配的兩個(gè)特征其特征點(diǎn)之間用線連接,檢測(cè)結(jié)果圖是在匹配的特征點(diǎn)周圍3×3區(qū)域進(jìn)行標(biāo)注。從實(shí)驗(yàn)結(jié)果看本文方法可以對(duì)多處偽造修改進(jìn)行準(zhǔn)確定位。
圖4的修改圖像對(duì)原始圖像中人物不僅進(jìn)行了復(fù)制-粘貼,而且在粘貼之前對(duì)復(fù)制內(nèi)容進(jìn)行了旋轉(zhuǎn)和縮小。從實(shí)驗(yàn)結(jié)果看,本文方法可以對(duì)這些帶有幾何變換的修改進(jìn)行有效檢測(cè)和定位。
因?yàn)镾IFT特征具有很好的魯棒性和鑒別性,本文利用SIFT特征和基于BBF方法的特征匹配方法,搜索和定位同幅圖像中復(fù)制-粘貼區(qū)域,得到了良好的真?zhèn)螜z測(cè)結(jié)果,不僅能檢測(cè)到復(fù)制-粘貼區(qū)域,而且在復(fù)制區(qū)域被信號(hào)處理甚至幾何變化都能有效檢測(cè)到。但是如果復(fù)制區(qū)域是平滑區(qū)域,本方法檢測(cè)效果不好,因?yàn)閺钠交瑓^(qū)域無(wú)法提取足夠數(shù)量的SIFT特征,所幸平滑區(qū)域的隱藏能力很弱,一般人不會(huì)復(fù)制平滑區(qū)域去覆蓋另外一個(gè)區(qū)域的圖像內(nèi)容。
[1] J.Fridrich,D.Soukal,J.Lukas.Detection of copy–move forgery in digital images[C].In Proceedings of Digital Forensic Research Workshop,Cleveland,OH,USA,August 2003:55-61.
[2] A.Popescu,H.Farid.Exposing digital forgeries by de?tecting duplicated image regions[R].Technical Report TR 2004-515,Department of Computer Science,Dartmouth Col?lege,2004.
[3] 劉美紅,徐蔚鴻.基于分形和統(tǒng)計(jì)的復(fù)制—粘貼篡改圖像的檢測(cè)[J].計(jì)算機(jī)應(yīng)用,2011,31(8):2236-2239.
[4] 歐佳佳,蔡碧野,熊兵,等.基于灰度共生矩的圖像區(qū)域復(fù)制篡改檢測(cè)[J].計(jì)算機(jī)應(yīng)用,2011,31(6):1628-1630.
[5]Li G H,Wu Q,Tu D.et al.A sorted neighborhood approach for detecting duplicated regions in image forgeries based on DWT and SVD[C].In Proceedings of 2007 IEEE International Conference on Multimedia and Expo.Beijing,China:IEEE,2007:1750-1753.
[6] D.G.Lowe.Distinctive image features from scaleinvariant keypoints[J].International Journal of Computer Vision,2004,60(2):91-110.
A M ethod for the Identification of the Authenticity of Digital Images
ShangWentao
(Henan ExperimentalMiddle School,Zhengzhou Henan 450002)
It is a common form of image forgery to copy imageand then paste it on the other part.In thisway,the commonly used detection methodis a block matchingmethod.Thismethod has the defects of low detection speed and low robustness.This paper presents a new method,which does not block the image,but extracts the SIFT features directly from the image,and then detects and locates the forged region by featurematching.The features are small,the detection efficiency is high,and the robustness is strong,which can not only can deal with the noise,compression and other image processing,but also can deal with the rotation,scaling and other geometric deformation.Finally,the effectiveness of thismethod is verified by experiments.
image forgery;scale invariant feature transform(SIFT);featurematching
TP391
A
1003-5168(2015)06-0001-4
2015-5-20
尚文韜(1997-),男,河南省實(shí)驗(yàn)中學(xué)高三學(xué)生,研究方向:數(shù)字圖像處理。