杜 媛
(西安職業(yè)技術(shù)學(xué)院 大數(shù)據(jù)應(yīng)用學(xué)院, 陜西 西安 710072)
當(dāng)今人們可通過多種圖像采集設(shè)備,輕易地獲取圖像數(shù)據(jù)。數(shù)字圖像已被廣泛應(yīng)用于人們生活的方方面面[1]??茖W(xué)技術(shù)的不斷發(fā)展不僅有助于人們能簡單快速地獲取數(shù)字圖像,而且還為人們修改編輯數(shù)字圖像提供了條件。雖然這種修改編輯數(shù)字圖像的方法給人們的生活帶來許多便利,但若使用不當(dāng)將會給人們的生活帶來困擾[2-3]。因此,對篡改圖像進(jìn)行檢測,就顯得非常具有實用意義。
為了識別篡改內(nèi)容,研究者設(shè)計了多種多樣的篡改圖像檢測算法。如Rajan 等[4]開發(fā)了一種利用特征的神經(jīng)網(wǎng)絡(luò)檢測陰影或反射中的圖像偽造技術(shù),在分割過程中,利用基于映射的分割技術(shù)對陰影點和反射點進(jìn)行識別,然后利用LVP(Learn vector quantization)算子提取陰影點和反射部分的特征點,最后利用前饋神經(jīng)網(wǎng)絡(luò)進(jìn)行偽造檢測。由于該方法中直接將提取的特征點用于偽造檢測,沒有考慮偽特征點的負(fù)面影響,易使得檢測結(jié)果中存在錯誤檢測。陳輝映等[5]采用Hessian 算子從圖像中提取特征點,利用K-g2NN 方法實現(xiàn)偽造檢測。由于K-g2NN 方法僅考慮了圖像特征的距離,而沒有考慮圖像特征間的互相關(guān)性,并且該方法在使用特征點時沒有對其進(jìn)行優(yōu)化,易引起錯誤檢測和漏檢測。如Kim 等[6]采用主動檢測的方法,設(shè)計了一種用于數(shù)字偽造篡改后圖像恢復(fù)的自嵌入水印算法,以絕對矩塊截斷編碼影像為水印,采用原始封面影像為壓縮版本,包含封面影像的內(nèi)容特征,以實現(xiàn)自我嵌入,對篡改圖像進(jìn)行檢測。該方法無須考慮圖像特征,但由于其需要將水印嵌入到原始圖像中,易造成原始圖像被損壞。Mohammed 等[7]將離散余弦變換引入篡改檢測過程,計算圖像系數(shù),并根據(jù)圖像系數(shù)使用之字形掃描方法求取特征向量,采用歐氏距離對復(fù)制塊進(jìn)行定位,完成檢測。由于采用歐氏距離定位復(fù)制塊時,未考慮復(fù)制塊間的互相關(guān)性,而且該過程依賴于閾值的設(shè)定,易使得檢測結(jié)果出錯。
對此,本研究采用DoG 算子及其二次Taylor 展開式構(gòu)造了優(yōu)化因子,提取圖像特征。利用NCC 模型求取特征點間的互相關(guān)信息,并利用其與特征點間的歐式距離信息一同完成圖像特征匹配,使得匹配結(jié)果的正確性得以提高。借助特征點間歐氏距離信息構(gòu)造比值制約規(guī)則,用以歸類匹配圖像特征,識別篡改內(nèi)容。利用所設(shè)計的篡改檢測算法,對偽造圖像進(jìn)行識別,以驗證其檢測性能。
本研究算法過程如圖1所示。由圖1可見,待檢測圖像經(jīng)過DoG 算子提取圖像特征后,再利用DoG 算子的二次Taylor 展開式構(gòu)成優(yōu)化因子并計算,獲取優(yōu)化后的圖像特征。利用圖像的Haar 小波信息獲取其特征向量,并通過該特征向量求取特征點間的歐氏距離信息,同時將其與特征點間的互相關(guān)信息進(jìn)行聯(lián)合,完成圖像特征的匹配,以提高圖像匹配的準(zhǔn)確度。利用基于匹配特征點間歐氏距離信息建立的比值制約規(guī)則,對匹配特征進(jìn)行歸類,識別篡改區(qū)域,獲取檢測結(jié)果。
圖1 本研究篡改檢測算法架構(gòu)圖Fig.1 The proposed architecture diagram of tamper detection algorithm
當(dāng)下眾多的圖像特征提取算子中,DoG 算子具有優(yōu)異的檢測性能[8]。而且DoG算子的計算過程較為簡單,其利用像素點與其鄰域點的像素值進(jìn)行比較快速提取圖像特征。對于尺度為β的圖像I(x,y),其尺度空間函數(shù)L(x,y,β)的計算過程為[9]
這里,G(x,y,β)為高斯核函數(shù),其表達(dá)式為
然后,利用尺度空間函數(shù)L(x,y,β)求取DoG 算子D(x,y,β),計算過程如下所示:
其中,k為比例因子。
利用DoG 算子提取圖像特征的示意圖如圖2 所示。由圖2 可見,在DoG 算子提取圖像特征的過程中,需要將像素點P的像數(shù)值與其26 個鄰點(圖2 中圓形區(qū)域)的像素值進(jìn)行比較。若像素點P的像素值為這些鄰點中的極值,則判定像素點P為圖像特征點[10]。
圖2 DoG算子提取圖像特征示意圖Fig.2 The schematic diagram of image feature extraction using DoG operator
由于受噪聲等影響,任何圖像特征提取算子時所提取的圖像特征都會包含有偽圖像特征。為了將偽圖像特征去除,本文利用DoG 算子的二次Taylor 展開式構(gòu)造了優(yōu)化因子,用于凈化圖像特征提取結(jié)果。
DoG算子的二次Taylor展開式D′為
在式(4)等于0 的情況下,對其進(jìn)行求導(dǎo)計算,便得到優(yōu)化因子,即
當(dāng)優(yōu)化因子的值太小時,易受到噪聲的影響,而成為偽圖像特征。對此,設(shè)定優(yōu)化閾值為TP,利用式(7)求取通過DoG 算子提取的圖像特征的值。若則認(rèn)為該特征點為偽特征點。
上述方法提取圖像特征的結(jié)果示意圖如圖3 所示。由圖3(b)可見,上述方法能夠較為準(zhǔn)確地獲取圖3(a)中圖像的特征點。
圖3 提取圖像特征結(jié)果示意圖Fig.3 The schematic diagram of extracted image features
為了克服旋轉(zhuǎn)等變換的影響,需計算圖像特征的基準(zhǔn)方向。在本研究算法中,利用特征點的梯度直方圖獲取其基準(zhǔn)方向。首先,計算像素點p(x,y)的梯度模值M(x,y)和梯度方向U(x,y)[11],即
隨后,通過M(x,y)和U(x,y)計算[0°,360°]的梯度直方圖,并以10°為步長將其分割。將分割后的峰值方向視為基準(zhǔn)方向φ。
再以特征點g(x,y)為起點,按照圖4所示方法,以基準(zhǔn)方向φ為起始方向建立特征點的8鄰域區(qū)。
圖4 建立特征點8鄰域區(qū)示意圖Fig.4 The schematic diagram of establishing feature point 8-neighborhood area
圖4中極半徑R與極角θ的計算過程為
其中,(xi,yi)為P(x,y)點的鄰點坐標(biāo)。
接著,采用大小為4β(β為特征點的尺度因子)的Haar 小波,計算每個鄰域區(qū)中x、y方向上的Haar 小波值Hx及Hy,由此可求得每個鄰域區(qū)中的四維向量W,即
聯(lián)合特征點的8 鄰域區(qū)便可得到一個32 維的向量。將其進(jìn)行歸一化運算,便生成了如圖5 所示的特征向量。
圖5 特征向量示意圖Fig.5 The schematic diagram of feature vectors
近鄰搜索方法是當(dāng)下使用較為廣泛的圖像特征匹配方法。由于其依賴于閾值而且沒有考慮特征點間的互相關(guān)特征,易出現(xiàn)錯誤匹配。對此,本研究利用NCC 模型求取圖像的互相關(guān)信息,將其與特征點的歐氏距離信息相聯(lián)合,用于匹配圖像特征,克服匹配過程中對閾值的依賴以及唯距離為依據(jù)的局面,提高匹配正確度。
特征點A(i,j)與S(i,j)間歐氏距離值D(A,S)可表述為[12]
其中,DAi與DSi分別為A(i,j)與S(i,j)的特征向量。
令E與T分別為以特征點A(i,j)與S(i,j)為中心,大小為m×n的區(qū)域,則此時A(i,j)與S(i,j)之間互相關(guān)值Re(A,S)的計算過程為[13]
其中,與分別為E與T中像素點均值。
利用式(12)與(13)分別計算特征點A與任一特征點S間的D(A,S)值與Re(A,S)值,若特征點A與某一特征點S′既滿足其歐氏距離值D(A,S′)為所有D(A,S)值中的最小值,又滿足其Re(A,S′)值比所有Re(A,S)值都大,則認(rèn)為A與S′為匹配點。
利用特征點間歐氏距離信息與互相關(guān)信息匹配的圖像特征示意圖如圖6所示。由圖6可知,本研究算法匹配的圖像特征具有較高的準(zhǔn)確度。
圖6 匹配的圖像特征示意圖Fig.6 The schematic diagram of matched image features
盡管匹配的圖像特征具有較高的準(zhǔn)確度,但難免會存在一些錯誤匹配[14]。為了對正確匹配的結(jié)果進(jìn)行歸類,更準(zhǔn)確地識別篡改內(nèi)容,本研究利用匹配特征點間的歐氏距離信息,建立了比值制約規(guī)則,用以歸類匹配特征。
令Z={z1,z2,z3,…,zn}為一個含有n個元素的特征點集。V={v1,v2,v3,…,vn}為另一個含有n個元素的特征點集,且該集合中的特征點與Z中的特征點為匹配關(guān)系。利用式(12)求取Z中元素zi與其他元素的歐氏距離值,并形成距離集合Z′={z′i1,z′i2,z′i3,…,z′in}。利用同樣的方法求取V中元素vi與其他元素的歐氏距離值,并形成距離集合V′={v′i1,v′i2,v′i3,…,v′in}。通過距離集合V′和Z′建立的比值制約規(guī)則如下。
首先,v′i1與V′中其他各元素進(jìn)行比值計算,z′i1與Z′中其他各元素進(jìn)行比值計算。然后,將v′i1與V′中其他各元素的比值結(jié)果,與z′i1與Z′中其他各元素的比值結(jié)果進(jìn)行比較。最后,若比較結(jié)果能夠滿足式(14),則將與歸為一類。
圖6 中匹配特征經(jīng)過比值制約規(guī)則進(jìn)行歸類后的結(jié)果如圖7所示。由圖7可見,利用比值制約規(guī)則對匹配特征進(jìn)行歸類后,識別的篡改內(nèi)容具有較高的準(zhǔn)確度。
圖7 識別的篡改內(nèi)容示意圖Fig.7 The schematic diagram of the identified tampered content
以LenovoIntel I3 CPU、500 GB ROM 的PC 機作為實驗平臺,利用MATLAB 7.10 軟件進(jìn)行實驗,實驗中優(yōu)化閾值TP= 0.05。采用文獻(xiàn)[15]和文獻(xiàn)[16]所提出的算法作為對比對象,并利用文獻(xiàn)[15]和文獻(xiàn)[16]算法以及本研究算法對偽造圖像進(jìn)行檢測,驗證本研究算法的有效性。
文獻(xiàn)[15]和文獻(xiàn)[16]以及本研究算法對復(fù)制-粘貼偽造圖像的檢測效果以及檢測準(zhǔn)確度數(shù)據(jù)如圖8 與表1所示。由圖8可見,文獻(xiàn)[15]算法檢測效果中具有錯誤檢測現(xiàn)象。文獻(xiàn)[16]算法檢測效果中具有漏檢測現(xiàn)象。本研究算法檢測效果中不存在錯誤檢測現(xiàn)象,而且漏檢測內(nèi)容也較少。通過對比表1 數(shù)據(jù)可見,本研究算法的檢測準(zhǔn)確度最高。圖9 及表2 分別為3 種算法對復(fù)制-粘貼+縮放偽造圖像的檢測效果以及檢測準(zhǔn)確度數(shù)據(jù)表。由圖9 可見,文獻(xiàn)[15]算法的檢測效果中有漏檢測現(xiàn)象以及2 處錯誤檢測。文獻(xiàn)[16]算法的檢測效果中也有漏檢測現(xiàn)象和錯誤檢測現(xiàn)象。本研究算法檢測效果中檢測完整度最高,而且錯誤檢測內(nèi)容最少。表2 數(shù)據(jù)也反映出本研究算法的檢測準(zhǔn)確度最高,為92.01%。圖10 和表3 分別顯示了3 種算法對復(fù)制-粘貼+旋轉(zhuǎn)+噪聲偽造圖像的檢測效果以及檢測準(zhǔn)確度數(shù)據(jù)。由圖10 可見,本研究算法的檢測效果最佳,檢測偽造內(nèi)容的完整度最高。對比表3 中數(shù)據(jù)發(fā)現(xiàn),本研究算法的檢測準(zhǔn)確度較對比對象最高,文獻(xiàn)[15]算法的檢測準(zhǔn)確度為86.80%,文獻(xiàn)[16]算法的檢測準(zhǔn)確度為87.79%,本研究算法的檢測準(zhǔn)確度為90.03%。由此說明,本研究算法對偽造圖像的檢測效果較好,檢測完整度以及檢測準(zhǔn)確度都較高,且魯棒性較好。因為本研究算法在利用DoG算子提取圖像特征后,并沒有直接使用提取結(jié)果,而是利用DoG算子的二次Taylor 展開式構(gòu)造優(yōu)化因子對提取結(jié)果進(jìn)行凈化后再使用,使得獲取的圖像特征正確度較高。同時本研究算法還利用直方圖方法計算了特征點的基準(zhǔn)方向,并以其為起始方向建立了特征點的極坐標(biāo)鄰域,通過求取鄰域Haar 小波值,獲取旋轉(zhuǎn)等魯棒性都較好的特征向量,從而使得算法的檢測準(zhǔn)確度以及抗干擾性能得以提高。
表1 圖8中3種算法檢測準(zhǔn)確度數(shù)據(jù)Tab.1 The detection accuracy of three algorithms in Figure 8
表2 圖9中3種算法檢測準(zhǔn)確度數(shù)據(jù)Tab.2 The detection accuracy of three algorithms in Figure 9
表3 圖10中3種算法檢測準(zhǔn)確度數(shù)據(jù)Tab.3 The detection accuracy of three algorithms in Figure 10
圖8 不同算法對復(fù)制-粘貼偽造圖像檢測效果Fig.8 The detection effect of different algorithms on copypaste forged images
圖9 不同算法對復(fù)制-粘貼+縮放篡改圖像檢測效果Fig.9 The detection effect of different algorithms on copypaste-zoom tampered images
圖10 不同算法對復(fù)制-粘貼+旋轉(zhuǎn)篡改圖像檢測結(jié)果Fig.10 Detection results of different algorithms for copypaste-rotation tampered images
GRIP數(shù)據(jù)集中包含了80幅偽造圖像。采用GRIP數(shù)據(jù)集的一幅偽造圖像進(jìn)行客觀評價,將該偽造圖像的篡改內(nèi)容旋轉(zhuǎn)多個角度,以形成12 幅偽造圖像。利用3 種算法對這些偽造圖像進(jìn)行檢測,并將檢測結(jié)果的準(zhǔn)確度進(jìn)行比較,以分析各算法的檢測性能。
3種算法檢測結(jié)果的準(zhǔn)確度如圖11所示。從圖11可以看出,本研究算法的檢測結(jié)果準(zhǔn)確度比文獻(xiàn)[15]和文獻(xiàn)[16]算法高。在檢測旋轉(zhuǎn)70°的偽造圖像時,本研究算法檢測結(jié)果準(zhǔn)確度為93.68%。由此說明,本研究算法的檢測性能較好,而且抗干擾能力較強。因為本研究算法將特征點間的互相關(guān)信息引入到圖像特征的匹配過程,利用其與特征點間歐氏距離信息來完成圖像特征匹配,使得算法的抗干擾能力及匹配準(zhǔn)確度得以提升。同時本研究算法還以特征點間的歐氏距離信息為基礎(chǔ),建立了比值制約規(guī)則,對匹配點進(jìn)行歸類,進(jìn)一步提升了算法的抗干擾能力及檢測準(zhǔn)確度,從而使得本研究算法的檢測性能較好。文獻(xiàn)[15]算法中將圖像分割為重疊圓形塊,用離散徑向諧波傅里葉矩提取重疊圓形塊的局部和內(nèi)部圖像特征,通過最近鄰方法來搜索塊的相似特征向量,進(jìn)而采用形態(tài)學(xué)運算去除孤立像素,獲取檢測結(jié)果。文獻(xiàn)[15]算法中將離散徑向諧波傅里葉矩提取的圖像特征直接用于偽造檢測,忽略了偽圖像特征的影響,而且最近鄰方法對閾值依賴性較強,從而使得文獻(xiàn)[15]算法的檢測性能不佳。文獻(xiàn)[16]算法利用尺度不變特征變換提取特征點,生成多尺度特征。在每個尺度上利用自適應(yīng)匹配算法對圖像特征完成匹配,將所有尺度上的匹配特征進(jìn)行合并,生成偽造區(qū)域。但是,文獻(xiàn)[16]采用尺度不變特征變換方法所提取的特征點沒有經(jīng)過優(yōu)化就直接用于偽造檢測,降低了算法的檢測準(zhǔn)確度,且沒有對匹配后的圖像特征進(jìn)行聚類就用于合并生成偽造區(qū)域,易引起誤檢。
圖11 3種算法檢測結(jié)果的準(zhǔn)確度Fig.11 The detection accuracy of three algorithms
為了在圖像偽造檢測過程中獲取較為純凈的圖像特征,本文利用DoG 算子的二次Taylor展開式,構(gòu)造了優(yōu)化因子,對利用DoG 算子提取的圖像特征進(jìn)行了凈化,提高了圖像特征的正確性。通過利用圖像Haar 小波值求取特征向量,并求取了特征點間的歐氏距離信息,利用其與通過NCC 模型獲取的特征點間互相關(guān)信息,共同完成圖像特征的匹配,提高了圖像特征的匹配正確性及魯棒性,采用特征點間的歐氏距離信息建立了比值制約規(guī)則,對匹配圖像特征進(jìn)行歸類,準(zhǔn)確識別了偽造內(nèi)容。實驗結(jié)果表明,無論本研究算法的檢測準(zhǔn)確度還是抗干擾性都較為優(yōu)異,能夠在準(zhǔn)確檢測偽造內(nèi)容的同時,適應(yīng)于旋轉(zhuǎn)等多種干擾因素。