郭銳,賈麗,郝宏翔,墨瀚林,李華
1. 中國(guó)科學(xué)院計(jì)算技術(shù)研究所智能信息處理重點(diǎn)實(shí)驗(yàn)室,北京 100190;2. 中國(guó)科學(xué)院大學(xué),北京 100049; 3. 91977部隊(duì),北京 100036
如何正確識(shí)別圖像中的目標(biāo)是計(jì)算機(jī)視覺(jué)和模式識(shí)別領(lǐng)域的經(jīng)典問(wèn)題?;诟鞣N圖像特征的方法已被多數(shù)研究者接受。在相機(jī)成像曝光過(guò)程中,由于大氣干擾、相機(jī)失焦以及相機(jī)與場(chǎng)景相對(duì)運(yùn)動(dòng)等環(huán)境和現(xiàn)實(shí)很多因素會(huì)造成圖像的退化,因此,理想的圖像特征應(yīng)當(dāng)對(duì)這些變化具有不變性。圖像運(yùn)動(dòng)模糊是在相機(jī)成像的過(guò)程中由于相對(duì)較長(zhǎng)的曝光時(shí)間及相機(jī)與場(chǎng)景相對(duì)運(yùn)動(dòng)導(dǎo)致的,可視做一定時(shí)間區(qū)間內(nèi)對(duì)圖像密度函數(shù)的積分。按照曝光時(shí)間內(nèi)相機(jī)相對(duì)于場(chǎng)景在3維空間的運(yùn)動(dòng)形式,圖像的運(yùn)動(dòng)模糊可分為直線(xiàn)運(yùn)動(dòng)模糊、旋轉(zhuǎn)運(yùn)動(dòng)模糊、徑向運(yùn)動(dòng)模糊以及其他由上述3種模糊多個(gè)疊加形成的復(fù)雜運(yùn)動(dòng)模糊。例如,安裝在高速旋轉(zhuǎn)的導(dǎo)彈或機(jī)械的相機(jī)拍攝的圖像會(huì)產(chǎn)生旋轉(zhuǎn)運(yùn)動(dòng)模糊。
本文以旋轉(zhuǎn)運(yùn)動(dòng)模糊的退化模型為出發(fā)點(diǎn),提出了旋轉(zhuǎn)運(yùn)動(dòng)模糊Gaussian-Hermite(GH)矩,并對(duì)已有的幾何矩旋轉(zhuǎn)變換不變量向GH矩不變量進(jìn)行拓展和篩選,構(gòu)造了一組由5個(gè)對(duì)旋轉(zhuǎn)變換和旋轉(zhuǎn)運(yùn)動(dòng)模糊保持不變的GH矩旋轉(zhuǎn)運(yùn)動(dòng)模糊不變量組成的特征向量(rotational motion blur Gaussian-Hermite moment invariants RMB_GHMI-5),該組特征向量可從受到嚴(yán)重噪聲干擾的旋轉(zhuǎn)變換疊加旋轉(zhuǎn)運(yùn)動(dòng)模糊的圖像中直接進(jìn)行圖像檢索,而無(wú)需前置復(fù)雜的“去模糊”預(yù)處理過(guò)程,從而實(shí)現(xiàn)了很好的識(shí)別效能。
在運(yùn)動(dòng)模糊圖像模式識(shí)別方面,大多數(shù)工作選擇去模糊策略,達(dá)到盡可能好的效果后再進(jìn)行下一級(jí)處理。在去模糊領(lǐng)域,按照使用的方法類(lèi)型可分為基于自然場(chǎng)景統(tǒng)計(jì)的方法和基于機(jī)器學(xué)習(xí)的方法?;谧匀粓?chǎng)景統(tǒng)計(jì)的方法主要有:Whyte等人(2012)針對(duì)相機(jī)繞光軸旋轉(zhuǎn)產(chǎn)生的模糊,提出基于簡(jiǎn)單投影變換模型的非統(tǒng)一模糊圖像復(fù)原,對(duì)模糊圖像建立了描述曝光時(shí)間內(nèi)相機(jī)的旋轉(zhuǎn)速度的參數(shù)。Zheng等人(2013)研究相機(jī)的徑向運(yùn)動(dòng)模糊,但在模糊核估計(jì)時(shí)需要手動(dòng)選擇。Wang等人(2017)通過(guò)使用Radon 變換求模糊方向和雙頻譜建模來(lái)找出直線(xiàn)運(yùn)動(dòng)模糊的長(zhǎng)度,該算法是基于空間和頻域分析的結(jié)合。Sun等人(2018)對(duì)于受到高斯噪聲影響的圖像盲恢復(fù)提出重加權(quán)ADMM(alternating direction method of multipliers)算法,但由于在非凸的ADMM 中,拉格朗日乘子取值很大,使得算法迭代較慢。Sun等人(2019)提出了一種基于參數(shù)預(yù)熱技術(shù)的交替極小化算法?;跈C(jī)器學(xué)習(xí)的方法主要有:Zhou等人(1988)率先將HNN(Hopfield neural network)應(yīng)用到圖像復(fù)原領(lǐng)域。Tao等人(2018)基于卷積神經(jīng)網(wǎng)絡(luò)提出一種深度學(xué)習(xí)方法用于圖像去運(yùn)動(dòng)模糊。Kupyn等人(2019)進(jìn)一步改進(jìn)網(wǎng)絡(luò),將特征金字塔網(wǎng)絡(luò)作為DeblurGAN-v2的核心構(gòu)建塊,與各種骨干網(wǎng)絡(luò)配合使用,在性能和效率之間更加均衡。Liang等人(2019)利用頭腦風(fēng)暴優(yōu)化算法自動(dòng)搜尋BP(back propagation)神經(jīng)網(wǎng)絡(luò)更佳的初始權(quán)值和閾值,提升了網(wǎng)絡(luò)性能。Qiu和Zhang(2020)基于cGANs(conditional generative adversarial nets)生成了端到端的去旋轉(zhuǎn)運(yùn)動(dòng)模糊的網(wǎng)絡(luò)。許多去模糊的研究工作在指定任務(wù)中取得了很好效果,但在圖像處理和識(shí)別領(lǐng)域一直面臨著“不適定”(Flusser和Suk,1998)或“非必要”的挑戰(zhàn)。首先,無(wú)論采用何種方法對(duì)圖像進(jìn)行復(fù)原都是不穩(wěn)定且耗時(shí)的,恢復(fù)工作難以完美實(shí)現(xiàn)。其次,在目標(biāo)識(shí)別和語(yǔ)義理解等無(wú)需人類(lèi)視覺(jué)系統(tǒng)參與處理的場(chǎng)景,對(duì)模糊圖像進(jìn)行恢復(fù)經(jīng)常是非必要的。
如果免去圖像恢復(fù)的預(yù)處理過(guò)程,直接提取具有運(yùn)動(dòng)模糊不變性的圖像特征,就會(huì)使圖像識(shí)別效率加速。因此,構(gòu)造運(yùn)動(dòng)模糊圖像的不變特征成為圖像識(shí)別領(lǐng)域的一個(gè)重要研究方向。Suk和Flusser(1996)基于中心對(duì)稱(chēng)卷積核構(gòu)造了直線(xiàn)運(yùn)動(dòng)模糊矩不變量。Flusser和Suk(1998)提出模糊幾何矩不變量。Flusser和Zitov(1999)提出了同時(shí)對(duì)模糊變換和相似變換有不變性的復(fù)數(shù)矩不變量。Zhang和Tan(2002)提出了仿射—卷積混合不變量。Zitov和Flusser(2003)提出使用模糊不變量替換已有仿射矩不變量中的中心矩的方法構(gòu)造仿射—卷積混合不變量的顯式表達(dá)式。Ojansivu和Heikkil?(2008)基于中心對(duì)稱(chēng)卷積核在頻域內(nèi)對(duì)相位譜沒(méi)有影響,提出局部相位量化特征描述子。這種假設(shè)使研究工作取得一定進(jìn)展,但不適用于實(shí)際中復(fù)雜運(yùn)動(dòng)形式的模糊圖像的識(shí)別。Zhang等人(2010)基于正交 Legendre 矩進(jìn)行了改進(jìn)。Flusser等人(2015)基于幾何矩提出了7階以?xún)?nèi)的直線(xiàn)運(yùn)動(dòng)模糊不變量,并給出了構(gòu)造方法,在與去模糊方法的圖像識(shí)別對(duì)比實(shí)驗(yàn)中,顯示出更好性能。
關(guān)于旋轉(zhuǎn)運(yùn)動(dòng)模糊的研究,一般思路是根據(jù)運(yùn)動(dòng)軌跡為一系列同心圓的性質(zhì),將模糊圖像從笛卡兒坐標(biāo)系轉(zhuǎn)換到極坐標(biāo)系,看成直線(xiàn)運(yùn)動(dòng)模糊來(lái)處理(Morimoto等,2011)。但這種研究思路的本質(zhì)仍然是去模糊,不但沒(méi)有解決本質(zhì)問(wèn)題,坐標(biāo)系的轉(zhuǎn)換還會(huì)引入新的噪聲,對(duì)后續(xù)的識(shí)別和分析產(chǎn)生影響。Hao等人(2021)基于旋轉(zhuǎn)運(yùn)動(dòng)模糊退化模型以及幾何矩,得到7個(gè)旋轉(zhuǎn)運(yùn)動(dòng)模糊幾何矩不變量RMBMI-7(rotational motion blur moment invariants),并在實(shí)驗(yàn)中證實(shí)了其對(duì)于旋轉(zhuǎn)運(yùn)動(dòng)模糊具有良好的不變性和區(qū)分性。但是由于幾何矩本身抗噪性能較差,因此在實(shí)際應(yīng)用中,適用性受到制約。除上述工作之外,對(duì)于旋轉(zhuǎn)運(yùn)動(dòng)模糊圖像不變特征的有價(jià)值研究較為鮮見(jiàn)。
當(dāng)被攝物體與感光元件之間存在相對(duì)運(yùn)動(dòng)時(shí),在一次快門(mén)時(shí)間內(nèi),光在成像平面上的會(huì)產(chǎn)生非正常累積,造成存在運(yùn)動(dòng)模糊的圖像。在感光元件與被攝物體存在軸向旋轉(zhuǎn)運(yùn)動(dòng)的情況下,模糊路徑可視為以相機(jī)與被攝物體為軸心、一系列以軸心為圓心的同心圓。由于快門(mén)時(shí)間通常較短,且變速旋轉(zhuǎn)運(yùn)動(dòng)可分解成多個(gè)勻速旋轉(zhuǎn)運(yùn)動(dòng),因此本文著重研究旋轉(zhuǎn)中心已知并以其為原點(diǎn)構(gòu)建坐標(biāo)系且角速度為常數(shù)的勻速旋轉(zhuǎn)運(yùn)動(dòng)模糊,其連續(xù)退化模型(Gonzales和Wintz,1987)為
(1)
式中,g(x(g),y(g)) 為模糊圖像,T為曝光時(shí)間,f(x(t),y(t))為原圖像的某像素點(diǎn)在經(jīng)過(guò)t時(shí)間旋轉(zhuǎn)變換后的終點(diǎn)坐標(biāo),而旋轉(zhuǎn)角度是關(guān)于時(shí)間t的函數(shù),設(shè)為φ(t)=ωt。因?yàn)樾D(zhuǎn)運(yùn)動(dòng)模糊的形成過(guò)程中,原圖像只繞旋轉(zhuǎn)中心發(fā)生旋轉(zhuǎn)變換,因此原圖像的坐標(biāo)系與模糊圖像的坐標(biāo)系之間也構(gòu)成了旋轉(zhuǎn)變換關(guān)系,旋轉(zhuǎn)角度是常數(shù),記做α(正負(fù)兩個(gè)方向)。根據(jù)上述關(guān)系可得
(2)
(3)
結(jié)合式(2)和式(3),可得(x(t),y(t))與旋轉(zhuǎn)路徑落點(diǎn)坐標(biāo)(x(g),y(g))的關(guān)系,具體為
(4)
設(shè)θ(t)=φ(t)-α=ωt-α,可得
(5)
旋轉(zhuǎn)運(yùn)動(dòng)模糊的離散退化模型為
(6)
根據(jù)正交多項(xiàng)式理論,Teague (1980)提出Zernike 矩和Legendre 矩,將正交矩引入圖像不變特征分析領(lǐng)域,解決了幾何矩不變量天然存在的信息冗余問(wèn)題。Yang等人(2011)證明了GH矩旋轉(zhuǎn)不變量與幾何矩旋轉(zhuǎn)不變量具有相同的形式,所有已經(jīng)發(fā)現(xiàn)的幾何矩旋轉(zhuǎn)不變量都可以用于構(gòu)建GH矩旋轉(zhuǎn)不變量,并給出了構(gòu)建方法,但未考慮旋轉(zhuǎn)運(yùn)動(dòng)模糊的場(chǎng)景。本節(jié)在介紹GH矩之前,先介紹GH多項(xiàng)式。
在連續(xù)區(qū)間(∞,-∞)上,第n階的Hermite多項(xiàng)式的定義為
Hn(x)=(-1)nex2(dn/dxn)e-x2
(7)
Hermite多項(xiàng)式的遞推公式為
Hn+1(x)=2xHn(x)-2nHn-1(x),n≥1
(8)
式中,初始條件為H0(x)=1,H1(x)=2x。加入權(quán)函數(shù)w(x)=e-x2, Hermite多項(xiàng)式滿(mǎn)足正交性,即
(9)
式中,Hm(x)和Hn(x)分別為m階和n階Hermite多項(xiàng)式函數(shù),δmn為克羅內(nèi)克符號(hào),當(dāng)m=n時(shí),δmn= 1,反之為0。此時(shí)Hermite多項(xiàng)式是正交的,但不具有歸一性。正交且歸一的Hermite多項(xiàng)式的形式為
(10)
此時(shí)加入控制衰減的自定義尺度因子σ,更通用的正交且歸一的GH多項(xiàng)式定義為
(11)
以GH多項(xiàng)式為基函數(shù),在(m,n)階下的GH矩的定義為
(12)
式中,f(x,y)為圖像的強(qiáng)度函數(shù)。
基于旋轉(zhuǎn)運(yùn)動(dòng)模糊退化模型,該類(lèi)圖像的形成是對(duì)原圖像進(jìn)行一系列旋轉(zhuǎn)變換后的結(jié)果的疊加均值。本節(jié)圍繞旋轉(zhuǎn)GH矩不變量能否在旋轉(zhuǎn)運(yùn)動(dòng)模糊中保持不變性展開(kāi)討論:首先給出旋轉(zhuǎn)運(yùn)動(dòng)模糊圖像GH矩的定義,再將該GH矩帶入旋轉(zhuǎn)矩不變量中,篩選出具有穩(wěn)定的不變性的旋轉(zhuǎn)變換和旋轉(zhuǎn)運(yùn)動(dòng)模糊的GH矩不變量,即旋轉(zhuǎn)運(yùn)動(dòng)模糊GH矩不變量(RMB_GHMI),構(gòu)成一組特征向量應(yīng)用于圖像檢索和目標(biāo)識(shí)別等領(lǐng)域。
結(jié)合旋轉(zhuǎn)運(yùn)動(dòng)模糊的退化模型和GH矩的定義,模糊圖像g(x(g),y(g))的GH矩為
(13)
下面,對(duì)式(13)中的推導(dǎo)過(guò)程做幾點(diǎn)說(shuō)明:
1)根據(jù)式(5)可得
(14)
然后將式(5)和式(14)代入。
2)將雙重積分中被積函數(shù)的兩部分分別展開(kāi)為多項(xiàng)式,式中i≤p,j≤q。
3)將被積函數(shù)去括號(hào),然后按照x(t)和y(t)的階數(shù)進(jìn)行合并。
4)由式(12)中的定義,引入GH矩。
5)由于推導(dǎo)過(guò)程中說(shuō)明3)的合并使兩個(gè)組合數(shù)發(fā)生了變換,說(shuō)明2)中i≤p,j≤q的約束不再有效,因此為保證推導(dǎo)的正確性和嚴(yán)謹(jǐn)性,將結(jié)果中的組合數(shù)用新的函數(shù)改寫(xiě),并指明當(dāng)套用結(jié)果代入各參數(shù)時(shí)一旦違反新組合數(shù)i≤p,k-i≤q的約束時(shí),此項(xiàng)不符合實(shí)際意義,系數(shù)為0。
6)由說(shuō)明5)可看出旋轉(zhuǎn)運(yùn)動(dòng)模糊圖像的GH矩是由原圖像GH矩的線(xiàn)性組合構(gòu)成,定義H(p,q,k)為各項(xiàng)系數(shù)。旋轉(zhuǎn)運(yùn)動(dòng)模糊GH矩不變量的構(gòu)建過(guò)程就是消除各項(xiàng)系數(shù)的過(guò)程。
離散情況下旋轉(zhuǎn)運(yùn)動(dòng)模糊圖像的GH矩為
(15)
式(13)給出了模糊圖像GH矩與原圖像GH矩的關(guān)系式,構(gòu)建旋轉(zhuǎn)運(yùn)動(dòng)模糊矩不變量的關(guān)鍵就是尋找各項(xiàng)系數(shù)之間的關(guān)系,以消去各項(xiàng)矩中的時(shí)間參數(shù)和正弦余弦函數(shù)。
證明:由式(13)可得
(16)
根據(jù)式(16)可得系數(shù)之間的關(guān)系,即
(17)
因此
(18)
由于旋轉(zhuǎn)運(yùn)動(dòng)模糊GH矩不變量的項(xiàng)數(shù)較多且系數(shù)復(fù)雜,人工推導(dǎo)效率極低,因此本文不直接構(gòu)建不變量,而是通過(guò)編寫(xiě)Maple程序?qū)⑴袛嘈D(zhuǎn)運(yùn)動(dòng)模糊不變性的過(guò)程封裝起來(lái),以不變量為參數(shù)。具體步驟為:1)將不變量中的模糊矩按式(13)展開(kāi)為原矩的線(xiàn)性組合;2)合并同項(xiàng)系數(shù);3)簡(jiǎn)化系數(shù),以消去各項(xiàng)矩中的時(shí)間參數(shù)和正弦余弦函數(shù)為主;4)判斷簡(jiǎn)化后的各項(xiàng)原矩是否仍能構(gòu)成不變量。待測(cè)不變量為Mo和Li(2021)方法中的旋轉(zhuǎn)矩不變量經(jīng)Yang等人(2011)的方法擴(kuò)展到GH 矩的旋轉(zhuǎn)GH矩不變量。
基于上述算法,本文得到一系列具有旋轉(zhuǎn)變換和旋轉(zhuǎn)運(yùn)動(dòng)模糊不變性的GH矩不變量。為了獲得一組穩(wěn)定的旋轉(zhuǎn)運(yùn)動(dòng)模糊GH矩不變量,對(duì)同一幅圖像做不同程度的旋轉(zhuǎn)運(yùn)動(dòng)模糊,合成了10幅測(cè)試圖像,分別計(jì)算待測(cè)不變量的值,并求得其平均相對(duì)誤差。具體為
(19)
經(jīng)過(guò)對(duì)多組圖像進(jìn)行上述相同實(shí)驗(yàn)后,篩選出平均相對(duì)誤差最小的5個(gè)不變量,組成具有相當(dāng)穩(wěn)定性的旋轉(zhuǎn)運(yùn)動(dòng)模糊特征向量,記做RMB_GHMI-5。這5個(gè)不變量的具體計(jì)算為
RMB_GHMI(1)=ghm20+ghm02
RMB_GHMI(2)=ghm40+2ghm22+ghm04
RMB_GHMI(3)=
RMB_GHMI(4)=
RMB_GHMI(5)=
(20)
為了測(cè)試RMB_GHMI-5的不變性和圖像檢索性能,以MATLAB為實(shí)驗(yàn)平臺(tái)進(jìn)行實(shí)驗(yàn)與分析,運(yùn)行平臺(tái)為CPU頻率2.80 GHz、內(nèi)存16 GB的計(jì)算機(jī)。
(21)
式中,X表示清晰圖像,Y表示模糊后的圖像,xi為原圖像的RMB_GHMI-5各分量的數(shù)值,yi為模糊圖像的RMB_GHMI-5各分量的數(shù)值,n為RMB_GHMI-5的特征維數(shù)。
圖1 原始圖像和變換/退化處理后的合成圖像Fig.1 Demonstration of original images and transformed/degraded composite images((a)grayscale and crop to circle;(b)rotate 36°+rotational motion blur 10°;(c)rotate 72°+rotational motion blur 20°;(d)rotate 108°+rotational motion blur 30°;(e)rotate 144°+rotational motion blur 40°;(f)rotate 180°+rotational motion blur 50°;(g)rotate 216°+rotational motion blur 60°;(h)rotate 252°+rotational motion blur 70°;(i)rotate 288°+rotational motion blur 80°;(j)rotate 324°+rotational motion blur 90°)
表1和表2分別是Female和Airplane(F-16)經(jīng)圖1處理后RMB_GHMI-5各分量的值以及特征距離。可以看出,即使在旋轉(zhuǎn)運(yùn)動(dòng)模糊程度極大,人眼完全不可辨認(rèn)時(shí),本文給出的RMB_GHMI-5依然能保持很小的修正卡方距離,表明RMB_GHMI-5在旋轉(zhuǎn)變換和旋轉(zhuǎn)運(yùn)動(dòng)模糊疊加的情況下具有良好的穩(wěn)定性和不變性。
表1 Female經(jīng)處理后RMB_GHMI-5的值Table 1 The values of RMB_GHMI-5 for Female after transforming
表2 Airplane (F-16)經(jīng)處理后RMB_GHMI-5的值Table 2 The values of RMB_GHMI-5 for Airplane (F-16) after transforming
另外,本文嘗試挑戰(zhàn)在對(duì)稱(chēng)圖像中的檢索性能。對(duì)稱(chēng)圖像相比于一般圖像,對(duì)算法的區(qū)分性要求更高。在Butterfly Image數(shù)據(jù)集(Li等,2019)中隨機(jī)挑選30幅相似的蝴蝶圖像作為數(shù)據(jù)集B,然后按數(shù)據(jù)集A的方式,構(gòu)成測(cè)試數(shù)據(jù)集B_G、B_SP、B_P和B_S,每個(gè)數(shù)據(jù)集有300幅圖像。
選取4個(gè)同類(lèi)方法與本文方法進(jìn)行對(duì)比,分別是:Hu(1962)提出的7個(gè)幾何矩不變量、Yang等人(2011)提出的7個(gè)GH矩旋轉(zhuǎn)變換不變量、Hao等人(2021)提出的7個(gè)幾何矩旋轉(zhuǎn)模糊不變量、Yang等人(2011)與Hu(1962)組成的12維幾何矩—GH矩混合特征向量。同時(shí),將RMB_ GMHI-5與Hao等人(2021)提出的7個(gè)幾何矩旋轉(zhuǎn)模糊不變量組合起來(lái)形成的12維GH矩與幾何矩融合的特征向量參與對(duì)比實(shí)驗(yàn)。實(shí)驗(yàn)使用特征向量間修正的卡方距離作為衡量圖像相似度的依據(jù),用P-R(precision-recall)曲線(xiàn)作為觀(guān)察圖像檢索實(shí)驗(yàn)結(jié)果的工具,對(duì)比測(cè)試RMB_GHMI-5的性能。
圖2和圖3分別展示了數(shù)據(jù)集A和數(shù)據(jù)集B中的一部分。圖4—圖11分別展示了在旋轉(zhuǎn)變換和旋轉(zhuǎn)運(yùn)動(dòng)模糊后,添加高斯噪聲、椒鹽噪聲、泊松噪聲和乘性噪聲的測(cè)試數(shù)據(jù)集A_G、A_SP、A_P、A_S和B_G、B_SP、B_P、B_S的一部分。
圖2 數(shù)據(jù)集A部分示例Fig.2 Examples of dataset A
圖3 數(shù)據(jù)集B部分示例Fig.3 Examples of dataset B
圖4 添加高斯噪聲的測(cè)試數(shù)據(jù)集A_G示例Fig.4 Examples of test dataset A_G with Gaussian noise added
圖5 添加椒鹽噪聲的測(cè)試數(shù)據(jù)集A_SP示例Fig.5 Examples of test dataset A_SP with salt and pepper noise added
圖6 添加泊松噪聲的測(cè)試數(shù)據(jù)集A_P示例Fig.6 Examples of test dataset A_P with Poisson noise added
圖7 添加乘性噪聲的測(cè)試數(shù)據(jù)集A_S示例Fig.7 Examples of test dataset A_S with speckle noise added
圖8 添加高斯噪聲的測(cè)試數(shù)據(jù)集B_G示例Fig.8 Examples of test dataset B_G with Gaussian noise added
圖9 添加椒鹽噪聲的測(cè)試數(shù)據(jù)集B_SP示例Fig.9 Examples of test dataset B_SP with salt and pepper noise added
圖10 添加泊松噪聲的測(cè)試數(shù)據(jù)集B_P示例Fig.10 Examples of test dataset B_P with Poisson noise added
圖11 添加乘性噪聲的測(cè)試數(shù)據(jù)集B_S示例Fig.11 Examples of test dataset B_S with speckle noise added
圖12展示了不同測(cè)試數(shù)據(jù)集圖像檢索實(shí)驗(yàn)的P-R曲線(xiàn)。從圖12(a)—(d)可以看出,RMB_GHMI-5在樹(shù)葉圖像極嚴(yán)重的模糊和噪聲干擾下,圖像檢索方面的性能遠(yuǎn)超Hu (1962)提出的7個(gè)幾何矩不變量、Yang等人(2011)提出的7個(gè)GH矩旋轉(zhuǎn)變換不變量和Hao等人(2021)提出的7個(gè)幾何矩旋轉(zhuǎn)運(yùn)動(dòng)模糊不變量。另外,12維GH矩與幾何矩融合的特征向量檢索準(zhǔn)確度最高,這主要得益于特征向量維數(shù)的增加。從圖12(e)—(h)可以看出,RMB_GHMI-5在更復(fù)雜的對(duì)稱(chēng)圖像中的表現(xiàn)也優(yōu)于其他對(duì)比方法。在蝴蝶圖像受到極嚴(yán)重的模糊和噪聲干擾下,圖像檢索方面的性能明顯優(yōu)于同類(lèi)其他更高維特征向量。
圖12 不同數(shù)據(jù)集圖像檢索實(shí)驗(yàn)P-R曲線(xiàn)Fig.12 P-R curves of image retrieval experiments on different datasets((a)dataset A_G;(b)dataset A_SP;(c)dataset A_P;(d)dataset A_S;(e)dataset B_G;(f)dataset B_SP;(g)dataset B_P;(h)dataset B_S)
實(shí)驗(yàn)選取了兩種數(shù)據(jù)集,分別仿真其受到旋轉(zhuǎn)、旋轉(zhuǎn)運(yùn)動(dòng)模糊以及4種常見(jiàn)的圖像噪聲干擾,實(shí)驗(yàn)結(jié)果如表3所示??梢钥闯?,在80%召回率下,本文方法相較在不同數(shù)據(jù)集、不同噪聲干擾下對(duì)應(yīng)同類(lèi)性能最好的Hao等人(2021)方法,在Flavia數(shù)據(jù)集,在高斯噪聲、椒鹽噪聲、泊松噪聲和乘性噪聲干擾下,準(zhǔn)確率分別提高了25.89%、39.95%、22.79%和35.80%;在Butterfly Image數(shù)據(jù)集,在高斯噪聲、椒鹽噪聲、泊松噪聲和乘性噪聲干擾下,準(zhǔn)確率分別提高了4.79%、7.63%、5.65%和18.31%。RMB_GHMI-5的檢索準(zhǔn)確率有顯著提升。
表3 RMB_GHMI-5與Hao等人(2021)在80%召回率下準(zhǔn)確率提升結(jié)果Table 3 The result of precision rates improve by RMB_GHMI-5 comparing with Hao et al.(2021)at 80% recall rate /%
由此可見(jiàn),RMB_GHMI-5在嚴(yán)重的旋轉(zhuǎn)運(yùn)動(dòng)模糊和噪聲干擾情況下,該特征向量的區(qū)分性較早前方法有了明顯改善,證明了本文方法在存在強(qiáng)干擾情況的真實(shí)場(chǎng)景中,對(duì)旋轉(zhuǎn)運(yùn)動(dòng)模糊的圖像檢索、識(shí)別任務(wù)更具優(yōu)異性能和應(yīng)用潛力。
基于旋轉(zhuǎn)運(yùn)動(dòng)模糊退化模型與GH矩理論,本文提出了對(duì)旋轉(zhuǎn)變換和旋轉(zhuǎn)運(yùn)動(dòng)模糊保持不變的旋轉(zhuǎn)運(yùn)動(dòng)模糊GH矩不變量,并構(gòu)建了一個(gè)5維旋轉(zhuǎn)運(yùn)動(dòng)模糊不變特征向量RMB_GHMI-5。
經(jīng)過(guò)實(shí)驗(yàn)測(cè)試和對(duì)比,該特征向量對(duì)旋轉(zhuǎn)變換和旋轉(zhuǎn)運(yùn)動(dòng)模糊都具有很好的不變性和區(qū)分性,在噪聲相當(dāng)嚴(yán)重的情況下,仍能保持良好的檢索和識(shí)別性能,且相比已有同類(lèi)方法,圖像檢測(cè)準(zhǔn)確率有了顯著提升。當(dāng)模糊增大至人眼無(wú)法辨別程度,圖像內(nèi)容發(fā)生巨大改變。甚至模糊程度在通用的神經(jīng)網(wǎng)絡(luò)都無(wú)法對(duì)網(wǎng)絡(luò)進(jìn)行訓(xùn)練的情況下,RMB_GHMI-5依然保持了很好性能。因此在圖像檢索和模式識(shí)別領(lǐng)域,基于手工特征的不變量研究具有非常重要價(jià)值。
本文工作還值得繼續(xù)推進(jìn)。如何將已經(jīng)得到的不變特征與神經(jīng)網(wǎng)絡(luò)相結(jié)合,改進(jìn)網(wǎng)絡(luò)結(jié)構(gòu),實(shí)現(xiàn)更具實(shí)用性的算法突破,將是未來(lái)一段時(shí)間的研究方向。