張立紅,瞿有利
(北京交通大學(xué)計算機與信息技術(shù)學(xué)院,北京 100044)
完成印刷的紙張要制成一本書需要經(jīng)過多道工藝流程,其中圖書配帖是書籍裝訂過程中的關(guān)鍵步驟。圖書配帖是指將折頁完成的書帖按順序裝訂成冊的過程,配帖是否正確直接影響了書籍裝訂的質(zhì)量。為了便于配帖操作和檢測配帖正誤,需要在書脊的每一書帖上都印刷上一個小方塊,即書帖標(biāo)識。正常的配帖會使這些小方塊按照特定順序排列,而錯誤的配帖則會出現(xiàn)少帖、多帖、錯帖等情況,一旦發(fā)現(xiàn)書帖標(biāo)識排列不成順序,就說明出現(xiàn)了配帖故障。因此,在生產(chǎn)過程中對書脊圖像的檢測,關(guān)系到產(chǎn)品的合格率及生產(chǎn)效率。
圖1為一典型的書脊圖像。書脊圖像主要包括多個書帖標(biāo)識、多個鎖線區(qū)域和多個書帖信息區(qū)域。如紅框內(nèi)的區(qū)域表示某一鎖線區(qū)域,綠框內(nèi)的區(qū)域表示某一書帖標(biāo)識,黃框內(nèi)的區(qū)域表示某一書帖信息區(qū)域。
圖1 書脊圖像
本文主要解決的是圖書配帖檢測中書帖標(biāo)識的檢測問題。書帖標(biāo)識檢測具有以下困難:檢測目標(biāo)可用特征較少且尺寸較小;書脊圖像信噪較低;實時性檢測要求較高等。本文將書帖標(biāo)識檢測問題歸約為多小目標(biāo)檢測問題。
多小目標(biāo)檢測算法大致可分為以下四類:基于特征的方法[1-2];基于視覺對比機制的方法[3-6];基于圖像數(shù)據(jù)結(jié)構(gòu)的方法[7-9];基于背景抑制的方法[10-11]?;趯W(xué)習(xí)的方法通過手動設(shè)計目標(biāo)特征或者通過深度學(xué)習(xí)算法提取目標(biāo)特征來完成小目標(biāo)檢測。Yao等[1]將Haar特征和三個AdaBoost分類器相結(jié)合,并通過不同方向的樣本對其進(jìn)行訓(xùn)練。Zhang等[2]提出了基于區(qū)域的目標(biāo)檢測框架(DM-FPN),以解決小而密集的目標(biāo)檢測問題,該框架由多尺度潛在區(qū)域網(wǎng)絡(luò)和多尺度檢測網(wǎng)絡(luò)組成。但是基于學(xué)習(xí)的方法訓(xùn)練樣本和目標(biāo)特征,難以解決目標(biāo)特征信息較少的檢測問題,且無法滿足實時性的要求?;谝曈X對比機制的方法利用小目標(biāo)特征,通過提高目標(biāo)與背景之間的對比度差異來完成檢測。Chen等[3]提出了局部對比度測量方法(LCM)。Shi等[6]提出了一種用于紅外小目標(biāo)檢測的多尺度局部對比度測量方法(ML?CM),對LCM算法進(jìn)行改進(jìn)。但是針對大小不同的目標(biāo),基于視覺對比機制的方法會遍歷各種大小的窗口導(dǎo)致執(zhí)行效率變低?;趫D像數(shù)據(jù)結(jié)構(gòu)的方法主要利用目標(biāo)的稀疏性和背景的低秩性等的圖像結(jié)構(gòu)信息將小目標(biāo)與背景分開。Wang等[9]設(shè)計了一種穩(wěn)定的多子空間學(xué)習(xí)方法,將圖像背景看作是一種多子空間結(jié)構(gòu)?;诒尘耙种频姆椒◤膱D像背景角度出發(fā),通過抑制背景提高小目標(biāo)的可識別性。如果目標(biāo)與其鄰域背景之間存在灰度差異,則基于背景抑制的方法將會得到較好的檢測效果。田雯等[10]提出了一種多尺度Tophat變換方法,以增強目標(biāo)、抑制背景和濾除噪聲。Bae等[11]提出了一種基于雙邊濾波的目標(biāo)檢測算法。然而這些方法沒有充分考慮到圖像中目標(biāo)、背景和噪聲的特征。
本文結(jié)構(gòu)如下:第1節(jié)介紹書脊圖像特性;第2節(jié)介紹感受野機制及其數(shù)學(xué)模型;第3節(jié)介紹基于三高斯模型的多小目標(biāo)檢測方法,其中,第3.1節(jié)分析利用三高斯模型進(jìn)行多小目標(biāo)檢測的可行性;第3.2節(jié)設(shè)計了參數(shù)選擇方法;第3.3節(jié)引入補償度量因子進(jìn)行后處理;第4節(jié)進(jìn)行實驗驗證;第5節(jié)對本文內(nèi)容進(jìn)行總結(jié)。
構(gòu)成書脊圖像的各個要素的的分布和統(tǒng)計特性是設(shè)計書帖標(biāo)識檢測方法的基礎(chǔ)。為此,本文將書脊圖像分為三個要素:目標(biāo)、背景和噪聲。其中,要進(jìn)行檢測的書帖標(biāo)識為目標(biāo)。本文詳細(xì)分析了書脊圖像中目標(biāo)、背景和噪聲這三個要素的形狀特征、空間位置特征、灰度分布特征和頻率分布特征等。
以一低對比度書脊圖像為例,該圖像的二維灰度分布如圖2(a)所示。圖像內(nèi)像素灰度值大都處于中間灰度級區(qū),但是圖像灰度級分布范圍較廣。如圖2(b)所示,將書脊圖像的二維灰度分布圖映射為三維灰度分布圖。若以局部鄰域內(nèi)像素灰度值的一個峰谷波動為一個單元,可以看出,背景域中的每一個單元灰度變化平緩,且彼此之間都表現(xiàn)出強相關(guān)性。目標(biāo)域像素點灰度值分布密集,表示為峰值突出的單元,且目標(biāo)域內(nèi)像素點的出現(xiàn)會導(dǎo)致圖像局部區(qū)域像素灰度值的突然變化。噪聲呈點狀隨機分布在圖像中。
圖2 書脊圖像灰度分布
書脊圖像由目標(biāo)、背景和噪聲三個互不相關(guān)的要素組成,則可以利用以上三者灰度線性疊加的形式建立如式(1)所示的書脊圖像I(x,y)的數(shù)學(xué)模型:
式中,I(x,y)表示圖像內(nèi)一點(x,y)的灰度值,fT(x,y)表示該位置目標(biāo)的灰度值,fB(x,y)表示該位置背景的灰度值,fN(x,y)表示該位置噪聲的灰度值。
通過對書脊圖像整體特性分析,考慮結(jié)合構(gòu)成圖像的目標(biāo)、背景和噪聲的分布特性和統(tǒng)計特性,設(shè)計合適的多小目標(biāo)檢測方法完成書帖標(biāo)識檢測任務(wù)。
若目標(biāo)尺寸小于80個像素,即小于256×256的0.15%,則認(rèn)為該目標(biāo)為小目標(biāo)。因此,書脊圖像中的書帖標(biāo)識檢測問題可以歸約為多小目標(biāo)的檢測問題。
一般情況下,同一書脊圖像中,目標(biāo)為大小相近的矩形,但是由于鎖線裝訂的破壞,某些書帖標(biāo)識目標(biāo)的結(jié)構(gòu)會被破壞,使得這些目標(biāo)失去輪廓特征。書脊圖像中單個書帖標(biāo)識顯示為灰度值小于局部背景域的深色斑塊的暗小目標(biāo),成像尺寸相對較小,大小在幾個到幾十個像素之間。目標(biāo)域像素灰度級分布與背景域像素灰度級分布之間存在交集。針對上述對目標(biāo)的分析,很難將目標(biāo)檢測算法中基于目標(biāo)形狀、紋理或者灰度等特征的方法應(yīng)用到書脊圖像書帖標(biāo)識檢測中。
在正常成像光線下,書脊圖像中書帖標(biāo)識目標(biāo)與其鄰域背景呈現(xiàn)出“中間暗,四周亮”的灰度分布特征,并且與局部鄰域的灰度值沒有空間相關(guān)性。目標(biāo)域的中心能量值小于其周圍鄰域的能量值,距離目標(biāo)域中心越遠(yuǎn),能量值差異越大。目標(biāo)占據(jù)著圖像的高頻部分。但是當(dāng)成像光線較暗時,會導(dǎo)致書脊圖像對比度較低,使得目標(biāo)域的灰度分布與周圍鄰域的灰度分布相近,能量值與其周圍鄰域的能量值差異變小。
在不考慮相機遠(yuǎn)距離拍攝導(dǎo)致目標(biāo)模糊等現(xiàn)象的影響時,影響本文書帖標(biāo)識檢測的主要因素有:目標(biāo)尺寸小、目標(biāo)形狀、紋理等信息少、圖像背景干擾過多等。在書脊圖像背景中,鎖線區(qū)域與書帖信息區(qū)域的部分像素對書帖標(biāo)識檢測準(zhǔn)確率的影響最大,其次,某些書脊圖像中還會出現(xiàn)與目標(biāo)灰度更相近但尺寸更小的矩形域的干擾。因此,正確利用書脊圖像中背景和目標(biāo)的分布和統(tǒng)計信息才能更精確地將書帖標(biāo)識目標(biāo)從圖像中檢測出來。
書脊圖像中除書帖標(biāo)識以外的所有區(qū)域均為背景區(qū)域。背景區(qū)域主要有以下3個特點:①背景區(qū)域灰度級分布范圍廣,包含了圖像中的絕大部分像素灰度級,且與目標(biāo)灰度級范圍存在交集。②背景區(qū)域占據(jù)了圖像的低頻部分,可用信息較少。但在鎖線區(qū)域或者書帖信息域內(nèi)部分像素灰度值與書帖標(biāo)識目標(biāo)灰度值接近,顯示出接近目標(biāo)的高頻特性。③背景在局部區(qū)域內(nèi)灰度變化緩慢,每個局部背景域都表現(xiàn)為互相關(guān)相似的單元。但在整幅書脊圖像中,背景的灰度變化既可能是平緩的,也可能是起伏不定的。
圖3描述了書脊圖片局部背景區(qū)域的灰度直方圖??梢哉J(rèn)為局部背景區(qū)域的灰度統(tǒng)計特性近似滿足均值為u標(biāo)準(zhǔn)差為σ的高斯分布,其概率密度函數(shù)如式(2)所示。
圖3 書脊圖像局部背景區(qū)域灰度直方圖
從圖2(b)所示的書脊圖像的灰度直方圖可以看出,局部背景區(qū)域變化平緩,背景頻段主要集中在低頻段,而目標(biāo)頻段主要集中在高頻段,其灰度值在局部區(qū)域內(nèi)具有突出峰值。因此在平緩變化的低頻段背景區(qū)域內(nèi),書帖標(biāo)識目標(biāo)較容易被檢測。但是在某些背景區(qū)域內(nèi)會有部分像素灰度值與書帖標(biāo)識灰度值接近,顯示出接近目標(biāo)的高頻特性,導(dǎo)致在檢測過程中把這些像素區(qū)域當(dāng)作目標(biāo)被檢測出來,提高了檢測虛警率。此時可以根據(jù)這種背景干擾的特征設(shè)計相應(yīng)的背景濾除方案,對虛假目標(biāo)進(jìn)行剔除。
書脊圖像中的噪聲隨機分布在圖像中,大小在1個像素左右,表現(xiàn)出和目標(biāo)相似的高頻特性。噪聲在圖像中明亮區(qū)域較少而在黑暗區(qū)域較多。根據(jù)產(chǎn)生途徑,噪聲被分為以下兩類:
(1)在圖像獲取過程中。在圖像傳感器CCD采集圖像過程中,由于受到采集溫度、傳感器材料屬性、電路結(jié)構(gòu)等因素的影響,會引入各種噪聲,如電阻引起的熱噪聲、暗電流噪聲和光學(xué)噪聲等;
(2)在圖像信號傳輸過程中。由于傳輸介質(zhì)不同的抗干擾性或者記錄設(shè)備的不完善性,數(shù)字圖像在傳輸時,往往會受到各種噪聲的勿擾,導(dǎo)致信號衰減。并且在進(jìn)行目標(biāo)檢測任務(wù)的過程中,某些算法的輸入對象與預(yù)想輸入存在偏差時,也會在檢測結(jié)果中引入噪聲。
一般情況下可以將噪聲當(dāng)作平穩(wěn)隨機過程來處理,簡單地描述為加性高斯白噪聲。因此噪聲灰度分量的空間統(tǒng)計特性可用均值為0的二維高斯函數(shù)表示:
通過對書脊圖像中目標(biāo)、背景和噪聲分布特性和統(tǒng)計特性的分析,綜合考慮這三個要素的形狀特征、空間位置特征、灰度分布特征和頻率分布特征等。本文以背景抑制為基本思想,設(shè)計多小目標(biāo)檢測方法,用以抑制背景,去除雜波,實現(xiàn)目標(biāo)檢測。
本文根據(jù)書脊圖像中目標(biāo)、背景和噪聲分布特性和統(tǒng)計特性的分析,以背景抑制為基本思想,在視覺感受野機制的啟發(fā)下,首次將三高斯模型應(yīng)用到多小目標(biāo)檢測領(lǐng)域中。接下來主要介紹感受野機制及其數(shù)學(xué)模型。
2.1.1 經(jīng)典感受野機制
生物視覺感知系統(tǒng)需要經(jīng)過大量神經(jīng)元按照特定路徑將光刺激傳遞到視皮層。位于視網(wǎng)膜的光感受器接受外界光刺激后將光信號轉(zhuǎn)換成神經(jīng)電信號,再把神經(jīng)電信號以化學(xué)突觸的形式依次經(jīng)水平細(xì)胞層、雙極細(xì)胞層和無長突細(xì)胞,傳遞至視網(wǎng)膜最終段的神經(jīng)節(jié)細(xì)胞感受野。再經(jīng)過視交叉、視神經(jīng)和視束后將來自視網(wǎng)膜感受野的信息經(jīng)多個外膝體細(xì)胞感受野將信息聚集后,投射到視皮層細(xì)胞感受野。經(jīng)過上述幾個對外界光刺激的信息處理機制,完成生物視覺感知系統(tǒng)的信息處理。其中所涉及到的細(xì)胞如視網(wǎng)膜神經(jīng)節(jié)細(xì)胞、外膝體細(xì)胞和視皮層細(xì)胞的感受野就是幾個經(jīng)典感受野(classical receptive field,CRF)。
1953年Kuffler等[12]在對貓的視網(wǎng)膜神經(jīng)節(jié)細(xì)胞進(jìn)行實驗研究時,發(fā)現(xiàn)當(dāng)視網(wǎng)膜神經(jīng)節(jié)細(xì)胞在光刺激其感受野中心時,放電效應(yīng)最強;當(dāng)光刺激其感受野中心一定距離的外周時,放電效應(yīng)減弱,甚至低于其本身水平。產(chǎn)生這種現(xiàn)象的細(xì)胞的感受野被稱為“ON”型感受野,呈現(xiàn)出由中心興奮區(qū)和外周抑制區(qū)組成同心圓形狀的空間分布形式,表現(xiàn)出“中心-外周”式的拮抗作用。而另一類細(xì)胞當(dāng)其感受野中心一定距離的外周受到光刺激時,放電效應(yīng)反而會增強,產(chǎn)生這種現(xiàn)象的細(xì)胞的感受野稱為“OFF”型感受野,它由外周興奮區(qū)和中心抑制區(qū)組成同心圓形狀的空間分布。經(jīng)典感受野結(jié)構(gòu)如圖4所示。
圖4 經(jīng)典感受野結(jié)構(gòu)
2.1.2 經(jīng)典感受野數(shù)學(xué)模型
經(jīng)典感受野對光點照射的響應(yīng)作用近似于頻率帶通濾波器,抑制圖像中部分低頻信息,增強圖像對比度,壓縮圖像的信息。CRF的這些特性,可以提高圖像信息處理的運算速度和運算效率。因此,研究感受野的數(shù)學(xué)模型稱為視覺信息加工的一個重要內(nèi)容。
1965年,Rodieck等[13]提出DOG(difference of gaussian)數(shù)學(xué)模型來描述經(jīng)典感受野。DOG模型用兩個高斯函數(shù)的差來表示,如式(4)所示:
圖5 經(jīng)典感受野
DOG模型能夠有效的描述經(jīng)典感受野特性,將其應(yīng)用于圖像處理中可有效獲取圖像高頻信息,但同樣由于抑制區(qū)域的作用損失圖像低頻信息,導(dǎo)致“欠增強”現(xiàn)象。
2.2.1 非經(jīng)典感受野機制
李朝義等[14]在研究視網(wǎng)膜神經(jīng)節(jié)細(xì)胞和側(cè)膝體細(xì)胞時,發(fā)現(xiàn)在光刺激細(xì)胞感受野中心時,細(xì)胞的放電效應(yīng)很強,當(dāng)逐漸增大光照面積時,放電效應(yīng)會隨著光照面積的增大逐步增大,顯然此時光刺激的區(qū)域為細(xì)胞感受野的中心興奮區(qū)。隨著光照面積的進(jìn)一步增大,細(xì)胞的放電效應(yīng)開始變小,顯然此時刺激的區(qū)域為感受野的抑制區(qū)。但是,隨著光刺激的范圍繼續(xù)增大,細(xì)胞的放電效應(yīng)又開始增大。經(jīng)過大量實驗驗證,發(fā)現(xiàn)在經(jīng)典感受野的抑制區(qū)之外還存在一個更大范圍的區(qū)域。這個更大范圍的區(qū)域被命名為非經(jīng)典感受野(Non-classical receptive field)。
圖6 非經(jīng)典感受野結(jié)構(gòu)和感受野反應(yīng)曲線
圖7下方的同心圓結(jié)構(gòu)表示非經(jīng)典感受野,由中心興奮區(qū)、抑制區(qū)和去抑制區(qū)組成,任一細(xì)胞的輸出都取決于上述三個區(qū)域響應(yīng)的相互作用。圖3—圖5上方的感受野曲線表示非經(jīng)典感受野受到刺激的響應(yīng)情況。只刺激中心興奮區(qū)時,響應(yīng)幅值隨著刺激面積的增加而增加;當(dāng)刺激延伸到抑制區(qū)時,響應(yīng)幅值隨著刺激面積的增大而減??;當(dāng)刺激延伸到去抑制區(qū)時,響應(yīng)幅值繼續(xù)隨著刺激面積的增加而增大。
2.2.2 非經(jīng)典感受野機制數(shù)學(xué)模型
在DOG模型的基礎(chǔ)上,李朝義等[15]提出了線性三高斯函數(shù)的數(shù)學(xué)模型,增加用以表示大外周抑制區(qū)域的高斯函數(shù),三高斯模型表達(dá)式為:
圖7 三高斯函數(shù)三維圖
圖8為使用三高斯模型模擬的非經(jīng)典感受野與用DOG模型模擬的經(jīng)典感受野的比較,從中可以看出,抑制區(qū)域的抑制作用明顯受到了去抑制區(qū)的作用而減弱。經(jīng)典感受野模型對目標(biāo)邊緣鄰域內(nèi)出現(xiàn)的不連續(xù)灰度值敏感,但是非經(jīng)典感受野模型通過去抑制區(qū)的去抑制作用實現(xiàn)了灰度梯度的緩慢變化,補償了因抑制區(qū)的抑制作用丟失的部分低頻信息,有效地避免了“欠增強”現(xiàn)象。
圖8 DOG模型與三高斯模型的比較
在非經(jīng)典感受野機制的啟發(fā)性,本文提出基于三高斯模型的多小目標(biāo)檢測方法。本文以書脊圖像作為刺激輸入,通過非經(jīng)典感受野中的三高斯模型對圖像進(jìn)行濾波處理。
本文根據(jù)書脊圖像中目標(biāo)、背景和噪聲的分布特性和統(tǒng)計特性,在非經(jīng)典感受野機制的啟發(fā)下,提出一種基于三高斯模型的多小目標(biāo)檢測方法。首先分析了利用該模型完成書脊圖像中書帖標(biāo)識目標(biāo)檢測的可行性;然后根據(jù)圖像中各個要素的分布特性和統(tǒng)計特性構(gòu)建了針對三高斯模型的參數(shù)選擇方法;最后引入補償度量因子進(jìn)行后處理操作?;谌咚鼓P偷亩嘈∧繕?biāo)檢測方法具體流程如圖9所示。
圖9 基于三高斯模型的多小目標(biāo)檢測方法流程
本文采用非經(jīng)典感受野的三高斯模型作為書脊圖像背景抑制的濾波器,并通過三高斯模型的濾波特性解釋利用該模型實現(xiàn)多小目標(biāo)檢測的可行性。
三高斯模型利用描述興奮作用、抑制作用和去抑制作用的分布函數(shù)來描述細(xì)胞對于光刺激的響應(yīng)程度,并以此計算非經(jīng)典感受野的總通光量。對于一幅書脊圖像,該過程可表示為如式(6)所示的卷積形式:
由于線性卷積運算具有可分離性,則式(6)可被分解為:
式(7)表明,利用三高斯模型對圖像進(jìn)行卷積的濾波過程可被分解為興奮強度和抑制強度之差。對于任一高斯函數(shù),濾波器的半徑取決于標(biāo)準(zhǔn)差σ。σ越大該函數(shù)越平坦,能量會越分散;σ越小該函數(shù)越陡峭,能量則會越集中。由于書脊圖像由目標(biāo)、背景和噪聲三個互不相關(guān)的要素組成,則對于高而陡且能量較集中的高斯函數(shù)G1(m,n)和低而寬且能量分布較分散的高斯函數(shù)G3(m,n),如果σ1和σ3小于目標(biāo)尺寸且σ3大于干擾或噪聲的尺寸,則該濾波過程可以起到濾除背景干擾和噪聲且增強目標(biāo)與背景對比度的作用;若σ2大于目標(biāo)尺寸,則該濾波過程可以起到平滑高頻目標(biāo),獲得變化緩慢的低頻背景的作用。因此,在理想情況下,式(6)可以轉(zhuǎn)化為式(8)。
由式(8)可以看出,利用三高斯模型對書脊圖像進(jìn)行卷積操作的可以被表示為從原圖中減去背景和噪聲的灰度分量,得到介于兩者之間的目標(biāo)分量。該過程原理與基于背景抑制的目標(biāo)檢測方法原理相同,本質(zhì)上為可以理解為能夠增強目標(biāo)、抑制背景和濾除噪聲的高通濾波器。
進(jìn)一步地,如圖10所示,三高斯模型函數(shù)值隨著與非經(jīng)典感受野中心距離的增加而減小。但是其導(dǎo)函數(shù)在中心興奮區(qū)以內(nèi),導(dǎo)數(shù)值即衰減速率增大隨著與非經(jīng)典感受野中心距離的增加而增大;在中心興奮區(qū)以外,導(dǎo)數(shù)值即衰減速率增大隨著與非經(jīng)典感受野中心距離的增加而減小。這種特性能夠增強非經(jīng)典感受野各個區(qū)域刺激強度的反差,使得圖像在灰度突變處灰度反差更加明顯。
圖10 三高斯函數(shù)及其導(dǎo)數(shù)曲線
本文利用書脊圖像目標(biāo)、背景和噪聲分布特性的先驗知識,構(gòu)建三高斯模型的參數(shù)選擇方法。
三高斯模型的函數(shù)表達(dá)式如式(9)所示:
式中,TG(x)表示感受野內(nèi)某點x的興奮響應(yīng);σ1,σ2和σ3分別表示非經(jīng)典感受野的中心興奮區(qū)、抑制區(qū)和去抑制區(qū)的半徑大?。籄1,A2和A3分別表示非經(jīng)典感受野中中心區(qū)域的興奮程度、抑制區(qū)域的抑制程度和去抑制區(qū)域的去抑制程度。通過計算感受野內(nèi)每一點的興奮響應(yīng)進(jìn)而得到整個細(xì)胞的響應(yīng)程度。
3.2.1 區(qū)域半徑σ1,σ2和σ3的選擇
在書脊圖像中,鎖線區(qū)域或者書帖信息區(qū)域內(nèi)由于部分像素灰度值與目標(biāo)灰度值接近而產(chǎn)生的背景干擾半徑通常不超過2個像素,且隨機噪聲的半徑通常在1個像素左右,基于該先驗知識,取σ1=1,σ3=2。進(jìn)一步地,根據(jù)李朝義等人的研究,σ1,σ2和σ3應(yīng)該滿足如式(10)所示的約束關(guān)系:
根據(jù)大量實驗驗證,本文取σ1=1,σ2=,σ3=2。
3.2.2 濾波模板ω的選擇
利用三高斯模型,非經(jīng)典感受野在積分區(qū)間為[ -∞,+∞]的響應(yīng)程度為中心興奮區(qū)的興奮程度,抑制區(qū)的抑制程度和去抑制區(qū)的去抑制程度之和,計算方式如式(11)所示:
在實際濾波操作中,為防止卷積模板過大,一般會將積分區(qū)間限制在均值附近區(qū)域[-ω,+ω],則式(11)可寫為:
由于不能用初等函數(shù)并表示式(12)所示的積分,但是本文根據(jù)標(biāo)準(zhǔn)正態(tài)分布表獲得高斯函數(shù)Gi(x)在區(qū)間[-ω,+ω]內(nèi)的能量Pi,則式(12)可表示為:
均值為μi,標(biāo)準(zhǔn)差為σi的高斯函數(shù)Gi(x)在積分區(qū)間[-σi,+σi],[-1.5σi,+1.5σi],[-2σi,+2σi]和[-3σi,+3σi]的 能 量Pi分 別 達(dá) 到 了68.28%、86.64%、95.44%和99.74%,即積分區(qū)間取均值μi附近1.5~3倍的標(biāo)準(zhǔn)差σi時,就可以達(dá)到85%以上的逼近程度。因此我們?nèi)V波模板半徑為ω=1.5σ3=3,大小為7×7。
3.2.3 敏感度A1,A2和A3的選擇
在非經(jīng)典感受野中,中心興奮區(qū)的區(qū)域半徑較小但是其響應(yīng)程度較強,去抑制區(qū)的半徑較大但是該區(qū)域響應(yīng)程度較弱。為了能夠突出目標(biāo),平滑緩慢變化的背景,本文通過增大興奮作用減小抑制作用來突出高頻目標(biāo),平滑緩慢變化的背景。進(jìn)一步地,為了保持能量分布的穩(wěn)定性,有效避免“過增強”現(xiàn)象或者“欠增強”現(xiàn)象,本文使總的響應(yīng)程度數(shù)值維持在1左右。根據(jù)以上分析,對敏感度A1,A2和A3建立如式(14)所示的約束關(guān)系:
根據(jù)大量實驗驗證,本文取A2=0.4886A1,A3=0.5A1,此時需要自適應(yīng)求解的模型參數(shù)只有敏感度A1。A1的取值應(yīng)該限定在合理的范圍內(nèi),防止當(dāng)A1取值過大時,會導(dǎo)致背景抑制能力過強而犧牲有效目標(biāo),表現(xiàn)出“過增強”現(xiàn)象;當(dāng)A1取值過小時,會導(dǎo)致背景抑制能力變?nèi)醵嬖诒尘靶孤叮憩F(xiàn)出“欠增強”現(xiàn)象。
研究發(fā)現(xiàn)非經(jīng)典感受野中的中心興奮區(qū)、抑制區(qū)和去抑制區(qū)三塊區(qū)域會根據(jù)輸入刺激處于一種動態(tài)的變化中。為了動態(tài)地模擬非經(jīng)典感受野各個區(qū)域的敏感度隨著輸入刺激的變化,考慮到經(jīng)過濾波后的輸出圖像中目標(biāo)具有最大灰度值,定義A1為理想目標(biāo)灰度值與輸入圖像最大灰度值之比,即
書脊圖像在經(jīng)過基于三高斯模型的濾波操作之后,目標(biāo)邊緣會被模糊,且書帖連接處產(chǎn)生的局部暗區(qū)會被該濾波過程增強。為此,本文引入補償度量因子進(jìn)行后處理操作,以改進(jìn)基于三高斯模型的多小目標(biāo)檢測方法,使得目標(biāo)邊緣得到增強并平滑背景暗區(qū)。
在一幅圖像中,邊緣點處于灰度突變處且具有較強的方向性。若將以某點為中心的鄰域分為兩個子鄰域,則位于邊緣點兩側(cè)的子鄰域灰度差較大,而位于非邊緣點兩側(cè)的子鄰域灰度分布較為均勻。針對某一點四對子鄰域像素點灰度值的分布情況,設(shè)計補償度量因子。以5×5模板為例,將圖像內(nèi)一點p(x,y)的鄰域分別在0°、45°,90°和135°四個方向分成兩個大小相同的部分,即四對子鄰域,如圖11所示。
圖11 四對子鄰域
補償度量因子的計算步驟如下:
(1)分別計算點p(x,y)在0°、45°、90°和135°四個方向上的每對子鄰域的灰度差值Δed;
式中,μd1和μd2分別表示兩個子鄰域的像素灰度均值。
(2)記Δe(m,n)=maxdΔed,
設(shè)Δemax=maxΔe(m,n);
(3)計算點p(x,y)的補償度量因子:
補償度量因子E(m,n)越大,其為邊緣點的可能性越大;E(m,n)越小,其屬于背景平滑區(qū)的可能性越大。引入補償度量因子的后處理操作如式(18)所示:
式中,F(xiàn)'(m,n)=255-F(m,n),F(xiàn)(m,n)表示原圖I(m,n)經(jīng)過三高斯模型濾波操作后的輸出圖像,O(m,n)表示最后輸出圖像。
為了全面評估本文方法的有效性和可行性,本文選取了3個小目標(biāo)檢測方法和本文方法進(jìn)行對比,分別為:基于視覺對比機制的MLCM算法[6]、基于背景抑制的多尺度Top-hat算法[10]和DOG模型。在圖片選取方面,本文選擇3類典型書脊圖像,分別為:大小為1161×126的光照不均勻圖像、大小為850×271的低對比度圖像、大小為916×114的噪聲圖像。在算法評價指標(biāo)方面,本文采用信雜比率增益(SCRG)和背景抑制因子(BFS)兩個指標(biāo)對算法性能進(jìn)行評估。
SCRG用于評估算法的目標(biāo)增強性能,如式(19)所示,
式中,SCRout和SCRin分別表示輸入圖像和輸出圖像的SCR值。SCR用于衡量目標(biāo)檢測難度以及目標(biāo)顯著性,目標(biāo)的SCR值越高,越容易被檢測到。SCRG值越高,表示目標(biāo)檢測的性能越好。
BFS用于評估算法背景抑制的能力,如式(21)所示,
式中,σin和σout分別表示輸入圖像以及輸出圖像的灰度標(biāo)準(zhǔn)差。如果BFS>0,表示背景加??;如果BFS<0,表示背景減緩。且 ||BFS越大,表示背景抑制的能力越好。表1給出了三類書脊圖像下經(jīng)過4種小目標(biāo)檢測算法處理后的BFS值和SCRG值。
由表1結(jié)果可知,基于視覺對比機制的ML?CM算法無法對書脊圖像進(jìn)行背景抑制和書帖標(biāo)識目標(biāo)檢測;基于背景抑制的多尺度Top-hat算法和DOG算法無法抑制光線較弱時圖像中出現(xiàn)的背景雜波;本文方法的BFS值恒小于0,SCRF值也有提高,表示本文方法的目標(biāo)增強能力和背景抑制能力都明顯優(yōu)于其他算法。
表1 三類書脊圖像下的BFS和SCRG
圖12、圖13和圖14分別給出了用MLCM算法、Multiscale Top-hat transform算法、DOG模型和本文提出的三高斯模型進(jìn)行小目標(biāo)檢測的結(jié)果圖。并且,引入三維灰度圖用來更直觀地顯示實驗效果。
圖12 光照不均勻圖像檢測效果
圖13 低對比度圖像檢測效果
圖14 噪聲圖像檢測效果
在非經(jīng)典感受野機制的啟發(fā)下,根據(jù)書脊圖像中背景,目標(biāo)和噪聲的分布特性和統(tǒng)計特性,本文提出了基于三高斯模型的多小目標(biāo)檢測方法。該方法充分利用了目標(biāo)與其相鄰背景之間的差異來完成背景抑制和對書脊圖像中的書帖標(biāo)識目標(biāo)的檢測。三高斯模型本質(zhì)上是一個高通濾波器,它允許高頻目標(biāo)信號通過并衰減低頻背景信號。實驗結(jié)果表明,與提出的MLCM、多尺度Top-hat變換和DOG模型相比,該方法具有更好的背景抑制效果和更好的目標(biāo)檢測性能。