閆 超,張建州,姜正茂(. 四川大學(xué)計(jì)算機(jī)學(xué)院 成都 60065;. 成都國(guó)翼電子技術(shù)有限公司 成都 60045)
?
基于外區(qū)抑制與馬爾可夫模型的輪廓檢測(cè)
閆 超1,張建州1,姜正茂2
(1. 四川大學(xué)計(jì)算機(jī)學(xué)院 成都 610065;2. 成都國(guó)翼電子技術(shù)有限公司 成都 610045)
【摘要】輪廓檢測(cè)是目標(biāo)識(shí)別的重要前提,為解決復(fù)雜紋理自然場(chǎng)景下目標(biāo)輪廓難以有效檢測(cè)的問題,該文提出一種新的計(jì)算方法。首先,利用旋轉(zhuǎn)不變?yōu)V波器快速實(shí)現(xiàn)外區(qū)抑制;其次,通過(guò)集合運(yùn)算整合不同抑制水平的抑制后響應(yīng),得到邊緣圖;最后,建立基于馬爾可夫隨機(jī)場(chǎng)的輪廓概率模型,賦予每個(gè)邊緣點(diǎn)一個(gè)概率值,選擇概率較高的邊緣點(diǎn)即得到最終的輪廓輸出。定性和定量分析表明,相對(duì)于現(xiàn)有算法,新算法的輪廓檢測(cè)性能顯著提升,并具有更好的魯棒性。
關(guān) 鍵 詞輪廓檢測(cè); 輪廓概率; 馬爾可夫隨機(jī)場(chǎng); 旋轉(zhuǎn)不變?yōu)V波器; 外區(qū)抑制
Contour Detection Based on Surround Inhibition and Markov Model
YAN Chao1, ZHANG Jian-zhou1, and JIANG Zheng-mao2
(1. College of Computer Science, Sichuan University Chengdu 610065; 2. Chengdu Goldwin Electronics Technology Co. LTD Chengdu 610045)
Abstract Contour detection plays an important role in object recognition. In order to detect effectively the target contour with complex textures in natural scenes, a new method of contour detection is proposed in this paper. In the algorithm, the surround inhibition is realized fastly by steerable filters; the multi-inhibited responses are integrated to form an edge map under the rules of set operations, and finally, according to the theory of Markov random field, a model of contour probability is presented to give each edge point a probability and form the output of contour by thresholding the probability map. Qualitative and quantitative analysis shows that the proposed method increases the performance signifacantly and get a better result of robustness, compared with existing methods.
Key words contour detection; contour probability; markov random field; steerable filters; surround suppression
輪廓檢測(cè)廣泛應(yīng)用于機(jī)器視覺相關(guān)的任務(wù)中,諸如目標(biāo)識(shí)別、形狀分析等[1-2]。鑒于此,人們已經(jīng)提出了大量的輪廓檢測(cè)算法。部分算法是基于灰度差分的[3],還有一部分則是基于機(jī)器學(xué)習(xí)[4]、模糊推理[5]和活動(dòng)輪廓[6]的。盡管如此,輪廓檢測(cè)仍然面臨著眾多困難,遠(yuǎn)未得到徹底的解決。
生理學(xué)研究[7]證實(shí),人類視覺系統(tǒng)存在著外區(qū)抑制特性,它可以減弱視神經(jīng)元對(duì)紋理性邊緣的響應(yīng),但對(duì)獨(dú)立的輪廓不起作用。文獻(xiàn)[7]首次提出了基于外區(qū)抑制特性的仿生輪廓檢測(cè)方法,其主要思想是利用兩個(gè)不同尺度的高斯函數(shù)作差分得到抑制濾波器,然后對(duì)梯度幅值作卷積,再由梯度幅值減去卷積結(jié)果即獲得輪廓顯著圖。由于上述算法存在自抑制現(xiàn)象,不能很好地保護(hù)弱輪廓。文獻(xiàn)[8-10]提出一系列的改進(jìn)措施,取得了明顯的效果,但計(jì)算復(fù)雜度卻呈指數(shù)級(jí)增長(zhǎng)。
為滿足實(shí)時(shí)性要求,文獻(xiàn)[11]引入Hermite-Gauss函數(shù),并給出一種統(tǒng)一的閉型分解框架[12],用于實(shí)現(xiàn)不同階數(shù)的旋轉(zhuǎn)不變?yōu)V波器(steerable filters)。具體而言,旋轉(zhuǎn)不變?yōu)V波器是一組固定基函數(shù)的線性組合,角度信息分離到組合系數(shù)中。因此,選擇一組旋轉(zhuǎn)不變?yōu)V波器作為外區(qū)抑制核函數(shù)時(shí),只需要少數(shù)幾個(gè)低階基函數(shù)對(duì)圖像作卷積,即可得到任意角度的外區(qū)抑制量,不僅避免了自抑制現(xiàn)象,且計(jì)算復(fù)雜度大大降低。不過(guò),該算法還存在如下缺陷:1) 組合方法過(guò)于簡(jiǎn)單,導(dǎo)致紋理性邊緣去除的不徹底,且造成部分輪廓的丟失;2) 弱輪廓保護(hù)機(jī)制不健全,由于弱輪廓長(zhǎng)度很短,接近于噪聲邊緣的長(zhǎng)度,所以根據(jù)長(zhǎng)度判斷噪聲邊緣,也會(huì)誤判弱輪廓。
針對(duì)上述缺陷,本文提出基于集合運(yùn)算的組合方式,用于整合不同抑制水平的邊緣響應(yīng);同時(shí),根據(jù)馬爾可夫隨機(jī)場(chǎng)理論建立圖像的輪廓概率模型,用于去除噪聲邊緣和保護(hù)弱輪廓。
1.1 高斯梯度與外區(qū)抑制
令I(lǐng)( x , y )表示一幅灰度圖像,其高斯梯度定義為:
外區(qū)抑制需要用到一組不同方向的濾波器,其生成函數(shù)定義為:
式中,θ表示梯度方向。
如圖1所示,點(diǎn)A嵌入在紋理邊緣中,其外區(qū)抑制量大于零,經(jīng)過(guò)抑制后點(diǎn)A就會(huì)消失;而點(diǎn)B位于孤立邊緣上,其外區(qū)抑制量等于零,經(jīng)過(guò)抑制后點(diǎn)B保持不變。因此,外區(qū)抑制可以抑制紋理性邊緣,進(jìn)而保護(hù)孤立的目標(biāo)輪廓。
為抑制紋理性邊緣,可將梯度幅值減去抑制量,得到抑制后響應(yīng):
式中,λ稱為抑制水平。由于紋理性邊緣對(duì)應(yīng)的抑制量一般較大,而輪廓對(duì)應(yīng)的抑制量一般較小,因此,從響應(yīng)中提取目標(biāo)輪廓將變得較為容易。
圖1 紋理點(diǎn)和孤立點(diǎn)的外區(qū)抑制
1.2 非極大值抑制與遲滯閾值
式中,Card表示求取集合中非零元素的個(gè)數(shù);M表示響應(yīng)點(diǎn)總數(shù)。式(7)表明強(qiáng)輪廓像素至少包含前pM個(gè)最大響應(yīng)點(diǎn)。取,響應(yīng)中小于lT的點(diǎn)被看作是噪聲點(diǎn)予以舍棄。位于兩個(gè)閾值之間的弱輪廓點(diǎn),如果能夠連接到強(qiáng)輪廓上則予以保留;否則舍棄。
由式(6)可知,當(dāng)抑制水平λ取值較小時(shí),可以較好的保護(hù)目標(biāo)輪廓,但不能充分的抑制紋理性邊緣;相反,當(dāng)抑制水平取值較大時(shí),雖然能夠充分的抑制紋理性邊緣,但目標(biāo)輪廓也會(huì)有所丟失(自然場(chǎng)景下輪廓抑制量雖然很小,但并不等于零)。為解決上述問題,同時(shí)進(jìn)一步提高輪廓檢測(cè)性能,本文提出一種新的仿生輪廓檢測(cè)算法。
2.1 算法框架
仿生輪廓檢測(cè)算法流程圖如圖2所示。首先,計(jì)算圖像I( x , y )的高斯梯度,并利用式(3)得到外區(qū)抑制量,通過(guò)不同抑制水平后作用于梯度幅值上,獲得抑制后響應(yīng);接著,對(duì)各級(jí)響應(yīng)分別進(jìn)行后處理操作,得到邊緣集合;然后,計(jì)算所有邊緣集合的交集和并集,并以交集作為種子點(diǎn)在并集中選擇強(qiáng)邊緣;最后,根據(jù)馬爾可夫隨機(jī)場(chǎng)理論建立輪廓概率圖,二值化概率圖即得到最終的輪廓輸出。
圖2 仿生輪廓檢測(cè)算法流程圖
2.2 基于集合運(yùn)算的多水平組合方法
圖3顯示的是不同抑制水平kλ作用下的二值圖像顯然,隨著kλ取值的逐漸變大,輪廓點(diǎn)和噪聲點(diǎn)都會(huì)有所減少,但噪聲點(diǎn)的減少速度大于輪廓點(diǎn)的減少速度。對(duì)于圖像點(diǎn)(x , y ),它在所有中出現(xiàn)的次數(shù)決定了它屬于強(qiáng)邊緣的程度。一般來(lái)說(shuō),孤立點(diǎn)或者輪廓點(diǎn)出現(xiàn)的次數(shù)要多于噪聲點(diǎn)出現(xiàn)的次數(shù)。因此,可將強(qiáng)邊緣和弱邊緣分別定義為的交集和并集:
式中,交集Bp, i表示在所有中都出現(xiàn)的圖像點(diǎn)集合;并集Bp, u表示在中至少出現(xiàn)一次的圖像點(diǎn)集合。
圖3 不同 λk取值下的?
集合運(yùn)算結(jié)果如圖4所示,交集包含有大量不連續(xù)的輪廓片段,而并集則同時(shí)包含有完整的輪廓和噪聲邊緣。為篩選出完整的輪廓并排除噪聲邊緣,本文以交集作為種子輪廓,然后遍歷并集中所有的弱邊緣Eu,如弱邊緣Eu與種子輪廓有部分像素點(diǎn)發(fā)生重疊,則將弱邊緣Eu加入到組合結(jié)果b( p , c )中,有:
組合結(jié)果b( p , c )去除了大部分噪聲邊緣,同時(shí)保留了較為完整的輪廓,如圖4c所示。
圖4 集合運(yùn)算結(jié)果
2.3 基于馬爾可夫隨機(jī)場(chǎng)的輪廓概率模型
組合結(jié)果b( p , c )中還存在著一些噪聲邊緣,需要進(jìn)一步的排除,如圖5所示,其中e1是噪聲邊緣,而e2是輪廓片段,它們長(zhǎng)度一致,但位置不同。如果直接去除長(zhǎng)度較短的邊緣,那么e1和e2都會(huì)被排除,這不是人們所希望的。為保留e2,去除e1,本文提出一種基于馬爾可夫隨機(jī)場(chǎng)的輪廓判斷機(jī)制。馬爾可夫隨機(jī)場(chǎng)描述了圖像中像素點(diǎn)之間的空間相關(guān)性,設(shè)是一隨機(jī)場(chǎng),N =是其鄰域系,若滿足[14]:
則稱X是關(guān)于N的馬爾可夫隨機(jī)場(chǎng)。式(12)表明隨機(jī)變量Xi, j的條件概率分布只取決于它的鄰域系統(tǒng)。將圖像看作馬爾可夫隨機(jī)場(chǎng),建立圖像概率模型,則圖像中任一像素點(diǎn)的概率(屬于輪廓的可能性)都可以通過(guò)該點(diǎn)的鄰域來(lái)進(jìn)行計(jì)算。具體而言,對(duì)于b( p , c )中每條輪廓e,其輪廓概率定義為:
式中,emax表示b( p , c )中的最長(zhǎng)輪廓;length(*)表示求取輪廓長(zhǎng)度。有了輪廓概率,則輪廓點(diǎn)概率可定義為:
其中,
圖5 偽輪廓排除示意圖
實(shí)驗(yàn)平臺(tái)為CPU E6600,2 G內(nèi)存,Windows7 SP1操作系統(tǒng),Matlab2013a仿真軟件。實(shí)驗(yàn)圖像采用標(biāo)準(zhǔn)測(cè)試庫(kù)共40幅自然圖像(帶有真實(shí)輪廓)。為保證實(shí)驗(yàn)結(jié)果對(duì)比的公平性,各算法的通用參數(shù)將采用相同的取值,其他參數(shù)則使用相關(guān)文獻(xiàn)給出的標(biāo)準(zhǔn)值,具體設(shè)置如下:
3.1 實(shí)驗(yàn)結(jié)果
圖6是各算法的輪廓檢測(cè)結(jié)果。
圖6 各算法的輪廓檢測(cè)結(jié)果
圖6中第1行圖像由大象輪廓、山脈脊線和草木紋理組成,用于測(cè)試算法對(duì)一般性輪廓和紋理的感知能力;第2行圖像中人造提籃具有很強(qiáng)的規(guī)則性紋理,而自然紋理則呈現(xiàn)出較強(qiáng)的隨機(jī)性分布,用于測(cè)試算法對(duì)不同紋理分布的鑒別能力;第3行圖像是一群擁有花斑紋理的袋狼,它們完全嵌入在草原紋理中,用于驗(yàn)證算法對(duì)動(dòng)物自身紋理的抑制能力;第4行圖像包含汽車前輪和人造路面,輪胎紋理和路面紋理都可看作是噪聲紋理,可用于驗(yàn)證算法的降噪能力。
Canny算子[13]的檢測(cè)結(jié)果如圖6b所示,由于沒有考慮空間點(diǎn)之間的互相作用,導(dǎo)致其無(wú)法分離出目標(biāo)輪廓和紋理性邊緣;DOG算子[7]的檢測(cè)結(jié)果如圖6c所示,由于其濾波器呈圓環(huán)型結(jié)構(gòu),會(huì)產(chǎn)生自抑制現(xiàn)象,因此,DOG算子的理論意義大于實(shí)際應(yīng)用;圖6d為文獻(xiàn)[11](簡(jiǎn)稱SF算法)的檢測(cè)結(jié)果,由于引入了旋轉(zhuǎn)不變?yōu)V波器,成功避免了自抑制現(xiàn)象,在抑制紋理和保護(hù)輪廓方面取得了一定的成效,但該算法的組合方法缺乏理論支撐,且沒有對(duì)殘留的噪聲邊緣作處理,所以還有一定的改進(jìn)空間;圖6e為本文算法的檢測(cè)結(jié)果,該文算法在抑制紋理、保護(hù)弱輪廓以及去除噪聲等方面都明顯優(yōu)于其他算法。
3.2 參數(shù)魯棒性分析
為便于定量分析,定義輪廓檢測(cè)性能[11]為:
其中:
式中,DC表示算法檢測(cè)到的輪廓點(diǎn)集;GT表示真實(shí)輪廓點(diǎn)集;Card函數(shù)用于計(jì)算集合點(diǎn)數(shù);dGT( x )表示輪廓點(diǎn)x到GT的最小歐式距離;d0用于平衡DC 和GT之間的差異(取值為2)。式(17)將F的取值限定于(0,1]區(qū)間上,F(xiàn)反映了算法檢測(cè)出來(lái)的輪廓和真實(shí)輪廓之間的接近程度,其取值越大,則算法的輪廓檢測(cè)性能就越好。算法性能采用40幅圖像的平均輪廓檢測(cè)性能來(lái)衡量。
算法中最為重要的兩個(gè)參數(shù)分別是尺度σ和分位數(shù)p。σ決定著抑制濾波器的大小,其值越大,抑制程度也就越強(qiáng)。而p決定了邊緣點(diǎn)保留的數(shù)量,其值越大,則最終輪廓點(diǎn)數(shù)量也會(huì)增大。
當(dāng)σ保持不變,p發(fā)生變化時(shí),各算法的平均檢測(cè)性能如圖7所示。當(dāng)p取值趨于零時(shí),輸出的輪廓點(diǎn)(即DC)數(shù)量也會(huì)減少,由式(11)可知,F(xiàn)也會(huì)跟著變?。划?dāng)p逐漸變大時(shí),輪廓點(diǎn)集DC亦隨之增加,則輪廓檢測(cè)性能也會(huì)變大;當(dāng)p過(guò)大時(shí),輪廓點(diǎn)集會(huì)包含有大量的紋理性邊緣,故輪廓檢測(cè)性能呈現(xiàn)出下降趨勢(shì)。從圖7可知,多數(shù)情況下,本文算法的輪廓檢測(cè)性能都明顯優(yōu)于其他3種算法。由于p接近零時(shí),大部分弱輪廓被舍棄,而強(qiáng)輪廓在各個(gè)算法中都會(huì)被保留,因此,本文算法的輪廓檢測(cè)性能略有下降。但在實(shí)際應(yīng)用中,分位數(shù)p的這種極端取值情況一般不予考慮。
圖7 分位數(shù)p對(duì)檢測(cè)性能的影響
圖8 尺度σ對(duì)檢測(cè)性能的影響
當(dāng)p保持不變,σ發(fā)生變化時(shí),各算法的平均檢測(cè)性能如圖8所示,當(dāng)σ取值較小時(shí),外區(qū)抑制濾波器尺寸會(huì)變得很小,以至于無(wú)法有效抑制紋理性邊緣,所以仿生輪廓檢測(cè)算法的性能都呈現(xiàn)出快速下降的趨勢(shì);當(dāng)σ>1時(shí),抑制濾波器開始發(fā)揮作用,算法的輪廓檢測(cè)性能亦隨之上升。若σ取值過(guò)大,則抑制濾波器的尺寸也變大,會(huì)導(dǎo)致過(guò)高的時(shí)間復(fù)雜度,而性能F卻提升不明顯,因此σ的取值不宜過(guò)大。由圖8可知,正常情況下,本文算法檢測(cè)性能都高于其他3種算法。
綜上所述,本文算法在輪廓檢測(cè)性能方面得到了明顯的提升,同時(shí)對(duì)參數(shù)也具有良好的適應(yīng)性。
外區(qū)抑制現(xiàn)象是生物視覺系統(tǒng)的基本特性之一,利用這種特性可以實(shí)現(xiàn)紋理抑制和輪廓提取。相對(duì)于現(xiàn)有算法,本文提出的組合方法和輪廓概率模型很好地解決了強(qiáng)紋理去除和弱輪廓保護(hù)之間的矛盾。隨后,大量的定性分析和定量分析都證實(shí)了本文算法的有效性。然而,生物視覺系統(tǒng)是極其復(fù)雜的,除了利用灰度梯度信息之外,還能夠整合顏色信息與形狀信息等,如何更好地模擬生物視覺系統(tǒng)將是下一步的研究方向。
參 考 文 獻(xiàn)
[1] LEORDEANU M, SUKTHANKAR R, SMINCHISESCU C. Generalized boundaries from multiple image interpretations [J]. Pattern Analysis and Machine, 2014, 36(7): 1312-1324.
[2] LUI L M, ZENG Wei, YAU S T, et al. Shape analysis of planar multiply-connected objects using conformal welding[J]. Pattern Analysis and Machine, 2014, 36(7): 1384-1401.
[3] LIM D H, JANG S J. Comparison of two-sample tests for edge detection in noisy images[J]. Journal of the Royal Statistical Society, 2002, 51(1): 21-30.
[4] MARTIN D R, FOWLKES C, MALIK J. Learning to detect natural image boundaries using local brightness, color, and texture cues[J]. Pattern Analysis and Machine Intelligence, 2004, 26(5): 530-549.
[5] 沈志熙, 代東林, 趙凱. 基于多特征分步模糊推理的邊緣檢測(cè)算法[J]. 電子科技大學(xué)學(xué)報(bào), 2014, 43(3): 381-387. SHEN Zhi-xi, DAI Dong-lin, ZHAO Kai. Edge detection based on multi-features and step-by-step fuzzy inference[J]. Journal of University of Electronic Science and Technology of China , 2014, 43(3): 381-387.
[6] LI H, YEZZI A J. Local or global minima: Flexible dualfront active contours[J]. Pattern Analysis and Machine Intelligence, 2007, 29(1): 1-14.
[7] GRIGORESCU C, PETKOV N, WESTENBERG M A. Contour detection based on nonclassical receptive field inhibition[J]. Image Processing, 2003, 12(7): 729-739.
[8] PAPARI G, CAMPISI P, PETKOV N, et al. A biologically motivated multiresolution approach to contour detection[J]. Journal on Advances in Signal Processing, 2007(1), doi: 10.1155/2007/71828.
[9] PAPARI G, CAMPISI P, PETKOV N. Contour detection by multiresolution surround inhibition[C]//IEEE International Conference on Image Processing. Atlanta GA, USA: IEEE, 2006: 749-752.
[10] 閆超, 張建州. 多水平外區(qū)抑制的輪廓檢測(cè)[J]. 中國(guó)圖象圖形學(xué)報(bào), 2012, 17(6): 664-670. YAN Chao, ZHANG Jian-zhou. Contour detection based on multilevel inhibition[J]. Journal of Image and Graphics, 2012, 17(6): 664-670.
[11] PAPARI G, PETKOV N. An improved model for surround suppression by steerable filters and multilevel inhibition with application to contour detection[J]. Pattern Recognition, 2010, 44(9): doi:10.1016/j.patcog.2010.08. 013.
[12] PAPARI G, CAMPISI P, PETKOV N. New families of fourier eigenfunctions for steerable filtering[J]. IEEE Transactions on Image Processing, 2012, 21(6): 2931-2943.
[13] CANNY J F. A computational approach to edge detection[J]. Pattern Analysis and Machine Intelligence, 1986, 8(6): 679-698.
[12] XU X M, QIAO Y L. Dynamic textures segmentation based on Markov random field[C]//Second International Conference on Instrumentation, Measurement, Computer, Communication and Control. [S.l.]: IEEE, 2012: 940-943.
編 輯 葉 芳
作者簡(jiǎn)介:閆超(1985 ? ),男,博士生,主要從事計(jì)算機(jī)視覺方面的研究.
收稿日期:2014 ? 08 ? 10;修回日期: 2015 ? 09 ? 25
中圖分類號(hào)TP391
文獻(xiàn)標(biāo)志碼A
doi:10.3969/j.issn.1001-0548.2016.01.023