趙浩鈞 林川 陳海杰 張玉薇
摘 要:作為目標(biāo)識別的關(guān)鍵步驟,輪廓檢測已成為計算機視覺研究領(lǐng)域的熱點之一.仿生學(xué)研究發(fā)現(xiàn),在初級視皮層(V1)細(xì)胞中,驅(qū)動彩色亮度單元的雙拮抗細(xì)胞感受野對亮度和顏色信息敏感且具有方向選擇性,對于輪廓檢測起到重要作用.本文提出一種基于顏色拮抗和紋理抑制的輪廓檢測模型,通過二維高斯差分DOG函數(shù)來模擬紋理抑制模板,對不同的雙拮抗細(xì)胞通道進(jìn)行紋理抑制,在基于顏色拮抗特性檢測模型中考慮了抑制紋理的作用.實驗結(jié)果表明:在BSDS300圖像庫下本文模型在紋理抑制方面較現(xiàn)有模型有一定的優(yōu)勢,能夠較好的提取目標(biāo)輪廓,是顏色拮抗目標(biāo)輪廓檢測模型中的一種新思路.
關(guān)鍵詞:顏色拮抗;輪廓檢測;紋理抑制
中圖分類號:TP391.41 DOI:10.16375/j.cnki.cn45-1395/t.2018.04.002
0 引言
早期邊緣檢測通常使用Roberts算子、Laplacian算子、Canny算子等空間微分算子[1].上述邊緣檢測算法的核心思路是沿不同方向計算空間梯度以獲得邊緣,檢測出來的邊緣中包含大量紋理邊緣,這些紋理邊緣會干擾后續(xù)的分割、識別等任務(wù);因此,該類邊緣檢測算法本質(zhì)上難以區(qū)分顯著目標(biāo)邊界和紋理邊緣,而與邊緣檢測不同的是,輪廓檢測能標(biāo)識別目標(biāo)與背景的分界,因而成為目標(biāo)識別的關(guān)鍵步驟[2].輪廓檢測需要消除紋理信息并將輪廓與非輪廓部分區(qū)分開來,并側(cè)重于提取形狀和其他中等視覺信息等特征[3].針對人類如何準(zhǔn)確地感知和理解視覺信息問題,視神經(jīng)科學(xué)家在視網(wǎng)膜信息采集、視神經(jīng)通路和大腦皮層等各方面做了大量研究.另外,計算機研究領(lǐng)域的科學(xué)家一直在研究生物視覺和計算機科學(xué)的結(jié)合并取得了一系列研究成果,為目標(biāo)輪廓檢測的視覺仿生檢測奠定了基礎(chǔ)[4].Grigorescu等[5]采用Gabor模型模擬經(jīng)典感受野,提出二維高斯差分函數(shù)來模擬非經(jīng)典感受野的抑制特性,后續(xù)的研究用改進(jìn)的神經(jīng)元激活函數(shù)sigmoid提取局部尺度信息[6].該類仿生型輪廓檢測模型主要是利用圖像中的亮度信息,而顏色信息有助于識別其他難以區(qū)分的實例,顏色通常用于視覺增強和吸引注意力,顏色的存在有助于視覺搜索和對象識別等任務(wù)[7-8].
在顏色信息的輪廓檢測任務(wù)中,Martin等提出的Pb算法[9],通過機器學(xué)習(xí)技術(shù)整合亮度、顏色和紋理梯度特征來獲取圖像輪廓,后續(xù)的Pb算法通過采用多尺度機制或全局信息來提高邊界檢測能力[10-11].這些方法都取得了較好的效果,但是基于深度學(xué)習(xí)的方法往往需要大量的樣本來進(jìn)行訓(xùn)練以及較好的硬件平臺來加速實現(xiàn),而近期出現(xiàn)的一些輪廓檢測方法在獲得較好的輪廓檢測結(jié)果的同時,計算效率也非常高.現(xiàn)有方法從兩個典型的顏色拮抗通道(紅-綠拮抗和黃-藍(lán)拮抗)中檢測彩色輪廓,Zhou和Mei等[12]使用配對差分(Pairwise Difference)算子在兩個平滑后的顏色拮抗通道上提取輪廓.Zhang等[13]提出一個基于顏色拮抗機理的顏色描述方法,能夠有效地提高紋理梯度的輪廓檢測算法的性能.最近,Yang等[14]提出CO模型,基于顏色拮抗機理的方法檢測亮度邊緣和顏色邊緣.后續(xù)的研究通過引入空間稀疏約束(spatial sparseness constraint)的紋理抑制提出SCO模型[15].本文在顏色拮抗機理的生理學(xué)依據(jù)上模擬信息傳遞通路從視網(wǎng)膜到外側(cè)膝狀體(LGN)到初級視皮層(V1)提出基于顏色拮抗和紋理抑制的輪廓檢測模型,引入高斯差分函數(shù)(DOG)[5]進(jìn)行通道紋理抑制.實驗結(jié)果表明:本文的輪廓檢測模型經(jīng)過DOG函數(shù)進(jìn)行紋理抑制,獲得了較高的性能評測指數(shù),有效地提高了輪廓檢測的準(zhǔn)確性.
1 模型
對于彩色圖像的輪廓檢測,大量的研究顯示在生物視覺系統(tǒng)中以拮抗方式進(jìn)行處理顏色信息,單拮抗感受野和雙拮抗感受野以兩種主要類型的神經(jīng)元感受野存在于前端視覺通路中.存在于視網(wǎng)膜節(jié)細(xì)胞和LGN神經(jīng)元中[16]的單拮抗細(xì)胞感受野包括:中心-外周結(jié)構(gòu)的拮抗細(xì)胞感受野(圖1(a))和單中心結(jié)構(gòu)的拮抗細(xì)胞感受野(圖1(b)).初級視皮層(V1)神經(jīng)元中含有更為復(fù)雜的感受野結(jié)構(gòu)包括:同心圓結(jié)構(gòu)雙拮抗感受野(圖1(c)),和具有朝向選擇性雙拮抗感受野(圖1(d))[17],對顏色和亮度邊緣信息敏感.只有顏色對比度的區(qū)域,彩色圖像檢測出的輪廓圖比灰度圖像檢測出的輪廓圖提供更多的有效信息,如圖2所示.
本文依據(jù)兩種顏色拮抗沿視網(wǎng)膜、外側(cè)膝狀體、初級視皮層通路進(jìn)行傳遞信息,提出基于顏色拮抗和紋理抑制的輪廓檢測模型,模型中紅-綠拮抗框架如圖3所示,藍(lán)-黃拮抗框架如圖一致,在提取紅-綠輪廓和藍(lán)-黃輪廓之后再用最大值方法處理得到本文最終輪廓.
1.1 視錐細(xì)胞層
在視網(wǎng)膜中,光刺激可以激活視錐細(xì)胞,細(xì)胞被激活的長度取決于光的波長.本文基于RGB顏色模型提取出圖像的3個顏色分量,用[R(x,y)]表示紅顏色分量,[G(x,y)]表示綠顏色分量,[B(x,y)]表示藍(lán)色分量.黃色分量是一種合成分量,用[Y=(R+G)/2]表示.
1.2 節(jié)細(xì)胞/LGN層
LGN層的細(xì)胞具有單一的拮抗細(xì)胞感受野并且顯示空間低通特性.使用視錐細(xì)胞層響應(yīng)作為輸入,計算出紅-綠和藍(lán)-黃通道的單拮抗細(xì)胞響應(yīng),它們的響應(yīng)可以被描述為:
[Sr+g-(x,y)=ω1?R(x,y)+ω2?G(x,y)], (1)
[Sr-g+(x,y)=ω1?R(x,y)+ω2?G(x,y)], (2)
[Sb+y-(x,y)=ω1?B(x,y)+ω2?Y(x,y)], (3)
[Sb-y+(x,y)=ω1?Y(x,y)+ω2?B(x,y)], (4)
[ω1ω2≤0ω1 , ω2?[0,1]] (5)
當(dāng)[ω1=ω2]時,亮度信息不響應(yīng);[ω1≠ω2]時,亮度信息和顏色信息都存在響應(yīng).[ω1]、[ω2]始終具有相反的符號,當(dāng)[ω1>0],[ω2<0]時,可提取R-on/G-off細(xì)胞的響應(yīng);用[Sr+g-]表示;相反,當(dāng)[ω1<0],[ω2>0]時,可提取R-off/G-on細(xì)胞的響應(yīng),用[Sg+r-]表示.
1.3 初級視皮層(V1層)
V1層的細(xì)胞中的大量神經(jīng)元(29%)對顏色和亮度敏感.初級視皮層中驅(qū)動彩色亮度單元的神經(jīng)網(wǎng)絡(luò)在空間上變換LGN層彩色信號,以實現(xiàn)對顏色的空間選擇性[18].特別地,朝向選擇性雙拮抗感受野被認(rèn)為在顏色邊界檢測中起重要作用,使用以下公式進(jìn)行描述:
[RF(x,y;θ)=?f(x, ;θ)?x], (6)
[f(x,y;θ)=12π(kσ1)2exp(-(x+γ2 2)2π(kσ1)2)], (7)
[xy=xcosθ+ysinθ-xsinθ+ycosθ], (8)
[γ] ——橢圓形感受野長軸與短軸比例的常數(shù)([γ] = 0.5 );[θ?[0,2π)]表示細(xì)胞的最優(yōu)響應(yīng)朝向;[σ1] ——高斯函數(shù)中的標(biāo)準(zhǔn)偏差決定了感受野的大??;[k>1] 表示V1神經(jīng)元具有比神經(jīng)節(jié)/ LGN細(xì)胞更大的感受野,本文設(shè)置[k=2].圖4顯示了由式(6)模擬出來對顏色和亮度邊緣信息敏感的感受野示意圖,從左到右分別為[0°、60°、120°、180°、240°、300°].
(a) (b) (c) (d) (e) (f)
圖4 朝向選擇性雙拮抗感受野
Fig.4 The receptive field model of the oriented double-opponent neurons
對于不同方向的雙拮抗響應(yīng)可以表示為:
[Dr+g-(x,y;θ)=m,n?Cr+g-Sr+g-(x+m,y+n)*RF(m,n;θ)], (9)
[Dg+r-(x,y;θ)=m,n?Cg+r-Sg+r-(x+m,y+n)*RF(m,n;θ)], (10)
[Db+y-(x,y;θ)=m,n?Cb+y-Sb+y-(x+m,y+n)*RF(m,n;θ)], (11)
[Dy+b-(x,y;θ)=m,n?Cy+b-Sy+b-(x+m,y+n)*RF(m,n;θ)], (12)
式中*表示卷積算子,[Cr+g-]表示顏色拮抗感受野區(qū)域的大小.
[θi?[0,2π)]表示[Nθ] 個用于提取朝向信息的濾波器朝向:
[θi=2(i-1)πNθ , ][i=1 , 2 , … , Nθ][ ], (13)
最后,通過計算每個方向下的最大響應(yīng)作為該通道下最終的邊界響應(yīng)為:
[Drg(x , y)=max{Dr+g-(x , y ; θi)|i=1 , 2 , … , Nθ}][ ], (14)
[Dgr(x , y)=max{Dg+r-(x , y ; θi)|i=1 , 2 , … , Nθ}][ ], (15)
[Dby(x , y)=max{Db+y-(x , y ; θi)|i=1 , 2 , … , Nθ}][ ], (16)
[Dyb(x , y)=max{Dy+b-(x , y ; θi)|i=1 , 2 , … , Nθ}][ ]. (17)
1.4 紋理抑制模型
中樞神經(jīng)元的反應(yīng)受到外圍神經(jīng)元細(xì)胞感受野的抑制,抑制作用隨著距離增大而減小.傳統(tǒng)的抑制模板使用高斯差分函數(shù)(DOG)[5],對于圖像中給定的點,抑制項是在圍繞著相關(guān)點的感受野周圍的環(huán)形區(qū)域內(nèi)計算出來的.DOG函數(shù)可以表達(dá)如下:
[DOG(x , y ; σ2 , k2)=12π(k2σ2)2exp(-x2+y22(k2σ2)2)-12πσ22exp(-x2+y22σ22)][ ], (18)
[ω(x , y ; σ2)=N(DOG(x, y ; σ2))DOG(x , y ; σ2)][ ], (19)
[N(X)=X , X>00 , X≤0][ ], (20)
式中[·]表示[L1]范數(shù),[N(X)]函數(shù)確保濾波器響應(yīng)非負(fù).通過V1層計算出來的雙拮抗細(xì)胞響應(yīng)經(jīng)過DOG函數(shù)濾波抑制可以表示如下:
[DOGρ(x , y ; σ2)=Dρ(x , y)*DOG(x , y ; σ2 , k2)][ ], (21)
[Rρ(x , y ; σ2)=Dρ(x , y)-αDOGρ(x , y ; σ2)][ ], (22)
其中[ρ∈{rg,gr,by,yb}] .通過線性歸一化對每個通道的響應(yīng)進(jìn)行歸一化,獲得最終的輪廓響應(yīng)為:
[T(x , y)=max(Rρ(x , y ; σ2)|ρ?{rg , gr , by , yb})][ ]. (23)
2 實驗結(jié)果與分析
本文模型在一臺硬件條件為CPU為Intel(R) core(TM) i3-4130k,主頻為3.4 GHz,內(nèi)存為8 GB的計算機上,對CO模型[14]以及本文提出的檢測模型使用MATLAB 2016a仿真軟件進(jìn)行仿真實驗.基于伯克利數(shù)據(jù)庫BSDS300[19]使用標(biāo)準(zhǔn)評價指數(shù)將本文模型得出的輪廓檢測結(jié)果與數(shù)據(jù)庫中給出的真實輪廓做定量比較,用來全面評估本文輪廓檢測的性能.表1給出了主要參數(shù)設(shè)置情況.
為了檢測本文模型的性能,使用Martin等提供的Berkley分割數(shù)據(jù)集(BSDS300),進(jìn)一步評估了模型的性能.每幅自然原始圖像有多個以人為標(biāo)記的手繪圖像標(biāo)準(zhǔn)輪廓結(jié)果(Ground Truth),為了便于比較,所有檢測器的輸出圖像(即邊界)的像素值在非最大值抑制操作之后作為輪廓邊界的概率,使用精確度-回歸度(覆蓋率)來評估輪廓檢測的性能.評價標(biāo)準(zhǔn)為[F]指數(shù),其定義如下:
[F =2PR/P+R], (24)
其中:[P]代表精確度,[R]代表覆蓋率,[F]指數(shù)為二者的調(diào)和平均,表示模型的檢測結(jié)果與人類觀察到輪廓之間的相似性,它被廣泛用于評估邊緣檢測器的性能.
為了增強不同雙拮抗通道提出來的圖像信息,用DOG函數(shù)對每組雙拮抗通道進(jìn)行紋理抑制,目的是突出背景響應(yīng)并減弱邊緣響應(yīng),使用提取出來雙拮抗響應(yīng)減去DOG函數(shù)調(diào)制的抑制項后就能抑制更多的背景噪點,從而凸顯輪廓信息.為了驗證不同拮抗通道抑制效果,本文基于BSDS300圖像庫進(jìn)行實驗,實驗結(jié)果如圖5所示,圖5(a)為自然圖像,圖5(b)為真實輪廓圖,圖5中(c1)、(d1)、(e1)、(f1)分別為紅-綠拮抗,綠-紅拮抗,藍(lán)-黃拮抗和黃-藍(lán)拮抗,用DOG函數(shù)對不同拮抗通道進(jìn)行抑制分別得到圖5(c2)、(d2)、(e2)、(f2),圖5(g1)為CO模型提取輪廓圖,圖5(g2)為本文最終輪廓圖.實驗結(jié)果表明,DOG函數(shù)在不同拮抗通道的調(diào)制能夠有效地抑制圖像背景中多余的噪點使提取的輪廓更加完整.
CO模型中不同通道的F值與本文模型中不同通道經(jīng)過DOG函數(shù)進(jìn)行抑制的F值如圖6所示,本文經(jīng)過DOG函數(shù)抑制的情況下評價指數(shù)F值均比未經(jīng)過DOG函數(shù)抑制的情況下評價指數(shù)F值有所提高,這充分體現(xiàn)出了本文所提出的DOG函數(shù)抑制方法改善了模型的整體輪廓檢測性能.
表2列舉了本文檢測模型和CO模型在BSDS300圖像庫中3幅圖像(65033,69020,108005)的輪廓提取F值結(jié)果.為定性實驗對比選取了BSDS300數(shù)據(jù)庫中另外5幅圖像(43074,37073,12084,351093,302008),如圖7所示,本文提出的輪廓提取模型能夠較好地提取出自然圖像中的輪廓,F(xiàn)值均有所提高.實驗結(jié)果表明:檢測模型能夠從多組顏色拮抗信息中有效的區(qū)分輪廓和紋理,消除不同顏色通道中背景紋理邊緣的響應(yīng),減少無關(guān)成分的影響,增強目標(biāo)的弱邊緣信息,保持目標(biāo)輪廓的完整性.通過模擬視錐細(xì)胞對不同顏色的敏感程度,雙拮抗色細(xì)胞的拮抗響應(yīng),對不同的兩種紅綠和藍(lán)黃顏色拮抗信息處理進(jìn)行紋理抑制,實現(xiàn)了較好的輪廓檢測效果.
3 結(jié)論
近年來,許多生物學(xué)和視神經(jīng)學(xué)方面的研究都主要關(guān)注于神經(jīng)視皮層V1區(qū)的顏色信息,這些研究的發(fā)現(xiàn)為計算機視覺的發(fā)展提供了新的研究思路.盡管這些方法在提高檢測輪廓成功率方面取得了不小進(jìn)步,然而很少有利用紋理抑制調(diào)制不同顏色拮抗通道信息.針對這一問題,本文提出了一種基于視顏色拮抗機制和紋理抑制的輪廓檢測模型,用于檢測自然圖像中的輪廓信息,該模型通過DOG函數(shù)濾波器對不同組的雙拮抗通道信息進(jìn)行紋理抑制處理,提高了輪廓檢測率,實現(xiàn)了較好的輪廓檢測效果.
V1層中的神經(jīng)元單元(29%)同時響應(yīng)顏色和亮度信息,但V1層中也有特定的神經(jīng)元專門響應(yīng)顏色(11%)或亮度(60%)信息.本文僅僅對顏色信息在輪廓檢測中的應(yīng)用進(jìn)行研究,如何整合視覺系統(tǒng)中的V1層顏色和亮度信息或更高級別皮質(zhì)中的顏色信息,仍需要進(jìn)一步的研究和探索.
參考文獻(xiàn)
[1]俞昊,林川,譚光興,等. 視覺注意機制與Canny算子結(jié)合的目標(biāo)輪廓檢測方法[J].廣西科技大學(xué)學(xué)報,2016,27(2):87-92.
[2]閆夏,譚光興,林川. 基于免疫聚類算法的MRI膝關(guān)節(jié)圖像分割[J].廣西科技大學(xué)學(xué)報,2015,26(1):70-74.
[3]LAGUNOVSKY D,ABLAMEYKO S. Fast line and rectangle detection by clustering and grouping[M]. Berlin:Berlin Heidelberg Springer,1997.
[4]SHPANER M,MOLHOLM S,F(xiàn)ORDE E,et al. Disambiguating the roles of area V1 and the lateral occipital complex (LOC) in contour integration[J]. Neuroimage,2013,69(4):146-156.
[5]GRIGORESCU C,PETKOV N,WESTENBERG M a. Contour detection based on nonclassical receptive field inhibition[J]. IEEE Transactions on Image Processing a Publication of the IEEE Signal Processing Society,2003,12(7):729-739.
[6]潘亦堅,林川,郭越,等. 基于非經(jīng)典感受野動態(tài)特性的輪廓檢測模型[J]. 廣西科技大學(xué)學(xué)報,2018,29(2):77-83.
[7]MEHRANI P,MOURAVIEV A,GONZALEZ O J A,et al. Color-opponent mechanisms for local hue encoding in a hierarchical framework[J/OL].arXiv.org,2018(2)[2018-03-02]. http://cn.arxiv.org/pdf/1706.10266v2.
[8]吳璟莉,劉袁靜. 一種基于顏色拮抗感受野的輪廓檢測模型[J].計算機科學(xué),2016,43(7):319-323.
[9]MARTIN D R,F(xiàn)OWLKES C C,MALIK J. Learning to detect natural image boundaries using local brightness,color,and texture cues[J]. Transactions on Pattern Analysis and Machine Intelligence,2004,26(5):530-549.
[10]MAIRE M,ARBELAEZ P,F(xiàn)OWLKES C,et al. Using contours to detect and localize junctions in natural images[C]// Using contours to detect and localize junctions in natural images. Computer Vision and Pattern Recognition,2008 CVPR 2008 IEEE Conference.
[11]ARBELA?EZ P,MAIRE M,F(xiàn)OWLKES C,et al. Contour detection and hierarchical image segmentation[C]// Contour Detection and Hierarchical Image Segmentation. IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE.
[12]ZHOU C,MEL B W. Cue combination and color edge detection in natural scenes[J]. Journal of Vision,2008,8(4):1-25.
[13]ZHANG J,BARHOMI Y,SERRE T. A new biologically inspired color image descriptor[C]// A New Biologically Inspired Color Image Descriptor. European Conference on Computer Vision,312-324.
[14]YANG K,GAO S,LI C,et al. Efficient color boundary detection with color-opponent mechanisms[C]// Efficient Color Boundary Detection with Color-Opponent Mechanisms. IEEE Conference on Computer Vision and Pattern Recognition,2810-2817.
[15]YANG K F,GAO S B,GUO C F,et al. Boundary detection using double-opponency and spatial sparseness constraint[J]. IEEE Transactions on Image Processing A Publication of the IEEE Signal Processing Society,2015,24(8):2565-2578.
[16]LK P,WS B,R A,et al. Agenesis of the corpus callosum:genetic,developmental and functional aspects of connectivity[J]. Nature Reviews Neuroscience,2007,8(4):287-299.
[17]楊開富. 前端視覺通路信息加工的計算模型及應(yīng)用研究[D].成都:電子科技大學(xué),2016.
[18]JOHNSON E N,HAWKEN M J,SHAPLEY R. The spatial transformation of color in the primary visual cortex of the macaque monkey[J]. Nature Neuroscience,2001,4(4):409-416.
[19]MARTIN D,F(xiàn)OWLKES C,TAL D,et al. A Database of Human Segmented Natural Images and its Application to Evaluating Segmentation Algorithms and Measuring Ecological Statistics[C]// A Database of Human Segmented Natural Images and its Application to Evaluating Segmentation Algorithms and Measuring Ecological Statistics. Computer Vision.
Contour detection model based on color opponent and texture suppression
ZHAO Haojun, LIN Chuan*, CHEN Haijie, ZHANG Yuwei
(School of Electric and Information Engineering, Guangxi University of Science and Technology,
Liuzhou 545006, China)
Abstract: As a key step in target recognition, contour detection has become one of the hotspots in the field of computer vision research. Bionic studies have found that in primary visual cortex (V1) cells the double-opponent cell receptive field is antagonistic to color and spatially responsive, sensitive to brightness and color information and has orientation selectivity, which plays an important role in contour detection. In this paper, a two-dimensional Gaussian difference DOG function is proposed to simulate the texture suppression template. And the texture suppression of different double antagonist cell channels is made up to make up for the defects of the traditional color antagonism algorithm in ignoring the background texture. Experiments show that under the BSDS300 image library, the algorithm considers the effect of suppressing texture, enhances the weak texture and suppresses the background texture in each group of color antagonism and the model can achieve better contour detection. It is a new idea in the color opponent target contour detection model.
Key words: color opponent; contour detection; texture suppression
(學(xué)科編輯:黎 婭)