焦旭 孫自強(qiáng) 王亮
摘要:該文基于Snake模型研究了SAR圖像的目標(biāo)分割與檢測(cè)方法。首先針對(duì)Snake模型圖像分割技術(shù)中存在的凹陷區(qū)域不能很好收斂的缺點(diǎn),在前人研究成果的基礎(chǔ)上,增加了外部約束凹陷能量,提出了改進(jìn)的Snake模型,然后采用貪婪算法進(jìn)行方法的實(shí)現(xiàn),該方法能夠有效地利用局部與整體信息,實(shí)現(xiàn)目標(biāo)邊界準(zhǔn)確定位,保持線性光滑。實(shí)驗(yàn)結(jié)果表明,改進(jìn)后的Snake模型能較好的收斂到圖像凹陷區(qū)域。
關(guān)鍵詞:合成孔徑雷達(dá);Snake模型;SAR圖像分割
中圖分類號(hào):TP317 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2014)23-5501-03
1 傳統(tǒng)Snake模型的基本原理
Kass等人在1987年刊發(fā)了兩篇論文,題目均為“Snakes: Active Contour Model”。文章中首次提出了使用Snake模型進(jìn)行圖像處理的觀點(diǎn)。[1]這是一種全局性的方法。它除了以圖像梯度作為輪廓邊緣的分類依據(jù),還在分類過程中加入了圖像的整體輪廓信息,因此該方法具有一定的學(xué)習(xí)功能。使用Snake模型進(jìn)行圖像處理定位具有很高的精度,可以同時(shí)獲得圖像的邊緣信息和圖像的輪廓特征信息。同時(shí)由于在整個(gè)處理過程中使用的是圖像的整體信息,所以使用Snake模型進(jìn)行圖像處理還有一個(gè)很大的優(yōu)點(diǎn)就是可以有效地克服噪聲的干擾。
1.1 Snake模型的物理含義
圖像的基本特征主要包括圖像的邊緣特征和圖像的輪廓特征。大多數(shù)的圖像處理技術(shù)更高一級(jí)的處理方式是以圖像的邊緣輪廓特征作為基元來進(jìn)行的。在普遍意義上傳統(tǒng)邊緣檢測(cè)的圖像處理技術(shù)存在著一個(gè)自下而上的三個(gè)階段,即邊緣檢測(cè)、邊緣細(xì)化和邊緣鏈接。由于各階段的相對(duì)獨(dú)立性,目標(biāo)的高層信息,如空間分布和連續(xù)性,無法指導(dǎo)底層信息的提取。主動(dòng)輪廓模型將這三個(gè)階段融為一體。它使待檢測(cè)圖像區(qū)域的邊緣成為一條連續(xù)的光滑曲線。這種方法的核心是先定義一個(gè)能量函數(shù),在主動(dòng)輪廓從最初的位置向著實(shí)際輪廓漸進(jìn)的過程中求取此能量函數(shù)的局部最小值。也就是在對(duì)能量函數(shù)動(dòng)態(tài)優(yōu)化的過程中逐步逼近待檢測(cè)圖像區(qū)域的真實(shí)輪廓。這樣整個(gè)圖像處理過程就被優(yōu)化為一個(gè)求取最小主動(dòng)輪廓模型能量函數(shù)的問題[2]。
通過運(yùn)用主動(dòng)輪廓模型進(jìn)行圖像處理最關(guān)鍵的優(yōu)點(diǎn)就在于該方法概括的將一系列計(jì)算機(jī)視覺問題統(tǒng)一的給出了解決方式。隨著該技術(shù)的成熟與發(fā)展,主動(dòng)輪廓模型已經(jīng)在計(jì)算機(jī)視覺,數(shù)字圖像分析,3D數(shù)字影像重建等諸多方面得到了廣泛的應(yīng)用。[3-6]
2 基于貪婪算法的Snake模型的改進(jìn)及實(shí)現(xiàn)
2.1 貪婪Snake模型的改進(jìn)
2.1.1 一階連續(xù)能量[Econt]的改進(jìn)
在Kass的研究中是通過變分法對(duì)偏微分方程求解獲取主動(dòng)輪廓模型能量最小值的,這是一種很有效的方法。在該方法中為了使輪廓曲線上各點(diǎn)之間的距離減小以達(dá)到使曲線長(zhǎng)度收縮的目的采用[|vi-vi-1|2]作為[Econt]在離散化情形下的近似計(jì)算。然而這樣做雖然可以達(dá)到預(yù)期的目的,但也有其自身的缺陷,它使輪廓曲線上的控制點(diǎn)在收縮的過程中向著輪廓曲線上曲率較高的位置移動(dòng),最終形成了部分輪廓點(diǎn)全部聚在了一起,影響了最終的實(shí)驗(yàn)結(jié)果。而本文所采用的貪婪算法引入了所有控制點(diǎn)的平均距離[d]這個(gè)分量,認(rèn)為:
[Econt=(d-|vi-vi-1|)2] (1)
其中[d=1ni=1n|vi-vi-1|]表示所有控制點(diǎn)之間的平均距離。由式(1-1) ,顯然越接近[d]的控制點(diǎn)所具有的[Econt]就越小,這樣就可以有效地克服控制點(diǎn)在收縮的過程中向著輪廓曲線上曲率較高的位置移動(dòng)形成積聚的問題,最終使得各個(gè)控制點(diǎn)保持較為均勻的分布。在每次迭代后平均距離[d]都將會(huì)被重新計(jì)算。
設(shè)[vi]和[vi-1]的坐標(biāo)分別為[(xi,yi)]和[(xi-1,yi-1)], 在本文中使用的是歐基里德距離,具體形式如下:
[|vi-vi-1|=(xi-xi-1)2+(yi-yi-1)2]
通過將[(d-|vi-vi-1|)2]作為[Econt]在離散化情形下的近似計(jì)算形式,使得輪廓曲線上各點(diǎn)的連續(xù)性得到了很好的保持。
2.1.2 二階曲率能量[Ecurv]的計(jì)算
曲率能量[Ecurv]的表達(dá)式有很多種,各有利弊,表達(dá)式的不同意味著輪廓點(diǎn)曲率估計(jì)的方法不同。該文中,彎曲能量采用二階中心差分,形勢(shì)如下:
[Ecurv=|vi-1-2vi+vi+1|2=(xi-1-2xi+xi+1)2+(yi-1-2yi+yi+1)2] (2)
因?yàn)楦倪M(jìn)后的連續(xù)能量[Econt]使得輪廓各個(gè)控制點(diǎn)保持了較為均勻的分布,所以可以采用式(1-2) 所示的曲率計(jì)算形式作為合理的近似。并且與其它曲率近似公式相比式(1-2) 具有很高的計(jì)算效率。
2.1.3 圖像能量[Eimage]的計(jì)算
我們用[Eimage]表示圖像能,在本文所采用的貪婪算法中圖像能[Eimage]的選取采用的是一種十分簡(jiǎn)單有效的方法,就是將圖像的梯度值進(jìn)行鄰域歸一化處理。下面我們來做具體的介紹:我們先對(duì)當(dāng)前點(diǎn)取一個(gè)鄰域,在該點(diǎn)的鄰域內(nèi)令[max]表示梯度最大值,[min]表示梯度最小值,[mag]表示當(dāng)前點(diǎn)的梯度值。則當(dāng)前點(diǎn)處的[Eimage]可以通過公式[(min-mag)/(max-min)]來計(jì)算。對(duì)于鄰域內(nèi)其它點(diǎn)的[Eimage]也可以用上式進(jìn)行計(jì)算。由于該式的計(jì)算結(jié)果均小于零為負(fù)能量,所以如果某點(diǎn)的梯度值較大,那么它的[Eimage]就會(huì)較小。比如對(duì)于47、48、49這三個(gè)梯度值,通過鄰域歸一化處理這三個(gè)點(diǎn)的[Eimage]分別為0、-0.5、-1,顯然控制點(diǎn)會(huì)被拉向梯度值為49的控制點(diǎn)的方向,但是該點(diǎn)同梯度值為47、48的兩點(diǎn)相比并不是明顯的邊緣。為了避免上述情況的發(fā)生,我們引入一個(gè)閾值[δ]來解決該問題。例如當(dāng)[δ=5],且[max-min<δ=5],則令[min=max-5],再將梯度47、48、49經(jīng)過鄰域歸一化處理其各點(diǎn)的[Eimage]分別為-0.6、-0.8、-1,這樣控制點(diǎn)就不會(huì)被拉向梯度值為49的控制點(diǎn)的方向了。
2.1.4 增加外部約束凹陷能量[Econcave]
為了克服傳統(tǒng)的Snake模型一個(gè)最大的缺陷就是不適合應(yīng)用于邊緣極不規(guī)則的畸形區(qū)域,我們引入形心的概念,增加一個(gè)凹陷能量[Econcave]。
[Econcave=|vi-c|2] (3)
其中[c=(X,Y)]為主動(dòng)輪廓的形心。離散化的形式為:
[X=1ni=1nxi,Y=1ni=1nyi] (4)
凹陷能量正好是主動(dòng)輪廓封閉區(qū)域的面積,可以看出,當(dāng)求能量函數(shù)的最小值時(shí),主動(dòng)輪廓所成區(qū)域的面積在減少,即輪廓曲線能達(dá)到一些深度凹陷的區(qū)域。
2.1.5 對(duì)各能量項(xiàng)的歸一化操作
為了平衡各項(xiàng)能量的影響,避免某項(xiàng)在整個(gè)能量中權(quán)重過重,對(duì)于[ESnake]中各個(gè)能量項(xiàng),都是在其8鄰域范圍內(nèi)進(jìn)行歸一化得到的,這樣可以更好地依靠權(quán)參數(shù)[α,β,γ]控制各個(gè)能量項(xiàng)對(duì)模型總能量的貢獻(xiàn)。具體定義如下:
2.1.6 對(duì)權(quán)參數(shù)[α,β,γ]的約定與自適應(yīng)性調(diào)整
在本文中對(duì)參數(shù)[α]取值為1,對(duì)參數(shù)[β]進(jìn)行自適應(yīng)性調(diào)整,對(duì)于參數(shù)[γ]則是根據(jù)選取的不同SAR圖像的具體情況進(jìn)行設(shè)定。下面主要介紹對(duì)參數(shù)[β]進(jìn)行的自適應(yīng)性調(diào)整。
連續(xù)能量[Econt]使各點(diǎn)之間保持等距離,而曲率能量[Ecurv]試圖減少兩個(gè)鄰近矢量的外角。[Ecurv]的系數(shù)[β]的作用則是調(diào)節(jié)輪廓曲線的彎曲變形,對(duì)能量函數(shù)最小化過程中輪廓曲線的收縮進(jìn)行調(diào)整。在傳統(tǒng)方法中[β]通常取一個(gè)常數(shù),在整個(gè)過程中不發(fā)生變化。而本文將對(duì)[β]的取值在0、1兩值之間依據(jù)一定的條件自動(dòng)選擇。下面我們來具體介紹[β]的取值機(jī)制。首先運(yùn)用公式(1-8) 計(jì)算輪廓中各個(gè)控制點(diǎn)的曲率。
在初次迭代之前將輪廓上各點(diǎn)的[β(i)]均初始化為1。在每一次迭代完成以后均按照公式(1-8) 將輪廓上各點(diǎn)的曲率重新計(jì)算。對(duì)于同時(shí)滿足曲率為極大值、曲率大于設(shè)定的閾值、梯度值大于設(shè)定閾值這三個(gè)條件的點(diǎn)[i],令其[β(i)=0]。這樣[β]的值總是通過上次迭代的曲率值進(jìn)行修改對(duì)能量函數(shù)最小化過程中輪廓曲線的收縮進(jìn)行調(diào)整的。
3 實(shí)驗(yàn)結(jié)果及分析
為了驗(yàn)證本文所提出的SAR圖像目標(biāo)邊緣檢測(cè)方法的有效性,我們對(duì)一幅SAR圖像應(yīng)用該方法。
參考文獻(xiàn):
[1] Kass M,Witkin A,Terzopoulous D,Snakes:Active Contour Models.International Journal of Computer Vision,1988,1(4):321-331.
[2] 孫即祥.圖像分析[M].合肥:科學(xué)出版社,2005:74-78.
[3] 李培華,張?zhí)镂?主動(dòng)輪廓線模型(蛇模型)綜述[J].軟件學(xué)報(bào),2000,11(6):751-757.
[4] Jolly M,Lakshmanan S,Jain A K.Vechile Segmentation and Classification Using Deformable Templates[J].IEEE Transactions on Pattern Analysis and Machine Intelligence.1996,18(3):293-308.
[5] Zhou Yan-bo,Zhang Guang-zhi.Deformable Objects Contour Extraction[J].Acta Electronic Sinia, 1998,26(7):133-137.
[6] Jia Chun-guang,Tan Ou,Duan Hui-long.Medical Image Registration based on Deformable Contour[J].Journal of Computer Aided Design and Computer Graphics,1999,11(2):115-119.