趙 婕,謝 剛
(1.太原理工大學信息工程學院,山西太原030024;2.太原大學計算機工程系,山西太原030032)
圖像區(qū)域分割中的無監(jiān)督圖割方法
趙 婕1,2,謝 剛1
(1.太原理工大學信息工程學院,山西太原030024;2.太原大學計算機工程系,山西太原030032)
提出一種基于圖割算法的圖像多區(qū)域分割方法,該方法采用核函數對數據項進行隱性的非線性映射,將原始數據映射到高維特征空間,實現圖像的線性多類劃分,擴展了分段常數模型的應用范圍,提高了復雜區(qū)域的分割效果。由于圖像邊緣梯度變化劇烈,具有不連續(xù)性,在平滑項中加入圖像的梯度約束條件,減少過分割。同時,采用無監(jiān)督方法設置初始參數,避免了交互操作,更符合多區(qū)域分割的要求。實驗結果表明,新方法不受圖像內容的限制,無論是主觀視覺判斷還是客觀定量分析,該方法都具有較好的分割效果。
區(qū)域分割;圖割算法;核方法;邊緣梯度
圖像在人眼中是由不同目標、不同區(qū)域聯合構成,人們通過辨識圖像中包含的各個目標,可以快速、準確地理解其所包含的信息。但是對于計算機而言,這個過程極具挑戰(zhàn)性。圖像分割就是幫助計算機像人眼一樣,實現目標提取與識別、圖像理解以及場景恢復等功能的前期環(huán)節(jié),是圖像分析與理解的基礎技術[1]。圖像分割一直以來是計算機視覺領域的研究熱點,而圖像的多區(qū)域分割是圖像分割中最為關注的研究方向,廣大研究者努力尋找更準確、更高效的多區(qū)域分割方法。由于能量函數模型具有統(tǒng)一的分割框架以及可以使用標準優(yōu)化方法求解的優(yōu)點,并且通過貝葉斯統(tǒng)計可以證明將圖像分割問題轉換為求解能量函數最優(yōu)解的正確性,能量優(yōu)化方法成為研究圖像分割的一個新流派[2-3]。
圖割算法是一種以圖論為理論基礎的優(yōu)化方法,可用于優(yōu)化能量函數全局解,而圖像中的像素點又可以與網絡圖的節(jié)點對應,圖論的相關理論與方法適用于圖像分析與處理領域的研究。因此,圖割算法成為近年來廣大學者研究圖像分割的重要方法。2000年,加拿大西安大略大學Boykov等人[4]首次將圖割算法引入圖像分割領域,經過數學證明驗證了求解離散能量函數的全局最優(yōu)解與圖像的目標分割過程等效,并且使用交互式方法,通過求解能量函數最優(yōu)解在實際應用中實現了目標與背景的分割。但是,當能量函數是非凸函數時,無法精確獲得全局最優(yōu)解。2002年,美國康奈爾大學Kolmogorov等人[5]提出一種求解具有較強約束的局部最優(yōu)解的圖割算法,用特定的局部最優(yōu)解替代全局最優(yōu)解,實驗證明了該算法的有效性,并成功地應用于多鏡頭3D場景重建。經典圖割算法適用于灰度圖像,2004年,英國微軟劍橋研究院Rother等人[6]提出GrabCut算法,用高斯混合模型代替單色直方圖模型,將圖割算法擴展到彩色圖像的目標分割;同時,用戶只需提供左上角和右下角兩個點,便可形成一個覆蓋目標的矩形框,簡化了交互操作。研究者們還在能量函數中融入各種先驗信息,以提高圖割算法的圖像分割效率。2010年,西安大略大學Veksler[7]將星形作為通用的目標形狀,以先驗知識的形式融入能量函數的結構中,用戶只需提供目標的中心點就可以準確分割出目標,提高了圖像中目標的分割效果。在近十幾年中,圖割算法得到了廣大研究者的關注,針對算法流程的設計與能量函數的構造不斷地提出改進方法[8-11],促進了圖像分析與處理研究的發(fā)展與進步,尤其是在圖像分割領域。
圖割算法在圖像分割領域的使用范圍主要集中于目標分割和交互式操作。這里指的目標分割是將圖像中的目標從背景中有效地分割出來,即圖像被分為兩個區(qū)域(目標和背景),屬于二分類。用戶預先確定一定量的目標像素和背景像素,通過交互式操作完成圖割算法中參數的初始化設置。圖割算法在交互式的兩區(qū)域分割研究中已經取得了很好的效果[4-11]。但是,由于圖像的復雜性,實際圖像都是由多個區(qū)域組成,如何將圖像有效分割成多個具有特定性質的區(qū)域,更具有實際應用價值,同時也更具有挑戰(zhàn)性。圖像的多區(qū)域分割成為圖割算法目前以及未來研究的重點與難點。對于圖像的多區(qū)域分割,如果仍然使用交互式操作完成初始化設置,那么圖像越復雜,分割的區(qū)域越多,交互式操作也越困難。因此,交互式操作不適合圖像的多區(qū)域分割。
圖割算法應用到圖像的多區(qū)域分割時,當分割區(qū)域大于3個以上,能量函數的全局優(yōu)化成為NP-h(huán)ard問題,通常采用α-擴展、α-β交換等近似優(yōu)化方法[12]。能量函數模型的構建是決定圖割算法處理圖像能力的關鍵因素,針對近似優(yōu)化方法,研究者們提出一些新的能量函數模型。文獻[13]提出一種離散能量函數模型,加入標簽懲罰限制使用標簽的數量,通過能量平衡解決經典優(yōu)化問題中的無容量限制的設施選址問題(uncapacitated facility location problem,UFLP),經過實驗驗證了該模型的有效性。文獻[14]構造了評價標簽質量的多模型能量函數,包括測量模型相似程度的相似項和測量證明模型合理的證據數量的模型懲罰項兩部分。采用一種快速的融合移動方法實現多模型能量函數的優(yōu)化,將融合問題變換為最小加權點覆蓋問題,該方法具有近鄰傳播一樣的魯棒性。文獻[15]通過t-權重將多個形狀先驗信息引入能量函數構造的圖中,形狀距離是對稱的,同時還符合三角不等式定理,采用多階段圖割算法完成有重疊的多目標分割。這些能量函數模型的提出推進了圖割算法在多區(qū)域分割中的應用,但是仍然存在一些缺點有待改進,例如模型復雜、計算量大,分割效果與分割區(qū)域的數量有關,并且分割區(qū)域的數量需要人為指定等問題。
本文將核方法與邊緣梯度信息有機融合,提出一種無監(jiān)督圖割方法。首先,采用常數模型描述各個劃分區(qū)域內的圖像數據,將圖像數據映射到高維空間,實現復雜圖像數據的線性可分,統(tǒng)計模型簡單、計算量小,并且提高了復雜區(qū)域的分割效果。其次,在多標簽分配過程中,加入梯度約束條件以保持邊緣不連續(xù)性,減少過分割。最后,參數初始化設置避免了交互操作,通過少量樣本測試便可以確定合適的參數值,完成多區(qū)域的自動分割。
圖像多區(qū)域分割中應用圖割算法的核心思想是構建一個能夠體現圖像特征的能量函數,對能量函數的最優(yōu)化求解,完成各個區(qū)域的標簽分配。每一個分割區(qū)域可以看作一類數據,每一類圖像數據都有唯一的標簽與之對應,通過解決標簽分配問題實現圖像數據的空間聚類。無監(jiān)督圖割方法避免了交互式操作,主要包含有以下3個基本步驟:
步驟1 構造無監(jiān)督圖割的能量函數
設I表示一幅圖像,P為該圖像中所有像素的集合,將圖像I分割為Nseg個區(qū)域,對于任意像素p,則存在一個對應函數f(p)表示像素點p的分類標簽,即
式中,L是標簽類別的集合,其基數小于等于Nseg。標簽類別為l(l∈L)的所有像素構成一個劃分區(qū)域Rl,即
通常能量函數由數據約束和平滑約束兩個特征項之和組成
這兩個約束項中包含圖像分割所需的圖像特征,其中EData(f)是數據約束項,衡量分割區(qū)域中圖像數據和統(tǒng)計模型的一致性程度。采用分段常數模型[13](piecewise constant model,PCM)作為統(tǒng)計模型描述劃分區(qū)域內像素的特征。PCM中同一區(qū)域內圖像特征近似等同,不同區(qū)域內圖像特征差異較大,每個區(qū)域內的像素分配統(tǒng)一的標簽,用相同的圖像特征進行表示,適用于圖像的多區(qū)域分割,并且計算量小。
式中,μl為區(qū)域Rl的PCM參數;Ip表示像素p的圖像特征。
但是,在實際應用中圖像數據分布復雜,而PCM要求圖像數據按照線性分布,大大限制了其應用范圍。為了擴展PCM在實踐中的應用范圍,采用核映射方法[16-18]對非線性可分的圖像數據進行隱性的非線性映射,將原始數據映射到高維特征空間,實現線性可分的目的。
ESmooth(f)是平滑約束項,用來描述分割區(qū)域的光滑程度,融入梯度變化作為約束條件,體現出分割區(qū)域內光滑連續(xù)而區(qū)域邊緣不連續(xù)的特性。
式中,λ為比例系數,用來調節(jié)數據約束和平滑約束兩個特征項所占的比重;N表示像素鄰域。
步驟2 構建加權圖
根據構造的能量函數可以構建一個加權圖,設圖G=〈v,ε〉,其中v是圖中的頂點,包括圖像中的所有像素點p∈P,以及用于表示標簽類別的額外端點l∈L。ε是圖中的邊,也相應地包括兩部分:相鄰像素點之間的邊和像素點與額外端點之間的邊。邊的權重如表1所示。
表1 邊的權重分配
步驟3 基于圖割的近似優(yōu)化實現多區(qū)域分割
采用α-β交換的最大流/最小割算法[12]迭代進行能量函數的近似最優(yōu)化,實現圖像的多區(qū)域分割。
本文提出的無監(jiān)督圖割方法,本質上是一種融合核方法與邊緣梯度變化的多目標自動分割方法。該方法的關鍵在于能量函數的構造和參數初始化設置,后面的第2節(jié)和第3節(jié)對這兩部分內容分別做詳細介紹。
2.1 數據項在核空間的轉換及計算
為了使PCM符合實際應用要求,采用核方法對非線性可分的圖像數據進行隱性的非線性映射,將原始數據映射到高維特征空間,實現線性可分的目的。這里“隱性”是指,不必明確給出非線性映射函數φ(·)的具體表達形式,內積運算可以用核函數代替[19],即K(x,y)=φ(x)·φ(y)。因此,在經典圖割算法中引入核方法,既可以使PCM成為有效描述圖像數據的通用的簡單模型,也可以充分利用基于圖割的能量優(yōu)化方法,同時還體現了線性方法便于處理、計算簡單的優(yōu)點,有效實現圖像的同質多區(qū)域分割,此方法適用范圍廣泛,不受圖像類型的限制。
將數據項通過非線性映射函數φ(·)映射到核空間,則數據項轉換后的計算公式為
設K(·)為選用的核函數,定義
將式(7)代入式(6),數據項的核空間轉換公式簡化為
轉換到核空間的數據項,不必考慮映射函數φ(·),只要確定使用的核函數即可完成數據項的計算。本文采用徑向基函數(radial basis function,RBF)中的拉普拉斯核函數(Laplace kernel,LRBF),該核函數在數據聚類中具有優(yōu)勢,且受參數影響較小,適合于區(qū)域分割。LRBF核函數的公式如下:
2.2 融合邊緣梯度約束的平滑項計算
邊緣信息是劃分圖像不同區(qū)域的重要特征。平滑項的作用是描述圖像分割區(qū)域的光滑程度,為使分割達到更好的效果,在平滑項中考慮圖像的邊緣信息,可以減少多區(qū)域分割產生的過分割。由于梯度特征在圖像邊緣變化劇烈,梯度變化可以作為判定圖像邊緣的基本準則。將圖像中邊緣梯度變化作為約束條件融入平滑項,可以保持邊緣的不連續(xù)性,提高區(qū)域邊緣分割的準確性,同時降低過分割現象的出現。則融合梯度約束的平滑項定義為
式中,Bpq為相鄰兩像素點的邊緣梯度約束。設Gp和Gq分別表示像素p和像素q的梯度,則
式中,σ是梯度變化閾值,其值取分割區(qū)域內的梯度方差。因為統(tǒng)計模型采用PCM,Bpq的值由常數C決定,實驗中C取值為5。
從平滑項公式可以看出,像素p和q劃分在不同區(qū)域時,需要確定邊緣不連續(xù)性。如果像素p和q梯度差異較大時,表明兩個像素處于區(qū)域邊緣,那么Bpq的值越小,平滑項確定的能量也越小,則像素p和q被分割可能性越大,可以保持邊緣的不連續(xù)性。如果像素p和q梯度差異較小時,Bpq的值增大,像素p和q被分割可能性減小,減少過分割現象。
統(tǒng)計圖像的顏色特征,用直方圖描述統(tǒng)計量,對于任意級值i,如果H(i)≥H(i±1),則H(i)是峰值。設置K均值聚類的個數為峰值數n,即區(qū)域標簽個數為n。特征值與峰值最接近的像素點設為聚類初始中心。利用確定的中心點和聚類個數,對圖像數據進行K均值聚類,每一個聚類結果成為一個分割區(qū)域,為各個區(qū)域分配初始標簽。聚類個數n與顏色直方圖組距h有關,n與h成反比,經過實驗驗證,h的取值范圍為[10,20]。
計算每個分割區(qū)域Rl(l∈L)的PCM參數μl。首先,μl的初始值為區(qū)域Rl內所有像素顏色特征的均值,用μlo表示。當采用α-β交換算法迭代逼近能量函數最優(yōu)解時,在每次迭代過程中,區(qū)域標簽都會重新分配,μl值也會發(fā)生改變。μl的計算公式如下:
式中,m表示迭代次數,即μlm為第m次迭代時PCM參數μl的值。
Berkeley圖像庫是經典的測試圖像分割效果的數據庫,其中還包含了人工標準分割結果。本文選用該圖像庫中的10幅圖像作為訓練圖像,用于無監(jiān)督圖割方法中參數的選擇實驗;選用300幅圖像做多區(qū)域分割效果測試實驗。實驗的硬件環(huán)境為雙核CPU T2390 1.8GHz,內存2G;軟件環(huán)境為Matlab R2011a開發(fā)平臺。
4.1 平滑項比例系數λ選擇與測試分析
平滑項比例系數λ的取值對圖像多區(qū)域分割的效果有較大的影響,下面具體討論λ的取值原則。
圖1 λ的選擇分析
λ表示在能量函數中平滑項與數據項的比例。λ的值不同,平滑項相對于數據項占有的比例不同,圖像多區(qū)域分割的效果也會不同。依據分割效果的視覺直觀判斷,選擇合適的λ值。以Berkeley庫中圖12003為例,λ的選擇分析過程如圖1所示。如果λ很小,則平滑約束項占有的比重很小,此時主要考慮數據項對能量函數的影響,忽略了平滑項,數據項的約束使圖像中同質區(qū)域都被有效分割,但是由于缺少了平滑項中邊緣梯度約束,分割區(qū)域較小且零散,過分割現象嚴重,不利于后續(xù)的圖像分析與理解。如果λ增大,則平滑項中邊緣梯度約束的作用加大,過分割現象逐漸減小,多區(qū)域分割效果好。但是λ增大到一定程度,平滑項的占有率遠遠大于數據項時,雖然過分割現象消失,但是圖像中有些區(qū)域不能被分割出來。經過實驗測試,λ取值在[2,3]范圍內,無監(jiān)督圖割方法的分割效果最好。
4.2 與其他分割方法的比較
通過圖像訓練測試,選擇好合適的參數之后,進行多區(qū)域分割效果比較實驗。將本文提出的方法與聚類結果融合法[20](fusion of clustering results,FCR)、歸一化分割法[21](normalized cuts,Ncuts)等經典多區(qū)域分割方法進行比較。3種分割方法的區(qū)域分割效果如圖2所示,由于篇幅有限,僅展示了Berkeley庫中一部分的圖像分割結果。以圖2中的分割效果為例,對3種方法進行分析比較。
FCR是一種聚類結果融合方法,采用非穩(wěn)定的馬爾可夫隨機場(Markov rank field,MRF)模型實現6個顏色空間特征聚類結果的融合。由于包含了6個顏色空間中的紋元特征和candy邊緣特征,并進行邊緣的軟分割,圖像誤分割現象較少,但是過分割現象嚴重。例如,圖67079中建筑的屋頂、圖296059中大象的脊背輪廓和圖187029中孩子的頭頂都出現了雙邊緣分割線。
Ncuts是基于圖論的歸一化分割算法,由于歸一化處理,減少了分割結果中的單一孤立分割點,因而分割區(qū)域形狀緊湊。Ncuts方法可以控制分割區(qū)域的數量,而分割區(qū)域總數較?。ǎ?)時,分割效果不理想,本文選用的分割區(qū)域數量為20。圖2的分割效果顯示Ncuts方法分割所得區(qū)域面積大致相近,多區(qū)域分割結果基本準確,但是邊緣分割線波動較大,影響了分割精度。例如,圖295087中樹枝的邊緣線和圖67079中石柱的邊緣線都有較大跳變,與標準分割線有明顯的差別。
本文提出的方法將數據項映射到核空間,實現復雜數據的線性可分,模型簡單通用,計算復雜度低,而區(qū)域分割效果較好,尤其是低維空間中分割復雜的區(qū)域。例如,圖295087上石頭中間的兩個空洞和圖296059中右邊大象嘴下方的天空和草地等區(qū)域處于全包圍狀態(tài),屬于復雜的分割區(qū)域。本文提出的方法對這些區(qū)域的分割效果比其他方法要好。同時,由于融合了邊緣梯度約束,過分割現象也得到抑制,并且邊緣分割線也較為流暢連貫。因此,從視覺效果直觀判斷,本文提出的方法分割效果更為理想。
下面采用概率Rand指數(probabilistic rand index,PRI)、信息變化指數(variation of information,VoI)和邊界偏離誤差(boundary displacement error,BDE)3個評價指標,客觀定量地評價3種方法的分割效果。PRI指標的作用是判斷算法分割結果與標準分割的相同程度,取值范圍在0~1之間,該指標值越大表示算法分割結果越接近標準分割,分割效果越好。VoI是信息變化指數,其值域為非負實數,用條件熵描述算法分割結果不能被標準分割結果解釋的隨機性,該指標越小分割效果越好。BDE指標通過計算區(qū)域邊緣精度來判定分割效果,取值范圍是[0,∞),取值越小表示邊緣偏離誤差越小,分割效果越好。
圖2 3種區(qū)域分割方法圖像分割效果比較
采用本文提出的方法對Berkeley庫中300幅圖像進行區(qū)域分割,統(tǒng)計PRI指標的分布情況如圖3所示。PRI指標高于0.8的圖像數量超出整個圖像庫的四分之三,表明本方法適用范圍廣泛,分割效果不受圖像內容限制。為了進一步驗證本文方法的分割效果,將本文方法與其他兩種典型的多區(qū)域分割方法作量化比較。標準分割和3種分割算法的定量評價指標如表2所示,表中各指標的值是測試Berkeley庫中300幅圖的平均值。通過定量分析,表明本文提出的方法優(yōu)于另外兩種方法。
圖3 Berkeley庫中300幅圖像的PRI指標統(tǒng)計
表2 定量評價指標
通過實驗證明,本文提出的方法不論是主觀視覺判斷還是客觀定量分析,都具有較好的分割效果,表明了該方法在圖像多區(qū)域分割中的有效性。
本文提出一種融合了核方法與邊緣梯度信息的無監(jiān)督圖割算法,通過圖像數據向高維特征空間的映射,擴展了分段常數模型的實際使用范圍,實現了復雜圖像數據的線性可分,既提高了區(qū)域分割效果又降低了計算量。同時,在平滑項中加入邊緣梯度信息,增加了邊緣的劃分精度,減少了過分割的出現,進一步提高區(qū)域分割性能。經實驗定性定量分析,該方法具有較好的多區(qū)域分割效果,也符合多區(qū)域分割的實際要求。本文提出的多區(qū)域分割方法可以較好地解決圖像中多目標自動分割問題,為后面的多目標識別、語義標注、場景理解等研究奠定了良好的基礎。
[1]Carreira J,Sminchisescu C.CPMC:automatic object segmentation using constrained parametric min-cuts[J].IEEE Trans.on Pattern Analysis and Machine Intelligence,2012,34(7):1312-1328.
[2]Kappes J H,Andres B,Hamprecht F A,et al.A comparative study of modern inference techniques for discrete energy minimization problems[C]∥Proc.of the IEEE Conference on Computer Vision and Pattern Recognition,2013:1328-1355.
[3]Liu G,Zhou Z,Xie S.Global minimization of adaptive local image fitting energy for image segmentation[J].Journal of Systems Engineering and Electronics,2014,25(2):307-313.
[4]Boykov Y,Jolly M P.Interactive organ segmentation using graph cuts[C]∥Proc.of the 3rd International Conference on Medical Image Computing and Computer-Assisted Interven-tion,2000:276-286.
[5]Kolmogorov V,Zabih R.Multi-camera scene reconstruction via graph cuts[J].Lecture Notes in Computer Science,2002,2352:82-96.
[6]Rother C,Kolmogorov V,Blake A.“GrabCut”-interactive foreground extraction using iterated graph cuts[J].ACM Trans.on Graphics,2004,23(3):309-314.
[7]Veksler O.Star shape prior for graph-cut image segmentation[J].Lecture Notes in Computer Science,2008,5304:454-467.
[8]Wang B,Li J,Gao X B.An edge-and region-based level set method with shape priors for image segmentation[J].Chinese Journal of Computers,2012,35(5):1067-1072.(王斌,李潔,高新波.一種基于邊緣與區(qū)域信息的先驗水平集圖像分割方法[J].計算機學報,2012,35(5):1067-1072.)
[9]Liu S T,Wang H L,Yin F L.Interactive ship infrared image segmentation method based on graph cut and fuzzy connectedness[J].Acta Automatic Sinica,2012,38(11):1735-1750.(劉松濤,王慧麗,殷福亮.基于圖割和模糊連接度的交互式艦船紅外圖像分割方法[J].自動化學報,2012,38(11):1735-1750.)
[10]Chang J C,Chou T.Iterative graph cuts for image segmentation with a nonlinear statistical shape prior[J].Journal of Mathematical Imaging and Vision,2014,49(1):87-97.
[11]Wang H,Zhang H,Ray N.Adaptive shape prior in graph cut image segmentation[J].Pattern Recognition,2013,46(5):1409-1414.
[12]Boykov Y,Veksler O,Zabih R.Fast approximate energy minimization via graph cuts[J].IEEE Trans.on Pattern Analysis and Machine Intelligence,2001,23(11):1222-1239.
[13]Delong A,Osokin A,Isack H N,et al.Fast approximate energy minimization with label costs[J].International Journal of Computer Vision,2012,96(1):1-27.
[14]Delong A,Veksler O,Boykov Y.Fast fusion moves for multi-model estimation[C]∥Proc.of the 12th European Conference on Computer Vision,2012:370-384.
[15]Vu N,Manjunath B S.Shape prior segmentation of multiple objects with graph cuts[C]∥Proc.of the IEEE Conference on Computer Vision and Pattern Recognition,2008.
[16]Dhillon I S,Guan Y,Kulis B.Kernel K-means,spectral clustering and normalized cuts[C]∥Proc.of the 10th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining,2004:551-556.
[17]Kulis B,Basu S,Dhillon I S,et al.Semi-supervised graph clustering:a kernel approach[J].Machine Learning,2009,74(1):1-22.
[18]Dhillon I S,Guan Y,Kulis B.Weighted graph cuts without eigenvectors:a multilevel approach[J].IEEE Trans.on Pattern Analysis and Machine Intelligence,2007,29(11):1944-1957.
[19]Salah M B,Mitiche A,Ayed I B.Multiregion image segmentation by parametric kernel graph cuts[J].IEEE Trans.on Image Processing,2011,20(2):545-557.
[20]Mignotte M.Segmentation by fusion of histogram-based K-means clusters in different color spaces[J].IEEE Trans.on Image Processing,2008,17(5):780-787.
[21]Shi J,Malik J.Normalized cuts and image segmentation[J].IEEE Trans.on Pattern Analysis and Machine Intelligence,2000,22(8):888-905.
E-mail:tydxcomputer@163.com
謝 剛(1972-),通信作者,男,教授,博士,主要研究方向為智能信息處理、智能控制。
E-mail:xiegang@tyut.edu.cn
Unsupervised graph cuts for image region segmentation
ZHAO Jie1,2,XIE Gang1
(1.College of Information Engineering,Taiyuan University of Technology,Taiyuan 030024,China;2.Department of Computer Engineering,Taiyuan University,Taiyuan 030032,China)
A multi-region image segmentation method based on graph cuts is proposed.Original image data is transformed into high-dimension feature space via the implicit nonlinear mapping of data term by kernel function,so that the effect of segmentation is improved,multi-class partition of the image is achieved and the application of the piecewise constant model is extended.Due to the edge gradient of the image dramatically changes with discontinuity,the gradient constraint is introduced to smooth terms in order to reduce the over segmentation.Simultaneously,initial parameters are set by the unsupervised method without user interactions to meet the requirements of multi-region segmentation.Experiment results show that the proposed method is not restricted by the content of the image and has better segmentation results through both the subjective visual judgement and the quantitative analysis.
region segmentation;graph cuts;kernel method;edge gradient
TP 391
A
10.3969/j.issn.1001-506X.2015.06.31
趙 婕(1978-),女,講師,博士研究生,主要研究方向為圖像處理、分析與理解、模式識別與機器學習。
1001-506X(2015)06-1431-06
2014-07-07;
2014-10-10;網絡優(yōu)先出版日期:2014-11-20。
網絡優(yōu)先出版地址:http://www.cnki.net/kcms/detail/11.2422.TN.20141120.1831.004.html
太原市科技項目人才專項基金(12024728)資助課題