魏明樺,鄭金貴
1.福建農(nóng)林大學 作物科學學院,福州 350007
2.福州職業(yè)技術學院 信息技術工程系,福州 350108
圖像分割是機器視覺與圖像處理學科的基礎問題,原始圖像像素點通過圖像分割轉(zhuǎn)化成若干個區(qū)域,不但能夠消除大量的冗余信息,還能夠提升后續(xù)圖像處理的性能[1-3]。分割后的圖像區(qū)域帶有自身的尺度約束,使其產(chǎn)生更有意義的性能,而這些性能可以更多地應用至機器視覺的各項應用中[4-6]。因此,圖像分割擁有較強的應用價值。
圖像分割有早期的閾值分割[7]、Graphcut分割[8]、超像素分割等方法[9],近幾年朝著不同的方向發(fā)展。有學者通過融合特征構建圖割算法[10],也有學者采用可變組件模型的Hoiem算法[11],還有更為細致的超像素分割與區(qū)域合并算法[12],以及基于PFE(piecewiseflatembedding)的多標簽圖割算法[13],另外還有學者通過深度神經(jīng)網(wǎng)絡構建圖像分割方法[14]。相比于傳統(tǒng)方法,近幾年提出來的層級分割算法產(chǎn)生了更優(yōu)的效果[15]。實際上,按照人類的視覺信息分組過程,層級分割模擬人類視覺,將某個像素點組成的區(qū)域看作是一個層級,從底向上組成層級樹,最終形成復雜的分割目標。人類視覺系統(tǒng)的層次分割規(guī)律模擬至圖像分割上產(chǎn)生的層級分割算法,是當前效果顯著,且意義重大的圖像分割算法之一。
當前最常用的層級圖像分割算法為超度量輪廓圖(ultrametric contour map,UCM)圖像分割算法[16]。該算法通過方向性分水嶺變換算法將原始圖像中的輪廓信號變換為超度量輪廓圖,再在UCM上迭代地完成相鄰區(qū)域融合以形成圖像的層級分割。然而,該算法在圖像輪廓的提取上,采用分水嶺算法的變換上,以及UCM層級樹的劃分上還存在較多模糊區(qū)域,使其針對色彩范圍大、紋理碎片多的圖像分割不佳,對輪廓適應性弱、層級匹配能力較弱且分割碎片較多等。為了解決傳統(tǒng)UCM算法的不足之處,本文提出一種自適應目標與內(nèi)容匹配的改進UCM層級分割圖像算法,該算法使用“輪廓盒子(edge boxes)”提取圖像關鍵輪廓,然后使用加權分水嶺算法合并區(qū)域,并采用動態(tài)規(guī)劃的方式自適應完成目標與內(nèi)容匹配,重新調(diào)整UCM層級樹的尺度,最終完成調(diào)整尺度后的UCM層級圖像分割。
本文的創(chuàng)新點如下:
(1)提出了加權分水嶺算法,該算法解決了原始算法對圖像輪廓適應性弱的問題;
(2)提出了自適應目標與內(nèi)容匹配的方法,通過動態(tài)規(guī)劃的方式重新調(diào)整UCM層級樹的尺度,使得相同尺度的層級區(qū)域劃分至同一個類別,減少了分割碎片,保證了層級匹配。
UCM層級分割算法首先采用gPb輪廓檢測算子[17]提取圖像關鍵輪廓,隨后使用有向分水嶺(oriented watershed,OWT)算法將輪廓信號變換為超度量輪廓圖,然后使用UCM算法完成目標分割。實際上,由于gPb輪廓算子的計算開銷較大,計算過程比較復雜。在本文的改進UCM層級圖像分割算法中,首先采用“輪廓盒子”[18]提取到圖像的關鍵輪廓,該方法能夠快速提取到圖像輪廓,大幅度降低圖像分割的時間復雜度;然后采用改進的加權WT算法將輪廓信號變換為超度量輪廓圖,通過加權WT算法能夠有效消除傳統(tǒng)OWT算法產(chǎn)生的“偽輪廓”,讓UCM算法更為精確。
在傳統(tǒng)UCM算法中,采用的有向分水嶺(OWT)算法對分水嶺的邊緣完成直線擬合,通過有向的方式可以使分水嶺邊上的每個像素均有一個方向,在進行分水嶺賦值過程中將會以一定的邊緣概率選擇相應方向上的邊緣,OWT算法能夠很好地解決傳統(tǒng)WT算法產(chǎn)生的“偽輪廓”問題[19]。然而,OWT算法要求輸入的輪廓帶有方向性,但是并不能滿足所有的邊緣檢測算子,適應性較弱。因此,本文結合OWT算法提出了一種改進的加權WT算法,該算法能夠滿足絕大多數(shù)邊緣檢測算子,適應性強,且同時能夠有效地解決“偽輪廓”問題。在加權WT算法中,分為賦值和抑制兩個階段:
(1)賦值階段。由于傳統(tǒng)WT算法將會產(chǎn)生過多的微小碎片分割,首先將原始邊緣E(x,y)通過高斯模糊σ=1后獲得Ef(x,y);然后采用WT算法,獲得邊緣的基礎分水嶺分割圖Sw(x,y),使用Sw(x,y)=1表示點(x,y)處對應的像素屬于分水嶺的邊,因此分水嶺的邊即可按照原始邊緣檢測分布,通過下式給出的判斷進行分水嶺邊的賦值:
經(jīng)過上式計算獲得具有軟邊緣的分水嶺邊緣圖像Ew(x,y),實際上還是會增強一些邊緣的強度。
(2)抑制階段。在抑制階段中,首先將提取的輪廓Ef(x,y)進行非最大值抑制,獲得非最大抑制輪廓Enms(x,y)。圖1給出了抑制后的輪廓結果。由于Enms(x,y)是按照原始輪廓圖的邊緣進行分布的,其并不會產(chǎn)生額外的邊界,從而該輪廓圖可以用于重新加權分水嶺邊緣的強度值。實際上,通過對分水嶺輪廓Ew(x,y)和非最大抑制輪廓Enms(x,y)進行加權求和,以獲得分水嶺軟邊輪廓圖:
其中,Sw(x,y)=1用于給出限制條件,讓該加權求和的過程僅發(fā)生在求解的分水嶺邊緣上。圖1給出了加權WT算法過程與結果圖。本文改進的加權WT算法能夠通過更為簡便的非最大抑制和加權運算消除“偽輪廓”的影響,同時也不會對輪廓圖有特定方向的要求。在實驗中,α、β的值是根據(jù)BSDS500驗證集上的優(yōu)化計算得到的。在加權分水嶺算法中,需要通過非最大抑制輪廓來抑制分水嶺輪廓圖像中的細節(jié)噪聲。根據(jù)圖1中的結果可以看出,非極大抑制輪廓能夠保留給出原始分水嶺輪廓圖像中的許多紋理細節(jié),而分水嶺輪廓的圖像在大輪廓上的結果較為明顯。在實驗中,應該保證權重α+β=1,為了分別確定兩個不同的權重,可以通過觀察原始分水嶺輪廓的強度,當大輪廓強度過大,而小輪廓幾乎被抑制掉時,α選擇的范圍是α∈[0.35,0.50],而當大輪廓強度一般,小輪廓的部分細節(jié)還在的情況時,α選擇的范圍是α∈[0.50,0.65],非極大抑制輪廓的權重則通過分水嶺輪廓的等式關系來確定。在圖1的情況下,由于大輪廓的強度較大,選擇α=0.4,β=0.6。
通過加權WT算法構建的邊緣強度給出了各個像素點滿足真正輪廓的概率,這樣就可以通過邊緣圖的分布來刻畫出圖像分割的層級性?;诖说腢CM算法通過定義在閉合的、非交叉的,帶有權重的層級輪廓關系,進而完成輪廓信號變換為超度量輪廓圖(UCM)。其中,等級低的層級與弱邊緣相關聯(lián),形成圖像的多分割;等級高的層級與強邊緣相關聯(lián),形成圖像的欠分割。由于在層級變換過程中可以產(chǎn)生出不同尺度的分割區(qū)域,可以在分割過程中,通過多個層級的區(qū)域信息作為先驗知識,并確定采用哪個層級完成分割任務。UCM算法可以對每個層級編碼成樹,并對輪廓的強度設置閾值,通過閾值分割保留閾值之上的輪廓,產(chǎn)生一系列封閉輪廓。對于在UCM中生成的嵌套輪廓,可以通過移除交叉邊緣來完成兩個嵌套區(qū)域的融合。
Fig.1 Procedure and results of weighted watershed algorithm圖1 加權WT算法過程與結果圖
UCM通過圖論來構建完整的層級區(qū)域樹,并通過貪心算法來實現(xiàn)。在UCM中,假設初始定義的圖為G=(P0,K0,W(K0))。其中,圖的節(jié)點是層級輪廓的初始區(qū)域P0,節(jié)點之間的邊K0,用于分開兩個相鄰的區(qū)域,邊上的權重W(K0)是兩個相鄰區(qū)域的距離度量。通過無向圖的定義,可以采用UCM計算出各個輪廓的平均強度,然后將各個邊按照權重進行排序,以迭代的方式,融合當前權重最小的兩個區(qū)域,并移除它們的交叉邊緣。迭代完成的條件是直到整幅輪廓產(chǎn)生的區(qū)域樹的根節(jié)點是整幅圖像,葉子節(jié)點是初始分割P0,上層層級的區(qū)域總是由下層層級的子區(qū)域組合而成。
根據(jù)上述給出的過程,本文構建了一個以Edge boxes-加權WT-UCM的改進層級圖像分割算法。圖2給出了采用該方法進行圖像分割的一個實例。如圖2(c)所示,通過加權WT-UCM的過程,可以從圖像輪廓圖上獲得包含有全部層級分割信息的UCM,進而求出了該UCM下的圖像分割結果,如圖2(d)。圖2(e)中給出了取閾值θ=0.4后產(chǎn)生的不同UCM結果,圖2(f)中給出了相應的圖像分割結果。
Fig.2 Example on improved edge boxes-weighted watershed-UCM algorithm圖2 Edge boxes-加權WT-UCM的圖像分割算法
UCM層級樹是通過區(qū)域間的合并獲得的,然而,很難通過實際的角度去處理這些合并以及構建UCM層級樹。實際上,圖像的一個分割過程可以被表達成一個關于每個像素點的標簽矩陣,UCM層級樹則需要更負責的標簽表達方式。在本研究中,UCM被用于自適應的層級目標和內(nèi)容的自適應匹配中來,因此構建UCM層級樹的剪枝過程成為了分割中的重要部分,因為剪枝后的部分對圖像分割意義重大。由于UCM層級樹是基于低等級的特征構造出來,例如,邊緣、顏色或紋理特征。實際上,這些特征目標的尺度并不能夠直接形成連貫,因此在層級豎行將會產(chǎn)生一定的差異性。本文提出的方法能夠從UCM層級樹的中等級特征中學習到目標的尺度概念。本文算法的目的是盡可能多地利用UCM層級樹的中等級特征的特性,而盡量避免獲得UCM層級樹中的高等級特征。中等級特征能夠為算法在分割圖像過程中獲得超越尺度的限制,讓分割的結果表現(xiàn)在各個中級特征尺度下,分割的效果更為平滑。在這些基礎的分析之上,本文算法需要首先以低等級的特征構造出UCM層級樹,然后在UCM層級樹上探索并構建出中等級特征,以最大程度獲得層級圖像分割圖像的一部分。另外,本文的自適應匹配算法旨在提供一個在所有圖像中的全局自適應匹配過程,也就是說,當改變待分割圖像的時候,依然能夠通過該算法提供尺度的層級來保證層級樹中的中等級特征,保證算法對所有圖像分割的有效性。當UCM層級分割算法包含有圖像中的大量多尺度分解時,此時并不需要提取如此豐富的UCM層級知識,因為當前形成的UCM層級并不是完全按照分割目標與分割內(nèi)容相匹配來完成的。簡單來說,去掉其中一個UCM層級將會造成某些輪廓出現(xiàn)欠分割,同時另一些輪廓出現(xiàn)過分割。在本章中,提出另一個可以自適應匹配分割層級的算法,該算法能夠使得圖像的UCM層級在實際使用過程中更為容易。首先將UCM層級的尺度標上標簽,然后采用自適應匹配的策略完成對目標和內(nèi)容的匹配。
使用τ表示圖像經(jīng)過UCM層級分割后產(chǎn)生的層級樹,且vi是層級樹上第i個節(jié)點,與圖像分割片段相對應。在層級樹τ中,本文的任務是尋找樹的切片過程ξ,該切片過程能夠?qū)⒄麄€層級樹的所有節(jié)點(UCM層級)劃分為三部分:L-、L、L+。該三部分分別表示欠分割層級、適合分割層級和過分割層級。圖3給出了一個將UCM層級樹劃分的例子。
Fig.3 Example of UCM hierarchical tree slice圖3 UCM層級樹劃分例子
UCM層級樹劃分的問題可以看作是三類別標簽的分類問題。對于每個節(jié)點vi,使用x(vi)∈{-1,0,1}表示它的類別標簽,其中的-1、0、1可以分別表示對應的L-、L、L+分類?,F(xiàn)在假設有映射函數(shù)f(vi):vi→[-1,1]用于提供檢測UCM層級樹之間的間隔尺度。其中,負值表示的是欠分割的層級,0表示的是合適分割的層級,正值表示的是過分割的層級。f(vi)的實際輸出值構成了是否適合層級分割的偏差值,后面給出求解f(vi)的學習算法過程。
層級樹的各個節(jié)點vi的打標簽過程可以通過貪婪地求解每個節(jié)點的最優(yōu)得分類別來完成。然而,并不是任何的標簽都能夠表達出層級樹的合理劃分。根據(jù)文獻[20]中對層級樹劃分的定義來看,層級樹的劃分包含有一組節(jié)點,且這些節(jié)點將會組成任意一條路徑Pn,n∈{1,2,…,N},且所有路徑都是從葉子節(jié)點開始到根節(jié)點結束v0,并且路徑中僅僅包含該組所有節(jié)點一次。在圖3(a)中用綠色的線條給出了一條路徑的例子。
其中,#(v)表示的是層級樹節(jié)點v的能量大小,λ是兩個能量項之間的權重值,l(vi)為節(jié)點標簽vi∈{L-,L+}定義的損失函數(shù),該損失函數(shù)通過x(vi)和f(vi)之間符號的一致性來定義:
損失函數(shù)通過下面兩個對立的條件進行懲罰,從而解決優(yōu)化問題:
(1)具有正值得分的過分割對應的層級區(qū)域;
(2)具有負值得分的欠分割對應的層級區(qū)域。
在本文中,通過動態(tài)規(guī)劃方法解決該優(yōu)化問題。
3.1.1 動態(tài)規(guī)劃方法推理
UCM層級樹打標簽的優(yōu)化問題是帶受限條件的結構化問題(式(3)),可以通過迭代的動態(tài)規(guī)劃方法解決該優(yōu)化問題。對于任意子樹的根節(jié)點v,它的最優(yōu)劃分L(v)或者是節(jié)點本身,或者是它所有孩子節(jié)點vc的最優(yōu)劃分組合,最優(yōu)劃分依賴于能量更低的孩子節(jié)點組成的劃分路徑。因此,該優(yōu)化問題存在更優(yōu)的子結構,且能夠輕易地適應動態(tài)規(guī)劃的框架,因此采用動態(tài)規(guī)劃方法可以求解最優(yōu)的全局方案。
該優(yōu)化問題是針對UCM層級樹自底向上求解。對于每個子樹的當前根節(jié)點v,其相應的能量v∈L(v)可以被計算出來,并且其所有孩子節(jié)點的最優(yōu)劃分的能量也需要被計算出來用于對比。算法可以來回遍歷,并且所有的最優(yōu)化劃分與子節(jié)點的最優(yōu)化劃分之間的能量比較可以在算法到達根節(jié)點之前完成。當算法迭代到根節(jié)點時,即可獲取UCM層級樹的全局最優(yōu)劃分結果,即式(3)的最優(yōu)結果。采用動態(tài)規(guī)劃算法求解該優(yōu)化問題效率較高,可以在O(N)的時間復雜度內(nèi)完成全局最優(yōu)劃分的求解。
動態(tài)規(guī)劃方法推理過程如下所示:
輸入:UCM層級樹節(jié)點vi。
3.1.2 預測層級區(qū)域的尺度
為了預測某個UCM層級區(qū)域的尺度屬于欠分割、適合分割或過分割,采用當前機器視覺系統(tǒng)的一般方法,通過人類標注數(shù)據(jù)學習出一個預測器,再采用該預測器對UCM層級區(qū)域完成預測。為了達到學習預測器的目的,定義了一個判斷過程用于比較當前圖像層級區(qū)域r與相應的人類標準的圖像層級區(qū)域g的尺度。在比較和判斷中,計算層級區(qū)域r與層級區(qū)域g的重復率(interaction of unit,IoU),重復率最高的人類主觀判斷標準結果將被認為是最佳結果。
當獲得了最佳尺度的層級區(qū)域g之后,層級區(qū)域r的尺度可以通過下式定義計算得出:
其中,S(r)的取值范圍是[-1,1],負值取值被認為是欠分割,0取值被認為是合適分割,正值取值被認為是過分割,取值的大小反映了欠分割或過分割的程度,也就是期望從f(v)中獲得的最優(yōu)結果。通過式(5),可以計算出各個層級區(qū)域的尺度,并且可以將這些尺度結果用于訓練層級區(qū)域的尺度預測器。
在學習層級區(qū)域的尺度預測器中,采用隨機森林回歸[22]作為預測f(v)的機器學習模型,由于隨機森林屬于級聯(lián)分類器,可以在不同的級別中對不同類型的特征進行分類,最終再通過加權分類,適合本文采用的組合特征的分類。對于隨機森林回歸的輸入特征,使用了低等級和中等級的組合特征,提取方法采用了文獻[22]中使用的目標提取過程。設計了獲取一系列區(qū)域特性的特征,并且在實驗結果中給出了組合特征的具體描述。
在通過動態(tài)規(guī)劃方法求解出UCM層級區(qū)域的最優(yōu)劃分后,根據(jù)該最優(yōu)化劃分展開UCM層級樹。圖4給出了本文提出的層級目標與內(nèi)容自適應匹配過程。其中,圖4(a)表示的是所有目標都存在于相同尺度的UCM層級樹,而圖4(b)則表示出了層級目標與內(nèi)容自適應后的UCM層級樹,可以看出相似尺度的分割目標都處在UCM層級樹的同一層。在實驗中,使用每個最優(yōu)節(jié)點的閾值作為控制點,并且采用該控制點對原始的層級進行線性插值。在UCM層級分割產(chǎn)生的層級樹中,包含有大小為(2h+1)×(2w+1)的節(jié)點矩陣,其中h是原始圖像的高度,w是原始圖像的寬度。對于原始圖像中的每一對相鄰節(jié)點,UCM矩陣中的值表示了它們的邊界強度,取值范圍為[0,1]。下面給出本文的層級目標與內(nèi)容自適應匹配的算法過程。
Fig.4 Matching procedure of hierarchical objects and self-adapted contexts圖4 層級目標與內(nèi)容自適應匹配過程
輸入:UCM層級樹MUCM,以及該層級樹的最優(yōu)劃分S。
其中,Boundary(r)表示的是UCM層級區(qū)域r對應的邊界元素,InnerArea(r)表示的是其內(nèi)部區(qū)域。UCM層級樹排列的最優(yōu)化劃分的閾值采用的是UCM算法中的閾值,由于UCM算法針對任何閾值都能夠保留好層級,因此閾值的實際取值在合適范圍內(nèi)均可。在傳統(tǒng)的UCM算法中,層級的構建采用的是貪婪圖的方法,采用層級間的相似性的鏈接,通過迭代的方式完成相似區(qū)域的合并,針對初始化定義的圖G=(P0,K0,W(K0))進行如下的迭代操作:
(1)選擇最小化的權重邊緣:
(2)使用最小化的權重邊緣C*迭代的分割區(qū)域P0,獲得多個子區(qū)域R1,R2∈P0。
(3)合并兩個子區(qū)域R=R1?R2,并更新P0←P0{R1,R2}?{R},K0←K0{C*}。
(4)分離的相鄰子區(qū)域K0為空,那么停止迭代,否則更新相鄰子鄰域之間的權重W(K0),并且重復(2)、(3)兩個步驟。
該步驟可以產(chǎn)生以區(qū)域為元素的UCM層級樹,其中的葉子包含有初始化區(qū)域P0,而根節(jié)點則包含的是整個圖像,所有的區(qū)域都通過包含關系被UCM層級樹排序好。因此,可以通過該UCM層級樹中加權每一個邊界的大小來獲得實值的分割后圖像。實際上,通過UCM層級樹形成的分割結果是帶權重的邊緣圖像,因此具有出色的特性,可以通過任何的閾值產(chǎn)生合適的封閉邊緣。為了讓結果更為穩(wěn)定,在實際分割過程中的閾值設置在θ∈[0.4,0.6]范圍內(nèi),在本文的展示圖像上,使用閾值θ=0.4來排列最優(yōu)的劃分,使得后續(xù)的分割變得更為簡便。
為了驗證本文提出算法的可行性和有效性,本文采用BSD500數(shù)據(jù)集作為實驗數(shù)據(jù)集。該數(shù)據(jù)集中包含有500張圖像,其中200張圖像作為訓練集,100張圖像作為驗證集,200張圖像作為測試集。每張圖像邀請5個不同的學生進行人工標注,并使用標注的平均值作為該圖像對應的人工標注類別。在圖像分割對比的指標上,分別選擇了分割掩蓋率(segment cover,SC)、概率邊緣指標(probabilistic region index,PRI)和信息變化率(information variation,IV)3個衡量指標,3個指標分別在最優(yōu)數(shù)據(jù)集尺度(optimal dataset scale,ODS)和最優(yōu)圖像尺度(optimal image scale,OIS)上進行衡量[23]。
在本文的對比實驗過程中,針對以下5種方法進行對比:
(1)gPb-OWT-UCM算法(POU)[16];
(2)Edge boxes-OWT-UCM算法(EOU)[16,18];
(3)gPb-加權OWT-UCM算法(PWU)[12,16];
(4)Edgeboxes-加權OWT-UCM算法(EWU)[12,16,18];
(5)Edge boxes-加權OWT-UCM算法+自適應目標與內(nèi)容匹配算法(EWUR)(本文算法)。
訓練過程:BSDS500數(shù)據(jù)集的訓練集和驗證集合并到一起作為訓練集,用于對隨機森林回歸的訓練。5種對比算法用于形成UCM層級樹,從訓練樣本中提取出UCM層級區(qū)域。針對每種算法訓練出與之相對應的層級區(qū)域尺度預測器。由于層級區(qū)域中有很大一部分區(qū)域?qū)儆诒容^小的待分割區(qū)域,并且從這些比較小的待分割區(qū)域中提取混合特征是不可靠的,因此在訓練預測器過程中排除一些小于50個像素點的小分割區(qū)域。特別是對于每個待預測的層級區(qū)域r,通過獲取人類主觀確定的最優(yōu)層級區(qū)域g的最大IoU得分來給予這些區(qū)域標簽。通過式(5),可以計算出層級區(qū)域r的相對尺度對應的區(qū)域標簽。對于區(qū)域r中想要提取的組合特征,采用文獻[23]中給出的目標候選提取算法提取獲得。在這種情況下,較大的中級等級特征組合被定義用于描述層級區(qū)域,采用的組合特征如下所述:
(1)圖分布特征:交叉、交叉率、歸一化交叉和非平衡歸一化交叉。
(2)區(qū)域特征:面積、周長、候選框大小、等價橢圓最大的和最小的坐標系長度、離心率、方位、凸包區(qū)域,以及歐拉系數(shù)。
(3)完型特征:內(nèi)部和外部區(qū)域紋理相似性、內(nèi)部和外部區(qū)域亮度相似性、內(nèi)部和外部區(qū)域邊緣能量以及曲線連續(xù)性和曲線凸包。
從UCM層級樹中一致采樣獲得的層級區(qū)域子集中提取到上述的組合特征。在使用組合特征訓練隨機森林回歸預測器過程中的參數(shù)設置如下,每個隨機森林包含有100個決策樹;動態(tài)規(guī)劃優(yōu)化式(3)中的λ=0.1用于平衡3種不同尺度組的信息,因為在最優(yōu)劃分L上將會有更多的過分割和欠分割層級區(qū)域。
表1給出了實驗中5種圖像分割算法的對比結果。從表1中的結果可以看出,通過改進的輪廓提取算法、加權分水嶺算法以及自適應的目標與內(nèi)容匹配的改進獲得了相當大的分割效果提升,更重要的是,在分割性能上與傳統(tǒng)UCM算法也相差不大。相比于OIS指標,本文的改進算法在ODS指標上的性能提升更明顯,因為OIS指標隸屬于對于單個圖像求解最優(yōu),單個圖像的尋優(yōu)將會減少機器學習的知識模型帶來的優(yōu)勢。因此,在圖像分割效果的對比指標上,ODS指標比OIS指標在實際機器視覺應用上具有更強的實用價值,因為實際應用中并沒有人類標注的最優(yōu)標簽。
Table 1 Comparison results of 5 different algorithms in experiments表1 實驗中5種圖像分割算法的對比結果
圖5給出了4幅典型的采用目標與內(nèi)容匹配的UCM層級分割算法的實驗結果。最左邊給出了原始圖像,從左至右則給出了自適應尺度由精到簡的圖像分割結果,紅框給出了人類主觀的分割最優(yōu)結果。從圖5的分割結果中可以看出,當平坦的區(qū)域通過自適應匹配取出后,自適應層級匹配后的分割結果能夠形成與人類更接近的特性。更重要的是,在自適應匹配之后,UCM層級形成了圖像的連續(xù)區(qū)域,包括過分割、合適分割和欠分割層級區(qū)域,且這些區(qū)域是從上到下的層級。這種分割特性能夠讓本文提出的圖像分割算法應用至更高級的機器視覺領域中。
圖6給出了本文實驗驗證的五種算法的分割結果對比。分別是實驗過程中提到的POU算法、EOU算法、PWU算法、EWU算法和EWUR算法。從圖6的對比結果中可以看出,本文提出的改進算法比傳統(tǒng)UCM層級分割算法獲得了較大的提升。從初始輪廓提取、分水嶺輪廓合并到自適應層級與內(nèi)容相匹配,圖像在分割過程中的效果獲得了一系列的提升,該方法能夠更好地適用于機器視覺領域中的目標提取、三維重建等復雜任務。實際上,通過自適應層級與內(nèi)容相匹配,本文構建的算法可以讓處于同級別的層級能夠在分割過程中合并至相同分割層級中,減少圖像分割過程中的碎片區(qū)域,讓分割結果變得更為緊湊,本文提出的算法能夠更好地保留跨層級之間的邊緣。
為了驗證本文提出的算法與現(xiàn)階段主流圖像分割算法之間的分割效果及分割性能,本文選擇了Threshold[7]、FusionCut[10]、DeepNN[14]、Hoiem[11]、ISCRA(image segmentation by cascaded region agglomeration)[12]以及PFE[13]等算法進行了分割效果的對比。表2給出了本文算法與主流圖像分割算法的對比結果。仍然采用SC、PRI和IV三個指標分別在ODS和OIS上進行了對比。從表2的結果中可以看出,本文提出的算法在SC和IV指標上獲得了最佳的效果,在PRI指標上,最新提出的PFE算法獲得了最好的效果。值得注意的是,本文提出的自適應層級與內(nèi)容相匹配的優(yōu)化過程,同樣可以適用至PFE+MCG(multiscale combinatorial grouping)算法中,使其獲得更優(yōu)的效果。
Fig.5 Results of UCM based on self-adapted objects and context圖5 目標與內(nèi)容匹配的UCM層級分割算法結果
Fig.6 Comparison results of 5 different image segmentation algorithms圖6 5種圖像分割算法的對比結果
Table 2 Comparison results between proposed algorithm and state-of-the-art algorithms表2 本文算法與主流圖像分割算法對比結果
本文的實驗在Windows 10 64 bit系統(tǒng),Genuine Intel?i7-6300 CPU,8 GB內(nèi)存的環(huán)境下進行。表3給出了在BSDS500數(shù)據(jù)集上各種不同算法的時間復雜度對比。從該表中的對比結果可以看出,本文算法的時間消耗集中在UCM層級樹和特征提取過程中,在隨機森林回歸預測與動態(tài)規(guī)劃的優(yōu)化過程中的時間消耗不大,與主流算法之間的時間復雜度消耗處于同級別。
本文通過“輪廓盒子”提升了UCM算法的輪廓提取性能,并采用加權WT算法解決了輪廓適應性問題;隨后采用動態(tài)規(guī)劃自適應調(diào)整目標與內(nèi)容的匹配,提升了UCM層級算法的分割精度,解決了層級匹配能力較弱且分割碎片較多等問題。然而,本文算法還存在提升的空間,今后的研究包括為層級圖像分割算法提供更為精準的層級劃分以及更高的算法效率,以期滿足更多的機器視覺和圖像處理場景,獲得更多的應用。