金曉民, 張麗萍, 李慧靜
(1.內(nèi)蒙古大學(xué) 交通學(xué)院, 呼和浩特 010070; 2.內(nèi)蒙古師范大學(xué) 計算機科學(xué)技術(shù)學(xué)院, 呼和浩特 010022)
圖像模式識別與場景分析已廣泛應(yīng)用于虛擬現(xiàn)實、模式識別及衛(wèi)星遙感圖像等領(lǐng)域, 圖像分割是圖像處理中最重要的預(yù)處理部分之一[1].目前已有許多圖像分割方法, 其中分割效率較高的是閾值分割方法.最大類間方差方法是典型的閾值分割方法[2], 該方法以最小二乘法為基礎(chǔ), 可獲取較優(yōu)的分割結(jié)果, 但最大類間方差方法需通過遍歷方法尋找類間方差最大閾值, 計算過程較復(fù)雜[3].活動輪廓波模型是通過能量最小化檢測輪廓的模型, 該模型選取圖像目標距離較近的點并設(shè)置為初始輪廓, 利用能量函數(shù)極小化令輪廓形成彈性形變, 利用輪廓形狀迅速獲取目標特征, 如何獲取圖像全部初始輪廓點的最優(yōu)控制點, 目前還沒有好的解決方法[4-5].粒子群優(yōu)化算法具有靈活、適應(yīng)性以及尋優(yōu)能力強等優(yōu)點, 在圖像分割中應(yīng)用廣泛, 但對于復(fù)雜、含噪的圖像, 單一粒子群優(yōu)化算法也存在不足.在復(fù)雜的圖像分割問題中, 單一活動輪廓波模型或者粒子群優(yōu)化算法均存在“過分割”或“欠分割”現(xiàn)象, 且圖像分割速度較慢、魯棒性較差[6-8].
為求得活動輪廓波模型的圖像分割最優(yōu)控制點, 以獲取最佳圖像分割結(jié)果, 本文將粒子群優(yōu)化算法與活動輪廓波模型相結(jié)合, 提出一種控制活動輪廓演化的快速圖像分割方法.先采用粒子群優(yōu)化算法獲取活動輪廓波模型的最優(yōu)控制點, 再根據(jù)最優(yōu)控制點進行控制活動輪廓演化, 并通過仿真實驗分析其性能.
活動輪廓波模型需將封閉曲線設(shè)置在所分割圖像的目標附近, 利用外部與內(nèi)部能量使曲線通過最優(yōu)路徑移動, 保持曲線能量不間斷更新, 直至曲線到達圖像所需分割目標輪廓附近.曲線能量最小時, 分割效果最好.活動輪廓波模型的外部能量與內(nèi)部能量加權(quán)和為曲線能量函數(shù), 內(nèi)部能量與外部能量分別通過曲線形狀及圖像獲取.活動輪廓波模型離散化公式為
(1)
其中Fint(i,k)和Fext(i,k)分別表示圖像迭代點i在第k次迭代時的內(nèi)部能量和外部能量.
圖像的內(nèi)部能量和外部能量可通過連接能量與彎曲能量及圖像梯度表示, 式(1)可分解為
(2)
其中:Fconnect(i,k)和Fcurve(i,k)分別表示迭代點i在第k次迭代時的彎曲能量和連接能量;Fimage(i,k)表示迭代點i在第k次迭代時的圖像能量;n表示曲線上離散點數(shù)量;β為彈力系數(shù), 其值越大表明曲線收斂速度越高, 彈力系數(shù)可有效控制活動曲線的收縮速度;α為強度系數(shù), 活動曲線在α過大時較難形成彎曲, 活動曲線在α過小時極易產(chǎn)生形變.式(2)中的αFcurve(i,k)+βFconnect(i,k)與式(1)中Fint(i,k)相同; 式(2)中γFimage(i,k)與式(1)中Fext(i,k)相同.Fconnect(i,k)描述活動曲線長度的變化率, 屬于離散點間的一階微分, 曲線收斂過程中的連續(xù)性可通過Fconnect(i,k)控制.Fcurve(i,k) 描述曲線的曲率變化,Fcurve(i,k)為離散點間二階微分的平方和, 控制活動曲線移動至圖像目標, 活動曲線移動至圖像目標速度由系數(shù)α控制.通過Fimage(i,k)判斷初始化曲線是否收斂至圖像分割的真實邊界.圖像能量最大處與最小處分別為邊界處曲線圖像及非邊緣處圖像,γ表示圖像力系數(shù),Fimage(i,k)通常為負, 且γ>α,β.
粒子群優(yōu)化算法是利用鳥群飛行覓食行為中個體間互相協(xié)作獲取群體最優(yōu)的群智能算法, 其通過迭代方式獲取問題最優(yōu)解.用粒子群優(yōu)化算法求解問題時, 先將所需解決問題設(shè)置為粒子, 設(shè)空間為b維, 令b維空間中數(shù)量為n的粒子運動形成粒子群.尋找問題最優(yōu)解時, 令空間中隨機形成粒子群, 利用粒子群迭代尋優(yōu)獲取問題最優(yōu)解, 粒子在迭代過程中利用局部最優(yōu)解與全局最優(yōu)解調(diào)整迭代速度與粒子位置, 更新新的粒子群, 并計算適應(yīng)度函數(shù), 根據(jù)所獲取的適應(yīng)度值將無法繼續(xù)尋優(yōu)的粒子淘汰, 粒子群不斷更新直至收斂獲取全局最優(yōu)解, 粒子群更新速度公式為
vk+1=wvk+c1r1(qbestk-xk)+c2r2(qgbestk-xk),
(3)
粒子群位置更新公式為
xk+1=xk+vk+1,
(4)
其中:xk和vk分別表示粒子的目前位置和速度矢量;qbest和qgbestk分別表示粒子在迭代過程中的最優(yōu)解及迭代過程中粒子群的整體最優(yōu)解;w表示加權(quán)因子, 其調(diào)整公式為
(5)
式中,wmax為慣性權(quán)重最大值,wmin為慣性權(quán)重最小值,mmax和mter分別為最大迭代和當前迭次數(shù).
粒子群優(yōu)化算法中粒子通過不斷更新迭代使空間中粒子具有最優(yōu)全局搜索能力及精細的局部搜索能力, 并通過動態(tài)調(diào)整限制粒子群中各粒子不同維度速度, 使粒子搜索速度小于vmax, 限制粒子搜索速度使粒子群中的粒子在迭代過程中避免發(fā)生失序情形, 并使粒子群全局尋優(yōu)能力隨著粒子數(shù)量增加而增加.
將粒子群優(yōu)化算法的適應(yīng)度函數(shù)與活動輪廓波模型相結(jié)合, 提出一種控制活動輪廓演化的快速圖像分割方法.利用一組控制點描述曲線T, 通過控制點迭代實現(xiàn)能量最小化.將活動輪廓波模型積分形式離散化至差分形式, 獲取控制點qi(x,y)附近的能量, 即
Fi,j=Fint+Fext+Farea.
(6)
曲線輪廓的彈性與連續(xù)性通過內(nèi)部能量控制, 公式為
(7)
曲線向圖像目標邊緣移動由外部能量控制, 公式為
(8)
通過增設(shè)一個面積, 使曲線向圖像分割目標區(qū)域移動, 公式為
Farea=δTarea,
(9)
其中δ表示面積力.Tarea在搜索到圖像分割目標區(qū)域位置時, 能量逐漸接近最小化.用活動輪廓波模型獲取粒子群優(yōu)化算法的最終適應(yīng)度函數(shù)公式為
ffit=ω1Fint+ω2Fext+ω3Farea,
(10)
其中ωi(i=1,2,3)表示權(quán)值.
粒子群優(yōu)化算法利用活動輪廓波模型能量獲取存在面積因素的適應(yīng)度函數(shù), 通過適應(yīng)度函數(shù)約束粒子群優(yōu)化算法中的尋優(yōu)粒子, 粒子位置與速度經(jīng)過不斷更新與迭代獲取全局最優(yōu)值, 即最優(yōu)控制點.對圖像中的全部初始輪廓點采用粒子群優(yōu)化算法, 獲取最優(yōu)極值輪廓點, 實現(xiàn)目標圖像的準確分割.
控制活動輪廓演化的快速圖像分割方法步驟如下:
1) 初始化粒子群優(yōu)化算法中的最大迭代次數(shù)、加速因子、慣性因子、群體數(shù)目等參數(shù), 為避免粒子搜索溢出, 設(shè)置粒子搜索范圍邊界;
2) 初始化粒子群優(yōu)化算法中粒子初始位置及初始速度;
3) 根據(jù)式(10)利用活動輪廓波模型獲取粒子群優(yōu)化算法的最終適應(yīng)度函數(shù)值;
4) 記錄粒子群優(yōu)化算法過程中粒子的局部最優(yōu)位置及最佳適應(yīng)度值, 更新粒子的全局最優(yōu)位置;
5) 更新粒子位置、粒子速度及粒子的適應(yīng)度函數(shù)值;
6) 當粒子符合迭代次數(shù)最大值時, 轉(zhuǎn)步驟7); 否則, 轉(zhuǎn)步驟5);
7) 當圖像全部初始輪廓點計算完成時, 通過迭代更新獲取圖像全部輪廓點最優(yōu)值, 實現(xiàn)圖像分割.
為驗證粒子控制活動輪廓演化快速圖像分割方法的有效性, 采用如下仿真實驗平臺進行驗證測試實驗: CPU為Inter酷睿i7-970, 內(nèi)存為32 GB, 硬盤為500 GB, 操作系統(tǒng)為Windows XP, 編程工具采用MATLAB 2018.粒子群優(yōu)化算法的相關(guān)參數(shù): 最大迭代數(shù)為100, 群體數(shù)為15,c1=c2=2.選取網(wǎng)絡(luò)圖像研究庫中的10幅圖像作為實驗對象, 從10幅圖像中隨機挑選4幅如圖1所示的原始圖像.為分析本文方法圖像分割的優(yōu)越性, 選擇文獻[9]和文獻[10]的圖像分割方法進行對比實驗.
圖1 原始圖像Fig.1 Original images
將圖1中的4幅原始圖像分別采用不同方法分割, 分割圖像結(jié)果如圖2~圖4所示.由圖2~圖4可見, 采用本文方法可有效將原始圖像分為不同區(qū)域, 且圖像分割邊緣平滑, 驗證了本文方法圖像分割的有效性, 而對比方法出現(xiàn)了許多錯誤的分割點, 導(dǎo)致丟失一些重要信息, 得到了“過分割”或“欠分割”的結(jié)果.
圖2 文獻[9]方法的圖像分割結(jié)果Fig.2 Image segmentation results of document [9] method
圖3 文獻[10]方法的圖像分割結(jié)果Fig.3 Image segmentation results of document [10] method
2.3.1 圖像分割精度對比 采用10幅原始圖像和加入噪聲的圖像作為測試對象, 統(tǒng)計其圖像分割精度, 結(jié)果列于表1.由表1可見, 3種方法對原始圖像分割精度均明顯高于加入噪聲后圖像, 本文方法的原始圖像和含噪聲圖像的分割精度均高于96%和93%, 神經(jīng)網(wǎng)絡(luò)方法和深度學(xué)習(xí)方法原始圖像和含噪聲圖像的分割精度均低于93%和91%.對比結(jié)果表明, 本文方法不僅具有較高的分割準確性, 且具有極高的抗噪性能, 可應(yīng)用于復(fù)雜的圖像分割中.
圖4 本文方法的圖像分割結(jié)果Fig.4 Image segmentation results of proposed method
表1 不同方法的圖像分割精度對比
圖5 不同方法的圖像分割時間對比Fig.5 Comparison of image segmentation time of different methods
2.3.2 圖像分割時間對比 統(tǒng)計不同方法分割原始圖像的分割時間, 對比結(jié)果如圖5所示.由圖5可見, 本文方法的原始圖像分割時間均在40 ms內(nèi), 而神經(jīng)網(wǎng)絡(luò)方法和深度學(xué)習(xí)方法的原始圖像分割時間均較高, 實驗結(jié)果表明, 本文方法可快速分割圖像, 這主要是由于本文方法融合了粒子群優(yōu)化算法與活動輪廓波模型的優(yōu)點, 提升了計算速度, 降低了圖像的分割時間.
2.3.3 圖像分割區(qū)域一致性對比 為更全面地評價圖像分割結(jié)果, 采用區(qū)域一致性[11]評價不同方法的圖像分割性能.統(tǒng)計不同方法分割10幅原始圖像分割區(qū)域的一致性, 結(jié)果列于表2.由表2可見, 本文方法10幅原始圖像的區(qū)域一致性均高于0.9, 神經(jīng)網(wǎng)絡(luò)方法和深度學(xué)習(xí)方法分割10幅原始圖像的區(qū)域一致性均低于0.9, 本文方法分割圖像獲取結(jié)果與人類視覺分割圖像結(jié)果基本一致.因此, 本文方法圖像分割結(jié)果的區(qū)域一致性明顯優(yōu)于對比方法, 驗證了本文方法的優(yōu)越性.
綜上所述, 本文針對當前粒子群優(yōu)化算法與活動輪廓波模型的缺陷, 基于組合優(yōu)化理論, 提出了一種控制活動輪廓演化的快速圖像分割方法, 解決了圖像分割精度差及計算速度慢等問題.為驗證本文方法分割圖像的優(yōu)越性, 將本文方法與神經(jīng)網(wǎng)絡(luò)方法、深度學(xué)習(xí)方法進行仿真對比實驗, 實驗結(jié)果表明, 本文方法分割精度、分割效果、計算速度及抗噪性能等方面均優(yōu)于對比方法.
表2 不同方法的分割圖像區(qū)域一致性對比