摘 要:本篇論文主要討論如何通過較脈沖耦合神經(jīng)網(wǎng)絡(luò)的方法,來對若干種不同類型的圖像進(jìn)行圖像分割的問題,并取得較好的分割效果。
關(guān)鍵詞:圖像分割;脈沖耦合神經(jīng)網(wǎng)絡(luò);計(jì)算機(jī)視覺
在計(jì)算機(jī)視覺的研究中,圖像分割是連接低級(jí)視覺與高級(jí)視覺的橋梁和紐帶,圖像分割的結(jié)果既取決于低級(jí)視覺中各種預(yù)處理的效果,又決定了高級(jí)視覺中的各種應(yīng)用中最終輸出的質(zhì)量。因此,圖像分割是人多數(shù)視覺系統(tǒng)中最為關(guān)鍵和重要的一個(gè)環(huán)節(jié)。在過去的幾十年里,圖像分割的研究一直受到人們高度的重視。
1 脈沖耦合神經(jīng)網(wǎng)絡(luò)(PCNN)
脈沖耦合神經(jīng)網(wǎng)絡(luò)核心運(yùn)作機(jī)制就是神經(jīng)元能夠接受外部信號(hào)和相鄰神經(jīng)元的加權(quán)輸入,通過耦合部分得到神經(jīng)元的內(nèi)部活性,脈沖耦合神經(jīng)元的脈沖爆發(fā)機(jī)制是PCNN運(yùn)行機(jī)制的核心。
對于較小的饋給輸入和較弱的鏈接強(qiáng)度,單個(gè)脈沖足以使閾值復(fù)位,這就是但脈沖機(jī)制,而鏈接強(qiáng)度較大時(shí),神經(jīng)元從它周圍接收到較強(qiáng)的鏈接輸入,他會(huì)得到一個(gè)較大內(nèi)部活性。這樣,就會(huì)驅(qū)使神經(jīng)元不斷地產(chǎn)生脈沖直到閾值超過內(nèi)部活性,這就是多脈沖爆發(fā)機(jī)制。大多數(shù)圖像處理中鏈接強(qiáng)度都選得較小,一般應(yīng)用的都是弱脈沖爆發(fā)機(jī)制。
當(dāng)考慮一組互關(guān)聯(lián)的神經(jīng)元時(shí),情況較為復(fù)雜。一個(gè)神經(jīng)元要接受來自該組中其它神經(jīng)元的鏈接輸入,鏈接輸入的量隨著該組中脈沖產(chǎn)生的個(gè)數(shù)而增長,它必須重復(fù)爆發(fā),直到推動(dòng)它的閾值超過鏈接輸入,反過來又影響該神經(jīng)元的鏈接輸入,由于鏈接與饋給域的時(shí)間常數(shù)不同,鏈接輸入會(huì)首先達(dá)到飽和,因而從使得神經(jīng)元閾值最終增大到超過內(nèi)部活性而停止爆發(fā)脈沖。
由以上可知,在一組神經(jīng)元相互作用的情況下,脈沖耦合神經(jīng)元的閾值大小主要由鏈接輸入決定,脈沖爆發(fā)周期既是它自身饋給輸入的函數(shù)也是這個(gè)區(qū)域鏈接輸入的函數(shù)。脈沖爆發(fā)的數(shù)量由區(qū)域的總能量決定,兩次爆發(fā)的時(shí)間間隔近似于該區(qū)域面積的對數(shù)函數(shù)。當(dāng)兩組神經(jīng)元相互作用時(shí),每個(gè)組的捕獲時(shí)間是另一個(gè)組的面積函數(shù),且隨兩組距離增大而減小。每個(gè)組的捕獲時(shí)間同脈沖同步爆發(fā)的時(shí)間之比可以比較小,這樣即使它們處于強(qiáng)鏈接多脈沖爆發(fā)區(qū)域也能提供較弱而有效的鏈接。在這種情況下,內(nèi)部同步的族之間的相互作用就相當(dāng)于大的單個(gè)神經(jīng)元直接作用的關(guān)系。這種同步是根據(jù)區(qū)域關(guān)系而不是內(nèi)部細(xì)小的強(qiáng)度鏈接,各區(qū)域之間表現(xiàn)出的關(guān)系同單個(gè)神經(jīng)元之間表現(xiàn)出的關(guān)系完全不同。多脈沖模式中區(qū)域相連關(guān)系是圖像分割等圖像處理操作的本質(zhì)所在。
2 圖像分割
基于PCNN的圖像分割是根據(jù)圖像的自然屬性,利用PCNN的脈沖快速并行傳播特性對圖像進(jìn)行自然而迅速的分割。本文中圖像處理時(shí),PCNN連接方式是相同的。同時(shí),PCNN中所有神經(jīng)元的參數(shù)均相同。具體應(yīng)用在灰度圖像分割時(shí),PCNN為一單層二維的局部連接的網(wǎng)絡(luò),神經(jīng)元的個(gè)數(shù)等于輸入圖像中像素點(diǎn)的個(gè)數(shù),神經(jīng)元與像素點(diǎn)一一對應(yīng)。每一個(gè)神經(jīng)元與對應(yīng)的像素點(diǎn)相連,同時(shí)每個(gè)神經(jīng)元與其8鄰域中的其它神經(jīng)元相連。每個(gè)神經(jīng)元的輸出只有兩種狀態(tài):1與0。經(jīng)過簡化后的神經(jīng)元模型,每個(gè)神經(jīng)元的饋送域信號(hào)等于對應(yīng)像素點(diǎn)的亮度值,鏈接域信號(hào)是鏈接域?qū)?鄰域中其它神經(jīng)元輸出的響應(yīng)和。
基于PCNN的圖像分割算法的基本思路是用PCNN沿著由高亮度值到低亮度值的方向分層依次分割灰度圖像,同時(shí)結(jié)合圖像熵得到最終的分割結(jié)果。
某個(gè)PCNN神經(jīng)元點(diǎn)火時(shí),其鄰域內(nèi)的任何一個(gè)未點(diǎn)火的且輸入亮度與其輸入亮度差別不大的神經(jīng)元都會(huì)受其影響而點(diǎn)火。PCNN用于圖像分割時(shí),圖像內(nèi)的一些輸入亮度值較高的神經(jīng)元先點(diǎn)火,發(fā)放脈沖,捕捉到它們8鄰域內(nèi)的輸入亮度值相似的還未點(diǎn)火的神經(jīng)元,使得它們也發(fā)放出脈沖,繼續(xù)進(jìn)行捕捉的過程。當(dāng)捕捉過程結(jié)束時(shí),就分割出一塊區(qū)域。鏈接域信號(hào)的統(tǒng)一使得圖像分割的過程清楚明了,便于控制。用PCNN分割圖像時(shí),既考慮到圖像中同一區(qū)域內(nèi)像素點(diǎn)亮度之間的相似性,又通過其脈沖并行傳播特性自如地利用圖像中像素點(diǎn)之間的空間位置關(guān)系。
在算法中引入圖像熵,是因?yàn)閷τ诮^大多數(shù)圖像來說,不管采用何種分割算法,一般分割后的圖像熵值越大,說明分割后從原圖得到信息量越大,分割圖像細(xì)節(jié)越豐富,因而總體分割效果也應(yīng)越好。將此特性應(yīng)用于PCNN圖像分割中,得到了一種基于圖像熵和PCNN的圖像分割算法。分割后得到的二值圖像的圖像熵可由下式確定:
其中,分別表示該分割后的圖像為、為的概率,。
注意,時(shí),圖像全白,;時(shí),圖像全黑,這兩種情況下,圖像熵取得最小值。當(dāng)時(shí),圖像熵取得最大值。
下面給出具體的基于圖像熵和PCNN的圖像分割算法:
(1)給出閾值,鏈接強(qiáng)度,分割次數(shù),步長,同時(shí)令每個(gè)像素點(diǎn)處于熄火狀態(tài),即。
(2)在時(shí),計(jì)算鏈接信號(hào):。
(3)計(jì)算每個(gè)神經(jīng)元的內(nèi)部活性:。
(4)將與閾值相比,記錄神經(jīng)元的輸出,即點(diǎn)火或不點(diǎn)火,,調(diào)整閾值。
(5)計(jì)算的圖像熵,將到目前為止圖像熵最大的存為,當(dāng)循環(huán)結(jié)束時(shí),取得最大值,就是最終的分割結(jié)果。
(6),如果,回到(2);否則,結(jié)束。
3 結(jié)語
本文結(jié)合圖像熵概念,成功地將簡化了的PCNN模型應(yīng)用于256灰度級(jí)的圖像分割中。通過對不同類型的圖像進(jìn)行計(jì)算機(jī)仿真,我們認(rèn)為,該算法具有較廣泛的通用性,如對氣象云圖、高空拍攝圖片等不同類型圖像,均能得到較好的、細(xì)節(jié)較豐富的分割結(jié)果。
參考文獻(xiàn):
[1] Rafael C.Gonzalez,Richard E.Woods.數(shù)字圖像處理(第二版)[M].北京:電子工業(yè)出版社,2007.
[2] J.L.Johnson,M.L.Padgett . PCNN Models and Applications[J] . IEEE Transactions on Neural Networks,1999(10).