林毅,傅夏生
(四川大學(xué)計(jì)算機(jī)學(xué)院,成都 610065)
基于PCNN網(wǎng)絡(luò)的印章圖像處理
林毅1,傅夏生2
(四川大學(xué)計(jì)算機(jī)學(xué)院,成都 610065)
當(dāng)今社會(huì),出現(xiàn)大量的假印章,假章的泛濫導(dǎo)致了嚴(yán)重的問題,因此對(duì)印文圖像進(jìn)行精確而高效的識(shí)別就顯得非常重要。對(duì)PCNN模型進(jìn)行深入的研究,并著重學(xué)習(xí)實(shí)踐應(yīng)用PCNN對(duì)印文圖像進(jìn)行處理研究。脈沖耦合神經(jīng)網(wǎng)絡(luò)是和生物智能領(lǐng)域的結(jié)合,具有生物神經(jīng)網(wǎng)絡(luò)獨(dú)特的高容錯(cuò)性和高適應(yīng)性,能夠保證印文圖像在印文殘缺,線條不均勻的情況下不會(huì)影響印章的識(shí)別,同時(shí)也能夠滿足對(duì)印文圖像識(shí)別的實(shí)時(shí)性和準(zhǔn)確性的要求[1]。應(yīng)用PCNN進(jìn)行印文提取質(zhì)量較高,提取速度快。應(yīng)用PCNN模型對(duì)印文圖像進(jìn)行提取,探究應(yīng)用人工神經(jīng)網(wǎng)絡(luò)和傳統(tǒng)上提取印文圖像紅色分量匹配的結(jié)果,更好地理解人工神經(jīng)網(wǎng)絡(luò)在圖像處理上應(yīng)用的相關(guān)技術(shù)。
脈沖耦合神經(jīng)網(wǎng)絡(luò);印章圖像;印文提取
印章,是用作于印在文件上表示鑒定或者簽署的憑證。從古至今,印章無論在日常的經(jīng)濟(jì)生活中還是在其獨(dú)特的藝術(shù)性上都有著無可取代的作用。然而在現(xiàn)實(shí)的生活中,正是因?yàn)槭率虏豢呻x開印章的這樣的特性,使得很多不法分子鋌而走險(xiǎn),使用假印章獲取不正當(dāng)?shù)睦?,這種行為已經(jīng)威脅到了社會(huì)的穩(wěn)定和公平,給國家、社會(huì)、個(gè)人帶來了巨大的損失。由于各類印章的防偽性較差以及監(jiān)督使用方法的相對(duì)不成熟,長久以來,我們一直受到假印章的困擾。
人工神經(jīng)網(wǎng)絡(luò)的研究已經(jīng)應(yīng)用在經(jīng)濟(jì)、軍事、工程等諸多領(lǐng)域,人工神經(jīng)網(wǎng)絡(luò)是和生物智能領(lǐng)域的相應(yīng)結(jié)合,因此人工神經(jīng)網(wǎng)絡(luò)具有生物神經(jīng)網(wǎng)絡(luò)所有的高容錯(cuò)性、適應(yīng)性強(qiáng)等明顯的優(yōu)點(diǎn)。人工神經(jīng)網(wǎng)絡(luò)應(yīng)用在印章圖像處理上,能夠以更快的效率,更準(zhǔn)確的識(shí)別率,更高的抗噪能力超越其他圖像處理技術(shù)。
神經(jīng)網(wǎng)絡(luò)是一種運(yùn)算模型,由大量的節(jié)點(diǎn)(或稱“神經(jīng)元”)和之間相互聯(lián)接構(gòu)成。每個(gè)節(jié)點(diǎn)即每一個(gè)神經(jīng)元代表的是一種特定的輸出函數(shù),被稱之為激勵(lì)函數(shù)。每?jī)蓚€(gè)神經(jīng)元間的連接都代表了一個(gè)對(duì)于通過該連接信號(hào)的加權(quán)值,稱之為權(quán)重,這就相當(dāng)于人工神經(jīng)網(wǎng)絡(luò)的記憶[2]。
人類神經(jīng)系統(tǒng)的結(jié)構(gòu)如圖1中所示,系統(tǒng)中是人類的神經(jīng)網(wǎng)絡(luò),神經(jīng)網(wǎng)絡(luò)不斷的接受來自外界的刺激,通過感受器,感受這些刺激并做出相應(yīng)的反應(yīng),信號(hào)會(huì)順著箭頭所指的方向往前傳輸,同時(shí)往回的箭頭表示的是系統(tǒng)的反饋。感受器把人本身或者來自外部環(huán)境的刺激轉(zhuǎn)換成為了電流,向神經(jīng)網(wǎng)絡(luò)傳送信息,神經(jīng)網(wǎng)絡(luò)的效用器會(huì)把電流刺激轉(zhuǎn)換成為可識(shí)別的響應(yīng)輸出。
圖1 神經(jīng)系統(tǒng)框架圖
人工神經(jīng)元的模型就是對(duì)生物神經(jīng)元的數(shù)學(xué)上的抽象化,如圖2所示。
圖2 神經(jīng)元模型
PCNN屬于第三代神經(jīng)網(wǎng)絡(luò),Eckhorn[3]在對(duì)貓的大腦皮層視覺區(qū)域神經(jīng)元研究時(shí)根據(jù)同步脈沖發(fā)放現(xiàn)象提出PCNN。Eckhorn提出的PCNN模型的參數(shù)較為復(fù)雜,不容易設(shè)定,所以在實(shí)際的應(yīng)用中,研究者們就Eckhorn提出的PCNN模型進(jìn)行了改進(jìn)和簡(jiǎn)化,這樣一來就能夠更加適合于圖像處理。不同的應(yīng)用采用的是不同的網(wǎng)絡(luò)模型和參數(shù)設(shè)定方法,網(wǎng)絡(luò)模型的選擇和參數(shù)的設(shè)定會(huì)直接影響著最終的效果。
有一種經(jīng)過簡(jiǎn)化的網(wǎng)絡(luò)模型“顧曉東模型”[4]如圖2所示,是該模型的基本結(jié)構(gòu)。
圖3 顧曉東模型
本文采用的模型就是如圖3所示的神經(jīng)元網(wǎng)絡(luò)模型,從生物的角度上來說,單個(gè)的神經(jīng)元不僅要接受來自外部的環(huán)境輸入,還會(huì)受到其他周圍鄰接神經(jīng)元的影響,上圖中的Ii,j表示的是來自外部的輸入,Yk(1≤K≤4)表示的是來自神經(jīng)元Ni,j鄰接神經(jīng)元的輸入。Fi,j和Li,j分別表示的是饋送單元輸入和連接單元輸入,在本模型中饋送單元輸入Fi,j在數(shù)值上等于外部環(huán)境輸入Ii,j,連接單元輸入Li,j是鄰接神經(jīng)元輸出的和。在調(diào)制區(qū)域的部分,內(nèi)部活動(dòng)矩陣Ui,j是由公式(1)計(jì)算的:
在公式(1)中βi,j表示連接的強(qiáng)度。在脈沖產(chǎn)生區(qū)域,Ui,j和神經(jīng)元的閾值θi,j進(jìn)行比較。如果Ui,j比θi,j大,那么神經(jīng)元Ni,j此時(shí)就會(huì)發(fā)送一個(gè)脈沖信號(hào),這也就是所謂的神經(jīng)元點(diǎn)火;否則,那就沒有脈沖輸出。神經(jīng)元發(fā)出脈沖的同時(shí),該神經(jīng)元的閾值θi,j也會(huì)立刻提高到一個(gè)足夠大的值,使得該神經(jīng)元不會(huì)再次發(fā)送脈沖。因此,神經(jīng)元的輸出Yi,j由公式(2)得到:
將脈沖耦合神經(jīng)網(wǎng)絡(luò)應(yīng)用于二值化圖像細(xì)化操作時(shí),除了以上所述的特點(diǎn)外,同時(shí)還應(yīng)該滿足以下的特點(diǎn):
神經(jīng)元Ni,j的饋送單元的輸入值Fij就是像素點(diǎn)Pi,j的灰度值;
神經(jīng)元Ni,j只會(huì)被其周圍的和它連接的神經(jīng)元Ni-1,j、Ni,j-1、Ni,j+1和Ni,j+1的影響,因此這時(shí)該神經(jīng)元的連接單元輸入Li,j的計(jì)算公式是:
閾值θi,j的計(jì)算公式如(4)所示,(和是兩個(gè)給定的常數(shù)):
這里設(shè)定的矩陣T是一個(gè)二值的矩陣,保存著細(xì)化的結(jié)果,F(xiàn)fired同樣表示的是一個(gè)二值的矩陣,保存的是當(dāng)前點(diǎn)火時(shí)刻所有點(diǎn)火的神經(jīng)元。
細(xì)化的流程圖如圖4所示。
印文的提取的主要步驟如下:先對(duì)原始的RGB顏色空間的印文圖像進(jìn)行二值化的處理,使得圖像變得簡(jiǎn)單,圖像的數(shù)據(jù)信息會(huì)因此減少,但是卻能夠突顯出我們需要的目標(biāo)輪廓,接著提取出印文的輪廓骨架,讓提取出來的骨架和原始的圖像轉(zhuǎn)化成的二值化印文圖像進(jìn)行融合,這樣最終就把印文的主要特征結(jié)構(gòu)給提取出來。對(duì)于印文的模版圖像和待比對(duì)的圖像都需要進(jìn)行這樣的相關(guān)處理,這樣把圖像轉(zhuǎn)換成為計(jì)算機(jī)能夠理解的特征,按照特征進(jìn)行比對(duì),最終得出鑒別的結(jié)果。
圖4 細(xì)化流程圖
原始圖像是一個(gè)基于RGB顏色空間的圖像,那么通過OpenCV這一跨平臺(tái)的計(jì)算機(jī)視覺庫里面的API函數(shù),能夠很方便地實(shí)現(xiàn)將原始圖像轉(zhuǎn)換為灰度圖像,接著繼續(xù)將灰度圖像轉(zhuǎn)換成更好處理的二值化的圖像,二值化的圖像能夠大大減少處理信息,簡(jiǎn)化問題。由于印文本身結(jié)構(gòu)的特殊性,可以料想到,進(jìn)行二值化處理后的圖像會(huì)存在一定數(shù)量的結(jié)構(gòu)上的空洞,不利于對(duì)圖像的處理,這時(shí)候應(yīng)該采取形態(tài)學(xué)上的連續(xù)腐蝕操作,形態(tài)學(xué)上的腐蝕是將圖像中的某些結(jié)構(gòu)元給去除掉,腐蝕會(huì)縮小并細(xì)化二值化圖像中的部分,在印文中就會(huì)將細(xì)小的邊界和結(jié)構(gòu)給過濾干凈,進(jìn)行完連續(xù)的腐蝕操作,還要對(duì)圖像進(jìn)行連續(xù)的膨脹操作,與腐蝕有所不同的,膨脹會(huì)在一定程度上粗化或者說增加二值化圖像中的部分,重塑圖像,然后對(duì)最終的圖像進(jìn)行邊界的提取,這樣就能夠得到的符合要求的結(jié)果圖像。
大小為m×n的二值圖像F(假設(shè)圖像中背景的灰度值是1,對(duì)象的灰度值是0),設(shè)定F(i,j)表示第(i,j)個(gè)像素的灰度值。在把圖像F輸入到神經(jīng)網(wǎng)絡(luò)前,對(duì)像素的灰度值F(i,j)進(jìn)行預(yù)處理:
接著把F輸入到網(wǎng)絡(luò)中一直到?jīng)]有新的神經(jīng)元點(diǎn)火,那么最終得到的結(jié)果就是空洞填充的結(jié)果。這一步的操作為接下來對(duì)圖像骨架細(xì)化,然后進(jìn)行印文提取有重要的作用[4]。
所謂圖像細(xì)化,指的是對(duì)二值化圖像骨架化的一種操作運(yùn)算。細(xì)化就是對(duì)圖像進(jìn)行一層層的剝離,把圖像中一些不重要的部分給濾去,但是最重要的是仍然保持圖像原來的大致形狀。這對(duì)于印文圖像的提取起到了很大的作用。
本文采用的細(xì)化算法能夠把印文骨架快速的從復(fù)雜的印文背景中提取出來。算法的流程圖如圖5所示。
在圖5中,Image1和Image2是兩幅二值圖像,在第n次點(diǎn)火的時(shí)候,分別用O1(n),O2(n)來表示輸出。細(xì)化的結(jié)果公式為:
實(shí)際上Image1是原始圖像通過空洞填充算法得到的,Image2則是由Image1和二值化后的圖像相減得到的。通過PCNN神經(jīng)網(wǎng)絡(luò)模型得到最終的結(jié)果。由于待操作的圖像在先決條件上要求是封閉的,那么形態(tài)學(xué)上的腐蝕和膨脹的操作就很有必要[4]。
在得到了印章的骨架之后,將印章圖像的骨架提取的圖像和印文的二值化圖像在形態(tài)學(xué)上進(jìn)行完腐蝕和膨脹操作之后的圖像進(jìn)行融合,可以得到一個(gè)新的融合圖像。
圖5 骨架提取算法流程圖
本文實(shí)驗(yàn)的探究是建立在Windows操作系統(tǒng)平臺(tái)上的。因此基于PCNN模型的印文處理研究可以利用微軟的可視化集成開發(fā)平臺(tái)Visual C++6.0。MFC基礎(chǔ)框架可以在此IDE中搭建,使用MFC框架來構(gòu)建實(shí)驗(yàn)程序,并輔之以O(shè)penCV1.0這個(gè)開源的計(jì)算機(jī)視覺庫,將相關(guān)的算法應(yīng)用到對(duì)圖像的處理上。
為了方便對(duì)印文圖像進(jìn)行比對(duì),因此需要對(duì)印文留底圖像和待識(shí)別圖像都進(jìn)行預(yù)處理操作,如圖7中所示,對(duì)印文的原始圖像進(jìn)行了二值化的處理,同時(shí)還對(duì)提取印文圖像紅色分量的圖像進(jìn)行二值化的處理,可以明顯觀察到,被處理后的印文圖像在圖像信息結(jié)構(gòu)上顯得更加簡(jiǎn)單,這樣也更容易被計(jì)算機(jī)理解,進(jìn)而做出更好的判斷。
通過對(duì)于兩者不同實(shí)驗(yàn)步驟進(jìn)行比較,明顯的發(fā)現(xiàn)僅僅只是提取印文圖像的紅色分量的值,顯然在印文圖像信息的顯示以及后續(xù)需要進(jìn)一步對(duì)印文圖像進(jìn)行處理的時(shí)候,能夠給印文正確識(shí)別帶來的幫助十分有限,提取紅色通道分量后的圖像雖然直接簡(jiǎn)單,但是提取的效果并不好,在提取的過程中,會(huì)丟失其他有用的信息。
圖6 印文原始圖像和提取紅色分量印文圖像的二值化圖像
得到二值化的圖像之后,可以看到的是二值化后的圖像還依然帶著一些影響判斷的特征,印文存在的瑕疵,因此在形態(tài)學(xué)上要對(duì)二值化的圖像進(jìn)行腐蝕和膨脹操作,得到更適合處理的印文圖像。下圖7中a、c、e、g、i、j是上文中二值化處理后的圖像,b、d、f、h、k、l是經(jīng)過了形態(tài)學(xué)上操作的圖像。
圖7 二值化圖像形態(tài)學(xué)處理后的圖像
經(jīng)過比對(duì)可以發(fā)現(xiàn),二值化原來存在的一些縫隙,大部分都已經(jīng)被處理完畢。同時(shí)也可以明顯的感受到圖像的特征信息已經(jīng)有了改進(jìn)。
[1]Johnson J.L.and Padgett M.L.PCNN Models and Applications[R].IEEE Transactions on Neural Networks,1999,10(3):480-498.
[2]維基百科.[EB/OL]http://zh.wikipedia.org/zh-cn/人工神經(jīng)網(wǎng)絡(luò)
[3]Eckhorn R.,F(xiàn)rien A.and Bauer R.High Frequency(60-90 Hz)Oscillations in Primary Visual Cortex of Wake Monkey[R].Neuroreport,1993,4(3):243-246.
[4]顧曉東,余道衡.PCNN的原理及其應(yīng)用.電路與系統(tǒng)學(xué)報(bào)[J],2001,9-6(3).
[5]Rafael C.Gonzalez,Richard E.Woods.Diaital Image Processing[M].Third Edition.北京:電子工業(yè)出版社,2011:14-16.
Process of the Seal Image Based on PCNN
LIN Yi,F(xiàn)U Xia-sheng
(College of Computer Science,Sichuan University,Chengdu610065)
With the development of the society,the seal plays a significant role in today’s social life as a symbol of the credit.In today’s society, there are many kinds of fake seals.Because the flooding of fake seals will cause serious problems,it is very important to identify the seal image accurately and efficiently.Studies this model and focuses on the application of the PCNN for the process of the seal image.The PCNN is a combination with biological intelligence.This model has unique high fault tolerance and high adaptability.By applying this model the seal image,it can be recognized under complicated conditions,and at the same time,it can satisfy the seal image recognition of realtime and accuracy requirements.Using the PCNN to extract seal images has higher quality and faster speed for extracting.Applies the PCNN model to extract the seal image and compare to the traditional method which extracts the red channel of the seal image.Through the study and research on PCNN model to get a better understanding of artificial neural network technologies of its application in image processing.
PCNNs;Seal Image;Seal Extraction
1007-1423(2017)05-0071-06
10.3969/j.issn.1007-1423.2017.05.017
林毅(1992-),男,福建福州人,碩士研究生,研究方向?yàn)闄C(jī)器學(xué)習(xí)
2016-12-16
2017-02-12
傅夏生(1991-),男,廣西玉林人,碩士研究生,研究方向?yàn)闄C(jī)器學(xué)習(xí)