張靖婭,劉 昶,劉麗萍
(沈陽理工大學 信息科學與工程學院,遼寧 沈陽 110159)
光學字符識別(Optical Character Recognition,OCR)是模式識別和人工智能領(lǐng)域的一個重要研究方向,是模式識別、圖像處理與文字處理技術(shù)相結(jié)合的一種技術(shù)。光學字符識別技術(shù)已經(jīng)被應(yīng)用在產(chǎn)品檢測中,文獻[1]采用特征加權(quán)模板匹配與結(jié)構(gòu)特征相結(jié)合的多級識別算法對鋼坯字符圖像進行了識別;文獻[2]將細化后的鋼坯字符進行投影變換,然后根據(jù)投影變換結(jié)果,將字符轉(zhuǎn)換為電子顯示的標準字符,針對電子字符編碼來實現(xiàn)鋼坯字符識別;文獻[3]采用Mean shift對復(fù)雜場景圖像進行抑制,采用多級分割濾波與聚類處理突出并找出字符串目標興趣區(qū)域,通過最小二乘法自適應(yīng)修整傾斜角度,進而完成了鋼坯字符串目標精準定位;文獻[4]采用提取字符特征向量并設(shè)定不同加權(quán)因子的特征模板匹配方法對寬、厚板噴碼進行了字符識別。
本文對傳統(tǒng)的模板匹配方法進行改進,提出了一種有針對性的鋼板噴印字符識別方法,采用高斯濾波和中值濾波去除鋼板噴印字符圖像中的噪聲,采用頂帽變換去除鋼板噴印字符圖像中亮度不均的背景;采用OTSU最大類間方差法進行圖像二值化;采用投影法結(jié)合鋼板噴印字符圖像的寬、高等先驗信息進行鋼板噴印字符分割;采用本文提出的特征加權(quán)模板匹配算法進行字符識別。特征加權(quán)模板匹配方法首先提取字符筆畫特征,然后給字符筆畫分配不同的權(quán)重,位于字符筆畫中心的像素權(quán)重最高,而位于字符筆畫邊緣的像素權(quán)重最低。最后采用本文提出的特征加權(quán)模板匹配識別鋼板噴印字符,通過實驗證明此方法提高了識別鋼板噴印字符的正確率。
圖1為鋼板噴印字符圖像,其中左上角存在明顯的光斑,字符區(qū)域存在亮度不均的問題。由于工業(yè)現(xiàn)場中噪聲大、光照不均,導(dǎo)致采集的鋼板噴印字符圖像噪聲大、亮度不均;又由于鋼板表面光滑、易生銹、字符噴印不均和字符拖尾等情況時有發(fā)生,這些給鋼板噴印字符的識別工作帶來了困難。因此,在對鋼板噴印字符圖像識別之前,需通過圖像預(yù)處理去掉鋼板字符圖像中的噪聲、消除亮度不均的圖像背景。
本文圖像預(yù)處理首先利用高斯濾波和中值濾波對鋼板噴印字符圖像進行去噪;然后采用頂帽變換[5]對不均勻亮度背景的灰度圖像進行處理,達到消除亮度不均的圖像背景的目的。設(shè)f(x,y)為濾波后的鋼板噴印字符圖像,用線性結(jié)構(gòu)元素b對鋼板噴印字符圖像f進行灰度腐蝕記為fΘb;用結(jié)構(gòu)元素b對鋼板噴印字符圖像進行膨脹記為f⊕b;用結(jié)構(gòu)元素b對鋼板噴印字符圖像f的開運算記為 f·b,定義 f·b=(fΘb)⊕b為;從濾波后的鋼板噴印字符圖像減去開運算后的鋼板噴印字符圖像的過程,稱為對鋼板噴印字符圖像進行的頂帽變換。針對亮度和噴印不均的鋼板噴印字符圖像(如圖1所示),經(jīng)過濾波和頂帽變換處理得到字符圖像如圖2所示??梢钥闯鲣摪鍑娪∽址麍D像的光斑被去除了,字符圖像亮度不均的背景也被去除了。
經(jīng)過圖像預(yù)處理,鋼板噴印字符圖像的噪聲和亮度不均的背景被去除了。本文利用OTSU最大類間方差法[6]對鋼板噴印字符圖像(如圖2所示)進行二值化。假定二值化閾值為k,采用OTSU方法計算閾值k。
式中:n是鋼板噴印字符圖像的像素總數(shù);nq是灰度級為rq所對應(yīng)的像素數(shù)目;L是鋼板噴印字符圖像所有可能的灰度級數(shù)。C0是一組灰度級為[0,1,…,k-1]的像素集,C1是一組灰度級為[k,k+1,…,L-1]的像素集。OTSU最大類間方差法是計算當最大類間方差取最大值時的閾值k,最大類間方差定義為式(2)。在式(3)和式(4)的約束下,求取最大值時所對應(yīng)的k,此時k即為鋼板噴印字符圖像的分割閾值。
式中:ω0為鋼板噴印字符圖像背景所占比例;ω1為鋼板噴印字符圖像前景所占比例;μ0為鋼板噴印字符圖像背景像素的平均灰度值;μ1為鋼板噴印字符圖像前景像素的平均灰度值;μT為鋼板噴印字符圖像總體的平均灰度值。采用OTSU最大類間方差法對經(jīng)過圖像預(yù)處理的鋼板噴印字符圖像進行二值化的結(jié)果如圖3所示,可以看出該方法能夠?qū)摪鍑娪∽址麖匿摪鍑娪∽址麍D像背景中有效分離出來。
圖3 鋼板噴印字符二值圖像
圖4 鋼板噴印字符二值圖像的水平投影圖
鋼板噴印字符圖像的行定位是確定鋼板噴印字符圖像區(qū)域水平方向的具體位置,并將包含鋼板噴印字符的子圖像從整個鋼板字符圖像中提取出來的圖像處理過程。由于鋼板噴印字符具有實際意義,第2行鋼板的爐號和板號、第3行鋼板的厚度、寬度、長度信息尤為重要,因此本文重點識別第2行和第3行的前14位字符。鋼板噴印字符行定位與行分割過程如下:
(1)對經(jīng)過二值鋼板噴印字符圖像(如圖3所示)做水平投影Hp(y),投影圖如圖4所示。設(shè)定水平閾值為KHp,圖4中KHp=0,當水平投影值小于KHp時設(shè)定投影值為0,目的是消除字符區(qū)域以外的圖像噪聲,從而更準確地定位字符區(qū)域;
(2)從鋼板字符圖像第一行起對水平投影Hp(y)按從上到下的順序進行遍歷,當Hp(y)≠0時,標記此行為定位上邊界top;
(3)從鋼板字符圖像最后一行起對水平投影Hp(y)按從下到上的順序進行遍歷,當Hp(y)≠0時,標記此行為定位下邊界bottom;
經(jīng)過(1)~(3)從水平方向定位鋼板噴印字符圖像區(qū)域如圖5所示。從圖5可以得出,通過采用投影法并結(jié)合設(shè)定閾值,本文可以從水平方向定位鋼板噴印字符區(qū)域。
(4)對鋼板噴印字符圖像行定位后,進行鋼板噴印字符的行分割。鋼板噴印字符行分割的過程是從按水平方向定位的鋼板噴印字符圖像中將鋼板噴印字符按行分割出來。由于鋼板噴印字符按水平方向排列,因此,將鋼板噴印字符圖像按水平方向平均分為四份,即可實現(xiàn)鋼板噴印字符的行分割,得到四行鋼板字符圖像。提取出第3行鋼板噴印字符圖像如圖6所示。本文經(jīng)過(1)~(4)步完成了鋼板噴印字符圖像的行定位與行分割。
鋼板字符列定位是從行分割后的鋼板噴印字符圖像中分割出獨立的鋼板噴印字符圖像的過程。本文采用投影法及鋼板噴印字符的寬、高等先驗信息進行鋼板噴印字符的列分割。以第3行鋼板噴印字符圖像的分割為例,具體介紹鋼板噴印字符圖像列定位與列分割過程。字符列定位與列分割過程如下:
(1)首先做第三行鋼板噴印字符圖像的垂直投影Vp(x)(如圖7所示)。設(shè)垂直閾值為kVp,圖7中kVp=0,當垂直投影值小于kVp時設(shè)定投影值為0,目的是消除字符區(qū)域以外的圖像噪聲,從而更準確地定位鋼板噴印字符區(qū)域;
圖7 第二行鋼板噴印字符圖像垂直投影圖
圖8 列定位后的第三行字符圖像
(2)從第三行鋼板字符圖像的第一列起對垂直投影Vp(x)按從左到右的順序進行遍歷,當Vp(x)≠0時,標記此列為定位左邊界left;
(3)從第三行鋼板字符圖像的最后一列起對垂直投影Vp(x)按從右到左的順序進行遍歷,當Vp(x)≠0時,標記此列為定位右邊界right;
經(jīng)過(1)~(3)步從垂直方向定位鋼板字符圖像區(qū)域如圖8所示。從圖8可以看出本文采用投影法并設(shè)定閾值,能夠從垂直方向上準確定位鋼板噴印字符圖像。
(4)將鋼板噴印字符圖像列定位后,進行鋼板噴印字符圖像的列分割。將投影值為0的位置作為分割點,分割出獨立的鋼板噴印字符圖像,同時將字符切割為最小范圍字符圖像(如圖9所示);
(5)利用鋼板噴印字符圖像寬度和高度等先驗信息,對切割好的鋼板噴印字符圖像進行判斷。若切割字符圖像的寬度與高度之比小于0.75,則認為鋼板字符圖像被切割正確。否則需要調(diào)整切割位置,將切割的字符圖像進行合并再次切割,直到字符圖像最終被切割準確為止。本文采用基于邊框的位置歸一化方法將鋼板噴印字符圖像歸一化,經(jīng)過歸一化處理后的鋼板噴印字符圖像如圖10所示。
針對鋼板噴印字符的識別問題,本文提出了一種基于特征加權(quán)模板匹配的方法進行鋼板噴印字符識別。具體思路為提取鋼板噴印字符的筆畫特征,給鋼板噴印字符筆畫分配不同的權(quán)重,位于字符筆畫中心的像素權(quán)重最高,位于字符筆畫邊緣的像素權(quán)重最低。鋼板噴印字符圖像任意一點像素的權(quán)重根據(jù)其周圍八個點的像素確定,任意一點像素的權(quán)重為W(i,j)
本文將首先對待識別的鋼板噴印字符圖像利用式(5)進行特征加權(quán)處理,模板字符圖像也利用式(5)進行特征加權(quán)處理;然后將特征加權(quán)處理后的鋼板噴印單字符圖像與特征加權(quán)處理后的模板字符圖像進行模板匹配[7]相關(guān)度計算,將相關(guān)度最大值所對應(yīng)的模板字符圖像作為待識別的鋼板噴印字符圖像的識別結(jié)果。相關(guān)度計算公式如式(6)所示。
式中:I為特征加權(quán)后的鋼板噴印字符圖像;M為特征加權(quán)后的模板字符圖像;H為鋼板噴印字符的高度;W為鋼板噴印字符的寬度。
本文采用提出的鋼板字符圖像定位方法與分割方法,對工業(yè)現(xiàn)場采集的210幅鋼板噴印字符圖像進行了定位與分割。共獲得5690個獨立的鋼板噴印字符圖像,其中包括數(shù)字字符圖像0~9,英文字符圖像“A”、“B”、“K”、“L”、“X”和“Z”,共16種字符圖像。字符識別方法采用本文提出的特征加權(quán)模板匹配方法實現(xiàn)。為了證明本文字符識別方法的有效性,將本文字符識別方法與模板匹配方法[7]和基于特征加權(quán)模糊模板匹配的字符識別方法[8]進行比較。采用本文的字符識別方法、模板匹配方法和基于特征加權(quán)模糊模板匹配的字符識別方法對分割獲得的5690個獨立的鋼板噴印字符進行識別,對比實驗結(jié)果如表1所示。
表1 對比實驗結(jié)果 %
由表1可以看出,采用本文提出的特征加權(quán)模板匹配識別方法對鋼板噴印字符進行識別的正確率可達98%,而基于特征加模糊模板匹配方法和模板匹配方法的識別率分別是97.17%、97.10%。證明了本文提出的基于特征加權(quán)模板匹配的字符識別算法對鋼板噴印字符識別的正確率較高。
針對亮度和噴印不均的鋼板噴印字符的識別問題,提出了一種有針對性的識別方法。采用高斯濾波和中值濾波去除了鋼板噴印字符圖像的噪聲;采用頂帽變換方法消除了鋼板噴印字符圖像亮度不均的背景;采用OSTU最大類間方差法進行了圖像二值化,有效地將鋼板噴印字符區(qū)域從鋼板噴印字符圖像背景區(qū)域中分離出來;采用投影法并結(jié)合鋼板噴印字符的寬、高等先驗信息實現(xiàn)了鋼板噴印字符圖像的分割;采用本文提出的特征加權(quán)模板匹配算法完成了鋼板噴印字符圖像的識別。通過特征加權(quán)模板匹配實驗,識別字符的正確率達98.00%,此結(jié)果證明了本文方法的有效性,本文方法也可以應(yīng)用到其他類似的字符識別問題中。
[1]楊義軍,洪漢玉,章秀華,等.重軌生產(chǎn)線鋼坯字符識別方法[J].武漢工程大學學報,2012,34(5):64 -67.
[2]洪漢玉,朱浩,魏和洪,等.基于字符結(jié)構(gòu)特征的鋼坯字符電子顯示識別[J].武漢理工大學學報,2013,35(2):176-179.
[3]俞枯俊,洪漢玉,章秀華,等.生產(chǎn)線復(fù)雜場景鋼坯檢測識別的定位方法研究[J].光電工程,2012,39(1):54-61.
[4]李潘,誤少波,王麗娜,等.基于機器視覺的寬厚板噴碼自動識別系統(tǒng)[J].冶金自動化,2013,37(4):12 -15.
[5]陳簫楓,潘保昌,鄭勝林,等.用頂帽變換估計并消除圖像背景[J].計算機學報,2007,30(6):979 -985.
[6]何友金,毛劍英,譚偉.海面島礁背景下艦船紅外自動識別技術(shù)研究[J].光電技術(shù)應(yīng)用,2010,25(4):31 -34.
[7]梁琎,包志強.人民幣冠字號碼的提取與識別[J].現(xiàn)代電子技術(shù),2013,36(11):70 -73.
[8]朱顥東,李紅嬋.基于特征加權(quán)模糊模板匹配的字符識別[J].蘭州理工大學學報,2013,39(2):68 -71.