朱小艷 張西芝
摘要:在信息化飛速發(fā)展的時(shí)代,字符識(shí)別是信息錄入和轉(zhuǎn)化的一個(gè)重要內(nèi)容。其中,手寫體數(shù)字的識(shí)別有著非常廣泛的應(yīng)用,如郵政編碼、手機(jī)手寫等。該文使用一種基于“孤立點(diǎn)”、交叉數(shù)和中間數(shù)的手寫數(shù)字識(shí)別方法,利用孤立點(diǎn)對(duì)數(shù)字(0-9)進(jìn)行首次分類,再利用交叉數(shù)和中間數(shù)對(duì)分類后的數(shù)字進(jìn)行進(jìn)一步分類和識(shí)別。實(shí)驗(yàn)結(jié)果表明,該算法有效提高了數(shù)字識(shí)別的效率。
關(guān)鍵詞:特征提?。还铝Ⅻc(diǎn);交叉數(shù);中間數(shù);效率
中圖分類號(hào):TP18文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1009-3044(2012)16-3969-04
Research of Handwritten Numeral Recognition Algorithm Based on the Outlier
ZHU Xiao-yan1, ZHANG Xi-zhi2
(1.Software College of Henan University, Zhengzhou 450064, China;2. Department of Information Management ,Shengda Economics Trade & Management College of Zhengzhou, Xinzheng 451191,China)
Abstract: In the age of information development, character recognition is an important content of information input and conversion.Hand? written numeral recognition has a very wide range of applications, such as postal code, mobile phone handwriting recognition. This paper presents a handwritten digital recognition method based on the" outlier", crossing number and middle number , which uses isolated point to digital (0-9) for classification, then uses crossing number and middle number for further classification and recognition. The test results show that, the algorithm can improve the efficiency of digital recognition.
Key words: Feature extraction ;outlier; crossing number; middle number; efficiency
在信息化飛速發(fā)展的時(shí)代,字符識(shí)別是信息錄入和轉(zhuǎn)化的一個(gè)重要內(nèi)容。字符識(shí)別處理的信息可分為兩大類:一類是文字信息,處理的主要是用各國家、各民族的文字(如:漢字、英文等)書寫或印刷的文本信息,目前在印刷體和聯(lián)機(jī)手寫方面技術(shù)已趨向成熟,并推出了很多應(yīng)用系統(tǒng);另一類是數(shù)據(jù)信息,主要是由阿拉伯?dāng)?shù)字及少量特殊符號(hào)組成的各種編號(hào)和統(tǒng)計(jì)數(shù)據(jù)。
手寫數(shù)字識(shí)別(Handwritten Numeral Recognition)是光學(xué)字符識(shí)別技術(shù)(Optical Character Recognition,簡(jiǎn)稱OCR)的一個(gè)分支,它研究的對(duì)象是:如何利用電子計(jì)算機(jī)自動(dòng)辨認(rèn)人手寫在紙張或者與計(jì)算機(jī)相連的手寫板上的阿拉伯?dāng)?shù)字。隨著社會(huì)信息化的發(fā)展,手寫數(shù)字的識(shí)別研究有著重大的實(shí)用價(jià)值,如在郵政編碼、稅務(wù)報(bào)表、統(tǒng)計(jì)報(bào)表財(cái)務(wù)報(bào)表、銀行票據(jù)、海關(guān)等需要處理大量字符信息錄入的場(chǎng)合。手寫數(shù)字的識(shí)別也具有商業(yè)意義,現(xiàn)在市面上流行實(shí)用的各種寫字筆,手機(jī)上面嵌入的手寫功能等等。因此,手寫數(shù)字的識(shí)別研究有著重大的現(xiàn)實(shí)意義,一旦研究成功并投入應(yīng)用,將產(chǎn)生巨大的社會(huì)和經(jīng)濟(jì)效益。[1]
數(shù)字字符識(shí)別是目前模式識(shí)別功能的一個(gè)重要組成部分?;诠铝Ⅻc(diǎn)、交叉數(shù)和中間數(shù)研究,該文研究了一種新的手寫數(shù)字識(shí)別算法。主要內(nèi)容包括:對(duì)所寫字符進(jìn)行截取以及掃描所寫字符并利用特征提取獲得孤立點(diǎn)、交叉點(diǎn)和和中間點(diǎn),從而進(jìn)行數(shù)字識(shí)別。
1數(shù)字識(shí)別概述
手寫體數(shù)字識(shí)別方法大體可分為兩類:基于統(tǒng)計(jì)的識(shí)別方法和基于結(jié)構(gòu)的識(shí)別方法。第一類方法包括模板匹配法、矩法、筆道的點(diǎn)密度測(cè)試、字符軌跡法及數(shù)字變換法等。第二類則是盡量抽取數(shù)字的骨架或輪廓特征,如孤立點(diǎn)、交叉點(diǎn)、內(nèi)部的虛實(shí),起點(diǎn)和終點(diǎn)位于中線的位置等,兩類方法具有一定的互補(bǔ)性。該文中使用了一個(gè)基于結(jié)構(gòu)特征的分類識(shí)別。
數(shù)字識(shí)別的基本過程分為位圖模式確定,位圖截取,數(shù)字識(shí)別和輸出結(jié)果四部分。其中,位圖模式是指使用在手寫過程中,任何一個(gè)圖形的形成都是有有限個(gè)像素點(diǎn)組成的位圖和像素陣列來表示的圖像,基于這種模式我們可以獲取圖形的大小和一些特征。
位圖截取指通過對(duì)位圖模式的掃描,根據(jù)上,下,左,右四個(gè)方向掃描,首先獲取到的點(diǎn)就作為該方向的邊界。識(shí)別指對(duì)剛才截取的圖像重新進(jìn)行掃描,根據(jù)算法獲取到孤立點(diǎn)個(gè)數(shù),交叉數(shù)的數(shù)目和中間數(shù)的值,依據(jù)它們進(jìn)行識(shí)別。最后,識(shí)別完成后,在相應(yīng)的區(qū)域輸出所識(shí)別的結(jié)果,如果無法識(shí)別,也需要做相應(yīng)處理。
1的孤立點(diǎn)有兩個(gè),并且對(duì)書寫的1的細(xì)度有要求,此時(shí)1也沒識(shí)別。7的左下部分的三分之一為空,此時(shí)7也沒識(shí)別出來。
由于手寫數(shù)字字符的任意性比較高,對(duì)一些數(shù)字字符還存在識(shí)別錯(cuò)誤和不能識(shí)別。一個(gè)是因?yàn)槭髽?biāo)書寫的不易操作性造成了書寫時(shí)可能做成圈,還有一些頓筆。一個(gè)是對(duì)特征提取的還不足夠多,以至于在有些數(shù)字的識(shí)別上出現(xiàn)錯(cuò)誤識(shí)別。
由于本算法對(duì)特征提取的不足,如果能把手寫區(qū)域那部分的區(qū)域進(jìn)行擴(kuò)大,例如擴(kuò)大到16×16的像素點(diǎn)界面,就能很好的解決鼠標(biāo)的不易操作性和頓筆。另外是改進(jìn)算法,獲取足夠多的特征進(jìn)行識(shí)別。例如基于BP神經(jīng)網(wǎng)絡(luò)的識(shí)別算法就比較好,不過它要預(yù)先存入相當(dāng)多的樣本,在對(duì)不熟悉的字符進(jìn)行識(shí)別時(shí),必須先進(jìn)行樣本訓(xùn)練,等到獲得相當(dāng)多的樣本時(shí),提取特征,進(jìn)行識(shí)別。
[1]張宏林,Visual C++數(shù)字圖像模式識(shí)別技術(shù)及工程實(shí)踐[M].北京:人民郵電出版社,2003:167-196.
[2]鄭靈芝,黃德才.基于最近鄰相似度的孤立點(diǎn)檢測(cè)及半監(jiān)督聚類算法[J].計(jì)算機(jī)系統(tǒng)應(yīng)用,2012(2).