盲文自動(dòng)識(shí)別方法研究

2010-09-19 07:59:52王麗榮

長(zhǎng)春大學(xué)學(xué)報(bào) 2010年8期

關(guān)鍵詞：字符串盲文漢語(yǔ)拼音

尹佳，李杰，王麗榮

(1.長(zhǎng)春理工大學(xué) 研究生學(xué)院，吉林長(zhǎng)春 130022;2.長(zhǎng)春大學(xué) 電子信息工程學(xué)院，吉林長(zhǎng)春 130022)

盲文自動(dòng)識(shí)別方法研究

尹佳1，李杰2，王麗榮2

(1.長(zhǎng)春理工大學(xué) 研究生學(xué)院，吉林長(zhǎng)春 130022;2.長(zhǎng)春大學(xué) 電子信息工程學(xué)院，吉林長(zhǎng)春 130022)

本文研究的盲文點(diǎn)字自動(dòng)識(shí)別技術(shù)，利用數(shù)字?jǐn)z像機(jī)采集盲文圖像，并利用圖像處理技術(shù)，對(duì)盲文圖像進(jìn)行預(yù)處理，將盲文圖像轉(zhuǎn)換成二值圖像，然后再利用盲文點(diǎn)字的特性來(lái)提取盲文點(diǎn)字特征，并定位、分組盲文點(diǎn)字單元，以二進(jìn)制字符串的形式與盲文語(yǔ)料庫(kù)進(jìn)行匹配，識(shí)別出盲文點(diǎn)字信息。本論文中給出了盲文識(shí)別的總體方法，并詳細(xì)介紹了具體的處理方法。實(shí)驗(yàn)證明，該方法能有效、準(zhǔn)確的提取盲文點(diǎn)字，并轉(zhuǎn)換成漢語(yǔ)拼音。

盲文識(shí)別;盲文圖像采集;盲文圖像分割;盲文特征提取

0 引言

根據(jù)我國(guó)的盲人數(shù)量以及受教育的盲人數(shù)量來(lái)看，我國(guó)視力殘疾人群中有很大一部分不能順利閱讀盲文讀物，這對(duì)盲人信息獲取、融入社會(huì)極為不利。在盲人學(xué)校，任課教師大都視力正常且大多不懂盲文，大量的盲文試卷、作業(yè)等盲文材料需要任課教師閱讀、批改，這對(duì)老師來(lái)說(shuō)無(wú)疑是一項(xiàng)艱巨的工作，如何快速準(zhǔn)確批閱盲生試卷作業(yè)等現(xiàn)實(shí)性事件已成為盲校教學(xué)中亟待解決的問(wèn)題。

本文主要研究盲文點(diǎn)字的提取識(shí)別方法，主要包括盲文圖像的獲取方法及預(yù)處理、盲文點(diǎn)字信息的提取及識(shí)別技術(shù)等幾個(gè)部分。研究的最終目的是要研發(fā)出一種方便快捷的盲文自動(dòng)識(shí)別裝置。盲文是通過(guò)點(diǎn)字機(jī)等在紙張上制作出的不同組合的凸點(diǎn)陣(3×2陣列)，如圖1所示為盲文的采集圖片。

1 盲文圖像的采集

盲文圖像的采集部分由成像裝置和鏡頭兩部分組成，這也是組成識(shí)別系統(tǒng)的重要環(huán)節(jié)。本論文在研究階段采用如圖2所示的圖像采集系統(tǒng)，該裝置能完成一秒鐘高速拍攝，分辨率達(dá)到2048×1536，可拍取30cm ×23cm大小紙張的材料，圖像數(shù)據(jù)通過(guò)USB2.0接口傳送到主機(jī)。

圖1 盲文采集系統(tǒng)采集的盲文示意圖

圖2 盲文采集系統(tǒng)

2 盲文圖像的增強(qiáng)

本文采用了有限對(duì)比自適應(yīng)直方圖均衡化的方法。該方法采用局部均衡的方法，就是把圖像分割成若干小區(qū)域進(jìn)行各個(gè)部分的局部均衡。該方法由于對(duì)每一小塊都進(jìn)行了直方圖均衡，輸出圖像更加接近指定圖像。同時(shí)該方法還可調(diào)整灰度圖像的對(duì)比度，使圖像像素均勻分布在圖像的整個(gè)灰度范圍內(nèi)。此外，盲文圖像在進(jìn)行局部均衡化后產(chǎn)生的人為邊界，通過(guò)雙線性插值方法來(lái)組合相鄰的區(qū)域予以消除。經(jīng)過(guò)增強(qiáng)處理的盲文圖像如圖3所示。

3 盲文點(diǎn)字的檢測(cè)

盲文點(diǎn)字檢測(cè)也就是點(diǎn)字的特征提取，即把點(diǎn)字從圖像中提取出來(lái)。本文主要包括以下兩個(gè)部分：數(shù)學(xué)形態(tài)學(xué)處理和閾值分割數(shù)學(xué)形態(tài)學(xué)是一門(mén)新興的圖像處理分析工具，包括腐蝕、膨脹、開(kāi)運(yùn)算和閉運(yùn)算［1］。根據(jù)盲文圖像特點(diǎn)，我們最終選取半徑為1的圓形結(jié)構(gòu)元素對(duì)盲文圖像進(jìn)行腐蝕的方法，來(lái)檢測(cè)相應(yīng)盲文特征信息。圖像的腐蝕可以消除圖像的邊界點(diǎn)，使圖像邊界向內(nèi)部收縮，把小于結(jié)構(gòu)元素的圖像去除，消除圖像邊緣的尖峰和凸角及圖像間的細(xì)小連通。之后采用閾值分割方法［2］對(duì)圖像進(jìn)行二值處理。

閾值分割的關(guān)鍵是閾值的選取方法，大津法是一種自適應(yīng)計(jì)算閾值的分割方法。假設(shè)有大小為M×N圖像I(x，y)，記T為前景(目標(biāo))和背景的分割閾值，屬于前景的像素點(diǎn)數(shù)占整幅圖像的比例記為w0，其平均灰度v0;背景像素點(diǎn)數(shù)占w1，其平均灰度為v1。圖像的總平均灰度記為v，類(lèi)間方差記為g。圖像中像素的灰度值小于閾值T的像素個(gè)數(shù)記作N0，像素灰度大于閾值T的像素個(gè)數(shù)記作N1，則有：

在實(shí)際應(yīng)用中，我們直接用大津法計(jì)算量大，一般為了減少計(jì)算量，將式(1)代入式(2)，得到等價(jià)公式：

采用遍歷的方法，設(shè)灰度值t，然后從最小灰度值到最大灰度值遍歷t，當(dāng)t值使類(lèi)間方差g最大時(shí)，t即為分割的最佳閾值T，使用該方法進(jìn)行分割意味著錯(cuò)分概率最小。針對(duì)盲文圖像特點(diǎn)，本文具體采用了局部閾值分割方法，先把盲文圖像分成若干小塊，再分別在每個(gè)圖像小塊內(nèi)采用大津算法進(jìn)行局部分割，并根據(jù)盲文排列的直線型特點(diǎn)，去除孤立點(diǎn)及雜點(diǎn)。提取出我們實(shí)驗(yàn)所需要的盲文點(diǎn)字，實(shí)驗(yàn)結(jié)果如圖4所示。

圖3 盲文增強(qiáng)圖像

圖4 盲文二值圖像

4 盲文點(diǎn)字的識(shí)別

進(jìn)行盲文圖像處理的目的就是要把盲點(diǎn)與背景分開(kāi)，也就是說(shuō)盲點(diǎn)與背景的閾值要形成很大的差異，這樣我們就可以在后面的處理中，根據(jù)盲點(diǎn)的閾值來(lái)定位該點(diǎn)，并分出盲文單元，與語(yǔ)料庫(kù)進(jìn)行匹配，輸出識(shí)別結(jié)果。

4.1 盲文單元分組定位

如圖5所示左上角的一個(gè)3×2陣列即為一個(gè)盲文單元，假設(shè)6點(diǎn)的位置按圖5所示順序(a，b，c，d，e，f)進(jìn)行排列。研究發(fā)現(xiàn)，盲文字符所對(duì)應(yīng)的點(diǎn)陣的排列是有一定規(guī)律的，而且每個(gè)盲文字符代碼間的距離都是有一定標(biāo)準(zhǔn)的［3］。我們可以根據(jù)這一性質(zhì)來(lái)進(jìn)行盲文字符的提取。

根據(jù)紙介盲文的這些特點(diǎn)，我們通過(guò)盲點(diǎn)的閾值，以水平和垂直兩個(gè)方向?yàn)槟繕?biāo)，對(duì)盲文圖像進(jìn)行劃線處理，則盲文點(diǎn)字落在直線上，如圖5所示。然后以3×2矩陣形式依次進(jìn)行分塊劃分，一個(gè)目標(biāo)矩陣為一個(gè)盲文單元。在每個(gè)盲文單元里按先前規(guī)定的順序檢測(cè)直線交點(diǎn)處是否存在盲點(diǎn)，有點(diǎn)處用1表示，無(wú)點(diǎn)處用0表示［4］，最終以一個(gè)二進(jìn)制字符串的形式予以表示并保存該盲文字符。圖5所示上半部的首個(gè)盲文單元以二進(jìn)制字符串011110的形式保存。

圖5 盲文識(shí)別示例圖

4.2 盲文字符到漢語(yǔ)拼音的識(shí)別

由于漢語(yǔ)盲文是由拼音、數(shù)字、標(biāo)點(diǎn)符號(hào)組成的。我們的任務(wù)是把識(shí)別出的盲文單元轉(zhuǎn)換成他所代表的字母、數(shù)字或標(biāo)點(diǎn)，這要求我們建立標(biāo)準(zhǔn)的盲文語(yǔ)料庫(kù)。根據(jù)我們前文提到的方法，把所有漢語(yǔ)盲文字符的二進(jìn)制字符串和所對(duì)應(yīng)的字符一一對(duì)應(yīng)的存入預(yù)料庫(kù)中，建立專(zhuān)業(yè)的標(biāo)準(zhǔn)盲文語(yǔ)料庫(kù)。識(shí)別過(guò)程是：提取出盲文單元，把盲文轉(zhuǎn)換成二進(jìn)制的字符串，和語(yǔ)料庫(kù)中的字符串進(jìn)行一一比對(duì)，匹配成功則輸出該字符串所代表的漢語(yǔ)拼音、數(shù)字或者標(biāo)點(diǎn)。未匹配則重新定位該盲文單元，進(jìn)行再次細(xì)化分割，準(zhǔn)確識(shí)別出盲文單元后再匹配輸出結(jié)果。

5 結(jié)語(yǔ)

論文所提及的方法能有效提取紙介盲文圖像中的盲文點(diǎn)字，并能準(zhǔn)確的轉(zhuǎn)換成漢語(yǔ)拼音，完成了盲文到漢語(yǔ)拼音的轉(zhuǎn)換識(shí)別。我們下一步的實(shí)驗(yàn)任務(wù)，就是繼續(xù)細(xì)化相關(guān)算法，進(jìn)一步消除噪聲污染，提高盲文點(diǎn)字提取和盲文識(shí)別的準(zhǔn)確率;同時(shí)把漢語(yǔ)拼音轉(zhuǎn)換成漢字并進(jìn)行語(yǔ)音處理，最終以語(yǔ)音的形式輸出。當(dāng)前所遇到的困難在于，漢語(yǔ)拼音存在一音多字的現(xiàn)象，無(wú)論是有聲調(diào)的盲文還是無(wú)聲調(diào)的盲文，在識(shí)別成漢語(yǔ)拼音后都存在這種歧義性［5］，我們的任務(wù)就是深化研究，盡可能的減少識(shí)別的歧義性，提高識(shí)別率。

［1］張津，萬(wàn)振凱.基于數(shù)學(xué)形態(tài)學(xué)的圖像二值化算法［J］.儀器儀表用戶，2008，115(2)：1671-1041.

［2］ R.Lienhat，A.Wernicke.Localizing and segmenting text in image，video and web pages［J］.IEEE Transactions on Circuits and Systems for Video Technology，2002(12)：256-268.

［3］ Shanjun ZHANG，K.YOSHINO.A Braille Recognition System by the Mobile Phone with Embedded Camera［J］.ICICIC 2007：1321-1324.

［4］ H.R.Shahbazkia，T.T.Silva and R.M.Guerreiro.Automatic Braille Code Translation System［M］.M.Lazo and A.Sanfeliu(Eds.)：CIARP 2005，LNCS 3773，2005：233-241.

［5］江銘虎，朱小燕，等.基于多種知識(shí)的盲文翻譯的研究［J］.清華大學(xué)學(xué)報(bào)(自然科學(xué)版)，2000，40(9)：69-73.

責(zé)任編輯：吳旭云

Research on braille automatic identification method

YIN Jia1，LI Jie2，WANG Li-rong2
(1.Graduate School，Changchun University of Science and Technology，Changchun 130022，China; 2.College of Electronic Information Engineering，Changchun University，Changchun 130022，China)

The braille automatic identification technology described in this paper captures braille images by digital camera，pretreats them by image processing technology，converts them into binary images，then extracts braille features by the fixed nature of braille，positions and groups braille cells to match corpora by the binary character string so as to identify information.This paper gives the general method of braille recognition and introduces concrete methods.The experiments show that the method is effective and accurate for braille extraction and convertion into Chinese spelling.

braille recognition;braille image acquisition;braille image segmentation;braille feature extraction

TP391.41

1009-3907(2010)08-0054-03

2010-06-07

長(zhǎng)春市科技局國(guó)際科技合作項(xiàng)目［08GH07］

尹佳(1986-)，男，陜西西安人，碩士研究生，主要從事檢測(cè)技術(shù)與過(guò)程控制方向的研究。

99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

盲文自動(dòng)識(shí)別方法研究

0 引言

1 盲文圖像的采集

2 盲文圖像的增強(qiáng)

3 盲文點(diǎn)字的檢測(cè)

4 盲文點(diǎn)字的識(shí)別

5 結(jié)語(yǔ)