(洛陽(yáng)師范學(xué)院 河南·洛陽(yáng) 471000)
字符識(shí)別廣泛應(yīng)用于生活的各個(gè)方面尤其是在車牌識(shí)別和醫(yī)療圖像識(shí)別等切實(shí)關(guān)系到人類日常生活質(zhì)量的場(chǎng)景中,提高字符的識(shí)別率也顯得尤為重要,而字符特征提取作為識(shí)別中的重要一步,直接關(guān)系到識(shí)別率,因此字符特征提取的研究也極具意義。
字符特征提取是指從經(jīng)過尺寸歸一化處理后的二值圖像中提取出字符的關(guān)鍵特征,同時(shí)要滿足特征向量的維數(shù)盡可能少,正確分類的精度盡可能高,系統(tǒng)有較高的穩(wěn)定性和魯棒性的要求。針對(duì)在實(shí)際生活中常用的數(shù)字和英文字母字符,本文提出一種將輪廓特征提取法和投影特征提取法相結(jié)合的方法,設(shè)置一個(gè)特征向量=[行輪廓特征,列輪廓特征,行投影特征,列投影特征]作為字符特征以便更好的進(jìn)行字符識(shí)別。
在日常的得到的數(shù)字和英文字母字符圖像常常存在大小不一致的問題,因此要將得到的字符二值圖像進(jìn)行尺寸歸一化處理,本算法中采用的是雙三次插值算法并將二值圖像統(tǒng)一尺寸為10*18,其中圖像的寬為18個(gè)像素點(diǎn),長(zhǎng)為10個(gè)像素點(diǎn),在MATLAB中使用語句imresize(img,[10,18],'bicubic')編碼實(shí)現(xiàn)。
本文采用的是輪廓特征提取法和投影特征法相結(jié)合的方法,將這個(gè)方法提取到的特征用一個(gè)特征向量表示,將特征向量用于BP神經(jīng)網(wǎng)絡(luò)的自學(xué)習(xí),進(jìn)而得到訓(xùn)練好的BP神經(jīng)網(wǎng)絡(luò)。
輪廓特征提取法為分別選取二值圖像中每行或每列的第一個(gè)白點(diǎn)(二值圖像中值為1的像素點(diǎn))到該行或該列中最后一個(gè)白點(diǎn)的距離作為特征向量值,若某一行或某一列中沒有白點(diǎn)則設(shè)為0,若只有一個(gè)白點(diǎn)則為1。設(shè)置特征向量矩陣Fr=[]、Fc=[]分別用來表示行輪廓特征和列輪廓特征。
字符的投影特征在字符圖像處理中廣泛應(yīng)用,其通過統(tǒng)計(jì)字符圖像在行上或列上的每個(gè)像素點(diǎn)的像素值即白點(diǎn)(二值圖像中值為1的像素點(diǎn))或者黑點(diǎn)(二值圖像中值為0像素點(diǎn))的總數(shù)來分析字符特征。在本文中分別統(tǒng)計(jì)字符圖像在每行以及每列的白點(diǎn)的數(shù)目作為投影特征,設(shè)置行投影特征向量Pr=[],列投影特征向量Pc=[]。
通過輪廓特征提取法和投影特征提取法分別得到了行輪廓特征Fr、列輪廓特征Fc、行投影特征Pr和列投影特征Pc,進(jìn)而可設(shè)置總的特征向量Feature=[Fr,Fc,Pr,Pc]。
本文分別提取輪廓特征和投影特征組合成字符的特征向量,用于字符識(shí)別,既能避免因單一特征造成識(shí)別的局限性,又增加了多個(gè)特征點(diǎn)進(jìn)而提高識(shí)別率。