王 勝,陳 寧
(集美大學(xué) 機(jī)械與能源工程學(xué)院,福建 廈門 361021)
一種改進(jìn)的集裝箱箱號(hào)自動(dòng)識(shí)別系統(tǒng)
王 勝,陳 寧
(集美大學(xué) 機(jī)械與能源工程學(xué)院,福建 廈門 361021)
針對(duì)已有集裝箱箱號(hào)字符定位、分割、識(shí)別算法上的不足,分別提出了基于逆向掃描的箱號(hào)區(qū)域提取法,基于區(qū)域重心的字符定位分割法和基于概率神經(jīng)網(wǎng)絡(luò)的字符識(shí)別法。用MATLAB編程,實(shí)現(xiàn)了對(duì)集裝箱箱號(hào)的自動(dòng)識(shí)別,識(shí)別正確率可達(dá)95%。提出的方法具有識(shí)別正確率高、算法簡(jiǎn)單、可靠性好等優(yōu)點(diǎn),有望提高碼頭道口通勤率,降低運(yùn)營(yíng)成本。
集裝箱箱號(hào);逆向掃描;字符分割;概率神經(jīng)網(wǎng)絡(luò);字符識(shí)別
為了滿足現(xiàn)代港口發(fā)展要求,有必要解決碼頭道口集裝箱通勤率低這一難點(diǎn)問(wèn)題。目前,有少部分碼頭采用射頻識(shí)別(Radio Frequency Identification,RFID)的方式錄入箱號(hào)信息,相對(duì)于傳統(tǒng)的人工檢查核對(duì),效率有了很大提高。但它需要為每個(gè)集裝箱貼上統(tǒng)一標(biāo)準(zhǔn)的RFID電子標(biāo)簽,成本較高,難以推廣應(yīng)用。
而基于機(jī)器視覺(jué)的光學(xué)字符識(shí)別法是一種可行的解決方案。它無(wú)需對(duì)集裝箱增加額外附件,只需借助相機(jī)拍攝集裝箱箱號(hào)圖像,通過(guò)計(jì)算機(jī)處理就可以將信息錄入到數(shù)據(jù)庫(kù)并控制通行。已有研究人員和工程師在這方面做過(guò)一些研究,主要是對(duì)箱號(hào)字符的定位、分割、識(shí)別算法的研究。李小平[1]等研究了利用BP算法實(shí)現(xiàn)集裝箱箱號(hào)識(shí)別。He Z[2]等提出了基于模板匹配的箱號(hào)字符提取技術(shù)。趙海英[3]等介紹了模式識(shí)別與結(jié)構(gòu)分析組合及箱號(hào)校對(duì)的識(shí)別技術(shù)。龐然[3]等研究了面向集裝箱字符識(shí)別的預(yù)處理算法。陳默[4]等針對(duì)箱號(hào)預(yù)處理后出現(xiàn)粘結(jié)現(xiàn)象,提出了基于隱馬爾科夫模型的連續(xù)字符識(shí)別方法。毛洪輝[6]基于實(shí)際應(yīng)用,設(shè)計(jì)開(kāi)發(fā)了一種碼頭閘口集裝箱箱號(hào)自動(dòng)識(shí)別系統(tǒng),并做了仿真。
集裝箱箱號(hào)字符識(shí)別系統(tǒng)的關(guān)鍵技術(shù)包括箱號(hào)搜索與提取,字符定位與分割,字符特征提取與字符識(shí)別。由于受各種環(huán)境因素的影響以及箱號(hào)自身特點(diǎn)的約束,實(shí)現(xiàn)起來(lái)還是有一定的復(fù)雜度。前面的研究有些是側(cè)重其中一個(gè)方面,有些是相關(guān)處理識(shí)別算法復(fù)雜,不能滿足工程應(yīng)用。因此,本文針對(duì)其不足研究了新的集裝箱箱號(hào)字符處理與識(shí)別方法。
集裝箱兩側(cè)和箱門上除了有集裝箱箱號(hào)外還存在許多干擾字符,怎樣從眾多字符中準(zhǔn)確提取箱號(hào)圖像是首要的一步。文獻(xiàn)[6]通過(guò)假設(shè)箱號(hào)在圖像中的位置固定來(lái)提取箱號(hào),這種假設(shè)可能不盡合理。文獻(xiàn)[5]先預(yù)定位滿足條件的字符區(qū)域,再進(jìn)一步確定箱號(hào)位置,文獻(xiàn)[7]提出了基于小波變換的集裝箱箱號(hào)定位法,它需要提取字符圖像的小波特征,因此算法相對(duì)復(fù)雜,并且字符定位正確率也僅90%左右。鑒于現(xiàn)有方法存在的一些不足之處,本文提出一種基于逆向掃描的箱號(hào)區(qū)域提取法。其依據(jù)是箱門上橫向箱號(hào)字符處于圖像右上角。因此,采用從上到下、從右到左的掃描方式可以大致確定箱號(hào)位置,再經(jīng)過(guò)預(yù)處理并結(jié)合箱號(hào)字符特點(diǎn)可以較精確地確定箱號(hào)區(qū)域并將其提取出來(lái)。處理結(jié)果如圖1所示。
圖1 原圖及提取到的箱號(hào)
從整幅圖像中提取出完整的集裝箱箱號(hào)后就可以開(kāi)始對(duì)字符進(jìn)行分割了。文獻(xiàn)[7]采用了基于灰度投影的字符分割方法,但需要預(yù)先知道字符寬度、間距等信息,處理比較復(fù)雜。本文提出了基于區(qū)域重心的字符定位分割法。
首先需要確定圖像中每個(gè)字符區(qū)域的重心坐標(biāo)。設(shè)單個(gè)字符的二維離散圖像函數(shù)用f(x,y)表示,則其(p+q)階矩定義為
(1)
然后根據(jù)區(qū)域信息找出該區(qū)域最小外接矩形的左上點(diǎn)坐標(biāo)以及寬高像素值。最后根據(jù)每個(gè)矩形所包含的信息就可以自適應(yīng)地確定各個(gè)字符的位置與大小,進(jìn)而將它們逐一分割出來(lái),并歸一化為30×60像素大小。字符信息及分割結(jié)果如圖2所示。
圖2 字符定位與分割結(jié)果
對(duì)于集裝箱側(cè)面的箱號(hào),通常不在同一平面上,字符間隔不均勻。不僅有縱向一列排列的,還存在縱向兩列排列的,見(jiàn)圖3。同時(shí)還可能存在污點(diǎn)、剝落、傾斜、光照不均等不利情況,但相對(duì)來(lái)說(shuō)干擾字符較少。因此,這里直接取縱向排列的箱號(hào)圖像做處理,見(jiàn)圖4。不同于橫向排列時(shí)的處理方法,這里需要采用重心排列法,才能依次有序地分割出單個(gè)字符。算法改進(jìn)后的分割效果如圖5所示。
圖3 原圖(縱向字符)
圖4 字符定位(縱向字符)
圖5 字符分割結(jié)果
字符分割是字符特征提取的基礎(chǔ),而特征提取又是后面自動(dòng)識(shí)別的關(guān)鍵,對(duì)特征選擇的好壞將直接決定字符自動(dòng)識(shí)別的效果,甚至整個(gè)系統(tǒng)的優(yōu)劣。
特征提取的目標(biāo)是找到一個(gè)長(zhǎng)度為n的向量{x1,x2,…,xn},用它來(lái)表示原圖像,稱為原圖像的一個(gè)特征向量。該特征向量應(yīng)滿足以下條件[8]:
1)當(dāng)圖像類似時(shí),得到的特征向量也比較類似;當(dāng)圖像差距很大時(shí),得到的特征向量的距離差別也很大。即該特征向量必須能夠代表這一圖像模式。
2)向量的長(zhǎng)度n應(yīng)盡量小,盡量不包含對(duì)分類沒(méi)有作用的分量,以便有效地進(jìn)行分類并減小計(jì)算量。
本文采用了字符結(jié)構(gòu)特征和統(tǒng)計(jì)特征相結(jié)合的方式,共抽取了12維特征值。其中結(jié)構(gòu)特征6個(gè),包括水平和豎直方向1/3、1/2和2/3處交點(diǎn)數(shù)各3個(gè)。比如水平1/2交點(diǎn)數(shù)是指在圖像水平方向1/2處畫(huà)一條直線,然后計(jì)算圖中等于1的像素與該直線的交點(diǎn)個(gè)數(shù)。統(tǒng)計(jì)特征有6個(gè),包括將30×60圖像四等分得到4個(gè)15×30小區(qū)域,以及水平和豎直方向1/2~2/3部分區(qū)域2個(gè),分別統(tǒng)計(jì)各個(gè)小區(qū)域中像素值為1的點(diǎn)的個(gè)數(shù)。這樣就構(gòu)成了一個(gè)12維的列向量,將其作為圖像的特征向量,如圖6所示。并對(duì)所有訓(xùn)練樣本做逐個(gè)歸一化而不是統(tǒng)一歸一化處理,這將大大提高單個(gè)字符識(shí)別正確率。
圖6 圖像字符提取
用來(lái)解決模式識(shí)別與分類的方法比較多,包括模板匹配、歐氏距離判別法和基于支持向量機(jī)的字符識(shí)別[9]等方法。另外,BP神經(jīng)網(wǎng)絡(luò)由于具有實(shí)現(xiàn)任何復(fù)雜非線性映射的能力,特別適合求解內(nèi)部機(jī)制復(fù)雜的問(wèn)題,將其用于字符識(shí)別中的研究也頗多。但它同時(shí)也存在一些難以克服的局限性,比如需要的參數(shù)較多,容易陷入局部最優(yōu),對(duì)初始權(quán)重比較敏感,網(wǎng)絡(luò)訓(xùn)練時(shí)間較長(zhǎng)等。而概率神經(jīng)網(wǎng)絡(luò)具有學(xué)習(xí)速度快,不易陷入局部極小值等優(yōu)點(diǎn)。因此,本文研究了基于概率神經(jīng)網(wǎng)絡(luò)的字符識(shí)別方法。
考慮到某些數(shù)字和字母的相似性比較大,為了提高識(shí)別率,本文創(chuàng)建了兩個(gè)概率神經(jīng)網(wǎng)絡(luò),分別對(duì)10個(gè)數(shù)字字符和26個(gè)大寫(xiě)字母字符進(jìn)行識(shí)別。
網(wǎng)絡(luò)的第一層為輸入層,神經(jīng)元節(jié)點(diǎn)數(shù)與輸入向量的維數(shù)相同,包含12個(gè)神經(jīng)元。第二層為徑向基層,神經(jīng)元節(jié)點(diǎn)數(shù)等于樣本個(gè)數(shù)(數(shù)字識(shí)別樣本200個(gè),字母識(shí)別樣本520個(gè))。第三層為隱含層,神經(jīng)元節(jié)點(diǎn)個(gè)數(shù)為分類的類別數(shù)(數(shù)字樣本分10類,字母樣本分26類)。輸出層包含一個(gè)神經(jīng)元,對(duì)應(yīng)分類的類別。概率神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)見(jiàn)圖7。
圖7 概率神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)(字母字符)
程序運(yùn)行流程如圖8所示。
圖8 程序運(yùn)行流程圖
用MATLAB神經(jīng)網(wǎng)絡(luò)工具箱中的newpnn函數(shù)創(chuàng)建兩個(gè)概率神經(jīng)網(wǎng)絡(luò),分別用來(lái)訓(xùn)練數(shù)字字符和字母字符。然后再用訓(xùn)練好的網(wǎng)絡(luò)對(duì)訓(xùn)練樣本和測(cè)試樣本進(jìn)行單個(gè)識(shí)別,對(duì)統(tǒng)一歸一化和逐個(gè)歸一化的識(shí)別結(jié)果做比較,如表1和表2所示。
表1 識(shí)別結(jié)果比較(數(shù)字字符)%
400個(gè)數(shù)字字符未加噪聲添加噪聲訓(xùn)練(統(tǒng)一歸一化)7876訓(xùn)練(逐個(gè)歸一化)10099測(cè)試(統(tǒng)一歸一化)6261測(cè)試(逐個(gè)歸一化)9189
表2 識(shí)別結(jié)果比較(字母字符)%
520個(gè)字母字符未加噪聲添加噪聲訓(xùn)練(統(tǒng)一歸一化)7471訓(xùn)練(逐個(gè)歸一化)10098測(cè)試(統(tǒng)一歸一化)5958測(cè)試(逐個(gè)歸一化)8886
結(jié)果表明,逐個(gè)歸一化后對(duì)訓(xùn)練樣本的識(shí)別率有很大提高,接近100%。對(duì)未訓(xùn)練的測(cè)試樣本的識(shí)別率稍低,考慮到概率神經(jīng)網(wǎng)絡(luò)識(shí)別的原理,這點(diǎn)也是容易理解的??梢酝ㄟ^(guò)不斷增加相應(yīng)訓(xùn)練樣本數(shù)來(lái)提高識(shí)別正確率,其效果通過(guò)實(shí)驗(yàn)證明也是很明顯的(單個(gè)識(shí)別正確率可達(dá)95%)。而且基于概率神經(jīng)網(wǎng)絡(luò)的字符識(shí)別對(duì)噪聲不太敏感,魯棒性較強(qiáng)。
增加訓(xùn)練樣本后,對(duì)前面提取的集裝箱箱號(hào)字符進(jìn)行逐個(gè)識(shí)別,MATLAB程序運(yùn)行結(jié)果如圖9所示。
圖9 集裝箱箱號(hào)識(shí)別結(jié)果
測(cè)試結(jié)果表明,在獲得較為可靠的箱號(hào)圖像,并經(jīng)過(guò)適當(dāng)處理后,系統(tǒng)識(shí)別結(jié)果還是相當(dāng)可靠的。值得注意的是,有時(shí)校驗(yàn)碼由于圖像質(zhì)量以及邊框的影響導(dǎo)致字符提取結(jié)果不理想,相對(duì)容易出現(xiàn)誤識(shí)別現(xiàn)象,但也在可控和可接受范圍之內(nèi)。
本文針對(duì)集裝箱箱號(hào)識(shí)別的幾個(gè)關(guān)鍵技術(shù),包括箱號(hào)定位、字符分割和字符識(shí)別,分別提出了基于逆向掃描的箱號(hào)區(qū)域提取法,基于區(qū)域重心的字符定位分割法和基于概率神經(jīng)網(wǎng)絡(luò)的字符識(shí)別法,從而完整有效地實(shí)現(xiàn)了對(duì)不同形式集裝箱箱號(hào)的正確快速可靠識(shí)別。
另外,由于集裝箱兩側(cè)以及箱門上的箱號(hào)周圍干擾字符較多,排列復(fù)雜多樣,從而導(dǎo)致處理算法相對(duì)復(fù)雜,容易產(chǎn)生誤識(shí)別。為了進(jìn)一步提高識(shí)別的準(zhǔn)確性及系統(tǒng)運(yùn)行的可靠性,可采集箱頂箱號(hào)(無(wú)干擾字符)圖像或者同時(shí)采集不同部位箱號(hào)圖像進(jìn)行聯(lián)合識(shí)別,相互驗(yàn)證,系統(tǒng)工作流程如圖10所示。
圖10 系統(tǒng)運(yùn)行流程圖
另外還可以結(jié)合校驗(yàn)碼自檢驗(yàn)規(guī)則來(lái)做最后驗(yàn)證。這樣就能保證足夠高的識(shí)別率,以滿足實(shí)際應(yīng)用要求,有望提高碼頭道口甚至整個(gè)集裝箱裝卸管理的自動(dòng)化水平。
[1] 李小平,段鍇,趙健龍. 利用BP算法實(shí)現(xiàn)集裝箱編號(hào)識(shí)別[J].北京理工大學(xué)學(xué)報(bào),2001,21(3):345-347.
[2] HE Z,LIU J,MA H,et al. A new automatic extraction method of container identity codes[J].IEEE Trans. Intelligent Transportation Systems,2005,6(1):72-78.
[3] 趙海英,姚振強(qiáng),陳斌,等. 集裝箱智能道口箱號(hào)識(shí)別系統(tǒng)中的字符識(shí)別技術(shù)[J].水運(yùn)工程,2006(6):34-36.
[4] 龐然,安博文,李丹. 面向集裝箱字符識(shí)別的預(yù)處理算法[J].計(jì)算機(jī)技術(shù)與發(fā)展,2010,20(12):21-23.
[5] 陳默,何小海,吳煒,等. 結(jié)合獨(dú)立與連續(xù)字符識(shí)別的集裝箱號(hào)識(shí)別技術(shù)[J].四川大學(xué)學(xué)報(bào):工程科學(xué)版,2011,43(Z1):139-145.
[6] 毛洪輝. 碼頭閘口集裝箱箱號(hào)自動(dòng)識(shí)別系統(tǒng)設(shè)計(jì)與開(kāi)發(fā)[J].水運(yùn)工程,2011(11):48-51.
[7] 許庶,馬志峰,吳煒. 基于計(jì)算機(jī)視覺(jué)的集裝箱號(hào)碼識(shí)別系統(tǒng)[J].電視技術(shù),2010,34(5):105-108.
[8] 陳明. MATLAB神經(jīng)網(wǎng)絡(luò)原理與實(shí)例精解[M].北京:清華大學(xué)出版社,2013.
[9] 高保平,白瑞林. 軸承壓印字符自動(dòng)識(shí)別算法的研究[J].電視技術(shù),2012,36(9):142-145.
Improved Container Code Automatic Recognition System
WANG Sheng, CHEN Ning
(CollegeofMechanicalandEnergyEngineering,JimeiUniversity,FujianXiamen361021,China)
In view of the insufficiency of the existing positioning, segmentation and recognition algorithm to container codes, the codes area extraction method based on reverse scan, character location and segmentation method based on the center of gravity of area, character recognition method based on probabilistic neural network are presented. It implements automatic identification of the container codes using MATLAB, the recognition accuracy up to 95%. The proposed method has the advantages of high recognition accuracy, simple algorithm and good reliability. So it is expected to increase commuting rate of terminal crossing, and reduce operating costs.
container codes; reverse scan; character segmentation; probabilistic neural network; character recognition
福建省科技廳資助省屬高校專項(xiàng)(JK2014024)
TP391.4
A
10.16280/j.videoe.2015.19.027
王 勝(1991— ),碩士生,主要研究方向?yàn)闄C(jī)器視覺(jué)及其應(yīng)用、自動(dòng)控制;
2014-12-25
【本文獻(xiàn)信息】王勝,陳寧.一種改進(jìn)的集裝箱箱號(hào)自動(dòng)識(shí)別系統(tǒng)[J].電視技術(shù),2015,39(19).
陳 寧(1972— ),副教授,博士,主要研究方向?yàn)闄C(jī)器視覺(jué)、工程機(jī)器人。
責(zé)任編輯:任健男