阮學(xué)云,白文杰,倪 橋,黃 偉
(安徽理工大學(xué)機械工程學(xué)院,安徽 淮南 232001)
隨著互聯(lián)網(wǎng)電商平臺的快速發(fā)展,網(wǎng)上購物過程中產(chǎn)生了大量快遞包裹,在快遞配送的各個環(huán)節(jié),目前主要依賴人工手動分揀,而人會產(chǎn)生疲勞,容易發(fā)生誤操作。針對物流分揀中心人工分揀快遞[1]效率低的問題,提出了基于機器視覺的三段碼識別[2]技術(shù),三段碼是一串包含地址分揀區(qū)域的數(shù)字與字母的組合。然而傳統(tǒng)OCR直接匹配定位識別在某些復(fù)雜背景[3]下會有一定的偏差,因此本文中會以幾何變化優(yōu)化定位以及參數(shù)的變量替換,以達(dá)到更好的自適應(yīng)調(diào)整,從而提高OCR識別[4]的準(zhǔn)確率。
本次測試采用的圖片素材為300張快遞面單的不同的角度、距離以及曝光度下攝取的圖片,所采用的識別系統(tǒng)如圖1所示。識別系統(tǒng)包括攝像機、光源、光電傳感器和圖像處理單元。待測物體置于平臺裝置上,經(jīng)過并觸發(fā)光電傳感器,傳感器將信號傳輸給攝像機對待測物體抓拍,同時有環(huán)行光源對其補光,使目標(biāo)能夠更加清晰的反饋給圖像處理模塊。
圖1 圖像識別系統(tǒng)
在此次對字符識別的測試中,采用了基于形狀模板匹配[5-6]下的定位,以及大量的運用仿射變換和Blob分析對圖像進(jìn)行識別[7]前的預(yù)處理。
1)模板的創(chuàng)建與查找。如圖2是模板的創(chuàng)建與查找流程。模板匹配有三種方法,分別是基于組件的匹配,基于灰度值的匹配和基于形狀的匹配。在本次測驗中選擇比例縮放模板Scale_mode,其支持投影變形的匹配。
圖2 模板的創(chuàng)建與查找流程
上式在齊次坐標(biāo)上,等價于下面的式(1)
(1)
3) Blob分析。Blob是指圖像中的一塊連通區(qū)域,Blob分析[10]就是對前景/背景分離后的二值圖像,進(jìn)行連通域提取和標(biāo)記。其核心思想就是在一塊區(qū)域內(nèi),將出現(xiàn)“灰度突變”的范圍找出來,確定其大小、形狀及面積等。其算法就是設(shè)定一個m×n掃描矩陣,矩陣每移動一步,就計算矩陣中前半部的灰度值總和,與矩陣中后半部的灰度值總和的差。如果矩陣掃描到了一塊前景的邊緣,這時矩陣前部與后部灰度值總和差突變了,灰度值不再接近,則是到了一個Blob。當(dāng)算法掃描完整的時候,系統(tǒng)就記錄了發(fā)生這種突變情況的點的坐標(biāo)。之后再對這些邊緣點進(jìn)行一系列的分析,便可以得到這個Blob的大小、形狀及面積等信息[11]。
1) 圖像灰度化?;叶葓D像上每個像素的顏色值又稱為灰度。圖像的每個像素的顏色由R、G和B三個分量決定,每個分量有256種取值,如果直接進(jìn)行處理,信息計算量非常大,因此對圖像進(jìn)行灰度化處理可降低圖像處理時間。圖像灰度化處理有以下幾種方式:
①分量法
(2)
②)最大值法
Gray(i,j)=max{R(i,j),G(i,j),B(i,j)}
(3)
③平均值法
Gray(i,j)=((R(i,j)+G(i,j)+B(i,j))/3
(4)
④加權(quán)平均法
Gray(i,j)=0.299*R(i,j)+0.578*G(i,j)+
0.114*B(i,j)
(5)
上述式中i,j為各像素點在圖中的位置,R、G和B為各顏色通道的灰度值。由于人眼對綠色的敏感最高,對藍(lán)色敏感最低,因此將三個分量依據(jù)上式(5)進(jìn)行加權(quán)平均。
2)圖像濾波。由于成像系統(tǒng)、傳輸介質(zhì)和記錄設(shè)備等的不完善,數(shù)字圖像在其形成、傳輸記錄過程中往往會受到多種噪聲的污染。另外,在圖像處理的某些環(huán)節(jié)當(dāng)輸入的像對象并不如預(yù)想時也會在結(jié)果圖像中引入噪聲。這些噪聲在圖像上常表現(xiàn)為一引起較強視覺效果的孤立像素點或像素塊。對于數(shù)字圖像信號,噪聲表為或大或小的極值,這些極值通過加減作用于圖像像素的真實灰度值上,對圖像造成亮、暗點干擾,極大降低了圖像質(zhì)量,影響圖像復(fù)原、分割、特征提取、圖像識別等后繼工作的進(jìn)行。一種有效抑制噪聲的濾波器須考慮兩個基本問題:能有效地去除目標(biāo)和背景中的噪聲,能很好地保護目標(biāo)的形狀、大小及特定的幾何結(jié)構(gòu)特征。
此處選擇中值濾波:對一個數(shù)字信號序列xj(- y(i)=Med[x(i-N),…,x(i),…x(i+N)] (6) 3)定位校準(zhǔn)。由于快遞面單中因其背景較為復(fù)雜,無法通過單一的Blob仿射將目標(biāo)區(qū)域準(zhǔn)確選中,且定位角度的差異會使得目標(biāo)難以精準(zhǔn)識別,這是由于在亞像素(SubPixel)級別上通過形狀匹配的原理查找目標(biāo)可影響查找的方位、角度和縮放比例。 圖3所示的區(qū)域產(chǎn)生了輕微的平行四邊行的畸變,造成了較為明顯的角度差異。 圖3 角度偏差示意圖 因此為了減少角度偏差帶來的影響,將實際面單中同一水平上的且有一定水平距離的兩點作為基準(zhǔn)點,如‘H3’兩邊的連字符,或者選取周圍的線條上的兩部分線段,本次測試中選取了連字符區(qū)域,然后獲取它們在圖像窗口上的像素中心坐標(biāo),如圖4所示,以像素為單位。 圖4 兩點求夾角示意圖 (7) 圖5 向量求夾角示意圖 圖6 中心變換示意圖 (8) (9) (10) (11) 如圖11,在匹配到的區(qū)域圓心M上建立二維坐標(biāo)系,均以像素為單位,實際待處理區(qū)域的中心與匹配區(qū)域中心的連線與水平有α的角度,由幾何知識推導(dǎo)出以下式子 (12) 式中:s為位移長度,Scale為縮放比。 但在圖像窗口上,N點相對于M點的坐標(biāo)還需加上M點在圖像窗口原來的坐標(biāo),即假設(shè)M點在圖像窗口的位置坐標(biāo)為(i,j),則 (13) 在測試中存在著光照不均勻[12]的影響,會導(dǎo)致選擇的區(qū)域會有稍微的缺損,從而導(dǎo)致像素中心點的坐標(biāo)會有微小誤差。選擇一張水平放正的圖像,依次對圖像旋轉(zhuǎn)固定的角度,再利用上述的算法對其進(jìn)行角度測量,將測量后的角度與原來固定的進(jìn)行比較。為了使結(jié)果更加形象直觀,在這里以0.157弧度為單位刻度,選取了其中20組測量數(shù)據(jù)來繪制圖7和表1。 表1 不同方法定位角度數(shù)據(jù) 圖7 角度誤差折線圖 觀察上述圖表可知,單純地進(jìn)行模板匹配而沒有進(jìn)行定位的優(yōu)化,其誤差值的幅度最大;當(dāng)以選取的基準(zhǔn)點的方向作為定位優(yōu)化后的方向,其波動幅度也較大;而通過本文兩向量求夾角方法的定位角度波動范圍最小,即計算誤差值為最小,圖8和圖9能很明顯的對比出定位優(yōu)化后的精確度。 圖8 定位優(yōu)化前 圖9 定位優(yōu)化后 1)閾值分割。相機在采集圖片時,由于光照[13]條件存在細(xì)微的差別,導(dǎo)致圖像的分割可能會出現(xiàn)部分偏差。在處理圖像分割時,halcon中自帶均值和標(biāo)準(zhǔn)偏差局部閾值分割算法,可動態(tài)進(jìn)行閾值調(diào)整[14],能夠較好的分開目標(biāo)和背景,對不適合的參數(shù)設(shè)置不敏感。該算法中變量閾值v(i,j)定義: v(i,j)=max(StdDevScale*d(i,j),AbsThreshold) StdDevScale≥0 (14) v(i,j)=min(StdDevScale*d(i,j),AbsThreshold) StdDevScale<0 (15) (16) (17) (18) 式中:Min為圖像的最小灰度值,依據(jù)灰度直方圖10,調(diào)節(jié)方差的權(quán)重系數(shù)g。經(jīng)過多次測試,如圖11所示,改動后的全局閾值算法分割的目標(biāo)較為飽滿,使得求交集后的圖像最大程度的保持完整性。 a. 傳統(tǒng)閾值分割 b. 局部閾值法分割 c. 改進(jìn)后的閾值法分割圖11 不同方法的閾值分割 2)特征選擇。閾值分割后,需要調(diào)用connection算子將非連通區(qū)域分隔開,再調(diào)用select_shape算子,利用形狀特征選擇區(qū)域過濾掉一部分毛刺,通過觀察字符特征得出,如果將字符周邊無關(guān)的雜亂區(qū)域也選中,就可能會造成字符識別錯誤。此處測量模板特征區(qū)域的最大像素面積mubanmax和最小mubanmin,利用模板區(qū)域像素面積與縮放比的關(guān)系推導(dǎo)出公式(19),得到待處理圖片中目標(biāo)區(qū)域的最大像素面積areamax和最小areamin,使得面積選擇可以隨著攝取的圖片的大小變化而自適應(yīng)。選中的目標(biāo)區(qū)域效果如圖12所示。 (19) 根據(jù)多層感知器的原理,可以創(chuàng)建一個字符識別分類器來識別字符,且HALCON自帶OCR字符庫,且具有很好的識別效果。OCR字符識別技術(shù)是一個系統(tǒng)的技術(shù)集,它的實質(zhì)是根據(jù)字符所提取的特征,與系統(tǒng)中的模板相對比,將置信度最大的值返回,以此達(dá)到識別的目的。識別結(jié)果顯示在圖像窗口,如圖13所示,以及表2的不同情形下的識別率,由表中數(shù)據(jù)可明顯看出,在測試的300張圖片中,未經(jīng)過本文方法優(yōu)化前,同一張圖在任意角度下,識別正確率可達(dá)83%,而經(jīng)過本文方法優(yōu)化后識別正確率可提高到100%;當(dāng)任意圖片在任意角度下進(jìn)行識別處理時,本文方法優(yōu)化前識別正確率為71%,而經(jīng)過本文方法優(yōu)化后識別正確率可達(dá)99.7%。 圖13 識別結(jié)果 表2 面單識別率 在利用機器視覺處理快遞面單的過程中,由于圖像攝取角度的偏差,背景環(huán)境的給光線等影響對面單三段碼的定位都會產(chǎn)生不可避免的誤差。本文的方法則做了以下的改進(jìn): (1)在模板匹配定位時出現(xiàn)的角度差,利用目標(biāo)背景的幾何位置關(guān)系,重新確立目標(biāo)的中心方位。此處采用向量求解方式求取中心,避免了單純使用三角函數(shù)求解帶來的角度限制。 (2)且由上述數(shù)據(jù)可知,大大縮小了定位的誤差范圍,增加了識別面單的穩(wěn)定性。 (3)基于圖像灰度值信息構(gòu)造的變量參數(shù)能較好的克服光亮的變化,且變量的應(yīng)用也能較好的適應(yīng)目標(biāo)與背景分割。 下一步將會在面單的處理效率與識別率上進(jìn)一步優(yōu)化,對方法進(jìn)行改進(jìn),使其能夠滿足現(xiàn)代社會物流面單日益加速變化且面單背景多元復(fù)雜化的需求。1.4 圖像分割的自適應(yīng)調(diào)整
2 結(jié)果
3 結(jié)論