單 瑾,曾 丹
(成都電子機(jī)械高等專(zhuān)科學(xué)校 網(wǎng)管中心,成都 610071)
車(chē)牌識(shí)別技術(shù)(License Plate Recognition,LPR)是計(jì)算機(jī)視覺(jué)和模式識(shí)別技術(shù)在現(xiàn)代智能交通系統(tǒng)中的一項(xiàng)重要研究課題,是實(shí)現(xiàn)交通管理智能化的重要環(huán)節(jié)。它是以數(shù)字圖像處理、模式識(shí)別、計(jì)算機(jī)視覺(jué)等技術(shù)為基礎(chǔ)的智能識(shí)別系統(tǒng)。它利用每一輛汽車(chē)都有唯一的車(chē)牌號(hào)碼,通過(guò)攝像機(jī)所拍攝的車(chē)輛圖像,在不影響汽車(chē)狀態(tài)的情況下,計(jì)算機(jī)自動(dòng)完成車(chē)牌的識(shí)別,從而可降低交通管理工作的復(fù)雜度。
由于車(chē)牌識(shí)別涉及到很多復(fù)雜因素,現(xiàn)有理論和方法還存在識(shí)別速度慢、精度低、抗干擾性能差等問(wèn)題,因此有必要進(jìn)一步研究。本文提出了一種基于模板匹配的車(chē)牌識(shí)別方法[1],能有效地完成不同解析度和不同模糊程度的車(chē)牌識(shí)別工作,而且識(shí)別精度高、速度快,能滿足實(shí)時(shí)系統(tǒng)的要求。
車(chē)牌圖像的分割就是把車(chē)牌的整體區(qū)域分割成為單字符的區(qū)域,以便后續(xù)識(shí)別。從車(chē)輛圖像中準(zhǔn)確地定位分割出車(chē)牌區(qū)域是車(chē)牌識(shí)別中最為關(guān)鍵的步驟之一,只有有效地完成分割,才能進(jìn)一步提取目標(biāo)特征并識(shí)別目標(biāo)。圖像分割結(jié)合車(chē)牌的一些共同特征,例如,車(chē)牌呈規(guī)則的矩形,大小一般為44 cm×14 cm;文字與背景之間有明顯灰度對(duì)比;第1、2個(gè)字符分別是漢字和字母,第3個(gè)字符是一個(gè)間隔符“·”等等,對(duì)圖像中的車(chē)牌、背景進(jìn)行標(biāo)記、定位,然后將待識(shí)別的車(chē)牌字符從背景或其他偽目標(biāo)中分離出來(lái)。筆者采用一種投影法粗分割結(jié)合先驗(yàn)知識(shí)后處理的字符分割方法,該方法簡(jiǎn)單、容易實(shí)現(xiàn),取得了很好的分割效果。算法流程圖如圖1所示。
圖1 分割算法流程圖
圖2 車(chē)牌圖片灰度圖
圖3 車(chē)牌的灰度直方圖
在完成車(chē)牌的精確定位后,進(jìn)行字符的分割。首先將圖像進(jìn)行二值化處理,使圖像僅呈現(xiàn)黑色和白色兩種顏色,即在灰度圖上形成僅包含255和0兩種灰度,使圖像在后期識(shí)別操作過(guò)程中更加容易處理。
車(chē)牌中的字和背景使用的是對(duì)比比較明顯的顏色,在灰度圖上表現(xiàn)的灰度值相差較大,如圖2所示。在灰度直方圖上面,車(chē)牌區(qū)域形成比較明顯的“雙峰型”,如圖3所示。大量統(tǒng)計(jì)表明,對(duì)于某一類(lèi)圖像(如目標(biāo)和背景有較強(qiáng)的對(duì)比)直方圖中出現(xiàn)2個(gè)峰值,其中一個(gè)表示背景灰度,另一個(gè)表示目標(biāo)灰度。在此前提下,在兩峰的中間谷取閾值。
本項(xiàng)目中,灰度值在車(chē)牌底色和字的灰度值周?chē)植急容^密集,因而在雙峰中的波谷位置選擇合適的閾值,能夠很好地將車(chē)牌二值化,將字和底色分開(kāi)。最簡(jiǎn)單的分類(lèi)規(guī)則是依據(jù)區(qū)域相似性和不連續(xù)性,取定一灰度閾值。大于此閾值的像素點(diǎn)置成黑(白),而小于此閾值的像素點(diǎn)置成白(黑)。尋找閾值的算法選擇Ostu算法(最大方差閾值選擇法),Ostu算法同時(shí)考慮了圖像的灰度信息和像素間的空間鄰域信息,是一種有效的圖像分割方法。其基本思想是選擇一個(gè)閾值,使用該閾值進(jìn)行分類(lèi)時(shí),2類(lèi)之間的類(lèi)間方差達(dá)到最大。
Ostu選擇法的具體步驟是:
將直方圖在某一閾值k處分為二組,C1={0~k},C2={k~255},各自產(chǎn)生的概率:
C1產(chǎn)生的概率為ω(k),
C2產(chǎn)生的概率為1-ω(k);
C1的平均值 μ1=μ(k)/ω(k),
C2的平均值μ2=(μ-μ(k))/(1-ω(k))
其中,μ是整體的灰度平均值;μ(k)是閾值為k時(shí)的灰度平均值,所以兩組間的方差可以由式(1)求出:
然后在0~255之間計(jì)算式(1)的值,當(dāng)該值最大時(shí)對(duì)應(yīng)的k值作為二值化閾值。這種方法對(duì)于在灰度直方圖上呈現(xiàn)出雙波峰的情況效果比較好,而定位之后的車(chē)牌區(qū)域恰好符合這個(gè)條件。經(jīng)過(guò)Ostu閾值二值化處理后的圖片如圖4所示。
由圖4可知,定位后的圖片對(duì)于車(chē)牌的上下邊緣已經(jīng)定位非常準(zhǔn)確。但是由于左右邊緣用于定位的信息不夠充分,同時(shí)車(chē)牌兩旁的干擾信息具有不可預(yù)見(jiàn)性。所以往往左右的邊緣都定位得不是那么準(zhǔn)確,通常都要比實(shí)際的車(chē)牌多出一截。
因此,在進(jìn)行字符分割時(shí),確定一個(gè)可靠的分割起始點(diǎn)就顯得非常重要。通過(guò)觀察,發(fā)現(xiàn)在車(chē)牌中,第2個(gè)字符和第3個(gè)字符的間隔是所有相鄰字符中最大的。所以可以尋找間隔最大的區(qū)域,把它認(rèn)為是第2個(gè)和第3個(gè)字符所處的位置,以此為依據(jù)進(jìn)行分割。具體方法如下:
圖4 經(jīng)過(guò)Ostu閾值二值化處理后的二值化圖片
1)在二值圖像中對(duì)白色像素進(jìn)行垂直投影。
2)計(jì)算橫向間隔最大的位置,認(rèn)為該位置即是第2、3字符的中間位置。
3)以該位置為基礎(chǔ),按照字符的大致寬度,向左分割出2個(gè)字符,向右分割出5個(gè)字符。
字符分割計(jì)算出的分割線如圖5所示。
該方法充分利用了車(chē)牌的布局特征,能夠很好地分割出每個(gè)字符。缺點(diǎn)是對(duì)于不是橫向排列的車(chē)牌不太適應(yīng),特別是公交車(chē)等車(chē)牌呈現(xiàn)上面2個(gè)字符,下面5個(gè)字符的情況。
圖5 字符分割計(jì)算出的分割線
字符分割后要識(shí)別每一個(gè)字符究竟是什么。筆者采用了一種基于模
板匹配的車(chē)牌識(shí)別方法,建立大容量的車(chē)牌字符特征向量模板庫(kù),用統(tǒng)計(jì)學(xué)的方法將樣本與模板進(jìn)行比對(duì)。模板匹配的思想是將現(xiàn)有的圖片和模板庫(kù)進(jìn)行比較,如果現(xiàn)有圖片和模板中的一幅圖片的相似度最大,
就認(rèn)為現(xiàn)有圖片和模板圖片表示的是同一個(gè)字符。這里需要解決2個(gè)問(wèn)題,一是圖片進(jìn)行模式識(shí)別前的特征提取采用什么方式,二是采用什么原則進(jìn)行相似度比較。
特征提取采用網(wǎng)格化的方式,如圖6所示,將一張字符圖片分割成5×5的小方格,這樣一共有25個(gè)格子,在每個(gè)格子中計(jì)算:白色像素個(gè)數(shù)/總像素,將得到的值作為特征值,這樣形成一個(gè)25維的特征向量。可以將它們定義為X0~X24。
圖6 字符分割計(jì)算出的分割線
字符識(shí)別的過(guò)程是利用現(xiàn)有的特征向量,從待識(shí)別的圖像中提取若干圖像的特征量與模板相對(duì)應(yīng)的特征量進(jìn)行比較,計(jì)算模板向量和現(xiàn)有向量之間的相似度,然后將現(xiàn)有特征向量歸入與它相似度最高的模板一類(lèi)。
本項(xiàng)目中計(jì)算圖像和模板特征量之間的距離,用最小距離法判定所屬圖像所屬類(lèi)別。假設(shè)一個(gè)模板向量為M0~M24,特征向量為X0~X24。則特征向量和模板向量的歐氏距離為。分別計(jì)算每個(gè)模板向量和現(xiàn)有特征向量的歐氏距離d,當(dāng)d最小時(shí),特征向量X歸入模板向量M所在的類(lèi)。
采用該方法,當(dāng)2個(gè)模板比較相似的時(shí)候,會(huì)出現(xiàn)誤判的現(xiàn)象。比如“A”和“4”,如果當(dāng)時(shí)的圖片采集環(huán)境很差或車(chē)牌本身有污損的時(shí)候,最小距離法有誤判的可能,這個(gè)時(shí)候可以采用模式識(shí)別中的k-近鄰法來(lái)實(shí)現(xiàn)。k-近鄰法是最近鄰法的擴(kuò)展,其基本規(guī)則是:在所有N個(gè)樣本中找到與測(cè)試樣本的k個(gè)最近鄰者,取k大者即為識(shí)別的字符。
本項(xiàng)目初始建立車(chē)牌字符特征向量模板庫(kù)時(shí),首先需要采集大量的車(chē)牌圖片,提取特征向量加入模版庫(kù),只有建立了較大規(guī)模的字符特征向量模版庫(kù),才能夠保證較高的識(shí)別度。
車(chē)牌字符可利用的規(guī)律如下:
1)第1個(gè)字符總是漢字。
2)第2個(gè)字符總是字母。
……
充分利用這些規(guī)律,可以在識(shí)別過(guò)程中加強(qiáng)判斷條件,以提高識(shí)別率。
采用本文中介紹的方法進(jìn)行實(shí)驗(yàn),對(duì)2 000個(gè)樣本進(jìn)行處理,識(shí)別正確1 958個(gè),識(shí)別準(zhǔn)確率為97.9%,效果理想。[2-4]
[1]單瑾,周娟.一種基于二值圖像灰度變化特征的車(chē)牌定位方法[J].成都電子機(jī)械高等專(zhuān)科學(xué)校學(xué)報(bào),2009(3):30-33.
[2]安勇,張高偉.基于灰度圖像的車(chē)牌識(shí)別系統(tǒng)[J].計(jì)算機(jī)工程與科學(xué),2006,28(2):61-62,65.
[3]宋晨光,葉海建.基于數(shù)字形態(tài)學(xué)的車(chē)牌字符分割算法[J].光電子技術(shù)與信息,2005,18(6):58-62.
[4]蘇厚勝.車(chē)牌識(shí)別系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J].可編程控制器與工廠自動(dòng)化,2006(3):103-107.
[5]李孟歆,吳成東.基于分級(jí)網(wǎng)絡(luò)的車(chē)牌字符識(shí)別算法[J].計(jì)算機(jī)應(yīng)用研究,2009,26(5):1703-1705.
[6]崔江,王友仁.車(chē)牌自動(dòng)識(shí)別方法中的關(guān)鍵技術(shù)研究[J].計(jì)算機(jī)測(cè)量與控制,2004,33(1):29-33.