王欣蔚
摘要:動車車號識別是動車安全自動監(jiān)測系統(tǒng)的一項重要內容。由于光照不均、運動失真等因素,動車車號的可靠識別困難較大。論文研究了基于深度網絡的識別算法,通過設計卷積神經網絡,以減少資源占用為出發(fā)點,獲得99.20%的識別正確率。與LeNet-5卷積網絡進行對比實驗,減少了近6倍的訓練時間,并且識別率有所提高。
關鍵詞:字符識別 卷積神經網絡 復雜光照 深度學
中圖分類號:TP391.4 文獻標識碼:A 文章編號:1007-9416(2016)07-0126-01
1 相關背景
近兩年,深度網絡[1]正成為模式識別與人工智能領域的一個重要方向,其中又以卷積神經網絡(Convolutional Neural Networks, CNN)[2]等為熱點,應用于目標檢測、人臉識別等領域。它通過卷積層和下采樣層兩個特殊結構來實現特征提取過程。能解決傳統(tǒng)算法對夜間車號圖像識別困難的問題。
然而,其復雜度高、系統(tǒng)資源的需求大,訓練需要海量的數據,實際應用不具有以上條件。本文通過研究,在提高識別率的同時,明顯降低系統(tǒng)資源的消耗,為深度網絡的實際應用探索新的思路。
2 卷積神經網絡的車號識別
針對降低網絡系統(tǒng)資源消耗、在適度規(guī)模的數據集下訓練的實際需要,不同的應用主要需要考慮卷積層個數、每層特征圖個數、下采樣層池化區(qū)域大小以及網絡的深度。
卷積層的作用是探測上一層特征的局部連接,而下采樣層的作用是把相似的特征合并起來。卷積過程要設計卷積核大小,針對樣本數據進行調節(jié),如果核的尺寸過大,會增加運算量;如果過小,則不足以提取到有效結構特征。此外,卷積核個數過少會使特征提取的不充足導致識別率低,過多會導致運行時間大大增加。下采樣過程需要確定合適的池化區(qū)域大小??紤]到信息的損失情況,池化矩陣不應過大,一般為2×2的大小。經以上考慮,本文卷積神經網絡結構如圖1所示。
由于動車車號應用統(tǒng)一的字體設計,字體結構沒有LeNet-5應用場景改變大。因此兩個卷積層的設計已滿足特征提取的需要,從而大大減少了耗時。由圖1可見,首先輸入歸一化為32×32的像素大小,并以灰度圖的形式輸入第一層C1。第一個卷積層C1是形成8個經卷積的特征圖,得到像素大小為28×28的特征圖。之后經過2×2鄰域的平均池化,在下采樣層S2生成了8個14×14像素的特征圖。C3存在20個10×10像素大小的特征圖,可生成20個圖像大小為5×5像素的S4層。卷積層核的大小均為5×5。接下來的F5層和S4層為全連接,有20×5×5=500個節(jié)點,相當于用含500×21=10500個參數的分類器對向量進行分類,因而具有更強的描述能力。
最后,輸出層為21個單元,由徑向基函數(RBF)組成。對應待測動車車號字符樣本庫中21個不同的數字和字母。網絡的訓練過程,通過BP算法[3]由前到后逐層學習的方式。
3 實驗結果與分析
實驗用的字符樣本均來自實際應用環(huán)境中獲取的動車車號圖像。為了提高網絡的泛化性能,將原始樣本經過仿射變換、添加椒鹽噪聲和乘性噪聲的處理,擴充樣本庫數量。訓練數據集與測試數據集之間沒有重疊,部分樣本如圖2所示。訓練數據集包含10500張圖像,測試數據集包含2250張圖像。所有實驗仿真平臺為Matlab2012b。
將本文提出的卷積神經網絡(記Proposed),與典型的卷積神經網絡LeNet-5[3]以及應用BP算法的普通神經網絡(記NN)進行識別正確率的實驗比較。其中網絡的學習率設置均相同。實驗結果如圖3所示。
因為卷積神經網絡相比于普通的神經網絡具有更好的魯棒性,所以兩卷積神經網絡識別率均高于普通網絡8%。而本文的網絡比LeNet-5的識別率高0.8%左右。
與LeNet-5在復雜度方面的對比實驗,結果如表1所示。
由表可見,本文網絡在三種指標上均有優(yōu)勢。由于LeNet-5多一次卷積操作,并且含120個特征圖,使復雜度大大提高,致使訓練時間比本文提出的網絡多出近6倍。
4 結語
傳統(tǒng)的方法對圖片質量較敏感,對動車車號夜間采集圖像識別性能差。本文經過對卷積神經網絡的應用研究,在提高識別率的同時,明顯降低了系統(tǒng)資源的消耗。結果表明,本文的卷積神經網絡識別率達到99.20%,高于LeNet-5,同時縮減了約6倍的訓練時間,在內存占用方面占優(yōu)勢。
參考文獻
[1]LeCun Y,Bengio Y,Hinton G.Deep Learning[J].Nature,2015, 521(7753):436-444.
[2]LeCun Y,Kavukvuoglu K,Farabet C.Convolutional networks and applications in vision[C].IEEE International Symposium on Circuits and Systems (ISCAS),2010,253-256.
[3]LeCun Y, Bottou L, Bengio Y,at el.Gradient-based learning applied to document recognition [C]. IEEE,1998.USA: IEEE,1998: 2278-2324.