劉思洋 黃堅(jiān) 劉桂雄 羅文佳
摘要:基于法定貨幣在不同光照下局部特征不同,該文研究一種基于AlexNet的兩光照下多類別法定貨幣識別技術(shù)。首先,分析自然光照、紫外光照下法定貨幣圖像特征,指出不同光照下法定貨幣呈現(xiàn)不同的面額、圖案等特征;其次,分析AlexNet神經(jīng)網(wǎng)絡(luò)模型與研究面向法定貨幣識別的AlexNet遷移學(xué)習(xí)方法;最后,在30類別的兩光照下不同幣種的圖像樣本庫上進(jìn)行圖像識別實(shí)驗(yàn),貨幣圖像識別準(zhǔn)確率達(dá)到100%,準(zhǔn)確實(shí)現(xiàn)區(qū)分貨幣幣種、光照條件、面額與正反面貨幣圖像功能。與經(jīng)典貨幣圖像識別方法相比,該法能減少人工提取圖像特征的工作量,具有通用性好、準(zhǔn)確度高的特點(diǎn)。
關(guān)鍵詞:法定貨幣;圖像識別;深度學(xué)習(xí);AlexNet
中圖分類號:TP391.4 文獻(xiàn)標(biāo)志碼:A 文章編號:1674-5124(2019)09-0118-05
收稿日期:2018-08-22;收到修改稿日期:2018-09-29
基金項(xiàng)目:廣州市科技計(jì)劃項(xiàng)目(2018020300006)
作者簡介:劉思洋(1995-),男,廣東揭陽市人,碩士研究生,專業(yè)方向?yàn)榫軝z測與儀器儀表。
通信作者:劉桂雄(1968-),男,廣東揭陽市人,教授,博導(dǎo),主要從事測控技術(shù)及儀器研究。
0 引言
法定貨幣作為重要交易手段,其自動(dòng)識別技術(shù)是貨幣防偽鑒別技術(shù)的應(yīng)用基礎(chǔ)。目前法定貨幣識別方法主要包括尺寸識別法與基于貨幣圖像特征的識別方法[1]。尺寸識別法計(jì)算量小,但可靠性低[2]?;谪泿艌D像特征的識別方法在提取圖像特征基礎(chǔ)上,采用識別算法實(shí)現(xiàn)貨幣圖像特征識別,具備通用性與泛化能力[3],是法定貨識別領(lǐng)域的主流方法。
圖像識別算法主要包括貨幣圖像經(jīng)典特征提取與識別算法、貨幣圖像機(jī)器特征提取與識別算法、貨幣圖像深度學(xué)習(xí)特征提取與識別算法[4]。其中,貨幣圖像經(jīng)典特征提取與識別算法是根據(jù)不同貨幣圖像間色差、熒光特征等顯著區(qū)別,設(shè)計(jì)圖像處理算法完成識別任務(wù)[5]。如清華大學(xué)(2017年)利用在紫外光照射下人民幣正面熒光面額區(qū)域作為識別特征,運(yùn)用幾何結(jié)構(gòu)分析和模板匹配的方法實(shí)現(xiàn)對6種人民幣面額的識別,識別準(zhǔn)確率達(dá)到99%以上[6]。貨幣圖像機(jī)器特征提取與識別算法是將圖像上易區(qū)分的圖像特征轉(zhuǎn)換為特征向量,采用k最近鄰算法(k-nearest neighbor,KNN)、支持向量機(jī)(supportvector machine,SVM)等機(jī)器學(xué)習(xí)算法完成特征向量運(yùn)算與識別[7]。如四川大學(xué)(2012年)提出一種在復(fù)雜背景條件下的票據(jù)字符分割方法,其通過小波變換提取圖像中字符區(qū)域紋理特征,基于SVM對區(qū)域進(jìn)行分類,定位包含文字的圖像區(qū)域,隨后采用kNN算法對文字區(qū)域內(nèi)的像素進(jìn)行聚類劃分,從而實(shí)現(xiàn)文字分割[8]。貨幣圖像深度學(xué)習(xí)特征提取與識別算法以圖像全域特征作為輸入向量,通過多層神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)與訓(xùn)練過程,實(shí)現(xiàn)圖像特征自動(dòng)提取與識別[9]。文獻(xiàn)[10]采用基于BP神經(jīng)網(wǎng)絡(luò)的票據(jù)圖像自動(dòng)識別技術(shù),通過BP神經(jīng)網(wǎng)絡(luò)完成票據(jù)特征自動(dòng)提取,完成票據(jù)金額、傳票號或交易碼等識別,但淺層BP神經(jīng)網(wǎng)絡(luò)存在識別準(zhǔn)確率不足問題;文獻(xiàn)[11]提出一種基于深度學(xué)習(xí)鈔票識別方法,采用卷積神經(jīng)網(wǎng)絡(luò)(CNN)在鈔票圖像數(shù)據(jù)集上訓(xùn)練,實(shí)現(xiàn)韓元、印度盧比與美元多種鈔票金額準(zhǔn)確識別。上述貨幣圖像識別算法中,經(jīng)典圖像處理算法須由人工設(shè)計(jì)圖像防偽特征,應(yīng)用不便;機(jī)器學(xué)習(xí)算法則需經(jīng)過圖像特征選擇、特征向量生成過程,適用于小樣本貨幣圖像識別;深度學(xué)習(xí)算法由神經(jīng)網(wǎng)絡(luò)自動(dòng)實(shí)現(xiàn)貨幣圖像特征提取與識別,無需人工完成復(fù)雜的特征提取任務(wù),適合兩光照下多類法定貨幣的識別。
本文將從不同光照下法定貨幣圖像特征分析入手,分析AlexNet訓(xùn)練過程與識別機(jī)理,提出基于AlexNet的兩光照下多類別法定貨幣識別技術(shù)與應(yīng)用。
1 不同光照下法定貨幣圖像特征分析
法定貨幣在不同光照下呈現(xiàn)不同的識別特征,是區(qū)分不同光照下法定貨幣圖像的基礎(chǔ)。法定貨幣在識別過程中光照條件主要包括自然光、紫外光。圖1為百元人民幣在自然光、紫外光下的圖像特征。
可以發(fā)現(xiàn),不同光照下貨幣圖像特征區(qū)別明顯。從圖像全局特征看,不同光照下圖像整體色澤、飽和度與亮度差別很大;從圖像局域特征看,不同光照下貨幣圖像具有不同的圖案、面額數(shù)字與其他特征,并且局域特征在整體圖像上的位置、局域特征的顏色與邊緣等均有顯著區(qū)別。
分析不同光照下法定貨幣圖像特征的區(qū)別可知,采用深度學(xué)習(xí)識別算法識別時(shí),通過制作不同光照下法定貨幣圖像數(shù)據(jù)集訓(xùn)練識別器,由神經(jīng)網(wǎng)絡(luò)自動(dòng)提取局域圖像的邊緣、位置與顏色特征信息,直至全域圖像的色澤、飽和度與亮度特征信息,完成特征提取與識別過程,減少人工提取圖像特征的工作量。
2 基于AlexNet兩光照下多類別法定貨幣識別技術(shù)
2.1 AlexNet神經(jīng)網(wǎng)絡(luò)模型分析
卷積神經(jīng)網(wǎng)絡(luò)作為高效的圖像識別網(wǎng)絡(luò),主要由卷積層、池化層與全連接層組成[12]。卷積層的神經(jīng)元節(jié)點(diǎn)存在于特征圖像中,每個(gè)節(jié)點(diǎn)與上一層特征圖像中的局部區(qū)域通過一系列權(quán)重的卷積核連接,通過卷積運(yùn)算實(shí)現(xiàn)特征自動(dòng)提取與特征局部連接。待識別目標(biāo)的圖像特征相對位置不同,池化層粗糙化每個(gè)特征位置,合并圖像特征相似局部區(qū)域,減少特征向量維度,增加移動(dòng)或扭曲不變性。全連接層是相鄰兩個(gè)特征圖象中,每個(gè)輸入神經(jīng)元均與所有輸出神經(jīng)元完全連接,將圖像特征矩陣轉(zhuǎn)換為列向量,與識別結(jié)果的類別數(shù)目相匹配。
對大型圖像識別數(shù)據(jù)集ImageNet上訓(xùn)練并優(yōu)化的卷積神經(jīng)網(wǎng)絡(luò)模型AlexNet神經(jīng)網(wǎng)絡(luò)進(jìn)行分析[13]。圖2為AlexNet卷積神經(jīng)網(wǎng)絡(luò)模型圖,它由11層神經(jīng)網(wǎng)絡(luò)組成,包含5層卷積層、3層池化層與3層全連接層。卷積層與池化層相互交叉堆疊,由非線性激活函數(shù)完成非線性運(yùn)算,再與全連接層相連,通過反向傳播算法訓(xùn)練所有卷積核權(quán)重參數(shù),得到AlexNet卷積神經(jīng)網(wǎng)絡(luò)。
[4]羅帥,婁震.基于印刷年份的人民幣版本識別技術(shù)研究[J].現(xiàn)代電子技術(shù),2015,38(18):72-74.
[5]金長江,師廷偉.紅外弱小目標(biāo)檢測背景抑制算法研究[J].中國測試,2016,42(4):115-119.
[6]李雪梨,索雙富,武佩君一種基于紫外熒光圖像的人民幣面額識別算法[J].機(jī)械設(shè)計(jì)與制造,2017(3):1-3.
[7]郭雪梅,劉桂雄.多顏色模型分割自學(xué)習(xí)k-NT設(shè)備狀態(tài)識別方法[J].中國測試,2016,42(4):107-110.
[8]葉龍歡,王俊峰,高琳,等.復(fù)雜背景下的票據(jù)字符分割方法[J].計(jì)算機(jī)應(yīng)用,2012,32(11):3198-3200.
[9]SOSA-GARCIA J,ODONE F.Banknote recognition as aCBIR problem[C]//International Conference on SimilaritySearch and Applications.Springer,2015.
[10]韓夢迪,曹玉東,杜剛.基于BP神經(jīng)網(wǎng)絡(luò)的銀行票據(jù)識別[J].信息通信,2016(9):157-159.
[11]PHAM T D,NGUYEN D T,KIM W,et al.Deep learning-based banknote fitness classification using the reflectionimages by a visible-light one-dimensional line imagesensor[J].Sensors,2018,18(2):472.
[12]盧宏濤,張秦川.深度卷積神經(jīng)網(wǎng)絡(luò)在計(jì)算機(jī)視覺中的應(yīng)用研究綜述[J].數(shù)據(jù)采集與處理,2016,31(1):1-17.
[13]KRIZHEVSKY A,SUTSKEVER I,HINTON G E.ImageNetclassification with deep convolutional neural networks[C]//International Conference on Neural Information ProcessingSystems.2012:1097-1105.
[14]LONG M S,WANG J M,DING G G,et al.Transfer featurelearning with joint distribution adaptation[C]//IEEEInternational Conference on Computer Vision.IEEE,2014:2200-2207.
(編輯:李剛)