陳虹旭 李曉坤 鄭永亮 邵娜 楊磊 劉磊
摘 要: 隨著信息化社會(huì)的高速發(fā)展,人們生活水平的不斷提升,與此同時(shí)人們開(kāi)始越來(lái)越注重身份驗(yàn)證的準(zhǔn)確性、安全性、穩(wěn)定性。人體生物特征表現(xiàn)出了幾大特點(diǎn):唯一性、穩(wěn)定性、不可復(fù)制。本文通過(guò)深度學(xué)習(xí)技術(shù)簡(jiǎn)述、分析特性、探究支持,研究了生物特征識(shí)別中的虹膜識(shí)別方法。虹膜識(shí)別性能指標(biāo)在應(yīng)用中相比其他生物指標(biāo)高,具有很高的研究?jī)r(jià)值。希望通過(guò)本次對(duì)虹膜識(shí)別方法的探究,促進(jìn)虹膜識(shí)別在人工智能方面的新發(fā)展。
關(guān)鍵詞: 深度學(xué)習(xí);生物特征識(shí)別;虹膜識(shí)別;人工智能
Abstract:With the rapid development of the information society people's living standard has been continuously improved. At the same time more and more attention has been paid to the accuracy security and stability of authentication. The biological characteristics of human body shows several characteristics: uniqueness stability and non-reproduction. In this paper through technical discussion characteristics analysis and support exploration of deep learning iris recognition of the biometric recognition is researched. Simulation shows that the technological index of iris recognition performance in the application is higher than other biometric identification index,which has high research value. It is expected that this research could promote the new development of iris recognition in artificial intelligence.
Key words: deep learning;biometric identification;iris recognition;artificial intelligence
引言
在科技高速發(fā)展的今天,生物特征識(shí)別已經(jīng)開(kāi)始進(jìn)入人們的日常生活工作中。目前指紋識(shí)別、人臉識(shí)別、語(yǔ)音識(shí)別已廣泛用于手機(jī)等終端設(shè)備解鎖,通過(guò)深度學(xué)習(xí)手機(jī)端實(shí)現(xiàn)虹膜識(shí)別解鎖也將會(huì)成為潮流趨勢(shì)。虹膜識(shí)別技術(shù)屬于一種人工智能,并因其所具備的唯一性、不可復(fù)制、穩(wěn)定性等特征,而使其在驗(yàn)證識(shí)別身份領(lǐng)域得到重要應(yīng)用[1],同時(shí)也深受該領(lǐng)域科研工作人員的青睞與高度關(guān)注。
1993年,Daugman博士提出了虹膜識(shí)別的理論框架。該框架將虹膜識(shí)別分為4個(gè)重要組成部分[2]:虹膜點(diǎn)位置、圖像歸一化、特征提取和匹配。Daugman[3]首先提出了模糊虹膜圖像檢測(cè)方法。該方法使用了特定的模板來(lái)對(duì)原始的虹膜圖像進(jìn)行卷積。其中模板的傅里葉變換是2個(gè)sinc函數(shù)之間的差值,圖像的中頻和高頻會(huì)被提取為模糊特征。另一種經(jīng)典的虹膜圖像模糊檢測(cè)方法是基于能量譜分布特征和SVM分類器的圖像模糊決策方法[4]。該方法計(jì)算了虹膜區(qū)域低頻、中頻和高頻能量的比值,根據(jù)這些比值判斷圖像的離焦和運(yùn)動(dòng)模糊,同時(shí)判斷是否有睫毛遮擋。此外,Kalka等人[5]研發(fā)了一種分開(kāi)檢測(cè)離焦模糊和運(yùn)動(dòng)模糊的虹膜圖像檢測(cè)方法。Jang[6]則發(fā)現(xiàn)可以通過(guò)計(jì)算不同頻段小波變換系數(shù)的均值作為模糊圖像的模糊特征。Chen[7]又相繼設(shè)計(jì)分析了可以利用墨西哥草帽小波提取不同尺度的虹膜圖像小波系數(shù)來(lái)作為模糊特征。Zhou等人[8]提出利用虹膜圖像中光斑特征進(jìn)行運(yùn)動(dòng)模糊檢測(cè)。在此基礎(chǔ)上,Park[9]的研究又指出可根據(jù)光斑的大小判斷虹膜圖像是否存在離焦模糊。
1 數(shù)據(jù)來(lái)源
本文所采用的數(shù)據(jù)庫(kù)為CASIA V4.0虹膜庫(kù)[10],是中國(guó)科學(xué)院自動(dòng)化研究所免費(fèi)公開(kāi)的數(shù)據(jù)庫(kù)。CASIA V4.0已經(jīng)成為國(guó)際上具有較高認(rèn)知度的虹膜圖像庫(kù),而且國(guó)際上已有超過(guò)70個(gè)國(guó)家及地區(qū)的3 000多家科研單位申請(qǐng)使用。
2 虹膜識(shí)別
虹膜是研究的一個(gè)重要組成部分。虹膜位于眼角膜之后和晶狀體之前,直徑約為12 mm、厚度約為0.5 mm的盤(pán)狀膜[11]。為了合理控制外界光線進(jìn)入眼睛,瞳孔將隨著光線強(qiáng)弱調(diào)節(jié)自身大小,虹膜也會(huì)隨之發(fā)生變化。虹膜識(shí)別可以解析為模式識(shí)別和計(jì)算機(jī)視覺(jué)問(wèn)題。通過(guò)收集虹膜,可以對(duì)采集到的圖像進(jìn)行分析和處理,并通過(guò)結(jié)果信息識(shí)別身份。虹膜識(shí)別的研究流程可表述為:圖像采集、預(yù)處理、提取特征,并對(duì)其編碼、匹配識(shí)別,而預(yù)處理中又包含有定位及歸一化。
具體來(lái)說(shuō),虹膜圖像處理主要通過(guò)采用預(yù)定的光學(xué)及電路設(shè)計(jì),來(lái)提取高質(zhì)量的虹膜圖像。所得到的圖像包含眼瞼及睫毛等,需要對(duì)虹膜展開(kāi)定位研究。此時(shí),在定位處理中需要將虹膜區(qū)域的邊界近似為2個(gè)圓,通過(guò)定位獲得圓心位置及半徑大小。每個(gè)人的虹膜大小不同,同一個(gè)人的虹膜在外界光線刺激下也會(huì)隨著光線的不同而改變,這些彈性變化會(huì)影響到識(shí)別結(jié)果,因而還需對(duì)采集到的虹膜引入歸一化處理。通過(guò)歸一化處理可以有效地表達(dá)和描述虹膜的特征信息,對(duì)信息進(jìn)行編碼處理。特征匹配識(shí)別時(shí),則將通過(guò)比對(duì)提取信息的編碼與數(shù)據(jù)庫(kù)編碼來(lái)分析確認(rèn)身份。
3 虹膜識(shí)別原理
3.1 虹膜圖
基于深度學(xué)習(xí)的虹膜識(shí)別是將圖像進(jìn)行預(yù)處理,在圖像中獲得感興趣的區(qū)域,采用暗道去霧理論進(jìn)行去霧增強(qiáng),實(shí)現(xiàn)圖片灰度處理;利用EMD方法進(jìn)行分塊特征提取,得到特征向量,最終獲得虹膜識(shí)別結(jié)果。運(yùn)行后結(jié)果可如圖1所示。
3.2 PCHIP-LMD
PCHIP-LMD算法是對(duì)LMD與EMD算法的優(yōu)缺點(diǎn)整合,將PCHIP運(yùn)用到LMD方法中獲取局域包絡(luò)估計(jì)函數(shù)和局域均值函數(shù)。PCHIP可以保證相鄰兩點(diǎn)之間插值曲線和單調(diào)性,有效消除了欠包以及過(guò)包絡(luò)現(xiàn)象。
3.3 虹膜歸一化
每個(gè)人的虹膜大小各異,同一個(gè)人的虹膜在外界光線刺激下也會(huì)隨著光線的不同而改變。瞳孔會(huì)隨著外界光線強(qiáng)弱發(fā)生收縮或擴(kuò)張,從而影響虹膜的大小。在進(jìn)行虹膜采集時(shí),眼睛距離采集設(shè)備的遠(yuǎn)近,也直接影響瞳孔的大小。采集虹膜時(shí)的這一變化將會(huì)影響比對(duì)結(jié)果,不同大小的虹膜難以用作匹配識(shí)別,虹膜歸一化可以有效地糾正瞳孔縮放失真。這里,也研究給出了EMD歸一化虹膜識(shí)別系統(tǒng)的功能設(shè)計(jì)解析即如圖2所示。
3.3.1 彈性模型
目前得到廣泛使用的歸一化方法,就是由Daugman教授提出的橡皮圈(Rubber-sheet)模型[3] Rubber-sheet假定虹膜為彈性模型,具有彈性和各向同性。根據(jù)固定模式將虹膜轉(zhuǎn)換為固定矩形區(qū)域。
3.3.2 歸一化結(jié)果
通過(guò)彈性模型,可以將虹膜轉(zhuǎn)換為固定的矩形,歸一化后就能夠獲得不受遮擋的虹膜圖像,舍棄識(shí)別率較差的部分。而且,理論可以證明,虹膜的歸一化處理還表現(xiàn)出良好的尺度不變性和平移不變性。
4 深度學(xué)習(xí)
機(jī)器學(xué)習(xí)是時(shí)下具有快速發(fā)展勢(shì)頭的活躍學(xué)術(shù)領(lǐng)域之一。深度學(xué)習(xí)就是機(jī)器學(xué)習(xí)中一種基于任務(wù)的算法。深度學(xué)習(xí)采用分層結(jié)構(gòu)來(lái)加工處理復(fù)雜的數(shù)據(jù),而每一分層均由含有特征檢測(cè)器的單元組成,底層主要檢查簡(jiǎn)單特征,再將特征信息傳輸給高層,從而可以檢查更為復(fù)雜的圖像特征。深度學(xué)習(xí)是通過(guò)整合多個(gè)非線性處理單元以生成輸出更加抽象和更富有價(jià)值的特征值。借助深度學(xué)習(xí)就使得無(wú)論是生物特征識(shí)別、虹膜識(shí)別,還是語(yǔ)音識(shí)別、聲紋識(shí)別等方面的研究都將獲得識(shí)別率的大幅提升。深度學(xué)習(xí)并非預(yù)先定制方程來(lái)獲得設(shè)計(jì)驅(qū)動(dòng),而是在運(yùn)行中通過(guò)收集數(shù)據(jù),進(jìn)行自我學(xué)習(xí)、訓(xùn)練來(lái)實(shí)現(xiàn)處理加速。
4.1 遞歸神經(jīng)網(wǎng)絡(luò)(RNN)
遞歸神經(jīng)網(wǎng)絡(luò)(RNN)是一種人工神經(jīng)網(wǎng)絡(luò),主要通過(guò)網(wǎng)絡(luò)的內(nèi)部狀態(tài)來(lái)描述系統(tǒng)的非線性動(dòng)態(tài)行為,具有很強(qiáng)的動(dòng)態(tài)逼近能力。而且,還可以描述任何非線性動(dòng)力系統(tǒng)。Hopfield網(wǎng)絡(luò)[12-13]是全局反饋遞歸網(wǎng)絡(luò)的經(jīng)典成果,但只是一個(gè)單層對(duì)稱反饋神經(jīng)網(wǎng)絡(luò)。根據(jù)網(wǎng)絡(luò)的輸出,可將其分為離散網(wǎng)絡(luò)和連續(xù)網(wǎng)絡(luò)兩種。其中,離散網(wǎng)絡(luò)往往用于優(yōu)化計(jì)算,而連續(xù)網(wǎng)絡(luò)則用于聯(lián)想記憶。離散網(wǎng)絡(luò)與連續(xù)網(wǎng)絡(luò)都具有初始狀態(tài)收斂到穩(wěn)定狀態(tài)的能力。
如各神經(jīng)元在初始狀態(tài)和外部輸入作用下,發(fā)生狀態(tài)變化,神經(jīng)元與神經(jīng)元之間形成環(huán)路,神經(jīng)元輸出到其它的輸入相連接,進(jìn)而產(chǎn)生了特定設(shè)計(jì)輸出。這種反饋狀態(tài)將繼續(xù)在穩(wěn)定的網(wǎng)絡(luò)狀態(tài)下激蕩反復(fù),以達(dá)到穩(wěn)定的平衡狀態(tài)。Hopfield網(wǎng)絡(luò)采用全連接網(wǎng)絡(luò)方式進(jìn)行連接,網(wǎng)絡(luò)節(jié)點(diǎn)數(shù)目增多時(shí)網(wǎng)絡(luò)將過(guò)于復(fù)雜。在應(yīng)用中若要達(dá)到簡(jiǎn)單優(yōu)化,可以采用部分反饋網(wǎng)絡(luò)結(jié)構(gòu),就能保留原有動(dòng)態(tài)特性。
4.2 卷積神經(jīng)網(wǎng)絡(luò)(CNN)
卷積神經(jīng)網(wǎng)絡(luò)(CNN)是人工神經(jīng)網(wǎng)絡(luò)的一種。這是一種帶有前向反饋的神經(jīng)網(wǎng)絡(luò),是深度學(xué)習(xí)常用方法之一[14]。CNN由多個(gè)可訓(xùn)練層采用層層堆疊的方式聚集構(gòu)成,通過(guò)在輸出層增加監(jiān)督分類器來(lái)獲得分類功能。CNN在圖像分類、識(shí)別問(wèn)題上獨(dú)具優(yōu)勢(shì),而在機(jī)器學(xué)習(xí)中還可以更有效地提高準(zhǔn)確率。在處理圖像方面,CNN的網(wǎng)絡(luò)結(jié)構(gòu)可以實(shí)現(xiàn)平移、縮放、傾斜等情況下高度不變的特性;在提取像素中可以給出一層到二層近原圖的像素級(jí)別提取特征;在圖像發(fā)生維度變化時(shí),還可以基本保持圖像全局性。關(guān)于CNN的重點(diǎn)研究?jī)?nèi)容可闡釋分述如下。
4.2.1 卷積層
卷積層是CNN的核心設(shè)計(jì)。卷積層由若干張?zhí)卣鲌D組成,每張?zhí)卣鲌D都是在輸入圖像上采用固定卷積對(duì)其進(jìn)行內(nèi)積操作所得到,在特征圖轉(zhuǎn)發(fā)過(guò)程中,過(guò)濾器需要在輸入卷積高度與寬帶上采用卷積,在過(guò)濾器輸入和條目間計(jì)算點(diǎn)積,并針對(duì)過(guò)濾器生成二維激活影像。不同的卷積核可以對(duì)不同的特征進(jìn)行提取,卷積操作的卷積區(qū)域就是卷積神經(jīng)網(wǎng)絡(luò)(CNN)的局部感知域。如果網(wǎng)絡(luò)處于某個(gè)空間位置時(shí)會(huì)對(duì)其展開(kāi)檢測(cè),并在檢測(cè)到特定類型特征時(shí)進(jìn)行學(xué)習(xí)過(guò)濾。
4.2.2 池化層
池化層主要通過(guò)降采樣方式來(lái)處理得到的圖像區(qū)域并獲得關(guān)鍵的模態(tài)特征,但還要對(duì)此特征圖進(jìn)行深度的抽象與降維。前者將輸入圖像進(jìn)行圖像塊均值或最大值的采集以做到進(jìn)一步的結(jié)果抽象解析。而降維則是通過(guò)對(duì)采集圖像進(jìn)行無(wú)重疊的降采樣來(lái)實(shí)現(xiàn)。對(duì)特征圖像進(jìn)行平均池化類似于均值濾波器,也就是對(duì)圖像進(jìn)行平滑處理,避免噪點(diǎn)的影響。
4.2.3 激活函數(shù)
對(duì)于卷積層的卷積以及池化層的降采樣來(lái)說(shuō),都需要對(duì)采集圖像及特征圖像進(jìn)行線性處理。對(duì)于采集樣本中獲得的特征分類樣本并不都是線性可分的,還要對(duì)其引入激活函數(shù),并追加非線性因素,這樣才可以得到適用于非線性的分類模型。
4.2.4 全連接層
在經(jīng)過(guò)卷積、池化、激活函數(shù)等一系列操作后,將得到的特征表達(dá)映射到標(biāo)記空間中。在采集數(shù)據(jù)中,RGB圖片是三維的,而對(duì)應(yīng)的采集標(biāo)簽是一維的??紤]到此后的計(jì)算梯度所需,就要將三維的RGB圖片與一維的標(biāo)簽進(jìn)行關(guān)聯(lián)映射處理,因此設(shè)計(jì)研發(fā)了全連接層將信息轉(zhuǎn)換保存到一維空間中。
4.2.5 改進(jìn)的深度學(xué)習(xí)模型
采用一個(gè)單層的下采樣層,針對(duì)不同大小的特征映射統(tǒng)一對(duì)其進(jìn)行下采樣歸一化處理,使其達(dá)到相同的尺寸。多尺度在傳統(tǒng)特征算子中發(fā)揮了重要作用,在卷積網(wǎng)絡(luò)中同樣可以采取類似的形式,例如卷積層就采用了3種不同的下采樣。下采樣過(guò)程是通過(guò)控制池化卷積模板來(lái)自適應(yīng)生成尺寸和步長(zhǎng),與前卷積層設(shè)定比例輸出,以保證下采樣輸出子圖固定大小。這里將給出本次研究的設(shè)計(jì)模型如圖3所示。
5 實(shí)驗(yàn)結(jié)果
5.1 實(shí)驗(yàn)一
本節(jié)實(shí)驗(yàn)從CASIA V4.0虹膜庫(kù)中選取150人作為訓(xùn)練樣本,隨機(jī)分別抽取50人成為測(cè)試樣本。
實(shí)驗(yàn)步驟:設(shè)置閾值為0.157 1,取得最高識(shí)別率。錯(cuò)誤拒絕次數(shù)FR為68,錯(cuò)誤接受次數(shù)FA為23,最高正確識(shí)別率CRR為99.968%。實(shí)驗(yàn)運(yùn)行結(jié)果如圖4所示。
5.2 實(shí)驗(yàn)二
本節(jié)實(shí)驗(yàn)從CASIA V4.0虹膜庫(kù)中選取150人作為訓(xùn)練樣本,隨機(jī)分別抽取50人作為測(cè)試樣本。
實(shí)驗(yàn)步驟可表述為:
(1)將原始采集虹膜經(jīng)過(guò)歸一化處理后得到特征圖;
(2)將特征圖作為原樣本輸入卷積神經(jīng)網(wǎng)絡(luò);
(3)設(shè)置閾值為0.157 1。
在此基礎(chǔ)上,得到的識(shí)別結(jié)果可見(jiàn)表1。
根據(jù)以上結(jié)果分析得出:CNN算法得到的識(shí)別率超過(guò)90%,而傳統(tǒng)的LMD算法識(shí)別率較低。
5.3 實(shí)驗(yàn)三
本節(jié)實(shí)驗(yàn)從CASIA V4.0虹膜庫(kù)中選取200人作為訓(xùn)練樣本,隨機(jī)分別抽取每人100組為測(cè)試樣本,其中50組作為測(cè)試集。設(shè)置實(shí)驗(yàn)參數(shù),PCHIP-LMD閾值為0.157 1,最后得到試驗(yàn)結(jié)果可見(jiàn)表2。
根據(jù)以上結(jié)果得出:CNN算法得到的識(shí)別率超過(guò)95%,而傳統(tǒng)的PCHIP-LMD算法識(shí)別率為89%。
6 結(jié)束語(yǔ)
綜上結(jié)論可以看出,虹膜識(shí)別的結(jié)果會(huì)受到閾值的影響。閾值可通過(guò)對(duì)圖像的分解處理后來(lái)提取識(shí)別特征圖,再對(duì)特征圖進(jìn)行移位匹配,最后計(jì)算匹配向量得到。當(dāng)閾值過(guò)高或過(guò)低都會(huì)影響識(shí)別結(jié)果,通過(guò)實(shí)驗(yàn)可知閾值為0.157 1時(shí),識(shí)別準(zhǔn)確率最高。經(jīng)過(guò)比較不難發(fā)現(xiàn),CNN方法的識(shí)別率遠(yuǎn)高于LMD與PCHIP-LMD的識(shí)別方法。但是也需指出,由于卷積神經(jīng)網(wǎng)絡(luò)在訓(xùn)練和設(shè)置參數(shù)方面難度較高,因此還需要通過(guò)大量實(shí)驗(yàn)的輔助佐證支持。本次研究表明,CNN可以在虹膜識(shí)別領(lǐng)域得到廣泛應(yīng)用,只要再加以改進(jìn),這種算法就可以在更大程度上提升虹膜研究的識(shí)別率。
參考文獻(xiàn)
[1] 李歡利,郭立紅,陳濤,等. 基于PCHIP-LMD的虹膜識(shí)別方法[J]. 光學(xué)精密工程 2013 21(1):197-206.
[2] DAUGMAN J G. High confidence visual recognition of persons by a test of statistical independence[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence 1993,15(11): 1148-1161.
[3] DAUGMAN J G. How iris recognition works[J]. IEEE Transactions on Circuits Systems for Video Technology 2004 14(1): 21-30.
[4] MA Li TAN Tieniu WANG Yunhong et al. Personal identification based on iris texture analysis[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence 2003 25(12): 1519-1533.
[5] KALKA N D,ZUO Jinyu SCHMID N A et al. Estimating and fusing quality factors for iris biometric images[J]. IEEE Transactions on Systems Man and Cybernetics Part A: Systems and Humans 2010 40(3): 509-524.
[6] JANG J PARK K R KIM J,et al. New focus assessment method for iris recognition systems[J]. Pattern Recognition Letter 2008 29(13): 1759-1767.
[7] CHEN Y DASS S C JAIN A K. Jain. Localized iris image quality using 2-D wavelets[C]//Proceedings of International Conference on Biometrics. Berlin/Heidelberg:Springer-Verlage,2006: 373-381.
[8] ZHOU Z DU Y,BELCHER C. Transforming traditional iris recognition system to work on non-ideal situation[J]. IEEE Transactions on Industrial Electronics 2009 56(8): 3203-3213.
[9] PARK K R KIM J. A real-time focusing algorithm for iris recognition camera[J]. IEEE Transactions on Systems Man and Cybernetics Part C 2005 35(3): 441-444.
[10]CASIA. Database of human iris [EB/OL]. [2009-09-21]. http://www.cbsr.ia.ac.cn/english/Iris Database.asp.
[11]倪綽. 眼的解剖組織學(xué)及其臨床應(yīng)用 [M]. 上海:上海醫(yī)科大學(xué)出版社 1993.
[12]楊行峻,鄭君里. 人工神經(jīng)網(wǎng)絡(luò)與盲信號(hào)處理[M]. 北京:清華大學(xué)出版社,2003.
[13]吳啟迪,汪鐳. 反饋式神經(jīng)網(wǎng)絡(luò)智能控制[M]. 上海:上??茖W(xué)教育出版社,2004.
[14]BOUVRIE J. Notes on convolutional neural networks[J]. Neural Networks,2006(1):38-44.