黃艷國(guó), 楊訓(xùn)根, 周滿國(guó)
(江西理工大學(xué)電氣工程與自動(dòng)化學(xué)院, 贛州 341000)
基于生物特征的身份識(shí)別技術(shù)越來(lái)越普及,各類產(chǎn)品漸漸融入日常生活。類似指紋[1-2]、人臉[3-5]等識(shí)別系統(tǒng)被廣泛用于手機(jī)的解鎖與支付軟件當(dāng)中。而身份識(shí)別產(chǎn)品的關(guān)鍵技術(shù)是基于人的生物特征,如指紋、人臉、虹膜[6]、掌紋[7]和靜脈等。手指靜脈作為人的生物特征之一,近年來(lái)也有許多的研究方法被提出,并取得了良好的識(shí)別效果。相對(duì)于一些基于深度學(xué)習(xí)的卷積神經(jīng)網(wǎng)絡(luò)[8]方法,傳統(tǒng)特征因其所需數(shù)據(jù)少、對(duì)硬件要求低、能夠達(dá)到較高識(shí)別率等特點(diǎn),在實(shí)際應(yīng)用上具備一定的優(yōu)勢(shì)。
關(guān)鍵點(diǎn)的匹配是手指靜脈識(shí)別的有效手段,Meng等[9]結(jié)合感興趣區(qū)域與細(xì)節(jié)匹配,提出了基于區(qū)域的檢測(cè)方法,通過(guò)計(jì)算Hessian矩陣作為細(xì)節(jié)點(diǎn)特征,對(duì)于細(xì)節(jié)點(diǎn)的匹配采用鄰域匹配以減少計(jì)算量,取得了較好的識(shí)別率,但相應(yīng)地增加了匹配時(shí)間。Jin等[10]提出的基于二值圖像的算法,對(duì)感興趣區(qū)域提取特征點(diǎn),利用梯度直方圖將特征點(diǎn)矢量化描述,有效縮小了圖像視野,為靜脈采集裝置的小型化提供思路,但算法的識(shí)別率仍有較大的提升空間。局部二值模式(local binary patterns, LBP)特征被成功運(yùn)用于目標(biāo)檢測(cè)與跟蹤[11]任務(wù)中,在手指靜脈識(shí)別方面也有許多研究。劉超等[12]在LBP算子的基礎(chǔ)上,根據(jù)圖像的分塊包含的信息量,通過(guò)逐步迭代的方式得出分塊圖像的權(quán)值,有效提升了算法的識(shí)別率,但求取權(quán)值系數(shù)過(guò)程計(jì)算量大、耗費(fèi)時(shí)間過(guò)長(zhǎng),降低了算法的時(shí)效性。而胡娜等[13]提出雙向主成分分析(principal component analysis,PCA)降維,對(duì)分塊圖像特征進(jìn)行行和列的雙向降維,相對(duì)于傳統(tǒng)LBP算法,有效提升了識(shí)別率,同樣降低了識(shí)別速度。稀疏表示模型也是靜脈識(shí)別的一類有效方法,Lei等[14]在稀疏表示模型中引入歐氏距離計(jì)算距離熵,有效抑制了圖像的噪聲干擾,相比于原有的模型,有效降低了等錯(cuò)誤率,但相較于傳統(tǒng)特征算子,識(shí)別率還需要進(jìn)一步提升。
基于以上分析,LBP算子在靜脈識(shí)別上具備優(yōu)良的性能,在LBP算子的基礎(chǔ)上,現(xiàn)通過(guò)局部平均的方式加強(qiáng)LBP算子的紋理表達(dá)能力,然后結(jié)合信息熵[15]作為加權(quán)系數(shù)得出熵值加權(quán)的局部二值模式(entropy weighted local binary patterns,ELBP)特征。而對(duì)于原始圖像提取感興趣區(qū)域[16],消除手指周圍區(qū)域的干擾。同時(shí),為提升算法的識(shí)別率與識(shí)別速度,采用主成分分析(PCA)將特征維數(shù)降低,最后使用歐式距離與曼哈頓距離計(jì)算相似性,對(duì)比驗(yàn)證本文方法的有效性。
手指區(qū)域的提取,去除了許多手指未覆蓋的干擾區(qū)域,有利于提升算法的識(shí)別率。首先將原圖像轉(zhuǎn)化為灰度圖,對(duì)灰度圖做邊緣濾波[17]處理,如圖1(b)所示。從圖1(b)中可以看出,邊緣算子能夠很好地凸顯手指的邊緣部分。然后通過(guò)簡(jiǎn)單閾值分割凸顯手指邊緣,為方便手指區(qū)域的提取,其中全局閾值設(shè)為100,像素小于100時(shí)為0,大于或等于100時(shí)為1,得到二值圖像如圖1(c)所示。
由圖1(c)可知,受檢測(cè)器的影響,圖像左右兩邊的手指邊緣被包含,為準(zhǔn)確提取手指區(qū)域,將二值圖像分為上下兩部分,如圖1(d)所示。分別求出每部分的最密集邊緣,即為對(duì)應(yīng)的邊界,根據(jù)求得的邊界坐標(biāo),可得出原圖的候選區(qū)域,如圖1(e)所示。最后得到的候選區(qū)域如圖1(f)所示,從圖1(f)中可以看出,此方法能夠較完整地保留了待測(cè)手指的完整性,有效地去除了冗余區(qū)域。
圖1 ROI提取示意圖Fig.1 ROI extraction process
LBP作為經(jīng)典的紋理特征,在圖像識(shí)別與目標(biāo)檢測(cè)中得到了廣泛的應(yīng)用。其主要是通過(guò)像素與鄰域像素的大小比較,并用0和1表示比較結(jié)果,然后將一系列0與1組合為一個(gè)二進(jìn)制數(shù),之后轉(zhuǎn)化為十進(jìn)制數(shù)即為中心像素的LBP值,最后通過(guò)直方圖統(tǒng)計(jì),得出圖像的LBP特征。像素LBP值轉(zhuǎn)換公式為
(1)
li=f(c,ni)
(2)
(3)
式中:f(x,y)為比較函數(shù);c為中心像素點(diǎn);ni為鄰域像素點(diǎn);li為鄰域像素比較結(jié)果;i為像素對(duì)應(yīng)編號(hào);L為求得的LBP值。
為提升LBP算子的識(shí)別性能,通過(guò)計(jì)算鄰域像素的均值,使LBP算子包含鄰域像素之間的大小信息,同時(shí)與中心像素比較取更大值作為新的中心像素,計(jì)算公式為
(4)
nc=max(c,mean)
(5)
式中:N為鄰域像素個(gè)數(shù);mean為均值;nc為新的中心像素。
圖2 LALBP編碼原理Fig.2 LALBP coding principle
將求得nc代入式(2)和式(3)中可得LALBP值,計(jì)算過(guò)程如圖2所示。將原圖像轉(zhuǎn)化為L(zhǎng)ALBP圖后,使用梯度直方圖統(tǒng)計(jì)可得256維的特征描述子,即圖像的LALBP特征。
信息熵是香農(nóng)在1948年根據(jù)熱力學(xué)中的熱熵[18]提出的,其描述的是信息源的不確定度。當(dāng)信息源的不確定性越高,信息熵越大,其包含的信息量越大。利用信息熵表述圖像的分塊信息量,根據(jù)信息熵的大小分配權(quán)值,可提高重要特征密集區(qū)域的表達(dá),提升識(shí)別率,信息熵與權(quán)值的計(jì)算公式為
(6)
式(6)中:P為像素級(jí)數(shù)大小為k時(shí)在圖像中出現(xiàn)的概率;E為信息熵;wi為塊i的權(quán)值系數(shù);Ei為塊i的信息熵值;m為分塊數(shù)。
將原圖劃分為8塊,對(duì)于每個(gè)分塊分別求LALBP特征并計(jì)算信息熵大小,將信息熵作為對(duì)應(yīng)塊的LALBP特征的系數(shù),得到ELBP的直方統(tǒng)計(jì)圖,最后將各塊的特征歸一化后級(jí)聯(lián)得到圖像的ELBP特征,提取流程如圖3所示。
圖3 ELBP特征提取示意圖Fig.3 ELBP feature extraction diagram
靜脈圖像的識(shí)別主要包括訓(xùn)練和識(shí)別兩部分,訓(xùn)練過(guò)程將提取每幅圖像的特征算子儲(chǔ)存到訓(xùn)練庫(kù)中,識(shí)別過(guò)程需要對(duì)提取的特征與訓(xùn)練庫(kù)進(jìn)行匹配比較,識(shí)別出待測(cè)圖像屬于訓(xùn)練庫(kù)中的哪一類,流程圖如圖4所示。
圖4 識(shí)別算法流程圖Fig.4 Flow chart of recognition algorithm
首先提取原圖像的ROI區(qū)域并歸一化至64×128大小,得到相同大小的特征提取圖像;然后根據(jù)歸一化后圖像的尺寸,將圖像分為m大小相同的子塊,分別對(duì)子塊圖像提取LALBP特征,之后通過(guò)式(4)和式(5)得到對(duì)應(yīng)塊的信息熵與加權(quán)系數(shù),將系數(shù)與對(duì)應(yīng)塊的特征相乘后級(jí)聯(lián),得到熵值加權(quán)的ELBP特征;最后利用向量距離計(jì)算方法歐氏距離、曼哈頓距離等作為相似度計(jì)算公式,計(jì)算待識(shí)別圖像與訓(xùn)練庫(kù)中所有樣本的相似度,采用最近鄰分類方式得出相似度最大的樣本類,待測(cè)圖像的識(shí)別結(jié)果即為對(duì)應(yīng)的類。
分別采用歐氏距離以及曼哈頓距離作為對(duì)比分類器,對(duì)于每一個(gè)待識(shí)別樣本,提取特征后分別與訓(xùn)練庫(kù)中的樣本特征求特征向量的距離,距離最小的訓(xùn)練樣本對(duì)應(yīng)的類型即分別為匹配類型。歐氏距離與曼哈頓距離計(jì)算公式分別為
(7)
(8)
式中:xi為訓(xùn)練庫(kù)的特征因子;yi為待識(shí)別特征因子;n為特征維數(shù);dE為歐氏距離計(jì)算結(jié)果;dM為曼哈頓距離計(jì)算結(jié)果。
采用的數(shù)據(jù)集為SDUMLA數(shù)據(jù)庫(kù)與天津市智能實(shí)驗(yàn)室采集指靜脈圖像數(shù)據(jù)庫(kù)。SDUMLA數(shù)據(jù)庫(kù)分別采集了106人,有636種手指類型,圖像大小為320×240。天津數(shù)據(jù)庫(kù)則采集了66根不同手指,每類15幅圖像,圖像為尺寸為80×170。
在SDUMLA數(shù)據(jù)庫(kù)中分別選取1、2、3、4、5幅圖像為訓(xùn)練樣本數(shù),組建5個(gè)不同的訓(xùn)練庫(kù),通過(guò)PCA降維,得到在不同訓(xùn)練樣本數(shù)下,ELBP特征維數(shù)與識(shí)別率的關(guān)系,結(jié)果如圖5所示。
圖5 特征維數(shù)對(duì)比Fig.5 Feature dimension comparison
對(duì)比圖5中兩種分類方式可以看出,ELBP的主要特征只有80維,維數(shù)上升到80之后,識(shí)別率處于穩(wěn)定狀態(tài),并且特征維數(shù)對(duì)識(shí)別率的影響在不同分類器上變化趨勢(shì)一致。同時(shí),隨著樣本數(shù)量的增加,識(shí)別率越穩(wěn)定,所需的特征維數(shù)越低。由圖5可知,當(dāng)訓(xùn)練樣本數(shù)為5時(shí),特征維數(shù)為40時(shí)識(shí)別率便基本不變?;谄ヅ鋾r(shí)間與識(shí)別率的綜合考慮,選取80作為維數(shù)降低后特征的長(zhǎng)度較為合適,既提升了識(shí)別率又兼顧了訓(xùn)練樣本數(shù)量的變化,同時(shí)能夠極大程度縮短匹配時(shí)間。
歐氏距離與曼哈頓距離同樣作為向量距離的計(jì)算方法,但作為識(shí)別系統(tǒng)的分類器性能上有很大的差異,一個(gè)優(yōu)良的分類器能夠有效地提升識(shí)別系統(tǒng)的識(shí)別率,LBP、HOG、LBP-PCA與本文方法在不同分類方式下的識(shí)別率與識(shí)別時(shí)間如表1所示。
表1 兩種分類器性能對(duì)比
從表1可以看出,在識(shí)別率方面,LBP、ELBP和ELBP-PCA特征采用曼哈頓距離計(jì)算相似度的識(shí)別率更高,相對(duì)于歐氏距離分別提升了0.48%、0.16%和0.47%,HOG特征保持不變,而LBP-PCA降低了0.47%;在時(shí)間方面,兩種計(jì)算方式并無(wú)明顯差異,因此本文所選特征算子更適合采用曼哈頓距離作為相似度計(jì)算的方法。同時(shí)對(duì)比幾種特征算子的結(jié)果可以發(fā)現(xiàn),HOG特征雖然識(shí)別率達(dá)到了99.21%,但匹配時(shí)間過(guò)長(zhǎng);LBP-PCA識(shí)別時(shí)間為8.3 ms,滿足一般識(shí)別要求,但識(shí)別率僅為94.97%,相對(duì)于其他方法偏低;而本文方法識(shí)別率最高,達(dá)到了99.53%,同時(shí)匹配時(shí)間最低為2.5 ms,因此本文方法在識(shí)別率與匹配時(shí)間上相對(duì)其他方法具有一定的優(yōu)勢(shì)。
利用維數(shù)選取的5個(gè)數(shù)據(jù)庫(kù),對(duì)比分析LBP、HOG、LBP-PCA與本文算法識(shí)別率、識(shí)別時(shí)間與樣本個(gè)數(shù)的關(guān)系,其中,識(shí)別率與訓(xùn)練樣本個(gè)數(shù)關(guān)系如圖6所示。
從圖6中可以看出,訓(xùn)練樣本個(gè)數(shù)為2時(shí),識(shí)別率達(dá)到了低谷,但低谷并不是特征算子導(dǎo)致。因此針對(duì)此數(shù)據(jù)集,樣本數(shù)為2時(shí)效果最差,同時(shí)樣本數(shù)為5時(shí),相較于1、2、3、4,識(shí)別率有明顯的提升,所以樣本數(shù)量的增加能夠有效提升識(shí)別率。對(duì)比圖6(a)和圖6(b),可以看出,不同的分類方式下,識(shí)別率會(huì)有一定的變化,但本文提出的ELBP-PCA特征,在兩種距離計(jì)算方法下,識(shí)別率均高于其他特征,在不同訓(xùn)練樣本個(gè)數(shù)下均有一定的優(yōu)勢(shì)。
由以上實(shí)驗(yàn)分析可知,本文算法在SDUMLA數(shù)據(jù)庫(kù)中的識(shí)別率最高為99.53%,高于其他對(duì)比特征,同時(shí)表明了本文算法的高性能。為證明本文算法的通用性,而不是針對(duì)某一數(shù)據(jù)集有較好的性能,將本文算法與LBP、HOG和LBP-PCA等特征在天津數(shù)據(jù)庫(kù)上進(jìn)一步對(duì)比分析。
天津靜脈數(shù)據(jù)庫(kù)樣本中,每種類型包含15個(gè)樣本,可分別選取1、3、5、7、9個(gè)訓(xùn)練樣本數(shù)構(gòu)建5個(gè)訓(xùn)練庫(kù),分析各算法在天津數(shù)據(jù)庫(kù)上的識(shí)別率與訓(xùn)練樣本個(gè)數(shù)的關(guān)系。在不同訓(xùn)練樣本個(gè)數(shù)的情況下,得出不同特征的識(shí)別率,同時(shí)也可反映出本文方法在天津靜脈數(shù)據(jù)庫(kù)上的性能,得出的各類方法所能取得的最高識(shí)別率。同樣采用兩種不同的距離計(jì)算方式構(gòu)建分類器,計(jì)算不同訓(xùn)練樣本下的識(shí)別率,對(duì)比結(jié)果如表2所示。
由表2可知,各類特征在此數(shù)據(jù)集上的識(shí)別率均在94%以上,表明紋理和梯度特征在靜脈識(shí)別中有較好的性能。比較樣本個(gè)數(shù)與識(shí)別率的關(guān)系可知,天津數(shù)據(jù)庫(kù)的最佳樣本數(shù)個(gè)數(shù)應(yīng)在3~5,過(guò)多的樣本反而會(huì)降低識(shí)別率。其中利用歐式距離分類,訓(xùn)練樣本個(gè)數(shù)為3時(shí),ELBP的識(shí)別率達(dá)到最大值99.74%,高于LBP的97.53%,與HOG持平;而使用曼哈頓距離分類時(shí),訓(xùn)練樣本個(gè)數(shù)為5時(shí),識(shí)別率達(dá)到99.84%,高于LBP、HOG的98.75%、99.74%,表明ELBP特征在不同的數(shù)據(jù)集上仍有很好的識(shí)別性能。
圖6 訓(xùn)練樣本數(shù)對(duì)比Fig.6 Comparison of the number of training samples
表2 不同訓(xùn)練樣本個(gè)數(shù)下的識(shí)別率
結(jié)合信息熵與改進(jìn)型LBP算子提出了信息熵加權(quán)的ELBP算子,整體上突出圖像部分信息豐富區(qū)域的表達(dá),對(duì)于單個(gè)LBP算子通過(guò)引入鄰域像素間的關(guān)系加強(qiáng)了LBP算子的識(shí)別性能,并通過(guò)PCA降維,消除冗余特征,提升了圖像的識(shí)別率與匹配速度。實(shí)驗(yàn)結(jié)果表明,本文算法能夠有效提升識(shí)別率,在兩個(gè)數(shù)據(jù)集上最高識(shí)別率分別達(dá)到99.53%、99.84%,相對(duì)于單一的LBP、HOG算法,具有更高的識(shí)別性能,并且在識(shí)別時(shí)間上同樣具有一定的優(yōu)勢(shì)。同時(shí)經(jīng)過(guò)實(shí)驗(yàn)驗(yàn)證,本文算法與曼哈頓距離結(jié)合識(shí)別性能更好。