(北方工業(yè)大學(xué) 信息與通信工程學(xué)院,北京 100144)
人類視覺感知與記憶、注意和其他視覺感知通道緊密交互,形成人類視覺感知神經(jīng)機(jī)制[1]。人類的視覺注意力是指在觀察場(chǎng)景時(shí),通過全局觀察,將注意力集中在重點(diǎn)想要關(guān)注的區(qū)域,對(duì)這一區(qū)域進(jìn)行更多的視覺感知處理,得到所需要關(guān)注的細(xì)節(jié)信息,不重要的信息不做細(xì)節(jié)觀察。模擬人類的視覺感知機(jī)制搭建神經(jīng)網(wǎng)絡(luò)模型,在圖像分類、物體檢測(cè)、語(yǔ)音識(shí)別等領(lǐng)域有重要研究意義。
以往視覺注意力的研究一般基于低級(jí)的圖像特征和自底向上的過程[2],應(yīng)用生成顯著圖像算法,對(duì)一幅輸入圖像提取顏色、亮度、方向等特征,然后在每個(gè)特征上生成關(guān)注圖,最終融合這些關(guān)注圖為顯著圖[3]?;陲@著圖的方法會(huì)對(duì)圖像的每一個(gè)像素點(diǎn)設(shè)置顯著值,從而對(duì)顯著值高的點(diǎn)更加關(guān)注,抑制顯著值低的點(diǎn)。該方法在圖像發(fā)生旋轉(zhuǎn),平移或者尺度等變化時(shí),顯著圖也隨之改變,因此在旋轉(zhuǎn)、平移變化下沒有很好的魯棒性。
本文將人類視覺注意力處理過程當(dāng)成一個(gè)策略控制任務(wù),經(jīng)過循環(huán)神經(jīng)網(wǎng)絡(luò)無(wú)監(jiān)督訓(xùn)練,不斷的尋求聚集點(diǎn),動(dòng)態(tài)輸出全部的局部ROI圖像,基于這些ROI圖像進(jìn)行特征提取并分類輸出?;谧⒁饬C(jī)制循環(huán)神經(jīng)網(wǎng)絡(luò)模型的手背靜脈識(shí)別方法,在每一時(shí)刻依次輸入不同的聚焦點(diǎn)的局部ROI手背靜脈圖像,同時(shí)以該區(qū)域?yàn)橹行?,截取不同尺度的手背靜脈區(qū)域,完成從局部到整體的手背靜脈信息表達(dá)。應(yīng)用強(qiáng)化學(xué)習(xí)中的策略學(xué)習(xí)機(jī)制[4]對(duì)網(wǎng)絡(luò)進(jìn)行訓(xùn)練。循環(huán)神經(jīng)網(wǎng)絡(luò)中每一時(shí)刻的輸入不僅與當(dāng)前輸入的局部區(qū)域有關(guān),也與上一時(shí)刻輸出有關(guān),保證了手背靜脈紋理的關(guān)聯(lián)性。該方法下的手背靜脈特征識(shí)別,有效抑制圖像對(duì)旋轉(zhuǎn)、平移、尺度敏感問題,實(shí)驗(yàn)驗(yàn)證該方法下的手背靜脈身份研究在旋轉(zhuǎn)、平移變化下有很好的魯棒性。
本文采用近紅外手背靜脈圖像采集設(shè)備,由光源部分,采集部分以及外圍部分組成,其中,光源部分由近紅外濾光片,LED陣列和均光片等組成,外觀及內(nèi)部結(jié)構(gòu)圖如圖1所示。本文研究在旋轉(zhuǎn)、平移變化下的手背靜脈識(shí)別,允許被采集者在采集過程中手背有輕微的移動(dòng)變化,對(duì)被采集者的采集姿勢(shì),采集角度和采集區(qū)域不做約束,所采集到的圖像與正常的手背靜脈圖像相比,會(huì)產(chǎn)生尺度、平移、旋轉(zhuǎn)等差異。在該條件下,本文建立了多形態(tài)變化的手背靜脈數(shù)據(jù)庫(kù)。50位受采集者,分別在不同的時(shí)間段采集手背靜脈圖像,采集時(shí)允許有旋轉(zhuǎn),平移等變化,同時(shí)在不同時(shí)間進(jìn)行采集,光照,對(duì)比度也會(huì)產(chǎn)生細(xì)微差異,在該情況下,本文建立弱約束多形態(tài)的手背靜脈數(shù)據(jù)庫(kù),采集的手背靜脈原始圖像如圖2(a)所示。對(duì)該原始數(shù)據(jù)進(jìn)行預(yù)處理及紋理分割,建立了多形態(tài)的手背靜脈圖像數(shù)據(jù)庫(kù),如圖2(b)所示。
本文以時(shí)間序列輸入不同聚焦點(diǎn)的手背靜脈局部ROI區(qū)域,并增量地組合以往的局部關(guān)注信息,建立整個(gè)手背圖像的動(dòng)態(tài)內(nèi)部表示,最終完成序列化的手背局部區(qū)域表達(dá)[5]。不同時(shí)刻的ROI區(qū)域由循環(huán)神經(jīng)網(wǎng)絡(luò)隱藏層決策,根據(jù)當(dāng)前隱藏層的狀態(tài)產(chǎn)生概率分布,為下一時(shí)刻提供決策,同時(shí)該隱藏層循環(huán)作為下一時(shí)刻隱藏層的輸入,最后隱藏層的輸出經(jīng)過softmax概率計(jì)算,分類輸出。訓(xùn)練過程中對(duì)當(dāng)前的決策給出相應(yīng)的獎(jiǎng)勵(lì),使用反向傳播算法優(yōu)化神經(jīng)網(wǎng)絡(luò)的參數(shù),用強(qiáng)化學(xué)習(xí)中的策略梯度尋求使獎(jiǎng)勵(lì)值最高的策略,模型結(jié)構(gòu)如圖3所示。
圖3 循環(huán)注意力網(wǎng)絡(luò)模型
該模型包含局部ROI的生成模塊,注意力傳感器網(wǎng)絡(luò)模塊,循環(huán)神經(jīng)網(wǎng)絡(luò)模塊,聚焦點(diǎn)決策模塊,獎(jiǎng)勵(lì)機(jī)制模塊。具體過程如下。
步驟1:局部ROI的生成。該模塊以聚焦點(diǎn)坐標(biāo)為中心,以不同的帶寬采集子圖,得到多尺度的手背靜脈區(qū)域圖像[6],通過下采樣對(duì)尺度歸一化處理,獲得相同尺度的局部手背靜脈圖像,生成一組的觀測(cè)區(qū)域圖像ρ(xt,lt),如圖4所示。其中初始位置坐標(biāo)(l0)通過ROI區(qū)域質(zhì)心法選取,坐標(biāo)為ROI區(qū)域中心位置,下一時(shí)刻位置lt由網(wǎng)絡(luò)循環(huán)決策產(chǎn)生。
圖4 生成局部ROI圖像
圖5 注意力傳感器網(wǎng)絡(luò)的特征提取過程
步驟3:循環(huán)神經(jīng)網(wǎng)絡(luò)。該模型的輸入由注意力傳感器網(wǎng)絡(luò)輸出的特征向量fg(θg)和上一時(shí)刻隱藏層的輸出ht-1共同決定,對(duì)圖像及聚焦點(diǎn)位置特征進(jìn)行提取。隱藏單元通過式(1)對(duì)網(wǎng)絡(luò)進(jìn)行迭代更新,θh為隱藏層ht的線性回歸計(jì)算。在t時(shí)刻對(duì)隱藏層節(jié)點(diǎn)ht進(jìn)行強(qiáng)化學(xué)習(xí)策略決策,同時(shí)作為下一時(shí)刻的輸入,傳遞給循環(huán)神經(jīng)網(wǎng)絡(luò)的隱藏單元,結(jié)構(gòu)圖如6所示。
ht=fh(ht-1,fg(t-1);θh)
(1)
圖6 循環(huán)神經(jīng)網(wǎng)絡(luò)模型
步驟4:聚焦點(diǎn)決策過程。循環(huán)神經(jīng)網(wǎng)絡(luò)在t時(shí)刻,將隱藏層的輸出ht向圖像坐標(biāo)空間映射,得到ht與位置坐標(biāo)lt的線性回歸模型fl(ht;θlt),在該模型條件下,對(duì)位置進(jìn)行采樣,lt服從l~p(l|fl(ht;θlt))的條件分布,輸出最大概率的即為t+1時(shí)刻的位置lt+1,如圖7所示。
圖7 位置決策過程
步驟5:獎(jiǎng)勵(lì)機(jī)制。為強(qiáng)化學(xué)習(xí)的訓(xùn)練過程,循環(huán)注意力網(wǎng)絡(luò)尋找到最后時(shí)刻的位置后,網(wǎng)絡(luò)輸出層進(jìn)行概率計(jì)算,輸出分類結(jié)果,同時(shí)將預(yù)測(cè)結(jié)果與真實(shí)值進(jìn)行計(jì)算,得到一個(gè)獎(jiǎng)勵(lì)信號(hào)rt。在時(shí)刻t,當(dāng)分類正確則獎(jiǎng)勵(lì)值加1,分類的最終目標(biāo)就是使獎(jiǎng)勵(lì)信號(hào)的總和最大化,公式如(2)所示。本文的循環(huán)注意力網(wǎng)絡(luò)是馬爾可夫決策的過程,通過對(duì)位置和動(dòng)作在時(shí)間序列上的策略學(xué)習(xí),將歷史時(shí)刻與環(huán)境交互的過程映射成關(guān)于當(dāng)前位置決策的概率分布,通過反向傳播算法,結(jié)合策略梯度下降算法進(jìn)行參數(shù)更新,使網(wǎng)絡(luò)更新的方向更加接近正向的獎(jiǎng)勵(lì)。
(2)
聚焦點(diǎn)的位置決定了局部手背靜脈圖像的截取位置,因此聚焦點(diǎn)的選取集中在手背靜脈ROI區(qū)域,聚焦到ROI區(qū)域外會(huì)降低識(shí)別率[7]。
由于條件分布決策下的聚焦點(diǎn)沒有考慮到樣本的隨機(jī)性,不同位置的局部手背靜脈圖像差異明顯,所以本文針對(duì)手背靜脈圖像對(duì)聚焦點(diǎn)決策過程進(jìn)行優(yōu)化,通過增加正態(tài)分布的噪聲對(duì)決策位置lt+1進(jìn)行調(diào)整,以決策位置lt+1為初始值,噪聲服從均值μ=0,標(biāo)準(zhǔn)差參數(shù)σ2的高斯分布,采樣結(jié)果為噪聲微調(diào)后的決策位置lt+1,公式如(3)所示。
(3)
循環(huán)神經(jīng)網(wǎng)絡(luò)的每次循環(huán)會(huì)決策出下一時(shí)刻的聚焦點(diǎn),該聚焦點(diǎn)作為下一時(shí)刻的輸入進(jìn)行網(wǎng)絡(luò)的循環(huán)。因此,循環(huán)神經(jīng)網(wǎng)絡(luò)的循環(huán)次數(shù)決定了網(wǎng)絡(luò)的聚焦點(diǎn)個(gè)數(shù)[8]。聚集點(diǎn)過少不能完全的顯示手背靜脈的ROI區(qū)域,聚焦點(diǎn)過多,網(wǎng)絡(luò)訓(xùn)練會(huì)產(chǎn)生過擬合現(xiàn)象。因此,本文通過實(shí)驗(yàn)對(duì)聚焦點(diǎn)的個(gè)數(shù)進(jìn)行選取,結(jié)果見3.2小節(jié)。
在確定聚焦點(diǎn)后,以聚焦點(diǎn)為中心,截取多尺度的局部ROI區(qū)域,將該區(qū)域作為循環(huán)神經(jīng)網(wǎng)絡(luò)的輸入進(jìn)行訓(xùn)練。截取的ROI區(qū)域應(yīng)該包含不同尺度下的手背靜脈的局部紋理信息[9]。在手背靜脈圖像中,截取三個(gè)不同尺度的ROI區(qū)域。第一個(gè)尺度為小尺度,該尺度下截取的為局部細(xì)節(jié)紋理區(qū)域,對(duì)細(xì)節(jié)特征進(jìn)行描述。第二個(gè)尺度進(jìn)行21放大,對(duì)關(guān)聯(lián)的局部紋理信息進(jìn)行描述。第三個(gè)尺度進(jìn)行22放大,描述更多的局部紋理信息。通過三個(gè)尺度截取的ROI區(qū)域,循環(huán)神經(jīng)網(wǎng)絡(luò)訓(xùn)練不同聚焦點(diǎn)的局部ROI區(qū)域之間的序列關(guān)聯(lián)性,完成了手背靜脈從局部細(xì)節(jié)到整體圖像的ROI區(qū)域描述。
本文中的循環(huán)注意力網(wǎng)絡(luò)對(duì)t時(shí)刻隱藏層的輸出進(jìn)行獎(jiǎng)勵(lì)值計(jì)算,根據(jù)獎(jiǎng)勵(lì)值進(jìn)行網(wǎng)絡(luò)參數(shù)更新,反向傳播時(shí)對(duì)位置決策進(jìn)行梯度更新,而位置決策的過程不可導(dǎo),找到目標(biāo)函數(shù)無(wú)法進(jìn)行求導(dǎo),所以引入了強(qiáng)化學(xué)習(xí)對(duì)位置決策的過程進(jìn)行梯度計(jì)算,樣本的梯度逼近如下(4)所示。
(4)
其中:p(s1:T;θ)為當(dāng)前環(huán)境狀態(tài)下決策序列s1:T的分布,R為獎(jiǎng)勵(lì)值函數(shù)。
為使獎(jiǎng)勵(lì)值R最大化,需要找到最優(yōu)參數(shù)θ,使得樣本梯度J(θ)最大化。樣本梯度函數(shù)▽(J(θ))含有連續(xù)的決策序列s1:T,本文采用強(qiáng)化學(xué)習(xí)樣本近似的方法來逼近梯度,如式(5)所示。
(5)
通過反向傳播算法計(jì)算網(wǎng)絡(luò)梯度,調(diào)整網(wǎng)絡(luò)的參數(shù)θ,使得能夠提升獎(jiǎng)勵(lì)值的決策概率變大。
本文的手背靜脈身份識(shí)別屬于分類識(shí)別任務(wù),神經(jīng)網(wǎng)絡(luò)的輸出層采用softmax激活函數(shù),輸出概率最大值為當(dāng)前分類結(jié)果的預(yù)測(cè)值。采用交叉熵?fù)p失函數(shù)對(duì)預(yù)測(cè)值進(jìn)行誤差估計(jì)。在本文中我們不僅將真實(shí)值與網(wǎng)絡(luò)預(yù)測(cè)值進(jìn)行誤差計(jì)算,同時(shí)將網(wǎng)絡(luò)決策的位置和獎(jiǎng)勵(lì)值進(jìn)行誤差計(jì)算,式(6)為網(wǎng)絡(luò)優(yōu)化的交叉熵?fù)p失函數(shù)。
C=-∑i(yilnαi+Rilnli)
(6)
式中,yi表示分類的真實(shí)值,αi為網(wǎng)絡(luò)的預(yù)測(cè)值;Ri為網(wǎng)絡(luò)決策下的累積獎(jiǎng)勵(lì)值,li為網(wǎng)絡(luò)的位置決策。
C′=-∑i(yilnai+(Ri-b)lnli)
(7)
本文采用最優(yōu)化的交叉熵?fù)p失函數(shù)進(jìn)行反向傳播算法,優(yōu)化循環(huán)神經(jīng)網(wǎng)絡(luò)和局部圖像特征提取網(wǎng)絡(luò)的參數(shù),網(wǎng)絡(luò)決策尋求聚焦點(diǎn)的過程由式(5)所示的強(qiáng)化學(xué)習(xí)梯度更新策略。
在循環(huán)神經(jīng)網(wǎng)絡(luò)中,每一時(shí)刻輸入一個(gè)位置,該位置為注意力機(jī)制中的聚焦點(diǎn)。本文通過增加正態(tài)分布的噪聲對(duì)位置進(jìn)行調(diào)整,正態(tài)分布服從均值μ=0,標(biāo)準(zhǔn)差為σ2。本文在迭代次數(shù)為370的情況下,對(duì)不加噪聲和加正態(tài)分布噪聲進(jìn)行實(shí)驗(yàn),將不同實(shí)驗(yàn)決策的聚焦點(diǎn)作為循環(huán)神經(jīng)網(wǎng)絡(luò)的輸入,進(jìn)行訓(xùn)練分類,得到的獎(jiǎng)勵(lì)值的實(shí)驗(yàn)結(jié)果如表1所示。
表1 不同標(biāo)準(zhǔn)差的手背靜脈獎(jiǎng)勵(lì)值(均值μ=0)
由實(shí)驗(yàn)結(jié)果可知,當(dāng)聚焦點(diǎn)不加噪聲時(shí),不同時(shí)刻的聚焦點(diǎn)之間的距離差異不明顯,不能聚焦到完全的手背靜脈圖像,所以獎(jiǎng)勵(lì)值較低,結(jié)果為0.89;加入標(biāo)準(zhǔn)差后,獎(jiǎng)勵(lì)值增大。當(dāng)標(biāo)準(zhǔn)差為0.20時(shí),獎(jiǎng)勵(lì)值最大,為0.95。當(dāng)標(biāo)準(zhǔn)差大于0.22時(shí),各聚焦點(diǎn)之間的距離過大,導(dǎo)致最后的聚焦點(diǎn)溢出手背靜脈圖像,從而導(dǎo)致獎(jiǎng)勵(lì)值下降。因此本文的聚焦點(diǎn)服從均值μ=0,標(biāo)準(zhǔn)差為0.20的正態(tài)分布,該參數(shù)下的網(wǎng)絡(luò)獎(jiǎng)勵(lì)值達(dá)到0.95。
我們?cè)诓煌瑫r(shí)刻尋找不同的注意力聚焦點(diǎn),聚焦點(diǎn)的個(gè)數(shù)由網(wǎng)絡(luò)循環(huán)的層數(shù)決定。網(wǎng)絡(luò)每一時(shí)刻的循環(huán)會(huì)決策出下一時(shí)刻的聚焦點(diǎn),因此,網(wǎng)絡(luò)循環(huán)的層數(shù)就是注意力機(jī)制中聚焦點(diǎn)的個(gè)數(shù)。本文在加均值μ=0,標(biāo)準(zhǔn)差為0.20正態(tài)分布噪聲的情況下,對(duì)網(wǎng)絡(luò)層數(shù)進(jìn)行設(shè)定,不同層數(shù)的實(shí)驗(yàn)結(jié)果如表2所示。
表2 不同聚焦點(diǎn)個(gè)數(shù)的手背靜脈獎(jiǎng)勵(lì)值
由實(shí)驗(yàn)可知,隨著隱藏層層數(shù)增加,網(wǎng)絡(luò)的獎(jiǎng)勵(lì)值增大。當(dāng)隱藏層層數(shù)小于6時(shí),網(wǎng)絡(luò)決策的聚焦點(diǎn)減少,過少的聚焦點(diǎn)不能完全的顯示出手背靜脈的整體信息。當(dāng)隱藏層層數(shù)為6時(shí),獎(jiǎng)勵(lì)值最大,為0.97。當(dāng)隱藏層數(shù)大于6時(shí),網(wǎng)絡(luò)決策的聚焦點(diǎn)過多,各聚焦點(diǎn)之間的差異不明顯,不能很好的學(xué)習(xí)到局部手背靜脈圖像之間的紋理聯(lián)系。文本選擇在隱藏層層數(shù)為6的情況下,對(duì)聚焦點(diǎn)進(jìn)行決策,網(wǎng)絡(luò)決策出6個(gè)完整描述手背靜脈局部紋理的聚焦點(diǎn)。
本文以當(dāng)前時(shí)刻的聚焦點(diǎn)為中心,按不同尺度截取3個(gè)矩形區(qū)域。定義第一個(gè)區(qū)域的圖像大小為ω*ω,第K(1 表3 不同尺度下的手背靜脈獎(jiǎng)勵(lì)值 由實(shí)驗(yàn)結(jié)果可知,當(dāng)網(wǎng)絡(luò)決策到聚焦點(diǎn)位置后,以該位置進(jìn)行局部區(qū)域的截取。當(dāng)截取的區(qū)域小時(shí),提取到的信息不足,降低了網(wǎng)絡(luò)的獎(jiǎng)勵(lì)值。當(dāng)截取的區(qū)域過大或者包含全部手背靜脈圖像時(shí),截取不同區(qū)域的圖像差別不大,循環(huán)神經(jīng)網(wǎng)絡(luò)訓(xùn)練的序列關(guān)聯(lián)性較小,因此代價(jià)值不穩(wěn)定。因此,本文選定區(qū)域大小為24*24,48*48,96*96,該情況下,獎(jiǎng)勵(lì)值最大,因此選擇該組帶寬截取局部區(qū)域圖像。 文本從每類數(shù)據(jù)中選擇1500張作為訓(xùn)練數(shù)據(jù)集,300張作為測(cè)試數(shù)據(jù)集進(jìn)行實(shí)驗(yàn)。手背靜脈圖像大小為128*128,.jpg格式的灰度圖像。 本文設(shè)定初始學(xué)習(xí)率為0.001,指數(shù)型衰減學(xué)習(xí)率。采用Adam優(yōu)化器對(duì)網(wǎng)絡(luò)的損失函數(shù)衰減優(yōu)化,將本文定義的交叉熵?fù)p失函數(shù)C和最優(yōu)化交叉熵?fù)p失函數(shù)進(jìn)行對(duì)比,不同迭代次數(shù)epoch和代價(jià)值cost的關(guān)系如圖8所示。 圖8 不同迭代次數(shù)下的代價(jià)值 如圖8可知,最優(yōu)化的交叉熵?fù)p失函數(shù)下,代價(jià)值收斂較快,當(dāng)?shù)螖?shù)為370時(shí),網(wǎng)絡(luò)的代價(jià)值平緩且趨于0,因此本文實(shí)驗(yàn)選擇最優(yōu)化的交叉熵?fù)p失函數(shù),迭代次數(shù)確定為370,進(jìn)行訓(xùn)練。 本文在選取6個(gè)聚焦點(diǎn),并服從均值,標(biāo)準(zhǔn)差為0.20正態(tài)分布噪聲,局部ROI區(qū)域的三個(gè)尺度分別為24*24,48*48,96*96的情況下在測(cè)試集進(jìn)行驗(yàn)證,并且與傳統(tǒng)算子進(jìn)行對(duì)比,如LBP算子,SIFT特征描述子,識(shí)別率如表4所示。 表4 不同算法的手背靜脈識(shí)別率 傳統(tǒng)LBP算子用來描述圖像局部紋理特征,具有旋轉(zhuǎn)不變性。但當(dāng)圖像發(fā)生平移變化時(shí),局部紋理發(fā)生改變。對(duì)各局部紋理特征之間的關(guān)系沒有描述,因此該方法下的識(shí)別率不高。SIFT特征描述子描述的是圖像的局部特征,對(duì)圖像上的每個(gè)像素進(jìn)行提取,增加了計(jì)算的復(fù)雜度和工作量[10]。并且提取的特征不具有平移不變性,在手背靜脈旋轉(zhuǎn)平移的情況下沒有很好的魯棒性。 在旋轉(zhuǎn)、平移變化的情況下,對(duì)手背靜脈的局部紋理特征進(jìn)行提取。應(yīng)用強(qiáng)化學(xué)習(xí)的方法不斷的尋求聚焦點(diǎn),以聚焦點(diǎn)為中心提取圖像的局部紋理信息。應(yīng)用循環(huán)神經(jīng)網(wǎng)絡(luò)訓(xùn)練各局部區(qū)域之間的序列關(guān)系,決策下一時(shí)刻的聚焦點(diǎn)。該方法下的手背靜脈識(shí)別方法,各局部信息的紋理和位置關(guān)系具有不變性,因此在發(fā)生旋轉(zhuǎn)和平移變化時(shí),要優(yōu)于傳統(tǒng)局部特征的提取算法,在多形態(tài)數(shù)據(jù)集下驗(yàn)證,手背靜脈圖像的識(shí)別率高達(dá)99.3%。 本文針對(duì)手背靜脈圖像對(duì)旋轉(zhuǎn)和平移變換識(shí)別率不高的問題,提出了基于循環(huán)神經(jīng)網(wǎng)絡(luò)的注意力模型。該模型下,手背靜脈圖像作為序列化的輸入送入循環(huán)神經(jīng)網(wǎng)絡(luò)中,以時(shí)間序列輸入不同聚焦點(diǎn)的局部手背靜脈ROI圖像,循環(huán)神經(jīng)網(wǎng)絡(luò)對(duì)不同時(shí)刻的局部特征進(jìn)行訓(xùn)練,從而完成從局部到整體的手背靜脈特征描述。在聚焦點(diǎn)的選取中,本文加入了正太分布的噪聲,使得聚焦點(diǎn)的選取更加完整的描述手背靜脈圖像。對(duì)循環(huán)神經(jīng)網(wǎng)絡(luò)的層數(shù)進(jìn)行了參數(shù)確定,從而確定了決策聚焦點(diǎn)的個(gè)數(shù)。在局部ROI區(qū)域截取時(shí),對(duì)局部區(qū)域進(jìn)行了三種尺度的約束,從而完成了從局部到整體的局部ROI區(qū)域的描述。應(yīng)用強(qiáng)化學(xué)習(xí)中的策略梯度下降法和最優(yōu)化的無(wú)偏估計(jì)交叉熵?fù)p失函數(shù)對(duì)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,使得該方法下的網(wǎng)絡(luò)代價(jià)值下降最快,并且趨于穩(wěn)定。該方法下的手背靜脈身份識(shí)別,在圖像發(fā)生旋轉(zhuǎn)和平移變化時(shí),聚焦點(diǎn)提取的局部紋理信息不會(huì)隨之改變,并且通過循環(huán)神經(jīng)網(wǎng)絡(luò)訓(xùn)練各局部圖像之間的序列關(guān)系,對(duì)旋轉(zhuǎn)、平移變化不敏感。本文提出的基于循環(huán)神經(jīng)網(wǎng)絡(luò)的注意力模型,在多形態(tài)手背靜脈數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn),識(shí)別率高達(dá)99.3%,驗(yàn)證了本文方法對(duì)手背靜脈圖像的旋轉(zhuǎn)和平移變化具有很好的魯棒性。3.4 交叉熵?fù)p失函數(shù)更新
3.5 對(duì)比實(shí)驗(yàn)
4 總結(jié)