(遼寧工業(yè)大學電子與信息工程學院,遼寧錦州 121001)
手背靜脈因同時具有內部特征、非接觸式采集、特定光源、活體識別等優(yōu)勢[1]逐漸受到越來越多人的關注,進而成為生物特征識別的研究熱點問題之一。
提取出有效的靜脈特征是實現(xiàn)準確識別的重要保證,而許多學者也針對該問題展開了較為深入的研究。目前,已有的靜脈圖像特征提取方式大體可分為以下兩種:一是直接對采集的灰度靜脈圖像進行特征分析;二是對二值靜脈圖像中的脈絡結構特征進行提取。由于靜脈圖像特征主要體現(xiàn)在靜脈的方向上,而靜脈的方向是由圖像中的高頻信息體現(xiàn)出來,因此,許多學者基于多尺度波變換思想對灰度靜脈圖像展開了分析,其中包括傳統(tǒng)的小波變換[2]、帶有方向性信息的條帶波(Bandelet)變換[3]、輪廓波(Curvelet)變換[4]、Gabor 變換[5-7]、Gabor 變換編碼[8-9]等;除波變換思想外,一些多尺度點特征也被證明是較為有效的,如尺度不變特征變換(Scale-Invariant Feature Transform,SIFT)[10]、加速魯棒特征(Speeded Up Robust Feature,SURF)[11]、梯度直方圖特征[12-13]等;近年來,隨著處理器計算能力的大幅度提升,深度卷積神經網絡[14-16]也被更多地應用在靜脈識別中,并取得較好的識別效果;此外,一些基于灰度統(tǒng)計分布的識別算法也被驗證是十分有效的,如圖像強度分布[17]、稀疏表示[18]等。而二值靜脈圖像特征提取方式主要是針對靜脈圖像局部特征展開的,主要包括交叉點與端點位置特征[19]、特征點間結構關系[20]、二值靜脈曲線信息編碼[21-25]等,這些提取的二值靜脈特征也成為了灰度靜脈圖像的重要補充。
以上兩種思想的識別算法在某一數據集下可以取得較好的識別效果,但當更換靜脈圖像采集設備即更換數據集時,源數據集下獲得的識別算法有效性將會出現(xiàn)明顯下降。因此,本文基于遷移學習思想,提出了一種孿生非負矩陣分解(Nonnegative Matrix Factorization,NMF)模型。該模型除了考慮識別準確率外,而且還添加了遷移性約束,從而提高了識別算法對于多種靜脈圖像采集設備的普適性。實驗結果表明,本文的算法可同時在多個靜脈數據集中取得良好的識別性能。
對于圖像識別問題,通過數據降維找到一組有效的特征基是十分關鍵的,而常用的有效降維方法主要包括主成分分析法、局部保持投影法等,它們的分解結果沒有符號約束,既可以是正的,也可以是負的。但對于圖像處理問題來說,在降維獲得的基圖像中,像素值不允許出現(xiàn)負值,因此,這里選擇NMF模型去實現(xiàn)圖像特征的降維,NMF思想如式(1)所示:
其中:F表示原始特征矩陣;U與V分別表示分解后的基矩陣與系數矩陣。
與一般的圖像分類問題不同,靜脈識別是采用圖像匹配的方式進行身份認證的,屬于單樣本或少樣本學習,也就是說對于每一個靜脈對象來說,沒有足夠多的樣本供機器去學習與訓練,傳統(tǒng)的訓練學習模式難以適用。孿生網絡近年來在衡量數據相似性上表現(xiàn)出了良好的效果[26],因此,針對靜脈識別問題,這里將NMF 與孿生網絡思想相結合,提出了一種孿生非負矩陣分解模型。
該模型將從源數據集中挑選出n對靜脈圖像,其中每一對圖像表示同一對象,并將每一對圖像拆分到兩個子集中;而后,利用文獻[13]中的特征提取方法,獲取初始特征,從而形成孿生NMF模型的初始目標函數,如式(2)所示:
其中:Fk為第k個子集的初始特征矩陣,其中每一列為靜脈圖像的初始特征;Vk為分解系數矩陣,即每一列為靜脈圖像新的特征向量;U為特征基矩陣,這里兩個NMF 模型的U是相同的,U為共享特征基。所提算法的目的就在于通過模型求解,能夠獲得一組最優(yōu)的共享特征基U*,如式(3)所示。
根據模式識別理論,表示同一目標的圖像之間應具有相似的特征向量;同樣,提出的孿生NMF 模型除非負性要求以外,也應讓兩幅表示同一靜脈的圖像經過分解后,得到相似的特征向量?;谝陨戏治?,有必要在目標函數中增加一個損失函數Em,提高特征的相似性,進而保證匹配的準確性,改進的目標函數如式(4):
式(4)中α為平衡因子。
由于初始特征矩陣F1與F2所表示的圖像來源于同一數據集,使得優(yōu)化得到共享特征基U*能夠較好地適用于該源數據集,但很難保證是否能夠適用于其他數據集,即共享特征基U*缺少普適性。針對以上問題,所提的模型將遷移學習思想引入到該模型中,即通過降低源數據集與目標數據集中靜脈圖像的特征分布差異,實現(xiàn)特征從源數據集到目標數據集的遷移,這里,最大平均差異(Maximum Mean Discrepancy,MMD)[27]度量損失函數Et被添加到目標函數中,用來保證特征的遷移性,目標函數可被進一步改進為式(6):
式中:β為平衡因子;當k=3時,F(xiàn)3為目標數據集中挑選圖像的初始特征矩陣,c為挑選圖像的數目;而當k=1,2時
綜上,本文提出的識別模型結構如圖1所示。
圖1 遷移孿生NMF模型結構Fig.1 Structure of Siamese NMF mode with transferability
為方便對目標函數求解,可將目標函數做如下轉換,即增加輔助向量A與B,如式(8)、(9),Et如式(10),而目標函數可進一步轉化為式(11):
而后,分別對U、V1、V2、V3求偏導數,結果如式(12)~(15):
而后,根據文獻[28]確定變量的迭代規(guī)則,如式(16)~(19):
確定變量的迭代規(guī)則后,由算法1 獲得最優(yōu)的共享基矩陣U*。
算法1 求解共享基矩陣U*算法。
輸入:初始特征矩陣F1,F(xiàn)2,F(xiàn)3,平衡因子α與β;
輸出:最優(yōu)共享基矩陣U*。
2)按照式(16)~式(19)進行參數迭代;
3)如果|J(t+1)-J(t)|<e或t>Nmax,輸出結果;否則,進入4),J(t)=J(U(t),V1,(t),V2,(t),V3,(t));
4)t=t+1,進入2);
優(yōu)化得到共享基矩陣U*后,將對靜脈圖像進行匹配,匹配過程如算法2所示。
算法2 靜脈圖像匹配算法。
輸入:兩幅待匹配的靜脈識別圖像I1與I2。
輸出:如果d(v1,v2) >ξ,兩幅圖像表示同一靜脈;否則,表示不同靜脈。這里,ξ為相似性閾值。
1)提取兩幅靜脈圖像的初始特征向量f1與f2;
2)利用式v=(U*TU*)-1U*Tf獲得兩幅靜脈圖像特征v1與v2;
3)計算兩幅靜脈圖像特征向量的余弦距離d(v1,v2)=
為證明式(16)~(19)的迭代是收斂的,需要各自引入一個合適的輔助函數,這里輔助函數的定義如下。
定義1如果式(20)成立,則定義G(h,h′)是H(h)的輔助函數。
由于式(21)成立:
因此,如果存在合適的輔助函數,便可證明式(16)~(19)的迭代過程是收斂的。
假定目標函數J中U為獨立變量,求J對U的一階與二階偏導數,如式(23)與式(24)。
引理1如果令U為獨立變量時,式(25)可被定義為J的輔助函數。
證明 由于G(u,u)=J(u),只需證明G(u,uij)≥J(uij)。根據泰勒級數可以得到式(26):
又因為式(27)成立:
假定目標函數J中V1為獨立變量,求J對V1的一階與二階偏導數,如式(28)與式(29)。
引理2如果令V1為獨立變量時,式(30)可被定義為J的輔助函數。
證明 由于G(v,v)=J(v),只需證明根據泰勒級數可以得到式(31):
又因為式(32)成立:
此外,容易得到引理2同樣適用于V2為獨立變量的情況,因此,式(18)的收斂性證明略。
假定目標函數J中V3為獨立變量,求J對V3的一階與二階偏導數,如式(33)與式(34)。
引理3如果令V3為獨立變量時,式(35)可被定義為J的輔助函數。
證明 根據泰勒級數可以得到式(36):
又因為式(37)成立:
綜上,可以證明式(16)~(19)的迭代過程是收斂的。
本實驗選取了4 個靜脈圖像數據集,分別為:1)數據集D1,自建手背靜脈數據集,數據集下載地址為https://pan.baidu.com/s/1jIGLSEy;2)數據集D2,文獻[29]中采用的手背靜脈圖像數據集;3)數據集D3,指靜脈數據集,數據集下載地址為http://more.datatang.com/data/44299;4)數據集D4,文獻[30]中指靜脈數據集。所有數據集共包含475 個靜脈對象,其中,每個數據集中的樣本如圖2所示。
圖2 不同數據集中樣本Fig.2 Samples in different datasets
該實驗是在PC 上運行的,配置如下:處理器Intel Core i5-4460 CPU 3.2 GHz,內存16 GB,運行環(huán)境Matlab 2017b。
本文的模型參數設定方式可分為兩種,分別為依據經驗設定與基于實驗結果設定。
1)在提出的模型中,將依據經驗設定以下參數,手背靜脈圖像歸一化為128× 128;指靜脈圖像歸一化為128× 64;誤差閾值e=0.1;最大迭代次數Nmax=30 000;源數據集選擇樣本數量n=300,目標數據集選擇樣本數量c=30。
2)除經驗參數外,分解后的特征維度r,目標函數平衡因子α與β將通過實驗獲得,即通過不同參數組合下的實驗結果比較,獲得能夠使識別性能達到最優(yōu)的參數組合。這里,識別性能將由源數據集的錯誤接受率(False Accept Rate,F(xiàn)AR)與錯誤拒絕率(False Reject Rate,F(xiàn)RR)來衡量,其中FAR 為實驗中表示不同靜脈對象的圖像被誤認為是同一靜脈對象的概率,而FRR 為表示同一靜脈對象的圖像被誤認為是不同靜脈對象的概率。而在本文實驗中,衡量識別性能的函數將由式(38)表示:
其中:Fk=的標簽。
而后,分別給出不同參數的取值范圍,令α∈{0.1,0.5,1,5,10},={0.2,0.3,…,0.7},由于目標函數中Em表示n對靜脈圖像特征的差異,而Et表示平均特征的差異,因此取β=nα是合理的。這里,不同參數組合下的識別算法性能比較結果如圖3所示。
圖3 不同參數組合下的識別性能Fig.3 Recognition performances under different parameter combinations
由圖3 可以看出,當維度降至初始特征維度的40%,且α=1 時,本文的模型可獲得最優(yōu)的識別性能。這里,算法2中的相似性閾值ξ同樣是依據式(38)優(yōu)化得到,即通過不斷調整閾值,獲得能夠使式(38)得到最小值,而不同閾值條件下的識別性能結果如圖4所示。
圖4 不同閾值下的識別性能Fig.4 Recognition performances under different thresholds
由圖4可以看出,當閾值ξ=0.873時,可以得到最優(yōu)的識別性能。
確定了模型參數后,這里將對算法的遷移性進行分析,即通過對比包含遷移約束的模型與不包含遷移約束的模型之間的特征分布,來驗證提出的模型中遷移性約束項的必要性,結果如圖5所示。
圖5 中,數據集1 與數據集3 為源域,數據集2 與數據集4為目標域,圖中每一點分別表示NMF 降維后的特征經過主成分分析后,選取的前兩項主成分特征。由圖5 可以看出,當模型包含遷移項約束后,源域與目標域的特征分布是非常相似的,即驗證了模型中遷移性約束項的必要性。
圖5 遷移約束項對特征分布的影響Fig.5 Influence of transfer constraint on feature distribution
驗證了遷移約束項的有效性后,將提出的識別算法分別與文獻[8,13,15-16]中的識別算法進行比較。首先,令訓練數據與測試數據來源于同一數據集,仍采用FRR 與FAR 作為衡量識別算法性能的指標,算法比較結果如表1 所示,表中數據為針對4個數據集實驗的平均結果。
表1 樣本來自同一數據集時的實驗結果比較Tab.1 Comparison of experimental results when the samples come from the same dataset
算法識別準確性對比之后,將對算法的遷移性能進行比較,即訓練與測試數據來源于不同數據集,結果如表2 所示。表2中,D1 →D2表示D1為訓練數據集,D2為測試數據集。
表2 樣本來自不同數據集時的實驗結果比較Tab.2 Comparison of experimental results when the samples come from different datasets
由表1~2 可以看出,當訓練數據與測試數據來源于同一數據集時,這些算法都可以取得較好的識別效果,F(xiàn)AR與FRR基本可以控制在0.05 以下;然而,當訓練數據與測試數據來源于不同數據集時,已有算法的識別性能出現(xiàn)了較大幅度的下降,而本文提出的算法在訓練時有少量目標數據集中的無標注樣本參與,通過MMD約束減小了數據集之間的特征分布差異,算法對于目標數據集仍具有較好的識別效果,可以看出,本文的算法較好地將源數據集中的知識遷移到了目標數據集中,使得本文的算法獲得的特征更具普適性。本文提出的識別算法運行時間0.56 s,能夠較好地滿足識別的實時性要求。
本文提出的基于孿生NMF 的識別算法同時考慮了誤差損失、分類損失與遷移損失,獲得了具有普適性的靜脈特征,不僅使識別算法能夠針對某一數據集取得較高的準確識別率,而且可以通過目標數據集中的少量樣本,讓源數據集中的特征同樣適用于目標數據集,即模型具有較好的遷移特性,對于其他圖像匹配問題具有一定的借鑒價值。本文研究仍存在一定問題有待解決,如數據集樣本數量有待增加,從而才能更好地驗證算法的有效性。