何振紅
(甘肅民族師范學(xué)院計算機(jī)科學(xué)系,甘肅 合作 747000)
基于特征加權(quán)FDCT和模糊最小二乘支持向量機(jī)的虹膜識別算法
何振紅
(甘肅民族師范學(xué)院計算機(jī)科學(xué)系,甘肅 合作 747000)
為了克服小波變換在二維空間分析的缺陷,提出了基于快速離散曲波(Curvelet)變換的虹膜識別改進(jìn)算法。利用能有效捕捉圖像邊緣信息的Curvelet變換對虹膜圖像進(jìn)行分解,提取低頻子帶系數(shù)矩陣的均值方差和高頻子帶能量,然后根據(jù)不同子帶特征的分類能力不同,對各子帶特征的離散度進(jìn)行加權(quán),為分類能力較強(qiáng)的特征向量賦予較大權(quán)值,構(gòu)成虹膜圖像的特征向量。利用最優(yōu)二叉樹多類模糊最小二乘支持向量機(jī)分類器進(jìn)行分類與識別。仿真實驗結(jié)果表明,該算法具有較高的識別性能,具有可行性。
虹膜識別;特征加權(quán);快速離散曲波變換;模糊最小二乘支持向量機(jī);最優(yōu)二叉樹
虹膜紋理以其唯一性、高穩(wěn)定性、高可靠性和低錯誤率的特點,已成為生物特征識別中極具發(fā)展?jié)摿Φ纳矸葑R別技術(shù),具有重要的研究價值和應(yīng)用意義,被廣泛應(yīng)用于金融、企事業(yè)、公共安全等領(lǐng)域,成為生物識別領(lǐng)域中研究的熱點之一。
虹膜識別包括圖像采集、定位、特征提取和分類識別4個部分。其中特征提取是虹膜識別的關(guān)鍵環(huán)節(jié),決定了識別系統(tǒng)的性能。目前常用的虹膜特征提取方法有:Daugman[1]利用2D-Gabor濾波器的局部方向性提取虹膜紋理圖像的相位信息作為虹膜特征編碼;Wildes[2]利用 Laplacian金字塔濾波器分解提取虹膜特征;Boles[3]采用小波過零檢測選取特定小波子帶過零點間的小波變換積分均值構(gòu)建虹膜特征;Lim[4]等人使用2D-Haar小波的多尺度分解建立特征模板;Huang[5]等人利用二維不可分小波變換,結(jié)合 Gauss-MRF提取具有旋轉(zhuǎn)不變性虹膜紋理特征;Babu[6]等人將離散Wavelet變換與ICA相結(jié)合提取虹膜特征;Tsai[7]等人利用Log-Gabor小波局部頻率性編碼虹膜紋理作為虹膜特征等。以上方法對虹膜識別技術(shù)的發(fā)展產(chǎn)生了積極推動作用。
雖然采用小波變換進(jìn)行虹膜特征提取,取得了良好的效果。但是小波變換也存在缺陷性,小波變換反映點奇異性,在表示線奇異的二維圖像時,不具有空間各向異性的要求,不能有效捕捉虹膜圖像的邊緣信息,從而影響虹膜識別的準(zhǔn)確性。Curvelet(曲波)變換克服了小波這一局限性,除了具有小波變換多尺度特性之外,還具有多方向性和各向異性,對圖像邊緣特征的表達(dá)更優(yōu)于小波變換。羅忠亮等[8]利用Curvelet變換提取虹膜特征取得了較好的識別效果。
本文提出了一種基于快速離散曲波變換 (fast discrete Curvelet transform,F(xiàn)DCT)的虹膜識別改進(jìn)算法。利用能有效捕捉圖像邊緣信息的Curvelet變換對虹膜圖像進(jìn)行分解,提取低頻子帶系數(shù)矩陣均值方差和高頻子帶能量,根據(jù)不同子帶特征的分類能力不同,對各子帶特征的離散度進(jìn)行加權(quán),為分類能力較強(qiáng)的特征量賦予較大權(quán)值,構(gòu)成虹膜圖像的特征向量。利用最優(yōu)二叉樹多類模糊LS-SVM(最小二乘支持向量機(jī))分類器實現(xiàn)對特征向量的有效分類。仿真實驗結(jié)果表明,該算法識別準(zhǔn)確率較高,能有效應(yīng)用于身份認(rèn)證系統(tǒng)中。
Curvelet變換作為一種多尺度幾何分析的新方法,兼顧尺度、角度和位移信息,能構(gòu)建最優(yōu)逼近意義下的高維特征函數(shù)表示,從而成為圖像處理領(lǐng)域新的研究熱點。為了更好地體現(xiàn)Curvelet變換的優(yōu)良特性,提升其在信號處理、統(tǒng)計估計等多領(lǐng)域的應(yīng)用潛力,Candès和 Donoho于2005年提出了快速離散Curvelet變換理論的實現(xiàn)方法。
設(shè)x為空間域參量,r和θ分別為頻域極坐標(biāo)的半徑和角度。在空間L2(R)中存在平滑非負(fù)實數(shù)的徑向窗函數(shù)W(r)和角窗函數(shù) V(t),滿足可容許條件[9]:
對任意一個j≥j0,傅里葉頻域的頻率窗Uj定義如下:
于是,頻域中尺度為 2-j、旋轉(zhuǎn)角度為 θl、位移為的連續(xù)Curvelet變換定義為:
在圖像處理中連續(xù)Curvelet變換不能直接使用,需將其離散化。實現(xiàn)過程如下[10]。
(1)在給定笛卡爾坐標(biāo)下對圖像進(jìn)行二維Fourier變換,得到二維頻率函數(shù)為矩陣行數(shù)。
(2)頻域中對每一對尺度角度(j,l)組合重采樣,得到新的 采 樣 函 數(shù),計算 fj,l[n1,n2]=
(3)對每一個 fj,l進(jìn)行二維的逆 Fourier 變換,得到離散Curvelet 系數(shù) cD(j,l,k):
其中,Pj={(n1,n2)|n1,0≤n1<n1,0+L1,j,n2,0≤n2<n2,0+L2,j},L1,j與 L2,j分別表示Uj(n1,n2)的支撐區(qū)間長寬分量,且L1,j≈2j,L2,j≈2j/2。
對于二分類問題,Suykens和Vandewalle提出的LS-SVM,采用最小二乘線性系統(tǒng)作為損失函數(shù),利用核函數(shù)將數(shù)據(jù)由輸入空間映射到線性高維的特征空間,使原樣本空間中的線性不可分問題轉(zhuǎn)化為高維特征空間的線性可分問題。把SVM中不等式約束條件轉(zhuǎn)換成等式約束,使支持向量機(jī)的求解由二次規(guī)劃問題轉(zhuǎn)化為低階的對稱正定線性方程組問題,降低了求解復(fù)雜性,提高了求解效率[11]。但在虹膜圖像的分類識別過程中,如果訓(xùn)練樣本中含有噪聲點等“異?!毙畔?,LS-SVM分類過程就容易出現(xiàn)過學(xué)習(xí)或者欠學(xué)習(xí)現(xiàn)象,因而不能獲取真正最優(yōu)分類面。針對此情況,許亮[12]在最小二乘支持向量機(jī)的基礎(chǔ)上,通過引入模糊集理論,依據(jù)不同的訓(xùn)練樣本在分類中對LS-SVM的貢獻(xiàn)不同,賦予不同的模糊隸屬度τi,削弱噪聲點對分類產(chǎn)生的不利影響,以實現(xiàn)噪聲等異常信息與有效樣本區(qū)分開。
其中,||xi-xc||表示訓(xùn)練樣本點間的歐式距離,xc表示類中心,ε表示極小正數(shù),且0<σ<ε。當(dāng)訓(xùn)練樣本點為異常數(shù)據(jù)時,賦予其隸屬度,這樣確保所有正常樣本全部映射到[ε,1]。
假設(shè)訓(xùn)練樣本集T由n個獨立同分布樣本點組成:T={(xi,yi)|xi∈Rn,yi∈{-1,1}}。根據(jù)結(jié)構(gòu)風(fēng)險最小化原理,求解模糊LS-SVM最優(yōu)分類面可歸結(jié)為如下二次規(guī)劃:
其中,w為權(quán)向量,γ為正則化因子且γ>0,ζi為松弛變量且 ζi>0,φ(xi)表示由輸入空間到高維特征空間的非線性映射,δ為偏差量。
引入拉格朗日函數(shù):
根據(jù)KKT條件同解變換消去變量w和ζi,結(jié)合Mercer理論,得到矩陣形式:
其 中 ,Y=[y1,…,yn]T,ζ=[ζ1,…,ζn]T,a=[a1,…,an]T,I=[1,…,1]T,Ψij=yiyjK(xi,xj)。
于是,模糊LS-SVM分類決策函數(shù)為:
虹膜圖像預(yù)處理包括圖像灰度化、虹膜定位、歸一化和圖像增強(qiáng)。圖像灰度化的目的是降低圖像維數(shù),剔除圖像的冗余信息,虹膜定位在虹膜圖像中確定虹膜內(nèi)外邊緣所在圓周的圓心和半徑,以準(zhǔn)確分割虹膜區(qū)域。歸一化是采用極坐標(biāo)形式將環(huán)型虹膜圖像展開成固定尺度的矩形圖像,以實現(xiàn)虹膜圖像平移不變性及瞳孔縮放不變性。為了提高識別的效果,采用局部動態(tài)的直方圖均衡化來獲得虹膜圖像的增強(qiáng)效果。整個虹膜的預(yù)處理過程如圖1所示。
在圖像識別中,特征提取的目的是從圖像中獲取有助于分類識別的特征向量。Curvelet作為多尺度幾何分析新方法,兼顧尺度、角度和位移信息,能構(gòu)建最優(yōu)逼近意義下的高維特征函數(shù)表示,從而成為圖像處理領(lǐng)域新的研究熱點。根據(jù)FDCT結(jié)果,提取低頻子帶系數(shù)矩陣的均值方差和高頻子帶能量,然后根據(jù)不同子帶特征的分類能力不同,對各子帶特征的離散度進(jìn)行加權(quán),為分類能力較強(qiáng)的特征向量賦予較大權(quán)值,構(gòu)成虹膜圖像的特征向量。
(1)低頻子帶系數(shù)矩陣的均值方差
Curvelet分解的低頻子帶含有虹膜圖像的基本信息,是對虹膜圖像的平滑逼近。其均值和方差表征了虹膜圖像整體特征,決定了分類準(zhǔn)確性。
(2)高頻子帶能量
Curvelet分解的高頻子帶的能量反映虹膜的斑點、收縮褶、細(xì)絲等紋理特征在不同方向、不同尺度的分布情況,刻畫了虹膜圖像的邊緣特征,是最具識別性的特征之一。
其中,c(k1+i,k2+j)為對應(yīng)圖像在第 i層 j方向子帶的系數(shù)矩陣,m×n為低頻子帶系數(shù)矩陣的大小,mij×nij為第 i層j方向的高頻子帶系數(shù)矩陣的大小,σij為對應(yīng)層子帶的方差。
圖1 虹膜圖像預(yù)處理
(3)特征加權(quán)
對虹膜圖像進(jìn)行FDCT獲取的是虹膜圖像局部特征,針對圖像不同子帶系數(shù)矩陣分類能力不同,對各子帶系數(shù)矩陣離散度進(jìn)行加權(quán),為分類能力較強(qiáng)的特征向量賦予較大權(quán)值,分類能力較弱的特征向量賦予較小權(quán)值。通過特征加權(quán),使利用FDCT提取的不同子帶信息重要性反映到虹膜圖像最終特征向量中。
由于經(jīng)FDCT分解后,各子帶系數(shù)的概率分布服從廣義高斯分布(generalized Gaussian distribution,GGD)模型,因而可以利用零均值GGD描述FDCT系數(shù)概率分布,用極大似然準(zhǔn)則估計法估算GGD的尺度參數(shù)和形狀參數(shù)。
構(gòu)造δ函數(shù):
利用特征加權(quán)FDCT提取虹膜的特征向量后,選擇合適的分類算法進(jìn)行分類識別至關(guān)重要。目前采用支持向量機(jī)對特征向量進(jìn)行分類識別較為普遍。SVM通過使用核函數(shù)將輸入數(shù)據(jù)信息映射到高維的特征空間,使非線性模式轉(zhuǎn)化為線性可分模式,較好地解決了高維非線性小樣本模式識別和函數(shù)估計等實際問題。當(dāng)SVM的訓(xùn)練復(fù)雜度高、樣本數(shù)據(jù)量大時,求解二次規(guī)劃問題就越復(fù)雜。針對上述不足,采用模糊LS-SVM把SVM的訓(xùn)練轉(zhuǎn)化為線性方程組的求解,在一定程度上加速了SVM的訓(xùn)練。
目前應(yīng)用較多的多類分類算法有一對一模糊LS-SVM和一對多模糊LS-SVM算法,但這些算法在測試樣本數(shù)和類別數(shù)較多時,算法時間復(fù)雜度較大。為此,本文利用聚類類距離為二叉樹生成依據(jù),提出了最優(yōu)二叉樹多類模糊LS-SVM分類算法。
設(shè)虹膜圖像訓(xùn)練樣本集T={(xi,yi)|xi∈Rn,yi=±1,i=1,2,…,n},M為類別數(shù)。則第m類樣本子集的均值表示為
步驟1 依據(jù)給定M類訓(xùn)練樣本構(gòu)造M棵二叉樹集合BT={T1,T2,…,TM},每棵二叉樹 Ti(i=1,2,…,M)帶有一個權(quán)值為?i的根節(jié)點,它的左、右子樹均為空。其中,?ij=min{||Ti-Tj||2},i,j=1,2,…,M 且 i≠j。
步驟2 在BT中選取兩棵最小權(quán)值根節(jié)點的二叉樹(Ti和Tj)為左、右子樹構(gòu)造一棵新的二叉樹TNew_i,其左子樹根節(jié)點對應(yīng)樣本為正類,右子樹根節(jié)點對應(yīng)樣本為負(fù)類,訓(xùn)練模糊LS-SVM,同時新生成的二叉樹根節(jié)點的權(quán)值為其左、右節(jié)點的權(quán)值之和。
步驟3 在BT中刪除Ti和Tj,同時將TNew_i加入BT中。
步驟4 重復(fù)步驟2和步驟3,直到BT中只有一棵樹,此時所生成的二叉樹即所求。
對測試樣本從根節(jié)點出發(fā),依次經(jīng)若干個兩類模糊LS-SVM分類器到達(dá)某一葉節(jié)點,則該節(jié)點對應(yīng)的類即該測試樣本的類別。
為了驗證本文算法的性能,實驗在Intel Core2 Duo CPU E7600,3.06 GHz,3.0 GB 內(nèi)存,MATLAB 7.1 編程環(huán)境的PC上進(jìn)行,采用中國科學(xué)院自動化研究所模式識別國家重點實驗室虹膜圖像數(shù)據(jù)庫 CASIA(V2)中的虹膜樣本進(jìn)行測試。CASIA包括了40個人的虹膜圖像,每人10幅,共400幅虹膜圖像標(biāo)本,分辨率為 640 dpi×480 dpi。實驗選取各類虹膜前7幅圖像為訓(xùn)練樣本,后3幅虹膜圖像為測試樣本。在特征提取階段,將訓(xùn)練樣本和測試樣本采用特征加權(quán)FDCT進(jìn)行分解,獲得Curvelet變換系數(shù)。每幅虹膜圖像分別選取 16、64、256、1 024、4 096 個系數(shù),做 5 組實驗。通過錯誤接受率(FAR)、錯誤拒絕率(FRR)和正確識別率(CRR)3個指標(biāo)進(jìn)行比較,實驗結(jié)果見表1。
表1 性能比較
特征加權(quán)FDCT算法訓(xùn)練虹膜樣本圖像,其編碼長度由Curvelet變換系數(shù)個數(shù)決定。系數(shù)數(shù)目將直接影響識別算法性能,系數(shù)數(shù)目過少或過多都會增大等錯率(EER)。系數(shù)數(shù)目過少,提取預(yù)處理后的虹膜圖像序列會丟失太多虹膜圖像紋理信息;系數(shù)數(shù)目過多,提取預(yù)處理后的虹膜圖像序列會包含大量噪音信號。實驗結(jié)果表明,Curvelet變換系數(shù)數(shù)目為1 024個時,可獲得最佳識別效果。
選取徑向基核函數(shù) K=(xi,xj)=exp(-||xi-xj||2/2α2)作為模糊LS-SVM的核函數(shù),采用雙線性法對280幅訓(xùn)練樣本圖像進(jìn)行實驗。正則化參數(shù)γ和徑向基寬度α對識別準(zhǔn)確率有較大影響,如圖2所示。γ過大或α2過小都會導(dǎo)致過擬合現(xiàn)象。當(dāng) γ=10,α2=0.9 時,取得了較低等錯率(0.81%)。
圖2 EER與γ、α2的分布曲線
為了進(jìn)一步驗證本文算法的效果和性能,將該算法與基于小波變換的虹膜識別算法進(jìn)行對比實驗。實驗采用識別準(zhǔn)確率較高且變換速度較快的Gabor小波和Haar小波,對虹膜圖像進(jìn)行3層分解,提取虹膜紋理特征,分別采用海明距離(Hamming distance,HD)、SVM、最優(yōu)二叉樹多類模糊LS-SVM進(jìn)行分類識別,實驗結(jié)果見表2。
通過對表2實驗結(jié)果的分析可知,基于特征加權(quán)FDCT和模糊最小二乘支持向量機(jī)的虹膜識別算法的性能優(yōu)于采用小波變換的虹膜識別算法,識別結(jié)果相對于小波算法的識別準(zhǔn)確率略有提高,最佳識別率可達(dá)98.72%,而Gabor小波和Haar小波算法最佳識別率分別為96.22%、94.63%。實驗驗證,基于特征加權(quán)FDCT的虹膜識別算法具有較好穩(wěn)定性和較強(qiáng)頑健性。
為了更好地評價算法的優(yōu)劣,采用ROC曲線進(jìn)行比較。ROC曲線越接近坐標(biāo)軸,說明匹配性能越好。對CASIA(V2)虹膜數(shù)據(jù)庫圖像采用Gabor小波、Haar小波、特征加權(quán)FDCT的ROC曲線如圖3所示。從圖3可知,與Gabor小波和Haar小波的虹膜圖像紋理特征提取算法相比,在同一相似度度量的情況下,本文提出的基于特征加權(quán)FDCT的特征提取算法,在相同錯誤接受率下,錯誤拒絕率更小,這表示虹膜識別性能得到提高。這是因為特征加權(quán)FDCT在提取虹膜紋理特征尺度信息的同時,也提取其角度和位移信息,細(xì)化了虹膜紋理信息的表達(dá)。因此,本文提出的算法,提取虹膜紋理特征性能更好,識別準(zhǔn)確率更高。
表2 算法性能對比
快速離散Curvelet變換具有緊支撐框架結(jié)構(gòu),可實現(xiàn)對二維圖像線奇異的“最優(yōu)”稀疏表示,其非線性逼近誤差可達(dá)到o在提取虹膜圖像紋理特征的算法中,基于特征加權(quán)FDCT能有效捕捉虹膜圖像的邊緣信息,從而提高了虹膜識別的準(zhǔn)確性。本文研究工作還有可改進(jìn)的地方,下一步將繼續(xù)完善相關(guān)算法,將小波變換和曲波變換的優(yōu)點相結(jié)合,提取虹膜圖像的紋理特征,采用多類分類器融合算法進(jìn)行分類識別,以期待獲得更高的識別效果。
圖3 ROC曲線
[1]DAUGMAN J.The importance of being random:statistical principles of iris recognition[J].Pattern Recognition,2003,36(2):279-291.
[2]WILDES R P.Iris recognition: an emerging biometric technology[J].Proceedings of the IEEE,1997,85(9):1348-1363.
[3]BOLES W W.Security system based on human iris identification using wavelet transform [J]. Engineering Applications of Artificial Intelligence,1998,11(l):77-85.
[4]LIM S Y,LEE K,BYEON O,et al.Efficient iris recognition through improvement of feature vector and classifier [J].Journal of Electronics and Telecommunication Research Institute,2001,23(2):61-70.
[5]HUANG J,YOU X G,YUAN Y,et al.Rotation invariant iris feature extraction using Gaussian Markov random fields with non-separable wavelet [J].Neuro Computing,2010,73 (4-6):883-894.
[6]BABU N T N,VAIDEHI V.Fuzzy based iris recognition system(FIRS)for person identification[C]//International Conference on Recent Trends in Information Technology,June 3-5,2011,Chennai,India.New Jersey:IEEE Press, 2011:1005-1011.
[7]TSAI C C,LIN H Y,TAUR J,et al.Iris recognition using possibilistic fuzzy matching on localfeatures [J].IEEE Transactions on Systems,Man and Cybernetics,2012,42 (1):150-162.
[8]羅忠亮,段琢華.基于 Curvelet變換的虹膜識別[J].武漢理工大學(xué)學(xué)報,2012,34(8):160-164.LUO Z L,DUAN Z H.Iris recognition based on the second generation Curvelet transform[J].Journal of Wuhan University of Technology,2012,34(8):160-164.
[9]STARCK J L,MURTAGH F,CANDES E J,et al.Gray and color image contrast enhancement by the Curvelet transform[J].IEEE Transactions on Image Processing,2003,12(6):706-717.
[10]CANDèS E J,DEMANET L,DONOHO D L,et al.Fast discrete Curvelet transforms[J].Multiscale Modeling&Simulation,2006,5(3):861-899.
[11]SUYKENS J A K,VANDEWALLE J.Least squares support vector machine classifiers[J].Neural Processing Letter,1999,9(3):293-300.
[12]許亮.改進(jìn)的模糊最小二乘支持向量機(jī)模型[J].計算機(jī)工程,2009,35(14):236-240.XU L.Improved fuzzy least squares support vector machines model[J].Computer Engineering,2009,35(14):236-240.
Iris recognition algorithm based on feature weighting fast discrete Curvelet transform and fuzzy LS-SVM
HE Zhenhong
Department of Computer Science,Gansu Normal University for Nationalities,Hezuo 747000,China
In order to overcome the weakness of wavelet transform in two dimensional spatial analysis,an improved algorithm based on fast discrete Curvelet transform for iris recognition was proposed.Curvelet transform which can effectively capture the image edge information was introduced to decompose iris image.Mean and variance of low frequency sub-band coefficients and the energy of high frequency sub-band were extracted.Then the feature vectors were weighted according to the difference of classification ability of sub-band feature.Fuzzy least square support vector machine with optimal binary tree was developed to implement classification and recognition.The simulation results show that the proposed algorithm has higher recognition performance than the present method.
iris recognition,feature weighting,fast discrete Curvelet transform,fuzzy least square support vector machine,optimal binary tree
TP391
A
10.11959/j.issn.1000-0801.2016058
2015-09-27;
2016-01-08
何振紅(1979-),女,甘肅民族師范學(xué)院計算機(jī)科學(xué)系講師,主要研究方向為圖像處理、模式識別。