李 偉,孫云娟
(1.河南師范大學(xué) 電子與電氣工程學(xué)院,河南 新鄉(xiāng) 453007;2.河南師范大學(xué) 新聯(lián)學(xué)院,河南 新鄉(xiāng) 453007)
基于變換域特征提取和模擬退火法特征選擇的人臉識別
李 偉1,孫云娟2
(1.河南師范大學(xué) 電子與電氣工程學(xué)院,河南 新鄉(xiāng) 453007;2.河南師范大學(xué) 新聯(lián)學(xué)院,河南 新鄉(xiāng) 453007)
為了提高人臉識別系統(tǒng)的性能,提出DWT雙邊子帶頻域特征提取和模擬退火優(yōu)化算法的特征選擇。首先,運(yùn)用DWT、DFT和DCT組合變換,用于人臉圖像表情、姿態(tài)、平移和光照不變特征的有效特征提取。人臉圖像DWT變換后,選擇近似系數(shù)分量和水平系數(shù)分量[CA CH]為小波特征,經(jīng)DFT變換后,利用四橢圓模板取出DFT低頻高幅值系數(shù),經(jīng)DCT壓縮得到人臉圖像的特征系數(shù)。其次,利用模擬退火優(yōu)化算法進(jìn)行特征選擇,在特征系數(shù)空間搜索特征子集進(jìn)行人臉識別。實(shí)驗(yàn)仿真說明了該方法的有效性。
人臉識別;特征選擇;模擬退火優(yōu)化算法;頻域特征提取
人臉識別作為模式識別的一個重要分支,在實(shí)際中具有廣泛的應(yīng)用,如:智能人機(jī)接口、可視電話系統(tǒng)和保安系統(tǒng)等。文獻(xiàn)[1]中人臉的特征是利用PCA主值特征和LAC本地相關(guān)系數(shù)的特征;文獻(xiàn)[2]中人臉的特征是利用PCA主值特征和DCT變換系數(shù)的特征;文獻(xiàn)[3-4]中人臉的特征是采用Gabor窗函數(shù)提取的特征;文獻(xiàn)[5-7]中的特征是采用小波特征;文獻(xiàn)[6,8]中人臉識別算法是采用RBF、SVM神經(jīng)網(wǎng)絡(luò)進(jìn)行識別;文獻(xiàn)[9]中采用PSO粒子群優(yōu)化算法選取特征歐氏距判別的方法。本文中提出的人臉識別算法包括兩部分:變換域系數(shù)的特征提取和基于模擬退火優(yōu)化算法的特征選擇,最后通過歐氏距判別器進(jìn)行判別。
1.1 變頻域算法(離散小波變換DWT、DFT和DCT)的系數(shù)特征
DWT的優(yōu)點(diǎn)是通過改變時頻窗口可以對信號進(jìn)行多分辨分析,用它表示圖像非常有效。一幅人臉圖像通過DWT可以分解成4個子帶分量:[CA]、[CH]、[CV]和[CD],其分別表示為近似分量、水平分量、垂直分量和對角分量。[CA]分量保持原有人臉圖像最基本的信息,屬于低頻分量,其他分量為高頻分量。[CA]分量和高頻分量相結(jié)合才能體現(xiàn)出原始圖像的特征。對于人臉分析,不同光照的同一人臉圖像DWT變換后,[CA]分量相差一常數(shù),高頻分量相同,但DWT一個典型的缺點(diǎn)是圖像的平移特性,即人臉圖像在圖像空間的移動,平移的圖像和原始圖像小波系數(shù)是不同的,但是其DFT系數(shù)幅值相同,僅僅引入了相移:
DFT[f(x,y)]=F(u,v),
(1)
(2)
離散傅里葉變換DFT是進(jìn)行信號頻率分析強(qiáng)有力的工具,在分析圖像時具有兩個最基本特性:頻譜的對稱性和圖像平移的不變性。由于頻譜系數(shù)幅值的對稱性使得其系數(shù)具有一半的自由度,在選擇特征系數(shù)時可以減去一半,大大減少了計算時間。為了體現(xiàn)DFT系數(shù)低頻高幅值的特征,通常將DFT系數(shù)進(jìn)行居中處理,這也恰恰體現(xiàn)出DFT系數(shù)的周期特性。DFT具有很強(qiáng)的壓縮能力,選擇適當(dāng)?shù)拈撝?,DFT系數(shù)大大減少。
離散余弦變換DCT是進(jìn)行信號頻率分析又一個強(qiáng)有力的工具,它的典型特征是具有很強(qiáng)的信息堆棧能力,其壓縮能力優(yōu)于DFT,在實(shí)際當(dāng)中它和DCT通常聯(lián)合使用,因此DFT-DCT性能更好。由于DFT系數(shù)動態(tài)范圍大,而DCT動態(tài)范圍小,DFT-DCT聯(lián)合使用使得后級人臉判別電路性能提高,從而增加人臉系統(tǒng)的性能,因此在實(shí)際中而不用DCT-DFT,而采用DFT-DCT[10]。
1.2 四橢圓模板
為了屏蔽DFT系數(shù),提高計算效率,采用四橢圓模板屏蔽系數(shù)。該模板由4個相互交疊的橢圓組成,假設(shè)原點(diǎn)為(0,0),長軸為a、短軸為b,橢圓方程(水平方向和垂直方向)為式(3)。設(shè)參數(shù)為t,參數(shù)方程為式(4),左右旋轉(zhuǎn)45°的橢圓參數(shù)方程為式(5)。
(3)
(4)
(5)
1.3 模擬退火(SA)優(yōu)化算法
模擬退火算法是高維空間復(fù)雜系統(tǒng)隨機(jī)搜索的一種尋優(yōu)算法,該算法的命名來源于物理化學(xué)中的退火過程,退火過程是從高溫開始,慢慢冷卻到低溫度并且保持熱平衡。該算法的基礎(chǔ)為Metropolis算法,下降溫度T為調(diào)節(jié)參數(shù),滿足迭代公式:Tk=cTk-1,c為常數(shù),一般取范圍為0.800≤c≤0.999,k=1,2,3,...。該算法與傳統(tǒng)的迭代優(yōu)化算法相比較,存在兩個優(yōu)點(diǎn):算法不會陷入局部最小值,并且模擬退火是自適應(yīng)的。模擬退火算法特別適用于求解組合優(yōu)化問題。組合優(yōu)化的目標(biāo)是針對有很多可能解的有限離散系統(tǒng),最小化它的目標(biāo)函數(shù)[11,12]。其基本步驟如下:
1) 初始化溫度為一個高值,并且給出其目標(biāo)函數(shù)的一個初始解;
2)計算當(dāng)前狀態(tài)A的能量EA;
3)擾動轉(zhuǎn)入另一狀態(tài)B,并計算該狀態(tài)的能量EB;
4)若EB 5)降低溫度,重復(fù)程序。 1.4 歐氏距離分類器 (6) (7) 在分析人臉圖像時,首先將該人臉圖像進(jìn)行DWT變換,分解出4個子帶分量,且具有低頻分量高幅值和高頻分量低幅值的特征。近似系數(shù)[CA]分量具有原始圖像的基本系數(shù)特征,眼睛、嘴巴、耳朵等位置處[CA]系數(shù)幅值比較低,而在高頻分量中,幅值較高,為了分析問題方便通常取小波特征系數(shù)[CA][CH]分量。對于不同光照的同一人臉圖像,DWT變換后高頻特征相同,這體現(xiàn)出了DWT變換的優(yōu)點(diǎn),而近似系數(shù)卻相差一常量。由于DFT變換可以克服DWT圖像平移的弱點(diǎn),直接將小波系數(shù)[CA][CH]進(jìn)行DFT變換,得到DFT頻譜特征系數(shù)。如果將原始圖像直接進(jìn)行DFT變換,得到的頻譜系數(shù)矩陣遠(yuǎn)遠(yuǎn)大于[CA][CH]進(jìn)行DFT變換得到的頻譜系數(shù)矩陣,這大大增加了數(shù)據(jù)處理速度和存儲空間。由于DFT系數(shù)的特點(diǎn),將其進(jìn)行居中處理后,體現(xiàn)出其低頻高幅值系數(shù)的特點(diǎn)。且DFT系數(shù)幅值的對稱性,通常拋棄一半系數(shù)進(jìn)行分析處理。一般情況下可以選用橢圓型模板和三角形模板來屏蔽DFT系數(shù),本文中選用四橢圓模板。經(jīng)過模板處理后,保留了模板處的系數(shù),刪除其他系數(shù),達(dá)到數(shù)據(jù)壓縮的目的。 DCT具有很強(qiáng)的信息堆棧和壓縮能力。將模板處理后的DFT特征系數(shù)重新禎裝成一個二維系數(shù)矩陣,進(jìn)行DCT壓縮,壓縮后解除DFT系數(shù)頻域的相關(guān)特性。選擇適當(dāng)?shù)拈撝?,進(jìn)行壓縮處理,生成DCT系數(shù)矩陣。人臉圖像變換域系數(shù)特征提取過程如圖1所示。 最后一級判別電路可由歐氏距離判別器構(gòu)成。通過歐氏判別器識別不同人臉、不同人臉表情、不同人臉姿態(tài)、不同光照、不同平移的人臉圖像。 圖1 人臉圖像變換域系數(shù)特征提取過程 圖2 模擬退火優(yōu)化算法選擇DCT系數(shù)矩陣列向量示意圖 現(xiàn)將所提出的方法歸納成如下步驟: Step1: 將人臉圖像進(jìn)行DWT變換,取出特征系數(shù)分量[CA CH]; Step2: 將[CA CH]進(jìn)行DFT變換,選擇四橢圓模板,取出DFT特征系數(shù); Step3:將DFT系數(shù)轉(zhuǎn)化為二維矩陣,進(jìn)行DCT壓縮,取出DCT特征系數(shù); Step4:利用模擬退火優(yōu)化算法選擇DCT系數(shù)矩陣列向量,構(gòu)成新的DCT矩陣; Step5:利用歐氏距判別電路識別人臉。 本實(shí)驗(yàn)仿真是在Matlab7.0環(huán)境下進(jìn)行,使用Intel Corei3 2.27 GHz cpu。所取人臉數(shù)據(jù)庫為Yale庫、ORL庫和BMP文件,其中Yale人臉圖像尺寸為100×100像素,ORL人臉圖像尺寸為128×128像素。Yale庫15人的人臉圖像,每人11種表情圖像,共計165幅人臉圖像。ORL庫40人的人臉圖像,每人10種姿態(tài)和表情圖像,共計400幅人臉圖像。本實(shí)驗(yàn)仿真對Yale庫人臉正面圖像進(jìn)行仿真,圖3給出了其中一部分人臉圖像。首先將人臉圖像進(jìn)行DWT變換,選擇bior4.4小波,提取近似系數(shù)分量[CA]和水平系數(shù)分量[CH],構(gòu)成系數(shù)特征[CA CH],大小為54×108像素。將該特征分量進(jìn)行DFT變換,居中處理后,系數(shù)矩陣大小為54×108,利用四橢圓模板(右半邊)屏蔽取出DFT低頻高幅值系數(shù),重新再構(gòu)成新的二維DFT系數(shù)矩陣,尺寸為33×33像素。將該二維系數(shù)矩陣進(jìn)行DCT壓縮變換,得到DCT系數(shù)矩陣。在該系數(shù)空間,利用模擬退火優(yōu)化算法,選擇優(yōu)化的特征列向量,在搜索過程中,設(shè)初始溫度為To=97°,終止溫度為Te=3°,常數(shù)c=0.999。利用歐氏距離判別器識別人臉,人臉識別率最高達(dá)到95%以上,此時特征系數(shù)矩陣平均為:33.0×25.5,特征壓縮比率為8.4/100。對Yale庫不同表情的人臉圖像進(jìn)行仿真,做同樣的分析,人臉識別率最高達(dá)到100%,此時特征系數(shù)矩陣平均為33.0×25.3,特征壓縮比率為8.3/100,圖4給出部分表情人臉圖像。對ORL庫不同的人臉姿態(tài)圖像進(jìn)行仿真,可以得出同樣好的性能,圖5給出了其中幾幅圖像人臉姿態(tài)圖像。為了說明該方法的有效性,該方法與僅采用DWT、DWT+DFT時的性能比較如表1所示。 圖3 Yale庫人臉圖像(部分) 圖4 Yale庫不同表情的人臉圖像 圖5 ORL庫不同姿態(tài)的人臉圖像 方法選擇平均特征系數(shù)計算時間/s最高識別率DWT+SA54.0×66.510.36100%DWT+DFT+SA33.0×26.22.12100%DWT+DFT+DCT+SA33.0×25.52.11100% 本文利用DWT、DFT、DCT組合變換進(jìn)行人臉圖像的特征提取,并且運(yùn)用模擬退火優(yōu)化算法進(jìn)行特征選擇的創(chuàng)新方法進(jìn)行人臉識別。DWT、DFT、DCT變換在有效特征提取過程中起著關(guān)鍵的作用,并且為人臉識別的高性能做出主要的貢獻(xiàn)。DWT具有圖像光照不變特征,DFT具有圖像平移的不變特征,對于不同的人臉圖像、不同表情的人臉圖像和不同姿態(tài)的人臉圖像,DFT、DCT大大壓縮了小波特征系數(shù)。為了有效選擇最佳系數(shù)特征,提高人臉識別性能,模擬退火法在高維系數(shù)空間搜索選擇最佳性能的系數(shù)列向量。 [1] Sun T H,Tien F C.Using Bp neural network for face recognition with 2D+3D hybrid information[J].Expert Systems with Applications,2008,35(1-2):361-372. [2] Yang J,Ling X F,Zhu Y T,et al.Face detection and recognition system in color image series[J].Mathematics and computer in simulation,2008,77(5-6):531-539. [3] Thiyagarajar R,Arulselvi S,Sainarayanan G.Gabor feature based classification using statistical models for face recognition[C]//Procedia computer science,2010,2:83-93. [4] Pong K H,Lam K M.Multi-resolution feature fusion for face recognition[J].Pattern Recognition,2014,47(2):556-567. [5] Sengur A.Wavelet transform and adaptive neuro-fuzzy inference for color texture classification[J].Expert Systems with Applications,2008,34(3):2120-2128. [6] Gumus E,Kilic N,Sertbas A,et al.Ucan.Evaluation of face recognition techniques using PCA、wavelets and SVM[J].Expert system with applications,2010,37(9):6404-6408. [7] Rangaswamy Y,Raja K B,Venugopal K R.Face Recognition Using Fusion of DTCWT and FFT features[C]//Procedia Computer Science,2015,54:809-817. [8] Balasubramanian M,Palanivel S,Ramalingam V.Real time face and mouth recognition using radial basis function neural networks[J].Expert Systems with Applications,2009,33(3):6879-6888. [9] Ajit Krisshna N L,Kadetotad D V,Manikantan K,et al.Face recognition using transform domain feature extraction and PSO-based feature selection[J].Applied soft computing,2014,22:141-161. [10] Gonzalez R C,Woods R E.Digital Image Processing[M].2版.北京:電子工業(yè)出版社,2007:35-40. [11] Kumar S.Neural Networks[M].北京:清華大學(xué)出版社,2006:68-70. [12] Haykin S.Neural Networks and Learning Machines[M].3版.北京:機(jī)械工業(yè)出版社,2011:22-30. [13] Theodoridis S,Koutroumbas K.Pattern Recognition[M].4版.北京:機(jī)械工業(yè)出版社,2009:34-36. Face Recognition Based on Transform Domain in Feature Extraction and Simulated Annealing Algorithm in Feature Selection LI Wei, SUN Yunjuan (Henan Normal University, Xinxiang 453007, China) Two core techniques are proposed in the paper to improve the performance of face recognition system: DWT dual_sub band frequency domain for feature extraction and simulated annealing optimization for feature selection. First, it is combined DWT、DFT and DCT methods to extract facial expressions,translation and illumination invariant features.The wavelet features [CA CH] are selected using approximation and horizontal coefficients of the DWT of a face images.Low frequency high amplitude components are achieved with quadruple ellipse mask after DFT. DCT feature coefficients are obtained with DCT compression in the end. Then,The Simulated Annealing Algorithm is used for features selection and the feature subset is searched for the recognition in the space.The experiment simulation shows the validity of the method. face recognition; feature selection; simulated annealing algorithm; frequency domain feature extraction 2016-12-09 李偉(1967-),男,河南新鄉(xiāng)人,碩士,講師,主要從事數(shù)字圖像處理、模式識別和水印技術(shù)等方面的研究. 10.3969/i.issn.1674-5403.2017.02.019 TP317.4 A 1674-5403(2017)02-0070-052 提出的方法
3 實(shí)驗(yàn)仿真和性能分析
4 結(jié) 語