摘 要:為了提高傳統(tǒng)的核主元分析的識別率,論文提出了一種基于再生核的KPCA(Kernel Principal Component Analysis,KPCA)提取人臉特征.使用ORL人臉數(shù)據(jù)庫進(jìn)行實驗,并且與傳統(tǒng)的KPCA在識別率上進(jìn)行了比較.實驗數(shù)據(jù)表明,改進(jìn)的KPCA不僅能夠抽取非線性數(shù)據(jù)而且有著比傳統(tǒng)的KPCA有更好的識別效果.
關(guān)鍵詞:主元分析;特征臉;人臉識別
DOI:10.16640/j.cnki.37-1222/t.2015.21.204
0 引言
Scholkopf等人首先提出了核主元分析,由于KPCA采用了非線性特征量,所以識別效果會比PCA更好.但單一使用的核函數(shù)會使得特征提取的數(shù)據(jù)有一定的缺陷和不足.因此,文章對單一核函數(shù)進(jìn)行改進(jìn)提出了一種再生核KPCA的人臉識別。
1 核主元分析方法
核主元分析方法的基本思路是通過一個非線性映射函數(shù),將輸入數(shù)據(jù) xk(k=1,...,l)(l為輸入數(shù)據(jù)的個數(shù)) 映射到一個高維特征空間F ,再在F空間上進(jìn)行線性主元分析.
輸入數(shù)據(jù)被映射為xk(k=1,...,L),假設(shè)
(7)
由于消掉一個常數(shù)對于求特征向量沒有影響,因此只要算出k的特征值和特征向量就可以算出(5)式的解。
設(shè)k的特征值為,相應(yīng)的特征向量為,并設(shè)是第一個不為零的特征值。由于F中的特征向量需要規(guī)范化,即
(8)
因此根據(jù)(7)和(8)式得
主元提取的目的就是計算測試樣本在特征向量上的映射。設(shè)x是一個測試樣本點(diǎn),在F中的映射為,則
(11)
傳統(tǒng)PCA提取主元的個數(shù)最多為輸入向量的維數(shù),但是在KPCA中,如果采樣數(shù)超過輸入維數(shù)時,主元提取的個數(shù)可以比輸入維數(shù)多。 如果(3)式不成立時,需要對映射進(jìn)行調(diào)整,設(shè)
2 再生核函數(shù)
2.1 再生核定義
設(shè)X是一個抽象集,H是定義在X上的實值或復(fù)值函數(shù)f的Hilbert空間.X*X在域上的函數(shù)K(x,y)稱為再生核, K(x,y)滿足以下2個特性:
如果H是一個具有再生核的可分的Hilbert函數(shù)空間,并且H中的正交基為,那么H中的再生核為:
(15)
文章介紹了一種采用δ函數(shù)在H1(R)和H2(R)的2種空間上計算再生核的技術(shù)。
令K1(X)是算子的基本解,滿足內(nèi)積定義,
的H1(R)的再生核是K1(x-y).令K2(X)
是算子的基本解,滿足內(nèi)積定義,
的H2(R)上再生核是K2(x-y)。
2.2 Hn(R)核函數(shù)設(shè)計
3 實驗結(jié)果及分析
(1)數(shù)據(jù)庫描述。實驗環(huán)境:WindowsXP+Matlab7.0,計算機(jī)的CPU:Dual Core Processor2.4 GHz,1.87GB內(nèi)存.在實驗中使用的是ORL人臉庫,該數(shù)據(jù)庫包含了40個人,每人采集10張分辨率為112×92的黑白照片,一共400張灰度圖像。該數(shù)據(jù)庫能夠充分地反應(yīng)了同一個人不同人臉圖像的差別。
(2)分類效果的比較與分析。為了比較分類效果,本實驗取ORL數(shù)據(jù)庫中的每人任意5幅圖像作為訓(xùn)練樣本,其他5幅圖像作為測試樣本.然后對傳統(tǒng)的KPCA和使用再生核改進(jìn)的KPCA分別抽取每個樣本的前兩個最佳鑒別特征進(jìn)行分析比較。從圖1可看出傳統(tǒng)KPCA只能較好識別同一人圖片的差異,而對不同人之間的差異識別效果較差.從圖2可看出使用再生核改進(jìn)的KPCA不但具有很好的類內(nèi)可分性,類間散度也很好。
4 結(jié)論
利用H'(R)核函數(shù)和卷積算子可以設(shè)計出Hn(R)再生核函數(shù).實驗結(jié)果表明:再生核函數(shù)其分類效果比傳統(tǒng)的KPCA要好,識別率較穩(wěn)定,且時間復(fù)雜度大幅降低.由于,在采用核函數(shù)方法進(jìn)行人臉識別時,使用預(yù)先選定的某種核函數(shù) ,往往不是最佳的.因此,通過設(shè)計再生核函數(shù),結(jié)合具體的工程實際應(yīng)用,可以選出較為合適的核函數(shù)用于人臉識別.
參考文獻(xiàn):
[1]Daoqiang Zhang,Zhi-Hua Zhou,and Songcan Chen, Diagonal principal component analysis for facerecognition[J].PatternRecognition,2006,39(1):140-142.
[2]Congde Lu,Taiyi Zhang,Xingzhong Du et al, “A Robust Kernel PCA Algorithm”[N], Proceedings of the Third International Conference on Machine Learning and Cybernetics,2004.
[3]A.D.Back,and A.S.Weigend,A first application of independent component analysis to extracting strueture from stock returns[J].International Journal on Neural Systems,1998,8(4):473-484.
[4]邊肇祺,張學(xué)工.模式識別[M].北京:清華大學(xué)出版社,2000:450-490.
作者簡介:吳林(1983-),男,福建莆田人,碩士,講師,研究方向:模式識別。endprint