馬帥旗
(陜西理工大學(xué) 電氣工程學(xué)院, 陜西 漢中 723000)
本文結(jié)合PCA與LDA算法的優(yōu)勢(shì)與不足,提出PCA子空間與LDA子空間的融合算法,利用PCA將高維空間的樣本投影到低維空間,以保證樣本類內(nèi)離散度矩陣非奇異,再利用LDA算法進(jìn)行特征提取,實(shí)現(xiàn)兩種特征子空間融合,再將人臉測(cè)試集投影至融合的特征空間,依據(jù)最近鄰分類準(zhǔn)則進(jìn)行分類,從而整體上提高識(shí)別系統(tǒng)的魯棒性和識(shí)別效率。
由于識(shí)別的圖像易受外部光照強(qiáng)度、拍攝角度、焦距等因素影響,因而需要對(duì)輸入圖像進(jìn)行預(yù)處理。圖像的預(yù)處理主要涉及輸入圖像的幾何位置規(guī)范化[4]和圖像灰度歸一化。幾何位置規(guī)范化是對(duì)原始輸入圖像進(jìn)行旋轉(zhuǎn)、縮放和裁剪等操作[5],灰度歸一化用于消除噪聲對(duì)輸入圖像灰度分布的影響,從而使預(yù)處理后的圖像的尺度、方向和灰度分布基本相似。
若(x1,y1)和(x2,y2)分別表示旋轉(zhuǎn)前、后點(diǎn)的坐標(biāo),則圖像中的像素點(diǎn)旋轉(zhuǎn)變換關(guān)系可表示為
(1)
(2)
為了使預(yù)處理后的人臉圖像的寬度width=130,高度height=150,左眼睛距圖像的左邊界距離和右眼睛距圖像的右邊界距離為30,雙目的對(duì)稱中心與圖像的上邊界和下邊界的距離分別為50和100,需要對(duì)圖像進(jìn)行平移和裁剪處理。若(xl,yl)和(xr,yr)分別為圖像平移前的左眼、右眼中心縱橫坐標(biāo),Δx和Δy分別表示水平偏移量和垂直偏移量,則水平和垂直方向的平移距離為Δx=width/2-(xl+xr)/2、Δy=height/3-(yl+yr)/2。若像素點(diǎn)(x3,y3)和(x4,y4)分別表示平移前后圖像像素點(diǎn)的坐標(biāo),則圖像中像素點(diǎn)的平移變換可以表示為
(3)
圖1為經(jīng)過上述旋轉(zhuǎn)、縮放和平移預(yù)處理后的人臉圖像,像素(x,y)經(jīng)預(yù)處理后的坐標(biāo)(x′,y′)可以表示為
(4)
(a) 原始圖像 (b) 旋轉(zhuǎn)、縮放并剪切后的圖像圖1 人臉圖像的幾何歸一化
在人臉圖像預(yù)處理時(shí),可以選擇雙眼、雙眉、鼻尖與嘴巴中線作為特征點(diǎn)進(jìn)行歸一化處理。如在雙眼部分或全部被遮擋的情況下,選擇兩眉毛中點(diǎn)進(jìn)行歸一化處理。為了使預(yù)處理后的人臉圖像的寬度width=130,高度height=150,左眉毛中點(diǎn)距圖像的左邊界距離和右眉毛中點(diǎn)距圖像的右邊界距離為30,雙眉毛的對(duì)稱中心與圖像的上邊界和下邊界的距離分別為30和120。同理,若雙眼、雙眉都被遮擋時(shí),選擇鼻尖和嘴巴中線為特征點(diǎn)進(jìn)行歸一化,鼻尖距離上邊界距離為110,嘴巴中線距離下邊界為20,鼻尖距離左右邊界75。
PCA與LDA特征融合與識(shí)別步驟如下:
步驟2 計(jì)算特征差值的協(xié)方差矩陣
(5)
步驟3 求取差值協(xié)方差矩陣Ф的非零特征值λ=(λ1,λ2,…,λN),進(jìn)而求取對(duì)應(yīng)特征向量V=(v1,v2,…,vN),并對(duì)特征向量按照特征值降序方式進(jìn)行排列:
Ф·V=λ·V。
(6)
步驟5 將輸入圖像x、每類平均圖像μj和總體平均圖像μ投影到PCA子空間[5]:
(7)
(8)
(9)
步驟6 分別計(jì)算LDA算法中的每個(gè)類內(nèi)散布矩陣Sj、總體類內(nèi)散布矩陣SW及類間散布矩陣SB:
(10)
(11)
(12)
步驟7 根據(jù)Fisher準(zhǔn)則,使樣本在LDA投影空間內(nèi)的類間離散度SB最大和類內(nèi)離散度SW最小,可知最佳投影子空間W滿足
(13)
步驟8 依據(jù)拉格朗日乘數(shù)法可得
(14)
步驟9 將PCA和LDA的特征空間進(jìn)行融合[2]:
(15)
對(duì)于任意一圖像列向量x,在融合特征空間的投影關(guān)系可表示為
(16)
將訓(xùn)練圖像及測(cè)試圖像分別投影至融合的特征空間,若y和Yi分別表示測(cè)試樣本x和訓(xùn)練樣本類Xi投影后特征,則定義在融合投影空間中測(cè)試樣本x到訓(xùn)練樣本類Xi的距離為
D(x,Xi)=‖y,Yi‖,
(17)
采用英國劍橋大學(xué)Olivetti實(shí)驗(yàn)室的ORL人臉庫進(jìn)行實(shí)驗(yàn),該人臉庫包含400幅人臉圖像,分為40類不同年齡、不同性別和不同種族的人臉,而每類人臉又包含10幅不同方向、光照、面部表情和面部遮擋物的圖像。對(duì)40類人臉庫中每類人的前5幅圖像進(jìn)行訓(xùn)練,后5幅圖像進(jìn)行測(cè)試。表1給出了PCA和PCA-LDA融合算法的識(shí)別率與投影特征維數(shù)之間的關(guān)系。
表1 識(shí)別率與特征維數(shù)關(guān)系
從表1可知,當(dāng)特征空間維數(shù)小于25時(shí),雖然PCA和PCA-LDA融合算法的識(shí)別率都較低,但隨著特征維數(shù)的增加,二者的識(shí)別正確率增長(zhǎng)較快;當(dāng)融合特征空間維數(shù)繼續(xù)增加且小于65時(shí),識(shí)別率逐漸增加并趨于穩(wěn)定,PCA算法正確識(shí)別率的極值點(diǎn)為93%,PCA-LDA算法的正確識(shí)別率的極值點(diǎn)為96%;若融合特征空間的維數(shù)繼續(xù)增加時(shí),融合特征空間的維數(shù)過多,所有的特征向量并不都代表有效的投影方向,部分特征向量可能表征與人臉特征無關(guān)的噪聲、背景等投影方向,正確識(shí)別率也不會(huì)超過極值點(diǎn),反而隨著維數(shù)增加而逐漸減小。
ORL人臉庫中共計(jì)40類人,每類人共10幅圖像,其中i幅用于訓(xùn)練,則10-i幅圖像用于實(shí)驗(yàn)測(cè)試。設(shè)定PCA算法的累計(jì)貢獻(xiàn)率為0.9,表2給出了不同算法下識(shí)別率與訓(xùn)練樣本個(gè)數(shù)之間的關(guān)系。
表2 不同算法下識(shí)別率比較
由表2可以看出,當(dāng)訓(xùn)練樣本為1時(shí),LDA的識(shí)別率僅為61.11%,受LDA算法影響,PCA-LDA融合算法識(shí)別率相對(duì)于PCA略大;當(dāng)訓(xùn)練的人臉圖像小于3,PCA、LDA和PCA-LDA算法的識(shí)別率都相對(duì)較低,PCA-LDA最高不超過89%;訓(xùn)練的樣本數(shù)增加時(shí),PCA、LDA和PCA-LDA的識(shí)別率逐漸增加,且PCA-LDA的增長(zhǎng)率高于PCA和LDA;當(dāng)訓(xùn)練樣本數(shù)為8時(shí),PCA-LDA的識(shí)別率達(dá)到100%。表3給出了不同的訓(xùn)練樣本下,LDA的最佳投影維數(shù)與識(shí)別率之間關(guān)系。
表3 不同訓(xùn)練樣本下的PCA-LDA識(shí)別率
另外在實(shí)驗(yàn)中發(fā)現(xiàn),PCA算法側(cè)重于提取圖像數(shù)據(jù)原始特征,LDA算法側(cè)重于提取同類之間及不同類之間的差別,當(dāng)每類樣本較少時(shí),樣本類別信息不足,LDA識(shí)別效果較差;當(dāng)訓(xùn)練的樣本數(shù)增加時(shí),同類及不同類的特征信息增加,識(shí)別率有顯著提高。PCA-LDA算法能夠結(jié)合PCA及LDA算法的優(yōu)勢(shì),對(duì)樣本類別具有較好的魯棒性,能獲得較好的正確識(shí)別率。
本文首先將原始圖像投影至PCA特征空間,實(shí)現(xiàn)數(shù)據(jù)降維;然后用LDA的類別標(biāo)簽信息,獲得類內(nèi)樣本特征及類間樣本特征;進(jìn)而實(shí)現(xiàn)PCA與LDA特征融合,獲得一個(gè)有效的分類器。實(shí)驗(yàn)結(jié)果表明,該P(yáng)CA-LDA融合算法能夠結(jié)合二者優(yōu)勢(shì),有效解決小樣本問題,對(duì)光照不均勻、表情變化及拍攝方向具有一定魯棒性,其識(shí)別率高于傳統(tǒng)的PCA算法,具有一定的應(yīng)用價(jià)值。