林 琳
(廈門海洋職業(yè)技術(shù)學(xué)院,福建 廈門 361000)
?
智能機(jī)器人視覺(jué)中的人臉識(shí)別研究
林 琳
(廈門海洋職業(yè)技術(shù)學(xué)院,福建 廈門 361000)
通過(guò)對(duì)智能機(jī)器人視覺(jué)中的人臉識(shí)別過(guò)程進(jìn)行研究,提出了采用MB-LBP紋理特征結(jié)合徑向基函數(shù)作為核函數(shù)的SVM進(jìn)行人臉識(shí)別,并在常見(jiàn)的Yale和ORL數(shù)據(jù)集上進(jìn)行了多項(xiàng)對(duì)比實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果表明,算法能夠很好的完成智能機(jī)器人視覺(jué)的人臉識(shí)別。對(duì)于光照變化較大的人臉圖像,對(duì)于人類識(shí)別正確率有較大的提升,另外,通過(guò)減少迭代次數(shù)減少了人臉識(shí)別的時(shí)間復(fù)雜度。該算法對(duì)智能機(jī)器人視覺(jué)中應(yīng)用人臉識(shí)別過(guò)程具有較強(qiáng)意義。
智能機(jī)器人; 機(jī)器視覺(jué);MB-LBP特征;支持向量機(jī);徑向基函數(shù)
機(jī)器人指的是一個(gè)由多自由度、多變量組成的復(fù)雜動(dòng)力學(xué)系統(tǒng),機(jī)器人系統(tǒng)的發(fā)展離不開計(jì)算能力的顯著提高。隨著人們對(duì)機(jī)器人的不斷改造和發(fā)展,智能機(jī)器人的視覺(jué)控制也是一個(gè)比較重要的方向[1],在智能機(jī)器人進(jìn)行常規(guī)仿人類活動(dòng)中,人們希望機(jī)器人也擁有像人類一樣的視覺(jué)能力。再仿人類視覺(jué)的功能研究中,最常見(jiàn)的是人臉識(shí)別的能力,如果冰冷的機(jī)器人也具有較強(qiáng)的人臉識(shí)別能力,這將為機(jī)器人增加很多擴(kuò)展的能力。
人臉識(shí)別(Face Recognition)[2]是目前生物與計(jì)算機(jī)智能學(xué)科的熱門交叉學(xué)科[3],對(duì)于機(jī)器人來(lái)說(shuō),人臉識(shí)別的計(jì)算速度是瓶頸,目前較為常見(jiàn)的人臉識(shí)別的分類器的效率較低,同時(shí)識(shí)別效果也不理想,這將制約機(jī)器人的視覺(jué)發(fā)展。
人臉識(shí)別屬于模式識(shí)別的一種,通常具有兩個(gè)階段,即特征提取和特征分類。人臉圖像處理的紋理特征中,較為常用的特征包括LBP紋理特征[4],Gabor紋理特征[5]等。提取完圖像的特征之后,利用人臉圖像的特征代替原始圖像,然后通過(guò)機(jī)器學(xué)習(xí)的分類算法進(jìn)行分類,將不同的人臉?lè)謩e分類到對(duì)應(yīng)的類別中,完成人臉識(shí)別。常見(jiàn)的分類方法包括支持向量機(jī)(SVM)[6],人工神經(jīng)網(wǎng)絡(luò)(NN)[7],邏輯斯蒂回歸(LR)[8]等等,不同的機(jī)器學(xué)習(xí)方法都在各自的領(lǐng)域中取得了不錯(cuò)的效果。
LBP局部二值模式是一種局部的紋理特征描述子,該描述子通過(guò)計(jì)算每個(gè)像素點(diǎn)與周圍相鄰像素點(diǎn)之間的關(guān)系為每個(gè)像素點(diǎn)生成一個(gè)描述子,該描述子可以表現(xiàn)出該像素點(diǎn)周圍的局部紋理特征。最簡(jiǎn)單的LBP算子是通過(guò)計(jì)算周圍8個(gè)鄰域之間的差值,然后將差值二值化獲得局部LBP算子。在此基礎(chǔ)上,人們提出了MB-LBP即多塊化局部二值模式紋理[9],該紋理的計(jì)算方式不僅僅針對(duì)單個(gè)像素點(diǎn)了,而是針對(duì)每一塊區(qū)域進(jìn)行二值模式的演化,通過(guò)像素塊的平均值代替原始像素塊,具有較強(qiáng)抗干擾能力。
圖1 MB-LBP紋理特征示意圖
如圖1所示,每個(gè)塊的像素均值可以計(jì)算出,此處以9個(gè)像素點(diǎn)劃分為塊。然后通過(guò)傳統(tǒng)的LBP算法得到二值模式,比中間值86小的位置為0,大的位置為1,按照順時(shí)針可以得到二值模式(0,1,0,1,0,1,0,0)2=84,該位置的紋理特征均值為84。
采用MB-LBP特征進(jìn)行人臉識(shí)別的分類研究,由于人臉圖像受到光照影響較強(qiáng)烈,不同強(qiáng)度的光照往往會(huì)造成局部紋理特征的變化,所以可利用MB-LBP紋理改善現(xiàn)有特征的不足,在最后的分類實(shí)驗(yàn)中,采用光照變化強(qiáng)烈的Yale人臉庫(kù)進(jìn)行識(shí)別,識(shí)別結(jié)果表明,MB-LBP紋理的抗光照干擾性較強(qiáng),適合作為人臉識(shí)別的主要特征。
智能機(jī)器人視覺(jué)的人臉識(shí)別方法另一個(gè)重點(diǎn)是特征的分類和識(shí)別過(guò)程。本文采用最新的分類器——支持向量機(jī),進(jìn)行人臉MB-LBP特征的分類和識(shí)別。
3.1 支持向量機(jī)SVM
支持向量機(jī)(SVM)由感知機(jī)發(fā)展而來(lái),傳統(tǒng)的感知機(jī)[10]通過(guò)求解線性分類面來(lái)將待分類的數(shù)據(jù)分離開來(lái)。根據(jù)數(shù)據(jù)分布的情況不同,這樣的線性分類面較多,而支持向量機(jī)需要尋找到一個(gè)最優(yōu)的分類面,使得待分類的數(shù)據(jù)能夠得到最大的“間隔”條件下的分離。
設(shè)訓(xùn)練集{xi,yi,i=1,2,3…n}表示一個(gè)數(shù)據(jù)集,該數(shù)據(jù)集中的數(shù)據(jù)x是需要分類的樣本數(shù)據(jù),而y表示的則是每個(gè)數(shù)據(jù)對(duì)應(yīng)的標(biāo)簽,也就是實(shí)際上該數(shù)據(jù)需要分類到哪一類中。SVM需要找到一個(gè)最優(yōu)的分類面w*x+b=0,使得樣本數(shù)據(jù)集x能夠盡可能大的分離開來(lái)。如圖所示,我們需要將兩個(gè)類別的數(shù)據(jù)盡可能分離開,也就是圖2中所示的“最優(yōu)分類面”。
圖2 支持向量機(jī)與最優(yōu)分類面
通過(guò)分析最優(yōu)分類面w*x+b=0,其中w為權(quán)值,x為支持向量,b為加性偏置。求最優(yōu)化的分類面,也就是求關(guān)于w和b的二次規(guī)劃問(wèn)題:
(1)
s.t.yi(ωgxi+b)≥ 1,i= 1,2,…,n
(2)
通過(guò)求解上述二次規(guī)劃的優(yōu)化問(wèn)題,通過(guò)拉格朗日乘子法及KKT條件可以解出最優(yōu)化的權(quán)值w及b,然后得到該樣本分類的最優(yōu)化結(jié)果。
實(shí)際上,幾乎所有的實(shí)際問(wèn)題都不能遇到圖2這樣的線性可分的數(shù)據(jù)集x,而線性不可分的數(shù)據(jù)集不能僅僅使用線性分類面將其區(qū)分,SVM在此基礎(chǔ)上,加入了松弛變量,允許部分樣本可以被錯(cuò)分,在這樣的情況下就可以采用SVM的方法求解非線性可分的數(shù)據(jù)集了。另外,如圖3所示,這樣的數(shù)據(jù)集并不能夠通過(guò)松弛變量解決,因?yàn)槿绻勒站€性分類平面進(jìn)行分類,那么錯(cuò)分的樣本較多,導(dǎo)致最后的分類器性能較差。這時(shí)候,SVM采用核函數(shù)的概念,通過(guò)核函數(shù)將原本線性不可分的數(shù)據(jù)集,變化到高維空間上,通過(guò)高維空間映射將原始數(shù)據(jù)變?yōu)楦呔S空間上線性可分的數(shù)據(jù)集,這樣就可以很好的使用線性分類面進(jìn)行分類了。
圖3 非線性數(shù)據(jù)集通過(guò)核函數(shù)變化為高維線性可分?jǐn)?shù)據(jù)集
其中,φx表示核函數(shù),通過(guò)核函數(shù)變化,可以將SVM的二次優(yōu)化問(wèn)題轉(zhuǎn)化為:
(3)
s.t.yi(ωgφ(xi)+b)≥ 1-ξi
(4)
ξi≥0,i= 1,2,3,…,n
(5)
其中,ξi表示松弛因子,φx表示核函數(shù),C表示懲罰系數(shù)。同樣,可以采用拉格朗日乘子法及KKT條件得到二次規(guī)劃的最優(yōu)化解,然后表示出非線性SVM的分類面:
(6)
其中,K(xi,xj)表示為核函數(shù),通過(guò)核函數(shù)思想,可以很容易的采用多個(gè)帶有核函數(shù)的SVM完成人臉識(shí)別的分類任務(wù)。
3.2 人臉識(shí)別中SVM的核函數(shù)選擇
到目前為止,并沒(méi)有理論研究表明,怎樣的核函數(shù)適合怎樣的分類數(shù)據(jù)。一般情況下,常見(jiàn)的做法采用暴力嘗試的方式,選擇不同的核函數(shù)測(cè)試自己的數(shù)據(jù)集,然后從中選出最好的核函數(shù)做SVM的分類工作。
常見(jiàn)的核函數(shù)包括以下4種核函數(shù):
(1)線性核函數(shù):
(7)
(2)多項(xiàng)式核函數(shù):
(8)
(3)徑向基函數(shù):
(9)
(4)sigmoid激勵(lì)函數(shù):
(10)
由于核函數(shù)分為局部性較強(qiáng)的核函數(shù),如多項(xiàng)式核函數(shù),以及全局性較強(qiáng)的核函數(shù),如徑向基函數(shù)。由于人臉識(shí)別過(guò)程中,既需要局部性較強(qiáng)的核函數(shù)去區(qū)分出單個(gè)人類的不同光照之間的局部情況,又需要完成全局所有人臉的識(shí)別分類工作。而式(9)表示的徑向基函數(shù)是采用高斯核的運(yùn)算,將當(dāng)前特征維度通過(guò)高斯核轉(zhuǎn)化到無(wú)窮維度,然后通過(guò)分類器對(duì)無(wú)窮維度的數(shù)據(jù)進(jìn)行分類。由于人臉識(shí)別最大的障礙在于光照的影響,光照影響通常在特征的某個(gè)維度影響較大,而其他維度的影響卻微乎其微,采用徑向基函數(shù)將特征數(shù)據(jù)轉(zhuǎn)化到無(wú)窮維度上去,可以有效的減少光照的影響,所以本文采用徑向基函數(shù)(RBF)進(jìn)行智能機(jī)器人視覺(jué)人臉識(shí)別過(guò)程中的分類核函數(shù),從后續(xù)的實(shí)驗(yàn)結(jié)果可以看出,徑向基函數(shù)RBF能夠很好地完成人臉識(shí)別的過(guò)程。
人臉識(shí)別是一項(xiàng)較為復(fù)雜的非線性分類問(wèn)題,首先需要較為合理的人臉特征代替原有圖像,用低維的特征代替高維的原始圖像達(dá)到了降維的目的,可以降低SVM識(shí)別過(guò)程中的時(shí)間復(fù)雜度。本文采用MB-LBP紋理特征,通過(guò)使用徑向基函數(shù)RBF的SVM進(jìn)行人臉圖像的分類工作,完成智能機(jī)器人的人臉識(shí)別的功能。人臉識(shí)別流程如圖4所示。
圖4 人臉識(shí)別流程
5.1 數(shù)據(jù)集選擇
本文通過(guò)分別在ORL數(shù)據(jù)集和Yale數(shù)據(jù)集上進(jìn)行人臉識(shí)別實(shí)驗(yàn)。ORL數(shù)據(jù)集是劍橋大學(xué)維護(hù)的人臉數(shù)據(jù)集,該數(shù)據(jù)集包括40個(gè)人,每個(gè)人的10張人臉圖像的光照強(qiáng)度幾乎不變,只是人臉的拍攝角度發(fā)生了一定變化。與此相反,Yale大學(xué)維護(hù)的人臉數(shù)據(jù)集由48個(gè)人,每個(gè)人具有55張人臉圖像。該人臉圖像數(shù)據(jù)庫(kù)則是每張圖像光照發(fā)生了變化,而人臉拍攝角度幾乎不發(fā)生變化。如圖5可以看到,兩個(gè)數(shù)據(jù)庫(kù)部分人臉圖像的例子。
圖5 Yale數(shù)據(jù)集(左)與ORL數(shù)據(jù)集圖像(右)
ORL與Yale數(shù)據(jù)庫(kù)有各自的優(yōu)點(diǎn),通過(guò)在這兩個(gè)數(shù)據(jù)庫(kù)上測(cè)試本文算法,具有較強(qiáng)的橫向比較意義。另外,本文算法還與傳統(tǒng)的LBP,一維MB-LBP紋理特征以及傳統(tǒng)采用徑向基函數(shù)的SVM縱向做了實(shí)驗(yàn)比較。實(shí)驗(yàn)環(huán)境在MatlabR2012a上進(jìn)行。
為了橫向與縱向比較本文算法的實(shí)踐意義。首先,從ORL與Yale兩個(gè)數(shù)據(jù)庫(kù)中分別隨機(jī)挑選出30個(gè)人的數(shù)據(jù)集,每個(gè)人10個(gè)樣本圖像,將其中的7個(gè)人臉圖像作為訓(xùn)練數(shù)據(jù)集,另外3個(gè)圖像作為測(cè)試數(shù)據(jù)集。所有樣本都?xì)w一化到32*32的大小。
特征提?。横槍?duì)兩個(gè)數(shù)據(jù)庫(kù)中的300個(gè)樣本,分別提取每個(gè)樣本的LBP和MB-LBP紋理特征用于橫向比較紋理特征對(duì)人臉識(shí)別結(jié)果的影響。其中MB級(jí)特征采取的塊大小為3*3,計(jì)算每3*3個(gè)塊大小的平均值作為計(jì)算LBP的周圍像素值。
SVM分類:分別采用多項(xiàng)式核函數(shù)、sigmoid激勵(lì)核函數(shù)和RBF徑向基函數(shù)作為核函數(shù)的SVM進(jìn)行人臉識(shí)別,這樣一來(lái)可以橫向比較核函數(shù)對(duì)人臉識(shí)別的影響。
5.2 實(shí)驗(yàn)結(jié)果與分析
依照上述實(shí)驗(yàn)預(yù)處理與參數(shù)選擇分別進(jìn)行了12組實(shí)驗(yàn),在ORL與Yale數(shù)據(jù)庫(kù)上分別進(jìn)行了6組相同的實(shí)驗(yàn)。即分別采用LBP特征和MB-LBP特征以及三種SVM核函數(shù)進(jìn)行人臉識(shí)別的研究,一共有6組橫向?qū)Ρ葘?shí)驗(yàn),分別在兩個(gè)數(shù)據(jù)集中對(duì)這6種組合的識(shí)別情況和識(shí)別時(shí)間進(jìn)行了實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果由表1和表2給出:
表1 各種算法在ORL數(shù)據(jù)上的識(shí)別率與時(shí)間
表2 各種算法在Yale數(shù)據(jù)上的識(shí)別率與時(shí)間
由表1,2的結(jié)果可以看出,對(duì)于光照變化較為強(qiáng)烈的Yale數(shù)據(jù)庫(kù),本文采用的MB-LBP結(jié)合徑向基函數(shù)作為核函數(shù)的SVM能夠顯著提高識(shí)別率。而對(duì)于人類方向變化較多的ORL數(shù)據(jù)庫(kù),本文采用的算法策略對(duì)識(shí)別率提升更弱一些。由于智能機(jī)器人的視覺(jué)范圍中采集到的人臉圖像較為復(fù)雜,但是最關(guān)鍵的還是光照對(duì)人臉圖像的影響對(duì)人臉識(shí)別率的影響,所以本文的研究對(duì)于光照變化強(qiáng)烈的人臉識(shí)別算法策略有較強(qiáng)的意義。另外,由于MB-LBP攜帶更少但是更有用的紋理特征信息,且徑向基函數(shù)將數(shù)據(jù)轉(zhuǎn)化到無(wú)窮維,從根本上減少了SVM收斂的迭代次數(shù),一定程度上減少了算法的時(shí)間復(fù)雜度。
智能機(jī)器人的視覺(jué)過(guò)程是一個(gè)非常有意義的研究方向,我們首要完成的任務(wù)是智能機(jī)器人的人臉檢測(cè)和人臉識(shí)別問(wèn)題。本文采用MB-LBP紋理特征結(jié)合徑向基函數(shù)作為核函數(shù)的SVM算法策略進(jìn)行人臉識(shí)別。對(duì)于人臉光照變化強(qiáng)烈的圖像可以提升不少識(shí)別率,且通過(guò)MB-LBP特征減少了迭代次數(shù),減少了算法的時(shí)間復(fù)雜度,對(duì)于智能機(jī)器人視覺(jué)的人臉識(shí)別具有重要意義。但是,本文算法對(duì)于人類方向變化的人臉圖像識(shí)別率提升不明顯,這一方向是今后的研究重點(diǎn)。
[1] 張宏基,葛媛媛.智能機(jī)器人視覺(jué)仿生技術(shù)研究綜述[J].價(jià)值工程,2013,(26).
[2] 汪淑賢,熊承義,高志榮,等.分塊最大相似性嵌入稀疏編碼的人臉識(shí)別[J].模式識(shí)別與人工智能,2014,(10).
[3] 單園園,王法勝,李緒成,等.改進(jìn)AdaBoost與SVM快速人臉檢測(cè)[J].煙臺(tái)大學(xué)學(xué)報(bào)(自然科學(xué)與工程版),2015,(3).
[4] 李亮,舒寧,王凱,等.融合多特征的遙感影像變化檢測(cè)方法[J].測(cè)繪學(xué)報(bào),2014,(9).
[5] 田天,陳剛.基于膚色和Gabor紋理的粒子濾波人臉跟蹤[J].計(jì)算機(jī)工程,2014,(7).
[6] 李武,胡冰,王明偉,等.基于主成分分析和支持向量機(jī)的太赫茲光譜冰片鑒別[J].光譜學(xué)與光譜分析,2014,(12).
[7] 李龍,魏靖,黎燦兵,等.基于人工神經(jīng)網(wǎng)絡(luò)的負(fù)荷模型預(yù)測(cè)[J].電工技術(shù)學(xué)報(bào),2015,(8).
[8] 王立,張蓉,沙朝鋒,等.電子商務(wù)商品歸一化方法研究[J].計(jì)算機(jī)學(xué)報(bào),2014,(2).
[9] 王小玉,張亞洲,陳德運(yùn),等.基于多塊局部二值模式特征和人眼定位的人臉檢測(cè)[J].儀器儀表學(xué)報(bào),2014,(12).
[10] 楊戈,張威強(qiáng),黃靜,等.一個(gè)感知機(jī)神經(jīng)網(wǎng)絡(luò)字符識(shí)別器的實(shí)現(xiàn)[J].電子技術(shù)應(yīng)用,2015,(3).
[編校:張芙蓉]
Research of Face Recognition in the Vision of Intelligent Robot
LIN Lin
XiamenOceanVocationalCollege,XiamenFujian361012)
This article researches on the face recognition in intelligent robot's vision. It proposes using MB-LBP texture feature combined RBF kernel SVM for face recognition. Aim at validating the method, some compared experiments are done on Yale and ORL Face datasets. The results show that the method can be favorable for accomplishing the task of face recognition on intelligent robot. This method improves the accuracy of face recognition when the illumination of face changes a lot. Besides, it can reduce the time complexity by reducing the iterations of SVM. Above all, this method is of great significance in the procedure of face recognition in intelligent robot.
intelligent robot; computer vision; MB-LBP feature; SVM; RBF
2015-08-06
林琳(1976- ),女,黑龍江海倫人,講師,在讀博士研究生,研究方向?yàn)橹悄軝C(jī)器人、數(shù)控。
TP
A
1671-9654(2015)03-064-06