鄭 琨,張 楊,賴 杰,李森森(河北科技大學(xué)信息科學(xué)與工程學(xué)院,河北石家莊 050018)
基于支持向量機(jī)和特征向量提取的人臉識(shí)別框架
鄭 琨,張 楊,賴 杰,李森森
(河北科技大學(xué)信息科學(xué)與工程學(xué)院,河北石家莊 050018)
為了研究支持向量機(jī)在人臉識(shí)別中的應(yīng)用,提出了人臉識(shí)別框架,該框架首先利用特征向量提取算法對(duì)人臉進(jìn)行特征提取,得到人臉面部紋理特征數(shù)據(jù),然后采用支持向量機(jī)對(duì)提取的數(shù)據(jù)進(jìn)行訓(xùn)練,得到人臉模板,并依據(jù)人臉模板對(duì)人臉進(jìn)行識(shí)別。實(shí)驗(yàn)采用ORL人臉數(shù)據(jù)庫(kù)作為實(shí)驗(yàn)數(shù)據(jù),使用LBP算法提取特征向量,使用LIBSVM訓(xùn)練得到人臉模板數(shù)據(jù)庫(kù),當(dāng)模板人臉數(shù)與預(yù)測(cè)人臉數(shù)比值一定時(shí),隨著人數(shù)增加,其預(yù)測(cè)的正確率會(huì)有所下滑;當(dāng)人數(shù)一定時(shí),人臉模板與預(yù)測(cè)人臉數(shù)值上升,其正確率會(huì)有所上升。當(dāng)選擇一個(gè)相對(duì)合適的模板比例時(shí),正確率將會(huì)達(dá)到89.29%以上。實(shí)驗(yàn)結(jié)果表明,提出的框架對(duì)于人臉具有良好的識(shí)別能力。
計(jì)算機(jī)圖像處理;支持向量機(jī);人臉識(shí)別;LBP特征向量提??;人臉數(shù)據(jù)庫(kù)
人臉識(shí)別技術(shù)是一種利用人臉部特征信息進(jìn)行身份識(shí)別的生物識(shí)別技術(shù),具有非接觸性、非強(qiáng)制性、并發(fā)性等特點(diǎn),因此該技術(shù)在公共安全、金融安全、人機(jī)交互等領(lǐng)域中已得到廣泛應(yīng)用。
國(guó)內(nèi)外諸多研究人員對(duì)于人臉識(shí)別技術(shù)進(jìn)行研究,部分研究利用基于幾何結(jié)構(gòu)特征的方法[1],通過(guò)對(duì)人的眼、鼻、嘴等面部特征進(jìn)行提取,并進(jìn)行身份驗(yàn)證。目前,幾何特征方法的維數(shù)由二維上升到三維,并開始對(duì)三維人臉識(shí)別方法進(jìn)行研究和改進(jìn)[2],該方法有效降低了無(wú)效三維幾何特征對(duì)識(shí)別的影響,使得三維人臉識(shí)別的實(shí)現(xiàn)更加高效和準(zhǔn)確。由于幾何結(jié)構(gòu)特征的方法本身具有計(jì)算簡(jiǎn)單、效果良好等特點(diǎn),已經(jīng)成為人臉識(shí)別的主流方法之一。此外,還有一些研究是基于模板匹配的方法,這部分主要包括特征臉?lè)椒?、線性判別分析法、神經(jīng)網(wǎng)絡(luò)分析法、動(dòng)態(tài)鏈接匹配方法等。有些研究采用LBP算子進(jìn)行特征提取進(jìn)行人臉識(shí)別,通過(guò)對(duì)LBP算子進(jìn)行改進(jìn),能夠提高識(shí)別的準(zhǔn)確率[3-4]。目前將LBP和支持向量機(jī)結(jié)合進(jìn)行人臉識(shí)別的研究還有待進(jìn)一步研究。
本文提出了一個(gè)基于支持向量機(jī)和特征向量提取的人臉識(shí)別框架,該框架的實(shí)驗(yàn)結(jié)果表明,所提出的框架對(duì)于人臉具有良好的識(shí)別能力。
1.1框架概述
該框架以人臉模板數(shù)據(jù)庫(kù)為基礎(chǔ),首先對(duì)數(shù)據(jù)庫(kù)中的人臉使用LBP算法進(jìn)行特征提取,得到人臉特征向量,然后以人臉特征為基礎(chǔ),利用支持向量機(jī)LIBSVM對(duì)人臉特征向量進(jìn)行訓(xùn)練,得到人臉模板數(shù)據(jù),并構(gòu)成人臉模板數(shù)據(jù)庫(kù)。通過(guò)LIBSVM的預(yù)測(cè)進(jìn)行人臉識(shí)別,人臉識(shí)別框架如圖1所示。
圖1 人臉識(shí)別框架Fig.1 Face recognition framework
1.2特征向量提取
在特征向量提取上,本文采用局部二值模式(local binary pattern,簡(jiǎn)稱LBP)[56],它是由OJALA等提出的用來(lái)描述圖像局部紋理特征的算子,可用于紋理特征提取。
LBP算子定義為在3×3的窗口內(nèi),將相鄰的8個(gè)像素的灰度值與其窗口中心像素比較,若周圍像素值大于中心像素值,則該像素點(diǎn)的位置被標(biāo)記為1,否則為0。這樣,3×3鄰域內(nèi)的8個(gè)點(diǎn)經(jīng)比較可產(chǎn)生8位二進(jìn)制數(shù),從而得到該窗口中心像素點(diǎn)的LBP值,并用這個(gè)值來(lái)反映該區(qū)域的紋理信息,LBP算子特征提取示意圖如圖2所示,圖中計(jì)算所得LBP值為54[7]。
圖2 LBP算子運(yùn)算過(guò)程示意圖Fig.2 LBP operation process diagram
在人臉識(shí)別中,人臉特征提取的過(guò)程至關(guān)重要,特征提取的好壞直接影響了人臉識(shí)別的正確率。為了能夠有更好的識(shí)別率,采用子圖分割的方法[8],將整張人臉劃分成n個(gè)小區(qū)域,再利用LBP算子得到每個(gè)小區(qū)域的LBP值,對(duì)所有小區(qū)域的LBP值按順序排列在一起,即得到整幅人臉的特征向量[8-9]。圖3為ORL人臉庫(kù)中的一張人臉,對(duì)其進(jìn)行LBP特征向量的提取過(guò)程和效果圖。
圖3 人臉特征提取前后變化圖Fig.3 Face feature extraction before and after change
1.3基于支持向量機(jī)的人臉模板獲取和預(yù)測(cè)
支持向量機(jī)(support vector machine,簡(jiǎn)稱SVM)[10-13]作為一種預(yù)測(cè)工具已經(jīng)受到眾多研究者的關(guān)注,它在人臉識(shí)別、遙感影像、車牌識(shí)別等領(lǐng)域內(nèi)有廣泛應(yīng)用。它在解決小樣本、非線性及高維模式識(shí)別中表現(xiàn)出許多特有的優(yōu)勢(shì),并能夠推廣應(yīng)用到函數(shù)擬合等其他類機(jī)器學(xué)習(xí)問(wèn)題中。SVM方法是建立在統(tǒng)計(jì)學(xué)習(xí)理論的VC維理論和結(jié)構(gòu)風(fēng)險(xiǎn)最小原理基礎(chǔ)上的,根據(jù)有限的樣本信息在模型的復(fù)雜性和學(xué)習(xí)能力之間尋求最佳折中,以期獲得最好的泛化能力。
本文使用LIBSVM對(duì)提取的特征向量進(jìn)行訓(xùn)練[14],LIBSVM是由臺(tái)灣大學(xué)林智仁教授等人開發(fā)的一個(gè)簡(jiǎn)單、方便和高效的SVM模式識(shí)別與回歸的軟件包。將圖像數(shù)據(jù)組織成LIBSVM需要使用固定的數(shù)據(jù)格式,其格式如下:
〈label〉〈index1〉:〈value1〉〈index2〉:〈value2〉…
在本實(shí)驗(yàn)中,〈label〉代表的是訓(xùn)練數(shù)據(jù)集的類別,即參與人臉訓(xùn)練的人數(shù),一般為整數(shù)值;〈index〉代表人臉向量的維度,可以不連續(xù);〈value〉代表人臉向量維度的值。將人臉的特征向量格式化成LIBSVM格式,得到如下數(shù)據(jù)(部分?jǐn)?shù)據(jù)):
1 1:368 2:65 3:113 4:73 5:58 6:17 7:57 8:105 9:54 10:57 11:18 12:90 13:7 14:10 15:9…
1 1:377 2:86 3:112 4:68 5:52 6:19 7:65 8:96 9:43 10:51 11:16 12:85 13:11 14:18 15:12…
1 1:394 2:59 3:132 4:61 5:57 6:15 7:53 8:74 9:34 10:53 11:11 12:88 13:5 14:15 15:13…
預(yù)測(cè)人臉是由最后3張人臉構(gòu)成。當(dāng)特征向量使用支持向量機(jī)對(duì)人臉模板進(jìn)行訓(xùn)練時(shí),需要設(shè)置參數(shù)c和gamma(γ)的值,恰當(dāng)?shù)脑O(shè)置該值能使分類的正確率達(dá)到最高。在LIBSVM軟件包中的easy.py工具中輸入訓(xùn)練模板和預(yù)測(cè)人臉特征向量能實(shí)現(xiàn)訓(xùn)練與預(yù)測(cè)同步完成,并尋找出最優(yōu)參數(shù)c 和γ,使得模板有最高正確率。如圖4所示,以20人每人7張人臉為模板,3張人臉為預(yù)測(cè)人臉為例,其中最合適的參數(shù)c=2,γ=0.125,模板的正確率為95.0%。
圖4 訓(xùn)練結(jié)果Fig.4 Training results
2.1實(shí)驗(yàn)環(huán)境
硬件上,采用AMD A6-4400雙核處理器,處理器主頻為2.7GHz,內(nèi)存大小為4GB。軟件上,采用Windows 7的32位操作系統(tǒng),支持向量機(jī)軟件為L(zhǎng)IBSVM 1.6版本,此外,本文使用Matlab 7.14版本作為L(zhǎng)BP特征提取的工具。
2.2實(shí)驗(yàn)數(shù)據(jù)
實(shí)驗(yàn)采用ORL數(shù)據(jù)庫(kù)作為人臉數(shù)據(jù),該人臉數(shù)據(jù)庫(kù)由劍橋大學(xué)AT&T實(shí)驗(yàn)室創(chuàng)建,包括不同人種和性別的40人,每人10幅圖片,共400張面部圖像[15-16]。所拍攝的圖片在照明、臉部表情等方面不盡相同,是一種常用于人臉識(shí)別的數(shù)據(jù)庫(kù),該數(shù)據(jù)庫(kù)的部分人臉如圖5所示。
圖5 ORL部分人臉數(shù)據(jù)庫(kù)Fig.5 ORL partial face database
實(shí)驗(yàn)用整個(gè)ORL人臉數(shù)據(jù)庫(kù)進(jìn)行測(cè)試,分別從5,10,20,40個(gè)不同人數(shù)(種類)[17]分析人數(shù)增加時(shí)預(yù)測(cè)正確率的變化。在實(shí)驗(yàn)中通過(guò)增加人臉模板數(shù)與預(yù)測(cè)人臉數(shù)的比值來(lái)分析框架預(yù)測(cè)結(jié)果的準(zhǔn)確性。
2.3實(shí)驗(yàn)結(jié)果
表1給出了使用該框架預(yù)測(cè)的結(jié)果。在預(yù)測(cè)過(guò)程中,通過(guò)改變模板數(shù),查看框架的學(xué)習(xí)能力。當(dāng)模板人臉數(shù)與預(yù)測(cè)人臉數(shù)的比值為3∶3時(shí),隨著人數(shù)的增加其正確率從100%降到了85.83%;當(dāng)模板人臉數(shù)與預(yù)測(cè)人臉數(shù)的比值為5∶3時(shí),人數(shù)增加會(huì)使正確率從100%降至90%;而當(dāng)比值為7∶3時(shí),隨著人數(shù)的增加正確率會(huì)從100%降至89.29%。由此可見,隨著人臉?lè)N類增加,其預(yù)測(cè)的正確率有所降低,這主要與SVM預(yù)測(cè)能力有關(guān);當(dāng)人臉模板與預(yù)測(cè)人臉數(shù)的比值上升時(shí),其正確率會(huì)有所上升??偟膩?lái)說(shuō),本文提出的框架結(jié)構(gòu)能夠正確識(shí)別人臉,并且正確率都能達(dá)到85.83%以上,說(shuō)明本框架具有較好的人臉識(shí)別效果。
表1 人臉識(shí)別結(jié)果Tab.1 Face recognition results%
人臉識(shí)別已在公共安全、金融安全、人機(jī)交互等領(lǐng)域[18]中具有廣泛的應(yīng)用,更有廣闊的發(fā)展空間。本文提出了一個(gè)人臉識(shí)別框架,該框架首先利用特征向量提取算法對(duì)人臉進(jìn)行特征提取,得到人臉面部紋理特征數(shù)據(jù),然后采用支持向量機(jī)對(duì)提取的數(shù)據(jù)進(jìn)行訓(xùn)練,得到人臉模板,并依據(jù)人臉模板對(duì)人臉進(jìn)行識(shí)別。實(shí)驗(yàn)采用ORL人臉數(shù)據(jù)庫(kù)作為實(shí)驗(yàn)數(shù)據(jù),使用LBP算法提取特征向量,使用LIBSVM訓(xùn)練得到人臉模板,實(shí)驗(yàn)結(jié)果表明,所提出的框架是可行的,對(duì)于人臉具有良好的識(shí)別能力。該框架利用基于結(jié)構(gòu)風(fēng)險(xiǎn)最小化的原理,而不是傳統(tǒng)統(tǒng)計(jì)學(xué)的經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化原理,使得可信度大幅提高。進(jìn)一步的工作應(yīng)著重改進(jìn)支持向量機(jī)算法,以增強(qiáng)框架的人臉識(shí)別準(zhǔn)確率。
/References:
[1] BRUNELLI R,POGGIC T.Face recognition:Features versus tem-plates[J].IEEE Transactions on PAMⅠ,1993,15:1042-1052.
[2] 余芳,岳冬利,王歲花.基于改進(jìn)幾何特征的三維人臉識(shí)別方法[J].計(jì)算機(jī)仿真,2011,28(4):291-294.YU Fang,YUE Dongli,WANG Suihua.Face recognition algorithm based on improved geometric features[J].Computer Simulation,2011,28(4):291-294.
[3] 阮曉虎,李衛(wèi)軍,覃鴻,等.一種基于特征匹配的人臉配準(zhǔn)判斷
方法[J].智能系統(tǒng)學(xué)報(bào),2015,10(1):12-19.RUAN Xiaohu,LI Weijun,QIN Hong,et al.An assessment method for face alignment based on feature matching[J].CAAI Transactions on Intelligent Systems,2015,10(1):12-19.
[4] 黃非非.基于LBP的人臉識(shí)別研究[D].重慶:重慶大學(xué),2009.HUANG Feifei.Research on Face Recognition Based on LBP Operator[D].Chongqing:Chongqing University,2009.
[5] 曾凡濤.基于改進(jìn)LBP特征的圖像理解[D].長(zhǎng)春:吉林大學(xué),2014.ZENG Fantao.Image Understanding Based on Improved LBP Methodology[D].Changchun:Jilin University,2014.
[6] OJALA T,PIETIKAINEN M,MAENPAA T.Multiresolution gray scale and rotation invariant texture classification with local binary patterns[J].IEEE Trans on Pattern Analysis and Machine Intelligence,2002,24(7):971-987.
[7] 王憲,張彥,慕鑫,等.基于改進(jìn)的LBP人臉識(shí)別算法[J].光電工程,2012,39(7):109-114.WANG Xian,ZHANG Yan,MU Xin,et al.The face recognition algorithm based on improved LBP[J].Opto-Electronic Engineering,2012,39(7):109-114.
[8] 胥淘.一種基于改進(jìn)LBP算子的人臉識(shí)別算法研究[J].電腦與信息技術(shù),2010,18(6):36-38.XU Tao.A face recognition method based on improved LBP algorithm[J].Computer and Information Technology,2010,18(6):36-38.
[9] 王瑋,黃非非,李見為,等.使用多尺度LBP特征描述與識(shí)別人臉[J].光學(xué)精密工程,2008,16(4):696-705.WANG Wei,HUANG Feifei,LI Jianwei,et al.Face description and recognition using multi-scale LBP feature[J].Optics and Precision Engineering,2008,16(4):696-705.
[10]孫文榮,周先春,嵇亞婷.基于直方圖均衡化、PCA和SVM算法的人臉識(shí)別[J].軟件,2014,35(8):11-15.SUN Wenrong,ZHOU Xianchun,JI Yating.Face recognition based on histogram equalization,Principal Components Analysis and Support Vector Machine algorithms[J].Computer Engineering &Software,2014,35(8):11-15.
[11]殷輝,葉飛.基于SVM的軟件質(zhì)量評(píng)價(jià)[J].河北工業(yè)科技,2012,29(5):308-310.YIN Hui,YE Fei.Software quality evaluation based on support vector machine[J].Hebei Journal of Industrial Science and Technology,2012,29(5):308-310.
[12]劉東輝,卞建鵬,付平,等.支持向量機(jī)最優(yōu)參數(shù)選擇的研究[J].河北科技大學(xué)學(xué)報(bào),2009,30(1):58-61.LIU Donghui,BIAN Jianpeng,F(xiàn)U Ping,et al.Study on the choice optimum parameters of support vector machine[J].Journal of Hebei University of Science and Technology,2009,30(1):58-61.
[13]陳琦,郭順超,張世輝.基于特征聯(lián)合和支持向量機(jī)的人臉識(shí)別[J].燕山大學(xué)學(xué)報(bào),2012,36(6):519-525.CHEN Qi,GUO Shunchao,ZHANG Shihui.Face vecognition based on features combination and SVM[J].Journal of Yanshan University,2012,36(6):519-525.
[14]羅婷婷,范太華.支持向量機(jī)核函數(shù)及優(yōu)化研究[J].先進(jìn)制造與管理,2007,26(10):34-35.LUO Tingting,F(xiàn)AN Taihua.Survey of SVM kernel function and optimum[J].Advanced Manufacture and Management,2007,26(10):34-35.
[15]高海闊,馬盛楠.基于ORL數(shù)據(jù)庫(kù)的快速人臉認(rèn)證技術(shù)的研究[J].科技傳播,2014(12):218-219.GAO Haikuo,MA Shengnan.Research on fast face authentication technology based on ORL database[J].Public Communication of Science &Technology,2014(12):218-219.
[16]李國(guó),穆國(guó)旺,睢佰龍.基于生物啟發(fā)特征與PCA-LDA的人臉識(shí)別方法[J].河北工業(yè)大學(xué)學(xué)報(bào),2013,42(5):80-83.LI Guo,MU Guowang,SUI Bailong.Face recoguition based on biologically inspired features combined with PCA-LDA[J].Journal of Hebei University of Technology,2013,42(5):80-83.
[17]翟倩茹.不同姿態(tài)人臉配準(zhǔn)方法研究[D].大連:大連海事大學(xué),2012.ZHAI Qianru.Research on Various Poses Face Image Registration[D].Dalian:Dalian Maritme University,2012.
[18]段錦.人臉自動(dòng)機(jī)器識(shí)別[M].北京:科學(xué)出版社,2009.
Face recognition framework based on support vector machine and feature vector extraction
ZHENG Kun,ZHANG Yang,LAI Jie,LI Sensen
(School of Information Science and Engineering,Hebei University of Science and Technology,Shijiazhuang,Hebei 050018,China)
In order to study the application of support vector machine in face recognition,a face recognition framework is proposed.This framework firstly extracts face feature with the feature vector extraction algorithm to get the face feature data,and trains the data to obtain a face model,then recognizes the faces according to the face model.The experiment uses ORL face database as experimental data,uses LBP to extract the face feature,and uses LIBSVM to train the data to get the face model.When the ratio of the number of faces in templates to the prediction number of faces is the same,the prediction accuracy will decrease with the increase of the number;when the number of faces is the same,the prediction accuracy will increase with the ncrease of the face templates and the prediction number of faces.When the proportion of the template is relatively appropriate,the accuracy will exceed 89.29%.The experimental results show that this framework works well in recognizing faces.
computer image processing;support vector machine;face recognition;LBP feature vector extraction;face database
1008-1534(2016)01-0058-05
TP391.41
A
10.7535/hbgykj.2016yx01011
2015-09-20;
2015-11-19;責(zé)任編輯:陳書欣
河北省高等學(xué)校青年拔尖人才計(jì)劃項(xiàng)目(BJ2014023)
鄭 琨(1981—),男,河北唐山人,講師,碩士,主要從事高性能計(jì)算方面的研究。
張 楊博士。E-mail:uzhangyang@foxmail.com
鄭 琨,張 楊,賴 杰,等.基于支持向量機(jī)和特征向量提取的人臉識(shí)別框架[J].河北工業(yè)科技,2016,33(1):58-62.
ZHENG Kun,ZHANG Yang,LAI Jie,et al.Face recognition framework based on support vector machine and feature vector extraction [J].Hebei Journal of Industrial Science and Technology,2016,33(1):58-62.