郎方年,田麗媛,劉莉莉,董愷凌
(1.成都大學信息科學與技術(shù)學院,四川成都 610054;2.江蘇大學附屬醫(yī)院信息科,江蘇鎮(zhèn)江 212013;3.營口職業(yè)技術(shù)學院成人教育分院,遼寧營口 115000;4.西南交通大學交通運輸與物流學院,四川成都 610031)
基于四元數(shù)的彩色人臉檢測
郎方年1,田麗媛2,劉莉莉3,董愷凌4
(1.成都大學信息科學與技術(shù)學院,四川成都 610054;2.江蘇大學附屬醫(yī)院信息科,江蘇鎮(zhèn)江 212013;3.營口職業(yè)技術(shù)學院成人教育分院,遼寧營口 115000;4.西南交通大學交通運輸與物流學院,四川成都 610031)
針對彩色圖像提出基于四元數(shù)的人臉檢測算法,從數(shù)學上解決傳統(tǒng)方法將膚色檢測與人臉最后確定分開進行而導致檢測率較低、程序復雜度高的弱點,將人臉膚色信息與反映輪廓形狀的灰度信息進行融合同時作計算處理,提高了檢測速度,且增強了算法的魯棒性.首先簡單概述作者提出的檢測系統(tǒng),然后按算法流程分塊說明系統(tǒng)每部分的主要內(nèi)容,其中包括:定義于實數(shù)域的廣義瑞利商以及Fisher鑒別分析法在四元數(shù)體上的推廣;基于四元數(shù)的Fisher鑒別分析法在人臉檢測中的應用原理;彩色人臉樣本集的收集與預處理;彩色非人臉樣本的收集及其分類的原因和分類原理;多尺度檢測中的融合問題;多組檢測結(jié)果的綜合判斷問題.數(shù)學上嚴密的推導表明,基于四元數(shù)的檢測算法合理可行,滿足實時性要求.大量實驗測試結(jié)果顯示,此算法快速有效,具有較強的魯棒性.
特征融合;特征抽取;四元數(shù)體;自共軛矩陣;模式分類;人臉檢測
人臉檢測技術(shù)起源于上世紀70年代[1],目前,關(guān)于人臉檢測的諸多技術(shù)問題已經(jīng)得到廣泛的研究,特別是基于運動、顏色等信息的檢測技術(shù)日漸成熟[2-3],而基于統(tǒng)計的檢測方法的出現(xiàn),也使得復雜背景下的人臉檢測成為可能[4].另外,能夠精確跟蹤和定位人臉特征的變形模板、活動輪廓模板等特征抽取技術(shù)也取得很大的進展[5],對這些檢測技術(shù)而言,一個共同的特征是,都需要使用有關(guān)人臉的先驗信息.根據(jù)使用人臉圖像先驗信息的不同可將人臉檢測方法分為2類:其一是僅僅采用灰度信息的模板匹配方法,其包括PCA方法(Eigenface)、神經(jīng)網(wǎng)絡方法(ANN)以及支持向量基方法(SVM)等[6-10],這類方法一般都具有較好的通用性及較強的魯棒性,但是缺點也很明顯,比如計算量大、檢測速度較慢等;其二是針對彩色圖像的基于膚色的檢測算法,即根據(jù)人臉表面的膚色信息以及啟發(fā)式信息確定人臉位置.
目前,科研人員提出了許多關(guān)于彩色人臉檢測的方法[11-14].盡管這些算法具體實施策略各異,但都遵循著一種共同的原則,即對顏色信息的利用與對人臉灰度信息的利用分開進行,先進行膚色檢測,確定出可能的人臉區(qū)域,然后再在這些區(qū)域中利用人臉的某些輪廓形狀等先驗信息來確定該區(qū)域是否存在人臉.同時,這些算法雖然都取得了某種程度的成功,卻也存在許多難以克服的缺點:①顏色模型對膚色聚類的影響,現(xiàn)有的顏色模型空間很多,如常用的RGB顏色空間,CIE的 Luv、Lab顏色空間,以及YUV、VHS、HIS彩色空間.但是,對于應用來說,一個基本的問題是人臉膚色在顏色空間中是否真的具有良好的聚類特性?如果具有好的聚集特性,則在哪一種顏色空間中膚色聚類效果最好?②類膚色區(qū)域的融合、歸并.如果待檢測圖像背景復雜,則膚色檢測結(jié)果有可能出現(xiàn)類膚色區(qū)域較多的情況,而對待檢測圖像而言,人臉存在的情況未知,即是否存在人臉,以及如果存在則其可能的位置、尺度如何,均不得而知.因此,需要根據(jù)經(jīng)驗對這些分散的類膚色區(qū)域做預先的歸并處理,如形態(tài)學處理、小區(qū)域合并等.③訓練樣本的大量需求.如基于Adaboost技術(shù)的檢測算法需要以數(shù)目巨大的訓練樣本作為基礎(chǔ),該算法誤檢現(xiàn)象相對突出.④時間復雜度.要想得到穩(wěn)定性好、檢測率高、適應性強的算法,大量時間的耗費則成為必然.⑤算法魯棒性.算法復雜度越高,檢測過程越曲折,則算法魯棒性成為必須考慮的問題.
針對上述彩色人臉檢測方法中存在的各種問題,本研究對正面端正人臉圖像以及旋轉(zhuǎn)角度較小的正面人臉圖像的檢測提出一種基于四元數(shù)的檢測方法,該方法從數(shù)學上有機融合了人臉表面的膚色信息以及反映輪廓形狀的灰度信息,檢測時對2種信息同時加以利用,從而避免出現(xiàn)傳統(tǒng)方法中將2種信息分開處理而出現(xiàn)的各種弊病.同時,以大量樣本的統(tǒng)計訓練為依據(jù),方法具有較好的準確性和較強的魯棒性.實驗結(jié)果表明,該方法具有良好的效果,為目前彩色人臉檢測方法中問題的解決提供了一種新的思路.
1.1.1 四元數(shù)的定義及其與本研究有關(guān)的命題.
設q=a+ib+jc+kd,其中a,b,c,d∈R,i,j,k滿足關(guān)系,i2=j2=k2=-1,ij=-ji=k,jk=-kj=i,ki=-ik=j,則稱q為四元數(shù).
令q1=a1+ib1+jc1+kd1,q2=a2+ib2+jc2+kd2,則四元數(shù)的基本運算法則定義如下:
本研究中,需要用到的有關(guān)四元數(shù)矩陣的概念有:令Q表示四元數(shù)集合,①設矩陣A∈Qn×n,若AH=A,則稱A為自共軛四元數(shù)矩陣,n階四元數(shù)自共軛矩陣的全體記為SCn(Q),實對稱矩陣和復Hermite矩陣都是特殊的自共軛矩陣;②設矩陣A∈Qn×n,當存在B∈Qn×n,使得AB=BA=I,則稱四元數(shù)矩陣A是可逆的,且稱B為A的逆陣,記為A-1;③設矩陣A∈Qn×n,若存在 λ ∈Q及0 ≠a∈Qn×1,使得Aa=aλ(或Aa=λa),則稱λ為矩陣A的右(或左)特征值,而a為A的屬于右(或左)特征值的特征向量.
有關(guān)命題:①(AB)H=BHAH;②設A∈SCn(Q),對任意X=(X1,X2,…,Xn)T∈Qn×1,XHAX必為實數(shù);③設A∈SCn(Q),則對任意非零X=(X1,X2,…,Xn)T∈Qn×1,有XHAX>0(≥0),則稱A為四元數(shù)(半)正定矩陣,并分別記為SC>(Q)(n(Q));④設A∈SCn(Q),若A可逆,則A-1∈SCn(Q);⑤設A∈SCn(Q),則四元數(shù)自共軛矩陣的行列式為實數(shù);⑥設A∈SCn>(Q),則A的特征值為實數(shù).
1.1.2 Fisher線性鑒別分析法在四元數(shù)中的推廣.
1)廣義Rayleigh商在四元數(shù)中的推廣.
四元數(shù)體上的Rayleigh商定義為,
設A∈SCn(Q),記 φA(α)=αHAα/αHα,其中,滿足0≠a∈Qn×1,它是Qn{0}到R的映射,稱為矩陣A的Rayleigh商.如λ1≥λ2≥…≥λn是A的特征值[15],則,
鑒于Fisher模式分類準則函數(shù)的需要,作者給出四元數(shù)廣義Rayleigh商的定義:設A∈(Q),B∈S(Q),且X∈Qn×1≠ 0,則稱,φ(X)=XHAX/XHBX為四元數(shù)矩陣A相對于四元數(shù)矩陣B的廣義Rayleigh商.
在計算過程中,會涉及到求解該式極值的問題.證明可知,求解該式極值的問題可轉(zhuǎn)換為求解方程AX=λBX的廣義特征值及廣義特征向量的問題[17].
結(jié)論1 設A∈SCn(Q),B∈SCn>(Q),則方程AX=λBX存在n個關(guān)于B共軛正交的特征向量和n個對應的實數(shù)特征值 λ1,λ2,…,λn,且滿足如下的條件,
結(jié)論2 設矩陣AH=A∈SCn(Q),BH=B∈SCn>(Q),滿足AX=λBX,則B的共軛向量系,X1,X2,…,Xn,具有性質(zhì):①Xi≠ 0,其中i=1,2,…,n;②X1,X2,…,Xn右線性無關(guān);③λi與Xi滿足方程,AXi=λiBXi,i=1,2…,n;④ 令,Q=(X1,X2,…,Xn),則QHBQ=E,且QHAQ=diag(λ1,λ2,…,λn).
2)四元數(shù)中的Fisher鑒別分析法.
設q=α+iβ+jγ+kη為四元數(shù)矢量,其中α、β、γ、η為實數(shù)矢量.Fisher判別分析法的基本思想是投影,使得投影后類與類之間的樣本投影盡量分開,而類內(nèi)的樣本投影盡量靠近,本研究定義的相應矩陣為,
①類間散布矩陣,
②類內(nèi)散布矩陣,
③總體散布矩陣,
由矩陣的以上構(gòu)造方式可知,Sb、Sw、St均為自共軛四元數(shù)矩陣.
本研究采用的Fisher準則函數(shù)為,
按上式表述可知,如果(SbX-λmaxStX)=0,則同樣滿足求解的要求.而由前述推導可知,該式能夠很方便求解,即該方程最大特征值所對應的特征向量即為本研究需要求解的最佳投影矢量.
1.1.3 基于四元數(shù)的彩色人臉檢測.
四元數(shù)的定義為q=a+bi+cj+dk,其中a,b,c,d∈R,如果將彩色圖像像素的R、G、B3個分量作為四元數(shù)的3個虛數(shù)部分,則數(shù)學上彩色圖像可表示為,
其中,(m,n)為彩色像素的位置坐標.將圖像按行展開成四元數(shù)列矢量,然后按照前述的方式構(gòu)造相關(guān)矩陣,從而一切計算問題的出發(fā)點就可以從這里開始.本研究方法的核心在于將非人臉類分為8個不同的類別,判別的時候使用Fisher鑒別分析法在每個非人臉類與人臉類之間對待檢測輸入圖像子區(qū)域做歸屬性判決.
圖1給出基于四元數(shù)的彩色人臉檢測方法的流程圖.
圖1 彩色人臉檢測方法流程圖
圖1所示的流程圖中,標號為⑥的橢圓表示彩色人臉樣本集,而8個標號為0的小矩形方框則表示8類非人臉樣本集,本研究以四元數(shù)空間中的歐氏距離為測度將非人臉樣本集分為8個類別.左上角的重疊矩形方框代表對原始圖像進行縮放處理的步驟,本研究采用多尺度檢測方式,即將待檢測輸入圖則上式的求解等價為如下模型的求解,像按1∶1.2的比例分級縮放,力求使得不同尺度的人臉都能得到檢測.標號為④的方框表示多尺度、多位置檢測中的融合處理步驟.標號為⑤的橢圓框表示對單檢測位置的8個判斷結(jié)果的綜合判定.標號為①的方框代表對待檢測輸入圖像進行全彩色均衡化處理的步驟.本研究基于四元數(shù)的人臉檢測方法的核心部分由圖中標號為③的方框所示,其中的內(nèi)容涉及到待檢測圖片中局部模式的匹配算法以及定義于實數(shù)域的相關(guān)定理在四元數(shù)中的推廣.
圖2給出本研究使用的部分樣本采集原始圖像的示例,其由200張標準身份證照片,經(jīng)過鏡向、旋
圖2 人臉樣本收集來源圖例
轉(zhuǎn)等處理辦法,總共獲取了200×6=1 200張彩色圖片源,旋轉(zhuǎn)角度分別±5°、±10°.收集樣本的時候,選用20×20像素的矩形框在每張圖片中從左到右、從下到上逐像素移動,保存所有20×20的子圖像,然后依靠主觀視覺判斷,在這些圖像中手工挑選合適的標準人臉樣本,如圖3(b)中間的圖像所示,而偏離人臉中心過多的半邊臉圖像則被認為是非人臉圖像,如圖3(a)所示.按這種采集辦法,本研究人臉庫共收集有1 200×3=3 600張標準彩色人臉樣本圖像.
圖3 人臉樣本圖像源的處理方式
為獲取統(tǒng)一的標準樣本圖像,同時避免4個角落背景顏色的干擾,本研究將20×20子圖像的4個角落作刪除處理,如圖3(b)所示.同樣,在做檢測的時候,輸入圖像中的待檢測子區(qū)域也按該方式進行預處理,以便獲得更為準確的匹配.
2.2.1 彩色非人臉樣本的收集.
為獲取在人臉與非人臉之間具有較好區(qū)分效果的彩色非人臉樣本,本研究選用了80多張彩色圖像作為非人臉樣本收集的圖片源,在這些圖片中有大部分顏色為類似于膚色的彩色風景照片,也有顏色跟膚色差異很大的圖像,然而更多的卻是尺度遠大于20×20的亞洲人臉面部圖像,部分圖例如圖4(a)所示,按該方式收集的部分非人臉樣本如圖4(b)所示.最終,本研究共收集了20 982張非人臉圖像.
圖4 非人臉樣本及其收集來源圖例
人臉作為具有彈性的自然形體,由于受到個體外貌差異、表情變化以及圖像在采集時光照、設備等因素的影響,而使得人臉圖像千差萬別、形態(tài)各異.但人臉的眼睛、鼻子、嘴巴等器官在空間位置上的分布大致相同,因此人臉又具有很強的共性.一般來講,基于統(tǒng)計的人臉檢測方法對樣本的處理都是將圖像像素按行排列成屬于高維空間的矢量.因此,人臉的共性在實際應用中體現(xiàn)為在高維矢量空間中人臉分布的類聚性.針對本研究提出的方法來說,這種共性則體現(xiàn)得更加具體,其原因為:①膚色信息對人臉類聚性的影響,因為本研究方法是將人臉的膚色信息與灰度信息從數(shù)學上融合在一起同時加以考慮,因此考慮人臉分布聚集性的時候必須考慮膚色對分布的影響.針對某一類人臉來說,如本研究采用的亞洲人臉,膚色基本上一致,因此四元數(shù)空間中膚色對人臉分布聚集性的影響是加強聚集效果,而不是令其發(fā)散;②灰度信息對人臉類聚性的影響,由于人臉形狀基本相似,因此在高維空間中代表人臉的點具有相當程度的類聚性,也就是說,這些點分布在一定空間范圍之內(nèi).
但是,對非人臉樣本來講,情況則要復雜得多.首先,就其在高維矢量空間中的分布來講,非人臉應該定義為,除人臉分布范圍之外的所有點都代表非人臉;其次,在人臉分布范圍之中,同樣存在許多人類視覺很容易辨別但是計算機硬件卻很難加以區(qū)分的屬于非人臉的點,如木偶、彩色漫畫人臉等類似于人臉,但是并不是真正的自然人臉圖像.因此,高維矢量空間中,代表非人臉的點集和代表人臉的點集屬于高維空間中的稠密子集.要在這樣的分布情形之下,找到一種能夠準確區(qū)分人臉與非人臉的算法,的確顯得很困難.本研究采用的判別待檢測子區(qū)域到底屬于人臉還是屬于非人臉的方法為Fisher鑒別分析法,但是常規(guī)的Fisher判別方法是針對2類問題而提出的.此外,由前述分析可知,彩色人臉在空間中的分布具有一定程度的聚集特性,然而非人臉的分布情況卻要復雜得多.但是,如果以歐氏距離作為測度標準,按照空間分布區(qū)域的不同將非人臉分為許多不同的類別,使得每類非人臉與人臉集之間形成Fisher方法能夠進行鑒別分析的分布情形,則該問題就可以很容易得到解決.
2.2.3 彩色非人臉樣本的分類策略.
本研究采用K-Means聚類算法對非人臉樣本集進行分類,其中關(guān)于距離的度量則采用四元數(shù)空間中的歐氏距離.對本研究收集的20 982張非人臉樣本圖像進行分類,最終獲取的8類非人臉樣本集的數(shù)目 為 3 839、919、909、2 885、2 768、4 672、1 811、3 179.通常,對于成熟的檢測方法而言,訓練集的樣本數(shù)量應該非常充分,因此,由目前的這些數(shù)據(jù)可知,仍然需要進行大量的工作去完善本研究的檢測方法.
圖5表示單尺度檢測時,同位置人臉被多次標定的情況.方法實現(xiàn)的時候,采用C(m,n)記錄判決結(jié)果,其中,坐標(m,n)表示外接矩形框左下角點的坐標,C值表示該次檢測的圖片尺度.如果單人臉檢測結(jié)果 存 在,C(m1,n1)、C(m2,n2)、…、C(mr,nr),顯然,這些記錄結(jié)果僅僅代表單張人臉,因此需要通過某種方式將這些記錄合并成一個正確結(jié)果.
圖5 單尺度、多位置融合示例
檢測時,采用25×25的矩形框由圖像左下角開始,從左到右、從下到上逐像素掃描,記錄該框內(nèi)所包含的被檢測到人臉的次數(shù),并用V(m,n)表示,其中,坐標(m,n)表示該矩形框的掃描位置,V則表示統(tǒng)計次數(shù).當整張圖片掃描結(jié)束以后,得到一數(shù)據(jù)表,表中每個位置都包含一非負整數(shù).如果表中某位置的數(shù)為0,則表示該位置不可能存在人臉;反之,則按數(shù)字的大小表示可能存在人臉的程度.顯然,該數(shù)據(jù)表中存在局部最大值的地方即為人臉存在的準確位置.本研究用R(m,n)記錄這些點的坐標以及本次掃描圖像相對于原始待檢測圖像的尺度,并利用坐標(m,n)以及R計算將該尺度轉(zhuǎn)換到原始待檢測圖像時,被檢測人臉的正確位置及其實際大小.單尺度檢測的最終結(jié)果用return(x,y)表示,(x,y)為位置坐標,而return則表示包含該人臉的外接矩形框的大小.
返回值return(x,y)表明某尺度下,圖像中人臉存在的位置及其大小.然而,不可避免的是同一張人臉在幾種尺度下都可能得到檢測,因此,返回結(jié)果為return1(x1,y1)、return2(x2,y2)、…、returnr(xr,yr),
環(huán)境檢測模塊采集的數(shù)據(jù)經(jīng)處理后傳送到主端,再由Processing編寫的上位機系統(tǒng)在PC機上顯示。系統(tǒng)節(jié)點環(huán)境數(shù)據(jù)監(jiān)測顯示如圖6所示。
如圖6所示,對此需要對最后的結(jié)果進行融合處理,以獲取較為準確、簡潔的檢測結(jié)果.
圖6 單位置、多尺度融合示例
同單尺度、多位置融合算法類似,單位置多尺度融合采用15×15的矩形框從原始圖像的左下角開始,從左向右、從下到上逐像素掃描,在每個掃描位置,用V(x,y)記錄此時矩形框中被檢測到人臉的次數(shù),坐標(x,y)表示矩形框所處的位置.掃描結(jié)束后,尋找數(shù)據(jù)表中的局部極大值點,記錄以該點為中心的15×15矩形框內(nèi)檢測到的所有人臉的平均大小.最后,用finalposition(m,n)表示該點位置及平均臉大小,并利用該數(shù)據(jù)繪制人臉外接矩形框.
設X為某類非人臉樣本集與人臉樣本集之間的最優(yōu)鑒別矢量,fi為人臉樣本,f0i為該樣本在最優(yōu)鑒別矢量上的投影,f為人臉樣本集的中心,而f0為該中心在同一鑒別矢量上的投影.同樣,設mi為某類非人臉樣本集中的樣本,m0i為該樣本在最優(yōu)鑒別矢量上的投影,m為該類非人臉樣本集的中心,而m0為該中心在該鑒別矢量X上的投影,則人臉樣本集和非人臉樣本集的離散度可以表示為,
通過兩類樣本集的離散度,則可以按如下方式獲取在兩類之間作歸屬性判別時所需要的判決閾值,
設Y表示待判決局部子區(qū)域的矢量表示,y=YTX為該矢量在最佳鑒別矢量上的投影,則最終的判決準則可以采用如下方式,
其中,F(xiàn)表示人臉集合,M表示非人臉集合.
可見,在實際判決過程中,對任意待判決局部子區(qū)域而言,將其投影到8個最優(yōu)鑒別矢量上作8次判決,因此會出現(xiàn)8種判決結(jié)果.本研究對這8個結(jié)果的最終決策辦法是,如果被判斷為屬于人臉的次數(shù)多于或者等于被判為非人臉的次數(shù),則將該子區(qū)域圖像判決為人臉,否則為非人臉.
實驗結(jié)果表明,如果圖片背景顏色單一,同時人臉膚色分布與樣本人臉膚色相差較小的時候,本方法檢測效果最佳.測試過程中,本研究將樣本收集源中的照片作為測試對象,檢測率高達100%,而對特意選取的同樣本收集源圖像拍攝條件完全一致的20張照片所進行的檢測結(jié)果表明,與預期的理想結(jié)果基本一致(見圖7),這表明本研究方法是可行性的.
圖7 拍攝環(huán)境與樣本完全一致的圖像檢測結(jié)果
此外,如圖7所示,令人意外的是檢測中有2張照片的人臉都附帶有額外的小方框,該矩形框包含以眉中間位置為中心的小塊區(qū)域.對于這樣的檢測結(jié)果,在本研究所做的測試中并不是個別現(xiàn)象,絕大多數(shù)圖片的結(jié)果中,在人臉圖像的該位置都出現(xiàn)了類似的小矩形框.之所以出現(xiàn)這種情況,可能是因為:本方法的核心是將待檢測子圖像矢量向最優(yōu)鑒別矢量作投影,然后根據(jù)該投影是偏向人臉類還是非人臉類而做出最后的歸屬性判決.因此,將理想的人臉外接矩形區(qū)域與額外附屬區(qū)域經(jīng)歸一化處理成維數(shù)相同的矢量,并向鑒別矢量作投影,如果得到的2個投影值基本相同的話,就會出現(xiàn)這種情況.
圖8 簡單背景下數(shù)碼相機拍攝照片的檢測結(jié)果
圖8給出作者對自己拍攝的簡單背景人臉圖像進行檢測的結(jié)果示例,其中圖(a)所包含的人臉其膚色跟人臉樣本庫中的人臉膚色相似,而圖(b)中人臉膚色跟樣本庫中的人臉膚色存在一定的差異.檢測結(jié)果表明,圖(a)中人臉外接矩形的位置與理想情況差不多,但是由于融合算法還不是很理想,因此,檢測結(jié)果中出現(xiàn)多個矩形并存的情形,另外前述的額外矩形仍然存在.圖(b)的測試效果則不是很好,外接矩形所包含的區(qū)域跟理想的情況存在一定的偏差,即矩形框的中心位置上移.
圖9為本檢測系統(tǒng)對簡單背景網(wǎng)絡照片的測試結(jié)果,其中圖(a)所包含的人臉膚色與樣本集人臉膚色相似,而圖(b)中的人臉膚色與樣本集人臉膚色存在差異,并且包含2張歐洲人臉照片.由圖(a)中各人臉外接矩形的位置可知,如果待檢測圖片中人臉膚色與樣本庫中人臉膚色類似,本算法能夠得到較好的檢測效果,在人臉旋轉(zhuǎn)角度不是很大的情況下,同樣能夠得到理想的檢測效果,如圖(a)中第4張照片.同時,如果人臉附屬物不是很明顯的話,對本方法檢測性能的影響并不嚴重.
圖9 簡單背景網(wǎng)絡照片的檢測結(jié)果
但是,如果網(wǎng)絡照片所包含人臉的膚色與樣本集人臉膚色存在一定差異,則不能得到滿意的檢測結(jié)果.圖10、圖11給出復雜背景下本檢測方法對不同光照環(huán)境下所拍攝圖像的檢測結(jié)果.這些圖像背景相對而言較為復雜,且色彩變化較大,同時與所包含人臉的膚色仍有一定的差距.
圖10中的照片由作者自己拍攝并剪輯,其中圖(a)中人臉膚色同樣本集人臉膚色比較接近,而圖(b)中的人臉膚色與樣本人臉膚色相比則存在一定差異.就檢測效果而言,圖(a)的檢測結(jié)果與預計較為吻合,但是對于圖(b)而言則檢測效果較差,不但人臉不能被準確定位,而且誤檢現(xiàn)象較為突出.第1張圖像不能得到準確的檢測卻在預料之中,首先人臉樣本庫中沒有采集小孩子的照片,同時該圖片中小孩面部與樣本庫中人臉膚色相差很大.第2張照片所包含的人物略帶淡狀,同時照片有輕微的處理痕跡,因此,本檢測系統(tǒng)難以對其進行準確的定位,同時存在誤檢.
圖11中的照片來源于Internet網(wǎng)絡,其中的照片是通過剪輯獲取的包含單人臉的圖像.測試結(jié)果表明,由于膚色與樣本人臉相似的,因此檢測效果較為理想,除開額外矩形框仍舊存在以外,包含眼睛、鼻子、嘴巴的人臉外接矩形定位較為準確.
圖11 復雜背景網(wǎng)絡照片的檢測結(jié)果
表1所包含的數(shù)據(jù)為本研究方法對作者分類收集的圖像進行測試的統(tǒng)計結(jié)果.由表1中數(shù)據(jù)可知,簡單背景下本研究方法的檢測效果要遠好于復雜背景下的檢測效果,而膚色與樣本集人臉相近的圖像,其檢測結(jié)果好于顏色存在差異的圖像.
表1 本研究算法實驗測試結(jié)果數(shù)據(jù)統(tǒng)計
此外,為與優(yōu)秀的算法進行性能對比分析,以便于對作者提出的方法進行改進,在本研究測試集中,作者采用基于adaboost算法的檢測方法進行測試,檢測結(jié)果數(shù)據(jù)如表2所示.
表2 adaboost算法實驗測試結(jié)果數(shù)據(jù)統(tǒng)計
由表1、表2的統(tǒng)計結(jié)果可知,除開某些特殊情況外,基于adaboost算法的檢測方法其性能要好于本檢測方法.
利用四元數(shù)及其矩陣的相關(guān)知識,本研究將定義于實數(shù)域的廣義Rayleigh商向四元數(shù)體做了合理的推廣,以此為基礎(chǔ)得到四元數(shù)體上的Fisher鑒別分析法,并在模式識別領(lǐng)域采用該策略,得到一種新穎的彩色人臉檢測算法,從數(shù)學上融合彩色像素的R、G、B3分量,使得彩色人臉的膚色信息和反映人臉形狀結(jié)構(gòu)的灰度信息能夠同時得到利用.測試結(jié)果表明,本研究關(guān)于四元數(shù)體的各種推廣結(jié)論成立,同時可以應用于實際問題的解決,提出的關(guān)于彩色人臉的檢測算法符合具體問題的應用要求,為高效人臉檢測算法的尋找提供了一種新的思路.
相對于傳統(tǒng)的許多方法而言,基于四元數(shù)的彩色人臉檢測算法有其天然的優(yōu)勢,盡管與基于adaboost算法的檢測能力相比較而言,本研究的檢測方法的性能還沒有達到相當理想的效果,但是,由前述相關(guān)內(nèi)容的分析可知,這并不完全是算法本身的缺陷,而是由其他可以避免和改進的原因所造成,這需要在以后的研究工作中繼續(xù)進行探索.
:
[1]Hjelmas E,Low B K.Face detection:a survey[J].Computer Vision and Image Understanding,2001,83(3):236-274.
[2]De Silva L C,Aizawa K,Hatori M.Detection and tracking of facial features[C]//'95Proceedings of Machine Vision Conference.New York:SPIE Digital Library,1995:1195-1207.
[3]Hsu R L,Abdel-Mottaleb M.Face detection in color images[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2003,24(5):696-706.
[4]Jain A K,Duin R P W,Mao J C.Statistical pattern recognition:a review[J].IEEE Transaction on Pattern Analysis and Machine Intelligence,2000,22(1):4-37.
[5]Cootes T F,Taylor C J.Active shape models-‘smart snakes’[C]//Proceedings of British Machine Vision Conference.London:Springer-verlag,1992:266-275.
[6]Moghaddam B,Pentland A.Probabilistic visual learning for object representation[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,1997,19(7):696-710.
[7]Moghaddam B,Pentland A.Beyond linear eigensp-aces:Bayesian matching for face recognition[C]//Face Recognition from Theory to Application.New York:Springer-Verlag,230-243.
[8]Sung K,Poggio T.Example-Based learning for view-based human face detection[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,1998,20(1):39-51.
[9]Rowley H A,Baluja S,Kanade T.Neural network-based face detection[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,1998,20(1):23-38.
[10]Osuna E,F(xiàn)reund R.Girosi F.Training support vector machines:an application to face detection[C]//Proccedings of the CVPR.Puerto Rico,IEEE Press,1997:130-136.
[11]Lee C H,Kim J S,Park K H.Automatic human face location in a complex background using motion and color information[J].Pattern Recognition,1996,29(11):1877-1889.
[12]Kafer M,Benois-Pineau J.Detection of human faces in color image sequences with arbitrary motions for very low bitrate videophone coding[J].Pattern Recognition Letters,1997,18(14):1503-1518.
[13]Garcia C,Tziritas G.Face detection using quantized skin color regions merging and wavelet packet analysis[J].IEEE Transactions on Multimedia,1999,1(3):264-277.
[14]Hsu R L,Abdel-Mottaleb M,Jain A K.Face detection in color images[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2002,24(5):696-706.
[15]Li W L.Quaternion Matrix[M].ChangSha:National Univercity of Defense Technology Press,2002.
[16]Ai H Z,Liang L H,Xu G Y.Skin color and template based face detection[J].Jounal of Software,2001,12(12):1784-1792.
[17]郎方年,周激流,宋恩彬,等.廣義Rayleigh商在四元數(shù)上的推廣及其在圖像信息融合中的應用[J].激光雜志,2006,27(3):39-40.
Quaternion Based Color Face Detection
LANG Fangnian1,TIAN Liyuan2,LIU Lili3,DONG Kailing4
(1.School of Information Science and Technology,Chengdu University,Chengdu 610106,China;2.Information Section of Affiliated Hospital,Jiangsu University,Zhenjiang 212013,China;3.Adult Education Branch,Yingkou Vocational and Technical College,Yingkou 115000,China;4.School of Transportation and Logistics,Southwest Jiaotong University,Chengdu 610031,China)
A novel color face detection algorithm based on quaternion is proposed in this paper.Compared with conventional face detection method,which has relatively low detection speed based on the separation of face color detection and face confirming,our method improves the detection speed and advances the stability through simultaneously making use of face color information and gray information which reflects the contour of face.In this paper,the simple introduction of the detection system is given firstly,then every part of our detection system is presented in detail according to the flow-chart,which includes:the generalization of general Rayleigh-quotien and Fisher discriminant algorithm defined in real field;the application principle of Fisher discriminant algorithm based on quaternion in color face detection method;the collection and pre-processing of color face sample set;the collection of color nonface sample set and the principle and reason of its classifying;the fusing problem of multi-scale detection.The detailed mathematical demonstration indicates that our detection algorithm based on quaternion is rational and feasible,and it satisfies real time demand.The tests based on a large amount of samples show that our method has high detection speed,high correct detection rate,and is very robust.
feature fusion;feature extraction;quaternion;self-conjugate matrix;classification;face detection
TP391
A
1004-5422(2013)03-0254-09
2013-06-15.
國家自然科學基金(61173121)、中國博士后基金(20100471665)資助項目.
郎方年(1974—),男,博士,副教授,從事數(shù)字圖像處理、生物特征識別及人工智能等研究.