夏慧卿,張麗艷,吳曉天,柯飄,張慶東
(1.大連交通大學(xué) 電氣信息學(xué)院,遼寧 大連 116028; 2.大連造船廠工具實業(yè)公司,遼寧 大連 116035)*
Adaboost人眼定位方法改進與實現(xiàn)
夏慧卿1,張麗艷1,吳曉天1,柯飄1,張慶東2
(1.大連交通大學(xué) 電氣信息學(xué)院,遼寧 大連 116028; 2.大連造船廠工具實業(yè)公司,遼寧 大連 116035)*
提出了基于改進的Adaboost方法來實現(xiàn)人臉圖片中人眼的精確定位.首先在待檢測的圖片中利用人臉分類器定位出人臉,然后在所得人臉圖像上進一步利用人眼分類器精確定位人眼.改進后的Adaboost算法與傳統(tǒng)方法相比,具有構(gòu)建分雙層分類器所需要的特征數(shù)目降低、算法精確性提高和實時性的特點.
Adaboost;人眼定位;聯(lián)級分類器
遠程教育的發(fā)展歷程,經(jīng)過函授、幻燈、信息化等等,一直沒有能對傳統(tǒng)教育模式形成挑戰(zhàn)[1].但是隨著科技的持續(xù)驅(qū)動,這種挑戰(zhàn)成為可能.中國開放大學(xué)遠程教育云[2]已經(jīng)初具規(guī)模,對任何類別的人都有所教,而且對不同類別的人有不一樣的教育方式.隨著遠程教育的發(fā)展,隨之而來的問題就是怎么才能保證遠程教育的效能呢?通過人眼定位可實現(xiàn)對學(xué)生的學(xué)習(xí)認真程度作出一定的判斷,并給出相關(guān)定論.
目前,人眼定位的方法有了很多,主要的定位方法包括:幾何特征以及灰度特征[3- 4]的方法,該算法在復(fù)雜的光照下檢測率大大降低而且算法也比較復(fù)雜;基于統(tǒng)計學(xué)習(xí)的方法[5- 6],充分將機器學(xué)習(xí)中的弱學(xué)習(xí)定理運用其中.本算法將對大量的目標樣本與非目標樣本進行學(xué)習(xí)并獲得相關(guān)模型數(shù)據(jù),與此同時構(gòu)建了檢測用的分類器或者濾波器,這樣就大大的提高了檢測的精度,使人眼檢測研究成為熱點之一.
本文將Haar-Like特征用于Adaboost算法[7]并結(jié)合Viola等的人臉檢測級聯(lián)模型[8],訓(xùn)練出人臉分類器,既而獲得人臉.對得到的人臉圖片通過雙眼分類器以及單眼分類器的方式對眼睛進行定位.首先,利用雙眼分類器對眼睛的敏感區(qū)域進行確定,從而實現(xiàn)人眼的粗定位.然后,在粗定位所得的區(qū)域,利用單眼分類器進行檢測,輸出的人眼圖像即為精確人眼位置.為了避免傳統(tǒng)Adaboost算法檢測所存在的誤檢問題,本文將采用雙層結(jié)構(gòu)的分類器能夠克服這些問題,還能夠解決其它人眼定位結(jié)構(gòu)復(fù)雜、檢測速度慢以及人眼配對復(fù)雜等難題.
利用Adaboost算法對人臉人眼進行檢測,就是要通過提取出某種特征才能解決算法的輸入問題.Haar-Like特征[9- 10]能夠描述圖像局部區(qū)域的灰度分布特點,因而可以作為特征提取的一種方法.Haar-Like特征是由線性特征、邊緣特征和中心特征組成的特征模板.模版中每個特征都是由黑白兩種顏色矩形組成,并且將白色矩形像素之和與黑色矩形像素之和做差,得到的值定義為模板特征值.訓(xùn)練樣本圖像的時候,圖像樣本的矩陣大小決定需要的Haar-Like特征的數(shù)量,矩陣越大所需數(shù)量越大.窗口內(nèi)的特征模板[11]所在的每一個位置都對應(yīng)一種特征.就這樣把窗口內(nèi)的所有特征都找到就可以為弱分類器的訓(xùn)練做鋪墊.實際中每幅圖片都是有限數(shù)據(jù)的,因此就可以快速準確地利用矩形特征計算并能夠計算出每個區(qū)域的狀態(tài).不僅可以加快檢測速度和靈活的檢測方式,還可以處理多分辨率多尺度的圖像.其中圖1中是簡單面部和眼部的矩形特征描述.
圖1 矩形特征說明
在基于統(tǒng)計學(xué)習(xí)的檢測算法中,Adaboost算法是比較普遍也比較好用的方法.近些年,Adaboost算法的檢測技術(shù)不斷的發(fā)展和完善,在領(lǐng)域內(nèi)取得了一定程度上成功.不但檢測率方面已經(jīng)達到較高的水平,而且可以實現(xiàn)實時檢測.
Adaboost算法在訓(xùn)練開始時,對所有的正負樣本設(shè)置一個相等的初始權(quán)重[12].分類器經(jīng)過一輪完成訓(xùn)練之后,通過訓(xùn)練集上的結(jié)果和分類的準確率作為評判標準,考慮是否重新調(diào)整樣本的權(quán)重;進入到下一輪迭代時,上一輪分類錯誤的樣本概率提高,而正確樣本概率降低.就這樣在下一輪迭代時,弱分類器更加注重錯誤樣本的分類.
強分類器的訓(xùn)練算法如下:
(1)對于n個學(xué)習(xí)樣本{x1,Y1},{x2,Y2},…,{xn,Yn},其中,每個x1,都是X的一個實例,即xi∈X,在人臉檢測中就是輸入的人臉圖像,每一個Yi是對應(yīng)于xi的輸出結(jié)果集Y,人臉檢測只有2個類的問題,則yi∈Y={-1,+1},設(shè)n個樣本中有P個正樣本和q個負樣本;
(3)對于t=1,2,...,-1,調(diào)用一個給定的弱學(xué)習(xí)算法,執(zhí)行以下4個步驟:
②對于每一個特征j,訓(xùn)練弱分類器hj與Et,j相關(guān)的誤差為εt,其中:
同時選擇具有最小εt的ht.
③更新權(quán)值,令:
當分類器正確時,ht(xi)=yi,ei=0,而當分類器錯誤時,ht(xi)≠yi,ei=1.
④最后輸出的假設(shè)為:
其中,αt=log(1/βt).
(4)將訓(xùn)練的各級簡單分類器級聯(lián)構(gòu)造為第n級強分類器fn.
將得到的強分類器串聯(lián)在一起,這種結(jié)構(gòu)稱之為聯(lián)級分類器,可以更好的提高檢測精度.在這樣一個多層結(jié)構(gòu)上看,可以理解為一個決策樹.在這個級聯(lián)結(jié)構(gòu)中,強分類器的級數(shù)是越來越復(fù)雜,也越來越嚴格.只有在剛開始的級數(shù)里分類特征較少,越往后特征數(shù)目越多.
眼睛的強分類器是訓(xùn)練雙眼分類器和訓(xùn)練單眼分類器聯(lián)級而成的.兩個分類器又分先后順序,雙眼分類器在前,單眼分類器在后.當已定位的人臉圖像輸入后,將圖像送入雙眼分類器進行檢測,形成人眼粗定位;粗定位后再送入單眼分類器中檢測,從而定位出人眼的位置,即為精確定位;最后將精確定位結(jié)構(gòu)輸出.
Adaboost算法的人眼訓(xùn)練系統(tǒng)和人眼檢測系統(tǒng)如圖2所示.主要由訓(xùn)練和檢測的兩部分組成.
(1)訓(xùn)練部分
將收集的人臉樣本和非人臉樣本的尺寸以及光照歸一化,減小訓(xùn)練樣本類內(nèi)差距.根據(jù)幾個樣本的積分圖,便于計算樣本的Haar-Like特征,提取所有的特征并生成特征空間,使用Adaboost算法對每一個特征構(gòu)造成一個弱分類器.根據(jù)歸一化因子最小化原則,選擇一個最優(yōu)的弱分類器.根據(jù)樣本輸出的權(quán)重不斷的迭代,直到符合分類誤差.將所得的最優(yōu)弱分類器整合成強分類器.
(2)檢測部分
分類器訓(xùn)練的特征一般存儲為xml文件,通過該文件對檢測圖片進行檢測.其中分類器是由若干個強分類器構(gòu)成聯(lián)級分類器.在圖像中檢測結(jié)構(gòu)以目標矩形來呈現(xiàn).人臉定位是為了減小檢測區(qū)域,使得人眼定位檢測的范圍縮小以及計算速度更快.在人臉檢測時,考慮到人臉在目標圖片上占的比例比較大,則可以擴大搜索目標使檢測速度更快.通過人臉定位之后所得圖像,利用雙層結(jié)構(gòu)分類器對人眼進行定位,可達到運算量減少計算速度快的目的. 算法是以Visual Studio 2010為運行環(huán)境使用OpenCV庫,并且在源碼中添加了一個CvRectface_domain參數(shù),實現(xiàn)檢索區(qū)域限定.本文算法采用檢測區(qū)域范圍縮小從而減小了算法計算量.
圖2 系統(tǒng)訓(xùn)練框架
Adaboost算法在訓(xùn)練中使用的人眼庫是從http://face.urtho.net中提供的數(shù)據(jù)集,還有人臉庫ORL庫中剪切的人眼圖片以及自己制作的人眼圖片1 500張.對于本算法進行驗證,通過對網(wǎng)上圖片和自拍圖片等樣本進行檢測,檢測效果如圖3所示.
(a) 網(wǎng)絡(luò)圖片
(b) 自拍圖片
在最后一幅圖中只定位了一只眼睛,表明該算法對戴眼鏡的人檢測時存在漏檢的情況,因此算法還有待改進完善.
本文提出的是基于雙眼和單眼的Adaboost分類器聯(lián)級而成的雙層結(jié)構(gòu)人眼分類器.這樣既延續(xù)了傳統(tǒng)Adaboost算法對較暗環(huán)境和光照變化較大情況的人眼追蹤特點.在前一層雙眼分類器檢測中,成功的縮小了待檢測的樣本范圍,為后一層單眼分類器檢測時,降低檢測多余的誤檢情況,使人眼檢測正確率提高.本算法的實現(xiàn)既具有較高的魯棒性和精度問題,還易于實現(xiàn).該算法應(yīng)用到在未來遠程教育系統(tǒng)上,將取得更大的進展.
[1]仕超.遠程教育創(chuàng)新體系特色探析——評《遠程教育概論》[J].中國教育學(xué)刊,2016(2):114.
[2]馮雪冰.我國遠程教育政策發(fā)展及演變特征分析[D].北京:北京郵電大學(xué),2014.
[3]鄭玉鐸,田楊萌,靳薇.基于AdaBoost和ASM算法的人眼定位[J].北京信息科技大學(xué)學(xué)報(自然科學(xué)版),2013(3):73- 76,81.
[4]QIUPING WANG,TIEPENG WANG,KE ZHANG.Image edge detection based on the grey prediction model and discrete wavelet transform[J].Kybernetes,2012,41(5/6):617- 621.
[5]張志文,付永慶.基于眼球運動狀態(tài)檢測的疲勞預(yù)警系統(tǒng)研究[J].計算機與數(shù)字工程,2016(2):255- 258.
[6]SUJING WANG,HUILING CHEN,WENJINH YAN,et al.Face Recognition and Micro-expression Recognition Based on Discriminant Tensor Subspace Analysis Plus Extreme Learning Machine[J].Neural Processing Letters,2014,39(1):25- 43.
[7]DONG WANG,JING YANG,JIANKANG DENG,et al.FaceHunter:A multi-task convolutional neural network based face detector[J].Signal Processing:Image Communication,2016,47:476- 481.
[8]曹正貴,馬文,王志鋒.基于膚色與新型Haar-Like特征的人臉檢測算法研究[J].廣東通信技術(shù),2015(11):27- 32,40.
[9]吳正平,楊杰,崔曉夢,等.融合L2范數(shù)最小化和壓縮Haar-like特征匹配的快速目標跟蹤[J].電子與信息學(xué)報,2016(11):2803- 2810.
[10]SRI-KAUSHIK PAVANI,DAVID DELGADO-GOMEZ,ALEJANDRO F.Gaussian weak classifiers based on co-occurring Haar-like features for face detection[J].Pattern Analysis and Applications,2014,17(2):431- 439.
[11]唐杰,文貢堅.基于改進AdaBoost分類器的一種目標識別算法[J].無線互聯(lián)科技,2016,20:100- 104.
[12]劉相濱,周治民,張波云.一種復(fù)雜環(huán)境下的人眼定位算法[J].湖南師范大學(xué)自然科學(xué)學(xué)報,2015(4):85- 89.
Improved and Implementation of Adaboost Eye Location Method
XIA Huiqing1,ZHANG Liyan1,WU Xiaotian1,KE Piao1,ZHANG Qingdong2
(1.School of Electrical & Information Engineering,Dalian Jiaotong University,Dalian 116028,China; 2.Dalian Shipyard Tools Industrg Co.,Dalian 116035,China)
An improved Adaboost method is proposed to realize the accurate positioning of human eyes in face images.Firstly,a face classifier is used to locate the human face in the image to be detected.Then,the human face image is further used to locate the human eye accurately.Compared with the traditional method, the improved Adaboost algorithm has the characteristics of reducing the number of features and improving the accuracy of the algorithm and real-time.
adaboost;eye location;joint classifier
1673- 9590(2017)05- 0111- 04
A
2016- 12- 23
夏慧卿(1989-),男,碩士研究生; 張麗艷(1974-),女,副教授,博士,主要從事信號處理、嵌入式系統(tǒng)開發(fā)的研究
E-mail:xiahuiqing007@163.com.