任小芹 段昭霞
摘要:針對(duì)目前人臉檢測(cè)速度較慢,近年來一種基于adaboost的人臉檢測(cè)算法受到很大關(guān)注,其主要特點(diǎn)是能夠快速檢測(cè)。為了更深入的了解adaboost算法,本文詳細(xì)闡述了該算法的組成原理,并對(duì)存在的不足提出了一定的改進(jìn)方案。
關(guān)鍵詞:人臉檢測(cè);adaboost算法
第一章 國(guó)內(nèi)外研究現(xiàn)狀
AdaBoost是最具有典型性的集成機(jī)器學(xué)習(xí)方法,其核心思想是針對(duì)同一個(gè)訓(xùn)練集訓(xùn)練不同的弱分類器——識(shí)別率僅好于隨機(jī)的猜測(cè)的學(xué)習(xí)算法,然后把這些弱分類器集合起來,構(gòu)成一個(gè)最終的強(qiáng)分類器——通過一組樣本的學(xué)習(xí)后,能夠達(dá)到理想的識(shí)別率的學(xué)習(xí)算法。
第二章 算法詳述
2.1 算法原理
2.1.1弱學(xué)習(xí)與強(qiáng)學(xué)習(xí)
如何根據(jù)觀測(cè)數(shù)據(jù)來學(xué)習(xí)并得到精確的假設(shè)是機(jī)器學(xué)習(xí)領(lǐng)域中人們非常關(guān)注的一個(gè)問題,機(jī)器學(xué)習(xí)的一個(gè)重要目標(biāo)就是對(duì)新的樣本盡可能給出精確的估計(jì)。
生成只比隨機(jī)猜測(cè)好一點(diǎn)的弱學(xué)習(xí)算法很容易,但是構(gòu)造一個(gè)強(qiáng)學(xué)習(xí)算法卻是一件相當(dāng)困難的事情。Kearns提出了弱學(xué)習(xí)算法與強(qiáng)學(xué)習(xí)算法間的等價(jià)問題——是否能把弱學(xué)習(xí)算法轉(zhuǎn)化為強(qiáng)學(xué)習(xí)算法。如果兩者等價(jià),則只需要找到一個(gè)弱學(xué)習(xí)算法就可以直接將其提升為強(qiáng)學(xué)習(xí)算法。Kearns 和Valiant 證明:只要有足夠的數(shù)據(jù),弱學(xué)習(xí)算法就能通過集成的方式生成任意高精度的假設(shè)(強(qiáng)學(xué)習(xí)方法)。
2.1.2類haar特征(矩形特征)
使用簡(jiǎn)單矩形組合作為特征模板。這類特征模板都是由兩個(gè)或多全等的矩形相鄰組合而成,特征模板內(nèi)有白色和黑色兩種矩形(定義左上角的為白色,然后依次交錯(cuò)),并將此特征模板的特征值定義為白色矩形像素和的減去黑色矩形像素和。
2.1.3積分圖
對(duì)于圖像內(nèi)一點(diǎn) A( x, y),定義其積分圖ii( x, y)為:
其中i(x′,y′)為點(diǎn)(x′,y′)處的“原始圖”,是此點(diǎn)的顏色值;對(duì)于灰度圖像,其值為0~255。對(duì)于彩色圖像,可以先按照人臉色彩空間將其轉(zhuǎn)化為灰度取值。
2.1.4圖像預(yù)處理
灰度規(guī)范化的目的是改善圖像質(zhì)量,并將其灰度統(tǒng)一到給定的標(biāo)準(zhǔn),它一般包括灰度變換、直方圖均衡化。
1、灰度變換:對(duì)原始圖像進(jìn)行彩色圖像到灰度圖像的變換。一般有三種方式:
其中,R,G,B分別代表彩色圖像中的紅色、綠色和藍(lán)色分量
2、直方圖均衡化是通過灰度變換將一幅圖象轉(zhuǎn)換為另一幅具有均衡化的直方圖,即在每個(gè)灰度級(jí)上都具有相同的象素點(diǎn)數(shù)的過程。
2.2 adaboost訓(xùn)練算法
2.2.1強(qiáng)分類器的訓(xùn)練
2.2.1.1流程描述
1. 給定訓(xùn)練樣本集S,共N個(gè)樣本,其中X和Y分別對(duì)應(yīng)于正樣本和負(fù)樣本; T為訓(xùn)練的最大循環(huán)次數(shù);
2. 初始化樣本權(quán)重為1/N ,即為訓(xùn)練樣本的初始概率分布;
3. 第一次迭代訓(xùn)練N個(gè)樣本,得到第一個(gè)最優(yōu)弱分類器;
4. 提高上一輪中被誤判的樣本的權(quán)重;
5. 將新的樣本和上次本分錯(cuò)的樣本放在一起進(jìn)行新一輪的訓(xùn)練。
6. 循環(huán)執(zhí)行4-5步驟,T輪后得到T個(gè)最優(yōu)弱分類器。
7.組合T個(gè)最優(yōu)弱分類器得到強(qiáng)分類器,組合方式如下:
2.2.2級(jí)聯(lián)強(qiáng)分類器
2.2.2.1流程描述
2.3 算法優(yōu)劣分析
2.3.1優(yōu)點(diǎn):
(1) Adaboost 是一個(gè)高檢測(cè)率低拒絕率的多層級(jí)聯(lián)分類器;
(2) 采用Haar特征比單個(gè)像素點(diǎn)更具有代表性;
(3) 它的積分圖像技術(shù)加速了矩形圖像區(qū)域的值的計(jì)算;
(4) 它使用統(tǒng)計(jì) boosting 來創(chuàng)建類問題(人臉與非人臉的)的分類器節(jié)點(diǎn),該節(jié)點(diǎn)應(yīng)具備高通過率,低拒絕率。
2.3.2缺點(diǎn):
(1) 基本類Haar特征不能表示側(cè)面人臉,即不能實(shí)現(xiàn)側(cè)臉識(shí)別(要實(shí)現(xiàn)側(cè)臉檢測(cè),可以提出新的矩形特征);
(2)在訓(xùn)練分類器時(shí)計(jì)算量較大;
(3)將不同類別同等對(duì)待,即沒有考慮錯(cuò)誤分類不同類別樣本的代價(jià)的不同,將導(dǎo)致檢測(cè)效果不是很好。
第三章 改進(jìn)方向分析
3.1改進(jìn)方向簡(jiǎn)述
(1) 由于將此類adaboost算法在設(shè)置初始權(quán)重時(shí)對(duì)于不同類別同等對(duì)待,即沒有考慮錯(cuò)誤分類不同類別樣本的代價(jià)的不同,那么通過調(diào)整權(quán)重的更新的方法,以達(dá)到提升分類器性能,提高分類效果;
(2) 由于此adaboost算法中所使用的矩形特征相對(duì)簡(jiǎn)單,對(duì)圖像特征的表達(dá)并不完整,通過改進(jìn)adaboost的訓(xùn)練方法,使其能更有效的提高adaboost算法的檢測(cè)能力;
(3) 由于此adaboost算法所使用的矩形特征只能識(shí)別正面人臉,因此通過結(jié)合其它功能算法,實(shí)現(xiàn)側(cè)臉的檢測(cè)。
[參考文獻(xiàn)]
[1]王映輝.《人臉識(shí)別:原理、方法與技術(shù)》.科學(xué)出版社.2010.
[2]王志良,孟秀艷.《人臉工程學(xué)》.機(jī)械工業(yè)出版社.2008.
[3]程正東.《基于子空間的人臉識(shí)別》.清華大學(xué)出版社.2009.endprint