李思潼 馮彥婕 杜帥 朱從亮 東北林業(yè)大學(xué)
近幾年,人機(jī)交互技術(shù)的應(yīng)用越來越廣泛,唇語識(shí)別作為人機(jī)交互中的關(guān)鍵技術(shù),也越發(fā)受到關(guān)注。谷歌DeepMind實(shí)驗(yàn)室提出了一種新的唇語識(shí)別技術(shù)LipNet。目前唇語識(shí)別技術(shù)主要是針對(duì)語音識(shí)別在噪聲較大環(huán)境下的識(shí)別率問題,作為對(duì)語音識(shí)別的補(bǔ)充和糾正。
關(guān)于唇語識(shí)別研究的熱點(diǎn)主要在嘴唇特征提取以及唇動(dòng)特征跟蹤上,但如何從靜態(tài)圖片或動(dòng)態(tài)視頻流中檢測(cè)出人臉和嘴唇區(qū)域并將嘴唇提取出來,對(duì)之后的嘴唇特征提取有著至關(guān)重要的影響。文獻(xiàn)提出了使用RGB色彩空間對(duì)嘴唇區(qū)域進(jìn)行提取,利用唇色與膚色在G、B分量上的差異對(duì)嘴唇進(jìn)行提取。本文使用開源的計(jì)算機(jī)視覺庫(OpenCv)中預(yù)先訓(xùn)練好的Harr Cascada分類器對(duì)人臉區(qū)域和嘴唇區(qū)域進(jìn)行檢測(cè),之后對(duì)分割出來的嘴唇區(qū)域利用色彩空間進(jìn)行嘴唇提取。
Paul Viola提出了一種快速的人臉檢測(cè)算法,該算法是一種基于Haar-like特征和AdaBoost自適應(yīng)增強(qiáng)算法的人臉檢測(cè)算法,OpenCv中給出了該算法的實(shí)現(xiàn)。
Haar特征首先由Papageorgiou提出,用于對(duì)物體和人臉的快速檢測(cè),之后Rainer Lienhart在文獻(xiàn)對(duì)其進(jìn)行了補(bǔ)充,形成了Haar-like矩形特征庫。本文所使用的OpenCv中的Harr Cascad分類器便是基于此特征庫編寫的。
由于使用Haar特征進(jìn)行檢測(cè)的特征數(shù)目過大,往往使用積分圖的方式對(duì)矩形特征值進(jìn)行計(jì)算。積分圖的計(jì)算方法如下:在圖像中取矩形D,其四個(gè)角的位置按順時(shí)針方向分別標(biāo)記為1、2、3、4,則其像素和可以根據(jù)如下公式計(jì)算:
AdaBoost算法是一個(gè)迭代過程,其思想是將分類效果較差的弱分類器組合起來,形成效果較好的強(qiáng)分類器。在過程中,AdaBoost算法不斷提高被錯(cuò)誤分類的樣本的權(quán)值,使之在后面的訓(xùn)練中所占的比重更大,更新權(quán)值公式為
其中,Zm是規(guī)范化因子,am是基本分類器的系數(shù)
每一個(gè)Haar-like特征值便可視作一個(gè)弱分類器,通過AdaBoost算法后便可形成檢測(cè)能力較強(qiáng)的強(qiáng)分類器,多個(gè)強(qiáng)分類器通過級(jí)聯(lián)的方式組合起來,就形成了本文所使用的Harr Cascad分類器,如圖1所示。
圖1 級(jí)聯(lián)分類器
根據(jù)Haar-like特征和AdaBoost算法可以對(duì)人臉和嘴唇區(qū)域進(jìn)行檢測(cè),并將檢測(cè)到的嘴唇區(qū)域分割出來,這樣可以去除膚色和周圍環(huán)境對(duì)嘴唇提取的干擾,從而可以使用基于色彩空間的方式將嘴唇提取出來。
OpenCv中已經(jīng)提供了訓(xùn)練好的Harr Cascad分類器,在haarcascades文件目錄下。本文使用haarcascade_frontalface_default.xml和haarcascade_mcs_mouth.xml分別檢測(cè)靜態(tài)圖片中的人臉和嘴唇區(qū)域,之后對(duì)檢測(cè)出的嘴唇區(qū)域進(jìn)行嘴唇提取。
對(duì)于輸入的人臉圖像,處理后的效果如圖2所示。
圖2 嘴唇提取的效果圖
可知,該方法可以較為準(zhǔn)確且完整地檢測(cè)出人臉和嘴唇區(qū)域,并有效地提取出嘴唇。
本文提出了一種利用Haar-like特征和AdaBoost算法對(duì)人臉和嘴唇區(qū)域進(jìn)行檢測(cè)及分割,并使用 色彩空間對(duì)分割出的嘴唇區(qū)域進(jìn)行嘴唇提取的方法。經(jīng)證明,該方法具有快速、準(zhǔn)確的特性,提取出的嘴唇輪廓較為完整。