史豫坤 張大秀
摘要:通過加入差異度參數(shù)優(yōu)化了PAC,IDA,LBP等算法,采用漢明距離選取特征,并對(duì)樣本進(jìn)行分析,得出類內(nèi)矩陣和類間矩陣,利用算法把一個(gè)人的兩個(gè)圖像向量的差降維,取二范數(shù)來加以區(qū)分并計(jì)算正確率,然后淘汰正確率低的差距參數(shù),從而得到更高的正確率。主要步驟是:以二進(jìn)制方式將圖片以多階灰度圖表示,然后進(jìn)行像素點(diǎn)運(yùn)算,統(tǒng)計(jì)有效像素點(diǎn),運(yùn)用優(yōu)化的算法,得出相似指數(shù)并分析出判定是否為不同時(shí)期同一人。提出的方法對(duì)一個(gè)人在理想狀態(tài)下不同時(shí)期的兩張照片的相似度高達(dá)95%以上,即對(duì)人臉相似度檢測(cè)具有顯著效果。
關(guān)鍵詞:差異度參數(shù);散度;漢明距離;降維;特征提取
中圖分類號(hào):TP391 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2018)04-0153-03
1 概述
人臉識(shí)別是從二十世紀(jì)中后期一直研究討論的問題,人臉識(shí)別的基礎(chǔ)是人眼對(duì)于人臉儲(chǔ)存與識(shí)別的生物理論,是基于人的面部特征信息進(jìn)行身份識(shí)別的一種生物識(shí)別技術(shù)。目前,基礎(chǔ)的研究方法都是基于統(tǒng)計(jì)學(xué)的研究方法,即采集大量的信息,對(duì)這些信息進(jìn)行分類,用某一種類中“共有”的統(tǒng)計(jì)特征來判斷某一信息是哪一個(gè)種類[1]。但判斷的標(biāo)準(zhǔn)不同,結(jié)果也就不同,比如定義一個(gè)特征為紅色特征,先觀察到一個(gè)信息中有紅色,但紅色只有20%,那么該不該判斷它就屬于紅色種類呢?這時(shí)可以采用機(jī)器學(xué)習(xí)的方法,把這個(gè)判別特征的差異度量化。通常,定義紅色比例大于30%是紅色種類,然后與定義紅色比例大于40%是紅色種類的差異度進(jìn)行比較舍棄正確率低的差異度。但在識(shí)別時(shí),真正把圖片向量化,可能每一個(gè)維度都有一個(gè)差異度,或者采用一些變換會(huì)增加計(jì)算速度和準(zhǔn)確率,那么每次變換時(shí)的系數(shù)也是一種差異度;故本文設(shè)置一個(gè)約束條件,只對(duì)標(biāo)準(zhǔn)光照情況下(即理想狀態(tài)下)的人臉進(jìn)行識(shí)別提取計(jì)算相似度。即兩個(gè)向量的差的二范數(shù),首先本文把兩個(gè)組所有圖片打亂進(jìn)行重組,每組兩張照片,記為一個(gè)pair(不進(jìn)行交叉打亂,即原來組還是原來組,只是進(jìn)行重組成pairs 時(shí),每一個(gè)pair中兩個(gè)照片不一定是一個(gè)人的),一個(gè)pair中兩個(gè)圖像向量的差就是一個(gè)樣本,全體樣本中一共有兩類,一類是“是同一個(gè)人”樣本,一類是“不是同一個(gè)人樣本”[2]。
假設(shè)人臉在這些低維線性空間的散布矩陣投影具有可分性,所以它可以對(duì)圖像光照條件引起的灰度變化判斷兩張不同時(shí)期階段的人臉是否為同一個(gè)人[3]。若人臉的特征為D維空間的特征,且本文需要從更高的維度空間(2D)中計(jì)算出協(xié)方差矩陣,在大量獨(dú)立樣本測(cè)試訓(xùn)練數(shù)據(jù)中,判斷是否能得到更高效率的運(yùn)行結(jié)果[4]。
PCA算法可以將圖像的隨機(jī)變量認(rèn)為是分布規(guī)律的,從而得到人臉圖像分布的主要成分的方向;LBP算法可以較好的分析圖像的紋理特征;低頻傅里葉變換可以通過時(shí)空域和頻率域?qū)D像的信息提取分析;Gabor小波變換可以保持著人臉固有的形態(tài)、面部表情以及遮蓋物體的某些特性[5]。LDA算法可以大大降低原來圖片模式的維數(shù),從而很好的解決了子類內(nèi)散布矩陣奇異問題[6],子空間算法的產(chǎn)生,對(duì)求解矩陣的逆有了新的改進(jìn)。
2 特征提取
由于只能比較兩者是不是一個(gè)人,前提為確定的兩張圖片皆為固定姿態(tài)及光線情況下人臉,故不用考慮人臉定位。本文每一個(gè)人的的面部圖片只有兩張,通過一張圖片的信息與另一張圖片對(duì)比判斷是否為同一個(gè)人。設(shè) 是關(guān)于特征向量 X(這里 “是同一個(gè)”, 為“不是同一個(gè)”)的散度定義如下:
P 為 ,的先驗(yàn)概率,即為關(guān)于事件 的古典條件概率。由統(tǒng)計(jì)學(xué)知識(shí)得: 1)不同特征相關(guān)性越低越好;2)特征選擇使散度越來越大。其中散度也可以簡(jiǎn)單認(rèn)為與 和 的差距成正比,故定義為:
使得 R 越大的特征 X 越具區(qū)分性,對(duì)于不同的 X 進(jìn)行實(shí)驗(yàn)(比如灰度分布,人臉輪廓,眼臉比例,特征值特征向量,奇異值,等密度線等等)然后選出最佳的 m 個(gè)特征 做參數(shù)化處理即作參數(shù) 作為衡量對(duì)應(yīng)特征的差距度,即 。
3 算法實(shí)現(xiàn)
3.1 整體的低頻傅立葉變換
二維離散傅里葉變換(DFT):
其中x,y為M*N像素中(x,y)點(diǎn)的像素值,取低頻向量 為維向量,判斷一個(gè)pair
其中為參數(shù),這里的也可以通過,求得,可以減少參數(shù)的維數(shù)。
3.2 子空間算法
3.2.1 PCA算法優(yōu)化
先將本文的樣本按之前的分成兩類,即“是同一人類”與“不是同一人”類。由于PCA與LDA算法可以把中每一個(gè)樣本看作是一對(duì)圖像,故本文將這兩個(gè)圖像向量“相減”,即對(duì)應(yīng)像素的灰度做差,形成一個(gè)圖像,這時(shí)可以區(qū)分與的特征不會(huì)變化很大。這樣中每個(gè)樣本都只是一個(gè)圖像(M*N像素)。
PCA算法的具體流程為:
① 假設(shè)中有個(gè)樣本,每個(gè)樣本為M*N圖像,可視為一個(gè)M*N維向量。
② 可以計(jì)算的均值
與散布矩陣
③ 計(jì)算出的特征值與特征向量,將特征向量,按大小順序排列。當(dāng)小的特征值對(duì)應(yīng)的“空白區(qū)域 ”去掉后,臉將變大,即臉的輪廓更接近邊界。只取前m個(gè)特征值與對(duì)應(yīng)的特征值向量,則原樣本圖像在m維空間上的前m個(gè)投影坐標(biāo)表示如下:(i=1,2)。
故PCA可以起到更好的降維效果,此時(shí)特征取:,則該樣本為類。其中,分子中的是在基下的前m個(gè)坐標(biāo),分母中的是在基下的前m個(gè)坐標(biāo)。
3.2.2 LDA算法優(yōu)化
在PCA中可以通過改變基的選取來改變投影方向,不同的投影方向決定不同的特征,由前面散度的定義知,這些特征對(duì)于區(qū)分樣本類別具有強(qiáng)弱之分。那么通過LDA找到最佳區(qū)分特征,即最佳投影與最佳散度。
定義:樣本類內(nèi)散布矩陣
樣本類間散布矩陣:
其中,為樣本,為類均值,為所有樣本均值。若樣本足夠大,使得為非奇異矩陣,則投影矩陣P滿足,即
令推倒出特征X,即,為參數(shù)。
3.3 局部算法
3.3.1 LBP算法優(yōu)化
LBP算法是一種局部算法,即它考慮的不再是整個(gè)人臉的特征,而是對(duì)每一點(diǎn)附近的灰度與自身進(jìn)行比較。如果把整體特征看做頻率變化后的低頻段,局部的特征就是高頻段。對(duì)于區(qū)分像素高的pair圖效果更好,雖然在原問題中不考慮拍照光線與旋轉(zhuǎn)但在進(jìn)行敏感度分析中,隨著拍照光線與照片角度的加入,會(huì)使其他算法效率降低,近而LBP算法的權(quán)重增加。由于LBP算法與整體灰度、旋轉(zhuǎn)都無(wú)關(guān)。
LBP算法步驟如下:
a. 將M×N的圖像分為不重疊的C塊,每塊P個(gè)點(diǎn),在一般操作中,多分為3*3的小塊,每一塊的中心點(diǎn)為C,其余共有p-1個(gè)點(diǎn)。
b. g是除中心外第p個(gè)點(diǎn)的灰度,為中心處的灰度定義:
其中,就為L(zhǎng)BP變化后的圖像,這時(shí)每個(gè)非中心點(diǎn)的灰點(diǎn)只為0或1。a中可以用圓形區(qū)域代替3*3塊,可以得到半徑為R的圓形域中P個(gè)點(diǎn)的LBP變換,即
LBP優(yōu)化的具體做法為:將上述圓形域進(jìn)行旋轉(zhuǎn)得到的中心點(diǎn)和灰度的最小值,即為優(yōu)化后的LBP變換。這時(shí),LBP的旋轉(zhuǎn)就不變了,進(jìn)行完LBP變換后,再進(jìn)行PAC或者LDA都簡(jiǎn)化了,且受光線影響變小了。
3.3.2 Gabor 小波變換
Fourier變換是對(duì)圖像進(jìn)行空間點(diǎn),到頻點(diǎn)的整體變換,受拍照光強(qiáng)影響較大,故考慮光強(qiáng),利用局部受影響較小的Cabor小波變換
其中,為中心頻率與方向,這里應(yīng)選取多個(gè)進(jìn)行變換,,都為參數(shù),當(dāng)越大時(shí),越可以體現(xiàn)局部性質(zhì),即波的高頻越突顯。
一般取。
設(shè)為圖像點(diǎn)(x,y)的灰度,則關(guān)于的Gabor特征為:,則Gabor與選取小塊(局部),不同取值相互獨(dú)立,即這個(gè)特征為一個(gè),不妨,就為一個(gè)10的四次方數(shù)量級(jí)的向量,維度過高便直接計(jì)算,且本文假設(shè)先忽略光照,故只利用整體算法即可。
4 實(shí)驗(yàn)數(shù)據(jù)分析
4.1 部分?jǐn)?shù)據(jù)
本文采用10張明星照片對(duì)本文提出的整體特征進(jìn)行對(duì)比檢測(cè)的400組數(shù)據(jù)如圖1所示:
4.2 實(shí)驗(yàn)數(shù)據(jù)分析
通過分析實(shí)驗(yàn)數(shù)據(jù)表明,在標(biāo)準(zhǔn)位置和標(biāo)準(zhǔn)光照環(huán)境下,如果兩張照片的相似度指數(shù)大于64.54122%,則可認(rèn)定為這兩張照片就是同一人的照片。在理想狀態(tài)下的實(shí)驗(yàn)數(shù)據(jù)表明,同一個(gè)人的不同時(shí)期的兩張照片,它們的相似度高達(dá)98.229834%。不同人的兩張照片,其相似度不超過61.63846%。在這10張照片中,利用本文提出的整體特征對(duì)比發(fā)現(xiàn),其中T1o的原圖與整體特征提取圖如圖2與T1y的原圖與整體特征提取圖如圖3所示的對(duì)比,從圖1中可以清楚地看出同一個(gè)人不同時(shí)期的對(duì)比檢測(cè)相似指數(shù)是98.22%。
5 總結(jié)
本文主要采用漢明距離選取特征,并對(duì)樣本進(jìn)行分析,得出類內(nèi)矩陣和類間矩陣,利用算法把一個(gè)pairs的兩個(gè)圖像向量的差降維,然后取二范數(shù)‘0,‘1來加以區(qū)分并計(jì)算正確率,然后淘汰正確率低的差距參數(shù),從而得到更高的正確率。運(yùn)用優(yōu)化過的算法用Java編程進(jìn)行實(shí)踐,得出相似指數(shù)進(jìn)行分析判定是否為不同時(shí)期同一人。實(shí)驗(yàn)表明:該方法可以準(zhǔn)確地判定在理想狀態(tài)下同一個(gè)人不同時(shí)期的相似度,但是對(duì)于其他光照面部不清晰的圖片的判斷不是很準(zhǔn)確,所以該方法還要繼續(xù)研究完善。
參考文獻(xiàn):
[1] 陳奇毅. 淺析人臉識(shí)別技術(shù)的現(xiàn)狀和發(fā)展趨勢(shì)[J]. 通訊世界,2015(13).
[2] 汪亞菲,張迎獻(xiàn).試析人臉識(shí)別技術(shù)的方法與應(yīng)用[J]. 電腦編程技巧與維護(hù),2014(15)
[3] 劉篤晉,孫淑霞,李思明.人臉識(shí)別中光照處理方法的分析[J]. 計(jì)算機(jī)系統(tǒng)應(yīng)用,2011(1).
[4] 黃敏.常見人臉識(shí)別技術(shù)及其設(shè)備應(yīng)用[J]. 電子世界,2014(12).
[5] 方程.人臉識(shí)別技術(shù)研究[J].信息技術(shù)與信息化,2014(11).
[6] 劉小軍,王東峰,張麗飛. 一種基于奇異值分解和隱馬爾可夫模型的人臉識(shí)別方法[J].計(jì)算機(jī)學(xué)報(bào),2003(13).