李玲,王江濤
?
基于分步降維HOG-LBP特征的行人頭部分類算法
李玲,王江濤
(淮北師范大學(xué) 物理與電子信息學(xué)院,安徽 淮北 235000)
傳統(tǒng)的基于PCA-HOG特征的行人頭部分類算法存在降維后的子空間鑒別性不足的問題.為此,提出一種基于分步降維HOG-LBP特征的行人頭部分類算法.首先,利用樣本類別標(biāo)簽構(gòu)建2類樣本的HOG特征集合,在這2類特征集合中分別執(zhí)行PCA降維,然后將所得的特征與LBP紋理特征進(jìn)行級(jí)聯(lián)得到最終的頭部描述算子,最后通過訓(xùn)練SVM分類器對(duì)實(shí)際樣本集進(jìn)行分類.實(shí)驗(yàn)結(jié)果表明,與傳統(tǒng)PCA降維方法相比,該方法可有效提高行人頭部的分類性能.
HOG;LBP;PCA;頭部檢測(cè)
一直以來,行人檢測(cè)都是模式識(shí)別與計(jì)算機(jī)視覺領(lǐng)域的研究熱點(diǎn),而頭部作為行人的重要局部特征,對(duì)正確檢測(cè)出行人起到重要的作用.
近年來,眾多研究人員提出多種不同的特征表達(dá)方法來進(jìn)行行人檢測(cè),其中應(yīng)用最廣泛的是2005年由Dalal和Triggs提出的方向梯度直方圖(HOG)描述算子[1].該算子通過統(tǒng)計(jì)局部區(qū)域內(nèi)的梯度方向分布來表達(dá)圖像中目標(biāo)的外形輪廓,目前已被廣泛地應(yīng)用在圖像處理與計(jì)算機(jī)視覺領(lǐng)域中[2-7].隨著研究的不斷深入,與HOG融合的特征算法相繼出現(xiàn),文獻(xiàn)[8]提出將局部HOG特征與Haar特征級(jí)聯(lián)起來對(duì)行人進(jìn)行分類的方法.盡管HOG得到廣泛的關(guān)注,但是存在特征維數(shù)高的缺點(diǎn),導(dǎo)致訓(xùn)練分類器性能欠佳.除了HOG特征外,LBP特征是當(dāng)前的另外一種流行特征描述算子,它可對(duì)局部目標(biāo)的紋理特征進(jìn)行有效表達(dá),且已被廣泛用于車牌識(shí)別及文字識(shí)別等領(lǐng)域.Ahonen[9]等人將LBP特征應(yīng)用于人臉識(shí)別且取得了良好的效果.而文獻(xiàn)[10]則給出一種方向梯度直方圖與紋理特征融合的方法來解決圖像檢索問題,此方法取得了較單一的特征更好的檢索性能.
本文設(shè)計(jì)了一種將HOG特征和LBP特征相級(jí)聯(lián)的行人頭部特征表達(dá)方法.在構(gòu)建HOG特征時(shí),分別建立正負(fù)樣本的HOG特征集合,通過分步地在2個(gè)特征集合上進(jìn)行PCA處理得到降維子空間.將降維后的HOG特征與相對(duì)應(yīng)的LBP特征進(jìn)行級(jí)聯(lián)構(gòu)建行人頭部描述算子,最后通過SVM訓(xùn)練分類器實(shí)現(xiàn)人體頭部分類.實(shí)驗(yàn)表明,所設(shè)計(jì)的描述算子可以顯著提高行人頭部檢測(cè)性能.
1特征的相關(guān)描述
1.1HOG特征
一般來說,邊緣方向分布或者梯度方向分布可以很好地表征局部目標(biāo)的輪廓和形狀.基于此,Dalal 和Triggs提出了HOG描述算子來對(duì)物體進(jìn)行表達(dá),并取得了優(yōu)異的效果.對(duì)待檢測(cè)圖像進(jìn)行HOG特征構(gòu)建的步驟大致如下:
(1)如果待測(cè)圖像不是灰度圖像,則先對(duì)其進(jìn)行灰度化處理;
(2)計(jì)算圖像每個(gè)像素的梯度(包括大小和方向),位于像素點(diǎn)的梯度可以表達(dá)為
(3)將圖像劃分成多個(gè)小塊cells;
1.2LBP特征
局部二值模式(Local Binary Patter,LBP)主要用來描述圖像的局部紋理特征模式,它具有灰度不變性和旋轉(zhuǎn)不變性等顯著優(yōu)點(diǎn).目前,LBP特征已被廣泛應(yīng)用到車牌識(shí)別、人臉識(shí)別和指紋識(shí)別等領(lǐng)域.
傳統(tǒng)的LBP特征構(gòu)建過程(見圖1):首先設(shè)定一個(gè)固定大小33的鄰域窗口,令窗口的中心像素點(diǎn)的值為閾值,然后將其周圍的8個(gè)像素點(diǎn)的值與其進(jìn)行比較.如果周圍像素值大于閾值則令其為1,否則為0,最后根據(jù)比較結(jié)果可以得到一個(gè)8bit無符號(hào)數(shù),該無符號(hào)數(shù)即中心像素點(diǎn)的LBP編碼值.
圖1 提取LBP特征
由圖1可見,像素點(diǎn)最終可以用一串二進(jìn)制序列表示為(01001100)2=76,即中心像素點(diǎn)的LBP編碼值,對(duì)圖像每個(gè)像素點(diǎn)求LBP特征值,最后統(tǒng)計(jì)所有編碼值的直方圖即可得到LBP特征.
2分步降維HOG-LBP級(jí)聯(lián)特征的構(gòu)建
2.1分步降維HOG
在使用HOG特征時(shí),其面臨著特征維數(shù)多、計(jì)算量大,導(dǎo)致訓(xùn)練分類器復(fù)雜度高的問題.對(duì)于此問題,常采用PCA算法來對(duì)HOG特征降維.PCA是一種當(dāng)前應(yīng)用最廣泛的無監(jiān)督降維方法,其核心思想是保留最新信息量的同時(shí)將高維數(shù)據(jù)投影到一個(gè)低維空間.PCA降維的步驟如下:
(7)
(8)
(9)
(11)
(4)將訓(xùn)練樣本在新的特征空間投影
(12)
PCA可以很好地保留樣本特征間的共性信息,但由于其無監(jiān)督特性,沒有考慮異類樣本間的鑒別性.因此,采用PCA得到的降維空間不能保證異類樣本在該空間中的鑒別性.
為了克服該問題,與傳統(tǒng)的PCA降維方法不同,本文采用不對(duì)正負(fù)樣本整體執(zhí)行PCA降維,而是分別在正負(fù)樣本集合內(nèi)進(jìn)行2次PCA降維的策略.對(duì)于正樣本集合來說,在該集合進(jìn)行PCA降維得到正樣本間最具共性的特征,當(dāng)負(fù)樣本投影到該空間時(shí),其將保持與正樣本間的鑒別性.同樣的,在負(fù)樣本集合內(nèi)部進(jìn)行PCA降維時(shí),將得到負(fù)樣本間最具共性的低維信息;當(dāng)正樣本投影到該空間時(shí),將保持與負(fù)樣本間的鑒別性.
經(jīng)過處理后,可以得到2個(gè)投影子空間,分別為S1={d11,d12,d13,...,d1},S2={d21,d22,d23,...,d2},將2個(gè)子空間進(jìn)行連接得到一個(gè)新的特征空間S={ d11,d12,d13,...,d1,d21,d22,d23,...,d2},對(duì)于待分類的樣本在這個(gè)特征空間進(jìn)行投影,最終得到分步降維后的HOG特征(見圖2).
圖2 分步降維HOG-LBP級(jí)聯(lián)特征的構(gòu)建
2.2HOG-LBP級(jí)聯(lián)特征
在對(duì)目標(biāo)圖像進(jìn)行特征表達(dá)時(shí),不同的特征之間往往是互補(bǔ)的,采用多特征可以進(jìn)一步地提高檢測(cè)的魯棒性.LBP特征作為一種紋理描述算子,在目標(biāo)檢測(cè)中已顯示出優(yōu)良的性能.將降維后的HOG特征與LBP特征結(jié)合,可以在得到方向梯度信息的基礎(chǔ)上獲取頭部的紋理信息L={d31,d32,d33,...,d3},從而提高在復(fù)雜背景中人體頭部檢測(cè)率.以此為出發(fā)點(diǎn),本文采用將分步降維后HOG特征和LBP特征級(jí)聯(lián)的方法來構(gòu)建頭部圖像描述算子E={ d11,d12,d13,...,d1,d21,d22,d23,...,d2,d31,d32,d33,...,d3},這種方法不僅有效地降低了HOG的大量冗余信息,實(shí)現(xiàn)信息有效壓縮,而且考慮了特征的多樣性.
分步降維HOG-LBP級(jí)聯(lián)特征的構(gòu)建過程見圖2,正負(fù)樣本分別進(jìn)行降維得到2個(gè)特征空間,二者結(jié)合構(gòu)成新的特征再與LBP特征級(jí)聯(lián),最后將所得特征與樣本標(biāo)簽一起經(jīng)SVM訓(xùn)練得到人頭分類器.當(dāng)給定一待分類樣本,將其特征送入分類器即可得到分類結(jié)果.
3實(shí)驗(yàn)及分析
通過對(duì)現(xiàn)實(shí)場(chǎng)合下采集的樣本圖像進(jìn)行分類實(shí)驗(yàn),來評(píng)估HOG-LBP級(jí)聯(lián)特征的性能.為驗(yàn)證該方法的有效性,將該方法在配置為intel處理器,CPU主頻為3.40 GHz,RAM為4.00 G的機(jī)器上采用MATLAB平臺(tái)編寫算法.實(shí)驗(yàn)中所用的樣本取自某公交車監(jiān)控圖像序列,正樣本集合通過手工截取人體頭部圖像來獲得,而負(fù)樣本圖像則為在沒有行人的圖像中隨機(jī)截取構(gòu)建.訓(xùn)練樣本中包括500張正樣本(人體頭部模型),3 500張負(fù)樣本(非人體頭部模型),而測(cè)試樣本包括60張正樣本,245張負(fù)樣本.部分正負(fù)樣本示例見圖3,為簡(jiǎn)化計(jì)算將所有樣本大小歸一化為64×64.
圖3 部分正負(fù)樣本
在構(gòu)建HOG特征時(shí),采用如下參數(shù)設(shè)置:每個(gè)cell的大小設(shè)為8×8,每個(gè)cell梯度方向?yàn)?,滑動(dòng)步長(zhǎng)為8,2×2個(gè)cell構(gòu)成一個(gè)Block,從而每個(gè)Block特征維數(shù)為36維,最終得到HOG特征維數(shù)為1 764.
在對(duì)HOG特征進(jìn)行降維時(shí),令正樣本集合所得投影空間維數(shù)為維,負(fù)樣本集合所得投影空間維數(shù)為,則最后得到的分步降維HOG特征維數(shù)為.
在計(jì)算樣本圖像的LBP特征時(shí),采用分塊均勻模式LBP特征(Uniform LBP)構(gòu)建方法,通過該方法對(duì)任一局部區(qū)域可以得到一個(gè)59維的特征向量.將樣本圖像分成個(gè)局部區(qū)域,則總的LBP特征維數(shù)為
(13)
采用2.2中所給出的方法,將降維后的HOG特征與LBP特征相級(jí)聯(lián)集合得到樣本圖像的描述特征E,其維數(shù)為,得到每個(gè)樣本的級(jí)聯(lián)特征后即可訓(xùn)練SVM分類器進(jìn)行分類決策.
鑒于SVM分類器的優(yōu)異性能,實(shí)驗(yàn)中采用SVM分類器來對(duì)測(cè)試樣本進(jìn)行分類,SVM分類器采用的核函數(shù)為徑向基函數(shù).為了能對(duì)不同特征的分類性能進(jìn)行對(duì)比,實(shí)驗(yàn)中分別使用傳統(tǒng)的PCA降維后的HOG特征和LBP特征,這2種特征的級(jí)聯(lián)特征以及本文所提出特征進(jìn)行分類實(shí)驗(yàn).分類結(jié)果見表1.
表1 不同特征組合下的性能分類比較 %
表1給出了各種分類器對(duì)測(cè)試樣本的正確分類率,其中特征維數(shù)的選取根據(jù)主成份所占能量比來確定.由正確分類率數(shù)值可以看出,隨著選取特征主成份所占能量比的不斷增大,傳統(tǒng)的PCA-HOG和LBP分類準(zhǔn)確率保持穩(wěn)定的水平,當(dāng)兩者進(jìn)行特征級(jí)聯(lián)后,分類正確率隨著能量比的增大逐漸提高,當(dāng)達(dá)到總能量的95%時(shí),分類精度最高.在4種特征表達(dá)方法中,本文的方法取得了最高的正確分類率.實(shí)驗(yàn)結(jié)果表明,采用分步降維HOG-LBP級(jí)聯(lián)特征可以有效地提高頭部圖像的特征表達(dá)性能.
4結(jié)束語
在注意到傳統(tǒng)的PCA降維方法沒有考慮樣本標(biāo)簽信息的基礎(chǔ)上,本文提出一種分別在正負(fù)樣本集合內(nèi)對(duì)HOG特征進(jìn)行降維的方法,以提高降維后特征的鑒別性能.該方法將分步降維后的HOG特征與LBP特征相級(jí)聯(lián)得到樣本圖像的特征描述子.對(duì)實(shí)際場(chǎng)合中的樣本采用SVM分類器進(jìn)行分類的結(jié)果表明,所設(shè)計(jì)的特征描述算子可以進(jìn)一步提高特征表達(dá)性能.
[1] Dala N,Triggs B.Histograms of oriented gradients for human detection[C]//IEEE Computer Society Conference on Computer Vision and Pattern Recognition.San diega IEEE,2005:886-893
[2] Ninomiya H,Ohki H,Gyohten K.An evaluation on robustness and brittleness of HOG feature of human detection [C]// 17thKorea-Japan Joint Workshop on Frontiers of Computer Vision.Ulsan IEEE,2011
[3] 顧炯,趙曙光,王宏斌.基于Joint HOG特征復(fù)雜場(chǎng)景下的頭肩檢測(cè)[J].電子設(shè)計(jì)工程,2012,20(7):58-62
[4] 孫麗娟,張立材.基于邊緣梯度方向直方圖的靜態(tài)手語識(shí)別[J].微電子學(xué)與計(jì)算機(jī),2010(3):148-150
[5] 李林,張麗紅.基于改進(jìn)梯度方向直方圖的多尺度的行人檢測(cè)[J].計(jì)算機(jī)應(yīng)用,2013,32(A2):168-170
[6] 劉威,段成偉,遇冰,等.基于后驗(yàn) HOG 特征的多姿態(tài)行人檢測(cè)[J].電子學(xué)報(bào),2015,43(2):217-224
[7] 李星,郭曉松,郭君斌.基于HOG特征和SVM的前向車輛識(shí)別方法[J].計(jì)算機(jī)科學(xué),2013,40(11A):329-332
[8] Geismann P,Schneider G.A two-staged approach to vision-based pedestrian recognition using Haar and HOG features[C]// IEEE Intelligent Vehicles Symposium.IEEE,2008:554-559
[9] Ahonen T,Hadid A,Pietikinen M.Face Description with Local Binary Patterns:Application to Face Recognition[J].IEEE Transactions on Pattern Analysis & Machine Intelligence,2006,28(12):2037-2041
[10] Yu J,Qin Z C,Wan T,et al.Feature integration analysis of bag-of-features for image retrieval[J].Neurocomputing,2013,120(23):355-364
Pedestrian head classification algorithm with two-step dimension reduction HOG- LBP feature
LI Ling,WANG Jiang-tao
(School of Physical and Electronic Information,Huaibei Normal University,Huaibei 235000,China)
Traditional pedestrian head classification algorithm based on PCA-HOG feature has the problem of degradation of the discrimination in the subspace.In order to handle this problem,the pedestrian head classification is completed based on the proposed two-step dimension reduction HOG- LBP feature.Firstly,two category of HOG sample set are obtained according to the sample labels.The PCA algorithm is carried out on each sample set step by step.Then the LBP texture features are combined with the dimension reduced HOG feature to form the final head descriptor.Lastly,experiments were performed by SVM classifier on practical test samples,and the experimental results show that,comparing with the traditional PCA algorithm,the presented HOG-LBP features can effectively improve the classification performance of pedestrian head.
HOG;LBP;PCA;head detection
1007-9831(2016)07-0029-05
TP391.41
A
10.3969/j.issn.1007-9831.2016.07.008
2016-05-17
國(guó)家自然科學(xué)基金資助項(xiàng)目(61203272);安徽省高校優(yōu)秀青年人才支持計(jì)劃重點(diǎn)項(xiàng)目(gxyqZD2016113);安徽省自然科學(xué)基金項(xiàng)目(1508085MF116);淮北師范大學(xué)教學(xué)研究項(xiàng)目(jy15128)
李玲(1992-),女,安徽滁州人,在讀碩士研究生,從事圖像處理、模式識(shí)別方面的研究.E-mail:1784656698@qq.com
王江濤(1979-),男,山東濰坊人,副教授,博士,從事視頻處理、計(jì)算機(jī)視覺方面的研究.E-mail:jiangtaoking@126.com