李嘉懿, 戴聲奎, 定志鋒
(國立華僑大學(xué) 信息科學(xué)與工程學(xué)院,福建 廈門 361021)
人體檢測的關(guān)鍵問題是如何選擇和提取行人的顯著性特征。
在早期的研究中,邊緣特征[1]經(jīng)常被使用。Gavrila和 Philomin[2]選取邊緣模板為特征,將邊緣圖像和模板數(shù)據(jù)集進行倒角距離的比較,并做了實驗,結(jié)果表明,邊緣特征受背景雜波影響較大,檢測能力不是很健壯;哈爾(Haar)特征應(yīng)用在人臉檢測卓有成效,并越來越多的應(yīng)用在人體檢測。Viola[3]等人將哈爾特征使用到檢測監(jiān)視系統(tǒng)中的運動人體,并結(jié)合級聯(lián)分類器,提高檢測率;最近幾年來,基于梯度方向直方圖(HOG,Histograms of Oriented Gradient)特征備受關(guān)注。Dalal和 Triggs[4]提出了HOG特征,并且采用SVM分類器對HOG特征進行訓(xùn)練和分類,人體檢測的準確度得到顯著提升。Zhu等人[5]在Dalal等人的基礎(chǔ)上,結(jié)合了AdaBoost與HOG特征,取得較好的檢測結(jié)果。但由于HOG計算的復(fù)雜性導(dǎo)致使用 HOG特征的人體檢測無法實現(xiàn)實時,因此局部二值紋理模式(LBP[6-7],Local Binary Patterns)特征成為另一種有效的人體特征描述算子。LBP度量和提取圖像局部的紋理信息,對光照具有不變性。LBP是典型的結(jié)構(gòu)與統(tǒng)計相結(jié)合的紋理分析方法。
以人體輪廓特性的強度、方向、寬度、結(jié)構(gòu)、連續(xù)性等屬性為出發(fā)點,將人體輪廓的梯度特性和結(jié)構(gòu)特性有機結(jié)合,提出一種基于脊模型的局部顯著性特征提取方法。該特征提取方法以Sobel和LBP為基礎(chǔ),使用改進的LBP和簡化的梯度方向直方圖作為局部顯著性特征。
結(jié)合HOG[8]和LBP,為了描述人體輪廓的顯著性,提出結(jié)合了梯度和結(jié)構(gòu)的局部顯著性特征的脊模型,如圖1所示。該特征不再是單一特征,而是人體輪廓多種特性的組合,因此能夠更全面的描述人體。模型的上升沿和下降沿表示脊邊緣;頂部表示邊緣的寬度和強度。類似于HOG,下面采用簡化的梯度方向直方圖來描述輪廓的方向。
圖1 脊模型——局部顯著性特征模型
HOG特征使用了9個不同的方向,并且采用了3次插值,計算復(fù)雜。因此提出角度梯度,從 4個方向描述圖像的梯度變化,如圖2所示,這樣在一個區(qū)域內(nèi)統(tǒng)計得到一個角度梯度向量直方圖。因此,提出的四方向梯度直方圖是原HOG九方向的簡化,同時利用積分圖可以進一步提高檢測速度。
圖2 角度梯度
圖3給出了一個基本的 LBP算子,應(yīng)用LBP算子的過程類似于濾波過程中的模板操作。逐行掃描圖像,對于圖像中的每一個像素點,以該點的灰度作為閾值,與其周圍3×3的8鄰域進行二值化,按照一定的順序(如從左上點開始按照順時針方向)將二值化的結(jié)果組成一個8位二進制數(shù),以此二進制數(shù)的值(0~255)作為該點的響應(yīng)。
在整個逐行掃描過程結(jié)束后,會得到一個LBP響應(yīng)圖像,這個響應(yīng)圖像的直方圖(255維)被稱為LBP統(tǒng)計直方圖或LBP直方圖,它常常作為后續(xù)識別工作的特征,因此也被稱為LBP特征。
圖3 LBP算子
LBP的主要思想是以某一點與其鄰域像素的相對灰度作為響應(yīng),正是這種相對機制使LBP算子對于單調(diào)的灰度變化具有不變性。
改進的或模式LBP是在LBP的3×3區(qū)域中心點8鄰域二值化的基礎(chǔ)上,進一步對其4方向(135°方向,90°方向,45°方向,0°方向)分別進行或操作,將結(jié)果編碼為一個4位的二進制數(shù),以此二進制數(shù)的十進制數(shù)的值(0~15)作為該點的響應(yīng),如圖4所示。在整個逐行掃描過程結(jié)束后,會得到一個或模式LBP響應(yīng)圖像,與其對應(yīng)的有一個16維的或模式LBP直方圖。
圖4 或模式LBP算子
或模式LBP在LBP的基礎(chǔ)上,將LBP得到的8位二進制編碼簡化為4位二進制編碼,使得十進制數(shù)取值范圍從[0,255]縮減至[0,15],大大減少計算量。
基于脊模型的局部顯著性特征的人體檢測方法是在基于梯度的檢測上,提取人體輪廓的邊緣性質(zhì)。人體輪廓的邊緣性質(zhì)有:強度,方向,寬度,結(jié)構(gòu),連續(xù)性等。
HOG和 LBP畢竟都是單一特征,描述人體皆不夠全面,于是現(xiàn)在又有了多特征融合的趨勢。如:顏色,局部紋理,梯度直方圖,邊緣,運動特征等。
局部顯著性脊特征的提取采用了分塊的思想。實驗所取的訓(xùn)練圖片大小均為112×40像素,經(jīng)過Sobel算子卷積運算后,得到一張大小為110×38像素的 Sobel梯度圖像,進而可以得到一張 108×36的角度梯度圖像和 108×36的或模式 LBP響應(yīng)圖像。分別對108×36的角度梯度圖像和108×36的或模式LBP響應(yīng)圖像分塊。取24×18像素大小的塊,再將塊平均分成4個單元,每個單元的大小為12×9像素點,如圖5所示。
圖5 分塊,分單元示意
圖6 塊移動示意
統(tǒng)計塊的或模式LBP直方圖,得到一個16維向量L。以單元為單位,分別統(tǒng)計一個塊中4個單元的角度梯度直方圖,可得到的4個4維向量,并將其合并為一個16維向量。統(tǒng)計塊的角度梯度直方圖。取歸一化的角度梯度直方圖向量作為一個塊的角度梯度直方圖的16維向量B。因此一個塊就可以用一個32維特征(L, B)來表示。
塊移動的步長為一個單元的大小。如圖6所示。由AEFD開始,下一次移動到BGHC,再下一次移動到EIJF,如此從左到右,由上到下移動。因此遍歷整張圖片將有()×()=24個塊,于是整張圖片可用一個 24×32=768維的向量表示局部顯著性脊特征。局部顯著性脊特征的提取如圖7所示。
圖7 局部顯著性脊特征的提取
選用正、負樣本各1000,尺寸均為112×40像素,訓(xùn)練過程如圖8所示。首先,將正樣本和負樣本通過SVM訓(xùn)練,得到基本分類器;其次,使用該基本分類器對負樣本進行密集掃描,將得到的困難樣本(即分類錯誤的負樣本:負樣本檢測出目標對象,而判定為正樣本)同原來的正、負樣本一起對基本分類器進行二次訓(xùn)練,得到最終的分類器。
圖8 訓(xùn)練過程
部分檢測圖片如圖9所示。
圖9 部分檢測圖片
對1126張正樣本,3653張負樣本進行檢測,檢測結(jié)果如表1所示。檢測率為89.08%。本算法存在一定的缺陷:對于具有明顯垂直邊緣的柱子、樹木等物體可能會被誤檢。這是由于垂直邊緣是人體的明顯特征之一,所占權(quán)重比較大。
表1 檢測結(jié)果
提出了一種基于脊模型的局部顯著性特征提取方法。該特征結(jié)合了梯度和結(jié)構(gòu),是在 Sobel梯度圖基礎(chǔ)上,進行或模式LBP算子掃描以及角度梯度計算,再提取或模式LBP直方圖向量以及角度梯度直方圖向量得到的[9-12]。創(chuàng)新點在于,該特征不是單一的特征,而是結(jié)合了梯度和結(jié)構(gòu)的特征,并且用768維的特征比較真實的描述出了人體的輪廓。
提出的局部顯著性脊特征利用了積分圖,并且簡化了梯度方向,有效減少計算復(fù)雜度,提高檢測速率,但較之HOG描述人體的特征維數(shù)少,因此檢測率還有待提高。局部顯著性脊特征的提取在塊以及單元的大小的選擇,Sobel算子以及梯度算法選擇等方面,還可以做進一步研究,以期有更好的效果。
[1]余萍,崔少飛,趙振兵,等.圖像配準中的邊緣提取方法的研究[J].通信技術(shù),2008,41(06):161-163.
[2]GAVRILA D, PHILOMIN V.Real-time Object Detection for “Smart” Vehicles[C]// Proceedings of the Seventh IEEE International Conference.New York:IEEE Computer Society Press, 1999:87-93.
[3]VIOLA P, JONES M J, SNOW D.Detecting Pedestrians Using Patterns of Motion and Appearance[C]//Proceedings of Ninth IEEE International Conference.New York: IEEE Computer Society Press, 2003:734-741.
[4]DALAL N, TRIGGS D.Histograms of Oriented Gradients for Human Detection[C]//Proceedings of Conference on Computer Vision and Pattern Recognition.New York: IEEE Computer Society Press, 2005:556-893.
[5]ZHU Q, AVIDAN S, YEH M C.et al.Fast Human Detection Using a Cascade of Histograms of Oriented Gradients[C]//Proceedings of the IEEE Computer Society Conference on Computer Vision and Pattern Recognition.New York: IEEE Computer Society Press,2006: 1491-1498.
[6]WU J,GEYER C, REHG J M.Real-Time Human Detection Using Contour Cures[C]//IEEE International Conference on Robotics and Automation (ICRA).New York: IEEE Computer Society Press, 2011: 860-867.
[7]WANG X, HAN T X, YAN S.An HOG-LBP Human Detector with Partial Occlusion Handing[C]// Proceedings of the Twelfth IEEE International Conference.New York: IEEE Computer Society Press, 2009:32-39.
[8]周柯.基于 HOG特征的圖像人體檢測技術(shù)的研究與實現(xiàn)[D].武漢.華中科技大學(xué):2008.
[9]唐崇武,李會方,何俊婷,等.改進的直方圖均衡圖像增強算法及實現(xiàn)[J].信息安全與通信保密,2009(12):72-74.
[10]高智芳,張新家.基于小波變換的除噪方法及其應(yīng)用研究[J].信息安全與通信保密,2007(06):102-104.
[11]石明慧.一種基于小波變換的信息隱含技術(shù)[J].通信技術(shù),2002(03):68-69,72.
[12]陳曉彬.基于小波的自動對焦算法研究[J].通信技術(shù),2010,43(06):210-212.