李錦明 曲 毅 裴禹豪 扆澤江
1.武警工程大學(xué)研究生管理大隊(duì),陜西 西安 710086
2.武警工程大學(xué)信息工程系,陜西 西安 710086
視頻中行人檢測(cè)研究方法綜述
李錦明1曲 毅2裴禹豪1扆澤江1
1.武警工程大學(xué)研究生管理大隊(duì),陜西 西安 710086
2.武警工程大學(xué)信息工程系,陜西 西安 710086
行人檢測(cè)是計(jì)算機(jī)視覺(jué)研究的熱門(mén)之一,其在智能監(jiān)控、虛擬現(xiàn)實(shí)等方面都能得到較好的應(yīng)用,具有較好的應(yīng)用前景。從行人檢測(cè)核心——目標(biāo)分類(lèi)方面對(duì)其進(jìn)行了論述,分析了目前常用方法的優(yōu)缺點(diǎn),并對(duì)現(xiàn)今的研究難點(diǎn)以及未來(lái)的研究方向進(jìn)行了詳細(xì)的論述。
行人檢測(cè);智能監(jiān)控;運(yùn)動(dòng)檢測(cè);目標(biāo)分類(lèi)
在過(guò)去的幾年里,計(jì)算機(jī)視覺(jué)方面的研究獲得了大量的關(guān)注[1]。其可以應(yīng)用在很多方面,如智能視頻監(jiān)控、交互式游戲、虛擬現(xiàn)實(shí)[2]等等。在進(jìn)行各種人體行為檢測(cè)之前,應(yīng)將我們所需要的人體通過(guò)自動(dòng)進(jìn)行的算法從視頻或圖像中分離出來(lái)。本文結(jié)合現(xiàn)今的主要行人檢測(cè)方法,綜述運(yùn)動(dòng)檢測(cè)后的目標(biāo)分類(lèi),并對(duì)行人檢測(cè)方法的未來(lái)進(jìn)行展望。
在我們需要處理的視頻中,一方面,除了行人以外還有其他運(yùn)動(dòng)的目標(biāo)在處理的區(qū)域,他們之間的運(yùn)動(dòng)可能有一定的相關(guān)性,比如有人在遛狗,然而也有可能沒(méi)有一點(diǎn)相關(guān)性;另一方面,不僅有在運(yùn)動(dòng)的行人,而且有靜止的行人,比如兩個(gè)在交談的行人以及在路邊打電話的行人。這兩個(gè)方面的情況對(duì)我們的運(yùn)動(dòng)檢測(cè)造成了極大的困難。基于這種需求,目標(biāo)方法應(yīng)運(yùn)而生。目前常用的目標(biāo)分類(lèi)方法如下:
行人與其他物體直觀上的區(qū)別就是外部輪廓的不同,因而可以通過(guò)篩選匹配外部輪廓來(lái)進(jìn)行目標(biāo)分類(lèi)。這種方法適用于靜止的行人,也適用于動(dòng)態(tài)的行人,因而被普遍應(yīng)用[3]。這種方法可分為基于整個(gè)人體的和基于人體部位的目標(biāo)分類(lèi)。
基于整個(gè)人體的目標(biāo)分類(lèi)可以通過(guò)訓(xùn)練好的外部輪廓模板與我們所需要檢測(cè)的視頻幀中的運(yùn)動(dòng)區(qū)域進(jìn)行匹配擬合,并選用特定的誤差函數(shù)與設(shè)定的閾值進(jìn)行篩選判斷,比如說(shuō)用Hausdorff距離[4]來(lái)計(jì)算選定的運(yùn)動(dòng)窗口與我們的模板之間的誤差并與閾值進(jìn)行比對(duì)來(lái)判斷最終是不是行人;或者直接利用人體外形的輪廓來(lái)進(jìn)行辨別,不過(guò)不同的是這個(gè)模板是具有可以根據(jù)運(yùn)動(dòng)目標(biāo)的剛性與非剛性特點(diǎn)進(jìn)行調(diào)整的一個(gè)代價(jià)函數(shù)[5]。
而基于人體部位進(jìn)行的目標(biāo)分類(lèi)則是通過(guò)在一個(gè)視頻幀中分別檢測(cè)頭、腿以及雙手這4個(gè)人體的一部分,因而需要4個(gè)不同的部位檢測(cè)器[6]。顯然這種檢測(cè)算法要比整體的檢測(cè)效果要好,也能較好地處理有部分被阻擋的行人,不過(guò)這種方法計(jì)算量比較大,平均一個(gè)普通720×480的視頻幀就得需要用20分鐘[7],因而要實(shí)現(xiàn)實(shí)時(shí)檢測(cè)的話,需要較高的硬件要求。
行人在運(yùn)動(dòng)時(shí)是具有一定的規(guī)律以及周期性的,視頻中連續(xù)的幀更能方便我們進(jìn)行運(yùn)動(dòng)的分析判斷,因而可以根據(jù)這種人體運(yùn)動(dòng)的特性來(lái)進(jìn)行分類(lèi)[8]。
比如可以通過(guò)行人腿部前后交替的特點(diǎn)來(lái)進(jìn)行目標(biāo)分類(lèi),也可以對(duì)運(yùn)動(dòng)對(duì)象進(jìn)行跟蹤識(shí)別,計(jì)算對(duì)象在幀與幀之間的相關(guān)性,并利用其周期性來(lái)判斷是否是行人,還可以對(duì)人體的運(yùn)動(dòng)軌跡進(jìn)行建模,只有符合運(yùn)動(dòng)軌跡的才是行人。但這種方法只對(duì)行走中的人有較好的識(shí)別,對(duì)于靜止不動(dòng)的則比較難判斷出來(lái)。
基于人體特征的目標(biāo)分類(lèi)方法是用得最廣泛的目標(biāo)分類(lèi)方法,因?yàn)槠漭^其他方法準(zhǔn)確度更好、速度更快,因而引起了廣泛的關(guān)注。
一般地,基于特征的方法都要進(jìn)行訓(xùn)練樣本特征的提取、學(xué)習(xí)以及判斷匹配,而用什么特征并通過(guò)什么來(lái)學(xué)習(xí)就是這類(lèi)方法之間最主要的區(qū)別。目前用得比較多的學(xué)習(xí)方法是機(jī)器學(xué)習(xí),有支持向量機(jī)(SVM)、多弱分類(lèi)器集成(AdaBoost)、隨機(jī)森林以及神經(jīng)網(wǎng)絡(luò)等;檢測(cè)分類(lèi)效果較好的人體特征則有方向梯度直方圖特征HOG(Histogram of Oriented Gradient)、Haar-like特征、描述人體各個(gè)部位的Edgelet特征以及綜合各種特征取得更好效果的方法。它們能從訓(xùn)練樣本中學(xué)習(xí)各種人體特征,從而進(jìn)行分析判斷是否為行人。
本文對(duì)視頻中的行人檢測(cè)里面的目標(biāo)分類(lèi)進(jìn)行了綜述,并進(jìn)行了優(yōu)缺點(diǎn)的分析與比較。如今的檢測(cè)技術(shù)不管在可靠性還是有效性方面都有顯著提高,不過(guò)距離實(shí)用性還是有不少差距。因而今后的行人檢測(cè)可以從以下幾個(gè)方向研究:進(jìn)行多特征融合的行人檢測(cè),有效地綜合利用各種特征的優(yōu)勢(shì)[3];提高雨天、雪天等特殊天氣下的行人檢測(cè)的可靠性,可設(shè)計(jì)針對(duì)特殊環(huán)境的檢測(cè)算法,自適應(yīng)地調(diào)整選用合適的算法;通過(guò)多視角的視頻監(jiān)控或者提取更加深度的特征來(lái)解決行人被部分遮擋的問(wèn)題。
總之,行人檢測(cè)是當(dāng)今機(jī)器學(xué)習(xí)、圖像識(shí)別、計(jì)算機(jī)視覺(jué)非常重要的研究領(lǐng)域,對(duì)于實(shí)際的應(yīng)用也有很好的前景。因而,這對(duì)于真實(shí)環(huán)境條件下行人檢測(cè)問(wèn)題的有效解決具有重大的理論意義。
[1]Ogale N A. A survey of techniques for human detection[J]. Master’s of Science Degree in Computer Science of the University of,2008.
[2]Gavrila D M. The Visual Analysis of Human Movement:A Survey[J]. Computer Vision & Image Understanding,1999,73(1):82-98.
[3]Varga D,Szirányi T. Robust real-time pedestrian detection in surveillance videos[J].Journal of Ambient Intelligence & Humanized Computing,2017,8(1):79-85.
[4]Felzenszwalb P F. Learning models for object recognition:Computer Vision and Pattern Recognition, 2001. CVPR 2001. Proceedings of the 2001 IEEE Computer Society Conference on, 2001[C].
[5]Gavrila D M, Giebel J. Shape-based pedestrian detection and tracking: Intelligent Vehicle Symposium,2002[C].
[6]Zhang S,Bauckhage C, Cremers A B. Informed Haar-Like Features Improve Pedestrian Detection:IEEE Conference on Computer Vision and Pattern Recognition,2014[C].
[7]Wu B,Nevatia R. Detection of multiple,partially occluded humans in a single image by Bayesian combination of edgelet part detectors:Tenth IEEE Intern mputer Vision,2005[C].
[8]Wu S,Laganière R,Payeur P. Improving pedestrian detection with selective gradient self-similarity feature[J]. Pattern Recognition,2015,48(8):2364-2376.
A Survey of the Methods in Pedestrians Detection in Video
Li Jinming1Qu Yi2Pei Yuhao1Yi Zejiang1
1. Graduate Management Team, CAPF of Engineering University, Shaanxi Xi’an 710086
2. Department of information engineering, CAPF of Engineering University, Shaanxi Xi’an 710086
Pedestrian detection is an active area in the research of computer vision. This strong interest can be driven by a wide of promising application in many areas such as virtual reality, smart surveillance and so on. This paper emphasizes on one major issue, the moving object classification and then discussed the pros and cons of different approaches. Finally,the paper gives the future work of the pedestrian detection.
pedestrian detection; smart surveillance; sport detection; object classification
TP391.41
A
1009-6434(2017)7-0119-02