雷永俊
【摘 要】基于計算機視覺的行人檢測,由于其在智能視頻監(jiān)控系統(tǒng)、車輛輔助駕駛系統(tǒng)、以及智能機器人等方面的廣泛應(yīng)用,成為當(dāng)前計算機視覺中最為活躍的研究課題。對行人檢測相關(guān)專利的發(fā)展歷程進行了回顧,結(jié)合專利申請的現(xiàn)狀分析了行人檢測的主要技術(shù),并簡要分析了行人檢測技術(shù)的發(fā)展趨勢。
【關(guān)鍵詞】行人檢測;計算機視覺
【中圖分類號】TP391.4 【文獻標(biāo)志碼】A
一、行人檢測相關(guān)專利發(fā)展歷程
計算機視覺中的行人檢測技術(shù),通俗來講,是指對于給定的圖片或視頻幀,計算機判斷出圖片或視頻幀中是否包含行人,如果包含行人,給出行人的位置信息。行人檢測技術(shù)廣泛地應(yīng)用于智能視頻監(jiān)控系統(tǒng),車輛輔助駕駛系統(tǒng),智能機器人,人體行為分析等領(lǐng)域。由于行人具有多樣性,如人體姿態(tài)各異、著裝多樣變化,同時場景具有多樣性,如天氣和光線變化、景物遮擋等,使得行人檢測技術(shù)成為計算機視覺領(lǐng)域中的一個研究熱點和研究難點。
行人檢測技術(shù)的發(fā)展經(jīng)歷了早期發(fā)展階段和快速發(fā)展階段。最早的行人檢測專利是US3462692(公開于1969年)公開的一種行人檢測系統(tǒng),其也可以檢測物體,該系統(tǒng)包括感覺器,振蕩器,一個平衡電容橋,補償控制電路等,其中感覺器是一個導(dǎo)電平板,其通過行人或者物體處于導(dǎo)電平板上,與地面之間形成的電容值導(dǎo)致平衡電容橋不平衡來檢測行人或者物體的存在。JPH10247297A(公開于1998年)公開一種行人檢測器,其通過一對相機采集斑馬線區(qū)域的圖像并輸出圖像信號,處理單元將所述圖像信號進行傅立葉變換,通過對傅立葉變換后的擴展頻譜檢測確定行人是否存在。這些專利可以視為早期的行人檢測,特別是JPH10247297A,已經(jīng)具備了計算機視覺中行人檢測技術(shù)的雛形,其處理單元處理的信號為圖像信號,經(jīng)過對圖像信號的處理進而判斷是否有行人。
隨著時間的推移,計算機的性能有了很大的提高,當(dāng)其可以處理如圖像這樣的大規(guī)模數(shù)據(jù)時,計算機視覺才得到了正式的關(guān)注和發(fā)展,進而作為其一個重要分支的行人檢測也得到了相應(yīng)的關(guān)注和發(fā)展。這可以從行人檢測的專利申請量的快速遞增中得以充分的體現(xiàn)。計算機視覺中的行人檢測技術(shù)在2000年以后逐漸從早期階段進入了發(fā)展階段,特別是在2010年以后進入了快速發(fā)展階段,相關(guān)的專利申請量逐年遞增。
二、行人檢測中的分類技術(shù)
現(xiàn)有行人檢測方法有多種分類方式,有的將行人檢測方法分為:基于全局特征的方法,基于人體部件的方法,基于立體視覺的方法[1];有的將行人檢測技術(shù)分為特征提取和目標(biāo)檢測。每一種分類方式都有其如此分類的原因。下面針對第一種分類方式中涉及的主要專利技術(shù)進行一一介紹。
1.基于全局特征的方法
1)基于小波特征
基于小波特征的方法,主要是基于小波模板概念,將圖像中小波相關(guān)系數(shù)子集定義為目標(biāo)形狀的小波模板,將待檢測圖像中每個特定大小的窗口進行一定范圍的比例縮放后進行小波變換,然后利用支持向量機檢測變換的結(jié)果是否與小波模板匹配,進而檢測行人是否存在。典型的專利申請CN101630369 A(公開于2010年)公開一種基于小波分形特征的行人檢測方法,該方法具有稠密采樣信息量大的優(yōu)點,又具備稀疏采樣簡潔性的優(yōu)點;在降低計算效率的同時,提高了檢測率。
2)基于HOG特征
基于HOG特征的方法,刻畫的是圖像的梯度特征,其是最為廣泛使用和成功的行人特征,可采用積分圖技術(shù)快速計算。典型專利申請CN102609716 A(公開于2012年)公開一種基于改進的HOG特征和PCA的行人檢測方法,該方法采用樣本圖像中行人梯度信息集中區(qū)域的HOG特征級聯(lián)PCA主元分析的特征提取算法來提取樣本特征;利用訓(xùn)練樣本提取的上述特征訓(xùn)練SVM分類器;對于檢測樣本利用上述特征提取方法提取特征向量,并利用訓(xùn)練得到的SVM分類器進行行人檢測。該方法能夠有效減少訓(xùn)練速度、降低誤檢率和漏報率。
3)Shapelet特征
Shapelet特征是利用機器學(xué)習(xí)的方法自動得到的特征。典型的專利申請CN104020845 A(公開于2014年)公開一種基于Shapelet特征的加速度傳感器放置無關(guān)化運動識別方法,通過處理加速度傳感器的運動信號識別人體運動。本方法分為數(shù)據(jù)訓(xùn)練和運動識別兩個部分,在數(shù)據(jù)訓(xùn)練部分中首先將原始的三維加速度信號處理成和放置方式無關(guān)的一維信號,然后抽取一維信號中與放置位置無關(guān)的Shapelet特征,建立識別模型;在運動識別部分中對實時采集的三維加速度信號進行處理得到和放置方式無關(guān)的一維信號,然后利用數(shù)據(jù)訓(xùn)練部分訓(xùn)練出的識別模型識別出運動。該方法可提供準(zhǔn)確的運動識別結(jié)果。
4)輪廓模板特征
基于輪廓模板特征的方法是利用圖像中行人的輪廓構(gòu)建模板,通過模板匹配來檢測是否有行人。優(yōu)點檢測方法簡單,缺點需要大量的模板才能取得好的檢測效果。典型的專利申請CN105678347 A(公開于2016年)公開了一種行人檢測方法及裝置,解決了相關(guān)技術(shù)中對行人進行檢測的方法沒有考慮到目標(biāo)邊緣的邊緣圖導(dǎo)致檢測結(jié)果不準(zhǔn)確的問題,進而達到了檢測結(jié)果較為準(zhǔn)確的效果。
2.基于人體部件的方法
基于人體部件的方法是把人體分為幾個部分,對每個部分分別進行檢測,然后將檢測結(jié)果進行整合,來判斷是否有行人。典型的專利申請為CN104361327 A(公開于2015年)公開了一種行人檢測方法,對采集到的圖像進行頭肩檢測、人臉檢測以及全人檢測,可以得到正面頭肩、背面頭肩或者側(cè)面頭肩的特征、正面全人特征信息、背面全人特征信息以及左側(cè)全人特征信息和右側(cè)全人特征信息中的一個或多個,這樣,對于人臉遮擋或偽裝的目標(biāo)行人,也可以獲得正面、背面和側(cè)面頭肩特征、以及多個角度的全人特征,對于實時處理違法行為以及事后分析都會有很大的幫助,可以極大減少相關(guān)人員的后繼工作量??朔爽F(xiàn)有技術(shù)中基于人臉檢測的人員卡口系統(tǒng)的缺陷,不但適應(yīng)正面人臉檢測,還進行背面和側(cè)面的行人檢測,一個人的人臉快照加上全人快照就基本包含了一個人的全部信息,便于后期進行一些深入分析。
3.基于立體視覺的方法
基于立體視覺的方法,是根據(jù)立體場景信息,估算出地面后結(jié)合身高約束或者根據(jù)深度圖進行分割檢測,其優(yōu)點是對環(huán)境變換的魯棒性高,缺點是計算速度較慢。典型專利申請為CN103020606 A(公開于2013年)公開了一種基于雙層時空上下文信息的行人檢測方法。該方法是在基于表觀特征的基礎(chǔ)行人檢測器基礎(chǔ)上,自動提取與行人檢測相關(guān)的雙層時空上下文信息,并利用時空上下文模型對表觀特征和雙層時空上下文信息進行結(jié)合。通過引入雙層時空上下文信息,有效的解決了復(fù)雜背景和局部遮擋對檢測性能的影響,提高了行人檢測的召回率和檢測精度。
三、總結(jié)
本文回顧了計算機視覺中行人檢測專利技術(shù)的發(fā)展歷程,結(jié)合專利申請的現(xiàn)狀分析了行人檢測的主要分類技術(shù)專利,特別是針對全局特征的方法進行比較詳細的分析。由以上分析可知,上述各個行人檢測方法均有優(yōu)缺點,因此未來行人檢測技術(shù)的發(fā)展趨勢將是:多種檢測方式融合,使得行人檢測準(zhǔn)確率高,實時性好,對環(huán)境的魯棒性高,檢出效率高。
【參考文獻】
[1]張春鳳,宋加濤,王萬良,行人檢測技術(shù)研究綜述[J].電視技術(shù),2014, 38(3).