摘 要:監(jiān)控視頻圖像的背景多種多樣,簡(jiǎn)單背景和動(dòng)態(tài)復(fù)雜背景中的運(yùn)動(dòng)目標(biāo)的特點(diǎn)不同、所采取的檢測(cè)方法也要有所不同。主要對(duì)目前的運(yùn)動(dòng)目標(biāo)檢測(cè)算法進(jìn)行了闡述,根據(jù)各自算法的特點(diǎn)做了區(qū)分,選取了幀間差法和背景差法用于簡(jiǎn)單背景下的運(yùn)動(dòng)目標(biāo)檢測(cè),而動(dòng)態(tài)復(fù)雜背景下的運(yùn)動(dòng)目標(biāo)檢測(cè)算法則主要采用光流法、高斯建模、ViBe算法,最后對(duì)五種算法進(jìn)行了總結(jié)和對(duì)比。
關(guān)鍵詞:復(fù)雜背景;運(yùn)動(dòng)目標(biāo);檢測(cè);光流法;高斯模型
1 概述
運(yùn)動(dòng)目標(biāo)檢測(cè)是智能視頻監(jiān)控系統(tǒng)的重要的基礎(chǔ)技術(shù),也是視頻系統(tǒng)中行為識(shí)別、目標(biāo)跟蹤等智能分析技術(shù)的基礎(chǔ),在國家和社會(huì)公共安全、航空航天等重要領(lǐng)域以及很多民用領(lǐng)域都有著舉足輕重的作用,在目標(biāo)跟蹤、人機(jī)交互、交通管控、視頻檢索等領(lǐng)域都有實(shí)踐價(jià)值。視頻系統(tǒng)中的運(yùn)動(dòng)目標(biāo)檢測(cè)的應(yīng)用前景非常巨大,市場(chǎng)需求廣泛,所以受到了全球相關(guān)領(lǐng)域研究者的高度關(guān)注,很多研究者提出了自己的算法。但是,各種算法都有自己的特點(diǎn)和適用對(duì)象,在不同的背景情況下,選取不同的算法實(shí)現(xiàn)運(yùn)動(dòng)目標(biāo)的檢測(cè)是較為合理的思路。
2 運(yùn)動(dòng)目標(biāo)檢測(cè)的概念
(1)運(yùn)動(dòng)目標(biāo)檢測(cè)的概念
運(yùn)動(dòng)目標(biāo)檢測(cè)是指在將圖像畫面中的運(yùn)動(dòng)目標(biāo)及運(yùn)動(dòng)軌跡利用特殊的方法從圖像背景中提取出來,并利用技術(shù)手段消除或抑制圖像的背景噪聲和前景噪聲,得到需要檢查的目標(biāo)[1]。
(2)運(yùn)動(dòng)目標(biāo)的分類以及各自特點(diǎn)
小目標(biāo),是指在圖像中的成像投影小到?jīng)]有形狀的目標(biāo)(與目標(biāo)本身的尺寸大小無關(guān),而是由于距離檢測(cè)點(diǎn)較遠(yuǎn))[2]。小目標(biāo)在圖像中的成像很小,它在整個(gè)圖像序列中連續(xù)運(yùn)動(dòng),與圖像背景和圖像噪聲的運(yùn)動(dòng)情況有明顯的差異,一般以幀為單位檢測(cè)目標(biāo)。
大目標(biāo),是指在圖像背景中先初步確定目標(biāo)的輪廓和軌跡,然后再利用幀間信息進(jìn)行確認(rèn)與對(duì)比。
(3)背景的分類以及各自常用的檢測(cè)方法
視頻信息中的背景大致分為兩種:第一種是攝影機(jī)器保持不動(dòng),只有目標(biāo)運(yùn)動(dòng),這種場(chǎng)景叫簡(jiǎn)單背景,也叫靜態(tài)背景;第二種是目標(biāo)在運(yùn)動(dòng)而且攝影機(jī)器也在運(yùn)動(dòng),這樣的場(chǎng)景叫復(fù)雜背景,也叫動(dòng)態(tài)背景[3]。
在拍攝靜態(tài)背景的視頻時(shí),攝像頭不動(dòng),所以得到的視頻圖像的背景是靜止的、多幅圖像的背景是相同的。靜態(tài)背景中運(yùn)動(dòng)目標(biāo)的檢測(cè)就變得簡(jiǎn)單很多。適合靜態(tài)背景中的最為經(jīng)典的檢測(cè)算法有背景差法、幀間差分法等。然而,復(fù)雜背景(動(dòng)態(tài)背景)中,被檢測(cè)目標(biāo)和攝像頭都在運(yùn)動(dòng),除了由于運(yùn)動(dòng)目標(biāo)產(chǎn)生的圖像變化之外,還有圖像背景本身的變化,以及運(yùn)動(dòng)目標(biāo)運(yùn)動(dòng)過程中運(yùn)動(dòng)目標(biāo)與背景物體相互影響所產(chǎn)生的光照陰影等,使得檢測(cè)不但受環(huán)境的改變而且還會(huì)受到目標(biāo)和背景本身的影響,這種變化不但復(fù)雜而且毫無規(guī)律可循。因此,動(dòng)態(tài)背景中運(yùn)動(dòng)目標(biāo)檢測(cè)非常困難。
3 運(yùn)動(dòng)目標(biāo)檢測(cè)算法
運(yùn)動(dòng)目標(biāo)的主流檢測(cè)算法主要有幀間差分法、背景差法、光流法、高斯建模和vibe算法等[3-12]。幀間差分法和背景差法需要檢測(cè)背景相對(duì)平穩(wěn),更適合靜態(tài)背景中運(yùn)動(dòng)目標(biāo)的檢測(cè)。在動(dòng)態(tài)復(fù)雜背景中常用的檢測(cè)算法是光流法、混合高斯建模、Vibe算法等。
3.1 簡(jiǎn)單背景下運(yùn)動(dòng)目標(biāo)檢測(cè)算法
(1)幀間差分法
幀間差分法即幀差法,它是視頻圖像的運(yùn)動(dòng)目標(biāo)檢測(cè)中最為經(jīng)典的算法。幀間差分法常常使用在環(huán)境變化很小的情況下。目前的攝影機(jī)每秒可以拍攝至少8/12/24幀圖像,所以相鄰的兩幀圖像時(shí)間間隔很短,可以利用前后兩幅圖像的差值來判斷圖像中的運(yùn)動(dòng)目標(biāo)。將相鄰兩幀圖像進(jìn)行像素值相減,如果所得到的像素差值很小,則可以認(rèn)為此處目標(biāo)是靜止的,反之,如果得到的像素差值很大,則此處為運(yùn)動(dòng)物體。由算法原理可以看出幀間差分法的本質(zhì)是利用相鄰幀圖像的對(duì)應(yīng)像素值之差來確定運(yùn)動(dòng)目標(biāo)的輪廓[13],所以它適合于背景變化很小的情形。幀差法雖然對(duì)各種環(huán)境均有較好的適應(yīng)性和穩(wěn)定性,但是,該法不能提取運(yùn)動(dòng)目標(biāo)的所有相關(guān)的特征像素點(diǎn),因此在運(yùn)動(dòng)目標(biāo)內(nèi)部會(huì)產(chǎn)生所謂的空洞現(xiàn)象。
(2)背景差法
背景差法也是常用的運(yùn)動(dòng)目標(biāo)的檢測(cè)算法之一,它的基本原理是將運(yùn)動(dòng)目標(biāo)與背景模型進(jìn)行比較,通過判定圖像的特征變化或直方圖等統(tǒng)計(jì)數(shù)據(jù)的變化來檢測(cè)運(yùn)動(dòng)目標(biāo)[14]。
背景差法在圖像背景沒有變化或者變化很小時(shí),可以比較完整地檢測(cè)出視頻圖像中運(yùn)動(dòng)目標(biāo)。但是對(duì)于背景經(jīng)常變化的情形,需要頻繁地更新背景。背景的更新使得背景差法非常復(fù)雜、計(jì)算量很大,難以用于運(yùn)動(dòng)目標(biāo)的實(shí)時(shí)檢測(cè)。背景差法的實(shí)現(xiàn)方法和幀間差分法大致相同,都是進(jìn)行相減操作,不同之處在于幀間差分法的相減是相鄰幀之間的差分運(yùn)算,而背景差法中需要建立背景模型,把背景模型和檢測(cè)幀進(jìn)行差分運(yùn)算。
3.2 復(fù)雜背景下運(yùn)動(dòng)目標(biāo)檢測(cè)算法
(1)光流法
光流是運(yùn)動(dòng)目標(biāo)的被觀測(cè)面上的像素點(diǎn)因?yàn)槟繕?biāo)運(yùn)動(dòng)所產(chǎn)生的瞬時(shí)速度場(chǎng),包含了目標(biāo)物體的表面結(jié)構(gòu)和動(dòng)態(tài)運(yùn)動(dòng)的重要特征[15]。光流法利用像素點(diǎn)速度場(chǎng)的補(bǔ)償來檢測(cè)運(yùn)動(dòng)目標(biāo),可以有效地去除背景動(dòng)態(tài)變化對(duì)運(yùn)動(dòng)目標(biāo)檢測(cè)所帶來的不良影響。光流法大致可分為三類:
基于匹配的光流計(jì)算法:包括基于特征匹配和基于區(qū)域匹配的兩種。前者是連續(xù)地對(duì)運(yùn)動(dòng)目標(biāo)的主要特征點(diǎn)進(jìn)行定位和跟蹤,這種算法優(yōu)點(diǎn)在于對(duì)大目標(biāo)的運(yùn)動(dòng)和亮度變化具有很好的適應(yīng)性,其缺點(diǎn)是是光流通常很稀疏,且特征提取和匹配都很十分困難。后者先對(duì)相似度很高的區(qū)域進(jìn)行定位,然后根據(jù)相似區(qū)域的位移計(jì)算光流,這種基于區(qū)域的匹配方法在視頻編碼中非常普及,但它計(jì)算的光流不完整,難以用于運(yùn)動(dòng)目標(biāo)的檢測(cè)定位。
基于頻域的光流計(jì)算法:利用濾波調(diào)節(jié)輸出頻率或相位信息,獲得高精度的初始光流估計(jì),這種方法計(jì)算復(fù)雜,且要想得到可靠性數(shù)據(jù)也十分困難,所以,同樣不適合于運(yùn)動(dòng)目標(biāo)的檢測(cè)定位。
基于梯度的光流計(jì)算法:此種方法是指用圖像序列的時(shí)空微分計(jì)算光流。對(duì)畫面中圖像像素點(diǎn)首先進(jìn)行逐個(gè)矢量賦值,當(dāng)畫面中出現(xiàn)運(yùn)動(dòng)目標(biāo)時(shí),運(yùn)動(dòng)目標(biāo)在畫面總所占據(jù)的像素點(diǎn)和背景像素點(diǎn)之間的矢量必然出現(xiàn)差異,利用運(yùn)動(dòng)目標(biāo)與背景之間的差異,檢測(cè)出運(yùn)動(dòng)目標(biāo)在畫面中的像素點(diǎn)[15]。如果沒有運(yùn)動(dòng)目標(biāo)出現(xiàn),則畫面中的像素點(diǎn)的矢量變化是平滑的。相對(duì)而言,基于梯度的光流計(jì)算方法更實(shí)用。
光流法適合于攝影機(jī)運(yùn)動(dòng)的情況,但是光流法時(shí)間復(fù)雜度高,不能滿足實(shí)時(shí)檢測(cè)的要求。
(2)混合高斯模型算法
混合高斯模型是一種典型的背景建模算法,其原理是將運(yùn)動(dòng)目標(biāo)的像素與背景模型進(jìn)行統(tǒng)計(jì)對(duì)比,和背景模型相似度比較高的像素點(diǎn)看作背景,相似度比較低的像素點(diǎn)視為前景,選擇中心點(diǎn)和對(duì)應(yīng)的系數(shù)更新模型,再利用形體特征進(jìn)行運(yùn)動(dòng)目標(biāo)檢測(cè)[16]。在混合高斯模型算法中,背景模型對(duì)應(yīng)一個(gè)更新參數(shù),如果背景發(fā)生變化,只要更新背景模型就能重新檢測(cè)到目標(biāo)。
混合高斯模型是由M個(gè)(一般為3到5個(gè))單高斯模型組成的。在獲取新的一幀圖像之后,如果當(dāng)前圖像中的像素點(diǎn)與該像素的M個(gè)模型中的某一個(gè)相似度比較高,則視為背景,并將當(dāng)前幀的像素作為一個(gè)新模型,對(duì)已存在的M個(gè)模型進(jìn)行更新。如果匹配度比較低,則為前景點(diǎn)。圖像中每個(gè)像素點(diǎn)的值在短時(shí)間內(nèi)都是圍繞特定的中心值呈正態(tài)分布。整個(gè)混合高斯模型算法主要有方差和均值兩個(gè)參數(shù),這兩個(gè)參數(shù)直接影響該算法的正確性、穩(wěn)定性[17~18]。
3.3 ViBe算法
ViBe算法在2011年被Marc Van Droogenbroeck和Olivier Barnich提出,ViBe算法也是背景建模算法的一種,其主要特點(diǎn)是Vibe算法背景的更新是隨機(jī)的,更利于復(fù)雜背景中運(yùn)動(dòng)目標(biāo)實(shí)時(shí)檢測(cè),是現(xiàn)階段較為前沿的算法之一。ViBe算法主要是利用單幀視頻序列初始化背景模型,對(duì)于每一個(gè)像素點(diǎn),隨機(jī)選擇它的鄰域點(diǎn)的像素值作為它的模型樣本值[17]。
Vibe算法中,更新方式采用八鄰域方法,可以抑制由于獲取視頻時(shí)因攝像機(jī)抖動(dòng)、目標(biāo)微動(dòng)而產(chǎn)生的重影和誤差,讓檢測(cè)目標(biāo)更加準(zhǔn)確。由于每次背景模型更新的個(gè)數(shù)相近,所以我們把第一幀背景更新的次數(shù)作為比較值,對(duì)背景模型進(jìn)行重新初始化,這樣可以避免由于大面積的光照變化導(dǎo)致的誤判。ViBe算法的背景更新是隨機(jī)的。在時(shí)間上,在背景模型中隨機(jī)抽取一幀圖像的像素值作為比較值,重新選擇一幀的新圖像,如果新圖像的像素值與比較值相差太大,則圖像就被判斷為背景,需要被更新;在空間上,從背景鄰域中隨機(jī)抽取一個(gè)像素點(diǎn),用這個(gè)像素點(diǎn)的來替換掉這個(gè)鄰域周圍的像素點(diǎn)[17,19]。
Vibe算法對(duì)噪聲的反應(yīng)比較靈敏,計(jì)算量小、速度快,可以很快地進(jìn)行運(yùn)動(dòng)目標(biāo)的檢測(cè)。
4 結(jié)束語
運(yùn)動(dòng)目標(biāo)的檢測(cè)容易受到環(huán)境的影響,面臨的主要問題有:光照變化、局部遮擋、目標(biāo)尺度變化、圖像抖動(dòng),噪聲干擾,光線變化,陰影,區(qū)域內(nèi)部反光,運(yùn)動(dòng)目標(biāo)緩慢移動(dòng)等。在根據(jù)背景做運(yùn)動(dòng)目標(biāo)檢測(cè)時(shí),可以根據(jù)不同情況選取不同的檢測(cè)算法。在簡(jiǎn)單背景情形中,可以選擇幀間差分法和背景差法。幀間差分法動(dòng)態(tài)性強(qiáng),能夠適應(yīng)動(dòng)態(tài)背景下的運(yùn)動(dòng)目標(biāo)檢測(cè)。但是該法的實(shí)現(xiàn)原理導(dǎo)致了該法檢測(cè)出的運(yùn)動(dòng)目標(biāo)輪廓內(nèi)部很可能出現(xiàn)許多空洞,有時(shí)甚至無法得到目標(biāo)的邊界。背景差法在背景不變或變化很小時(shí)可以準(zhǔn)確地獲取運(yùn)動(dòng)目標(biāo),但是由于通常需要緩沖若干幀來完成背景減除,因此需要消耗大量的內(nèi)存,這使其使用范圍受到了限制。在復(fù)雜背景也就是動(dòng)態(tài)背景情形下,適合采用光流法、高斯混合模型、Vibe算法。光流法在攝像機(jī)運(yùn)動(dòng)、背景變化時(shí),也能檢測(cè)出運(yùn)動(dòng)目標(biāo),并且它能同時(shí)完成運(yùn)動(dòng)目標(biāo)檢測(cè)和跟蹤,但是該方法的計(jì)算復(fù)雜度高,也容易受到噪聲、光照變化和背景擾動(dòng)的影響。高斯混合模型通過對(duì)背景的不斷更新,使系統(tǒng)能對(duì)背景變化自適應(yīng)。但是,高斯混合模型對(duì)于全局光照變化、陰影非常敏感,對(duì)于緩慢的運(yùn)動(dòng)目標(biāo)檢測(cè)效果也不理想。Vibe算法是較為前沿的背景建模的運(yùn)動(dòng)目標(biāo)檢測(cè)算法,在更新模型時(shí)利用了圖像像素值的空間傳播特性,背景模型逐漸向外擴(kuò)散,能快速識(shí)別并且消除Ghost區(qū)域,在前景檢測(cè)和背景模型更新上都存在顯著優(yōu)勢(shì)。
參考文獻(xiàn)
[1]BERND Jahne. Digital Image Processing[J].Springer,2000:7-13.
[2]LOWE D. Distinctive Image Features from Scale Invariant Keypoints[J].International Journal of Computer Vision,2004,60(2):91-110.
[3]白曉方.復(fù)雜背景下運(yùn)動(dòng)目標(biāo)檢測(cè)與跟蹤技術(shù)研究[D].中北大學(xué),2014.
[4]王歡.復(fù)雜背景下運(yùn)動(dòng)目標(biāo)檢測(cè)與跟蹤研究[D].北京理工大學(xué),2015.
[5]C.Harris, M. Stephens. A Combined Corner and Edge Detector[C].In Proceedings of the Fourth Alvey Vision Conference,1988:147-151.
[6]解曉萌.動(dòng)態(tài)背景下運(yùn)動(dòng)目標(biāo)檢測(cè)關(guān)鍵技術(shù)的研究[D].華南理工大學(xué),2012.
[7]駱勇.復(fù)雜場(chǎng)景下運(yùn)動(dòng)目標(biāo)檢測(cè)關(guān)鍵技術(shù)研究[D].上海交通大學(xué),2012.
[8]鐘必能.復(fù)雜動(dòng)態(tài)場(chǎng)景中運(yùn)動(dòng)目標(biāo)檢測(cè)與跟蹤算法研究[D].哈爾濱工業(yè)大學(xué),2010.
[9]徐功益.復(fù)雜背景下運(yùn)動(dòng)目標(biāo)檢測(cè)方法[D].中國科學(xué)院研究生院,2007.
[10]黃大衛(wèi).復(fù)雜場(chǎng)景下的運(yùn)動(dòng)目標(biāo)檢測(cè)算法研究[D].安徽大學(xué),2016.
[11]張輝.復(fù)雜場(chǎng)景圖像序列中運(yùn)動(dòng)目標(biāo)檢測(cè)與跟蹤研究[D].北京理工大學(xué),2010.
[12]張森悅.復(fù)雜背景下運(yùn)動(dòng)目標(biāo)檢測(cè)方法研究[D].沈陽航空工業(yè)學(xué)院,2009.
[13]HOWZE JW. Robust tracking, error feedback and two-degree-of-freedom controller[J].IEEE Trans AC, 1997,47(7):980-983.
[14]CHRIS Stauffer, W.E.L Grimson. Learning Patterns of Activity Using Real-time Tracking[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2000,22(8):747-757.
[15]張金林,萬蔚,芮挺,等.基于改進(jìn)的Lucas-Kanade光流估算模型的運(yùn)動(dòng)目標(biāo)檢測(cè)[J].微計(jì)算機(jī)信息,2010.
[16]郝毫剛.基于五幀差分和背景差分的運(yùn)動(dòng)目標(biāo)檢測(cè)算法[D].上海理工大學(xué),2012.
[17]王小霞.復(fù)雜場(chǎng)景運(yùn)動(dòng)目標(biāo)檢測(cè)[D].東華大學(xué),2014.
[18]李博川,丁軻.結(jié)合陰影抑制的混合高斯模型改進(jìn)算法[J].計(jì)算機(jī)工程與科學(xué),2016,3.
[19]洪飛.復(fù)雜背景下運(yùn)動(dòng)目標(biāo)跟蹤算法研究[D].西安電子科技大學(xué),2013.
作者簡(jiǎn)介:王春蘭(1980,2-),女,重慶,碩士,講師,研究方向:圖像處理。