孫 濤,陳瑞平
(煙臺大學(xué),山東 煙臺 264005)
運動目標的檢測是指從序列圖像中將運動目標從背景圖像中分割出來。運動目標的檢測和跟蹤是計算機視覺研究的主要問題之一,它融合了自動控制、圖像處理、模式識別、計算機及人工智能等領(lǐng)域的先進技術(shù),在智能交通、視頻監(jiān)控、醫(yī)療診斷等方面都有廣泛的運用[1]。常見的運動目標檢測方法主要有背景圖像差分法、幀間差分法、光流法和邊緣檢測。背景差分法是采用當(dāng)前圖像與背景圖像同位置的像素相減的方式進行前景目標檢測。它實現(xiàn)簡單,能完整地分割出運動目標;缺點是容易受光照等外在環(huán)境條件的影響。幀間差分法是相鄰幀的圖像對應(yīng)像素點的灰度值相減,對差分圖像進行二值化處理來確定運動目標。幀間差分法自適應(yīng)性強,穩(wěn)健性好,可適用于運動場景,但一般不能完整的檢測出運動目標,容易產(chǎn)生空洞現(xiàn)象。光流法是對序列圖像的光流長分析,來檢測出運動的目標,但計算量大,實時性差,對硬件要求高。邊緣檢測法的原理是圖像的邊緣為圖像中灰度發(fā)生變化明顯的區(qū)域。邊緣檢測方法有利于鄰近運動目標的區(qū)分和運動目標特征的提取,穩(wěn)健性好,但運算復(fù)雜度也相對較大[2-5]。
通過總結(jié)、分析各種運動目標檢測算法的優(yōu)缺點,本文提出了一種基于背景查分法和三幀差分法相結(jié)合的運動目標檢測算法,該算法能有效地分割出視頻中的運動目標。由于背景圖像的動態(tài)變化,如光照、天氣、影子等干擾因素,是運動檢測成為一個相當(dāng)困難的工作。在此,只研究在背景靜止情況下的目標檢測。
運動目標的檢測過程包括運動目標檢測的預(yù)處理、運動目標的分割、運動目標的跟蹤。背景差分法的關(guān)鍵是背景圖像的提取。獲取背景圖像的簡單方法是在場景沒有運動目標的情況下進行,但在大部分的場合是無法實現(xiàn)的。一個有效的背景的提取應(yīng)該解決幾種常見的現(xiàn)實中存在的問題:1)背景中存在運動物體。初始化背景圖像時存在運動的物體,容易把物體變成背景圖像的一部分。2)陰影問題。無論是白天還是夜晚都存在光照,物體就存在影子,影子的像素和背景的像素不同就被判為背景圖像的一部分。3)背景的變化。背景中的物體可能在一段時間后發(fā)生位置的變化,差分圖像就會出現(xiàn)錯誤[6]。
算法流程圖如圖1所示。
圖像預(yù)處理中最重要的問題就是噪聲的存在,去除噪聲是首要任務(wù)。消除噪聲可以增強圖像對比度,從而改善圖像質(zhì)量,提高圖像的對比度,以便于后期處理。攝像機拍攝的圖片可能因為一些外在原因被其他的隨機信號(即噪聲)污染,考慮到此噪聲的特性,可采用中值濾波法,中值濾波法對很多隨機噪聲都有良好的去噪能力。
圖1 算法流程圖
背景初始化常見的一種方法是在室內(nèi)、走廊等一些場景變化不大的地方,直接采用靜態(tài)的沒有運動物體的背景圖像,將不同時間段的背景圖像儲存到數(shù)據(jù)庫中,然后根據(jù)時間提取相對應(yīng)的背景圖片。但前期數(shù)據(jù)采集麻煩,穩(wěn)健性也不好。另一種常見的方法就是對一段時間內(nèi)的視頻圖像用累加求平均值的方法獲得背景圖像。此方法雖然計算簡單,但是很容易把前景目標混入到背景圖像中,使背景圖像模糊。還有一種較高級的方法是混合高斯模型法,對于緩慢變化的背景,可以用正態(tài)分布來表征像素灰度值的變化,每一種背景圖像的像素都可以通過多個高斯分布的加權(quán)和來描述?;旌细咚鼓P头ㄓ嬎懔看?、實時性差、對硬件設(shè)備的要求高[6]。
最常見的方法為累加求平均值的方法,公式為
式中:F(x,y)為所求的背景圖像,F(xiàn)i(x,y)為第i幀圖像。這種方法有很大的缺點,當(dāng)初始化時圖像序列中存在運動物體時,容易在背景圖像中產(chǎn)生模糊的影子,影響背景圖像的質(zhì)量。
改進方法為:取一段視頻的圖像求平均值,然后用平均圖像的灰度值與每一幀圖像的灰度值相減所得絕對值,利用絕對值最小的對應(yīng)圖像的部分區(qū)域組成的圖像就是當(dāng)前的背景圖像。
求3幀圖像灰度值的平均值,公式為
每幀圖像的灰度值與平均值相減的絕對值,公式為
判斷其中的最小值,最小值對應(yīng)的圖像部分可以認為背景圖像,公式為
式中:i≤3。
平均法與改進法的比較如圖2所示。背景初始化時,視頻中存在運動目標的情況下,使用多幀圖像取平均值的效果很差,而改進法就明顯得到改進。平均法得到的背景圖片存在模糊的人影,而改進法存在些物體邊緣上的點,這些噪聲可以通過中值濾波去除,通過直方圖均衡化,增加圖像的對比度。
圖2 平均法與改進法的比較
監(jiān)控視頻中的背景并不是一成不變的。最常見的影響背景變化的就是光照,隨著時間的推移、光照的強度和方向的改變,使陰影的灰度值和位置發(fā)生改變,例如白天到黑夜的變化,物體陰影的灰度值就會發(fā)生明顯的變化。其次就是背景區(qū)域內(nèi)的變化,例如停車場內(nèi)新停放的車輛,它們是長時間不移動的,可以視為背景物體,或者是停車場原來的車輛開走,背景圖像中原有的物體消失。如果背景圖像沒有實時更新,會影響運動物體的檢測,把背景中的新增物體當(dāng)成運動物體檢測出來,或者是在運動實體內(nèi)部容易產(chǎn)生空洞現(xiàn)象,所以背景圖像需要更新[7]。
常用的背景圖像更新方法是:每隔一段時間提取新的背景圖像,新取的圖像可以是連續(xù)幀的視頻圖像的平均值,新取圖像與之前的背景圖像按照一定的比例綜合,就是新的背景圖像。此方法取得的背景還是受到運動物體的影響,仍需改進。數(shù)學(xué)表達式如下
F(x,y)=αFi+1(x,y)+(1 - α)Fi(x,y),0 < α < 1 (6)式中:F(x,y)為最新的背景圖像,F(xiàn)i(x,y)為上次的背景圖像,F(xiàn)i+1(x,y)為當(dāng)前新取的背景圖像,F(xiàn)j(x,y)和Fj+1(x,y)為連續(xù)的幾幀圖像,α為權(quán)值,α的取值盡量取大一些,約為0.8~0.95,如果取值太小,背景更新效果不佳。
取幾幀圖像按照背景初始化時的改進算法處理,然后與上次的背景圖像取綜合。計算量有所增加,但背景圖像的準確度高,不宜受運動物體及陰影等影響。取當(dāng)前幾幀連續(xù)的圖像,按照初始化的算法求的新的背景圖像Fi+1(x,y)
式中:F(x,y)為最新的背景圖像,F(xiàn)i(x,y)為上次的背景圖像,F(xiàn)i+1(x,y)為當(dāng)前新取的背景圖像,F(xiàn)j(x,y)和Fj+1(x,y)為連續(xù)的幾幀圖像,α為權(quán)值,表達式為
在二值化的處理過程中,閾值的選擇是圖像二值化的關(guān)鍵。單一閾值對差分圖像進行二值化操作存在很大的弊端。閾值過小,就得不到完整的運動目標;閾值過大,就會出現(xiàn)太多噪聲。
單一閾值二值化圖像的獲取,其數(shù)學(xué)表達式為
式中:F(x,y)為背景圖像,F(xiàn)i(x,y)為當(dāng)前幀,Di為二值化后的差值圖像。
對單一閾值的改進方法一般有2種:1)動態(tài)閾值法,根據(jù)不同的圖像確定不同的閾值,基本思想是不同時間段使用不同的閾值,使圖像進行二值化處理以后,使得目標與背景2個像素的類間方差取最大值時的閾值為最佳閾值;2)雙閾值法,取2個閾值,設(shè)雙閾值中的高閾值為YH,此時得到的差值圖像為圖YH,圖YH由于閾值過大,提取的運動目標不完整。雙閾值中的低閾值為YL,此時得到的差值圖像為圖YL,由于閾值過小,圖YL中不僅提取了運動目標,同時也包含大量的噪聲。圖YH和圖YL取與,可以得到較完整的運動目標,并很好地去除噪聲[8]。其數(shù)學(xué)表達式如下
式中:F(x,y)為背景圖像,F(xiàn)i(x,y)為當(dāng)前幀,Di(x,y)為大閾值二值化后的差值圖像,(x,y)為小閾值二值化后的差值圖像。
本文使用動態(tài)閾值法。動態(tài)閾值的取值隨時間變化的,當(dāng)光照變化、背景中的物體發(fā)生改變時,閾值也改變。基于改進迭代的閾值計算方法,初始閾值選取為圖像灰度的中值F0,然后以F0為圖像的像素點分界點分成2個部分,計算出2個部分的平均灰度,分別為FA和FB,計算F1=,用F1代替F0,重復(fù)以上過程,如此迭代,直至FK收斂,即FK+1=FK。此時FK是基數(shù),閾值是基數(shù)的0.3~0.6倍。
三幀差分法獲得的二值化圖像,將兩種方法獲得的運動區(qū)域相或,便可以獲得比較完整的運動區(qū)域。二值化圖像和運動區(qū)域如圖3所示。
圖3 二值化圖像和運動區(qū)域
二值化的圖像仍然存在一些小的噪聲干擾點,影響運動目標的檢測的質(zhì)量,因此還需對二值化圖像進行后期處理。首先,對二值化圖像進行中值濾波,消除小噪聲;然后,采用數(shù)學(xué)形態(tài)學(xué)圖像處理中的腐蝕、膨脹、開啟和閉合算法對二值化圖像處理,去除前景點等噪聲,從而得到相對完整的運動目標的輪廓。
在視頻圖像中運動目標的檢測過程中,背景的選取和閾值是關(guān)鍵。本文提出的背景差分法和幀差分法相結(jié)合的算法,很好地解決了背景選取的問題,動態(tài)閾值法改善了固定單一閾值的弊端。本文提出的運動目標檢測與識別的原理存在一定的缺點,只能適用于固定攝像機,但此算法的實時性好、計算量小,完全滿足室內(nèi)和一些固定場合的監(jiān)控。
[1]劉桂喜,邵明禮,劉先紅,等.真實場景下視頻運動目標自動提取的方法[J]. 光學(xué)學(xué)報,2006,28(8):1150-1155.
[2]LI Gang,ZENG Ruili,LI Ling.Moving target detection in video monitoring system[C]//Proc.the 6th World Congress on Intelligent Control.Dalian,China:[s.n.],2006:9778-9781.
[3]楊長生,李志舜.水下高速運動目標檢測及其DSP實現(xiàn)[J].電聲技術(shù),2004,28(7):30-36.
[4]楊冬冬,常丹華,韓夏.運動目標檢測與跟蹤算法的改進與實現(xiàn)[J].激光與紅外,2010,40(2):205-209.
[5]XIAO Benxian,LU Cheng,CHEN Hao,et al.Moving object detection and recognition based on the frame difference algorithm and moment invariant features[C]//Proc.the 27th Chinese Control Conference.Kunming,China:[s.n.],2008:578-581.
[6]萬衛(wèi)兵,霍宏,趙宇明.智能視頻監(jiān)控中目標檢測與識別[M].上海:上海交通大學(xué)出版社,2009:43-49.
[7]胡彪,龔曉峰.基于改進背景差法的運動目標檢測[J].計算機工程與設(shè)計,2010,31(17):3841-3844.
[8]陳明潔.智能視頻監(jiān)控系統(tǒng)目標檢測和跟蹤技術(shù)分析[J].電視技術(shù),2008,32(10):85-87.