胡光龍,秦世引
(北京航空航天大學(xué)自動化科學(xué)與電氣工程學(xué)院,北京 100191)
動態(tài)成像條件下基于SURF和Mean shift的運動目標(biāo)高精度檢測
胡光龍,秦世引
(北京航空航天大學(xué)自動化科學(xué)與電氣工程學(xué)院,北京 100191)
針對動態(tài)成像條件下運動目標(biāo)檢測的難點問題,提出了一種將SURF特征和Mean shift圖像分割相結(jié)合的高精度運動目標(biāo)檢測方法.首先利用SURF特征進行圖像配準(zhǔn),以補償背景圖像的運動漂移;然后利用差分求積二值化和形態(tài)學(xué)濾波方法檢測出運動目標(biāo)區(qū)域;最后結(jié)合Mean shift圖像分割方法實現(xiàn)運動目標(biāo)的精確檢測.通過一系列實拍視頻的運動目標(biāo)檢測實驗驗證了此算法的有效性和可行性.實驗結(jié)果表明,此方法能精確檢測出動態(tài)成像條件下所形成的動態(tài)背景中的運動目標(biāo),而且具有良好的魯棒性和抗噪能力,對于光照條件和亮度變化等不利因素也有較強的適應(yīng)能力.
SURF;圖像配準(zhǔn);Mean shift;圖像分割;動態(tài)背景;目標(biāo)檢測
運動目標(biāo)檢測是計算機視覺領(lǐng)域的研究熱點之一,在目標(biāo)跟蹤、視頻監(jiān)控、生物醫(yī)學(xué)、機器人技術(shù)等領(lǐng)域都有著廣泛的應(yīng)用[1-4].根據(jù)攝像機是否運動,運動目標(biāo)檢測方法可分為2類:靜態(tài)背景目標(biāo)檢測和動態(tài)背景目標(biāo)檢測[5].在靜態(tài)背景目標(biāo)檢測中,攝像機處于靜止?fàn)顟B(tài),產(chǎn)生的是背景靜止的圖像序列,進行目標(biāo)檢測較為容易,且計算簡單,常用的方法有:幀間差分法、背景差分法、光流法[6]等.在動態(tài)背景目標(biāo)檢測中,由于攝像機處于運動狀態(tài),導(dǎo)致圖像中的背景和目標(biāo)同時運動,使目標(biāo)檢測變得非常復(fù)雜,是運動目標(biāo)檢測中的難點問題.
動態(tài)背景下的運動目標(biāo)檢測方法主要有3類:背景配準(zhǔn)法、光流法和相機幾何模型法[7].背景配準(zhǔn)法是在沒有相機內(nèi)外參數(shù)的情況下,利用圖像配準(zhǔn),結(jié)合背景差分法,檢測出運動目標(biāo).光流法中,由于背景和目標(biāo)運動速度不同,導(dǎo)致光流存在較大差異,并據(jù)此檢測出運動物體;但光流法計算量大,且有孔徑問題.相機幾何模型法利用相機的內(nèi)外參數(shù)計算出像素位置的變化,實現(xiàn)相機運動的補償,但在實際應(yīng)用中很難實時得到相機內(nèi)外參數(shù).
圖像配準(zhǔn)方法有模板匹配、基于特征的方法和基于傅里葉變換的方法3類[8].特征匹配法具有計算簡單、精度高的特點,但現(xiàn)有的角點匹配方法受匹配誤差和環(huán)境變化的影響較大.2006年,H.Bay在分析、總結(jié)多種特征檢測方法的基礎(chǔ)上,提出了SURF(speeded-up robust features)描述算子[9],其對圖像平移、旋轉(zhuǎn)、縮放等變化具有良好的不變性[10-11].文獻[12]利用 SURF 特征進行了圖像配準(zhǔn)和拼接方面的研究,取得了良好的效果.
針對動態(tài)視頻中進行運動目標(biāo)檢測的難點問題,鑒于Mean shift算法在圖像分割中的優(yōu)勢[13],本文提出了一種基于SURF和Mean shift的運動目標(biāo)檢測方法:首先利用SURF特征進行圖像配準(zhǔn)以補償背景運動,然后利用差分求積二值化和形態(tài)學(xué)濾波檢測出運動目標(biāo)區(qū)域,最后結(jié)合Mean shift圖像分割的方法,精確檢測出運動目標(biāo).實驗結(jié)果表明,該方法能精確檢測出運動目標(biāo),有效減少誤檢、多檢情況的發(fā)生,具有良好的魯棒性和抗噪能力.
目前,針對動態(tài)背景下的運動目標(biāo)檢測,大多數(shù)研究者傾向于使用背景配準(zhǔn)法和光流法,以獲得高精度的檢測結(jié)果,并盡可能減少誤檢、多檢情況的發(fā)生.
利用背景配準(zhǔn)法來檢測運動目標(biāo)的重點在于準(zhǔn)確補償背景運動.文獻[14]中提出的基于相位相關(guān)和差分求積二值化的運動目標(biāo)檢測方法,在攝像機只存在平移和旋轉(zhuǎn)變化時,能夠取得較好的效果,但無法適應(yīng)縮放變化.文獻[15]中提出的基于SIFT特征和差分求積二值化的運動目標(biāo)檢測方法,利用SIFT特征準(zhǔn)確補償背景運動;但形態(tài)學(xué)處理后容易導(dǎo)致目標(biāo)被割裂,造成多檢情況的發(fā)生.
文獻[16]結(jié)合光流估計和背景配準(zhǔn)方法來實現(xiàn)航拍圖像下汽車和行人的檢測和跟蹤,取得了較好的效果;但速度較慢,且對小目標(biāo)的檢測效果較差.文獻[17]提出了結(jié)合光流場的模圖像和Mean shift圖像分割的方法來精確檢測運動目標(biāo),取得了較好的結(jié)果;然而光流場計算量大,且該方法無法檢測出大位移運動目標(biāo).但其提出的結(jié)合Mean shift圖像分割來檢測運動目標(biāo)的方法,可有效減少誤檢、多檢情況的發(fā)生.
因此,結(jié)合圖像分割和邊緣檢測等方法來實現(xiàn)運動目標(biāo)的精確檢測,是動態(tài)成像條件下運動目標(biāo)檢測的發(fā)展趨勢.
本文提出的算法原理如圖1所示,其處理流程為:對輸入視頻進行采集得到相鄰4幀的彩色圖像IC1、IC2、IC3、IC4,對其進行灰度化處理得到相應(yīng)的灰度圖像IG1、IG2、IG3、IG4;然后通過提取 SURF特征進行視頻幀配準(zhǔn),可以得到IG3配準(zhǔn)到IG1的圖像IG31和IG4配準(zhǔn)到IG2的圖像IG42;進而利用差分求積二值化和形態(tài)學(xué)濾波實現(xiàn)運動目標(biāo)區(qū)域的有效檢測;最后結(jié)合Mean shift圖像分割和邊緣提取以精確檢測出運動目標(biāo).
圖1 動態(tài)成像條件下基于SURF和Mean shift的運動目標(biāo)檢測原理Fig.1 Principle of moving object detection under dynamic imaging conditions based on SURF and Mean shift
基于SURF特征提取的視頻幀配準(zhǔn)需經(jīng)過以下3個步驟:首先,在圖像的尺度空間中,提取SURF興趣點,生成特征描述符;其次,在一定的尺度空間范圍內(nèi),匹配來自不同圖像的SURF興趣點;最后,結(jié)合RANSAC算法和最小二乘法來估計出待配準(zhǔn)圖像和參考圖像間的變換參數(shù).
2.2.1 興趣點檢測
SURF興趣點的檢測是基于尺度空間理論,采用近似的Hessian矩陣來檢測興趣點.對于圖像I中某點X,X=(x,y),該點在尺度σ上的Hessian矩陣H定義為
H.Bay等提出用框狀濾波器來近似代替高斯濾波二階導(dǎo)(圖2為9×9框狀濾波器模板,圖中灰色部分模板值為0),然后用積分圖像來加速卷積,以提高計算速度.將框狀濾波器與圖像卷積的結(jié)果Dxx、Dxy、Dyy分別代替Lxx、Lxy、Lyy得到近似 Hessian矩陣Happrox,其行列式為
圖2 9×9框狀濾波器模板Fig.2 Box filters with 9×9
尺度空間是按階分層形成的,SURF采用增大方框濾波器的尺寸來達(dá)到尺度空間分層的效果.尺度空間的建立是從9×9的濾波器開始,每一階分4層.圖3為建立4階的尺度空間,圖中方框內(nèi)的數(shù)字表示框狀濾波器模板的尺寸,對數(shù)橫坐標(biāo)表示相應(yīng)的尺度,如濾波器模板尺寸為N×N,則對應(yīng)的尺度為s=1.2×N/9.
對于某一像素點,用近似的Hessian矩陣求出極值后,其上一尺度、下一尺度及本尺度可構(gòu)造一個3×3×3的立體鄰域.在三維尺度空間(x,y,s)中,進行非最大值抑制,只有比臨近的26個點的響應(yīng)值都大的點才被選為興趣點.然后利用三維2次函數(shù)擬合方法[18]對興趣點精確定位,至此可以得到興趣點的位置和尺度信息(x,y,s).
圖3 4階尺度空間框狀濾波器的尺寸Fig.3 Box filters size for four different octaves in scale space
2.2.2 興趣點描述和匹配
為保證旋轉(zhuǎn)不變性,SURF興趣點描述分2步來實現(xiàn):
1)以每一個興趣點為圓心,計算半徑為6s(s為其尺度值)的鄰域內(nèi)的點在x、y方向的Haar小波(Haar小波邊長取4s)響應(yīng),并給這些響應(yīng)值賦予高斯權(quán)重系數(shù).再將60°范圍內(nèi)的響應(yīng)相加形成新的矢量,然后遍歷整個圓形區(qū)域,選擇模長最長的矢量的方向為該興趣點的主方向.
2)以興趣點為中心,將坐標(biāo)軸旋轉(zhuǎn)到主方向,按照主方向選取邊長為20s的正方形區(qū)域,并將該區(qū)域分成4×4的子區(qū)域.在每一個子區(qū)域內(nèi),按照5×5的大小進行采樣,分別計算相對于主方向的水平和垂直方向上的Haar小波響應(yīng),記為dx和dy,同樣賦予權(quán)重系數(shù).然后對每個子區(qū)域的響應(yīng)以及響應(yīng)的絕對值求和,在每個子區(qū)域可以得到一個4維向量 V=(∑dx,∑|dx|,∑dy,∑|dy|)T,這樣 16 個子區(qū)域可形成一個64維的描述向量.
在獲得參考圖像和待配準(zhǔn)圖像的興趣點及其描述向量后,采用最近距離比次近距離的方法進行興趣點匹配.設(shè)N1、N2分別為圖像I1、I2用SURF方法提取的興趣點集合,對N1中的任一興趣點n1i,N2中與n1i的歐氏距離最近和次近的2個興趣點分別為n2j、n'2j,對應(yīng)距離分別為dij,d'ij,如果dij≤λ ×d'ij,則n1i與n2j為匹配點對,遍歷I1中的興趣點,找出所有潛在的匹配點對.這是可利用Hessian矩陣跡的正負(fù)性來加速匹配,提高匹配效率[11].
2.2.3 透視變換模型參數(shù)估計
獲得2幀圖像間的匹配點對后,就可以計算圖像間的變換關(guān)系.對于存在旋轉(zhuǎn)、縮放、平移變化的運動模型,可用透視變換模型近似.透視變換矩陣M為
設(shè) p=(x1,y1)和 q=(x2,y2)是匹配的興趣點對,則有
由于最近距離比次近距離匹配方法得到的匹配點對中,還可能有誤匹配,因此本文結(jié)合RANSAC算法和最小二乘法計算得到圖像間的透視變換關(guān)系[19].
2.2.4 視頻幀配準(zhǔn)
在完成透視變換模型參數(shù)的求解之后,就要利用得到的透視變換矩陣M把待配準(zhǔn)視頻幀中的每一點映射到參考圖像的坐標(biāo)系中.對待配準(zhǔn)的視頻幀進行插值重采樣,就可以得到同一坐標(biāo)系下的配準(zhǔn)結(jié)果.常用的插值方法有最近鄰法、雙線性法、雙三次卷積法等,本文采用雙線性插值的方法.
2.3.1 差分求積二值化運動目標(biāo)區(qū)域檢測
確定了相鄰幀之間的透視變換關(guān)系后,將后一幀按此變換關(guān)系與前一幀圖像配準(zhǔn),再進行差分運算,以減掉背景圖像.理論上對于差分圖像來說,只有運動重疊部分對應(yīng)的像素值非零,但由于噪聲的影響,差分圖像中存在很多虛假的運動目標(biāo).為解決這一問題,考慮差分圖像之間必然存在運動重疊區(qū)域,采用多幀差分求積二值化的方法使差分圖像中運動邊緣的相關(guān)峰更加尖銳,這樣就能有效排除噪聲,正確檢測出運動目標(biāo)區(qū)域.因此,采用相鄰4幀差分求積二值化的方法,算式如式(1):
式中:f1(x,y)為第1幀圖像,f2(x,y)為第2幀圖像,f3(x,y)為第3幀配準(zhǔn)到第1幀得到的圖像,f4(x,y)為第4幀配準(zhǔn)到第2幀得到的圖像,F(xiàn)'(x,y)為差分求積圖像.如果圖像中沒有運動物體,則2幅圖像灰度差為零,只有運動重疊區(qū)域會在差分圖像中產(chǎn)生高的相關(guān)峰,按閾值α分割得到二值圖像F(x,y),檢測出運動目標(biāo).
與其他方法相比,該方法具有計算簡單、精度高和抗噪性強的優(yōu)勢.
2.3.2 形態(tài)學(xué)濾波后處理
經(jīng)過差分求積二值化處理后,得到了包含不規(guī)則輪廓的運動目標(biāo)圖像,在該圖像中仍可能殘留一些孤立的噪聲點.利用形態(tài)學(xué)濾波處理技術(shù)對差分圖像進行后處理,通過形態(tài)學(xué)開、閉運算彌補斷裂的輪廓線和填補空洞,并濾除殘留的噪聲點,以檢測出運動目標(biāo)區(qū)域.
由于差分運算會把運動目標(biāo)區(qū)域擴大,經(jīng)過上述差分求積二值化檢測得到的包含運動目標(biāo)區(qū)域的圖像,很容易出現(xiàn)將背景當(dāng)做運動目標(biāo)區(qū)域的誤檢情況.此外形態(tài)學(xué)開運算容易將連接纖細(xì)的運動目標(biāo)區(qū)域割裂開來,造成多檢情況的發(fā)生.為此,采用結(jié)合Mean shift圖像分割方法來精確提取運動目標(biāo)輪廓.
基于Mean shift的圖像分割與圖像平滑非常類似,只需要把收斂到同一點的起始點歸為一類,然后把這一類的標(biāo)號賦給這些起始點.在圖像分割中有時還需要把包含像素點太少的區(qū)域去掉.該分割方法能有效得到圖像中物體的輪廓[20].
綜合上述內(nèi)容,給出SURF特征與Mean shift圖像分割相結(jié)合的運動目標(biāo)檢測實現(xiàn)算法.
算法:動態(tài)成像條件下基于SURF和Mean shift的運動目標(biāo)檢測.
輸入:連續(xù) 4 幀視頻圖像IC1、IC2、IC3、IC4.
輸出:運動目標(biāo)檢測結(jié)果R.
1)基于SURF特征的視頻幀配準(zhǔn).先將連續(xù)4幀的原始視頻圖像IC1、IC2、IC3、IC4轉(zhuǎn)化成灰度圖像IG1、IG2、IG3、IG4.
a)對連續(xù) 4 幀圖像IG1、IG2、IG3、IG4分別進行SURF興趣點檢測和描述;
b)將IG1和IG3、IG2和IG4中的興趣點分別進行匹配,得到匹配的興趣點對;
c)根據(jù)IG1和IG3、IG2和IG4之間匹配的興趣點對,進行透視變換模型參數(shù)的最小二乘估計;
d)利用雙線性插值方法,將IG3配準(zhǔn)到IG1圖像坐標(biāo)系下、IG4配準(zhǔn)到IG2圖像坐標(biāo)系下,配準(zhǔn)結(jié)果分別為IG31、IG42.
2)差分求積二值化分割與形態(tài)學(xué)濾波處理.
a)將配準(zhǔn)后的圖像IG31、IG42分別與原始圖像IG1、IG2做差分運算,得到差分后的圖像IG5、IG6;
b)將IG5、IG6相乘,并按閾值α分割得到二值圖像IG7;
c)對IG7進行形態(tài)學(xué)濾波處理,結(jié)果為IG8.
3)基于Mean shift的圖像分割與邊緣檢測.分別用xi和zi(i=1,2,…,n)表示IG4和IG4分割后圖像中的像素點.對每一像素點:
a)初始化j=1,并且使yi,1=xi;
b)運用 Mean shift算法計算yi,j+1直到收斂,記收斂后的值為yi,c;
c)將收斂到同一點的起始點歸為一類,把這一類的標(biāo)號賦給這些起始點,把包含像素點太少的區(qū)域去掉,將每個類之間的邊界點賦值0,其余點賦值1,就得到分割結(jié)果IG9;
d)對IG9進行邊緣檢測,結(jié)果為IG10.
4)基于SURF和Mean shift的運動目標(biāo)檢測.
a)將IG8和IG10做相與運算,得到具有重疊區(qū)域的輪廓圖像IG11;
b)以IG11中的非零像素點為種子點,在IG10中進行區(qū)域生長,精確得到運動目標(biāo)輪廓IG12.
5)輸出運動目標(biāo)檢測結(jié)果R.根據(jù)IG12中非零像素點的坐標(biāo),在IC4中檢測得到運動目標(biāo)輪廓,輸出運動目標(biāo)檢測結(jié)果R.
該算法在運行過程中,差分求積二值化中的閾值α影響著分割后的結(jié)果,過小容易將背景噪聲擴大,過大容易將運動目標(biāo)區(qū)域減小.
根據(jù)前文所述的基于SURF和 Mean shift的運動目標(biāo)高精度檢測算法,在Visual Studio 2008的環(huán)境下和OpenCV 2.1的基礎(chǔ)上,編寫應(yīng)用程序.為驗證該算法的有效性,進行了面向航拍序列圖像和手持?jǐn)z像機序列圖像的運動目標(biāo)檢測2組實驗.
實驗選取的航拍視頻來自卡耐基梅隆大學(xué)的標(biāo)準(zhǔn)視頻庫,該視頻共438幀,分辨率為320×240像素大小,幀頻為23幀/s.圖4為視頻中的第157~160幀原始圖像.
圖4 原始航拍圖像Fig.4 Original aerial images
實驗步驟如下:
1)基于SURF特征的視頻幀配準(zhǔn),如圖5所示.
圖5 基于SURF特征的視頻幀配準(zhǔn)Fig.5 Registration of video frames based on SURF
2)差分求積二值化分割與形態(tài)學(xué)濾波處理.分別將第157幀與配準(zhǔn)后的第159幀圖像I159r、第158幀與配準(zhǔn)后的第160幀圖像I160r做差分運算,差分結(jié)果如圖6所示.然后并將差分圖像相乘,按閾值α(本文所設(shè)閾值α=64)來分割得到二值圖像I0,形態(tài)學(xué)濾波處理結(jié)果為I1,并據(jù)此在第160幀原始圖像中檢測得到運動目標(biāo)輪廓,如圖7所示.
圖6 差分結(jié)果圖像Fig.6 Images of differential results
圖7 基于SURF的運動目標(biāo)區(qū)域檢測結(jié)果I1Fig.7 Area detection result I1of moving object based on SURF
3)基于Mean shift的圖像分割與邊緣檢測,結(jié)果為I2,如圖8所示.
圖8 基于Mean shift的圖像分割與邊緣檢測結(jié)果I2Fig.8 Result I2of image segmentation and edge detection based on Mean shift
4)基于SURF和Mean shift的運動目標(biāo)檢測.將I2與I1進行與運算,結(jié)果為I3;以I3中的非零像素點為種子點,在I2中進行區(qū)域生長,結(jié)果為I4,如圖9所示.
圖9 基于SURF和Mean shift的運動目標(biāo)檢測結(jié)果I4Fig.9 Moving object detection result I4based on SURF and Mean shift
5)根據(jù)I4中的非零像素點,在第160幀原始圖像中檢測運動目標(biāo),最終結(jié)果為R0,如圖10所示.
圖10 運動目標(biāo)檢測最終結(jié)果R0Fig.10 Final result R0of moving object detection
從實驗結(jié)果來看,簡單差分運算可以分割出運動目標(biāo)區(qū)域,但是受匹配誤差等的影響,差分圖像中存在許多噪聲,如圖6(a)、(b)所示.差分求積二值化技術(shù)能夠有效濾除噪聲,增強運動目標(biāo)區(qū)域,如圖7(a)所示.經(jīng)過形態(tài)學(xué)濾波處理后,圖像中的運動目標(biāo)區(qū)域更加清晰;但此時存在誤檢情況,如圖7(c)所示.采用本文方法后,可精確得到運動目標(biāo)輪廓,避免誤檢情況的發(fā)生,如圖9(b)、10所示.
利用手持?jǐn)z像機拍攝同時存在平移、旋轉(zhuǎn)和縮放的輪式機器人運動.攝像機型號為Canon IXUS 105,拍攝得到的視頻分辨率為640×480像素大小、幀頻為30幀/s、共523幀.下面選取視頻的第97~100幀原始圖像進行實驗,如圖11所示.
圖11 手持式攝像機拍攝得到的原始圖像Fig.11 Original images captured by handheld camera
與3.1節(jié)方法類似,將第97幀與配準(zhǔn)后的第99幀圖像、第98幀與配準(zhǔn)后的第100幀圖像分別做差分運算,然后利用差分求積二值化得到包含噪聲和運動目標(biāo)區(qū)域的檢測結(jié)果K0,其形態(tài)學(xué)濾波處理結(jié)果為K1,并據(jù)此在原始第100幀圖像中檢測得到運動目標(biāo)輪廓,如圖12所示.
圖12 基于SURF的運動目標(biāo)區(qū)域檢測結(jié)果K1Fig.12 Result K1of moving object area detection based on SURF
圖13為基于Mean shift圖像分割和邊緣檢測的結(jié)果K2.將K2與K1做與運算,結(jié)果為K3,并以K3中的非零像素點為種子點,在K2中進行區(qū)域生長,結(jié)果為K4,如圖14所示.
圖13 基于Mean shift的圖像分割與邊緣檢測結(jié)果K2Fig.13 Result K2of image segmentation and edge detection based on Mean shift
圖14 基于SURF和Mean shift的運動目標(biāo)檢測結(jié)果K4Fig.14 Result K4of moving object area detection based on SURF and Mean shift
根據(jù)區(qū)域生長結(jié)果K4,最終輸出運動目標(biāo)檢測結(jié)果圖像R1,如圖15所示.
圖15 運動目標(biāo)最終檢測結(jié)果R1Fig.15 Final result R1of moving object detection
實驗結(jié)果表明,該方法同樣適用于手持?jǐn)z像機運動情況下的運動目標(biāo)檢測,能夠避免多檢情況的發(fā)生(如圖12(c)所示),精確提取出運動目標(biāo)輪廓(如圖14(b)、15所示).
上述2組實驗表明,本文所提出的方法能實現(xiàn)動態(tài)成像條件下的運動目標(biāo)高精度檢測,具有良好的適應(yīng)能力.其中,面向航拍序列圖像運動目標(biāo)檢測的實驗表明,該方法可有效地避免將背景誤認(rèn)為目標(biāo)區(qū)域這一誤檢情況的發(fā)生;面向手持?jǐn)z像機序列圖像運動目標(biāo)檢測的實驗表明,該方法可有效避免將目標(biāo)割裂成多個目標(biāo)這一多檢情況的發(fā)生.
針對動態(tài)成像條件下運動目標(biāo)檢測的應(yīng)用背景和難點問題,本文提出了一種基于SURF和Mean shift的高精度運動目標(biāo)檢測方法.首先,利用SURF特征提取完成圖像配準(zhǔn),通過求解透視變換模型參數(shù),補償背景運動;然后,用差分求積二值化和形態(tài)學(xué)濾波處理檢測出運動目標(biāo)區(qū)域;最后,結(jié)合Mean shift圖像分割,實現(xiàn)運動目標(biāo)輪廓的精確提取.實驗結(jié)果表明,與單一的基于SURF特征提取的目標(biāo)檢測方法相比,該方法檢測精度高,魯棒性強,可有效避免誤檢、多檢情況的發(fā)生,并能適應(yīng)多種動態(tài)成像條件下的運動目標(biāo)檢測,具有普適性的實際意義.不過,在研究中還發(fā)現(xiàn),圖像分割的結(jié)果會對后續(xù)輪廓的提取產(chǎn)生影響,為提高輪廓提取精度,就應(yīng)當(dāng)在圖像分割方面需進一步的研究.
[1]李勁菊,朱青,王耀南.一種復(fù)雜背景下運動目標(biāo)檢測與跟蹤方法[J].儀器儀表學(xué)報,2010,31(10):2242-2247.
LI Jinju,ZHU Qing,WANG Yaonan.Detecting and tracking method of moving target in complex environment[J].Chinese Journal of Scientific Instrument,2010,31(10):2242-2247.
[2]郝久月,李超,高磊,等.智能監(jiān)控場景中運動目標(biāo)軌跡聚類算法[J].北京航空航天大學(xué)學(xué)報,2009,35(9):1083-1087.
HAO Jiuyue,LI Chao,GAO Lei,et al.Moving object trajectory clustering method in intelligent surveillance video[J].Journal of Beijing University of Aeronautics and Astronautics,2009,35(9):1083-1087.
[3]HE L,PENG Z,EVERDING B,et al.A comparative study of deformable contour methods on medical image segmentation[J].Image and Vision Computing,2008,26(2):141-163.
[4]BONIN-FONT F,ORTIZ A,OLIVER G.Visual navigation for mobile robots:a survey[J].Journal of Intelligent& Robotics Systems,2008,53(3):263-296.
[5]謝鳳英,趙丹培.Visual C++數(shù)字圖像處理[M].北京:電子工業(yè)出版社,2008:449-463.
[6]YILMAZ A,JAVED O,SHAH M.Object tracking:a survey[J].ACM Computing Surveys,2006,38(4):1-45.
[7]KIM I S,CHOI H S,YI K M,et al.Intelligent visual surveillance:a survey[J].International Journal of Control,Automation,and Systems,2010,8(5):926-939.
[8]ZITOVA B,F(xiàn)LUSSER J.Image registration methods:a survey[J].Image and Vision Computing,2003,21(11):977-1000.
[9]BAY H,TUYTELAARS T,GOOL L V.SURF:speeded up robust features[C]//Proceedings of the European Confer-ence on Computer Vision.Graz,Austria,2006:404-417.
[10]張銳娟,張建奇,楊翠.基于SURF的圖像配準(zhǔn)方法研究[J].紅外與激光工程,2009,38(1):160-165.
ZHANG Ruijuan,ZHANG Jianqi,YANG Cui.Image registration approach based on SURF[J].Infrared and Laser Engineering,2009,38(1):160-165.
[11]謝凡,秦世引.基于SIFT的單目移動機器人寬基線立體匹配[J].儀器儀表學(xué)報,2008,29(11):2247-2252.
XIE Fan,QIN Shiyin.Wide baseline stereo vision matching approach for monocular mobile robot based on SIFT[J].Chinese Journal of Scientific Instrument,2008,29(11):2247-2252.
[12]卜珂.基于SURF的圖像配準(zhǔn)與拼接技術(shù)研究[D].大連:大連理工大學(xué),2009:33-58.
BO Ke.Research on image registration and mosaic based on SURF[D].Dalian:Dalian University of Technology,2009:33-58.
[13]COMANICIU D,MEER P.Mean shift:a robust approach toward feature space analysis[J].IEEE Transaction on Pattern Analysis and Machine Intelligence,2002,24(5):603-619.
[14]周許超,屠大維,陳勇,等.基于相位相關(guān)和差分求積二值化的動態(tài)背景下運動目標(biāo)檢測[J].儀器儀表學(xué)報,2010,31(5):980-983.
ZHOU Xuchao,TU Dawei,CHEN Yong,et al.Moving object detection under dynamic background based on phase-correlation and differential multiplication[J].Chinese Journal of Scientific Instrument,2010,31(5):980-983.
[15]王梅,屠大維,周許超.SIFT特征匹配和差分求積二值化融合的運動目標(biāo)檢測[J].光學(xué)精密工程,2011,19(4):892-899.
WANG Mei,TU Dawei,ZHOU Xuchao.Moving object detection by combining SIFT and differential multiplication[J].Optics and Precision Engineering,2011,19(4):892-899.
[16]XIAO Jiangjian,YANG Changjiang,HAN Feng,et al.Vehicle and person tracking in aerial videos[M]//Multimodal Technologies for Perception of Humans.Berlin/Heidelberg:Springer-Verlag,2008:203-214.
[17]趙文哲,秦世引.一種高精度視頻目標(biāo)檢測與分割新方法[J].北京航空航天大學(xué)學(xué)報,2010,36(12):1490-1494.
ZHAO Wenzhe,QIN Shiyin.Novel approach to video object detection and precise segmentation[J].Journal of Beijing University of Aeronautics and Astronautics,2010,36(12):1490-1494.
[18]BROWN M,LOWE D G.Invariant features from interest point groups[C]//British Machine Vision Conference.Cardiff,UK,2002:656-665.
[19]FISCHLER M A,BOLLES R C.Random sample consensus:a paradigm for model fitting with application to image automated cartography[J].Communication of the ACM,1981,24(6):381-395.
[20]王晏,孫怡.自適應(yīng)Mean shift算法的彩色圖像平滑與分割算法[J].自動化學(xué)報,2010,36(12):1637-1644.
WANG Yan,SUN Yi.Adaptive Mean shift based image smoothing and segmentation[J].Acta Automatica Sinica,2010,36(12):1637-1644.
胡光龍,男,1988年生,碩士研究生,主要研究方向為運動目標(biāo)檢測與跟蹤、機器人技術(shù).
秦世引,男,1955年生,教授,博士生導(dǎo)師,主要研究方向為復(fù)雜系統(tǒng)的智能控制、圖像處理與模式識別等.作為負(fù)責(zé)人主持完成(或在研)國家攀登計劃項目的子課題、國家“973”計劃項目的子課題、國家“863”計劃項目、國家自然科學(xué)基金項目等20余項.1999年獲全國優(yōu)秀科技圖書獎暨科技進步獎(科技著作)一等獎,同年獲國家第5屆工程設(shè)計優(yōu)秀軟件金獎.發(fā)表學(xué)術(shù)論文180余篇,出版學(xué)術(shù)著作1部、研究生教材1部、譯著2部.
High precision detection of a mobile object under dynamic imaging based on SURF and Mean shift
HU Guanglong,QIN Shiyin
(School of Automation Science and Electrical Engineering,Beihang University,Beijing 100191,China)
Taking into account the difficulty of moving-object detection with a dynamic background caused by camera motion,a new method was proposed based on speeded-up robust features(SURF)and Mean shift.First,the image registration based on SURF was applied to compensate the background motion,and then binarization of quadrature by difference method and morphological filters was carried out to detect the moving-object’s area so that the accurate detection and segmentation of the moving object was accomplished with Mean shift.Finally,the effectiveness and satisfactory performance were validated through a series of experiments of dynamic videos.The results indicate that the proposed algorithm is characterized by high precision,low false detection,and strong robustness to noises,and thus can be extended to application in practical engineering.
speeded-up robust features(SURF);image registration;Mean shift;image segmentation;dynamic background;object detection
TP391.41
A
1673-4785(2012)01-0061-08
10.3969/j.issn.1673-4785.201107006
2011-07-13.
國家自然科學(xué)基金資助項目(60875072);北京市自然科學(xué)基金資助項目(4112035);中澳國際合作項目(2007DFA11530).
胡光龍.E-mail:hgllgh007@163.com.