陸 牧,高 揚,朱 明
(中國科學院 長春光學精密機械與物理研究所 航空光學成像與測量重點實驗室,吉林 長春 130033)
?
動基座下的運動目標檢測
陸牧*,高揚,朱明
(中國科學院 長春光學精密機械與物理研究所 航空光學成像與測量重點實驗室,吉林 長春 130033)
由于動基座下運動目標的檢測存在的背景干擾較大,影響運動目標檢測精度的問題,本文提出了一種基于傅里葉變換和核函數(shù)-灰度統(tǒng)計圖的動基座動目標檢測算法,以便較大限度地克服光照變化、背景噪聲對運動目標檢測精度造成的影響。該算法首先將評價函數(shù)引入特征匹配塊的選取中完成視頻圖像背景的分塊匹配。然后,采用傅里葉變換的相位相關(guān)算法估計全局運動補償參量;逐一計算各圖像子塊的高斯核函數(shù)值,建立核函數(shù)-灰度統(tǒng)計圖并通過相鄰幀高斯核函數(shù)值的變化情況判斷運動目標的區(qū)域。最后,對包含運動目標的圖像子塊進行圖像分割處理,完成動目標檢測。實驗仿真表明,與傳統(tǒng)的運動目標檢測算法相比,該算法中評價函數(shù)的評價系數(shù)α取0.7,幀間圖像塊相似度閾值T取0.3時,能有效地抑制光照變化和噪聲帶來的背景干擾,檢測出動基座下的運動目標。該算法具有較快的計算效率,能滿足工程上的實時性要求。
運動目標檢測;動基座;正交傅里葉變換;核函數(shù)—灰度統(tǒng)計圖
運動目標檢測技術(shù)是計算機視覺領(lǐng)域中關(guān)鍵的底層技術(shù)之一,也是計算機視覺領(lǐng)域研究的熱點。基于動基座的運動目標檢測技術(shù)是運動目標檢測技術(shù)中的重點、難點,在國防、安保等領(lǐng)域中也有著更加廣闊的應(yīng)用前景和發(fā)展空間[1-8]。按照所檢測視頻圖像背景的性質(zhì),運動目標檢測技術(shù)可分為兩種:靜態(tài)背景運動目標檢測和動態(tài)背景運動目標檢測。目前,主流的靜態(tài)背景運動目標檢測方法有背景差分法和幀間差分法[8-11]:背景差分法的優(yōu)點在于算法簡單易于實現(xiàn),但其缺點也很明顯,即在背景有干擾的情況下檢測效果不佳;幀間差分法的優(yōu)點是檢測精度高、算法運行速度較快,但缺點是該算法只能應(yīng)用于背景是靜態(tài)的視頻圖像。主流的動態(tài)背景運動目標檢測方法有全局運動補償法和光流法[12-15]:全局運動補償法又可分為塊匹配法、位平面法和特征匹配法,這些方法各有優(yōu)缺點,它們對視頻圖像背景均比較敏感,不適合視頻圖像背景干擾較大的情況;光流法適合處理運動目標有遮擋的情況,但抗噪性較差并且對視頻中光照的改變十分敏感。動基座動目標檢測是動態(tài)背景運動目標檢測的一個重要分支,也是目前運動目標檢測領(lǐng)域的重要課題,其特點為基座運動無死角,設(shè)備工作環(huán)境復雜,在一些特定的場合中背景干擾較大。這些特點給動基座下運動目標的檢測帶來了一定難度。
基于動基座的上述特點,本文先將評價函數(shù)引入到匹配特征塊的選取過程中,這樣不僅能選取到背景噪聲較小的特征塊,而且還能減小后續(xù)全局運動補償操作中特征塊的誤匹配率。然后采用傅里葉變換的相位相關(guān)算法將動態(tài)圖像序列靜態(tài)化。這種算法只需計算視頻圖像傅里葉互功率譜和傅里葉變換幅值譜的相關(guān)信息,與視頻圖像內(nèi)容的關(guān)系較小,因此這種算法具有較好的抗噪性。最后,提出了一種核函數(shù)—灰度統(tǒng)計圖,并通過相鄰幀核函數(shù)—灰度統(tǒng)計圖的變化實現(xiàn)了運動目標的檢測。由于核函數(shù)—灰度統(tǒng)計圖的空間分布情況不受背景光照改變和噪聲大小的影響,因此能有效抑制背景干擾,并具有較快的計算效率。
針對動基座動目標檢測中基座運動平穩(wěn),基座運動速度相對較慢的特點,實驗研究發(fā)現(xiàn),相鄰幀圖像間背景的運動可以近似簡化成二維平移運動。為了消除大目標運動對背景圖像運動產(chǎn)生的影響,可將視頻圖像分成若干個不同的子塊,并假設(shè)各子塊中各像素點的運動方向與該子塊形心所在像素點的運動方向一致。采用視頻圖像特征塊匹配方法對硬件的依賴度較小,在一定程度上抑制了背景噪聲對運動補償?shù)挠绊憽?/p>
2.1匹配特征塊的選取
由于在背景噪聲較大的條件下較難獲得高精度的匹配圖像,為了減小圖像匹配誤差對運動目標檢測精度的影響,故要求在匹配特征塊的選取過程中盡量選取那些包含細節(jié)多、包含運動目標少的特征塊[16-17]。因此,在匹配特征塊的選取過程中引入了評價函數(shù)。首先,將視頻圖像分成m×n個大小相同的矩形塊。由于視頻圖像中運動目標的位置常出現(xiàn)在圖像的中心位置附近,所以選取圖像中4個邊緣附近的若干矩形塊,分別進行圖像相鄰幀間的差分運算,從而得到差分圖像。然后,計算各差分圖像的評價函數(shù)值,評價函數(shù)為:
f=αμ+(1-α)σ,
(1)
其中:μ、σ分別是差分圖像的期望和標準差,α是評價系數(shù)。最后,選取評價函數(shù)值最大的矩形塊作為圖像的特征塊。
這樣粗選取的特征塊包含細節(jié)較多,降低了匹配特征塊時的誤匹配率,抑制了背景噪聲對運動補償?shù)挠绊?。值得注意的是,評價系數(shù)α的選取與背景噪聲、光照等條件有關(guān),本文根據(jù)多次試驗結(jié)果將α取為0.7。
2.2全局運動補償
全局運動是指在拍攝過程中由于相機運動造成原本靜止的背景相對于相機所產(chǎn)生的運動。背景的這種從一個相對位置轉(zhuǎn)換到另一個相對位置的映射關(guān)系滿足仿射變換模型。一個仿射變換是一個非奇異的線性變換接上一個平移變換[18-19]。它的矩陣表達為:
(2)
式中:各背景像素點的坐標位置從(px,py)變換到(qx,qy),s為放縮系數(shù),θ為旋轉(zhuǎn)角度,(tx,ty)為平移參數(shù)。全局運動補償?shù)年P(guān)鍵就是如何精確估計出上述背景運動的各項參數(shù)。鑒于正交傅里葉變換[14]和圓傅里葉變換[20-22]的相位相關(guān)算法在估計全局運動參數(shù)方面具有抑制背景光照、噪聲干擾的優(yōu)點,具有較高的估計精度,本文選用這兩種方法進行參數(shù)估計。
根據(jù)仿射變換矩陣表達式,假設(shè)特征塊圖像f1(px,py)沿x軸正方向和y軸正方向分別平移了tx與ty,得到當前幀特征塊圖像f2(qx,qy),由:
f2(qx,qy)=f1(px+tx,py+ty).
(2)
對于相同背景下特征塊的平移,不妨令px=qx=x,py=qy=y,得式:
f2(x,y)=f1(x+tx,y+ty).
(3)
將上式做正交傅里葉變換得:
F2(u,v)=F1(u,v)e-j2π(utx+vty).
(4)
求得特征塊圖像f1(px,py),f2(qx,qy)的傅里葉互功率譜[23]為:
(5)
L-1(e-j(utx+vty))=δ(x-tx,y-ty),
(6)
其中L-1為傅里葉逆變換。
可以看出傅里葉互功率譜的逆變換為一個二維脈沖函數(shù),由該二維脈沖函數(shù)圖像可求得平移參數(shù)為(20,0),如圖1所示。
圖1 平移參數(shù)的二維脈沖函數(shù)
同理,引入放縮系數(shù)s和旋轉(zhuǎn)角度θ后,式(3)變?yōu)椋?/p>
f2(x,y)=f1[s(xcosθ+ysinθ)-
tx,s(-xsinθ+ycosθ)-ty],
(7)
則上式兩邊的傅里葉變換幅值譜[24-25]為:
s-1(-usinθ+vcosθ)]|.
(8)
由式(8)可知傅里葉變換幅值譜只與放縮系數(shù)s和旋轉(zhuǎn)角度θ有關(guān),與平移參數(shù)(tx,ty)無關(guān)。
由于上述笛卡爾坐標系下的放縮變換和旋轉(zhuǎn)變換在對數(shù)極坐標系下將轉(zhuǎn)化為平移變換,因此可以根據(jù)上述相位相關(guān)算法求得放縮系數(shù)s和旋轉(zhuǎn)角度θ。將式(7)變換到對數(shù)極坐標系下有:
f2(lnρ,Θ)=f1(lnρ-lns,Θ-θ),
(9)
其中:ρ為對數(shù)極坐標系下的極徑,Θ為對數(shù)極坐標系下的極角。
因為式(9)與式(3)具有相似形式,可以計算式(9)的傅里葉互功率譜并根據(jù)上述步驟求得放縮系數(shù)s和旋轉(zhuǎn)角度θ。將式(3)利用極坐標變換,得到式(9)的形式,可以看出s=1,θ=0。
圖2 放縮系數(shù)和旋轉(zhuǎn)角度的二維脈沖函數(shù)
Fig.2Scaling factor and rotation angle of two-dimensional pulse function
2.3基于高斯核函數(shù)的目標檢測
動態(tài)背景視頻圖像完成全局運動補償以后,可以近似看成靜態(tài)背景視頻圖像,再利用靜態(tài)背景下的運動目標檢測算法檢測運動目標。經(jīng)典的靜態(tài)背景下運動目標檢測算法有背景差分法和幀間差分法。背景差分法對于全局運動補償?shù)木纫筝^高,并不能較好地處理動基座這種所采集視頻圖像背景噪聲較大的情況[26]。傳統(tǒng)的幀間差分法也不能很好地解決視頻圖像中由于光照變化、噪聲等帶來的影響[27]。針對動基座動目標檢測的特點,本文提出根據(jù)相鄰幀高斯核函數(shù)值的變化情況實現(xiàn)動基座動目標的檢測。本文將圖像分為32×32的子塊,通過平均梯度最大塊快速配準圖像序列,再計算各個子塊的灰度加權(quán)核函數(shù)(GWK),并根據(jù)bhattacharyya系數(shù)判斷子塊GWK函數(shù)的相似度,提取GWK函數(shù)發(fā)生變化的子塊,通過合并處理,即找到圖像中包含運動目標的區(qū)域。
直方圖是圖像的一種統(tǒng)計表達,對一幅灰度圖像,其灰度統(tǒng)計直方圖反映了該圖中不同灰度級出現(xiàn)的統(tǒng)計情況。圖像的灰度統(tǒng)計直方圖是一個1-D的離散函數(shù),可寫成:
h(k)=nk(k=0,1,…,L-1),
(10)
(11)
(12)
其中δ(x)為單位脈沖函數(shù)。k(x)為高斯核函數(shù),其表達式可簡化為:
k(x)=exp(-‖x‖2).
(13)
(14)
其中n為視頻圖像塊歸一化特征向量的維度。ρ值越大則表明幀間圖像塊的相似度越高,當ρ值小于閾值T時即可認為圖像塊中包含運動目標。再將包含運動目標的圖像塊做圖像分割處理,即可檢測出完整的運動目標。根據(jù)多次實驗仿真結(jié)果,本實驗中閾值T取0.3。
(15)
(a)第56幀視頻圖像
(b)第76幀視頻圖像
(c)第56幀的灰度圖像
(d)第76幀的灰度圖像
(e)兩幅圖像的核函數(shù)—灰度統(tǒng)計圖對比
(a)第56幀圖像塊(a)The fifty-sixth frameimage block
(b)第76幀圖像塊(b)The seventy-sixthframe image block
為了驗證本文方法的先進性,分別利用傳統(tǒng)的幀間差分法和基于核函數(shù)—灰度統(tǒng)計圖的相似度判別方法進行動基座動目標檢測,對比結(jié)果如圖4所示。
(a)第56幀圖像
(b)全局運動補償結(jié)果
(c)傳統(tǒng)幀間差分法結(jié)果
(d)核函數(shù)-灰度統(tǒng)計圖檢測結(jié)果
根據(jù)實驗對比圖可見,傳統(tǒng)的幀間差分法的實驗結(jié)果中有大片的圖像殘留,不能有效消除背景噪聲,匹配殘留誤差較大?;诤撕瘮?shù)—灰度統(tǒng)計圖的動基座動目標檢測算法能有效地消除由光照變化、背景噪聲造成的背景殘留,可有效提高檢測精度。
針對動基座下的運動目標檢測中背景干擾較大,影響運動目標檢測精度的問題,利用正交傅里葉變換和核函數(shù)—灰度統(tǒng)計圖的方法完成了動基座下的運動目標檢測。該方法在評價函數(shù)的評價系數(shù)α取0.7,幀間圖像塊相似度閾值T取0.3時,可以有效抑制視頻圖像運動背景中光照變化、背景噪聲對運動目標檢測帶來的影響,達到了動基座下的運動目標檢測要求。仿真實驗結(jié)果表明該算法在視頻圖像背景干擾較大的情況下,能滿足工程上對算法精度方面的要求,驗證了該算法的可行性。
[1]賴作鎂,王敬儒,張啟衡. 背景運動補償和假設(shè)檢驗的目標檢測算法 [J]. 光學 精密工程,2007,15(1):112-116.LAI Z M, WANG J R, ZHANG Q H. Object detection algorithm based on background motion compensation and hypothesis test [J].Opt.PrecisionEng., 2007, 15(1): 112-116.(in Chinese)
[2]程帥,曹永剛,韓廣良,等. 用基于二值化規(guī)范梯度的跟蹤學習檢測算法高效跟蹤目標 [J]. 光學 精密工程,2015,23(8):2339-2348.
CHENG SH, CAO Y G, HAN G L,etal.. Efficient target tracking by TLD based on binary normed gradients [J].Opt.PrecisionEng., 2015, 23(8): 2339-2348.(in Chinese)
[3]聶海濤,龍科慧,馬軍,等. 采用改進尺度不變特征變換在多變背景下實現(xiàn)快速目標識別 [J]. 光學 精密工程,2015,23(8):2349-2356.
NIE H T, LONG K H, MA J,etal.. Fast object recognition under multiple varying background using improved SIFT method [J].Opt.PrecisionEng., 2015, 23(8): 2349-2356.(in Chinese)
[4]李靜宇,劉艷瀅,田睿,等. 視頻監(jiān)控系統(tǒng)中的概率模型單目標跟蹤框架 [J]. 光學 精密工程,2015,23(7):2093-2099.
LI J Y,LIU Y Y, TIAN R,etal.. Probabilistic model single target tracking framework for video surveillance system [J].Opt.PrecisionEng., 2015, 23(7): 2093-2099.(in Chinese)
[5]王偉國,劉廷霞,李巖,等. 用于三軸轉(zhuǎn)臺的衛(wèi)星跟蹤策略 [J]. 光學 精密工程,2015,23(3):871-878.
WANG W G, LIU T X, LI Y,etal.. Secondary planet tracking tactic arithmetic for three-axis turntable [J].Opt.PrecisionEng., 2015, 23(3): 871-878.(in Chinese)
[6]程帥,孫俊喜,曹永剛,等. 增量深度學習目標跟蹤 [J]. 光學 精密工程,2015,23(4):1161-1170.
CHENG SH, SUN J X, CAO Y G,etal.. Target tracking based on incremental deep learning [J].Opt.PrecisionEng., 2015, 23(4): 1161-1170.(in Chinese)
[7]宋策,張葆,尹傳歷. 適于機載環(huán)境對地目標跟蹤的粒子濾波設(shè)計 [J]. 光學 精密工程,2014,22(4):1037-1047.
SONG C, ZHANG B, YIN CH L. Particle filter design for tracking ground targets in airborne environment [J].Opt.PrecisionEng., 2014, 22(4): 1037-1047.(in Chinese)
[8]MAES F, COLLIGNON A, VANDERMEULEN D,etal.. Multimodality image registration by maximization of mutual information [J].IEEETransactionsonMedicalImaging, (S0278-0062),1999,16(2):189-198.
[9]BARRON J,F(xiàn)LEET D,BEAUCHEMIN S. Performance of optical flow techniques [J].InternationalJournalofComputerVision,(S0920-5691),2011,12(1):42-77.
[10]KUGLIN C,HINES D. The phase correlation image alignment method[C].NewYork:IEEEConferenceonCyberneticsandSociety,2013.
[11]HUANG ZH W, QI F H, CEN F. Background Subtrac-tion and Frame Difference Based Moving Object Detection for Real-time Surveillance[J].JournalofDonghuaUniversity, 2013, 20(1): 15-19.
[12]LUO J. Application and implementation of moving estimate in image stabilation and matching [J].NationalUniversityofDefenseTechnology, 2007, 12(1):42-77.
[13]COLLINS R A. System for video surveillance and monitoring: VSAM final report.Carnegie mellon university technical report[R]. CMU-RI-TR-00-1 2, 2011.
[14]CHEUNG H K, SIU W C. Fast global motion estimation for sprite generation [C].IEEEInternationalSymposiumonCircuitsandSystems, 2012, 3: 26-29.
[15]RICHARD A, STEVEN M K, PETRE S. Estimation of the parameters of a bilinear model with applications to submarine detection and system identification [J].DigitalSignalProcessing, 2013, 17(4): 756-773.
[16]HSU Y N. Optical pattern recognition using harmonic expansion [J].ApplOpt, 2011,21:4016-4019.
[17]HA J E, LEE W H. Foreground objects detection using multiple difference images [J].OpticalEngineering,2010,49(4):047201.
[18]HU W M, TAN T N, WANG L,etal.. A survey on visual surveillance of object motion and behaviors [C].IEEETans.Syst.,Man,Cyben.,Appl.Rev., 2014,34(3):334-352.
[19]MADDALENA L, PETROSINO A. A self-Organizing approach to background subtraction for visual surveillance applications [C].IEEETrans.ImageProcess, 2008,17(7):1168-1177.
[20]ZHANG D. Motion detection for rapidly moving cameras in fully 3D scenes in Pacific-Rim Symposium on Image and Video [J].Technology(PSIVT), 2010: 444-449.
[21]YU X Q, CHEN X N, GAO M N. Motion detection in dynamic scenes based on fuzzy C-means clustering [C].InternationalConferenceonCommunicationSystemsandNetworkTechnologies, 2012:306-310.
[22]JIANG ZH, DING W R, LI H G. Aerial video image object detection and tracing based on motion vector compensation and statistic analysis [C]. 2007AsiaPacificConferenceonPostgraduateResearchinMicroelectronics&Electronics, 2009:302-305.
[23]YANG Y, ZHU H, FU M Y. Lane recognition self-learning scheme of mobile robot based on integrated perception system [J].IntelligentVehiclesSymposium(IV), 2013:78-81.
[24]YANG Y, FU M Y, XIN Y,etal.. Autonomous ground vehicle navigation method in complex environment [J].IntelligentVehiclesSymposium(IV), 2010:458-460.
[25]VAMBORG V, BROVKIN M C. The effect of a dynamic background albedo scheme on Sahel/Sahara precipitation during the mid-Holocene [J].ClimateofthePast,2011,7(1): 117-131.
[26]HUANG S C. An advanced motion detection algorithm with video quality analysis for video surveillance systems [C].IEEETrans.CircuitsSyst.VideoTechnol, 2011,21(1):1-14.
[27]DO B H,HUANG S C. Dynamic background modeling based on radial basis function neural networks for moving object detection [C].Proc.IEEEICME, 2011:1-4
陸牧(1989-),男,吉林長春人,博士研究生,2012年于吉林大學獲得學士學位,主要從事圖像處理、目標檢測、目標跟蹤等方面的研究。E-mail:980443913@qq.com
導師簡介:
朱明(1964-),男,江西南昌人,研究員,博士生導師,主要從事圖像處理,光電成像測量技術(shù),電視跟蹤和自動目標識別技術(shù)等方面的研究。E-mail:zhu_mingca@163.com
(版權(quán)所有未經(jīng)許可不得轉(zhuǎn)載)
Moving target detection under moving base
LU Mu*, GAO Yang, ZHU Ming
(LaboratoryofAviationImagingandMeasurementofOptical,ChangchunInstitute,F(xiàn)ineMechanicsandPhysics,ChineseAcademyofSciences,Changchun130033,China)
*Correspondingauthor,E-mail:980443913@qq.com
Traditional moving target detection under a moving base has a problem of larger background interference, and its detection accuracy is effected by the noise interference. This paper proposes a moving target detection method under the moving base by using orthogonal Fourier transform and kernel-grayscale chart to overcome the influence of a larger illumination change and background noise on moving target detection accuracy. Firstly, the evaluation function was introduced the selection of a feature matching block to implement the sub-block matching of video backgrounds. Then, global motion compensation parameters were estimated by using a phase-correlation algorithm based on orthogonal Fourier transform, and each Gaussian kernel value of each sub-block of the image was calculated to build a nuclear function-gray chart and to determine the area of moving target according on the change of the adjacent frame Gaussian kernel value. Finally, the image sub-block with moving target was divided and processed, and the moving target detection was implemented. The simulation in comparison with conventional moving object detection algorithm shows that when the evaluation coefficient in the evaluation function is set to be 0.7, and inter tile similarity threshold to be 0.3, the algorithm can effectively inhibit the background interference from illumination changes and background noise and can detect the moving target under the moving base. The algorithm has fast calculation speeds and meets real-time requirements of engineering.
moving target detection; moving base; orthogonal Fourier transform; kernel-gray chart
2015-11-13;
2015-12-09.
吉林省科技發(fā)展計劃青年科研基金項目(No.20150520057JH)
1004-924X(2016)07-1782-07
TP391.4
Adoi:10.3788/OPE.20162407.1782