劉財(cái)興,李亞楨,陳銘欽,梁云,甘乙波
(華南農(nóng)業(yè)大學(xué)數(shù)學(xué)與信息學(xué)院,廣東 廣州 510642)
目標(biāo)跟蹤是計(jì)算機(jī)視覺領(lǐng)域研究熱點(diǎn)之一,通過對(duì)視頻序列中的目標(biāo)提取特征,然后根據(jù)特征匹配視頻流中每幀的位置和目標(biāo)大小,從而實(shí)現(xiàn)目標(biāo)跟蹤。目標(biāo)跟蹤具有廣泛的應(yīng)用前景,如視頻監(jiān)控(實(shí)現(xiàn)對(duì)目標(biāo)自動(dòng)監(jiān)控)、無人機(jī)(實(shí)現(xiàn)對(duì)目標(biāo)的自動(dòng)跟蹤拍攝)等。本文采用懶交互將跟蹤目標(biāo)分成多個(gè)散亂不規(guī)則分塊,基于核相關(guān)濾波算法實(shí)現(xiàn)對(duì)各個(gè)分塊進(jìn)行建模和跟蹤。根據(jù)每個(gè)分塊的置信度值等進(jìn)行異常判定,采用懶交互方式對(duì)異常判定進(jìn)行重采樣。最后運(yùn)用霍夫投票算法確定跟蹤目標(biāo)在新一幀中的位置。其中,懶交互處理將目標(biāo)分成多個(gè)散亂不規(guī)則分塊,保證分塊對(duì)目標(biāo)特征描述的有效性以及通過對(duì)目標(biāo)典型特征進(jìn)行多次不規(guī)則的采樣,能夠更好的適應(yīng)目標(biāo)狀態(tài)的變化。與現(xiàn)有跟蹤方法相比,本文跟蹤算法在旋轉(zhuǎn)、復(fù)雜背景、光照變化等挑戰(zhàn)的跟蹤準(zhǔn)確度和成功率具有顯著提高。
目標(biāo)跟蹤是計(jì)算機(jī)視覺領(lǐng)域研究熱點(diǎn)之一。近年來多種目標(biāo)跟蹤方法被提出,如基于相關(guān)濾波方法和基于卷積神經(jīng)網(wǎng)絡(luò)方法等[1-11]。但是由于現(xiàn)實(shí)情況復(fù)雜多變,如目標(biāo)在跟蹤過程中出現(xiàn)遮擋、光照變化、旋轉(zhuǎn)等情況,容易導(dǎo)致跟蹤目標(biāo)丟失。故此,設(shè)計(jì)出一種魯棒性很好的跟蹤算法是一大挑戰(zhàn)。
目標(biāo)跟蹤過程中關(guān)鍵步驟之一是建立符合跟蹤目標(biāo)特征的表觀模型。主流的跟蹤方法對(duì)于跟蹤目標(biāo)的表觀模型有兩種,一種是用跟蹤目標(biāo)的全局特征描述和表達(dá)目標(biāo)物體[2,12-15];一種是將跟蹤目標(biāo)分塊多個(gè)分塊,通過對(duì)每個(gè)分塊進(jìn)行局部特征來表示跟蹤目標(biāo)[16-19]。
基于局部特征的目標(biāo)跟蹤,即通過對(duì)目標(biāo)的局部信息進(jìn)行跟蹤來達(dá)到對(duì)目標(biāo)整體跟蹤的效果。如:Cai等[24]提出采用超像素分解目標(biāo),通過對(duì)計(jì)算相鄰超像素點(diǎn)像素差值進(jìn)行連接從而區(qū)分背景與目標(biāo),增加目標(biāo)跟蹤的準(zhǔn)確性。Guo等[25]通過學(xué)習(xí)和訓(xùn)練目標(biāo)局部特征構(gòu)建和更新目標(biāo)表觀模型,以解決遮擋或光照等跟蹤挑戰(zhàn)。Li等[16]基于核相關(guān)濾波方法提出基于可靠分塊的目標(biāo)跟蹤方法,通過將跟蹤目標(biāo)分成N個(gè)分塊,然后對(duì)每個(gè)分塊進(jìn)行跟蹤,來提高算法的魯棒性。以上方法都是通過規(guī)則、隨機(jī)局部分塊對(duì)跟蹤目標(biāo)進(jìn)行描述,在跟蹤過程中隨著跟蹤目標(biāo)的運(yùn)動(dòng)和背景的變化,容易出現(xiàn)分塊偏移,導(dǎo)致跟蹤目標(biāo)丟失。
本文在繼承基于局部跟蹤方法的基礎(chǔ),采用懶交互對(duì)目標(biāo)進(jìn)行分塊建模和更新,進(jìn)一步保證目標(biāo)外觀的準(zhǔn)確性。采用交互方式確定初始化目標(biāo),能夠很好的確定跟蹤目標(biāo)區(qū)域,避免出現(xiàn)冗余區(qū)域,但大部分交互方式比較復(fù)雜難操作[26-27]。本文交互方式在目標(biāo)區(qū)域內(nèi)隨意劃分分塊,簡單易操作,故稱為“懶交互”。首先在初始化建模階段,采用懶交互方式將目標(biāo)分成多個(gè)散亂不規(guī)則分塊。然后運(yùn)用核相關(guān)濾波方法對(duì)每個(gè)分塊進(jìn)行初始化建模,以此能夠有效地控制欠擬合或者過擬合現(xiàn)象。其次對(duì)每個(gè)分塊跟蹤過程中進(jìn)行異常判定,并對(duì)異常分塊采用懶交互方式進(jìn)行重采樣,從而可以在最大程度上保證分塊的有效性。本算法的優(yōu)點(diǎn)在于:
(i) 采用懶交互方式將目標(biāo)劃分為N個(gè)散亂不規(guī)則分塊,簡單易操作。
(ii) 對(duì)每個(gè)分塊分別建模,當(dāng)個(gè)別分塊出現(xiàn)跟蹤異常時(shí),并不會(huì)影響整體的跟蹤效果,有效地提高了算法的魯棒性。
(iii) 提出基于懶交互方式目標(biāo)跟蹤方法。在跟蹤過程中目標(biāo)框發(fā)生漂移現(xiàn)象時(shí),能及時(shí)處理掉異常的塊并進(jìn)行重采,使目標(biāo)框能夠重新正確的對(duì)目標(biāo)進(jìn)行跟蹤,以保證跟蹤的延續(xù)性,從而保證跟蹤算法的準(zhǔn)確性。
本文通過懶交互的方式將跟蹤目標(biāo)分成多個(gè)散亂不規(guī)則分塊,提出了一種基于懶交互模式下散亂不規(guī)則分塊引導(dǎo)的目標(biāo)跟蹤方法。根據(jù)實(shí)現(xiàn)過程本文算法主要流程是:首先采用懶交互方式將跟蹤目標(biāo)分成N個(gè)散亂不規(guī)則分塊并對(duì)每個(gè)分塊建立初始化表觀模型;然后根據(jù)表觀模型和核相關(guān)濾波方法對(duì)每個(gè)分塊進(jìn)行跟蹤,并根據(jù)跟蹤結(jié)果確定每個(gè)分塊在新一幀上的位置;接著對(duì)每個(gè)分塊進(jìn)行異常判斷并對(duì)異常分塊采用懶交互方式重采樣,并對(duì)非異常分塊更新。最后采用霍夫投票算法[28]確定跟蹤目標(biāo)在新一幀上的位置,并更新目標(biāo)模板進(jìn)行后續(xù)的跟蹤。本文算法流程如圖1所示,包含目標(biāo)建模階段、目標(biāo)跟蹤階段和目標(biāo)模板更新階段。
目標(biāo)建模階段:在第一幀圖像上以標(biāo)準(zhǔn)目標(biāo)區(qū)域?yàn)榛A(chǔ),向四周擴(kuò)展得到一個(gè)擴(kuò)展區(qū)域。在擴(kuò)展區(qū)域內(nèi)采用交互方式隨機(jī)選取N個(gè)散亂不規(guī)則分塊(例如N=25),并提取各個(gè)分塊中心位置,同時(shí)計(jì)算分塊中心與跟蹤目標(biāo)位置的偏移值,以此判定分塊正負(fù)樣本屬性,若分塊在標(biāo)準(zhǔn)目標(biāo)區(qū)域內(nèi)則為正樣本,否則為負(fù)樣本。最后,運(yùn)用核相關(guān)濾波方法,構(gòu)建出每個(gè)分塊的表觀模型。
圖1 本文算法總體流程圖Fig.1 Algorithm flow chart
目標(biāo)跟蹤階段:輸入新一幀圖像,對(duì)每一個(gè)局部分塊進(jìn)行核相關(guān)濾波操作,得到每個(gè)分塊在當(dāng)前幀出現(xiàn)在每個(gè)位置上的概率值和每個(gè)分塊在目標(biāo)對(duì)象上概率值,從而確定每個(gè)分塊的作為目標(biāo)中心位置的概率值。由此,得到每個(gè)分塊在當(dāng)前幀的跟蹤位置,再根據(jù)所有分塊的跟蹤位置,并結(jié)合霍夫投票算法初步得到跟蹤目標(biāo)位置。其次對(duì)每個(gè)分塊進(jìn)行異常判定,依據(jù)是:分塊與跟蹤目標(biāo)中心距離值、分塊跟蹤中心的置信度值、所有分塊的正負(fù)樣本比例值。然后比較異常塊數(shù)量與預(yù)先設(shè)定閾值大小,當(dāng)異常塊數(shù)量大于閾值時(shí)采用交互方式重采相對(duì)應(yīng)的異常分塊數(shù)量。最后根據(jù)每個(gè)分塊在新一幀上的中心位置值和每個(gè)分塊的作為目標(biāo)中心位置的概率值運(yùn)用霍夫投票算法確定目標(biāo)位置。
目標(biāo)模板更新:主要為對(duì)異常分塊重采樣的重新建模和對(duì)非異常分塊的模型更新。重采樣分塊的建模過程即分塊初始化過程。非異常分塊的更新為:更新其在新一幀中的參數(shù),建立新的表觀模型,再與舊表觀模型線性組合。
本章首先介紹如何根據(jù)懶交互和散亂不規(guī)則分塊建立跟蹤目標(biāo)的表觀模型,然后結(jié)合核相關(guān)濾波方法,對(duì)每個(gè)分塊進(jìn)行跟蹤。最后根據(jù)所有分塊的中心位置,運(yùn)用霍夫投票計(jì)算跟蹤目標(biāo)的跟蹤結(jié)果, 并更新分塊的表觀模型以精確指導(dǎo)后續(xù)幀的跟蹤處理。
建立目標(biāo)分塊表觀模型,首先根據(jù)懶交互方式選擇目標(biāo)的散亂不規(guī)則分塊,然后運(yùn)用核相關(guān)濾波建立分塊表觀模型。
(i) 基于懶交互的目標(biāo)散亂不規(guī)則分塊選擇。首先,在視頻第一幀的目標(biāo)區(qū)域周圍,采用懶交互方式選擇N個(gè)散亂布局的分塊(如:N=25),要求這些分塊能夠覆蓋目標(biāo)具有典型特征的主要區(qū)域,因此分塊常是無規(guī)則散亂分布且具有不同的尺寸。其次,計(jì)算每個(gè)分塊中心與目標(biāo)中心的中心偏移值,并據(jù)此對(duì)每個(gè)分塊進(jìn)行正負(fù)樣本的判定。如圖2所示,黃色矩形區(qū)域?yàn)槟繕?biāo)區(qū)域,橙色區(qū)域?yàn)榛谀繕?biāo)區(qū)域的擴(kuò)展區(qū)域,當(dāng)所取分塊的中心位置處于黃色框架內(nèi)時(shí)為正樣本,處于橙色框架與黃色框架之間時(shí)為負(fù)樣本。
圖2 散亂不規(guī)則目標(biāo)分塊的采集和劃分Fig.2 Collection and division of scattered and irregular targets
(ii) 基于核相關(guān)濾波的分塊表觀模型。采集目標(biāo)分塊后,運(yùn)用核相關(guān)濾波初始化每個(gè)分塊。其中,核相關(guān)濾波根據(jù)分塊的表觀信息如顏色、梯度等,通過求解嶺回歸訓(xùn)練目標(biāo)檢測(cè)器,它成功地利用了循環(huán)矩陣在傅里葉空間可對(duì)角化的特性,將矩陣的運(yùn)算轉(zhuǎn)化為向量的點(diǎn)乘,從而提高了計(jì)算效率。本文運(yùn)用核相關(guān)濾波得到每個(gè)分塊的特征矩陣X和用于區(qū)分目標(biāo)與背景的分類器矩陣α。
結(jié)合上述內(nèi)容,即可得到每個(gè)分塊的表觀模型。該分塊表觀模型共包括分塊的4部分即:特征矩陣X,分類器矩陣α、中心偏移、正負(fù)樣本標(biāo)記。
(1)
該矩陣中,響應(yīng)值越大說明分塊中心位于此點(diǎn)的概率越大。核相關(guān)濾波最大的特點(diǎn)是跟蹤速度快,因此雖然本算法需要對(duì)每幀圖像中的多個(gè)分塊進(jìn)行跟蹤,故此能夠在最大程度上保證算法的跟蹤速度。其中,目標(biāo)預(yù)測(cè)區(qū)域是根據(jù)前一幀目標(biāo)中心和尺寸得到的。
因本文根據(jù)所有散亂不規(guī)則分塊實(shí)現(xiàn)目標(biāo)跟蹤,故需對(duì)每個(gè)分塊進(jìn)行有效性判定。首先根據(jù)分塊目標(biāo)概率值對(duì)每個(gè)分塊進(jìn)行最優(yōu)判定(概率值越大,說明離目標(biāo)中心位置越近);然后對(duì)分塊進(jìn)行異常判定并對(duì)異常分塊采用懶交互方式進(jìn)行重采樣;最后根據(jù)每個(gè)分塊的位置和其作為目標(biāo)中心的概率值,采用霍夫投票算法計(jì)算跟蹤目標(biāo)在新一幀的位置。通過將每個(gè)分塊作為目標(biāo)中心概率值作為權(quán)值,并對(duì)異常分塊進(jìn)行及時(shí)的重采樣操作,保證每個(gè)分塊的有效性來確保整體跟蹤效果的準(zhǔn)確性。
3.3.1 最優(yōu)分塊的判定 判定一個(gè)分塊是否為最優(yōu)分塊的依據(jù)是分塊在當(dāng)前幀置信度值和分塊在當(dāng)前幀目標(biāo)區(qū)域上的概率值。結(jié)合二者,計(jì)算每個(gè)分塊在當(dāng)前幀上作為最優(yōu)分塊的概率值。如下式所示:
pzt|xt=ptzt|xtp0zt|xt
(2)
其中,zt表示當(dāng)前幀(第t幀),xt表示第t個(gè)分塊。所以,p(zt|xt)表示第t個(gè)分塊在當(dāng)前幀的作為最優(yōu)分塊的概率值,pt(zt|xt)表示第t個(gè)分塊在當(dāng)前幀可跟蹤的置信度值,它將根據(jù)公式(3)計(jì)算。po(zt|xt)表示第t個(gè)分塊在當(dāng)前幀跟蹤目標(biāo)上的概率值,它將根據(jù)公式(5)計(jì)算。具體而言,最優(yōu)分塊的確定根據(jù)如下3步實(shí)現(xiàn):
(i) 計(jì)算分塊的置信度值。置信度值是基于核相關(guān)濾波所得的響應(yīng)值來計(jì)算的。再引入了峰值-旁瓣比來作為衡量分塊的置信度值標(biāo)準(zhǔn)。峰值-旁瓣比計(jì)算公式:
(3)
其中,R(X)是搜索區(qū)域上的響應(yīng)值矩陣,Φ是在響應(yīng)峰值的周圍區(qū)域。μΦ和σΦ分別是響應(yīng)值矩陣中除了Φ區(qū)域的平均值和標(biāo)準(zhǔn)差值。基于con(Xi)的結(jié)果,分塊的置信度值設(shè)置為pt(zt|xt)=con(Xt)2。
(ii) 計(jì)算每個(gè)分塊在目標(biāo)區(qū)域內(nèi)的概率值。由于在分塊跟蹤的過程中,搜索范圍包含了背景信息,因此計(jì)算過程中需要參考背景的因素,通過對(duì)前、背景進(jìn)行區(qū)分可提高整體算法的魯棒性。本文通過當(dāng)前分塊與分塊在上一幀的距離,并借助正樣本和負(fù)樣本的分布信息來來計(jì)算新塊在目標(biāo)對(duì)象上的概率值。計(jì)算公式:
(4)
其中,yt∈{+1,-1}表示當(dāng)前塊是正樣本還是負(fù)樣本。Ω+,Ω-分別表示正負(fù)樣本的集合,N+表示正樣本數(shù)量,N-表示負(fù)樣本數(shù)量?;趌(X),可以計(jì)算出這個(gè)分塊在目標(biāo)對(duì)象上的概率值,計(jì)算公式為:
po(zt|xt)=el(Xt)
(5)
(iii) 根據(jù)公式(2),則可得每個(gè)分塊作為最優(yōu)分塊中心的概率值。概率值越大,離目標(biāo)中心位置的概率越大。
3.3.2 異常分塊的判定及處理 在跟蹤過程中隨著跟蹤目標(biāo)及背景的變化,不可避免出現(xiàn)分塊跟蹤異常的現(xiàn)象,故需對(duì)每個(gè)分塊進(jìn)行異常判定并對(duì)異常分塊進(jìn)行重采。分塊異常判斷依據(jù)具體如下:
(i) 判斷分塊是否遠(yuǎn)離目標(biāo)。當(dāng)分塊已經(jīng)超出了目標(biāo)以及背景的范圍,則需要?jiǎng)h除這個(gè)分塊,因?yàn)檫@個(gè)分塊已經(jīng)不能代表目標(biāo)或者周圍背景的局部區(qū)域。
(ii) 判斷正負(fù)樣本比例是否失衡:在初始化分塊時(shí)是在擴(kuò)展區(qū)域內(nèi)隨機(jī)選擇分塊的,正負(fù)樣本的數(shù)量也為隨機(jī)產(chǎn)生。當(dāng)正樣本數(shù)量過多時(shí),容易出現(xiàn)過擬合現(xiàn)象;當(dāng)負(fù)樣本過多時(shí),則容易跟蹤目標(biāo)丟失。因此,維持正負(fù)樣本的比例可保持跟蹤算法的穩(wěn)定性。所以,當(dāng)分塊的正樣本(目標(biāo))數(shù)或者負(fù)樣本(背景)數(shù)大于某一閾值之后(如:閾值為5),則需要?jiǎng)h除掉正樣本或者負(fù)樣本中置信度較小的一些塊。
(iii) 所跟蹤分塊的置信度值是否太低。根據(jù)式(1)我們得到每個(gè)分塊的響應(yīng)值矩陣,并運(yùn)用式(3)和公式pi(zt|xt)=con(Xt)2,得到每個(gè)分塊的置信度值。當(dāng)這個(gè)分塊的置信度值過小,則說明與原分塊的相似度較低,應(yīng)該視為異常分塊,應(yīng)刪掉此分塊。
通過刪除異常分塊,可防止跟蹤漂移現(xiàn)象出現(xiàn);并通過對(duì)異常分塊的及時(shí)重采樣,提高整體算法的魯棒性。而未被刪除的分塊,在新一幀圖像上建立新表觀模型并與舊表觀模型進(jìn)行線性組合,得到最后在新一幀上的表觀模型。
3.3.3 異常分塊的重采樣 由于本文采用懶交互方式對(duì)異常分塊進(jìn)行重采樣,需在保證跟蹤準(zhǔn)確性的同時(shí)最大程度上不影響跟蹤速度,故此對(duì)異常分塊設(shè)定一個(gè)重采樣判定閾值m。當(dāng)異常分塊的數(shù)量大于等于m時(shí),則對(duì)異常分塊進(jìn)行重采。當(dāng)閾值設(shè)定過高時(shí),不能對(duì)異常分塊進(jìn)行及時(shí)的重采樣操作,容易出現(xiàn)跟蹤漂移現(xiàn)象;當(dāng)閾值設(shè)定過低時(shí),容易導(dǎo)致重采樣次數(shù)增加,從而影響跟蹤的實(shí)時(shí)性。在本文設(shè)置m=5,在保證跟蹤準(zhǔn)確性的同時(shí),保證其實(shí)時(shí)性。其過程如圖3所示,其中(a)為在進(jìn)行懶交互式散亂不規(guī)則塊采集之后目標(biāo)的跟蹤效果;(b)出現(xiàn)分塊漂移現(xiàn)象(左上角紅色框);(c)為進(jìn)行懶交互式重采樣過程;(d)為進(jìn)行懶交互式重采樣之后目標(biāo)分跟蹤效果。
圖3 懶交互式重采樣過程(黃色框?yàn)槟繕?biāo)區(qū)域)Fig.3 The process of lazy interaction resampling (yellow box for object area)
3.3.4 基于霍夫投票投票的目標(biāo)跟蹤結(jié)果計(jì)算 在異常分塊處理之后,我們得到了所有的散亂不規(guī)則分塊,并依據(jù)所以分塊采用霍夫投票算法計(jì)算跟蹤目標(biāo)在新一幀上的最終位置。將最優(yōu)分塊中心的概率值作為每一個(gè)分塊的權(quán)重,并與對(duì)應(yīng)的分塊位置進(jìn)行加權(quán)求和,得到跟蹤目標(biāo)在新一幀上的最終位置,具體計(jì)算如式(5)所示。圖4為霍夫投票示意圖。
圖4 霍夫投票Fig.4 Hough-voting
將最優(yōu)分塊中心的概率值pi(zt|xt)作為每一個(gè)分塊的權(quán)重,并根據(jù)式(6)加權(quán)計(jì)算出跟蹤目標(biāo)中心位置結(jié)果。
(6)
其中postar表示跟蹤目標(biāo)在新一幀上的最終位置,posi表示第i分塊的位置,pi(zt|xt)表示第i個(gè)分塊作為跟蹤目標(biāo)中心位置的概率值。
表觀模型的更新分為2種情況:對(duì)異常塊的更新和對(duì)非異常塊的更新。
(i) 異常分塊表觀模型的更新。異常分塊都是先刪除,然后再對(duì)其進(jìn)行重采樣操作。需要對(duì)每個(gè)新采樣的分塊利用核相關(guān)濾波進(jìn)行初始化,即對(duì)新采樣分塊建立初始表觀模型。
(ii) 非異常分塊表觀模型的更新。線性組合每個(gè)分塊的新表觀模型和舊表觀模型,實(shí)現(xiàn)目標(biāo)分塊表觀模型的更新。首先,利用核相關(guān)濾波和分塊的新跟蹤結(jié)果,計(jì)算其新表觀模型;然后將該模型與其舊表觀模型進(jìn)行線性組合,具體而言是將描述表觀模型的特征矩陣進(jìn)行組合,最終得到每個(gè)分塊更新后的表觀模型。同時(shí),更新分塊與目標(biāo)中心的偏移值以更新目標(biāo)的結(jié)構(gòu)信息。
本文在普通PC機(jī)(Windows 7系統(tǒng),Intel i5-4460CPU,3.20 GHz,4 G內(nèi)存)上基于MATLAB 2012A實(shí)現(xiàn)本文算法。采用Visual tracking benchmark平臺(tái)的27組視頻序列進(jìn)行實(shí)驗(yàn),它們包含多種挑戰(zhàn)如旋轉(zhuǎn)、快速移動(dòng)、背景復(fù)雜、光照變化等。為驗(yàn)證本算法的優(yōu)越性,將其與當(dāng)前主流的5種方法(含KCF[2]、RPT[16]、SCM[29]、Struck[30]、VTD[31])進(jìn)行對(duì)比。結(jié)果表明本文方法對(duì)平面旋轉(zhuǎn)、外平面旋轉(zhuǎn)、背景復(fù)雜、光照變化比較有效。
本文依據(jù)中心位置誤差精度圖和每一幀跟蹤區(qū)域與目標(biāo)標(biāo)準(zhǔn)區(qū)域的覆蓋成功率圖對(duì)目標(biāo)跟蹤進(jìn)行定量分析。其中精準(zhǔn)度通過跟蹤結(jié)果區(qū)域和理想目標(biāo)區(qū)域的中心距離計(jì)算,而成功率則根據(jù)兩者的重疊率計(jì)算[32]。如圖5所示,與其它5種目標(biāo)跟蹤方法相比,本文方法在中心距離誤差精度圖和覆蓋成功率分別以0.785和0.658排在第1。而在光照變化、內(nèi)平面旋轉(zhuǎn)、復(fù)雜背景和外平面旋轉(zhuǎn)(表1和表2)這4種情況下,分別以0.783和0.618、0.779和0.628、0.759和0.624、0.774和0.615排在首位。
圖5 綜合情況Fig.5 The total situation
表1 跟蹤精確度(紅色為第1,綠色為第2、藍(lán)色為第3)Tabel 1 Precision plots of OPE(Red is the first, green is second and blue is third)
表2 平均成功率Tabel 2 Success plots of OPE
本節(jié)主要針對(duì)內(nèi)平面旋轉(zhuǎn)、外平面旋轉(zhuǎn)、背景復(fù)雜、光照變化挑戰(zhàn)來分析本文方法的有效性,并與現(xiàn)有方法進(jìn)行對(duì)比分析。
4.2.1 內(nèi)平面旋轉(zhuǎn) 圖5展示了內(nèi)平面旋轉(zhuǎn)挑戰(zhàn)中兩個(gè)例子(football1,dudek)跟蹤效果。由于本文方法通過多個(gè)分塊表示跟蹤目標(biāo)且在重采樣時(shí)采用懶交互方式,故當(dāng)目標(biāo)在旋轉(zhuǎn)過程中,通過對(duì)每個(gè)分塊進(jìn)行跟蹤以達(dá)到對(duì)目標(biāo)的跟蹤效果。當(dāng)出現(xiàn)異常分塊時(shí),通過懶交互方式可以保證重采樣分塊的有效性,從而確定跟蹤的有效性。如在football1視頻(第55幀,第67幀)或者dudek視頻(第761幀)中,目標(biāo)在劇烈運(yùn)動(dòng)且背景復(fù)雜中出現(xiàn)旋轉(zhuǎn)現(xiàn)象,本算法依然能夠正確跟蹤目標(biāo),而其它算法如RPT算法,在重采樣分塊過程中在置信度值最高分塊附近進(jìn)行異常分塊重采樣,當(dāng)置信度值最高的分塊已發(fā)生漂移現(xiàn)象時(shí),則重采樣分塊也容易出現(xiàn)漂移現(xiàn)象,故容易導(dǎo)致跟蹤失敗。
圖6 內(nèi)平面旋轉(zhuǎn)跟蹤結(jié)果(第一行為:football1序列;第二行為dudek序列)Fig.6 The result of in-plane rotation (First line: football; Second line: dudek)
4.2.2 外平面旋轉(zhuǎn) 圖7展示了外平面旋轉(zhuǎn)挑戰(zhàn)中兩個(gè)例子(basketball,david3)跟蹤效果。對(duì)比分析可知,本文算法通過對(duì)每個(gè)分塊進(jìn)行建模跟蹤,通過每個(gè)分塊的局部信息來表達(dá)整體,當(dāng)部分分塊丟失時(shí)可通過其它分塊來達(dá)到跟蹤目標(biāo)的目的,從而提高整體算法的魯棒性。在basketball視頻(109幀)中,SCM、TLD和KCF算法都是通過整體跟蹤,故在目標(biāo)旋轉(zhuǎn)且劇烈運(yùn)動(dòng)情況下跟蹤失敗。在david3視頻(54幀,118幀)中,目標(biāo)在運(yùn)動(dòng)中經(jīng)過電線桿或者樹時(shí)被完全遮擋,KCF、Struck和SCM算法采用整體跟蹤,故而導(dǎo)致失敗。
4.2.3 背景復(fù)雜 圖8展示了背景復(fù)雜挑戰(zhàn)中兩個(gè)例子(carDark, singer2)跟蹤效果。carDark視頻中,在目標(biāo)運(yùn)動(dòng)路線上背景復(fù)雜且出現(xiàn)光照變化情況。第222幀左右,目標(biāo)運(yùn)動(dòng)路線出現(xiàn)變化。第263幀,如RPT算法雖然基于局部分塊進(jìn)行跟蹤,但由于分塊比較規(guī)則,容易融入背景信息,導(dǎo)致出現(xiàn)跟蹤漂移現(xiàn)象;而TLD算法等背景環(huán)境復(fù)雜,且采用整體跟蹤導(dǎo)致跟蹤失敗。本文算法在跟蹤過程中,出現(xiàn)跟蹤分塊丟失情況,但通過其余分塊調(diào)整且通過懶交互方式及時(shí)重采樣,從而保證后續(xù)跟蹤的準(zhǔn)確性。
4.2.4 光照變化 圖9展示了光照變化挑戰(zhàn)中兩個(gè)例子(david,singer1)跟蹤效果。在david視頻中,目標(biāo)由光照比較暗的地方走到光照比較亮的地方(第387-444幀),本文算法跟蹤效果很穩(wěn)定。在singer1視頻中(第195幀、第286幀),光照變化很頻繁,本文通過對(duì)散亂不規(guī)則分塊跟蹤性且通過懶交互重采樣方式,最大程度保證分塊有效性,在后續(xù)模版更新及跟蹤時(shí),可維持算法的魯棒性。
圖7 外平面旋轉(zhuǎn)跟蹤結(jié)果(第一行為:basketball序列;第二行為david3序列)Fig.7 The result of out-of-plane rotation (First line: basketball; Second line: david3)
圖8 背景復(fù)雜跟蹤結(jié)果第一行為:carDark序列;第二行為singer2序列)Fig.8 The result of background clutters (First line: carDark; Second line: singer2)
圖9 光照變化跟蹤結(jié)果(第一行為:david序列;第二行為singer1序列)Fig.9 The result of illumination variation (First line: david; Second line:singer1)
如表3所示,列舉了本文算法與其它四種算法的平均速度對(duì)比數(shù)據(jù)。由表中可知,本文算法的運(yùn)行速度為7.8 Fps,遠(yuǎn)小于KCF算法(195.1 Fps),但大于同樣通過對(duì)目標(biāo)分塊跟蹤以達(dá)到對(duì)目標(biāo)整體跟蹤的RPT算法(3.59 Fps)。
表3 運(yùn)行平均速度對(duì)比Tabel 3 Running average speed contrast
本文針對(duì)在視頻跟蹤過程中出現(xiàn)背景復(fù)雜、光照變化等挑戰(zhàn)展開研究,提出了一種懶交互模式下散亂不規(guī)則分塊引導(dǎo)的目標(biāo)跟蹤方法。該方法首先將跟蹤目標(biāo)區(qū)域通過懶交互方式劃分為N個(gè)散亂不規(guī)則分塊,然后分別對(duì)N個(gè)分塊進(jìn)行初始化建模,并引入核相關(guān)濾波算法提高跟蹤效率。針對(duì)異常分塊,本文提出一種懶交互方式方法對(duì)異常分塊進(jìn)行重采。最后采用霍夫投票算法確定跟蹤目標(biāo)在新一幀上的最終位置。通過在benchmark上對(duì)大量視頻序列進(jìn)行跟蹤的結(jié)果表明:與現(xiàn)有主流跟蹤算法相比,本算法對(duì)多種挑戰(zhàn)(如背景復(fù)雜、光照變化、旋轉(zhuǎn)等)情況下,本方法的跟蹤結(jié)果具有更高的精度。