孟思明 廣州中大數(shù)字家庭工程技術(shù)研究中心有限公司
基于優(yōu)化TLD模型的數(shù)字視頻監(jiān)控方法研究
孟思明 廣州中大數(shù)字家庭工程技術(shù)研究中心有限公司
優(yōu)化TLD模型;數(shù)字視頻監(jiān)控;改進(jìn)Mean-shift算法;運動目標(biāo)跟蹤
運動目標(biāo)跟蹤是整個數(shù)字視頻監(jiān)控體系的一個重要環(huán)節(jié),其跟蹤模型一方面應(yīng)具有高效的魯棒性,即能夠在各種各樣的場景背景下使用,且能對應(yīng)用場景具有較好的抗干擾能力。另一方面該跟蹤模型應(yīng)具有較高的時效性,即能夠滿足運動目標(biāo)的快速跟蹤,對于高速運動的物體依然具有較好的跟蹤能力。本文將針對TLD跟蹤模型進(jìn)行如下的研究及優(yōu)化。
目前適合長時間跟蹤的主流跟蹤算法TLD (Tracking-Learning-Detection) 模 型 是Kalal等人[1]于2010年提出的,由跟蹤器、檢測器、學(xué)習(xí)器等三部分組成,其最大特點是將傳統(tǒng)的檢測算法與跟蹤算法通過學(xué)習(xí)器結(jié)合在一起,使模型的跟蹤器與檢測器能實現(xiàn)在線更新,實現(xiàn)對目標(biāo)的長期跟蹤。然而,其跟蹤器使用的是光流法預(yù)測,在跟蹤過程中容易因光照變化、目標(biāo)被遮掩及出現(xiàn)相似目標(biāo)而導(dǎo)致跟蹤丟失。
為彌補(bǔ)標(biāo)準(zhǔn)TLD算法模型的缺陷,本文提出將其跟蹤器進(jìn)行優(yōu)化,以具有計算速度快及一定抗遮掩能力的Mean-shift算法為基礎(chǔ),將改進(jìn)的Mean-shift算法融合到標(biāo)準(zhǔn)TLD模型跟蹤器中,提高其跟蹤器的跟蹤效果,進(jìn)而提高模型的抗遮掩能力及對相似目標(biāo)的辨別能力。其優(yōu)化角度如下。
用改進(jìn)Mean-shift算法得到的預(yù)測窗口與標(biāo)準(zhǔn)TLD跟蹤器得到的預(yù)測窗口進(jìn)行耦合處理,從而增強(qiáng)跟蹤模型的抗遮掩能力。其中分別對標(biāo)準(zhǔn)TLD模型的跟蹤器得到的區(qū)域與改進(jìn)Mean-shift算法預(yù)測得到的區(qū)域進(jìn)行相似度比較,當(dāng)TLD跟蹤框的巴氏系數(shù)較高時,將TLD輸出的目標(biāo)中心位置作為改進(jìn)Mean-shift算法的迭代起始點。當(dāng)TLD跟蹤框的巴氏系數(shù)較低時,將上一幀中的目標(biāo)框的中心位置作為改進(jìn)Mean-shift跟蹤算法的迭代起始點。通過合理地設(shè)置改進(jìn)Mean-shift算法的迭代起始點,以提升TLD追蹤算法的抗遮攔跟蹤能力。
同時,為了避免圖像目標(biāo)背景出現(xiàn)相似目標(biāo)導(dǎo)致的檢測器長時間跟蹤過程產(chǎn)生累計誤差,將用改進(jìn)Mean-shift算法預(yù)測得到的目標(biāo)區(qū)域及標(biāo)準(zhǔn)TLD模型跟蹤器得到的預(yù)測區(qū)域同時與上一幀的目標(biāo)模型進(jìn)行巴氏系數(shù)閾值判斷。當(dāng)改進(jìn)Mean-shift算法得到的巴氏系數(shù)與TLD模型得到的巴氏系數(shù)均大于各自設(shè)定的閾值,則以較大閾值的作為模型的跟蹤結(jié)果。當(dāng)只有改進(jìn)Mean-shift算法得到的巴氏系數(shù)閾值大于設(shè)定閾值,則直接以改進(jìn)Mean-shift算法得到的目標(biāo)區(qū)域為模型的跟蹤結(jié)果。當(dāng)兩者均小于各自設(shè)定的閾值時,表明跟蹤失敗。當(dāng)跟蹤失敗時,立即使用檢測器重新初始化目標(biāo),避免檢測器引入錯誤正樣本導(dǎo)致積累誤差。
為了充分對比跟蹤效果的差異,本文將標(biāo)準(zhǔn)TLD模型和優(yōu)化TLD模型應(yīng)用在相同的視頻序列[1] 的跟蹤過程中。其中,對Motocross視頻跟蹤結(jié)果如圖1所示,可以看出當(dāng)目標(biāo)出現(xiàn)比較明顯的相似對象時,標(biāo)準(zhǔn)TLD模型會得到錯誤的跟蹤結(jié)果,而優(yōu)化后的TLD模型由于設(shè)定了巴氏系數(shù)的對比,雖然TLD模型得到了一個目標(biāo)巴氏系數(shù),但由于相似物與目標(biāo)之間還是存在一定的差距,因此綜合起來改進(jìn)Mean-shift算法得到巴氏系數(shù)要比TLD模型得到的要大,故最終以改進(jìn)Mean-shift算法得到的跟蹤結(jié)果為準(zhǔn)。
圖1 視頻中相似目標(biāo)出現(xiàn)時標(biāo)準(zhǔn)TLD模型(上)、優(yōu)化后模型(下)跟蹤結(jié)果
基于標(biāo)準(zhǔn)TLD和優(yōu)化TLD模型對各視頻的跟蹤結(jié)果見下表1,結(jié)果表明優(yōu)化后TLD模型在跟蹤成功率上均有所提高,其中對Motocross視頻跟蹤效果提升尤為顯著。
表1 基于標(biāo)準(zhǔn)TLD及優(yōu)化TLD模型的各視頻目標(biāo)跟蹤成功率
通過對數(shù)字視頻監(jiān)控方法中比較主流的TLD目標(biāo)跟蹤算法的分析,針對標(biāo)準(zhǔn)模型在跟蹤過程中目標(biāo)受遮掩及相似目標(biāo)出現(xiàn)時容易導(dǎo)致跟蹤失敗的不足,提出用一種改進(jìn)Meanshift算法對標(biāo)準(zhǔn)TLD跟蹤器進(jìn)行優(yōu)化,并通過實驗驗證了優(yōu)化后TLD目標(biāo)跟蹤模型在抗性上有較大提升,說明本文方法能滿足數(shù)字視頻監(jiān)控系統(tǒng)較高的性能要求。
[1] Kalal Z., Matas J.and Mikolajczyk K.,Tracking-Learning-Detection, IEEE Transctions on Pattern Analysis and Machine Intelligence, 6(1), 2010
[2] Yizong Cheng, Meanshift,Mode Seeking, and Clustering,IEEETransactions on Pattern Analysis and Machine Intelligence (S0162-8828), 17(8), 1995, 790~799
[3] 田莘,基于MeanShift算法的目標(biāo)跟蹤問題研究,西安科技大學(xué),2010
孟思明(1976.-),女(漢族),博士,主要研究方向:數(shù)字家庭技術(shù),計算機(jī)圖像處理等。
隨著各行各業(yè)對數(shù)字視頻監(jiān)控系統(tǒng)中目標(biāo)跟蹤的實時性、準(zhǔn)確性和穩(wěn)定性要求的不斷提高,我們除了提升系統(tǒng)的硬件配置外,最為關(guān)鍵且有效的方法就是優(yōu)化現(xiàn)有的跟蹤算法,使之具有更好的魯棒性和穩(wěn)定性,能夠應(yīng)對更復(fù)雜的跟蹤情況。本文針對目前比較主流跟蹤算法TLD模型進(jìn)行研究,并對其原有的光流法跟蹤器進(jìn)行優(yōu)化,彌補(bǔ)標(biāo)準(zhǔn)TLD模型在長時間數(shù)字視頻中運動目標(biāo)出現(xiàn)局部遮掩及出現(xiàn)相似目標(biāo)時跟蹤結(jié)果不理想的缺陷。