劉 陽(yáng),金曉康,王 朦,任燚梵
(長(zhǎng)沙理工大學(xué)計(jì)算機(jī)與通信工程學(xué)院 湖南 長(zhǎng)沙 410114)
基于壓縮感知理論的實(shí)時(shí)目標(biāo)跟蹤算法研究及系統(tǒng)實(shí)現(xiàn)
劉陽(yáng),金曉康,王朦,任燚梵
(長(zhǎng)沙理工大學(xué)計(jì)算機(jī)與通信工程學(xué)院 湖南 長(zhǎng)沙410114)
目標(biāo)跟蹤是計(jì)算機(jī)視覺(jué)的一個(gè)具有挑戰(zhàn)性的方向,其基本思想是序列圖像中根據(jù)目標(biāo)在視頻信息的空間和時(shí)間上相關(guān)性,從而確定感興趣的目標(biāo)在每一幀的位置和姿態(tài)以及目標(biāo)的運(yùn)動(dòng)軌跡。目標(biāo)跟蹤的困難主要由于目標(biāo)的形狀及尺度的變化、目標(biāo)不可預(yù)知性的運(yùn)動(dòng)以及目標(biāo)所處的背景存在干擾觀測(cè)的物體等引起。本課題使用一種基于壓縮感知理論的高效的跟蹤算法,確定跟蹤的目標(biāo),在目標(biāo)周?chē)杉龢颖荆h(yuǎn)離目標(biāo)采集負(fù)樣本,利用符合RIP原則的隨機(jī)測(cè)量矩陣對(duì)提取的樣本特征進(jìn)行降維,并采用樸素貝葉斯分類(lèi)器分類(lèi),同時(shí)更新分類(lèi)器。在研究算法的基礎(chǔ)上,利用OpenCV圖像視覺(jué)庫(kù)及Qt開(kāi)發(fā)框架進(jìn)行系統(tǒng)的實(shí)現(xiàn),完成具有多功能輔助的目標(biāo)跟蹤系統(tǒng),其功能包括目標(biāo)跟蹤、人臉檢測(cè)、開(kāi)啟攝像、視頻播放等。
目標(biāo)跟蹤;壓縮抽樣;人臉檢測(cè);OpenCV;Qt
本文著錄格式:劉陽(yáng),金曉康,王朦,等. 基于壓縮感知理論的實(shí)時(shí)目標(biāo)跟蹤算法研究及系統(tǒng)實(shí)現(xiàn)[J]. 軟件,2016,37(8):20-26
計(jì)算機(jī)視覺(jué)是通過(guò)計(jì)算機(jī)來(lái)模擬人類(lèi)的視覺(jué)能力,從而達(dá)到觀察、理解拍攝到的外界環(huán)境的目的。目標(biāo)跟蹤作為計(jì)算機(jī)視覺(jué)中一個(gè)重要的且最具有挑戰(zhàn)性研究方向之一,它融合了許多學(xué)科的復(fù)雜課題[1],在科學(xué)研究和工程項(xiàng)目中都具有的重要的研究?jī)r(jià)值和廣泛的應(yīng)用場(chǎng)景。目標(biāo)跟蹤作為計(jì)算機(jī)視覺(jué)中最困難的課題之一,依然存在著諸多無(wú)法預(yù)料的因素干擾著目標(biāo)的觀測(cè),如目標(biāo)的外觀變化、目標(biāo)的遮擋以及所處的復(fù)雜背景等[2]。本文使用基于壓縮感知的實(shí)時(shí)目標(biāo)的跟蹤算法,在運(yùn)動(dòng)變化、噪聲和部分遮擋的環(huán)境中,算法依然具有較好的魯棒性,實(shí)現(xiàn)對(duì)感興趣目標(biāo)實(shí)時(shí)高效地跟蹤。本系統(tǒng)采用C++與Qt的混合編程,完成具有多功能輔助的目標(biāo)跟蹤系統(tǒng)。
2.1壓縮感知原理
壓縮感知(Compressive Sensing)理論,也被稱為壓縮采樣(抽樣)理論(Compressive Sampling),簡(jiǎn)稱CS理論,吸引了許多國(guó)內(nèi)外學(xué)者的研究。壓縮感知(CS)是一種基于信號(hào)或圖像稀疏表示和隨機(jī)投影重建的可壓縮新理論。壓縮感知理論指出:通常意義下的信號(hào)或圖像具有“稀疏性”或“可壓縮性”,即在某個(gè)字典、框架下表現(xiàn)為稀疏的,可壓縮的或者在變換后是稀疏的,通過(guò)測(cè)量矩陣把高維信號(hào)投影到低維空間中,證明這樣的隨機(jī)投影包含重建信號(hào)的足夠信息,并利用稀疏性這個(gè)先驗(yàn)條件,通過(guò)求解優(yōu)化問(wèn)題,利用重構(gòu)算法從低維的信號(hào)中高概率地重構(gòu)出原來(lái)的信號(hào)。CS理論的最誘人之處在于具有稀疏特性的信號(hào)或圖像能利用比傳統(tǒng)的Nyquist低的采樣率實(shí)現(xiàn)高維信號(hào)的完美重建。在該理論的框架下,采樣的速度很大程度上取決于兩個(gè)基本的準(zhǔn)則:稀疏性和約束等距性[3],即RIP準(zhǔn)則。
CS理論提供了一種新的信號(hào)或圖像的采樣模式,即非自適應(yīng)的隨機(jī)線性欠采樣:將隨機(jī)測(cè)量矩陣θ作用于原信號(hào),得到信號(hào)或者圖像在低維空間上的非自適應(yīng)線性壓縮采樣y,u是原信號(hào)或者圖像,得到式(1)。
證明得到,式(1)的隨機(jī)采樣方法包含原信號(hào)(圖像)足夠的信息,利用信號(hào)的稀疏性這個(gè)先驗(yàn)條件,通過(guò)非線性的解碼模型可以較高概率重建原始圖像或者高維信號(hào),重建模型如式(2),在保證了α盡可能的稀疏的條件下,保證重構(gòu)信號(hào)唯一性。
2.2算法思想
壓縮感知目標(biāo)跟蹤算法算法[4],后文簡(jiǎn)稱為CT算法,和一般的模式分類(lèi)架構(gòu)一樣:先提取圖像中感興趣目標(biāo)的特征,再通過(guò)分類(lèi)器對(duì)其分類(lèi),不同在于CT算法采用壓縮感知進(jìn)行目標(biāo)特征提取和降維,采用樸素貝葉斯分類(lèi)器進(jìn)行分類(lèi),然后每幀通過(guò)在線學(xué)習(xí)更新分類(lèi)器。學(xué)習(xí)CT算法可知,其基于圖像子窗口的特征提取模型是有效且高效的,具有很好的實(shí)時(shí)性。CT算法的主要思想主要由兩部分組成,第一部分如圖2.1所示。
在第t幀的時(shí)候,在目標(biāo)附近均勻采樣得到若干正樣本和在遠(yuǎn)離目標(biāo)的背景區(qū)域采樣得到若干負(fù)樣本,然后進(jìn)行多尺度變換。將經(jīng)過(guò)多尺度變換后的圖像特征展開(kāi)形成特征向量,再通過(guò)一個(gè)隨機(jī)測(cè)量矩陣對(duì)特征向量進(jìn)行降維,最后利用維數(shù)更低的特征去構(gòu)建和更新樸素貝葉斯分類(lèi)器。
第二部分如圖2.2中所示:在第t+1幀的時(shí)候,在上一幀目標(biāo)位置附近采樣n個(gè)樣本(可以減少目標(biāo)的搜索范圍,加快采樣和降維的速度)。通過(guò)相同的方法提取特征,利用稀疏測(cè)量矩陣對(duì)其降維,然后用第t幀更新好的樸素貝葉斯分類(lèi)器進(jìn)行分類(lèi),分類(lèi)得到最大分?jǐn)?shù)的樣本位置便確定為目標(biāo)位置,將其篩選標(biāo)示。同時(shí)利用幀的特征進(jìn)行分類(lèi)器參數(shù)的更新。這樣實(shí)現(xiàn)了從t幀到t+1幀的目標(biāo)跟蹤。
2.3高效降維
隨機(jī)測(cè)量矩陣R(n×m),將一個(gè)高維圖像空間中的x(m維)特征投影到一個(gè)低維的空間v(n維)特征,m遠(yuǎn)遠(yuǎn)大于n:
圖2.1 t幀的時(shí)候更新分類(lèi)器
圖2.2 第(t+1)幀的跟蹤
隨機(jī)矩陣R滿足Johnson-Lindenstrauss的推論[5]:即隨機(jī)選擇一個(gè)適當(dāng)?shù)母呔S子空間,原始空間兩點(diǎn)的距離投影到這個(gè)子空間,能高概率的保留該距離關(guān)系。因此當(dāng)x是可壓縮的信號(hào)或圖像,可以通過(guò)矩陣R從v中高概率重構(gòu)出x[6]。
在壓縮感知理論研究中,主要使用三種不同的矩陣類(lèi)別,分別為高斯隨機(jī)觀測(cè)矩陣和伯努利隨機(jī)觀測(cè)矩陣,部分傅立葉矩陣和部分哈達(dá)瑪矩陣組成的由正交矩陣中的隨機(jī)行所構(gòu)成的觀測(cè)矩陣以及結(jié)構(gòu)化矩陣。高斯隨機(jī)矩陣是使用的比較廣泛、典型的隨機(jī)矩陣,這類(lèi)矩陣滿足高斯分布的特點(diǎn):均值為0,矩陣元素滿足N(0,1)分布,方差為1/M,同時(shí)滿足RIP條件。但是,在一個(gè)n×m的高斯隨機(jī)矩陣中,如果m的維數(shù)比較大的話,非零的元素比較多,因此該矩陣還是較稠密的,它的運(yùn)算和存儲(chǔ)開(kāi)銷(xiāo)較大。本算法采用了一個(gè)隨機(jī)測(cè)量矩陣,它的元素相對(duì)稀疏,矩陣內(nèi)元素定義如式(4)所示。矩陣計(jì)算非常方便,只需要一個(gè)隨機(jī)數(shù)的產(chǎn)生函數(shù)。取s=m/4。它的計(jì)算復(fù)雜度為O(n),只需要存儲(chǔ)矩陣R的非零元素,而每行的非零元素不會(huì)超過(guò)4個(gè),因此存儲(chǔ)的開(kāi)銷(xiāo)和計(jì)算的開(kāi)銷(xiāo)很小。隨機(jī)矩陣R只需要在程序啟動(dòng)時(shí)計(jì)算一次,在跟蹤的過(guò)程中保持不變。
在提取特征的過(guò)程中,為了實(shí)現(xiàn)尺度不變性(在運(yùn)動(dòng)過(guò)程中,拍攝的距離和成像的角度會(huì)發(fā)生不可預(yù)測(cè)的變化,為了在目標(biāo)區(qū)域內(nèi)仍然能夠具有響應(yīng)的特征點(diǎn),從而減少運(yùn)動(dòng)的干擾),針對(duì)每個(gè)樣本z,將其與一系列大小不同的濾波器進(jìn)行卷積,不同大小的濾波器定義如式(5)所示:i和j是濾波器的寬和高。將濾波后的圖像矩陣展開(kāi)成一個(gè)維的列向量,將不同大小的列向量連接成一個(gè)高維(w× h)2的圖像特征向量x=(x1,…,xm)T。
圖2.3表明,一個(gè)高維的x向量(m維)通過(guò)n×m的稀疏矩陣投影到低維v向量(n維)。其中,矩陣R中的黑色代表負(fù)數(shù)元素,灰色代表正數(shù)元素,而白色代表零。藍(lán)色箭頭則表示隨機(jī)測(cè)量矩陣R的某一行中的非零元素與特征向量x中元素相乘,相當(dāng)于一個(gè)矩形框與圖像中被框定位置圖像進(jìn)行卷積。算法利用了一個(gè)相當(dāng)稀疏的隨機(jī)測(cè)量矩陣R,將高維x投影到低維的v。利用積分圖,可以高效的計(jì)算v向量[7]。
2.4分類(lèi)器構(gòu)建和更新
樸素貝葉斯分類(lèi)法因?yàn)樗姆诸?lèi)算法思想簡(jiǎn)單,其基本思想為:假定給定目標(biāo)值時(shí)屬性之間相互條件獨(dú)立,而對(duì)于給定的待分類(lèi)的樣本,求解此樣本出現(xiàn)的條件下各個(gè)類(lèi)別出現(xiàn)的概率,當(dāng)計(jì)算出的概率哪個(gè)最大,此樣本判定為屬于哪一類(lèi)。本算法利用樸素貝葉斯分類(lèi)法:樣本z(m維),它的低維表示是v(n維)。假定低維向量v中的各特征的元素符合正態(tài)分布的,符合貝葉斯原理,利用分類(lèi)法進(jìn)行建模[8]得到:
其中,y∈{0,1}代表樣本的標(biāo)簽,通過(guò)設(shè)定y=0表示負(fù)樣本,y=1表示正樣本,假設(shè)兩個(gè)樣本的先驗(yàn)概率相等,即p( y=1)=p( y=0)=0.5。Freedman[9]證明了高維隨機(jī)向量的投影是符合正態(tài)分布的。假定構(gòu)建的分類(lèi)器H(v)中的條件概率p( vi|y=1)和p( vi|y=0)同樣滿足高斯分布,因此可以用四個(gè)參數(shù)來(lái)描述,分別為他們的分布和更新遵從式(7):通過(guò)采集到正負(fù)樣本利用隨機(jī)矩陣降維后,得到的樣本特征進(jìn)行逐步更新。
圖2.3 高維到低維的壓縮
3.1開(kāi)發(fā)工具
本算法在OpenCV庫(kù)的基礎(chǔ)上采用C++和Qt的混合編程實(shí)現(xiàn),C++用于處理目標(biāo)跟蹤及人臉檢測(cè)算法的實(shí)現(xiàn)。為了完善多功能協(xié)助目標(biāo)跟蹤功能的系統(tǒng),故添加其他輔助功能,使用C++進(jìn)行模塊化封裝,體現(xiàn)了面向?qū)ο箝_(kāi)發(fā)的思想[10]。而Qt則用于人機(jī)交互界面的開(kāi)發(fā),實(shí)現(xiàn)界面與用戶的友好交互。
Qt是一個(gè)跨平臺(tái)圖形用戶界面應(yīng)用程序框架。它提供給應(yīng)用程序開(kāi)發(fā)者建立完美的圖形用戶界面所需的各項(xiàng)功能。Qt支持?jǐn)U展,并允許組件編程,其最大的特點(diǎn)是利用信號(hào)/槽的安全機(jī)制來(lái)替代回調(diào)函數(shù),這使得各個(gè)元件之間的增加協(xié)同效率。
OpenCV是一個(gè)龐大開(kāi)源的計(jì)算機(jī)視覺(jué)庫(kù)。大部分代碼采用C/C++編寫(xiě),并且具有良好的跨平臺(tái)性,在各大操作系統(tǒng)上皆可運(yùn)行使用。OpenCV具有超過(guò)五百個(gè)的API函數(shù),幾乎覆蓋了機(jī)器學(xué)習(xí)和計(jì)算機(jī)視覺(jué)等大型研究領(lǐng)域,世界各地的開(kāi)發(fā)者都在擁抱OpenCV并開(kāi)發(fā)出各式各樣優(yōu)秀的視覺(jué)產(chǎn)品[11]。
3.2功能模塊
本系統(tǒng)主要以CT算法實(shí)現(xiàn)目標(biāo)跟蹤模塊和Adaboost+Haar算法的人臉檢測(cè)模塊為核心,其他功能模塊為輔助,實(shí)現(xiàn)了界面美觀,操作簡(jiǎn)單,功能齊全的效果。系統(tǒng)采用自底向上的開(kāi)發(fā)方法[12],先完成模塊化的開(kāi)發(fā),然后進(jìn)行組裝形成系統(tǒng)。圖4.1所示,多功能輔助目標(biāo)跟蹤系統(tǒng)分為六個(gè)模塊,分別為目標(biāo)跟蹤模塊、人臉檢測(cè)模塊、開(kāi)啟攝像模塊、播放視頻模塊、關(guān)于系統(tǒng)模塊、退出系統(tǒng)模塊,每個(gè)模塊都具有特有的功能,這些功能共同輔助目標(biāo)跟蹤的功能,有不乏其各自的特色,形成了功能完善,主要功能突出的系統(tǒng)。
圖4.1 系統(tǒng)功能模塊圖
4.1目標(biāo)跟蹤
目標(biāo)跟蹤模塊算法設(shè)計(jì)復(fù)雜,而且需要人工標(biāo)定跟蹤的目標(biāo),在視頻播放的過(guò)程中,鼠標(biāo)框定目標(biāo),釋放鼠標(biāo)后將信號(hào)以及矩形框的坐標(biāo)傳送給初始化函數(shù),然后使用壓縮感知目標(biāo)實(shí)時(shí)跟蹤算法處理,在接下來(lái)視頻流中預(yù)測(cè)目標(biāo)的位置,從而達(dá)到目標(biāo)跟蹤的目的[13]。
圖4.2所示,在攝像讀取視頻的過(guò)程中,第t幀的時(shí)候,利用鼠標(biāo)確定需要跟蹤的目標(biāo),是一個(gè)初始化的過(guò)程。根據(jù)鼠標(biāo)的響應(yīng),將目標(biāo)的信息傳送至算法,激活目標(biāo)跟蹤算法,在之后的運(yùn)行過(guò)程中持續(xù)跟蹤。圖4.3表示在確定目標(biāo)后的連續(xù)跟蹤。
圖4.2 初始化跟蹤目標(biāo)圖
圖4.3 跟蹤流程圖
圖4.4所示是目標(biāo)算法流程圖,l為采樣或目標(biāo)位置,Dγ為小于γ范圍采集的樣本,aD為小于α范圍的采集樣本,Dζ,β為大于ζ,小于β的范圍中采集的樣本,α,γ,ζ,β都表示采樣距離。
圖4.4 壓縮跟蹤算法流程
4.2人臉檢測(cè)
人臉檢測(cè)模塊是一個(gè)重要的模塊,它從攝像頭攝取的視頻流中取出一幀,將圖片預(yù)處理后,將圖片縮小原來(lái)的1/scale,調(diào)用人臉檢測(cè)算法進(jìn)行檢測(cè),檢測(cè)到的人臉信息放入vector容器中,將結(jié)果返回,然后利用迭代方法將人臉信息都取出,待圖像放大,恢復(fù)到原來(lái)的大小之后,利用位置信息將人臉框定。在計(jì)數(shù)的過(guò)程中,每迭代一次便返回一個(gè)人臉,直到容器為空后即為人臉的數(shù)目,即可顯示在界面上。
圖4.5表示的是人臉檢測(cè)模塊的流程圖。為了加速檢測(cè)的速度,將原來(lái)的圖像進(jìn)行了先縮小,再放大的操作,從而避免造成視頻不流暢的現(xiàn)象。圖4.6陳述了人臉檢測(cè)算法的步驟,得到了攝取圖像上所有人臉的大小和位置信息,從而正確地計(jì)數(shù)和標(biāo)示人臉。
圖4.5 人臉檢測(cè)模塊流程圖
圖4.6 人臉檢測(cè)算法流程
系統(tǒng)利用OpenCV和C++實(shí)現(xiàn)了壓縮抽樣的目標(biāo)跟蹤算法和Haar-like特征+AdaBoost的人臉檢測(cè)算法,利用Qt實(shí)現(xiàn)界面的開(kāi)發(fā),將兩者混合編程開(kāi)發(fā),構(gòu)成多功能的目標(biāo)跟蹤系統(tǒng)。系統(tǒng)的主要界面如5.1所示,六個(gè)按鈕對(duì)應(yīng)了不同模塊。其所對(duì)應(yīng)的類(lèi)名為MainWindow,主要包含了六個(gè)按鈕的消息響應(yīng)函數(shù)。
圖5.1 主界面
目標(biāo)跟蹤模塊是當(dāng)前系統(tǒng)中最重要的部分,其后臺(tái)的算法與界面開(kāi)發(fā)實(shí)現(xiàn)了完美的融合。主系統(tǒng)的的初始化界面模塊分為三個(gè)部分構(gòu)成:控制按鈕、顯示視頻控件和顯示框定跟蹤目標(biāo)的控件。Compressive Tracker是算法實(shí)現(xiàn)的類(lèi),其中包含7個(gè)函數(shù)方法。
圖5.2表示確定跟蹤目標(biāo)后第t幀的跟蹤物體,圖5.3表示在n幀后,雖然有部分的遮擋,依然能夠較好的跟蹤物體,并且在目標(biāo)移動(dòng)的過(guò)程中,具有較好的魯棒性。在開(kāi)始跟蹤按鈕的下側(cè),是最開(kāi)始確定的跟蹤目標(biāo),可以和之后的跟蹤效果進(jìn)行對(duì)比。
圖5.2 t幀跟蹤效果圖
圖5.3 t+n幀跟蹤效果圖
人臉檢測(cè)模塊是當(dāng)前系統(tǒng)中重要的組成部分。如圖5.4所示,是人臉檢測(cè)模塊的初始化界面,本模塊分為三個(gè)部分構(gòu)成。通過(guò)加載硬盤(pán)中的圖像或者調(diào)用攝像頭利用FaceDetect類(lèi)實(shí)現(xiàn),其中包含detectMultiScale方法對(duì)人臉進(jìn)行檢測(cè)[15]。圖5.5所示,檢測(cè)出一副圖像的3個(gè)人臉,并把其標(biāo)示,在右側(cè)顯示數(shù)目。
開(kāi)啟攝像模塊是本系統(tǒng)中重要的輔助部分,具有監(jiān)控以及視頻備份的功能。相似的,開(kāi)啟攝像模塊的初始化界面也分為三個(gè)部分構(gòu)成:控制按鈕、顯示視頻控件和拍照之后顯示截取圖像的控件,利用OpenCapture類(lèi)進(jìn)行實(shí)現(xiàn),其中包含拍照響應(yīng)函數(shù)以及開(kāi)啟攝像函數(shù)等。
視頻播放模塊是整個(gè)系統(tǒng)的重要部分。如圖5.6所示,是視頻播放模塊的初始化界面,本模塊由兩個(gè)部分構(gòu)成:控制按鈕、顯示視頻控件。當(dāng)按下本地視頻的按鈕時(shí),從本地的硬盤(pán)上隨機(jī)播放一個(gè)可以格式支持的視頻文件。在視頻播放的過(guò)程可以點(diǎn)擊快進(jìn)、快退、暫停、提高音量、降低音量按鍵,類(lèi)videoshow中包含了視頻的播放模塊和按鈕的響應(yīng)函數(shù)。如圖5.7所示,視頻播放各項(xiàng)功能均已實(shí)現(xiàn)。
圖5.4 人臉檢測(cè)模塊初始化圖
圖5.5 人臉檢測(cè)效果圖
圖5.6 視頻播放模塊初始化圖
圖5.7 視頻播放效果圖
本文闡述了基于壓縮感知理論的實(shí)時(shí)目標(biāo)跟蹤算法,以及利用OpenCV和Qt的系統(tǒng)結(jié)構(gòu)設(shè)計(jì)與實(shí)現(xiàn),分為目標(biāo)跟蹤、人臉檢測(cè)、視頻播放、開(kāi)啟攝像、關(guān)于系統(tǒng)和退出系統(tǒng)六大模塊,形成多功能輔助目標(biāo)跟蹤系統(tǒng)。簡(jiǎn)要介紹了壓縮感知的原理,通過(guò)矩陣R對(duì)圖像感興趣目標(biāo)進(jìn)行降維,使用樸素貝葉斯分類(lèi)器對(duì)降維后的特征分類(lèi),同時(shí)利用在線學(xué)習(xí)的方式對(duì)分類(lèi)器的參數(shù)進(jìn)行更新。雖然能夠達(dá)到
實(shí)時(shí)性的要求,但是在某一幀目標(biāo)的位置與之前一幀相差較大的情況下,會(huì)造成目標(biāo)的丟失。因此在后續(xù)的工作中,可以在現(xiàn)有的基礎(chǔ)上,對(duì)CT算法進(jìn)行改進(jìn),不僅可以提高遮擋、運(yùn)動(dòng)的突變的跟蹤準(zhǔn)確性,還可以實(shí)現(xiàn)跟蹤框的尺度變化,以及實(shí)現(xiàn)多目標(biāo)的準(zhǔn)確跟蹤等,希望其改進(jìn)算法能夠應(yīng)用到更廣泛的實(shí)際生活生產(chǎn)中。
[1] Blake A, Isard M. Active Contours: The Application of Techniques from Graphics, Vision, Control Theory and Statistics to Visual Tracking of Shapes in Motion [J]. Language Speech and Hearing Services in Schools, 1998, 11(3): 320-323.
[2] 李培華. 序列圖像中運(yùn)動(dòng)目標(biāo)跟蹤方法[M]. 北京: 科學(xué)出版社, 2010.
[3] 盧雁, 吳盛教, 趙文強(qiáng). 壓縮感知理論綜述[J]. 計(jì)算機(jī)與數(shù)字工程, 2012, 40(8): 12-14.
[4] Zhang K, Zhang L, Yang M H. Real-time compressive tracking[C]. European Conference on Computer Vision, Springer-Verlag, 2012: 864-877.
[5] Candes E J, Tao T. Decoding by Linear Programming [J]. IEEE Transactions on Information Theory, 2006, 51(12): 4203-4215.
[6] Achlioptas D. Database-friendly random projections: Johnson-Lindenstrauss with binary coins [J]. Journal of Computer & System Sciences, 2003, 66(4): 671-687.
[7] Viola P, Jones M. Rapid Object Detection using a Boosted Cascade of Simple Features [J]. CVPR 2001, 1:511.
[8] Ng A Y, Jordan M I. On Discriminative vs. Generative Classifiers: A comparison of logistic regression and naive Bayes[J]. Advances in Neural Information Processing Systems, 2002,2(3): 169-187.
[9] Diaconis P, Freedman D. Asymptotics of Graphical Projection Pursuit [J]. Annals of Statistics, 1984, 12(3): 793-815.
[10] 斯坦利·李普曼, 約瑟·拉喬伊等. C++ Primer中文版(第5版)[M]. 北京: 電子工業(yè)出版社, 2013.
[11] 于仕琪, 劉瑞禎. 學(xué)習(xí)OpenCV[M]. 北京: 清華大學(xué)出版社, 2009.
[12] 張海藩. 軟件工程導(dǎo)論[M]. 北京: 清華大學(xué)出版社, 1992.
[13] 張明軍, 俞文靜, 袁志等. 視頻中目標(biāo)檢測(cè)算法研究[J].軟件, 2016, 37(4): 40-45.
[14] 侯順艷, 許靜, 郄建敏. 融合雙膚色模型及AdaBoost算法的人臉檢測(cè)[J]. 軟件, 2014, 35(3): 48-51.
[15] 楊國(guó)林, 馮喬生, 張亞萍. 基于膚色的人臉檢測(cè)綜述[J].軟件, 2013, 34(3): 7-9.
Real-time Object Tracking Research Base on Compressive Sensing and System Implementation
LIU Yang, JIN Xiao-kang, WANG Meng, REN Yi-fan
(School of Computer and Communication Engineering, Changsha University of Science and Technology, Changsha 410114, China)
Object tracking is a challenging research direction of computer vision. The basic idea of object tracking is to ensure object position and attitude and the object trajectory based on the spatial-temporal correlation in video. Object tracking is one of the most difficult tasks in computer vision, and the difficulty is mainly due to shape change, the unpredictability of the motion and complicated background from the object. This topic employs a simple and efficient tracking algorithm based on compressive sensing. Determining the goal of tracking, first to collect the positive samples around the object, and collect the negative samples far away the object, after the dimension reduction by random sparse measurement matrix which satisfy the condition of RIP, we use naive Bayesian classifier to recognize the feature vectors. On the basis of the algorithm, we use OpenCV image processing library and Qt completed the multi-function aid object tracking system consisting of object tracking, face detection, open capture, video display, etc.
Object track; Compressive sampling; Face detection; OpenCV
TP391
A
10.3969/j.issn.1003-6970.2016.08.005
2016年湖南省研究生科研創(chuàng)新項(xiàng)目(CX2016B413);2016年長(zhǎng)沙理工大學(xué)大學(xué)生研究性學(xué)習(xí)和創(chuàng)新性實(shí)驗(yàn)計(jì)劃項(xiàng)目(長(zhǎng)理工大教[2016]7號(hào)-133)
劉陽(yáng)(1985-),男,碩士研究生,主要研究方向:模式識(shí)別、管理信息系統(tǒng);金曉康(1993-),男,碩士研究生,主要研究方向:計(jì)算機(jī)視覺(jué)、深度學(xué)習(xí);王朦(1996-),女,本科生,主要研究方向:模式識(shí)別;任燚梵(1997-),男,本科生,主要研究方向:模式識(shí)別。