沈陽理工大學(xué)信息科學(xué)與工程學(xué)院 馬健博 胡玉蘭
基于窄基線的SIFT特征匹配目標(biāo)識(shí)別
沈陽理工大學(xué)信息科學(xué)與工程學(xué)院 馬健博 胡玉蘭
一直以來,遮擋狀態(tài)下的運(yùn)動(dòng)目標(biāo)的識(shí)別一直是該領(lǐng)域的難點(diǎn),當(dāng)目標(biāo)處于遮擋狀態(tài)且在復(fù)雜背景的干擾之下,對于目標(biāo)特征的提取與匹配將變得十分困難。本文對于遮擋狀態(tài)下運(yùn)動(dòng)的目標(biāo)提出一種基于窄基線SIFT特征匹配目標(biāo)識(shí)別。鑒于被識(shí)別的目標(biāo)在相鄰的兩個(gè)(或多個(gè))圖像幀之間的外形輪廓以及尺度變化較小以及基于目標(biāo)位置預(yù)測出的運(yùn)動(dòng)范圍有限,因此可以實(shí)現(xiàn)快速的窄基線小范圍之內(nèi)的SIFT特征匹配。實(shí)驗(yàn)結(jié)果顯示,該方法具有較強(qiáng)的穩(wěn)定性。
SIFT;目標(biāo)識(shí)別;特征匹配;窄基線
尺度不變特征轉(zhuǎn)換是British Columbia大學(xué)教授David Lowe首先發(fā)表于計(jì)算機(jī)視覺國際會(huì)議(International Conference on Computer Vision,ICCV)的一種圖像識(shí)別的方法,是一種用于圖像處理領(lǐng)域的一種描述子,即SIFI特征匹配算法,可在圖像中檢測出關(guān)鍵點(diǎn)。
SIFT特征匹配主要分為五個(gè)步驟:1)生成尺度空間;2)尺度空間中極值點(diǎn)的檢測;3)極值點(diǎn)的準(zhǔn)確定位;4)關(guān)鍵點(diǎn)中方向參數(shù)的指定;5)生成關(guān)鍵點(diǎn)描述子。
1)生成尺度空間:在計(jì)算機(jī)視覺領(lǐng)域中最先出現(xiàn)了尺度空間理論,該理論的出現(xiàn)是為了用計(jì)算機(jī)去模擬圖像數(shù)據(jù)的多尺度特征,Koendering和Lindeberg分別于1984年和1994年通過大量的研究證明發(fā)現(xiàn)高斯卷積核是實(shí)現(xiàn)尺度變換的唯一核函數(shù)。是可變的尺度核函數(shù),則其可以表示為:
David Lowe指出,采用一種高斯差分函數(shù)在圖像生成的矩陣中尋極值點(diǎn),差分尺度空間DoG(Difference-of-Gaussian)便可以構(gòu)造出來,同時(shí)檢測空間中局部的極值作為特征點(diǎn)。DoG算子表示的是不同的尺度的高斯卷積核的差分,其表達(dá)式可以表示為:
圖1 高斯金字塔和差分高斯金字塔的構(gòu)建
2)尺度空間中極值點(diǎn)的檢測:極值點(diǎn)的檢測如圖2所示:
圖2 尺度空間極值點(diǎn)的檢測
首先需要在圖像的尺度空間中尋找極值點(diǎn),尋找極值點(diǎn)的過程需要將每一個(gè)像素點(diǎn)要和它周圍的相鄰的所有的點(diǎn)比較,并將它和圖像域和尺度域中的相鄰點(diǎn)的值比較大小,因此在圖像的尺度空間上以及二維圖像空間上都可以準(zhǔn)確地檢測到極值點(diǎn)的存在。
3)極值點(diǎn)的準(zhǔn)確定位:當(dāng)檢測到空間中的極值點(diǎn)以后,此時(shí)需要采用一個(gè)擬合的三維二次函數(shù)。刪除尺度空間中對比度較低的關(guān)鍵點(diǎn),因此剩余得到的極值點(diǎn)便會(huì)增強(qiáng)了圖像匹配過程的穩(wěn)定性。
4)關(guān)鍵點(diǎn)中方向參數(shù)的指定:圖像中的每個(gè)關(guān)鍵點(diǎn)都需要指定方向參數(shù),此時(shí)可以采用尺度空間中的關(guān)鍵點(diǎn)相鄰像素的梯度方向作為關(guān)鍵點(diǎn)的方向,這一過程便可以使算子具備了旋轉(zhuǎn)不變的特性。接下來就可以計(jì)算圖像尺度空間中關(guān)鍵點(diǎn)的鄰域像素的梯度模值m和方向θ,其計(jì)算公式如下:
圖3 梯度直方圖確定的主方向
5)生成關(guān)鍵點(diǎn)描述子
當(dāng)圖像中關(guān)鍵點(diǎn)的信息確定以后,接下來則需要使得圖像中的關(guān)鍵點(diǎn)具有旋轉(zhuǎn)不變的特性,此時(shí)將坐標(biāo)軸旋轉(zhuǎn)到與關(guān)鍵點(diǎn)相同的方向就可實(shí)現(xiàn)上述要求。以關(guān)鍵點(diǎn)作為中心可以生成描述子,將采樣點(diǎn)和關(guān)鍵點(diǎn)的相對方向通過高斯加權(quán)后,最終可以得到228的32維特征描述子。
圖4 由關(guān)鍵點(diǎn)信息生成的特征向量
圖中箭頭方向表示當(dāng)前像素的梯度方向,其長度表示該像素的幅值大小。接下來采用4×4大小的窗口去計(jì)算8個(gè)方向的梯度方向上的直方圖。繪制出每個(gè)梯度方向上的累加的值即能產(chǎn)生一個(gè)種子點(diǎn)。任意一個(gè)描述符包含一個(gè)位于關(guān)鍵點(diǎn)附近的四個(gè)直方圖數(shù)組,對于任意一個(gè)關(guān)鍵點(diǎn)則產(chǎn)生了128維的SIFT特征向量。
首先當(dāng)目標(biāo)處于正常無遮擋干擾的狀態(tài)之下,可以直接使用SIFT特征匹配以實(shí)現(xiàn)快速的匹配與目標(biāo)的識(shí)別。當(dāng)目標(biāo)運(yùn)動(dòng)至出現(xiàn)遮擋時(shí),為了保證穩(wěn)定的識(shí)別效果,即采用基于窄基線SIFT特征匹配,目標(biāo)運(yùn)動(dòng)所產(chǎn)生的軌跡在相鄰的兩幅圖像之間的變化非常小,因此可以實(shí)現(xiàn)小范圍內(nèi)快速的窄基線匹配。對于所有目標(biāo)的識(shí)別,分割是目標(biāo)識(shí)別的第一步,是對目標(biāo)跟蹤,偵測,分析的基礎(chǔ),同時(shí)將目標(biāo)從背景中分割出來可以減少匹配時(shí)的干擾,提高識(shí)別率。其次將未被遮擋時(shí)從背景中分割出的目標(biāo)與被遮擋(未完全遮擋)的目標(biāo)進(jìn)行特征匹配,這樣可以確定目標(biāo)在被遮擋以后在區(qū)域中的位置,可以將原目標(biāo)(未被遮擋時(shí))與被遮擋后的目標(biāo)兩者之間建立關(guān)系,并將更新被識(shí)別的目標(biāo)的特征描述符。
本實(shí)驗(yàn)采用Visual Studio 2010 + opencv2.4.1作為開發(fā)平臺(tái)。首先采用Grabcut作為圖像的分割方法,該方法是Graphcut算法的改進(jìn),是一種圖論的分割方法,該方法基于能量優(yōu)化算法,將圖像分割問題轉(zhuǎn)換為圖的最小割優(yōu)化問題,是一種直接基于圖像算法的圖像分割技術(shù)。如圖6(a)所示,目標(biāo)未遮擋時(shí)的狀態(tài),圖6(b)是未遮擋狀態(tài)時(shí)分割出的運(yùn)動(dòng)目標(biāo),圖6(c)是遮擋狀態(tài)下的復(fù)合運(yùn)動(dòng)目標(biāo),圖6(d)是遮擋狀態(tài)下復(fù)合運(yùn)動(dòng)目標(biāo)的分割結(jié)果,圖6(e)是運(yùn)動(dòng)目標(biāo)在兩種狀態(tài)下分割以后匹配出的結(jié)果,由實(shí)驗(yàn)結(jié)果可知,在未遮擋的狀態(tài)下,目標(biāo)得以從背景中分割出來,目標(biāo)被遮擋時(shí),依然可以從背景中分離出,分割出的目標(biāo)在兩種不同的狀態(tài)之下依然可以成功的匹配與識(shí)別。實(shí)驗(yàn)流程與實(shí)驗(yàn)結(jié)果如圖5、圖6:
圖5 實(shí)驗(yàn)流程圖
圖6 實(shí)驗(yàn)結(jié)果
[1]Lowe David. Distinctive image features from scale-invariant key points[J].International Journal of Computer Vision,2004,60(2):91-110.
[2]李志華.智能視頻監(jiān)控系統(tǒng)目標(biāo)跟蹤與分類算法研究[D]:浙江大學(xué),2008.
[3]王素玉,沈蘭蓀.智能視覺監(jiān)控技術(shù)研究進(jìn)展[J].中國圖象圖形學(xué)報(bào),2007,12(009):1505-1514.
馬健博,碩士研究生,主要研究領(lǐng)域:自適應(yīng)信號(hào)處理。
胡玉蘭,教授,主要研究領(lǐng)域:圖像信息處理、模式識(shí)別與人工智能。