葛明濤 海潔
引言:隨著光電子技術和數(shù)字序列圖像處理及分析技術的深入發(fā)展,由運動恢復形狀的研究越來越受到研究人員的重視。本文在特征點檢測方面,分類總結(jié)了現(xiàn)有的二維圖像特征(興趣點)檢測方法,分析了不同方法各自的優(yōu)缺點,并著重分析和評價了幾種典型的興趣點檢測方法的性能。
一、研究背景和意義
隨著光電子技術和數(shù)字序列圖像處理及分析技術的深入發(fā)展,由運動恢復形狀(Structure/Shape From Motion)的研究越來越受到研究人員的重視。這一方法的巨大吸引力來源于它吸收了單目視覺設備簡單和多目視覺的精確性兩方面的優(yōu)點。利用單個攝像機和對象之間的相對運動,以及有相對運動的條件下拍攝的連續(xù)幾幅圖像,就可以比較精確的恢復出對象的三維表面形狀。而為了精確的恢復出對象的三維表面形狀,就必須知道攝像機的內(nèi)部參數(shù)。近年來,攝像機的自標定受到了普遍關注,成為計算機視覺研究的一個熱點。這一問題的成功解決,將會成為計算機視覺研究的一個重大理論突破,對于由運動恢復形狀等應用有著重大的意義,同時也會對計算機視覺的工程應用,特別是軍事應用提供更加簡單、易行、經(jīng)濟、實用的手段。
二、興趣點檢測
(一)興趣點檢測方法分類
目前的興趣點檢測方法大致可以分為四類:基于邊緣的檢測方法、基于灰度的檢測方法、基于參數(shù)模型的檢測方法以及基于局部能量的檢測方法等。其中,基于局部能量的檢測方法在頻域空間內(nèi)進行興趣點的檢測,避免了興趣點形狀的限制。它假定圖像信號在其興趣點處的傅立葉分量具有最大的相位一致性,而相位一致性正比于局部能量[1],故可通過計算局部能量來尋找這些興趣點。這種方法的優(yōu)點是可以檢測到各種類型的興趣點,而且定位精度也很準確。其主要缺點為:計算量相當大,而且也沒有統(tǒng)一的閾值可用來標記興趣點。
(二)一維對數(shù)-Gabor濾波器
為了有效地計算特征點的相位一致性,需要首先計算特征的局部能量。為此,這里簡要介紹一下計算局部能量時所用的濾波器。
Field[2]提出了對數(shù)-Gabor濾波器,其轉(zhuǎn)移函數(shù)為:
(1)
其中 為濾波器的中心頻率。
由定義可知,對數(shù)-Gabor濾波器的直流分量為零,并且其轉(zhuǎn)移函數(shù)一直向高頻端延伸。此外,對數(shù)-Gabor函數(shù)也與人類視覺系統(tǒng)的細胞響應在對數(shù)頻率尺度下的對稱性這一特性相符合。因此,本文選用對數(shù)-Gabor小波來計算興趣點的相位一致性。
(三)基于相位一致性的興趣點檢測方法
與傳統(tǒng)的興趣點檢測方法一樣,局部能量對于圖像的亮度和反差較為敏感,不同圖像計算得到的局部能量圖具有很大差別,故興趣點閾值的選取往往較為困難。另一方面,由于圖像信號在其興趣點處的傅立葉分量具有最大的相位一致性,故可以通過計算圖像的相位一致性來檢測圖像中的興趣點(即二維特征)。因為相位一致性是一個無量綱的量,其取值范圍被標準化為0和1之間,并且相位一致性對圖像的亮度和反差具有不變性,所以為特征顯著性的度量提供了一個統(tǒng)一的方法。一維信號的相位一致性可表示為[2]:
(2)
其中, 和 分別為信號的傅立葉分量的振幅和相位, 為加權均值相角。
(a) 梯形邊及其頻域分量 (b) 三角波及其頻域分量
圖2 兩種常見一維圖像特征及其頻域分量
圖2給出了兩種常見一維信號特征及其傅立葉展開式的前7項。由圖可以看出,只有在圖像特征點處,其頻域分量才具有最大的相位一致性。
三、特征點匹配
當前,解決兩視角下特征配準問題的方法可大致分為兩類:連續(xù)的方法和離散的方法。對于特征匹配問題,存在兩種不同的解決方案。第一種方案是,對于給定的圖像序列,首先計算圖像的速度場(如光流場),這里的每一個速度向量逼近不同圖像中兩點之間的相關性,因此,計算得到的速度場就對應配準的特征。第二種方案是,首先方面在每幅圖像中提取特征點,然后利用某種方法進行特征的匹配。
連續(xù)的方法。這類方法直接計算圖像的向量場,而不是進行顯示的特征配準。計算得到的速度場就對應配準的特征,每一個速度向量逼近不同圖像中兩點之間的相關性。在實際應用中,光流場經(jīng)常被用于逼近實際圖像面中的速度場。這類方法要求幀間的運動較小,并且圖像具有平滑的灰度函數(shù)??梢曰趫D像灰度函數(shù)的時空變化來計算光流場。盡管灰度流與3-D速度的投影并不完全相同,在某種假設下,它們非常相似。
離散的方法。這類方法允許圖像間具有較大的運動。此外,由于離散特征較灰度值更為穩(wěn)定,故離散的方法不受灰度值變化的影響,并且不要求圖像灰度是連續(xù)的。
四、總結(jié)
近年來,隨著光電子技術和數(shù)字序列圖像處理及分析技術的深入發(fā)展,由運動恢復形狀(Structure/Shape From Motion)的研究越來越受到研究人員的重視。此外,許多導航或控制任務,如目標跟蹤、障礙避免或map building等需要攝像機(或目標)的運動參數(shù)和場景的歐氏結(jié)構信息。為了得到這些信息,我們必須首先確定攝像機的內(nèi)部參數(shù),即實現(xiàn)攝像機的標定。本文正是從攝像機標定過程的幾個關鍵步驟入手,分別對特征點提取,序列圖像中的特征點匹配以攝像機自標定算法進行了研究和討論。
參考文獻
[1]吳冠勇,攝像機內(nèi)參數(shù)估計的若干研究.碩士論文:合肥,安徽大學,2004.
[2]David A. Forsyth and Jean Ponce, Computer Vision: A Modern Approach. Pearson Education,2002.
[3]馬頌德,張正友.計算機視覺——計算理論與算法基礎.北京:科學出版社,1998.