馬迎春,劉慧鋒,張 航
(1. 山西迪邁沃科光電工業(yè)有限公司,山西 太原 030006; 2. 山西大學(xué) 物理電子工程學(xué)院,山西 太原 030006)
在機(jī)器視覺領(lǐng)域,金屬表面缺陷檢測(cè)[1]、立體視覺技術(shù)[2]、目標(biāo)識(shí)別[3]等對(duì)目標(biāo)物特征的提取及匹配[4]等很大程度上取決于圖像興趣點(diǎn)(關(guān)鍵點(diǎn)或特征點(diǎn)),即只需提取圖像的某些特征點(diǎn)進(jìn)行局部分析,而非整幅圖像. 角點(diǎn)是圖像中很有價(jià)值的一種二維特征點(diǎn),它在保留圖像重要信息的同時(shí),有效減少了處理圖像的信息量[5]. 國(guó)內(nèi)外學(xué)者基于對(duì)角點(diǎn)的檢測(cè)過程做了大量研究,取得了相應(yīng)的成果,按照檢測(cè)判斷依據(jù)的不同大致分為基于灰度和基于邊緣輪廓的角點(diǎn)檢測(cè). Harris和Stephens提出的Harris角點(diǎn)檢測(cè)是檢測(cè)角點(diǎn)的經(jīng)典方法,Harris角點(diǎn)針對(duì)Moravec角點(diǎn)中的連續(xù)平方求和而引入局部變換因子,并利用高斯權(quán)重函數(shù)特性檢測(cè)角點(diǎn)而進(jìn)行改進(jìn)[6]. J.Shi和C.Tomasi對(duì)Harris檢測(cè)提出了改進(jìn)算法,采用與harris 不同的角點(diǎn)響應(yīng)函數(shù),Shi-Tomasi角點(diǎn)檢測(cè)劃分相關(guān)一對(duì)一匹配對(duì),依據(jù)圖像的角點(diǎn)特征、灰度和位置信息采用最大互相關(guān)函數(shù)進(jìn)行相似度計(jì)算[7]. Smith和Brady提出了SUSAN檢測(cè)算法,SUSAN算子采用圓形模板來得到各向同性的響應(yīng),不需要計(jì)算微分以及非線性響應(yīng)的特點(diǎn)使得SUSAN算子抑制噪聲的性能較好[8],但定位精度較差. 此后,人們針對(duì)不同檢測(cè)算子的缺陷提出過大量的改進(jìn)方法,都取得了較好的檢測(cè)效果.
上述提到的幾種代表性算法,屬于灰度角點(diǎn)檢測(cè)算法,依賴于像素點(diǎn)鄰域的灰度值判斷特征變化,操作計(jì)算復(fù)雜、難度大. 相比于此類檢測(cè)器,基于邊緣輪廓的檢測(cè)器首先提取邊緣輪廓,然后在輪廓上而不是整幅圖像上檢測(cè)角點(diǎn),這樣就大大降低了圖像處理運(yùn)算的信息量,極大地降低了錯(cuò)誤檢概率,因此受到廣泛應(yīng)用. 近年來,學(xué)者大量的研究與實(shí)驗(yàn)也驗(yàn)證了基于圖像邊緣輪廓的檢測(cè)算法性能優(yōu)于基于灰度信息的檢測(cè)算法. Mokhtarian等人提出了曲率尺度空間CSS檢測(cè)方法[9],但該方法顯著的問題在于如何選擇合適的高斯尺度以及角點(diǎn)的閾值. Mohammad和Lu提出了利用弦到點(diǎn)的距離累加CPDA[10],He和Yung利用自適應(yīng)曲率閾值對(duì)CSS算法進(jìn)行了相應(yīng)的改進(jìn)[11].
Gabor濾波器擁有和人類視覺皮層感受野響應(yīng)相似的性質(zhì),SHEN L等人證明了Gabor濾波器在提取局部特征上的優(yōu)勢(shì)[12]. 李云紅等人提出將Gabor濾波器平滑后的輪廓像素的主方向角度差作為角點(diǎn)測(cè)度,降低了計(jì)算的復(fù)雜度,取得了較好的檢測(cè)效果[13]. 本文基于同樣的數(shù)學(xué)思想,提出利用多方向Gabor濾波器虛部(imaginary part of Gabor filters, IPGFs)對(duì)圖像輪廓平滑,有效地抑制了噪聲并且提高了檢測(cè)準(zhǔn)確率.
Gabor濾波器即Gabor小波變換,實(shí)質(zhì)上是一個(gè)以Gabor函數(shù)作為基函數(shù)的小波變換,它結(jié)合了Gabor變換和小波變換的優(yōu)點(diǎn),具有多尺度、多分辨率的特性,被廣泛應(yīng)用到圖像的特征提取中. Pellegrino F A 等人分析認(rèn)為IPGFs可以提供一個(gè)像素周圍精確的方向強(qiáng)度變化信息,適用于圖像角點(diǎn)檢測(cè)[14].
在空域,一個(gè)二維Gabor濾波器是一個(gè)正弦平面波和高斯核函數(shù)的乘積[15],表現(xiàn)形式為
x′=xcosθ+ysinθ,y′=-xsinθ+ycosθ,
(1)
式中:γ,η分別為沿x軸和y軸方向的銳度(垂直于平面波);f是濾波器的中心頻率;θ是調(diào)制平面波和高斯主軸沿逆時(shí)針旋轉(zhuǎn)的角度,濾波器的參數(shù)在極坐標(biāo)中定義.
對(duì)于一個(gè)輸入圖像I(x,y), 在IPGFs平滑后的響應(yīng)函數(shù)可以表示為
φ(x,y;f,θ)=Im(ψ(x,y;f,θ)),
(2)
在實(shí)際應(yīng)用中,輸入圖像是二維離散的I(m,n),IPGFs響應(yīng)函數(shù)也是離散的,離散的IPGFs幅值響應(yīng)定義為
m′=mcosθk+nsinθk,n′=-msinθk+ncosθk,
(3)
式中:fs為第s個(gè)尺度的中心頻率;K為方向采樣個(gè)數(shù);θk為第k個(gè)方向角度. 圖 1 顯示8個(gè)方向的IPGFs頻域圖.
圖 1 8個(gè)方向的IPGFs頻域圖Fig.1 Eight directions of IPGFs frequency domain
圖 2 算法流程圖Fig.2 Algorithm flow chart
以CSS算法、CPDA算法和H&Yung算法為代表的基于圖像輪廓的角點(diǎn)檢測(cè)算法大多分三步進(jìn)行: 邊緣提取、填充輪廓、角點(diǎn)判決.
C={P1,P2,…,PN}.
(4)
式(4)表示圖像輪廓,其中PN=[xN,yN]T表示第N個(gè)輪廓上的像素. 對(duì)于輸入的離散圖像I(m,n), 8個(gè)方向的IPGFs的梯度幅值響應(yīng)可表示為
G(m,n;fs,k)=I(m,n)φ(m,n;fs,θk)=
(5)
每個(gè)像素點(diǎn)對(duì)應(yīng)的最大梯度方向及主方向定義為
(6)
輪廓線上邊緣點(diǎn)的角點(diǎn)測(cè)度定義為沿輪廓線位于該邊緣像素點(diǎn)兩側(cè)最近的兩個(gè)邊緣像素點(diǎn)的主方向角度差.
δ=min{|βN-1-βN+1|, π-|βN-1-βN+1|}.
(7)
算法流程如圖 2 所示.
角點(diǎn)檢測(cè)長(zhǎng)期以來缺乏嚴(yán)格統(tǒng)一的算法測(cè)評(píng)技術(shù). 近二十年來,獲得廣泛認(rèn)可的算法測(cè)評(píng)技術(shù)是Awrangjeb和Lu提出的基于輪廓的角點(diǎn)檢測(cè)算法測(cè)評(píng)技術(shù),使用平均重復(fù)率(average repeatability,Ravg)和定位誤差(localization error,Le)來衡量角點(diǎn)檢測(cè)算法的優(yōu)劣[16]. 與CSS,CPDA和H&Yung對(duì)比,對(duì)本文算法進(jìn)行比較評(píng)估.
Ravg計(jì)算原始圖像和變換圖像之間重復(fù)角點(diǎn)的平均數(shù)量,可以檢測(cè)算法在圖像幾何變換下的穩(wěn)定性,其定義為
(8)
式中:No,Nt分別表示原始圖像中檢測(cè)到的角點(diǎn)數(shù)量、變換后圖像中檢測(cè)到的角點(diǎn)數(shù)量;Nr表示原始圖像與變換圖像兩者的重復(fù)角點(diǎn)數(shù)(重復(fù)角點(diǎn)之間的距離為3個(gè)像素以內(nèi)).
Le計(jì)算重復(fù)角點(diǎn)的像素偏差值,用于檢測(cè)算法的精確度,它使用被檢測(cè)角點(diǎn)的均方根誤差(root-mean-square-error,RMSE)來衡量,定義為
(9)
式中: (xoi,yoi)和(xti,yti)分別為第i個(gè)重復(fù)角點(diǎn)在原始圖像和變換圖像中的位置坐標(biāo).
我們選用CSS, CPDA和H&Yung算法所用的檢測(cè)圖像作為原始測(cè)試圖像,如圖 3 所示,對(duì)圖像進(jìn)行如下兩種幾何變換:
1) 旋轉(zhuǎn): 以10°為步長(zhǎng)在[-90°,90°]旋轉(zhuǎn),不包括0°,得到18個(gè)旋轉(zhuǎn)角度下的幾何變換圖像;
2) 高斯噪聲: 在測(cè)試圖像中加入以方差1為步長(zhǎng),區(qū)間[1,15],0均值高斯白噪聲.
圖 3 測(cè)試圖像(所標(biāo)記為事實(shí)角點(diǎn))Fig.3 Test image(marked as the fact corner)
表 1~4 分別列出了本文算法與其他算法在不同的旋轉(zhuǎn)角度和高斯噪聲方差下計(jì)算所得的平均重復(fù)率Ravg和定位誤差Le的比較結(jié)果.
表 1 不同旋轉(zhuǎn)角度下各算法的Le(Pixels)
統(tǒng)計(jì)分析表 1 中數(shù)據(jù)可知,在圖像進(jìn)行旋轉(zhuǎn)幾何變換下,CSS, CPDA和本文算法的Le差別均在1%以內(nèi),本文算法比H&Yung降低了8.6%.
表 2 不同旋轉(zhuǎn)角度下各算法的Ravg(×100%)
表 2 數(shù)據(jù)表明,在圖像進(jìn)行旋轉(zhuǎn)幾何變換下,本文算法的Ravg較CSS高31.7%,較CPDA高 16.4%,較H&Yung 高7.9%.
表 3 不同高斯噪聲方差下各算法的Le(Pixels)
分析表 3 的數(shù)據(jù)可知,隨著高斯噪聲方差的增加,各算子的定位誤差均隨之增大. 在圖像加入高斯噪聲后,本文算法的Le比CSS高出了23.5%,比CPDA高出3.2%,比H&Yung降低了11.1%.
表 4 不同高斯噪聲方差下各算法的Ravg(×100%)
分析統(tǒng)計(jì)表 4 數(shù)據(jù)可知,在圖像加入高斯噪聲后,本文算法的Ravg比CSS高4.9%,比CPDA高18.1%,比H&Yung高10.9%. 隨著高斯噪聲方差的增大,本文算法Ravg下降最緩慢,CSS算法和Yung算法次之,CPDA算法的平均重復(fù)率下降最快.
綜合上述表 1~4 的實(shí)驗(yàn)測(cè)試數(shù)據(jù)分析可知: 圖像旋轉(zhuǎn)幾何變換下,CSS算法的穩(wěn)定性能最差,相應(yīng)的改進(jìn)算法CPDA和H&Yung提高了其穩(wěn)定性,卻增大了其定位誤差,使角點(diǎn)檢測(cè)準(zhǔn)確性略有下降. 本文算法提高了其平均重復(fù)率的同時(shí),降低了改進(jìn)算法的定位誤差Le; 在抗噪聲性能方面,改進(jìn)算法CPDA和H&Yung在算法穩(wěn)定性和角點(diǎn)檢測(cè)的準(zhǔn)確性方面都較CSS算法有所降低,這是其輪廓平滑處理的不足和欠缺. 綜合評(píng)價(jià),本文算法表現(xiàn)出較強(qiáng)的噪聲魯棒性和圖像幾何變換下的穩(wěn)定性,在算法測(cè)評(píng)中的綜合性能最佳.
基于圖像輪廓的角點(diǎn)檢測(cè)及對(duì)圖像輪廓提取的基礎(chǔ)上,沿著輪廓查找角點(diǎn),所需處理的信息量大大降低,降低了錯(cuò)誤檢概率,提高了算法的實(shí)時(shí)性能. 本文算法結(jié)合圖像的邊緣映射與主方向角度差,提高了算法的噪聲魯棒性. 首先基于Canny算子在圖像邊緣提取中的優(yōu)良性能,充分利用二維Gabor濾波器模擬人類視覺系統(tǒng)視網(wǎng)膜上圖像分解的機(jī)制,結(jié)合Gabor 變換和小波變換多尺度、多分辨率特性及其在圖像特征提取中的優(yōu)勢(shì),利用Gabor濾波器虛部平滑圖像輪廓,針對(duì)傳統(tǒng)基于圖像輪廓角點(diǎn)檢測(cè)中利用高斯核函數(shù)平滑造成的角點(diǎn)定位準(zhǔn)確率低、對(duì)局部信息變換敏感及噪聲魯棒性差等問題,本文算法提高了角點(diǎn)的定位準(zhǔn)確性,同時(shí)表現(xiàn)出較強(qiáng)的噪聲魯棒性. 實(shí)驗(yàn)測(cè)試表明,本文算法在角點(diǎn)檢測(cè)算法測(cè)評(píng)技術(shù)中,較傳統(tǒng)的算法綜合性能高.