張軼飛,牛守瑞,馬 娜,張長泉
?
一種新的基于多頻譜疊加的圖像配準算法
張軼飛1,牛守瑞1,馬 娜2,張長泉1
(1. 63963部隊 北京 100072;2. 中科院高能物理研究所 北京 100049)
針對現有頻域法FFT和PPFFT對于大倍率圖像配準精度和計算效率難以同時保證的問題,研究了一種基于多重頻譜疊加的頻域算法,為最大限度減小插值誤差噪聲,該算法采用多分辨率頻譜插值,構造出更接近對數極坐標網格。文中給出分辨率參數設置和算法流程。最后通過算例驗證,結果表明:本算法對無裁減圖像最大配準倍率可至10,對裁減圖像可至5,而FFT和PPFFT(無迭代)對于兩種類型圖像都約為2;相對于特征點匹配法,本算法也適用于更大倍率的圖像配準,從而驗證了該算法的準確性和可行性。
多重頻譜;大倍率配準;對數極坐標;插值誤差
圖像配準是圖像運動估計的關鍵,廣泛應用于圖像嵌入、視頻壓縮、電子穩(wěn)像及圖像增強等領域[1-5]。一般地,配準方法主要分為空域法和頻域法兩種。頻域法主要有傅里葉變換法(FFT)[6-7]、偽極數傅里葉變換法(Pseudo Polar FFT,PPFFT)[8-10]等。空域法主要有塊匹配法[11]、灰度投影法[12]及特征匹配法等[13]。相較于空域法,頻域法抗噪性強、不受亮度變化影響,且計算簡單,易于實現。在傳統(tǒng)的FFT法和PPFFT法實現過程中,坐標變換易產生較大的插值誤差,使配準精度降低。FFT法最高配準倍率較低,最高為2[7],而PPFTT法最高配準倍率雖可達4[9],但需經過多次迭代,計算效率則較低。顯然傳統(tǒng)方法在配準倍率和計算效率上難以兼?zhèn)洹?/p>
本文基于圖像的多分辨率頻譜疊加,提出一種改進方法,該方法無需迭代,且能實現大倍率圖像的配準。
一般地,圖像信噪比(Signal Noise Ratio, SNR)是針對單幅圖像質量而言,表達為圖像信號與噪聲的功率譜之比,又可近似等于峰值信噪比10×lg(2552/MSE)。但在基于頻域法的圖像配準中,兩種圖像能否準確配準,則取決于其互功率譜的傅里葉反變換圖像的最大值位置是否準確。文獻[9]給出了配準信噪比的定義:
并證明該式滿足:
顯然,正常情況下,配準信噪比最大值處對應正確的配準參數。但當噪聲強于信號時,則會產生誤匹配,因此區(qū)分噪聲種類,并予以去除或減弱,尤為重要。
式(2)表明,SNR越大,配準信噪比越高。而SNR又與噪聲功率成反比,因此,最大限度降低圖像經縮放、旋轉及配準過程中插值等產生的頻譜噪聲,能提高圖像配準精度。
一般,圖像噪聲可分為以下3種。
1)旋轉混疊
圖像經旋轉后,其離散傅里葉變換將產生多處疊加現象。這是因為圖像不是無限周期延伸的,尤其當圖像采樣頻率小于2倍頻譜截止頻率時。該噪聲主要表現為頻譜的高頻部分,文獻[14]提出采用窗口函數來消除該噪聲,但同時也會削弱真實信號能量。
2)倍率混疊
當圖像被放大某一倍率時,其頻譜也被相應放大,單周期內的頻譜高頻部分與相鄰周期的頻譜可能產生重疊,從而產生倍率混疊噪聲。通常這種噪聲可通過低通濾波減弱,但對于大倍率圖像,因濾波帶寬難以估計,濾波函數往往會淹沒真正的圖像信息。
3)插值誤差
插值誤差是指圖像頻譜從笛卡爾坐標或偽極坐標變換至對數極坐標時,因插值計算產生的誤差噪聲。
上述誤差中,旋轉和混疊噪聲,隨角度和縮放倍率變化,難以通過固定窗口的加窗函數和固定帶寬的濾波函數進行消除,而插值誤差噪聲,則可通過改進插值方法予以降低。
以下將重點圍繞如何降低插值噪聲,研究對數極坐標下非均勻網格的特點,設計多分辨率傅里葉變換的分段插值,來提高配準精度。
改進方法按多頻譜網格的構建、多重參數設置及改進算法流程逐一介紹。
1)對數極坐標網格特點
頻域法進行圖像配準時,是對兩幅圖對數極坐標下的幅度譜進行比較。圖1示出極坐標和對數極坐標網格。顯然,極坐標網格沿徑向均勻分布,而對數極坐標網格則是沿徑向由密至疏非均勻分布。將圖1橫縱坐標替換為徑長和角度,則如圖2所示。圖2更直觀顯示出縱坐標方向網格的非均勻分布情況。傳統(tǒng)的FFT和PPFFT法,都是基于均勻網格,而后插值出對數極坐標網格。從圖2看出,在徑長較大處時,由于均勻網格間隔與對數極坐標網格相當或更小,插值誤差將較小,而在徑長較小處時,均勻網格則明顯大于對數極坐標網格間隔,此時,插值結果將會產生較大誤差,影響匹配結果。
圖1 笛卡爾坐標下均勻極坐標網格和對數極坐標網格比較
圖2 均勻極坐標網格和對數極坐標網格比較
2)構建過程
根據以上分析,考慮構造一種類似圖2(b)的網格,使其更接近對數極坐標網格。
離散傅里葉變換(DFT)有如下表達形式:
圖3 多分辨率網格疊加示意圖
另外式(4)還可以通過分數傅里葉變換得到:
0≤<,=1/
考慮到頻譜集需要疊加,為便于對中,將頻域變量范圍定義為關于原點對稱,則有-p≤≤p,于是式(4)變?yōu)椋?/p>
0≤<,-(/2)≤¢</2
同樣,將式(5)對中,可變?yōu)椋?/p>
0≤<,-(/2)≤¢</2,=1/
比較式(6)和(7)可知,二者得到的頻譜范圍-p≤≤p和-p≤≤p,即前者得到的頻譜矩陣規(guī)模更大,而后者僅與原頻譜相當。事實上,當進行多分辨率頻譜疊加時,若將由式(6)得到的各頻譜矩陣全部疊加,其本質相當于取最大分辨率值(即為最大)的頻譜,且計算量極大,失去了疊加的意義。因此應對式(6)得到的全頻域頻譜進行截取,得到與原圖像尺寸相當規(guī)模的頻譜矩陣。而式(7)無需截取可即得到所需規(guī)模的矩陣。從計算量來看,式(6)的運算量為10×(),而式(7)則只需30×(),因此,用分數傅里葉變換更快捷。
如上所述,通過設置多重頻譜并疊加,能使疊加后的頻譜更接近實際頻譜。其中,各頻譜的分辨率(即細化參數)的選取設置是關鍵。在確定參數設置之前,先分析一下頻譜插值誤差及網格插值誤差。
1)一階頻譜插值誤差函數
對于某頻譜為的圖像,定義一階插值誤差[9]為:
式中:grid(r,)為實際頻域點與網格中最近點距離,表示為:
2grid(r,)=(closet-real)2+(closet-real)2(9)
2)頻譜參數計算
建立200×200的二重均勻網格和對數極坐標網格,并計算error。誤差曲線和誤差曲面如圖4、圖5所示。
表1反映出,傳統(tǒng)的笛卡爾及偽極坐標網格都為均勻網格,與極坐標網格插值比較看,偽極坐標明顯優(yōu)于笛卡爾坐標網,同時也優(yōu)于多重頻譜網,但與對極數坐標網的插值誤差則明顯增大,而多重網格疊加的優(yōu)勢則比較明顯,隨著網格層數的增加,其插值誤差明顯減小,當達到五重網格疊加時,插值誤差可達到傳統(tǒng)笛卡爾及偽極坐標網的1/3和1/2左右。從多重網格參數比較看,優(yōu)化后的參數較隨機選取的參數能得到更小的插值誤差。同時,注意到多重網格同一參數下p較lp更大,這時因為對數極坐標網大部分點聚集在內層高分辨網格,插值誤差更低,而極坐標網格外層低分辨網格內插值點較多,因此,各點插值誤差求和后,仍可能使二者相差相大。綜合來看,可以得到如下結論:多重網格疊加能明顯改善插值精度,當網格層數超過2時,與對數極坐標網格插值誤差大大低于偽極坐標網格;多重網格插值精度隨網格層數增加而增高;多重網格采用優(yōu)化參數較非優(yōu)化參數具有更高的精度。
圖4 二重頻譜參數曲線
圖5 三重頻譜參數曲面
表1 各類網格插值誤差比較
綜上所述,采用多重網格能明顯改善與對數極坐標網格的插值精度,因此,基于傅里葉變換,采用多重頻譜疊加,可以得到改進算法。具體實現步驟如圖6所示。
圖6 改進算法流程圖
Fig 6. Improvedalgorithm flow chart
采用改進方法與FFT、PPFFT法進行圖像配準,分別測試同一圖像不同放大倍率下的配準情況,如圖7所示,所用圖像均未經裁剪。實驗平臺為CPU intelE31230雙核3.2G,內存4G的PC機,編程軟件為Matlab,測試圖像分辨率均為256×256。
圖7 各倍率配準圖
從表2結果看,前3組放大倍率在5以上的圖像樣本,FFT和PPFFT法均無法配準,而改進法則能準確匹配。而放大倍率為2的圖像樣本,用3種方法均可正常匹配,這與文獻[7]、[9]闡述一致。由此可見,改進法對于無裁剪圖像可配準恢復的最大倍率約為10,且無需迭代,計算效率更高。同時改時法疊加層數在3~4層時,精度變化已經很小。通常采用改進法層數設置為3~4即可。
圖像經放大后,在相同分辨率下,超出部分會被裁剪,這就造成圖片信息的丟失。換言之,同一幅圖片,在經過放大剪切處理后,其有效頻域范圍變窄,干擾頻率增加,增大了配準難度。
分別選用不同類型圖片進行配準比較。實驗選用圖片來自加州大學USC圖像庫,從中選出如圖8所示的具有代表性圖片,上述圖片中包含了頭像、建筑、風景、重復紋理、航拍全景等風格。配準分裁剪和未裁剪兩種情形。裁剪情形,設定放大倍率為5,旋轉角為20°;未裁剪情形,設定放大倍率為10,旋轉角為20°。分別采用FFT、PPFFT、改進法及特征點匹配法進行比較。其中,為保證較高精度,改進法設置為4層,特征點匹配法采用魯棒性和精度較好的SURF算法[13]。
表2 各圖配準結果
表3顯示出,對于放大倍率為5,有裁剪圖像樣本,改進法能準確配準;FFT和PPFFT均不能正確匹配;SURF法僅對4幅圖能準確匹配,成功率較低。表4顯示出,對于倍率為0.1,無裁剪情形,改進法能準確匹配;其他方法均無法正確匹配。另外,通過對USC圖像庫中樣本大量計算表明,改進法的圖像配準倍率范圍約為0.1~5。
通過配準后,將圖像拼接,進一步驗證改進算法的有效性。圖9(b)和圖9(c)分別為圖9(a)局部的不同倍率、角度、平移后的圖像。分別采用改進法、PPFFT法和SURF法進行配準比較。
改進法配準后拼接效果如圖9(d)所示,各算法計算結果比較如表5所示。
圖8 圖像樣本集合
表3 裁剪后各圖不同方法下配準結果比較
表4 未裁剪各圖不同方法下配準結果比較
圖9 配準拼接圖
表5 改進法與PPFFT、USRF法配準參數比較
圖9(d)顯示出改進法對各圖配準后,均能恢復到原圖中正確的位置,圖中在配準位置存在部分細長的白色邊緣線,說明配準后的(,)坐標參數存在較小的誤差。表5反映出改進法對圖9中兩個局部放大圖均能正確計算其參數,PPFFT法是均計算錯誤,無法配準。SURF法對于較小放大倍率局部圖9(b)可實現配準,但對倍率5.2的圖9(c)無法實現配準??梢?,改進法在大倍率圖像配準中優(yōu)于PPFFT法和傳統(tǒng)的特征點匹配法。
頻域法是圖像配準的重要方法,因其抗噪性強、不受圖像亮度變化影響、計算簡單而應用廣泛。針對現有頻域法FFT和PPFFT對于大倍率圖像配準精度和效率難以同時保證的問題,本文研究了一種基于多重頻譜疊加的頻域算法,立足于最大限度減小插值誤差噪聲,該算法通過多分辨率頻譜插值構造更接近對數極坐標網格,并給出了分辨率參數設置和算法流程。最后通過實驗進行驗證,結果表明:改進法對無裁減圖像最大配準倍率可至10,對裁減圖像可至5,而FFT和PPFFT(無迭代)對于兩種類型圖像都約為2;相對于特征點匹配法,改進法也適用于更大倍率的圖像配準。
[1] 王磊, 葛鏡, 熊曼子. 幀間預測編碼中的運動估計算法研究[J]. 計算機與數字工程, 2007, 35(12): 28-31.
[2] 鐘錦, 吳昊. 霧天視頻圖像增強與運動目標跟蹤模型及方法[J]. 計算機仿真, 2013, 30(8): 402-407.
[3] 徐端全, 朱光喜. 基于幀間預測的視頻水印算法[J]. 計算機工程與應用, 2008, 44(24): 22-24.
[4] 陳錢. 紅外圖像處理技術現狀及發(fā)展趨勢[J]. 紅外技術, 2013, 35(6): 311-318.
[5] 杜小平, 劉明, 夏魯瑞, 等. 基于光譜角累加的高光譜圖像異常檢測算法[J]. 中國光學, 2013, 6(3): 325-331.
[6] 周武, 胡躍明. 基于相位相關和重采樣的亞像素圖像配準算法[J]. 華南理工大學學報, 2010, 38(10): 68-73.
[7] Reddy B S, Chatterji B N. An FFT-based technique for translations, rotations and scale-invariant image registration[J].. 1996, 5(8): 1266-1271.
[8] 劉漢洲, 郭寶龍, 馮宗哲. 基于傅里葉變換的遙感圖像配準[J]. 光電子×激光, 2006, 17(11): 1393-1397.
[9] Keller Y, Averbuch A, Israeli M. Pseudopolar-based estimation of large translations, rotations and scalings in images[J]., 2005, 14(1): 12-22.
[10] Liu H, Guo B, Feng Z. Pseudo-Log-Polar Fourier Transform for Image Registraion[J]., 2006, 13(1): 17-20.
[11] 趙振民, 彭國華, 符立梅. 基于形狀模板的快速高精度可靠圖像匹配[J]. 計算機應用, 2010, 30(2): 441-444.
[12] 吳浩, 鄧宏彬, 何少陽. 基于分塊灰度投影的無人飛行器視頻穩(wěn)像方法[J]. 北京理工大學學報, 2013, 33(4): 385-389.
[13] 劉少鵬, 郎躍東, 丁祝順. 改進的SURF算法及其在目標跟蹤中的應用[J]. 傳感器與微系統(tǒng), 2012, 31(12):148-152.
[14] Harold S Stone, Bo Tao, Morgan. Analysis of image registration noise due to rotationally dependent alising. Commum[J].2003, 14(2):114-135.
A New Image Registration Method Based on Overlaying of Multiple Spectrums
ZHANG Yi-fei1,NIU Shou-Rui1,MA Na2,ZHANG Chang-quan1
(1. 63963,100072,; 2.,100049,)
Of frequency-domain method, registration accuracy and efficiency of FFT or PPFFT for large scale image is difficult to be obtained simultaneously. With this problem considered, a new registration method based on overlaying of multiple spectrums is proposed, which interpolates spectrums of multi resolution and generates the grid closest to log-polar, to minimize interpolation error noise. In addition, how to set resolution parameter and the algorithm flow is also explained. Finally, to validate the accuracy and feasibility of the algorithm, three examples were calculated through the new algorithm, and the result shows as followed: as for the image without cutting, the maximum registration scale of the improved method without iterations can reach 10, and as for the image with cutting, the same one can reach 5, while the FFT and PPFFT (non iterative) for the two kinds of image is about 2; compared with the feature point matching method, the improved method is also applied to image with larger scale.
multiple spectrum,large scale registration,log-polar ordinary,interpolation error
TP391.41
A
1001-8891(2015)05-0424-07
2014-11-02;
2015-01-18.
張軼飛(1980-),男,工程師,博士,主要研究圖像匹配、電子穩(wěn)像等。E-mail:flightzyf@126.com。
中國博士后科學基金,編號:2012T50870。