鄒雨彤,譚 毅,羅一涵
(1.中國科學院光束控制重點實驗室,四川成都 610209;2.中國科學院光電技術研究所,四川成都 610209;3.中國科學院大學光電學院,北京 100049)
在光學系統(tǒng)裝調(diào)完畢的運行過程中,常常由于氣壓、溫度、高度等變化而造成系統(tǒng)離焦[1],調(diào)焦系統(tǒng)應運而生。高精度的實時調(diào)焦系統(tǒng)是提高光學系統(tǒng)成像質量的有效保證,可靠的檢焦技術則是系統(tǒng)準確調(diào)焦的前提和關鍵。隨著現(xiàn)代光學系統(tǒng)的發(fā)展,光學成像系統(tǒng)逐漸趨于自動化和輕量化,對于檢焦系統(tǒng)的自動采集分析能力、實時性以及靈活性等要求都越來越高;光學成像系統(tǒng)的檢焦技術也從最初的預先標定法發(fā)展到光電自準直法,再到如今普遍采用的圖像檢焦方法[2-3],實時性、靈活性以及精度逐步提高[4]?;趫D像的檢焦方法擺脫了對輔助設施的依賴,方便靈活且具有較好的實時性,該方法直接對光電成像元件上的圖像進行像質分析,通過圖像的清晰度函數(shù)評價值來評判系統(tǒng)當前的對焦狀態(tài),從而指導調(diào)焦工作。而圖像清晰度評價函數(shù)的核心在于提取圖像中的灰度邊緣細節(jié)或高頻分量信息,以此來表征圖像的離焦程度。
空域類、頻域類、信息學類、統(tǒng)計學類清晰度評價函數(shù)是常用的4 類清晰度評價方法[5]。文獻[6]通過對各種梯度算子進行仿真比較,總結出各種算子的特性,其中Sobel 算子和Canny 算子的邊緣檢測效果較好,可探測到更多圖像細節(jié);文獻[7]通過對比標準差、梯度函數(shù)算子、直方圖統(tǒng)計等方法對紅外圖像的檢焦性能進行分析,發(fā)現(xiàn)灰度梯度函數(shù)具有較好的檢焦精度、實時性和適應性。多年來,科研人員針對圖像清晰度評價算子嘗試了各種改進,文獻[8]使用灰度差分算子并結合大步長粗尋與小步長精尋,成功減小了計算量,檢焦速度和精度由此得到提升。但是由于成像系統(tǒng)中的加性噪聲無法避免,以及受成像環(huán)境的照度影響,各種圖像清晰度評價函數(shù)仍然存在易受干擾的問題[9],因此基于圖像的檢焦清晰度評價函數(shù)在靈敏度和抗噪性能方面仍需提升。
文中首先對基于圖像的檢焦評價方法中各類清晰度評價函數(shù)進行了分析,在4 類基本清晰度評價方法里選擇了應用廣泛的基于空域的清晰度函數(shù)進行改進[10-11],以此為基礎對基于Sobel 算子的檢焦清晰度評價函數(shù)提出了改進,旨在提高檢焦系統(tǒng)中清晰度評價函數(shù)的靈敏度和穩(wěn)定性;然后進行了仿真實驗,對圖像清晰度評價曲線的單峰性、無偏性、抗噪性以及靈敏度[12]等性能進行了驗證。實驗結果表明,文中方法在系統(tǒng)輕度離焦時仍具有較高的靈敏度,并且擁有良好的抗噪性能,結果顯示在椒鹽噪聲和高斯噪聲的不同影響下,該方法的清晰度評價曲線都能保持較好的穩(wěn)定性。
檢焦系統(tǒng)的關鍵在于如何可靠地找到系統(tǒng)當前狀態(tài)與準確聚焦時的差距,基于圖像的檢焦方法則是以圖像清晰度評價曲線為判斷依據(jù),具體表現(xiàn)為對焦準確的清晰圖像包含更多細節(jié)信息,邊沿尖銳易于分辨,空域中的像素間灰度梯度對比更明顯,頻域中的高頻分量更多,對應的檢焦清晰度評價值更大;而離焦時的圖像像素邊沿模糊不清、不易區(qū)分,空域中的像素間特征值變化減弱,頻域中高頻分量減少,對應的清晰度評價結果相對較小。各類清晰度評價算法所采用的算子模板各有差異,但實質都在于加強待檢圖像像素間的灰度梯度或高頻信息分量[13],旨在建立具有單峰性、無偏性、穩(wěn)定性和良好靈敏度的評價函數(shù)曲線[12]。
常用的各種清晰度評價函數(shù)[14]包括梯度向量模函數(shù)、Roberts 函數(shù)[15]、Brenner 函數(shù)、TenenGrad 函數(shù)、Laplacian 函數(shù)、Varaince 方差函數(shù)、基于離散傅里葉變換(DFT)的圖像清晰度評價函數(shù)等。
其中,TenenGrad 函數(shù)運算速度快,得到的清晰度評價曲線光滑連續(xù),并且通過突出尖銳邊緣細節(jié)分量運算加強了梯度信息[10],得到了廣泛的應用。
該函數(shù)采用Sobel 算子[16],傳統(tǒng)Sobel 算子只有水平和豎直方向上的兩個算子模板,分別為:
將其分別與圖像像素點灰度值作卷積,可得到圖像像素點水平方向梯度和垂直方向梯度,該點處的像素灰度梯度可表示為:
圖像清晰度評價值可表示為:
其中,G()x,y>T時有效,T為預設閾值,通過閾值的設定,可以對噪聲產(chǎn)生一定的抑制作用。
良好的清晰度評價曲線應該近似于圖1 的表現(xiàn)形式,具有如下特性[12]:
圖1 理想清晰度評價曲線
1)單峰性:理想的對焦位置(曲線全局極值點)有且只有一個,且在峰值兩側保持單調(diào)性。
2)無偏性:在整個調(diào)焦過程中,由光學成像系統(tǒng)采集到一系列圖像得出的清晰度評價曲線的走勢必須符合成像面的實際狀態(tài)變化趨勢。
3)抗噪性好:當系統(tǒng)受到噪聲干擾時,清晰度評價曲線應當盡可能減小局部波動。
4)高靈敏度:當成像面相對于正焦位置僅發(fā)生輕微改變時,從清晰度評價曲線上依舊能明顯分辨出狀態(tài)變化。
為了進一步提高圖像清晰度評價曲線的靈敏度和穩(wěn)定性,文中針對1.1 節(jié)中的Sobel 算子從以下3 個方面提出改進:①考慮到像素間灰度梯度變化方向并不固定于某一特定方向,故此豐富梯度卷積算子模板,在原本僅有水平、豎直兩個方向的基礎上添加了斜向的6 個算子模板,使得灰度梯度評價信息更加全面;②根據(jù)人眼視覺特性,調(diào)整不同視覺方向上算子卷積的權重;③改變原本取固定參數(shù)閾值的方式,引入Donoho 閾值,以靈活適應不同特征的圖像。
首先將Sobel 算子僅有的兩個方向卷積算子模板進行擴展,保證像素灰度梯度評價信息更加全面,增加了6 個方向算子后,該卷積模板變?yōu)椋?/p>
再將其分別與像素點灰度值進行卷積:
人類視覺系統(tǒng)(Human Visual System,HVS)相關研究提出,人類視覺皮層上簡單細胞和復雜細胞的感受野對于一定方位上的刺激反應最強烈。人眼對于水平和豎直方向的刺激反應更敏感,而對于對角方向的刺激反饋較弱[17]。基于此特性將垂直和水平方向上的4 個卷積算子模板的權重設置為其他4 個方向上卷積算子模板的兩倍,得到:
由于基于Sobel 算子的Tenengrad 函數(shù)本身采用的是帶參數(shù)的閾值,實際上每幅圖像各自的特征信息差異巨大,使用含參閾值需要人為調(diào)整,缺乏靈活性并且可能引入最佳閾值選取誤差。文中改動了預設閾值,采用Donoho 經(jīng)典閾值,該方法由于1994 年提出,是一種基于小波變換的收縮閾值降噪方法[18]。該閾值為:
為了驗證文中檢焦清晰度評價函數(shù)的有效性,采用圓盤模型來模擬離焦點擴散函數(shù),依次用r=0.6~2.9(間隔0.1)和r=3.0~11.0(間隔2.0)的模糊半徑對cameraman 圖像進行離焦模糊。模擬從正焦到離焦的過程,得到編號從1 到30 的圖片序列,其中編號為1 的圖像是正焦面原圖。隨著編號的增加,圖像離焦程度逐漸增大。部分圖像序列如圖2 所示。
圖2 離焦圖像部分序列
分別用1.1 節(jié)中的各種傳統(tǒng)方法和文中方法對離焦圖像序列進行清晰度評價,并對評價結果作歸一化處理,最后得出的清晰度評價曲線如圖3 所示。
圖3 cameraman的清晰度評價曲線
在圖3 的檢焦清晰度評價曲線圖中,橫坐標為離焦圖像序列,縱坐標為每幅離焦圖像的歸一化清晰度評價值。
實驗結果顯示,在無噪聲的理想情況下,所有的清晰度評價曲線都能滿足單峰性,沒有出現(xiàn)局部最大值波動點,并保持了嚴格的無偏性;同時文中提出的方法靈敏度得到了提升,在曲線峰值附近(輕度離焦區(qū))斜率最大,更有利于區(qū)分微小離焦量,接下來進行抗噪性能討論。
經(jīng)過圖像校正和補償后,光學系統(tǒng)輸出圖像的主要噪聲有圖像采集時產(chǎn)生的椒鹽噪聲和阻性元器件內(nèi)部產(chǎn)生的高斯噪聲[19-22]。利用仿真軟件分別對原圖像加入密度為0.05 的椒鹽噪聲和方差為0.1 的高斯噪聲,并分別對添加了椒鹽噪聲和高斯噪聲的cameraman 離焦圖像序列進行評價,將所得清晰度評價值進行歸一化處理,含噪聲離焦圖像及對應清晰度評價曲線如圖4 所示。
圖4 含噪聲離焦圖像及其對應清晰度評價曲線
結果表明,文中提出的方法在椒鹽噪聲的影響下依舊保持良好的靈敏性,在添加高斯噪聲的情況下靈敏度有所降低;但在兩種噪聲的影響下依舊滿足良好的單峰性和無偏性,在DFT 評價函數(shù)和Laplace 函數(shù)表現(xiàn)出約1~5 個不等的異常波動點情況下,文中方法依舊未出現(xiàn)局部最大值波動點,具有良好的抗噪穩(wěn)定性能。
對3 組無噪聲離焦圖像進行定量的靈敏度評估,分別為cameraman 圖像組(人像)、eight 圖像組(圖像具有大面積背景特征)、testpat1(圖像為紋理特征圖樣)圖像組。靈敏度因子公式為[12]:
其中,F(xiàn)sen為靈敏度因子,Zmax為正焦處的橫坐標,ε是橫坐標的改變量,F(xiàn)max和F(Zmax+ε) 分別對應Zmax處和Zmax+ε處的清晰度評價值。
結果表明,相較于傳統(tǒng)方法,文中提出的基于改進Sobel算子的清晰度評價函數(shù)的平均靈敏度因子提升了約0.086~0.215;并且文中提出的方法在提高靈敏度的同時,在中度離焦區(qū)曲線變化明顯,保持著良好的檢焦評價能力,并且具有優(yōu)越的穩(wěn)定性,無局部最大值波動點。
為了驗證文中方法針對離焦系統(tǒng)所拍攝圖像的實際表現(xiàn),分別采集了一系列單一場景和復雜場景的真實離焦圖像,如圖5(a)、(b)所示,真實評價結果如圖5(c)、(d)所示。
圖5 真實離焦圖像及其清晰度評價曲線
結果表明,文中方法在實際場景中的表現(xiàn)嚴格滿足單峰性和無偏性要求,表現(xiàn)出最佳的靈敏度,未出現(xiàn)任何局部最大值波動點,在檢焦系統(tǒng)的精檢階段應用中可靠有效。
表1 各檢焦評價函數(shù)的靈敏度因子
文中在圖像檢焦清晰度評價方法的基礎上,通過對清晰度評價函數(shù)的Sobel 算子進行改進,提出了一種新的清晰度評價方法。實驗結果表明,相較于傳統(tǒng)的清晰度評價函數(shù),該方法的靈敏度和抗噪性得到了穩(wěn)定提升,可為光學成像系統(tǒng)的檢焦調(diào)焦過程提供方便有效的參考依據(jù),但是由于改進的方法計算量相對更大,未來在實時性方面還有待進一步優(yōu)化。