南京郵電大學通信與信息工程學院 鄧麗珍 朱 虎
“圖像與視頻處理”課程立體化教學研究
——以歸一化互相關圖像匹配為例
南京郵電大學通信與信息工程學院 鄧麗珍 朱 虎
【摘要】立體化教學逐漸成為高校工科專業(yè)教師教學的一種重要的教學方法,本文針對工科課程“圖像和視頻處理”的教學,提出了“實際意義和應用→定義→數(shù)學原理→編碼→三維效果演示”全方位立體化的教學模式,該模式把工科理論和數(shù)學依據(jù)以及編程實踐渾然天成般的融合在一起,從而全面提高學生的理論創(chuàng)新和實際動手能力。本文以圖像匹配里的歸一化互相關匹配為例,深入闡述了立體化教學模式實現(xiàn)的具體過程。
【關鍵詞】圖像和視頻處理;立體化教學;歸一化互相關;Matlab編程
圖像和視頻處理是信息技術中的一門新興學科,它在軍事、安保、醫(yī)學、遙感、氣象等領域得到了廣泛應用?!皥D像和視頻處理”課程是高等工科院校通信工程、電子信息工程、廣播電視工程和自動化等專業(yè)的一門重要專業(yè)課,是南京郵電大學廣播電視工程專業(yè)開設的本科生主干課程。該課程是圖像與廣播電視工程專業(yè)學生本科階段接觸的第一門專業(yè)基礎課程,向?qū)W生介紹了圖像與視頻處理方面的基礎知識。該課程主要將數(shù)字圖像、視頻等媒體信息的處理技術有機地融合在一起,揭示其內(nèi)在的聯(lián)系,以便讓學生在有限的學習時間內(nèi)掌握更系統(tǒng)、更全面的知識。
“圖像和視頻處理”課程是一門對數(shù)學推理能力和編程動手能力都要求比較高的課程。傳統(tǒng)的照本宣科式的教學方式,忽略了學生的理論聯(lián)系數(shù)學和實踐能力培養(yǎng),缺乏綜合應用能力的訓練,導致學生面對具體應用問題無從下手。為了加深學生對該課程理論的數(shù)學基礎的掌握和增強學生解決實際問題的能力,在教學內(nèi)容和教學方法上進行改革,在教學中引入立體教學法。通過工科的定義聯(lián)系數(shù)學原理在到編程實現(xiàn),最后到實驗結(jié)果立體顯示的方式,來鞏固所學理論知識,加深學生對抽象理論知識的理解和感性認識,同時更好地培養(yǎng)學生的理論功底和創(chuàng)新能力,進而達到學以致用的目的。
本文在結(jié)合了“圖像和視頻處理”課程中的具體內(nèi)容的基礎上,作者提出一種“圖像和視頻處理”課程教學中的立體化教學模式。該教學模式分為“實際意義和應用→定義→數(shù)學原理→編碼→三維效果演示”的五個教學環(huán)節(jié),五個環(huán)節(jié)環(huán)環(huán)相扣,相互依存,把工科定義和數(shù)學理論以及編程實踐渾然天成般的融合在一起。通過對實際意義和應用的講解提高學生學習的興趣,從而引出工科定義,通過分析其數(shù)學意義,提高學生對其理論的數(shù)學依據(jù)的理解,可以更好的激勵學生的創(chuàng)造性思維;然后,通過編程實驗和三維效果演示,使原本很抽象的內(nèi)容變得簡單生動。另外,為了滿足學生實踐的要求,可以布置課后編程作業(yè),這樣不但可以鞏固所學知識,還可提高學生的動手能力。
下面我們將以圖像和視頻處理里面的圖像匹配中的歸一化互相關為例,將介紹如何把枯燥無味的歸一化互相關匹配算法,轉(zhuǎn)化為實際意義和應用→定義→數(shù)學原理→編碼→三維效果演示的立體化教學方式。
圖像匹配是“圖像和視頻處理”課程中一節(jié)重要的內(nèi)容。圖像匹配技術在生活和工作中有著廣泛的應用,根據(jù)相關專家統(tǒng)計大約有40%的機器視覺應用中需要用到圖像匹配技術。圖像匹配技術有著極其廣泛的應用,從工業(yè)流水線的自動監(jiān)控到軍事上的目標檢測識別與跟蹤、從遙感中的資源分析到氣象中的氣象預報、從醫(yī)療中的醫(yī)療診斷到交通管理的智能交通、從文字識別到圖像數(shù)據(jù)庫檢索以及景物分析中的變化檢測等等,幾乎現(xiàn)代生活中的每一處都能見到圖像匹配技術。
所謂圖像匹配是指在一幅(或一批)圖像中尋找與給定目標圖像相似的圖像或者圖像區(qū)域(子圖像)的過程。通常將已知目標圖像稱為基準圖(或者模板圖),而將待搜索圖像中可能與它對應的子圖稱作該模板的待匹配的目標圖像。圖像匹配是在來自不同時間或者不同視角的同一場景的兩幅或多幅圖像之間尋找對應關系,基準圖可以比實時圖大也可以比實時圖小?;ハ嚓P匹配算法是一種最基本的灰度統(tǒng)計匹配方法,它要求參考圖像和待匹配圖像具有相似的灰度和尺度信息。歸一化互相關匹配算法是一種經(jīng)典的互相關的匹配算法,經(jīng)常寫為NCC(Normalized Cross Correlation)算法,其通過計算模板圖像和待匹配圖像的互相關系數(shù)值來確定匹配的相似程度,互相關系數(shù)最大時對應的搜索窗口的位置決定了模板圖像在待匹配圖像中的位置。NCC的相關矩陣公式定義為:
其中,h(x,y)和f(x,y)表示實時圖像H和模板圖像F在(x,y)位置像素點的灰度值。NCC算法具有很高的準確性和適應性。
通過觀察互相關匹配的公式,我們可以聯(lián)想到中學數(shù)學學過的柯西不等式:
把工科的理論聯(lián)系到學生所學的數(shù)學知識里面,有助于學生深化理解理論,為將來進行科研創(chuàng)新打下良好的基礎。這要求授課教師有著更強的責任心,而且需要扎實的理論功底和數(shù)學分析能力。
“圖像和視頻處理”課程所授內(nèi)容都可以通過計算機編程來進行試驗和測試,通過實驗的結(jié)果和效果,從而直觀的再現(xiàn)課程所講述的內(nèi)容,提高學生的學習興趣和建立學生動手創(chuàng)新的自信心。當然,這要求教師具備極強的編程能力和將理論與編程代碼相結(jié)合的解釋能力,現(xiàn)場講解編程思想和演示編程過程,不僅可以熏陶學生處理的思路和提高學生的編程技巧,而且可以很好的建立起學生發(fā)現(xiàn)問題解決問題的興趣和能力。
本文應用MATLAB R2014a影像處理工具箱中提供的相關函數(shù)和命令,對數(shù)字圖像進行互相關匹配去識別基準圖,其核心代碼和注釋如下:
scene = im2double(imread(‘1.jpg’));%讀取目標圖像并轉(zhuǎn)為雙精度浮點型
template = im2double(imread(‘1_template.jpg’));%讀取基準圖像并轉(zhuǎn)為雙精度浮點型
[template_height,template_width]=size(template);%輸出目標圖像大小
[scene_height,scene_width]=size(scene);%輸出基準圖像大小
for i=1:scene_height-template_height
for j=1:scene_width-template_width
temp_picture=imcrop(scene,[j,i,template_width-1,template_height-1]);
r(i,j)=corr2(temp_picture,template); %計算互相關系數(shù)
end
end
figure, surf(r), shading flat,hold on %畫出三維互相關系數(shù)的峰值圖像。
scene = im2double(imread(‘1.jpg’));%讀取目標圖像并轉(zhuǎn)為雙精度浮點型
[x,i]=max(r), [y,j]=max(max(r)),i=i(j); %找出相關系數(shù)的峰值的位置
plot(j:j+template_width,i,’r’);%畫紅色的匹配結(jié)果框
plot(j:j+template_width,i+template_height,'r');
plot(j,i:i+template_height,'r');
plot(j+template_width,i:i+template_height,'r');
figure,imshow(template,[]); %顯示匹配結(jié)果
課堂上通過運行代碼,用來演示利用互相關匹配算法的實現(xiàn)過程,具體的實驗結(jié)果見圖1。
圖1 互相關匹配算法實例
最后,讓學生課后思考和實驗習題;針對傳統(tǒng)的互相關匹配方法計算速度比較慢的缺點,采用什么方法可以提高算法的實時性,改進要有數(shù)學依據(jù)和實驗驗證。這樣,完成了學生可以在課堂上見到從實際意義和應用到定義,再到數(shù)學原理和編碼,和最后的三維效果演示的整個全方位的立體化教學過程,從而增加對理論認識的深度,掌握理論付諸于實踐的編程技術和實驗技巧,同時提供相應方法實現(xiàn)的源代碼供學生參考學習。再增加學生的課后實驗和擴展,這樣可以達到全方面的引導和提高學生的創(chuàng)新學習能力。
本文根據(jù)“圖像和視頻處理”課程的具體特點和特色,通過結(jié)合理論的數(shù)學依據(jù)和具體可見的編程演示實驗,提出了實際意義和應用→定義→數(shù)學原理→編碼→三維效果演示的立體化教學方式。這種教學方式即可以提高了學生的學習興趣和動手能力,而且能夠增強學生的數(shù)學分析能力和激發(fā)學生的理論創(chuàng)新能力。將圖像和視頻處理的專業(yè)知識和實際應用、數(shù)學以及編程實驗有機結(jié)合起來,使得學生可以即掌握圖像和視頻處理課程知識和相關技術,也提高了學生的專業(yè)素質(zhì)和創(chuàng)新能力。
參考文獻
[1]章毓晉.圖像工程(下)圖像處理[M].北京∶清華大學出版社,2006.3.
[2]岡薩雷斯著,阮秋琦譯.數(shù)字圖像處理(matlab 版)[M].北京∶電子工業(yè)出版社,2009.5.
[3]朱虎,盧官明,謝世朋.“數(shù)字電視原理”理論實踐一體化教學研究[J].電子世界,2014(13)∶54.
[4]梅中輝,李曉飛,圖像與視頻處理教學過程中的若干思考[J].科技資訊,2009(26)∶232.
基金項目:南京郵電大學教改基金(編號:JG00215JX66)。
作者簡介:
鄧麗珍(1985—),女,安徽宿州人,博士,講師,研究方向:信號處理與模式識別。