馬麗?侯強(qiáng)
摘要:培養(yǎng)本科生科研能力是社會(huì)發(fā)展對高校人才培養(yǎng)提出的必然要求。模式識別既有嚴(yán)密的理論基礎(chǔ),又有廣泛的實(shí)際應(yīng)用,是一個(gè)不斷發(fā)展的活躍領(lǐng)域,其作為高年級本科生課程,通過科學(xué)的教學(xué)設(shè)計(jì),適合用來培養(yǎng)學(xué)生的創(chuàng)新思維和科研能力。教學(xué)采用以實(shí)際模式識別科研任務(wù)為主線和以啟發(fā)科學(xué)思維為核心的教學(xué)方法,培養(yǎng)學(xué)生獨(dú)立分析問題、解決問題的能力,為以后進(jìn)行相關(guān)科學(xué)研究打下良好基礎(chǔ)。
關(guān)鍵詞:模式識別;本科教學(xué);科研能力
中圖分類號:G642.0 文獻(xiàn)標(biāo)識碼:A 文章編號:1007-0079(2014)36-0133-02
具備初步的科研工作能力是本科生重要的學(xué)業(yè)標(biāo)準(zhǔn),培養(yǎng)本科生科研能力是社會(huì)發(fā)展對高校人才培養(yǎng)提出的必然要求[1]。模式識別是一個(gè)既有著嚴(yán)密的理論基礎(chǔ),又有著廣泛的實(shí)際應(yīng)用的學(xué)科[2-4],并且模式識別的發(fā)展非常迅速,各種新思想新算法不斷涌現(xiàn),任何算法都不是完美的,都有很多工作可以繼續(xù),因此,模式識別課程可以很好的用來培養(yǎng)學(xué)生的科研能力和創(chuàng)新思維。針對培養(yǎng)學(xué)生科研能力的教學(xué)目標(biāo),本課程的教學(xué)重點(diǎn)是理論與實(shí)踐相結(jié)合,以具體科研任務(wù)貫穿整個(gè)教學(xué)過程,引導(dǎo)學(xué)生積極思考,啟發(fā)學(xué)生科學(xué)思維。
隨著模式識別學(xué)科的日益發(fā)展,模式識別的教學(xué)也從研究生教學(xué)逐漸延伸到本科教學(xué)[5]。對于培養(yǎng)高年級本科生科研能力這個(gè)目標(biāo),我們采取以下三種方法:一是授課方式選擇幾種經(jīng)典的模式識別算法來講,包括k均值聚類(k-means)算法;k近鄰(k-nearest-neighbor, kNN)、Bayes、和支持向量機(jī)(Support Vector Machine, SVM)三種有監(jiān)督分類算法;主成分分析(Principle Component Analysis, PCA)和線性判別分析(Linear Discriminant Analysis, LDA)兩種特征提取算法。這幾種經(jīng)典的算法,能夠很好的代表模式識別這門課程。掌握好這些算法,就可以較快較好的適應(yīng)模式識別相關(guān)課題的研究。二是采用以實(shí)際模式識別科研任務(wù)為主線的教學(xué)方法,學(xué)生帶著具體的科研任務(wù)聽課,更容易理解復(fù)雜算法,提高聽課效率;實(shí)踐環(huán)節(jié)也都圍繞同一個(gè)科研任務(wù),便于前后關(guān)聯(lián),比較不同算法。通過獨(dú)立完成科研任務(wù),學(xué)生的文獻(xiàn)閱讀能力,編程能力,分析問題、解決問題的能力,都可以得到鍛煉和提高。三是注重引導(dǎo)學(xué)生積極思考,培養(yǎng)學(xué)生的創(chuàng)新思維,將知識灌輸為主的教學(xué)方法轉(zhuǎn)變?yōu)橐詥l(fā)科學(xué)思維為核心的教學(xué)方法。在授課和實(shí)驗(yàn)過程中,有意識的提出科學(xué)問題,先給出幾種可能的解決方案,擴(kuò)展思路,然后引導(dǎo)學(xué)生自己思考解決方法,培養(yǎng)學(xué)生獨(dú)立思考的意識,克服人云亦云的傾向。
一、模式識別教學(xué)內(nèi)容
模式識別作為高年級選修課,我們安排16學(xué)時(shí)上課時(shí)間,以及16學(xué)時(shí)上機(jī)時(shí)間,給學(xué)生留出充分的自主完成科研任務(wù)的時(shí)間。模式識別主要討論的問題是分類和特征提取,其中分類主要包括無監(jiān)督分類和有監(jiān)督分類,特征提取也有無監(jiān)督和有監(jiān)督之分。所以,對于每一個(gè)關(guān)鍵問題,我們都選擇最經(jīng)典的算法來講授:對于無監(jiān)督分類,選擇k-means算法;對于有監(jiān)督分類,選擇Bayes分類器,kNN分類器,以及SVM分類器;對于無監(jiān)督特征提取,選擇PCA算法;對于有監(jiān)督特征提取,選擇LDA算法。另外,課程最初4個(gè)學(xué)時(shí),用來介紹模式識別基礎(chǔ)概念,講授相關(guān)的數(shù)學(xué)基礎(chǔ),以及介紹具體的模式識別科研任務(wù),即遙感圖像分類,講解遙感圖像的數(shù)據(jù)特點(diǎn)。
對于16學(xué)時(shí)上機(jī)實(shí)驗(yàn)安排,我們圍繞遙感圖像分類任務(wù),布置四次作業(yè),第一次實(shí)驗(yàn)是認(rèn)識遙感圖像,學(xué)會(huì)使用ENVI軟件。第二次實(shí)驗(yàn)是使用MATLAB實(shí)現(xiàn)k-means算法對遙感圖像進(jìn)行聚類,重點(diǎn)分析初始類心的選擇,迭代終止條件,相似性度量方法的選擇等關(guān)鍵問題。第三次實(shí)驗(yàn)是使用MATLAB實(shí)現(xiàn)kNN分類,分析參數(shù)k的選擇以及相似性度量方法的選擇。第四次是實(shí)現(xiàn)PCA或LDA降維,并對降維數(shù)據(jù)采用kNN分類,然后與第三次實(shí)驗(yàn)結(jié)果做比較分析。四次上機(jī)實(shí)驗(yàn),都針對遙感圖像分類這一科研任務(wù),既可以采用最基本算法,又有很大的算法改進(jìn)空間,適合不同層次學(xué)生的科研能力的培養(yǎng)。
二、以實(shí)際模式識別科研任務(wù)為主線的教學(xué)方法
模式識別是一門實(shí)用性很強(qiáng)的課程,每種算法都有很好的應(yīng)用實(shí)例,我們以具體的科研任務(wù)貫穿整個(gè)教學(xué)過程??蒲腥蝿?wù)選擇為“遙感圖像分類”,目標(biāo)是獲得好的圖像分類精度。這個(gè)課題可以采用簡單的模式識別分類算法完成,但是分類精度可能不高,所以學(xué)生可以通過文獻(xiàn)閱讀、實(shí)驗(yàn)仿真等方式尋找提高圖像分類精度的方法,這個(gè)科研任務(wù)既易于著手,又有很大的發(fā)揮空間。
1.授課環(huán)節(jié)
我們把具體科研任務(wù)“遙感圖像分類”貫穿在整個(gè)授課環(huán)節(jié),這樣學(xué)生更容易理解復(fù)雜的公式和算法。每次授課,首先重復(fù)并明確科研任務(wù),然后講解本次課所講授算法對完成科研任務(wù)所起到的作用,并對于每一個(gè)抽象的公式,結(jié)合科研任務(wù)中的具體實(shí)例進(jìn)行講解。例如Bayes分類器,對于公式中先驗(yàn)概率的計(jì)算,假設(shè)遙感圖像只包含兩類地物,分別是水和草地,其中水域占圖像場景的70%,草地占圖像的30%,那么先驗(yàn)概率就是地物存在的比例,所以水存在的先驗(yàn)概率為0.7,草地存在的先驗(yàn)概率為0.3。Bayes公式的概率表達(dá)很抽象,但結(jié)合遙感圖像分類任務(wù),講解公式中每一項(xiàng)如何求解,學(xué)生就能較容易理解并學(xué)會(huì)使用該公式。以具體科研任務(wù)為主線,所講解算法不會(huì)停留在抽象的公式層面上,而是看到公式,就可以通過實(shí)例來把握公式中每一項(xiàng)的物理含義。
2.實(shí)踐環(huán)節(jié)
實(shí)踐環(huán)節(jié)對于培養(yǎng)學(xué)生科研能力非常重要,通過實(shí)驗(yàn),學(xué)生可以更深刻的理解算法,并進(jìn)行思考和探索,以解決實(shí)驗(yàn)中出現(xiàn)的問題,更好的完成科研任務(wù)。四次上機(jī)任務(wù)全部圍繞“遙感圖像分類”,互相關(guān)聯(lián),逐步深入。第一次上機(jī)采用ENVI軟件中已有算法進(jìn)行分類,對不同算法的分類效果有直觀認(rèn)識和性能比較,后面上機(jī)任務(wù)就是自己用MATLAB編程來實(shí)現(xiàn)這些算法(不是直接調(diào)用MATLAB工具箱函數(shù)直接實(shí)現(xiàn)[6])。第二次和第三次分別對遙感圖像進(jìn)行k-means聚類和kNN分類,通過這兩次實(shí)驗(yàn),學(xué)生可以體會(huì)有監(jiān)督分類算法的分類效果優(yōu)于無監(jiān)督分類算法,認(rèn)識到訓(xùn)練樣本的重要性。第四次進(jìn)行PCA或者LDA降維,可以體會(huì)降維對于分類的作用,并且,通過PCA和LDA的比較,可以認(rèn)識到,一般情況下,有監(jiān)督的降維算法得到的降維數(shù)據(jù),相比較無監(jiān)督算法得到的降維數(shù)據(jù),具有更好的可分性能。四次上機(jī),面向同一個(gè)任務(wù),能夠更好的理解和比較不同算法的作用和性能。并且,實(shí)驗(yàn)中我們要求學(xué)生對算法參數(shù)進(jìn)行分析,以更深刻理解算法對于參數(shù)的敏感性,學(xué)生在這個(gè)過程中可以學(xué)習(xí)到該如何全面的評價(jià)一個(gè)算法,這些都是進(jìn)行科學(xué)研究的必要環(huán)節(jié)。
三、以啟發(fā)創(chuàng)新思維為核心的教學(xué)方法
我們將創(chuàng)新思想有意識的貫穿于教學(xué)過程始終,引導(dǎo)學(xué)生積極思考,培養(yǎng)學(xué)生發(fā)現(xiàn)問題,思考問題,解決問題,并提出新思想,新方法的能力。對學(xué)生創(chuàng)新思維的培養(yǎng)體現(xiàn)在以下幾個(gè)方面。
1.對已有科研成果的學(xué)習(xí)和評價(jià)
閱讀文獻(xiàn)是科學(xué)研究的重要環(huán)節(jié),這個(gè)過程是一個(gè)學(xué)習(xí)、積累、思考、創(chuàng)新的過程。我們要求學(xué)生自己檢索并閱讀文獻(xiàn)(包含一篇英文文獻(xiàn)),在閱讀過程中思考:每篇論文主要使用什么算法實(shí)現(xiàn)什么任務(wù)?論文有沒有對算法做出改進(jìn)(為什么改進(jìn),原算法存在什么問題,改進(jìn)方法是什么)?論文中做了什么對比試驗(yàn),實(shí)驗(yàn)結(jié)論是什么?論文還存在什么問題或者缺點(diǎn)?論文所作出的改進(jìn)策略是否好?你自己對算法有沒有什么改進(jìn)的想法?通過這樣的思考,可以有效引導(dǎo)學(xué)生對已有科研成果進(jìn)行學(xué)習(xí)和評價(jià),并在這個(gè)過程中提出自己的想法,培養(yǎng)創(chuàng)新思維。
2.改進(jìn)型創(chuàng)新思維的培養(yǎng)
對已有方法存在的問題進(jìn)行改進(jìn),以提高算法性能,屬于改進(jìn)型創(chuàng)新。在模式識別領(lǐng)域,任何方法都不是完美的,授課過程中要引導(dǎo)學(xué)生思考影響算法性能的因素有哪些,算法可以從哪些方面進(jìn)行改進(jìn)?例如k-means聚類算法,第一步是隨機(jī)選擇K個(gè)類心,第二步是最小距離分類,第三步是判斷算法是否收斂。對于這個(gè)算法,引導(dǎo)大家思考,每一步存在什么問題?對于第一步,隨機(jī)選擇初始類心,那么隨機(jī)選擇是否會(huì)得到不同的聚類結(jié)果?算法的穩(wěn)定性是否受到影響?有什么方法可以得到更好的初始類心?對于第二步,主要采用最小距離分類,那么距離度量方法如何選擇?第三步對于收斂的判斷,采用什么準(zhǔn)則更好?這些都是算法存在的問題,在這些方面都可以對k-means算法進(jìn)行改進(jìn)。這個(gè)過程,重點(diǎn)引導(dǎo)學(xué)生如何提出問題,并從哪些方向可以分析和解決問題。
3.結(jié)合型創(chuàng)新思維的培養(yǎng)
將兩種或者多種方法結(jié)合起來,以達(dá)到更好的分析精度,屬于結(jié)合型創(chuàng)新。在第四次實(shí)驗(yàn)中,先對數(shù)據(jù)進(jìn)行PCA或者LDA降維,然后對降維數(shù)據(jù)進(jìn)行kNN分類,這就是降維算法和分類算法的結(jié)合。與第三次實(shí)驗(yàn)結(jié)果進(jìn)行比較,學(xué)生可以體會(huì)到無監(jiān)督的PCA算法和kNN算法結(jié)合,無法提高分類精度,而有監(jiān)督的LDA算法和kNN算法結(jié)合,就可以提高分類精度。通過實(shí)際訓(xùn)練,培養(yǎng)學(xué)生多種方法相結(jié)合的創(chuàng)新思維。這種創(chuàng)新思維的建立,需要有較為完備的理論基礎(chǔ),是本科生所缺乏的,所以要鼓勵(lì)學(xué)生多學(xué)習(xí)新方法,并多閱讀文獻(xiàn),學(xué)習(xí)尋找算法結(jié)合點(diǎn)。
4.應(yīng)用型創(chuàng)新思維的培養(yǎng)
將一個(gè)領(lǐng)域的已有知識和方法有效的應(yīng)用到另外一個(gè)領(lǐng)域,屬于應(yīng)用型創(chuàng)新,是比較難的創(chuàng)新,需要對兩個(gè)領(lǐng)域的知識都有好的掌握。模式識別課程中有較多這樣的成功實(shí)例,例如Bayes分類器,就是概率論中學(xué)習(xí)過的Bayes公式,引導(dǎo)學(xué)生思考,算法是如何建立橋梁,將公式中每一項(xiàng)賦予特定的物理意義,并將公式應(yīng)用到遙感圖像分類中的。對于培養(yǎng)本科生的應(yīng)用型創(chuàng)新思維,要多分析實(shí)例,在實(shí)例中帶領(lǐng)學(xué)生積極思考。
四、結(jié)語
模式識別是一門理論性和實(shí)用性都很強(qiáng)的課程,作為一門高年級本科課程,我們以培養(yǎng)學(xué)生的科研能力為目標(biāo),采用理論與實(shí)踐相結(jié)合,以具體模式識別科研任務(wù)貫穿整個(gè)教學(xué)過程,并以啟發(fā)科學(xué)思維為核心的教學(xué)方法,提高學(xué)生的科研能力和創(chuàng)新能力。實(shí)踐證明,學(xué)生在學(xué)習(xí)過程中,改變了問題具有唯一正確答案的思維模式,積極思考各種解決問題的方法,體會(huì)到了科研的樂趣,提高了獨(dú)立分析問題、解決問題的能力。
參考文獻(xiàn):
[1]姜長寶.本科生科研能力培養(yǎng)的途徑與方法探討[J].科技管理研究,2010,(8):152-154.
[2]孫即祥.現(xiàn)代模式識別[M].第二版.北京:高等教育出版社,
2008.
[3]邊肇祺,張學(xué)工.模式識別[M].第二版.北京:清華大學(xué)出版社,
2001.
[4]楊淑瑩.模式識別與智能計(jì)算:Matlab技術(shù)實(shí)現(xiàn)[M].第二版.北京:電子工業(yè)出版社,2011.
[5]戚玉濤,劉芳,焦李成.模式識別教學(xué)實(shí)踐與課程改革[J].計(jì)算機(jī)教育,2010,(19):24-26.
[6]楊勃,歐陽竟成,潘理.Matlab在“模式識別”課程教學(xué)中的應(yīng)用研究[J].中國電力教育,2012,(34):63-64.
(責(zé)任編輯:劉麗娜)