摘要:判別函數(shù)法是找分界線的一種算法,其結(jié)果就是提供一個(gè)確定的分界線方程,這個(gè)方程就是判別函數(shù),因此判別函數(shù)描述了各類之間的分界線的具體形式。該文主要是基于判別函數(shù)模型,對圖像分類問題進(jìn)行了研究,通過實(shí)例說明分類方法的有效性和可行性。實(shí)驗(yàn)結(jié)果表明判別函數(shù)模型具有一定的實(shí)際應(yīng)用價(jià)值,在圖像分類問題上,判別函數(shù)方法性能良好,分類準(zhǔn)確和高效,最后利用利用MATLAB圖形用戶界面(GUI)方法,設(shè)計(jì)了良好的人機(jī)交互系統(tǒng)的主界面。
關(guān)鍵詞:判別函數(shù);圖像分類;MATLABGUI
中圖分類號:TP311 文獻(xiàn)標(biāo)識碼:A 文章編號:1009-3044(2012)33-8018-03
圖像分類本身是一個(gè)具有重要應(yīng)用價(jià)值的研究課題,它是分類問題的子問題,是圖像挖掘和分類挖掘技術(shù)的結(jié)合點(diǎn)。判別函數(shù)理論是處理不完備、不確定信息的一種有效的數(shù)學(xué)方法,將判別函數(shù)理論應(yīng)用于分類問題的研究是判別函數(shù)理論應(yīng)用研究的一個(gè)重要方向,該文正是嘗試將判別函數(shù)理論應(yīng)用于圖像分類研究之中,在此基礎(chǔ)上實(shí)現(xiàn)了對兩類圖像的分類器設(shè)計(jì)。
MATLAB是當(dāng)前最流行的、功能強(qiáng)大的高效率的數(shù)值計(jì)算的可視化科技應(yīng)用軟件和編程語言之一。其特有的圖形用戶界面開發(fā)環(huán)境(GraphicalUserInterfacesDevelopmenEnvronment,簡稱GUIDE)大大簡化了人機(jī)交互界面程序的開發(fā)過程。
1判別函數(shù)理論簡介
模式識別分類問題是提取待識別對象的某方面的特征,根據(jù)觀察值建立識別對象的訓(xùn)練集,訓(xùn)練集中樣本點(diǎn)的類別已知,基于這些條件建立適當(dāng)?shù)呐袆e函數(shù),并使用已有的樣本來估計(jì)判別函數(shù)的未知參數(shù),最后用判別函數(shù)對待測樣本的類別進(jìn)行判別。
1.1判別函數(shù)概念
由于一個(gè)模式通過某種變換映射為一個(gè)特征向量后,該特征向量可以理解為特征空間的一個(gè)點(diǎn),在特征空間中,屬于一個(gè)類的點(diǎn)集,總是在某種程度上與輸入另一個(gè)類的點(diǎn)的集合相分離,各個(gè)類之間確定可分離的。因此,如果能夠找到一個(gè)分離函數(shù)(線性或非線性函數(shù)),把不同類別的點(diǎn)集分開,則分類任務(wù)就解決了。判別函數(shù)法不依賴于條件概率密度的知識,可以理解為通過幾何方法,把特征向量分解為對應(yīng)于不同類別的子空間。而且呈線性的分離函數(shù),將使計(jì)算簡化。找分界線的方法就是判別函數(shù)法,判別函數(shù)法的結(jié)果就是要提供一個(gè)確定的分界線方程,這個(gè)分界線方程叫做判別函數(shù),因此判別函數(shù)描述了各類之間的分界線的具體形式。
1.2判別函數(shù)的類型
判別函數(shù)法按照分界函數(shù)的形式可以劃分為現(xiàn)行判別函數(shù)和非線性判別函數(shù)兩大類?,F(xiàn)行判別函數(shù)由于涉及的數(shù)學(xué)方法較為簡單,在計(jì)算機(jī)上容易實(shí)現(xiàn),故在模式識別中被廣泛應(yīng)用。但是在模式識別中僅僅有線性分類器是不夠的。在模式識別中的許多問題中,由于線性判別函數(shù)有其一定的局限性,它并不能提供理想的識別效果,必須借助于非線性的分類器。而且,有些較為簡單的非線性分類器,對于某些模式識別問題的解決,顯得簡單,效果又好。
1.3線性判別函數(shù)
模式識別中用以對模式進(jìn)行分類的一種最簡單的判別函數(shù)。在特征空間中,通過學(xué)習(xí),不同的類別可以得到不同的判別函數(shù),比較不同類別的判別函數(shù)值大小,就可以進(jìn)行分類。對于特征空間中的每個(gè)特征向量x,可以計(jì)算相應(yīng)于各個(gè)決策區(qū)的判別函數(shù)[gi(x),i=1,2,…,m],用判別函數(shù)進(jìn)行分類的方法就是:若對所有的i均有[gi(x)≥gj(x)],則把x分為第j類,記成r(x)=j(luò)。對于線性判別函數(shù),[gi(x)]的函數(shù)形式為
[gi(x)=wi0+wi1x1+wi2x2+…+widxd]
式中x1,x2,…,xd是輸入模式特征向量的各個(gè)分量,Wi0,Wi1,…,Wid組成與第i類對應(yīng)的權(quán)向量,它們的大小反映與它們對應(yīng)的特征向量的各個(gè)分量在確定第i類判別函數(shù)值的重要程度。
特征空間中分別與第i類、第j類相對應(yīng)的區(qū)域之間的決策邊界形式為
對于一個(gè)兩類分類器,可以計(jì)算g(x)=g2(x)-g1(x)。若g(x)≥0,則r(x)=2,相應(yīng)于決策區(qū)R2。若g(x)<0,則r(x)=1,相應(yīng)于決策區(qū)R1。這一結(jié)果可寫成
2圖像分類識別系統(tǒng)實(shí)現(xiàn)
2.1顏色空間與量化
顏色空間有很多類型,常見的有HSV顏色空間、RGB顏色空間等,其中HSV顏色空間更接近人的視覺特性,其中包括色調(diào)H(Hue)、飽和度S(Saturation)和亮度V(Value)。在以圖像內(nèi)容為條件的圖像識別中,HSV顏色空間比RGB顏色空間更適合辨別。根據(jù)人眼的識別能力,顏色大致分為9種:紅、黃、綠、青、藍(lán)、紫、黑、灰和白,根據(jù)這9種顏色基本可以描繪一幅圖像。因此,由這9種顏色可確定圖像的主顏色特征,其具體量化方法詳見參考文獻(xiàn)[5]。
2.2圖像分塊主色的實(shí)現(xiàn)
該文對識別圖像做4*4的劃分,得到16個(gè)子圖像。對每個(gè)子圖像進(jìn)行像素顏色統(tǒng)計(jì),取數(shù)值最高的顏色為主顏色,這樣就得到識別圖像對應(yīng)的16個(gè)主顏色特征向量。此種方法突出每個(gè)子圖像顏色的空間關(guān)系,適用于顏色特征固定的分類問題,但對顏色變化明顯的圖像效果一般。
2.3主要MATLAB程序
3圖形用戶界面
MATLAB的GUIDE功能提供了便捷的軟件界面設(shè)計(jì)工具箱,利用此工具箱可設(shè)計(jì)出形象直觀的人機(jī)交互界面。圖像識別系統(tǒng)界面主要內(nèi)容是各個(gè)空間的回調(diào)函數(shù),利用回調(diào)函數(shù)可執(zhí)行相應(yīng)控件的功能,下面以菜單“線性函數(shù)”下的“獎(jiǎng)懲算法”按鈕為例,給出其回調(diào)函數(shù)的Callback的語句
在MATLAB提示符下輸入系統(tǒng)名“PDHS”命令,啟動(dòng)如圖1所示的系統(tǒng)主界面,用戶可用其中的載入圖像按鈕載入待識別的圖像,在菜單項(xiàng)中選擇“線性函數(shù)”的“獎(jiǎng)懲算法”選項(xiàng)按鈕,系統(tǒng)就可顯示待識別圖像的類別,顏色矩陣,分類時(shí)間等信息。
4總結(jié)
該文介紹了利用MATLAB軟件開發(fā)基于判別函數(shù)的圖像分類系統(tǒng)的方法和步驟,選取了模式識別中常用的基于判別函數(shù)的算法,實(shí)現(xiàn)了對兩類圖像的分類問題。利用MATLAB圖形用戶界面(GUI)方法,設(shè)計(jì)了良好的人機(jī)交互系統(tǒng)的主界面,最后給出了實(shí)際例子的程序運(yùn)行結(jié)果,對推動(dòng)模式識別理論在圖像分類問題實(shí)踐中的應(yīng)用和普及,具有實(shí)際意義。軟件系統(tǒng)的性能還需要進(jìn)一步提高,進(jìn)一步工作包括增加聚類分析等算法,實(shí)現(xiàn)對三類及多類的圖像識別問題。
參考文獻(xiàn):
[1]楊淑瑩.模式識別與智能計(jì)算—MALAB技術(shù)實(shí)現(xiàn)[M].北京:電子工業(yè)出版社,2008:67-78.
[2]陳垚光,王玲.精通MATLABGUI設(shè)計(jì)[M].北京:電子工業(yè)出版社,2007:21-34.
[3]王家文.MATLAB7.6圖形圖像處理[M].北京:國防工業(yè)出版社,2008:78-100.
[4]余芳.基于顏色特征的圖像檢索技術(shù)研究[D].中國石油大學(xué),2007.
[5]徐擇峰,陳世鴻.一種統(tǒng)一的文本與圖像分類算法[J].武漢大學(xué)學(xué)報(bào):理學(xué)版,2004,50(1):79-82.