李昆侖 蘭長(zhǎng)明
摘要:該文研究了幾種解決大型規(guī)劃問題的常用方法以及采用支持向量機(jī)進(jìn)行多分類的方法;并在此基礎(chǔ)上提出使用決策二叉樹的方法來(lái)實(shí)現(xiàn)人臉圖像質(zhì)量的分類?;谥Ц断蛄繖C(jī)的人臉圖像質(zhì)量分類算法,對(duì)于無(wú)參考圖像質(zhì)量評(píng)價(jià)具有很好的指導(dǎo)意義,也為今后的研究打下了良好的基礎(chǔ)。
關(guān)鍵詞:支持向量機(jī);多分類;二叉樹;人臉圖像
中圖分類號(hào):TP391 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2015)06-0175-02
Research of Face Image Quality Classification Algorithm Based on Support Vector Machine
LI Kun-Lun, LAN Chang-Ming
(Science and Technology College of NanChang University, Nanchang 330029, China)
Abstract:This paper analyzes several common methods to solve the problem of large scale planning and support vector machine. Based on this, we propose a method to realize the classification of face image quality using by two fork trees. This method that used for face image quality classification has a good guide on the no reference image quality assessment, at the same time, which also lays a good foundation for further research.
Key words:support vector machine; multi classification; two fork tree; face image
人臉圖像質(zhì)量分類是近幾年剛興起的研究領(lǐng)域,該領(lǐng)域的研究成果相對(duì)來(lái)說還比較有限。但對(duì)人臉圖像質(zhì)量分類的研究具有重大意義:首先,人臉圖像質(zhì)量分類對(duì)一些人臉識(shí)別相關(guān)領(lǐng)域的研究起到基礎(chǔ)性的作用,比如在某些人臉圖像識(shí)別系統(tǒng)中,如果輸?shù)娜四槇D像質(zhì)量較好,將能提高系統(tǒng)的人臉識(shí)別性能[1]。其次,目前都是采用人工方式來(lái)檢查各種證件照中的人臉圖像質(zhì)量,人工檢查時(shí)往往帶有較多主觀性,且率不高,不能在實(shí)時(shí)場(chǎng)所的應(yīng)用。如果可以將人臉圖像質(zhì)量的實(shí)時(shí)分類融入到某些人臉圖像的采集系統(tǒng)中,就能實(shí)現(xiàn)在采集人臉圖像時(shí)對(duì)圖像質(zhì)量進(jìn)行實(shí)時(shí)的監(jiān)控,從而提高圖像識(shí)別系統(tǒng)的效率,間接地降低系統(tǒng)的成本[2]。另外,人臉圖像質(zhì)量分類涉及人眼視覺識(shí)別系統(tǒng),目前這方面的研究還比較少,如果能從人臉圖像質(zhì)量分類的研究中尋求相應(yīng)人眼視覺機(jī)制的原理,則對(duì)視覺領(lǐng)域的進(jìn)一步研究起到極大的促進(jìn)作用[3]。當(dāng)然,目前對(duì)圖像質(zhì)量分類的研究還處于原始階段,本文提出采用基于支持向量機(jī)的人臉圖像質(zhì)量分類算法,希望能夠?yàn)橐院笕四槇D像質(zhì)量評(píng)價(jià)系統(tǒng)的研究提供重要啟示。
1 支持向量機(jī)
支持向量機(jī)是一種典型的機(jī)器學(xué)習(xí)方法,該方法是在統(tǒng)計(jì)學(xué)習(xí)理論的基礎(chǔ)上發(fā)展起來(lái),具有較好的推廣性和較強(qiáng)的分類性能[4]。起初,支持向量機(jī)是為了兩類分類而設(shè)計(jì)的,隨著識(shí)別需求的發(fā)展,支持向量機(jī)的分類功能擴(kuò)展到多種類識(shí)別領(lǐng)域,目前,怎樣更有效的用支持向量機(jī)來(lái)解決多分類問題還是支持向量機(jī)的研究熱點(diǎn)[5]。
支持向量機(jī)的多分類問題可以用數(shù)學(xué)公式如下描述:
假設(shè)有訓(xùn)練集S,[S=(X1,y1),(X2,y2)...(Xn,yn)],其中,[Xn∈RM],[yn∈1,2...k]。怎樣計(jì)算[RM]上的決策函數(shù)[g(X):X=RM→yn]。
就目前來(lái)說,使用較多的基于支持向量機(jī)的多分類方法有以下幾種:一對(duì)一方法、一對(duì)多方法、導(dǎo)向非循環(huán)圖方法、決策樹方法等[6]。
1.1 一對(duì)一方法
這種方法指的是從支持向量機(jī)的總訓(xùn)練集[S]中任取兩類樣本點(diǎn)[Si]和[Sj],然后將選取的這兩類樣本點(diǎn)組成訓(xùn)練集[Sij],然后在此組合后的訓(xùn)練集上用支持向量機(jī)求解兩分類的問題。
這種方法需要構(gòu)造支持向量機(jī)分類器的數(shù)量為[k(k-1)2]。用分類器分別去測(cè)試某個(gè)測(cè)試樣本[X]屬于[k]類樣本中的第幾類,統(tǒng)計(jì)所有分類器對(duì)該樣本的分類結(jié)果。如果其中某個(gè)分類器判定測(cè)試樣本[X]屬于第[i]個(gè)類別,那么就將該類別的得票數(shù)加一。最后綜合統(tǒng)計(jì)各個(gè)測(cè)試樣本的得票情況,得到票數(shù)最高的那個(gè)類別就是測(cè)試樣本的最終劃定的類別。一對(duì)一方法有個(gè)明顯的缺陷,就是如果某個(gè)測(cè)試樣本存在多個(gè)類別得票相同的情況,也即是同時(shí)屬于多個(gè)類別的時(shí)候,可能將無(wú)法正確判定該樣本屬于哪個(gè)類別。另外就是該方法在分類過程中需要構(gòu)造較多數(shù)目的分類器,也使得在訓(xùn)練分類器的過程非常耗時(shí)。
1.2 一對(duì)多方法
該方法是先指定某個(gè)樣本為負(fù)類,其余樣本作為正類,然后去構(gòu)造一個(gè)兩類的支持向量機(jī)分類器。該方法在具體的應(yīng)用過程中需要構(gòu)造的分類器的個(gè)數(shù)為[k]。就一個(gè)3分類問題來(lái)說,如果將第一類樣本作為負(fù)類,其余樣本作為正類,構(gòu)造第一個(gè)決策函數(shù)[g1(X)];然后依次構(gòu)造出其余兩個(gè)決策函數(shù)[g2(X)]和[g3(X)]。在使用這些決策函數(shù)進(jìn)行類別判別時(shí),當(dāng)有一個(gè)而且只有一個(gè)決策函數(shù)的判別結(jié)果是負(fù)值,那么這個(gè)判別函數(shù)所得到的結(jié)果就是這個(gè)測(cè)試樣本所屬的分類。
和一對(duì)一方法相比,該種方法在應(yīng)用過程構(gòu)造分類器的數(shù)量明顯減少,所以在訓(xùn)練過程中其速度也相應(yīng)加快。但這種方法可能會(huì)存在某些測(cè)試樣本不屬于任何一種類別的情況。
1.3 決策導(dǎo)向非循環(huán)圖方法(Decision Directed Acyclic Graph, DDAG)
在訓(xùn)練階段該方法與一對(duì)一方法比較相似,訓(xùn)練過程中需要構(gòu)造[k(k-1)2]個(gè)分類器,但測(cè)試階段可以使用導(dǎo)向循環(huán)圖。該圖具有[k(k-1)2]內(nèi)部結(jié)點(diǎn),每個(gè)內(nèi)部結(jié)點(diǎn)即為一個(gè)兩類分類器,還具有[k]個(gè)葉子結(jié)點(diǎn),也即是最終的分類結(jié)果。在對(duì)導(dǎo)向循環(huán)圖進(jìn)行遍歷時(shí),先從根結(jié)點(diǎn)開始,根據(jù)根節(jié)點(diǎn)分類器的輸出結(jié)果來(lái)決定下一步是遍歷左側(cè)結(jié)點(diǎn)還是右側(cè)結(jié)點(diǎn),直至某個(gè)葉子節(jié)點(diǎn)結(jié)束,得到該樣本最終的分類結(jié)果。這種方法的主要優(yōu)勢(shì)就是在測(cè)試階段比上述的兩種方法都要快得多。
1.4 決策樹方法
該方法是用決策樹的形式來(lái)表示處理邏輯的一種方法。由于該方法能夠直觀地表述所需的邏輯要求,比較適用于邏輯關(guān)系簡(jiǎn)單和判斷條件少的情況[7]。傳統(tǒng)的支持向量機(jī)多用于兩分類情況,所以,也可以將決策樹方法與支持向量機(jī)方法相結(jié)合生成一種新的基于支持向量機(jī)的多分類方法。
假設(shè)要構(gòu)造一個(gè)[k]類樣本的二叉樹,其葉子結(jié)點(diǎn)分別對(duì)應(yīng)一種類別,非葉子結(jié)點(diǎn)(度數(shù)為2)對(duì)應(yīng)一個(gè)支持向量機(jī)分類器。整個(gè)決策二叉樹共有[k]個(gè)葉子節(jié)點(diǎn), [2k-1]個(gè)非葉子結(jié)點(diǎn),需要構(gòu)造的支持向量機(jī)兩類分類器的個(gè)數(shù)為[k-1]。
另外,由二叉樹的性質(zhì)知道想要構(gòu)造一棵有[k]個(gè)葉子結(jié)點(diǎn)的二叉樹,實(shí)際上可以有多種方案。下面以一個(gè)4分類問題為例,列舉構(gòu)造二叉樹的兩種方案。分別如圖1和圖2所示。
總結(jié)該方法具有兩大特點(diǎn):第一,由于決策樹具有層次結(jié)構(gòu),在每一層次上都可以采用不同的訓(xùn)練樣本來(lái)訓(xùn)練分類器,由于樣本的差異性,分類器的重要級(jí)別也有所差異;另外,由于測(cè)試階段也需按層次來(lái)完成測(cè)試,所以對(duì)測(cè)試樣本來(lái)說,用到的分類器數(shù)目可能介于1和決策樹的深度之間。
2 人臉圖像質(zhì)量分類算法實(shí)例分析
若采用決策樹的方式進(jìn)行人臉圖像質(zhì)量的多分類實(shí)驗(yàn),假設(shè)需要進(jìn)行分類的圖像質(zhì)量等級(jí)有5個(gè),那么則需構(gòu)造的4個(gè)支持向量機(jī)兩類分類器,在實(shí)際構(gòu)造時(shí)可以采用很多不同的組合方式,即能產(chǎn)生多種類型的決策二叉樹。五類人臉圖像質(zhì)量分類決策二叉樹模型如圖3所示。
圖3 五類人臉圖像質(zhì)量分類決策二叉樹模型
構(gòu)造人臉圖像質(zhì)量分類決策二叉樹的具體做法是:先將人臉圖像質(zhì)量為第一等級(jí)的樣本作為負(fù)類,其余的圖像樣本作為正類,通過訓(xùn)練得到第一個(gè)支持向量機(jī)分類器;然后,將人臉圖像質(zhì)量為第二等級(jí)的樣本作為負(fù)類,把剩下的圖像樣本作為正類,通過訓(xùn)練得到第二個(gè)支持向量機(jī)分類器;依次類推去構(gòu)造另外兩個(gè)支持向量機(jī)分類器。在對(duì)圖像樣本進(jìn)行測(cè)試時(shí),如果其被第一個(gè)分類器判為負(fù)類,那該樣本就屬于第一等級(jí),否則轉(zhuǎn)到第二個(gè)分類器上進(jìn)行判別,如果被判別為負(fù)類,則該樣本被認(rèn)定為第二等級(jí)。依此往下,直至進(jìn)行到二叉樹的某一葉子節(jié)點(diǎn)。
3 總結(jié)和展望
本文深入研究了支持向量算法的相關(guān)知識(shí),分析了幾種常用的支持向量機(jī)多分類方法;提出使用決策二叉樹的方式實(shí)現(xiàn)對(duì)人臉圖像質(zhì)量的多分類。無(wú)參考圖像質(zhì)量評(píng)價(jià)是近年來(lái)興起的比較前沿的研究方向,但整體來(lái)看視覺識(shí)別的研究目前還處于相當(dāng)有限的水平,所以該領(lǐng)域的突出成果相對(duì)還較少[8]。無(wú)參考人臉圖像質(zhì)量評(píng)價(jià)的研究還要繼續(xù)深入,本文以后的研究將圍繞以下方面來(lái)開展:嘗試將支持向量機(jī)算法和遺傳算法相融合,在訓(xùn)練過程中通過遺傳算法選取較優(yōu)的核函數(shù)參數(shù)。
參考文獻(xiàn):
[1] Hamid Rahim Sheikh, Alan C.bovik. Image Information and Visual Quality [J]. IEEE Transactions on Image Processing, 2006(15):430-444.
[2] 安平.基于線性SVM的級(jí)聯(lián)檢測(cè)器的構(gòu)造及其在目標(biāo)檢測(cè)中的應(yīng)用[D].長(zhǎng)沙:國(guó)防科學(xué)技術(shù)大學(xué),2007.
[3] Venkatesh R, Babu S. Sureshb, rew Perkis. No-reference JPEG-image quality assessment using GAP-RBF [J]. Signal Processing, 2007(12):1493-1503.
[4] Chih-Wei Hsu, Chih-Jen Lin. a comparison of methods for multi class support vector machines. IEEE Transactions on neural networks,2002,13(2):415-425.
[5] Platt J C, Cristianini N, Shawe-Taylor J. large margin dags for multiclass classification[J]. Advances in Neural Information Processing Systems. MIT Press,2000(12):547-553.
[6] Weston J, Watkins C. Multi-class support vector machines. M. Verleysen, editor, Proceedings of ESANN99, Brussels, 1999. D. Facto Press.
[7] Gastaldo P, Parodi G. No-Reference Quality Assessment of JPEG Images by Using CBP Neural Networks[C], International Symposium on Circuits and Systems, 2004(5):772-775.
[8] Huitao Luo. A training-based no-reference image quality assessment algorithm [C]. Singapore: International Conference on Image Processing, 2004(5):2973-2976.