廖 亮, 楊程凱
(中原工學(xué)院 電子信息學(xué)院, 河南 鄭州 451191)
基于圖像邊緣位移的有監(jiān)督的稀疏表示分類(lèi)方法
廖 亮, 楊程凱
(中原工學(xué)院 電子信息學(xué)院, 河南 鄭州 451191)
稀疏表示分類(lèi)算法在有監(jiān)督的圖像識(shí)別上有廣泛的應(yīng)用.該分類(lèi)算法的準(zhǔn)確度與訓(xùn)練樣本個(gè)數(shù)有很大的關(guān)聯(lián).通常訓(xùn)練樣本越充分,則該算法分類(lèi)準(zhǔn)確率越高,然而遇到小樣本問(wèn)題時(shí),該算法分類(lèi)準(zhǔn)確率會(huì)明顯降低.針對(duì)小樣本問(wèn)題,提出使用基于圖像邊緣位移的方法,得到和原始訓(xùn)練圖像樣本高度相關(guān)的新樣本,達(dá)到擴(kuò)充訓(xùn)練樣本容量的目的,進(jìn)而提高算法的分類(lèi)準(zhǔn)確率.同時(shí),對(duì)于帶仿射約束的稀疏表示分類(lèi)算法,也可以經(jīng)過(guò)圖像邊緣位移方法來(lái)提高分類(lèi)準(zhǔn)確率.實(shí)驗(yàn)結(jié)果證明,所用方法能夠取得較好的圖像識(shí)別效果.
圖像分類(lèi);稀疏表示;訓(xùn)練樣本;仿射約束
在近年來(lái)的機(jī)器視覺(jué)領(lǐng)域中,有監(jiān)督的圖像分類(lèi)技術(shù)(SupervisedImageClassification,SIC)一直是該領(lǐng)域關(guān)注的熱點(diǎn)[1].該技術(shù)針對(duì)目標(biāo)圖像,利用提取的有效圖像特征,通過(guò)匹配已知訓(xùn)練集的圖像信息,尋找出與測(cè)試圖像最相近的訓(xùn)練圖像所在的類(lèi),從而達(dá)到圖像分類(lèi)的目的[2].現(xiàn)有的多數(shù)有監(jiān)督的圖像分類(lèi)算法的分類(lèi)準(zhǔn)確率和訓(xùn)練樣本個(gè)數(shù)有非常密切的關(guān)系.一般情況下,只有足夠多的樣本才能夠獲得較好的分類(lèi)準(zhǔn)確率.目前,稀疏表示分類(lèi)算法(SparseRepresentation-basedClassifier,SRC)[3]是比較有效的圖像識(shí)別算法之一.它利用所有訓(xùn)練樣本,對(duì)待測(cè)試樣本進(jìn)行線(xiàn)性表示.當(dāng)訓(xùn)練樣本足夠多時(shí),通過(guò)計(jì)算線(xiàn)性向量的最小1范數(shù),將測(cè)試樣本分類(lèi)到距離最近的類(lèi)中.與現(xiàn)有多數(shù)方法相比,SRC借助于1范數(shù)的最小化,在分類(lèi)準(zhǔn)確率和魯棒性都有理論上的保證[4].然而在實(shí)際應(yīng)用中常常會(huì)遇到小樣本問(wèn)題,這將影響SRC算法的分類(lèi)精度.解決小樣本問(wèn)題,是SRC方法所不得不面對(duì)的現(xiàn)實(shí)問(wèn)題[5].
原始訓(xùn)練圖像有N類(lèi),可以表示成矩陣A=[A1,A2,…,AN].每類(lèi)含有M個(gè)訓(xùn)練樣本,其中第i類(lèi)訓(xùn)練樣本可以表示成矩陣,Ai=[vi,1,vi,2,…,vi,M],vi,j表示第i類(lèi)中第j個(gè)圖像樣本,是大小為m×n的灰度圖像,在矩陣Ai中的每個(gè)樣本將展成列向量,即vi,j∈MN.根據(jù)線(xiàn)性子空間原理[6],若給出屬于第i類(lèi)的測(cè)試樣本y,則y可表示成有足夠多的第i類(lèi)訓(xùn)練樣本的線(xiàn)性疊加,
y=αi,1vi,1+αi,2vi,2+…+αi,Mvi,M
(1)
式中,αi,j∈,j=1,2,…,M
由于A表示N類(lèi)目標(biāo)的所有訓(xùn)練樣本所組成的矩陣,所以可以用所有訓(xùn)練樣本對(duì)測(cè)試樣本y進(jìn)行線(xiàn)性表示,其矩陣形式的表達(dá)式如下,
y=Ax
(2)
x*=argminx‖x‖0s.t. y=Ax
(3)
x*=argminx‖x‖1s.t. y=Ax
(4)
式中,‖·‖0表示0范數(shù),‖·‖表示1范數(shù).
若SRC的訓(xùn)練樣本數(shù)越多,所獲得的x就越稀疏,即訓(xùn)練集樣本數(shù)越多,SRC的分類(lèi)準(zhǔn)確率就越好.對(duì)于現(xiàn)實(shí)中小樣本的情況,可以通過(guò)位移矩陣和傅里葉變換實(shí)現(xiàn)圖像的最外層像素的循環(huán)位移,得到與原始圖像特征極為近似的擴(kuò)充圖像,從而達(dá)到擴(kuò)充原始訓(xùn)練集的目的,同時(shí)可以得到擴(kuò)充圖像的類(lèi)別.
1)定義位移矩陣.
定義1 位移矩陣:對(duì)尺寸為m×n的圖像要求行位移數(shù)為r,列位移數(shù)為c,給定尺寸為m×n的位移矩陣S,滿(mǎn)足下面條件,
(5)
式中,0≤r≤m-1,0≤c≤n-1且r,c均為整數(shù).
為了使圖像盡可能保持原本的特征信息,對(duì)于r,c將選取4種情況,
(6)
這4種情況下得到的位移矩陣分別對(duì)應(yīng)于S1,S2,S3,S4.
2)對(duì)原始訓(xùn)練集進(jìn)行二維快速傅里葉變換,變換后的各個(gè)圖像矩陣點(diǎn)乘二維傅里葉變換后的位移矩陣,進(jìn)行二維傅里葉反變換得到基于圖像邊緣位移的圖像,并以此來(lái)擴(kuò)充原始訓(xùn)練集,從而達(dá)到增加分類(lèi)準(zhǔn)確率的目的.
在實(shí)驗(yàn)中,選擇目前常用的ORL人臉數(shù)據(jù)庫(kù)作為實(shí)驗(yàn)數(shù)據(jù)集[8],以滿(mǎn)足訓(xùn)練樣本較少而圖像尺寸較大的情況.其中ORL人臉數(shù)據(jù)庫(kù)共有40個(gè)類(lèi),每個(gè)類(lèi)僅含10幅112×92像素圖像,每幅圖像擁有不同的細(xì)節(jié)和角度[8].該數(shù)據(jù)集的一個(gè)樣本示例如圖1所示.
圖1ORL數(shù)據(jù)庫(kù)示例
本研究模擬小樣本問(wèn)題,將對(duì)樣本的各個(gè)類(lèi)別進(jìn)行3次隨機(jī)抽樣,依次抽取1、2及3個(gè)樣本,從而從多方面來(lái)驗(yàn)證所提方法的性能.對(duì)抽樣過(guò)后的訓(xùn)練集進(jìn)行基于圖像邊緣位移的訓(xùn)練樣本集擴(kuò)充方法,選取上述提出的4種位移矩陣,同時(shí)對(duì)比未擴(kuò)充SRC和擴(kuò)充未受仿射約束SRC,以及擴(kuò)充并受仿射約束SRC.在不同的較低維數(shù)和不同的每類(lèi)原始訓(xùn)練樣本個(gè)數(shù)的環(huán)境下,對(duì)各個(gè)分類(lèi)器的分類(lèi)精度進(jìn)行比較,這樣可以看出顯著差異.在實(shí)驗(yàn)中,特征將選取10到40維的不同維數(shù),并觀察每類(lèi)訓(xùn)練樣本個(gè)數(shù)分別為1、2及3時(shí)各個(gè)分類(lèi)器的分類(lèi)結(jié)果,統(tǒng)計(jì)結(jié)果數(shù)據(jù)如表1、2和3所示.
表1 每類(lèi)訓(xùn)練樣本為1時(shí)的分類(lèi)精度
表2 每類(lèi)訓(xùn)練樣本為2時(shí)的分類(lèi)精度
表3 每類(lèi)訓(xùn)練樣本為3時(shí)的分類(lèi)精度
同時(shí),相對(duì)應(yīng)的MATLAB仿真結(jié)果圖如圖2、圖3和圖4所示.
圖2 每類(lèi)樣本為1時(shí)的分類(lèi)精度
圖3 每類(lèi)樣本為2時(shí)的分類(lèi)精度
圖4 每類(lèi)樣本為3時(shí)的分類(lèi)精度
圖2~4中,從上至下的折線(xiàn)依次代表的是樣本未擴(kuò)充SRC、樣本自擴(kuò)充的未受仿射約束SRC、樣本自擴(kuò)充的受仿射約束SRC.
實(shí)驗(yàn)數(shù)據(jù)表明,經(jīng)過(guò)擴(kuò)充樣本并受仿射約束SRC的分類(lèi)準(zhǔn)確率最高.
通過(guò)實(shí)驗(yàn)數(shù)據(jù)可以看出,雖然隨著原始樣本個(gè)數(shù)的增多,各個(gè)分類(lèi)精度的差距會(huì)隨之縮小,但基于樣本自擴(kuò)充的受仿射約束SRC的分類(lèi)精度始終保持最高,而且當(dāng)處于小樣本問(wèn)題時(shí),本研究提出的基于圖像邊緣位移的有監(jiān)督的稀疏表示分類(lèi)方法要比其他情況下SRC分類(lèi)結(jié)果高得多.對(duì)于小樣本問(wèn)題,實(shí)驗(yàn)結(jié)果顯示,無(wú)論是否受仿射約束,基于圖像邊緣位移的有監(jiān)督的稀疏表示分類(lèi)方法都能有效提高分類(lèi)準(zhǔn)確率.因此,本研究所提出的基于樣本自擴(kuò)充的受仿射約束SRC,利用樣本自擴(kuò)充,將訓(xùn)練樣本包含信息量最少的最外層像素經(jīng)過(guò)循環(huán)移位來(lái)擴(kuò)充訓(xùn)練集樣本個(gè)數(shù),同時(shí)通過(guò)受仿射約束SRC對(duì)擴(kuò)充樣本的系數(shù)進(jìn)行受限,從而在原始樣本較少的情況下,能夠穩(wěn)定提高分類(lèi)準(zhǔn)確率.
[1]WrightJ,YangAY,GaneshA,etal.Robust face recognition via sparse representation[J].IEEETransPatternAnalMachIntell,2008,31(2):210-227.
[2]YangJ,ZhangL,XuY,etal.Beyond sparsity:The role of L1-optimizer in pattern classification[J].PatternRecogn,2012,45(3):1104-1118.
[3]雷明軍,彭進(jìn)業(yè).改進(jìn)SRC算法在人臉識(shí)別中的應(yīng)用[J].電子設(shè)計(jì)工程,2013,21(4):137-139.
[4]MichaelElad.Sparse and redundant representations:from theory to applications in signal and image processing[M].NewYork,USA:Springer,2010.
[5]DonohoDL.For most large underdetermined systems of linear equations the minimal[J].CommPureApplMath,2006,59(6):797-829.
[6]XuY,LiXL,LaiZH,etal.Integrating conventional and inverse representation for face recognition[J].IEEETransCybern,2014,44(10):1738-1746.
[7]AT&T.The ORL Database of Faces[EB/OL].[2002-01-01].http://www.cl.cam.ac.uk/Research/DTG/attarhive/pub/data/att-faces.tar.Z.
[8]WoldS,EsbensenK,GeladiP.Principal component analysis[J].ChemometrIntellLabSys,1987,2(13):37-52.
Classification Method of Supervised Sparse Representation Based on Image Edge Displacement
LIAOLiang,YANGChengkai
(School of Electric and Information Engineering, Zhongyuan University of Technology, Zhengzhou 451191, China)
Sparse Representation-based Classifier(SRC) is widely used in supervised image recognition.However,the accuracy of SRC is tightly associated with the number of training samples.The more the training samples are,the more accurate the SRC is.However,when small sample problems occur,the accuracy of SRC decreases.As for the small sample problems,the paper puts forward a method based on image edge displacement to obtain new samples which are highly associated with the original training samples in order to expand the training sample capacity and therefore to increase the classification accuracy of SRC.Meanwhile,as for the SRC with affine constraints,the classification accuracy of SRC can be further improved by image edge displacement.The experiments show that the above-mentioned method can help achieve much more accurate image recognition.
image classification;sparse representation;training samples;affine constraints
1004-5422(2016)04-0355-03
2016-09-01.
廖 亮(1975 — ), 男, 博士, 副教授, 從事復(fù)雜圖像識(shí)別與分類(lèi)研究.
TP391.41
A