龍力
摘要:為了提升紋理圖像分類準(zhǔn)確度,從圖像單一特征出發(fā),例如LBP特征、灰度共生矩陣特征、Gabor特征。首先對圖像進(jìn)行預(yù)處理,提取特征,運用機(jī)器學(xué)習(xí)方法進(jìn)行分類,驗證特征與分類器的有效性。再通過參數(shù)調(diào)整,最大程度上提高各方法在各特征基礎(chǔ)上的準(zhǔn)確率。單一特征包含圖像某方面信息的側(cè)重性,各特征有不同的關(guān)注點。為了克服特征的局限性,增加分類特征包含圖像信息的全面性,提出一種特征融合的方法。在提取的紋理圖像單一特征基礎(chǔ)上,給各個特征設(shè)置相應(yīng)權(quán)重,進(jìn)行融合再分類。在brodatz紋理庫圖像上進(jìn)行實驗,得到由融合機(jī)制進(jìn)行分類的準(zhǔn)確度優(yōu)于單一特征分類的結(jié)果。
關(guān)鍵詞:紋理圖像;特征提?。粓D像分類;特征融合
中圖分類號:TP391.41 文獻(xiàn)標(biāo)識碼:A 文章編號:1007-9416(2017)11-0109-04
面對爆炸式增長的海量圖像數(shù)據(jù),急需尋找一種方法,使計算機(jī)能夠自動識別,分析,理解圖像,滿足檢索圖像的需求。而圖像分類技術(shù)便是解決這個問題的一個重要方法,能夠自動識別圖像的內(nèi)容,構(gòu)建出與人類視覺系統(tǒng)相似的圖像信息表達(dá)。紋理圖像分類即根據(jù)圖像信息中的特征,將不同紋理區(qū)域予以分開,提取感興趣區(qū)域的一種圖像處理方法,一直是科研人員研究的核心問題。紋理圖像分類主要包括三個步驟:預(yù)處理、特征提取、分類方法的選擇。預(yù)處理是為了消除無關(guān)因素的影響,例如噪聲、冗余信息等。特征提取是分類的重要環(huán)節(jié),優(yōu)秀的特征需要具有良好的魯棒性,穩(wěn)定性和泛化能力,分類方法則一般采用有監(jiān)督的學(xué)習(xí)方法。
由于各種特征關(guān)注點的局限性,雖然運用單一特征進(jìn)行分類,能取得較好的效果。但考慮到圖像特征的多樣性,能否從特征組合上提高分類的準(zhǔn)確度是一個值得研究的問題。因此本文提出了一種特征融合策略,即在單個特征基礎(chǔ)上對其進(jìn)行加權(quán)組合,使得融合生成的特征向量在構(gòu)成上以主要特征為核心,增加新的元素,去對紋理圖像進(jìn)行分類。在brodatz紋理庫圖像上進(jìn)行實驗,驗證策略有效性。
1 紋理圖像特征提取方法
1.1 局部二值模式
局部二值模式是一種常用的基于直方圖的紋理分析方法,其關(guān)注點為圖像局部特征,是對圖像局部區(qū)域內(nèi)像素灰度值與中心像素灰度值關(guān)系的反映,將不同的局部區(qū)域直方圖作為描述圖像的特征。LBP算子最早是定義在3×3的窗口內(nèi),以窗口中心像素灰度值為閾值,將相鄰的8個像素的灰度值與其進(jìn)行比較,若大于,則該鄰點位置記為1,否則為0,如此以來便可產(chǎn)生8個二進(jìn)制數(shù),將其轉(zhuǎn)化為十進(jìn)制就是描述該局部區(qū)的LBP值。
LBP算子的數(shù)學(xué)表達(dá)式:
2 特征向量提取算法步驟
2.1 LBP特征向量提取
(1)確定半徑與取樣點數(shù),對于每個像素,以該像素為中心,在半徑為R的鄰域均勻選擇N個點,如該點恰好落在某像素,取該像素值為該點取值,否則以線性插值的方法作為該點值。(2)將取樣點分別與中心元素作比較,若大于中心元素,記為1,否則為0。所有取樣點經(jīng)過比較,會得到一個N位二進(jìn)制數(shù),將其轉(zhuǎn)為十進(jìn)制數(shù),得到LBP值。(3)將得到的窗口中心像素點的LBP值賦給該中心點,作為該中心點的像素值。(4)統(tǒng)計鄰域灰度直方圖,形成256維的特征向量。
3 實驗結(jié)果與分析
3.1 實驗圖像與特征組合分析
實驗圖像來源于兩部分,一部分為其他文獻(xiàn)所采用的brodatz紋理圖像庫中典型紋理圖像,另一部分從brodatz紋理圖像庫隨機(jī)選擇兩種圖像進(jìn)行合并。
實驗一共采用9張圖像,如圖2所示。
首先對圖像進(jìn)行預(yù)處理,即對圖像進(jìn)行灰度化處理,并對邊緣進(jìn)行填充,可以采用0像素(黑色像素)或反射像素(圖像內(nèi)部像素對稱翻轉(zhuǎn))進(jìn)行填充。之后隨機(jī)從兩類圖像中選取1000個像素點,以該像素為中心,選取9×9的鄰域進(jìn)行特征提取,作為訓(xùn)練樣本,另取5000個像素點,作為測試集。將訓(xùn)練樣本與測試樣本進(jìn)行歸一化,如公式(4)所示:
3.2 單個特征對紋理圖像分類的作用
模型訓(xùn)練方法分別選用K近鄰算法(KNN)和支持向量機(jī)(SVM)。由于參數(shù)的選擇與準(zhǔn)確率相關(guān)性較大,因此進(jìn)行網(wǎng)格搜索參數(shù),每隔一定距離選取一個參數(shù)進(jìn)行訓(xùn)練,計算測試集準(zhǔn)確率,選取令測試集準(zhǔn)確率最高的參數(shù)最為最終選取參數(shù)。分類模型構(gòu)造完成,對待分類圖像進(jìn)行預(yù)處理之后開始進(jìn)行預(yù)測。依次對其像素進(jìn)行遍歷,以每個像素為中心,選取9×9的鄰域,提取特征進(jìn)行預(yù)測。圖3所示分別為三種特征進(jìn)行預(yù)測的待分類圖像,其中樣本為圖2(5)。
實驗圖像在三種基礎(chǔ)特征上,測試集上的準(zhǔn)確率結(jié)果見表2。
圖4直觀的反應(yīng)了各個特征準(zhǔn)確率情況。
從圖4可以看出:
(1)整體上,SVM分類方法圖較KNN方法相比,準(zhǔn)確率較高。SVM有一個訓(xùn)練過程,先在訓(xùn)練樣本上訓(xùn)練一個模型,產(chǎn)生最優(yōu)分類平面,再對樣本進(jìn)行預(yù)測,考慮了訓(xùn)練樣本的概率分布情況。而KNN方法沒有訓(xùn)練過程,只根據(jù)訓(xùn)練數(shù)據(jù)與待分類數(shù)據(jù)之間的距離度量來進(jìn)行分類,若訓(xùn)練樣本特征維度較高,KNN效果較差,波動也較大。(2)在三種特征中,GLCM特征與Gabor特征較LBP特征相比,效果較好。LBP特征是通過像素與其相鄰像素進(jìn)行比較,以直方圖的形式表現(xiàn)的圖像特征。而圖像直方圖則需要較多的像素點才能體現(xiàn)圖像包含的信息,因此鄰域較小的情況下,其準(zhǔn)確率較低。(3)Gabor特征是在不同頻率與幅值變換上得到的局部圖像像素均值,而紋理特征,通常與頻率有關(guān),因此Gabor特征較適合于紋理表示與判別,準(zhǔn)確率較高。GLCM特征是計算灰度共生矩陣包含的信息所得出的,能反映出圖象灰度關(guān)于方向、相鄰間隔、變化幅度的綜合信息,對于較小的鄰域,其包含的信息較多,也能取得較好的效果。(4)對圖像像素進(jìn)行分類時,若鄰域選擇較小,則GLCM與Gabor特征較LBP表現(xiàn)好。endprint
3.3 多特征加權(quán)組合分析結(jié)果
在特征融合時,為了消除各特征之間的量綱影響,首先對三個不同的特征向量進(jìn)行歸一化,歸一化的方法采用公式(4),使所有特征取值范圍都處于之間。
圖像在進(jìn)行分類時,各個特征包含圖像的信息有不同的側(cè)重點,在進(jìn)行融合時,進(jìn)行權(quán)重設(shè)置,分別使LBP:GLCM:Gabor比例依次為1:1:8、1:8:1、8:1:1和1:1:1。得到的實驗結(jié)果如表3所示。
圖5為各種權(quán)重比例下融合特征準(zhǔn)確率,其結(jié)果用虛線表示。
可以看出,在對特征設(shè)置不同權(quán)重進(jìn)行融合后,一些權(quán)重情況下,融合特征分類準(zhǔn)確率比單一特征高。特征融合存在一個權(quán)重的關(guān)鍵點,不同的權(quán)重對準(zhǔn)確率有不同的影響,另外分類方法也影響這特征融合的準(zhǔn)確率。圖像的不同特征都包含著不同的信息,對特征進(jìn)行加權(quán)組合,伴隨著信息的損失與增加。不同的特征也具有不同的側(cè)重點。對于圖2(1)、2(4)、2(6),圖像明暗變化突出,紋理方向也明顯不同,若提高GLCM特征所占權(quán)重,并加入一些與GLCM包含不同信息的特征,必將提高其準(zhǔn)確率。對于圖2(7)、2(8)、2(9),圖像成團(tuán)狀分布,將其在不同的頻率下進(jìn)行Gabor變換,得到圖像能量能有較好的區(qū)分度。剩下的三種圖像,LBP特征效果較好,提高其權(quán)重勢必也能提高其分類效果,但這也與分類方法有關(guān)。
對于KNN分類方法,當(dāng)將LBP:GLCM:Gabor = 8:1:1時,此時分類準(zhǔn)確率極大的降低,原因在于LBP特征維度較高,而KNN屬于距離度量分類器,當(dāng)對三種特征設(shè)定權(quán)值進(jìn)行融合,若LBP特征向量中非零元素較多,與權(quán)重相乘后,極大減小了LBP特征的距離信息,而增加的信息較小,產(chǎn)生了距離錯亂的問題。相反,將其他兩種特征作為主要特征時,其附加的信息對最終分類起到了積極作用。而SVM方法,特征融合之后準(zhǔn)確率都維持在較高水平,其考慮到主要特征的同時,改變最優(yōu)分類平面去適應(yīng)新增加的特征分量。
因此在進(jìn)行紋理圖像分類時,當(dāng)單一特征分類效果并不是很理想時,可以對圖像不同特征設(shè)置相應(yīng)權(quán)重進(jìn)行融合。圖像的不同特征包含著圖像的不同信息,有不同的側(cè)重點。融合意味著新信息的加入,設(shè)定相應(yīng)的權(quán)值,使融合特征在保持主要特征的基礎(chǔ)上加入新的元素,再結(jié)合恰當(dāng)?shù)姆诸惙椒ǎ瑴?zhǔn)確率將會提升。
4 結(jié)論與展望
紋理圖像分類中,一般都是提取單一特征進(jìn)行分類。本文在單個特征進(jìn)行圖像分類的基礎(chǔ)上,研究特征組合在不同機(jī)器學(xué)習(xí)分類方法上對圖像分類準(zhǔn)確度的影響。通過對不同的特征設(shè)置權(quán)重,按照主次進(jìn)行融合,在一些權(quán)重比例組合下,得到的準(zhǔn)確率高于以往用單一特征進(jìn)行分類的準(zhǔn)確率。不同特征有不同關(guān)注點,融合增加了圖像的信息表達(dá)。分類器的選擇同樣重要,若主要特征維度較高,此時應(yīng)當(dāng)選擇魯棒性強(qiáng)的分類器,否則新向量的并入反而會降低準(zhǔn)確率。本文只選取了三種典型圖像特征,數(shù)量有待增加,另外對于分類方法的組合方式,權(quán)重設(shè)置更加多樣化,鄰域大小的確定這也是進(jìn)一步研究的方向。
參考文獻(xiàn)
[1]Haralick R M, Shanmugam K, Dinstein I. Textural features for image classification[J]. Systems Man & Cybernetics IEEE Transactions on, 1973,smc-3(6): 610-621.
[2]Lu D, Weng Q. A survey of image classification methods and techniques for improving classification performance[J]. Taylor & Francis, Inc. 2007.
[3]Vega-Rodriguez M A. Review: feature extraction and image processing[J]. Computer Journal, 2004, 44(2): 595-599.
[4]Lin Y, Lv F, Zhu S, et al. Large-scale image classification: fast feature extraction and SVM training. IEEE Conference on computer Vision and Pattern Recognition[J]. IEEE Computer Society, 2011: 1689-1696.
[5]陳榮,曹永鋒,孫洪.基于主動學(xué)習(xí)和半監(jiān)督學(xué)習(xí)的多類圖圖像分類[J].自動化學(xué),2011,37(8):954-962.
[6]Wang G D, Zhang P L, Ren G Q, et al. Texture feature extraction method fused with LBP and GLCM[J]. Computer Engineering,2012,38(11): 199-201.
[7]Ojala T, Harwood I. A Comparative Study of texture measures with classification based on feature distributions[J]. Pattern Recognition, 1996,29(1): 51-59.
[8]Feichtinger H G, Luef F. Gabor Analysis and Algorithms[J]. Applied & Numerical Harmonic Analysis, 1998,1: 123-170.
Abstract:In order to improve the classification accuracy of texture images, based on the single feature of images, such as lbp, gray co-occurrence matrix and gabor feature. Firstly, images are preprocessed, then features are extracted and texture images are classified by machine learning method, at last verify the validity of the features and classifiers. Through adjusting parameters, improve the accuracy in the maximum extent by each method on each feature. The Single feature contains particular information of image, which has different concerns from others. A strategy based on Multi-feature Fusion is proposed, which overcome the limitations of features and increase the comprehensiveness in images information of the features used on classification. On the basis of extracting the single feature of texture images, the corresponding weights are set for each feature, and then images are classified by fusion feature. Experiments are conducted on the Brodatz texture image. The experimental results show the classification accuracy by feature fusion is better than results on single feature.
Key Words:texture images; features extraction; images Classification; feature fusionendprint