黃媛媛, 管圖華
(南通大學(xué) 工程訓(xùn)練中心,江蘇 南通226019)
紋理[1]是圖像中反復(fù)出現(xiàn)的局部特征及其不規(guī)則而宏觀有規(guī)律的排列,它包含物體表面結(jié)構(gòu)組織排列的重要信息及其空間鄰域的相關(guān)性,是一種不依賴圖像顏色或亮度變化的反映圖像同質(zhì)現(xiàn)象的視覺特征。紋理特征提取是紋理分析技術(shù)的一個最基本的問題,是圖像紋理描述、分類、分割的重要環(huán)節(jié),對圖像分析起至關(guān)重要的作用。目前,根據(jù)基礎(chǔ)理論和研究思路的不同,紋理特征提取方法主要分為統(tǒng)計類、模型類、信號處理類和結(jié)構(gòu)類[2]。4 類方法各有優(yōu)缺點,在圖像分析不同的領(lǐng)域發(fā)揮重要作用,多種方法相互融合,取長補短,以提高紋理特征提取的綜合性能,已成為當前的一個研究方向[3-8]。本文主要采用統(tǒng)計類中灰度共生矩陣法和信號處理類中雙樹復(fù)小波法,引入結(jié)構(gòu)類“基元”概念,提出了一種雙樹復(fù)小波域基元共生矩陣的紋理特征提取方法,以小波作為分析域,以紋理基元為依據(jù),描述紋理的局部特征。
雙樹復(fù)小波變換(Dual-Tree Complex Wavelet Transform,DT-CWT)[9-11]繼承了離散小波變換DWT 的多尺度多分辨率特點,同時彌補了復(fù)小波變換CWT 計算量大、復(fù)雜度高的不足,具有近似平移不變性、良好的方向選擇性和重構(gòu)性、有限的冗余性和高計算效率等特點。
DT-CWT 與常規(guī)的CWT 不同,它獨立地使用2 個離散小波分別構(gòu)成一個復(fù)數(shù)的實部和虛部,形成一個雙樹復(fù)小波。圖1 為一維信號的DT-CWT 分解示意圖。它包含了2 個平行的實小波樹a 和b,且所有濾波器都是實值濾波器,即分別產(chǎn)生的小波系數(shù)為實數(shù),僅當兩棵樹合并時,輸出才出現(xiàn)復(fù)數(shù),形如d = da1+jdb1,其中:da1、db1分別為樹a 和b 的小波系數(shù);ca1、cb1分別為樹a 和b 的尺度系數(shù)。
圖1 一維雙樹復(fù)小波分解圖
局部二進制模型LBP(Local Binary Pattern)[12-13]方法系在紋理譜方法的基礎(chǔ)上,將紋理分析從傳統(tǒng)的基于像素點的方法轉(zhuǎn)移到基于局部紋理模式的方法。LBP 具有很強分類能力、較高計算效率并且對于單調(diào)的灰度變換具有尺度不變性和旋轉(zhuǎn)不變性等特點。
LBP 的基本算法原理:一個二維圖像,將中心像素與其鄰域像素進行比較,若鄰域像素值大于中心像素值,則將該點賦值為1;若鄰域像素值小于中心像素值,則將該點賦值為0,將權(quán)值模板與閾值處理后的圖像對應(yīng)相乘求和,得到中心像素值。最后用得到的值表示局部紋理特征。
LBP 算法的數(shù)學(xué)定義:(P,R)表示不同尺度的紋理結(jié)構(gòu),P 表示圓形鄰域的像素個數(shù);R 表示鄰域半徑。設(shè)(P,R)的紋理特征為T,它表示了相鄰P +1 個像素點的灰度值關(guān)系,
式中:gc是局部鄰域的中心像素灰度值;g0是在半徑為R(R >0)的圓形對稱區(qū)域內(nèi)第i 個相鄰空間像素灰度值。
灰度共生矩陣(Gray Level Co-occurrence Matrix,GLCM)[14]是一種分析圖像紋理特征的經(jīng)典二階統(tǒng)計法,算法簡單易于實現(xiàn),而且紋理分類效果較好。
GLCM 本質(zhì)上是兩個像素點的聯(lián)合直方圖,距離差分值(Δx,Δy)取不同的數(shù)值組合,都可以得到圖像沿 著 一 定 方 向 θ、相 隔 一 定 距 離 δ =的灰度共生矩陣。
GLCM 的數(shù)學(xué)定義:從圖像灰度值為j 的像元(x,y)出發(fā),統(tǒng)計與其距離為δ 且灰度值為j 的像元(x +Δx,y+Δy)同時出現(xiàn)的頻度P(i,j,δ,θ):式中:i,j=0,1,2,…,L-1,L 為圖像的灰度級數(shù);θ 為灰度共生矩陣的生成方向,通常取0°、45°、90°和135°4 個方向;x、y 是圖像中的像素坐標;Δx 和Δy 分別為行和列方向的差分距離;M、N 分別為圖像的行列數(shù)。
從GLCM 中可以提取描述圖像紋理的各種統(tǒng)計量作為特征值,包括能量、慣性矩、相關(guān)性、熵、方差、均值和、方差和、局部平穩(wěn)性、差的方差、和熵、差熵、聚類陰影、顯著聚類和最大概率14 種[2],其中能量、熵、慣性矩和局部平穩(wěn)性為4 種不相關(guān)的特征。
構(gòu)造一個二維的雙樹復(fù)小波變換函數(shù),即,
實部小波函數(shù):
式中:i=1,2,3;φ1,i(x,y)和φ2,i(x,y)分別為6 個方向的小波函數(shù),定義為:
虛部小波函數(shù):
式中:i=1,2,3;φ3,i(x,y)和φ4,i(x,y)分別為6 個方向的小波函數(shù),定義為:
按式(3)~(9)對圖像進行DT-CWT 可以得到多個分解層,每個分解層有6 個方向的細節(jié)子帶圖像,分別用和表示,其中:k 表示分解層數(shù);α 表示方向。實驗表明,進行4 層以上的DT-CWT 并進行不同層的匹配,更利于圖像特征分析,但變換的復(fù)雜度也隨之增加。因此,可根據(jù)具體情況在特征分析性能和計算量之間進行均衡。
對紋理圖像進行多層DT-CWT,得到子帶圖像Ik,α,提取子帶圖像紋理基元特征碼構(gòu)成紋理特征碼矩陣,將特征碼矩陣劃分成8n ×8n 的窗口,提取每個窗口(x,y)位置的圖像數(shù)據(jù),將數(shù)據(jù)進行8m 級灰度級的量化,對量化后的圖像數(shù)據(jù)根據(jù)下式計算θ =0°、45°、90°、135°4 個方向距離為d 的灰度共生矩陣Gk,α,并提取能量、熵、慣性矩和局部平穩(wěn)性4 種特征值。
能量(二階矩):
熵:
慣性矩:
局部平穩(wěn)性(逆差矩):
DT-CWT 域基元共生矩陣的紋理特征提取流程圖如圖2 所示。
實驗選用了國際標準圖片庫brodatz 中40 幅圖片,編號為D21 ~D40 和D80 ~D100,每幅圖片大小為640 ×640,將每幅圖片按5 ×5 互不重疊的均分為大小128 ×128 的25 幅子圖片,每幅原圖片作為1 類,生成一個新的圖片庫,其中包含40 種不同類型的圖片,每類有25 幅圖片,圖片庫共1000 幅圖片,如圖2 所示。
圖2 一幅圖片經(jīng)5 ×5 均分后生成一種類型共25 幅子圖片
本來從紋理特征性能分析和圖像檢索應(yīng)用[15]兩方面驗證本文方法的性能,并將本文方法與傳統(tǒng)的基于GLCM 和基于DT-CWT 的紋理特征提取方法進行性能比較。
實驗中,對圖像進行雙樹復(fù)小波的四層變換,第1層變換濾波器為:(13,19)階近對稱濾波器;第2、3、4層變換濾波器為:Q-shift 濾波器?;叶裙采仃噮?shù)為:灰度級選擇16 級,移動窗口大小選擇32 ×32,距離d 選擇1。本文方法用第1 ~4 層分解的低頻子帶圖像在0°、45°、90°、135°4 個方向的基元共生矩陣,分別計算能量、熵、慣性矩、局部平穩(wěn)性4 種特征值,提取長度為32 的特征矢量?;贒T-CWT 的紋理特征提取方法利用第1 ~4 層分解的低頻子帶圖像在±15°、±45°和±75° 6 個方向上系數(shù)的均值和方差表示圖像紋理,提取了長度為48 的特征矢量?;贕LCM 的紋理特征提取方法則采用能量、熵、慣性矩、局部平穩(wěn)性4 種特征值描述圖像紋理特征,提取了長度為16 的特征矢量。實驗的硬件環(huán)境為:Intel(R)Core(TM)I3-2130 CPU 3.4 GHz;軟件平臺為Matlab R2009b。
分別用本文方法、基于DT-CWT 和基于GLCM 的紋理特征提取方法,對圖片庫中的40 種不同類型(每類25 幅)共1 000 幅提取紋理特征,并將每類圖片所提取的紋理特征作一個聚類,共構(gòu)成25 個聚類,通過分析聚類的類間距離(聚類中心之間的歐氏距離)、內(nèi)距離(聚類內(nèi)部所有樣本與聚類中心的平均歐氏距離)及其比值,來評判紋理特征提取方法的性能[9]。
圖4、圖5 給出的類間距離和類內(nèi)距離是利用上述3 種方法分別針對圖片庫中任選的5 種圖片(見圖3)所構(gòu)成的5 個聚類進行計算而得。
由圖表可以看出,在大多數(shù)情況下,本文方法所提取的紋理特征聚類的類間距離大于其他兩種方法,而聚類的類內(nèi)距離則小于或接近其他兩種方法,據(jù)此計算的類間距離和類內(nèi)距離之比在大多數(shù)情況下也大于其他兩種方法。綜合來看,本文方法提取紋理特征在保持聚類內(nèi)部樣本的差異性的前提下,聚類分離度明顯優(yōu)于其他兩種方法。
圖3 5 種紋理圖片構(gòu)成5 個聚類
圖4 5 種紋理特征聚類的類間距離
圖5 5 種紋理特征聚類的類內(nèi)距離
將本文提取的紋理特征應(yīng)用到圖像檢索實驗中,并與基于DT-CWT 和基于GLCM 的紋理特征提取方法進行比較,進一步驗證本文方法的性能。實驗中,3種方法在特征提取實驗的基礎(chǔ)上,計算相似性度量值,即待檢索圖像與圖像庫中圖像之間的紋理特征距離,
式中:D 為待檢索圖像與圖像庫中圖像的歐氏距離;I為待檢索紋理圖像的特征矢量;Q 為圖像庫中紋理圖像的特征矢量;K 為紋理圖片特征矢量維數(shù)。
實驗選取圖像查準率作為圖像檢索性能優(yōu)劣的判別指標,
圖6 繪出的平均查準率曲線圖,是針對圖像庫中40 種不同類型的圖像,分別用上述3 種方法提取特征進行圖像檢索,返回檢索圖像總數(shù)為5、10、15、20 時的圖像平均查準率。
圖6 3 種方法檢索圖像的檢索率曲線
圖7 是針對D22、D23、D34、D85 和D97 五類紋理圖像的檢索實例。其中,第1 幅為檢索圖像,后面的5幅為檢索返回的查準率最高的前5 幅圖像。
圖7 紋理圖像檢索實例
從上可以看出,本文方法應(yīng)用于圖像檢索實驗中的平均查準率明顯高于基于DT-CWT 和基于GLCM的紋理特征提取方法,證明了本文方法具有更好的應(yīng)用適可靠性。
本文利用雙樹復(fù)小波域基元共生矩陣提取圖像的紋理特征,保持了基元共生矩陣提取特征的紋理間相關(guān)性、整體的結(jié)構(gòu)性,計算簡便,方法簡潔,同時繼承了雙樹復(fù)小波提取紋理特征的多方向性、多尺度和符合人類視覺特征的特點。本文方法能夠應(yīng)用于隨機、復(fù)雜、規(guī)則和非規(guī)則的自然紋理等多種圖像的紋理特征提取,具有較強的適應(yīng)能力和魯棒性。通過對紋理特征的聚類分離度比較和在圖像檢索的應(yīng)用,表明本文方法提取紋理特征的性能優(yōu)于僅依賴于雙樹復(fù)小波或灰度共生矩陣的紋理特征提取方法。本文實驗只提取了均值和方差來統(tǒng)計圖像的紋理特征,如何選用或組合其他的統(tǒng)計特征來進一步提高性能,有待于今后深入研究。
[1] 馬 莉,范影樂. 紋理圖像分析[M]. 北京:科技出版社,2009.
[2] 劉 麗,匡綱要. 圖像紋理特征提取方法綜述[J]. 中國圖象圖形學(xué)報(A),2009,14(4):14.Liu Li,Kuang Gang-yao. Overview of Image Textural Feature Extraction Methods[J]. Journal of Image and Graphics(A),2009,14(4):14.
[3] Clausi D A,Deng H. Design-based texture feature fusion using garbor filters and co-occurrence probabilties[J]. IEEE Transactions on Image Processing,2005,14(7):925-936.
[4] Acqua F D,Gamba P,Trianni G. Semi-automatic choice of scale dependent features for satallite SAR image classification[J]. Pattern Recognition Letters,2006,27(4):244-251.
[5] Nelson J D B,Kingsbury N G. Dual-tree wavelets for estimation of locally varying and anisotropic fractal dimension [C]//IEEE Conference on Image Processing,Hong Kong,2010:341-344.
[6] 沈 翀.基于灰度梯度共生矩陣最大熵估計的盲視頻水印算法[D].蘇州:蘇州大學(xué),2010.
[7] 王亮申,歐宗瑛. 圖像紋理分析的灰度-基元共生矩陣法[J].計算機工程,2004,30(23):19-21.Wang Liangshen,Ou Zongying. Image Texture Analysis by Grey-Primitive Cooccurrence Matrix[J]. Computer Engineering,2004,30(23):19-21.
[8] 劉 清,林土勝,王曉軍.基于系數(shù)關(guān)系共生矩陣和SVM 的紋理分析[J].光電工程,2009,36(4):128-132.Liu Qing,Lin Tu-sheng,Wang Xiao-jun. Texture Analysis Based on Coefficient Relationship Co-occurrence Matrix and SVM[J]. Opto-Electronic Engineering. 2009,36(4):128-132.
[9] Miller M A,Kingsbury N G. Image modeling using interscale phase properties of complex wavelet coefficients[J]. IEEE Transactions on Image Processing,2008,17(9):1491-1499.
[10] Haralick R M,Shanmugnm K,Dinstein I. Textural feature for image classification[J]. IEEE Transcations on Systems,Man,and Cybemetics,1973,3(6):610-621.
[11] N G Kingsbury. The dual-tree complex wavelet transform:a new technique for shift invariance and directional filters[C]//Proc 8th IEEE DSP Workshop,Bryce Canyon,1998:86-90.
[12] 張亞莉.局部二進制模式與小波特征融合的掌紋識別[J]. 計算技術(shù)與自動化,2010,29(1):102-105.Zhang Ya-li. Palmprint Recognition by Fusion of Local Binary Pattern and Wavelet Features[J]. Computing Technology and Automation,2010,29(1):102-105.
[13] 張 錚,趙 政,袁甜甜. 基于二維多尺度局部Gabor 二進制模式特征的表情識別[J].計算機應(yīng)用,2010,30(4):964-966.Zhang Zheng,Zhao Zheng,Yuan Tian-tian. Expression recognition based on 2D multi-scale block local Gabor binary patterns[J].Journal of Computer Applications,2010,30(4):964-966.
[14] Haralick R M,Shanmugan K,Dinsein I. Textural Features for Image Classification[J]. IEEE Transactions on Systems,Man,and Cybernetics,1973,3(6):610-621.
[15] 劉廣海,楊靜宇.基于四像素共生矩陣的圖像檢索[J].中國圖象圖形學(xué)報,2008,13(9):1783-1788.Liu Guang-hai,Yang Jing-yu. Image Retrieval Based on Four Pixels Co-occurrence Matrix[J]. Journal of Image and Graphics,2008,13(9):1783-1788.