尚 燕,安 濤,李春明
(河北科技大學(xué)信息科學(xué)與工程學(xué)院電子系,河北 石家莊050000)
為實現(xiàn)基于內(nèi)容的圖像檢索,MPEG-7標(biāo)準(zhǔn)提出了圖像內(nèi)容描述子的概念(如紋理描述子、形狀描述子和顏色描述子等)[1-2]。如果圖像表現(xiàn)出來的是以某一像元進行比較規(guī)則的多次重復(fù),則可以看成是一幅較規(guī)則的紋理圖像,因此紋理具有一定的區(qū)域特性。自然界的景物中,例如布匹、木紋等,大部分圖像均可表現(xiàn)出紋理特性,因此,紋理已經(jīng)成為人們用來感知世界的要素之一。紋理分析被廣泛應(yīng)用于圖像識別、檢索等,已經(jīng)成為機器視覺系統(tǒng)的重要基礎(chǔ)。最近幾年來,研究學(xué)者們提出了各種分析方法,這些方法取得了較好的分類效果,而抗噪性是算法在實際用中應(yīng)具備的重要性能,但它們往往忽視了圖像噪聲的影響。另一方面,雖然直接在空域計算圖像的LBP直方圖特征具有較好的分類效果,但其存在一些弊端,例如不能有效描述基元較大的紋理,且不具有多分辨率和抗噪性,而這些性能在實際應(yīng)用中是非常重要的。為了克服這些局限,文章提出的算法先在頻域?qū)D像進行Curvelet變換,然后在空域計算其LBP直方圖的方法,算法提取的特征具有多分辨率的特性且更加緊湊,能夠更好地描述圖像的細節(jié)和基元較大的紋理,彌補了前者的不足。另外,在現(xiàn)實中,如果圖像混入了噪聲,那么此時算法仍能夠正確分類,現(xiàn)有的方法沒有考慮圖像噪聲對紋理分類的影響,本文利用每個尺度的能量顯著方向子帶進行圖像重構(gòu),再提取多分辨率LBP特征,算法具有較強的抗噪性能。
小波理論已經(jīng)被廣泛應(yīng)用于圖像處理領(lǐng)域,小波變換固然表現(xiàn)出了很多優(yōu)點,但是其小波基只有水平、垂直和對角線這3個方向,對于圖像的邊緣、輪廓等細節(jié)特征不能準(zhǔn)確反映。因此,繼小波變換之后,出現(xiàn)了很多新的多尺度幾何變換,例如Ridgelet變換和之后的Curvelet變換。Curvelet變換是近年來圖像處理研究的熱點,因為其基函數(shù)是多方向的,具有高度各向異性,使能量更集中,能對圖像的細節(jié)信息進行更稀疏表示[3]。
Curvelet變換是直接在二維連續(xù)空間R2中定義的,其基函數(shù)γ的頻域表達式為
式中:ω=(ω1,ω2)T,k=(k1,k2)T∈Z2,Rj,l為旋轉(zhuǎn)矩陣,其旋轉(zhuǎn)角度θj,l=2πl(wèi)2-j。
式中:δ1=14/3(1+O(2-j)),δ2=10π/9。χ為二維窗函數(shù)
如圖1a所示,Curvelet將整個頻域分割成不同尺度不同方向的扇形子帶,由低頻子帶到高頻子帶方向數(shù)依次加倍。通過Candes提出的Wrapping算法實現(xiàn)離散化,如圖1b所示,不同于連續(xù)Curvelet,離散Curvelet變換將頻域劃分為梯形基元[4]。
圖1 Curvelet變換頻帶劃分
令gc,g0,…,gP表示灰度紋理圖像局部鄰域內(nèi)的p個像素,其中,gc為鄰域中心像素的灰度值,gp,(p=0,…,P-1)表示半徑為R的圓對稱域內(nèi)圓周上均勻分布的像素點灰度,不同(P,R)坐標(biāo)下的圓對稱域如圖2所示[5]。
圖2 不同(P,R)坐標(biāo)下的圓對稱域
描述局部圖像紋理空間結(jié)構(gòu)的LBPP,R參數(shù)定義為
LBPP,R參數(shù)產(chǎn)生2P個不同的值,圖像旋轉(zhuǎn)時,灰度值gp將沿中心為g0、半徑為R的圓周發(fā)生移動,導(dǎo)致LBPP,R改變,因此提出一種基于“均勻”模式的LBP算子,該算子具有旋轉(zhuǎn)不變特性。定義均勻參數(shù)U,表示二進制0/1變化的次數(shù),當(dāng)U最大取2時,改進的LBP算子定義為
用LBP實現(xiàn)紋理分類,不能有效描述基元較大的紋理,且不具有多分辨率的特性,只通過增加R值來增加像素點達到改進分類效果的措施效果不顯著,反而會使計算量增大。另外,LBP算法沒有考慮抗噪性這一在實際應(yīng)用中很重要的特性。針對這些問題,本文提出了一種空域和頻域結(jié)合的基于Curvelet顯著方向子帶多分辨率LBP特征實現(xiàn)旋轉(zhuǎn)不變紋理分類的方法。
Curvelet變換方向子帶豐富,可更準(zhǔn)確描述圖像的細節(jié)信息,同時具有高度各向異性,能量更加集中,因此Curvelet變換可以更有效地表征紋理圖像。算法特征提取的步驟如下:
1)設(shè)大小為N×N的紋理圖像像素值f(x,y),將其灰度值歸一化到[0,1],并對其進行(lbN-3)級Curvelet變換,因此對128×128像素的待測圖像進行四級Curvelet變換,第一級為低頻子帶,第二級分解為16個方向子帶,第三、四級均有32個子帶。
2)計算各子帶能量,每一尺度選取能量最大的k個子帶對圖像進行重構(gòu),得到的4個重構(gòu)圖像分別具有不同頻率成分的信息,噪聲主要包含在能量較小的子帶中,故用大能量子帶重構(gòu)圖像能消除大量噪聲,使算法有較強的抗噪性,同時體現(xiàn)了多分辨率特性。設(shè)尺度i方向j子帶的大小為N×N,能量計算公式為
式中:i=1,2,…,lbN-3;j=1,2,…,pi/2;pi為尺度i的子帶總數(shù),對于實值Curvelet,Ⅰi,j與Ⅰi,j+pi/2子帶對代表同一方向,因此,為降低運算量,取這兩個子帶的模值(|·|)后計算能量,并用值最大的k個子帶對進行圖像重構(gòu)。而對于復(fù)Curvelet變換,子帶各元素值為復(fù)數(shù),實驗分別取|·|和|·|2后計算能量得到的分類效果,由于復(fù)變換的計算量較大,而子帶對Ii,j與Ii,j+pi/2關(guān)于原點對稱,代表同一方向,因此為減少運算每個尺度只計算前pi/2個子帶的能量,之后選能量大的子帶對重構(gòu)圖像。紋理bubble及其前n(n=1,2,3,4)個尺度的重構(gòu)圖像以及加噪后的重構(gòu)圖像分別如圖3和圖4所示,由圖3可以看出,隨著尺度的增大,重構(gòu)圖像的頻率成分越豐富且頻率越高,同時如圖4所示,由于各尺度選取大能量子帶重構(gòu)圖像,因此有效消除了噪聲的干擾。
3)對重構(gòu)圖像進行抽樣,取絕對值后計算其LBP直方圖。根據(jù)奈奎斯特采樣定理,抽樣頻率應(yīng)大于或等于2倍信號的最高頻率,因此對包含最高頻率成分的重構(gòu)圖像(n=4)不抽樣,而對n=1,2,3的重構(gòu)圖像,行和列分別按抽樣率1/8,1/4,1/2進行抽樣。抽樣后,取絕對值計算旋轉(zhuǎn)不變LBP直方圖,由于計算的是抽樣后圖像的LBP直方圖,因此該LBP算子對應(yīng)抽樣前原圖像更大尺寸的LBP算子,即可表征更大區(qū)域的圖像信息,彌補傳統(tǒng)LBP算法的不足。
4)將全部重構(gòu)圖像的LBP直方圖組合成為特征向量。通過以上分析,該算法提取的特征更加緊湊且具有旋轉(zhuǎn)不變和抗噪性能。
選用如圖5所示Brodatz紋理圖像進行分類實驗,該紋理庫共有bark、brick等13類紋理,且每類均有0°,30°,60°,90°,120°,150°,200°這7個角度。首先將原大小為512×512的圖像分解為16幅128×128像素的子圖,由此每類紋理可產(chǎn)生16×7=112幅子圖。每類紋理的112幅子圖中,從0°和60°的子圖中各選取11幅用于訓(xùn)練,即訓(xùn)練集共包括11×2×13=286幅128×128像素的子圖,其余子圖均用于測試。按照上述特征提取部分描述的算法提取各子圖的特征向量,將全部訓(xùn)練圖像的特征向量集送入多項式核的支持向量機(SVM)進行訓(xùn)練,最后再用SVM對待側(cè)圖像進行分類。
圖5 實驗紋理圖像
對紋理圖像進行實值Curvelet變換,分類結(jié)果如表1所示,當(dāng)重構(gòu)子帶數(shù)k=11時正確分類率達98.89%,過少或過多的子帶均會降低分類率(k=2時為86.67%,k=14時為98.21%)。復(fù)Curvelet變換得到的分類結(jié)果如表2所示,由表2可知,同樣在k=11時對子帶元素取|·|2的分類率最高為96.15%,但相比實值Curvelet得到的98.89%分類率低2.74%。故實值Curvelet變換在重構(gòu)子帶數(shù)k=11的情況下,分類結(jié)果最佳,算法具有良好的旋轉(zhuǎn)不變特性。
表1 實Curvelet平均正確分類率
表2 復(fù)Curvelet時的平均正確分類率
將此情況下各類紋理的具體分類結(jié)果列于表3中,由此看出,全部紋理圖像均可獲得較高的分類率,均在96%以上,紋理基元較大的brick,bubble等紋理的分類可達100%。
表3 各類紋理分類統(tǒng)計結(jié)果
為進一步實驗算法的抗噪性,再對加噪后的紋理庫進行分類實驗。對紋理圖像加不同強度的白噪聲:σ=0.05,0.1,0.15(圖6所示為wood及加噪σ=0.1后的圖像),再用本文算法(實值Curvelet,k=11條件下)進行分類實驗,訓(xùn)練和測試圖像的選取均與實驗1相同,分類結(jié)果如表4所示。從表4可以看出,實驗仍可獲得較高的分類率,在σ=0.15時分類率仍可達92.74%,只比加噪前下降了6.15%。
圖6 實驗紋理圖像
表4 本算法抗噪性實驗結(jié)果
用直接在空域計算圖像旋轉(zhuǎn)不變LBP算子直方圖的方法對原紋理圖像和實驗Ⅱ中的加噪圖像進行分類實驗,并采用相同的訓(xùn)練圖像和測試圖像,實驗結(jié)果如表5所示。對原紋理圖像,改進前的算法分類率為96.15%,對加噪后的圖像,分類率大幅度下降,在σ=0.1和σ=0.15時分別降低10.59%和30%,而由表1和表4所示實驗結(jié)果可知,改進后算法對原紋理的分類率為98.89%,分類率顯著提高,而對加噪后的圖像仍可獲得較高的分類率,誤分類率明顯小于改進前算法。因此可驗證本文提出改進后的算法能夠有效提高分類率并且具有較強的抗噪性能。
表5 改進前算法抗噪性實驗結(jié)果
另外,將本算法與文獻[6]用Gabor變換計算微模型參數(shù)構(gòu)成宏觀特征的方法對該紋理庫的分類結(jié)果進行比較,文獻[6]分類率為96.79%,且特征向量維數(shù)為208,用7個角度估計模型參數(shù)。而本算法的分類率比文獻[6]提高了2.1%,并且特征向量維數(shù)為72,僅用0°和60°兩個角度對SVM進行訓(xùn)練,因此本文改進后算法提取的特征更加緊湊有效,可以實現(xiàn)更優(yōu)的分類效果。
針對已有直接在空域計算圖像LBP直方圖的紋理分類算法的不足,提出一種空域和頻域結(jié)合的基于Curvelet大能量方向子帶多分辨率LBP特征的旋轉(zhuǎn)不變和抗噪紋理分類算法。對圖像進行Curvelet變換后用各尺度大能量方向子帶對圖像進行重構(gòu)并重新抽樣,進而計算抽樣后重構(gòu)圖像的LBP直方圖,直接用得到的直方圖作為特征向量并用SVM實現(xiàn)分類。通過本算法提取的特征向量實現(xiàn)了多分辨率且更加緊湊,能夠更準(zhǔn)確地表征較大基元的紋理,克服了傳統(tǒng)LBP分類法的不足。另外,本算法還具有較強的抗噪性能,這在實際應(yīng)用中是非常重要的。同時結(jié)合基于最優(yōu)分類超平面思想的支持向量機進行分類,實驗結(jié)果表明,算法能夠顯著提高正確分類率,對實驗紋理庫的平均正確分類率可達98.89%,而且具有較強的抗噪性能。
[1]MANJUNATH B S,OHM J R,VASUDEVAN V V,et al.Color and texture descriptors[J].IEEE Trans.Circuits and Systems for Video Technology,2001(116):703-715.
[2]BORBER M.MPEG-7 visual shape descriptors[J].IEEE Trans.Circuits and Systems for Video Technology,2001(116):716-719.
[3]CANDES E J,GUO F.New multiscale transforms,minimum total variation synthesis:applications to edge-preserving image reconstruction[J].Signal Processing,2002,82(11):1519-1543.
[4]CANDES E J,DEMANET L,DONOHO D L,et al.Fast discrete curvelet transforms[J].Multiscale Modeling and Simulation,2006,5(3):861-899.
[5]OJALA T,PIETIKAINEN M.Multiresolution gray-scale and rotation invariant texture classification with local binary patterns[J].IEEE Trans.Pattern Analysis and Machine Intelligence,2002,24(7):971-987.
[6]GEORGE M H,MANJUNATH B S.Rotation-invariant texture classification using a complete space-frequency model[J].IEEE Trans.Image Processing,1999,8(2):255-269.