李春華,秦志英
(河北科技大學(xué)a.信息科學(xué)與工程學(xué)院;b.機(jī)械電子與工程學(xué)院,河北 石家莊050018)
圖像稀疏表示旨在確保圖像精度的前提下,用數(shù)量最少的基函數(shù)組合近似表示圖像,使圖像的特征用盡量少的變換系數(shù)表達(dá)出來(lái),在圖像壓縮、特征提取、圖像檢索、圖像去噪和圖像復(fù)原等應(yīng)用中具有重要作用。Vinje和Gallant通過(guò)生理學(xué)的實(shí)驗(yàn)顯示[1],主視覺皮層的神經(jīng)元在接受自然圖像作為輸入刺激時(shí),其響應(yīng)是滿足稀疏性的,證實(shí)了圖像稀疏表示模型能夠有效匹配人類的視覺感知特性。
Mallat和Zhang將Coimfan和Wickerhauesr等提出的信號(hào)稀疏分解概念推廣到圖像處理領(lǐng)域[2-3]。在圖像稀疏表示中,基函數(shù)的選擇是關(guān)鍵?;瘮?shù)與圖像信號(hào)的結(jié)構(gòu)越匹配,越容易形成圖像的稀疏表示。隨著多尺度幾何分析的興起,出現(xiàn)了Ridgelet,Curvelet,Contourlet,Wedgelet等一系列圖像稀疏表示的超小波方法。它們放寬了正交基表示圖像的嚴(yán)格條件限制,采用框架(超完備基)來(lái)表示圖像,獲得更好的圖像表示效果。本文針對(duì)Fourier變換和小波變換用于圖像表示應(yīng)用存在的不足,研究了各種新興起的超小波變換稀疏表示圖像的方法,分析了它們各自的特點(diǎn)與優(yōu)勢(shì),并對(duì)未來(lái)發(fā)展進(jìn)行了展望。
經(jīng)典的Fourier變換可以對(duì)平穩(wěn)信號(hào)形成最優(yōu)表示,但表示圖像這種非平穩(wěn)信號(hào)時(shí),只能把圖像分解成具有不同強(qiáng)度和不同頻率的分量組合,而不能同時(shí)表示出頻率分量在圖像上出現(xiàn)的位置,喪失了圖像的空間分析特性。小波基具有良好的空間-頻率局部化特性,較好地解決了Fourier變換在時(shí)域分析和頻域分析之間的矛盾,被靜止圖像編碼新標(biāo)準(zhǔn)JPEG2000選用。但是圖像表示通常采用二維可分離小波基,基函數(shù)各向同性,只能有效表示零維奇異點(diǎn)。這是因?yàn)槎S可分離小波基是由一維小波基通過(guò)張量積的方式推廣得到的,支撐區(qū)間在不同分辨力下,表現(xiàn)為不同尺寸大小的正方形,不具有各向異性特征。它在表示圖像邊緣時(shí),相當(dāng)于用一系列的“點(diǎn)”去捕捉圖像中的“線”。這種維度的差異嚴(yán)重影響了小波的逼近效率,導(dǎo)致在邊緣輪廓處聚集了大量的大幅度小波系數(shù)。而且可分離二維小波變換在表示圖像時(shí),只能表達(dá)出水平、垂直和對(duì)角3個(gè)方向的圖像信息,不利于完整表達(dá)自然圖像[4]。為了克服實(shí)數(shù)小波變換的時(shí)移敏感性和方向性缺乏的缺陷,Kingsbury提出了復(fù)數(shù)小波稀疏表示圖像的方法[4],用兩個(gè)實(shí)數(shù)濾波器分別近似逼近復(fù)小波的實(shí)部和虛部,具有近似的平移不變性和更多的方向選擇性。復(fù)小波變換采用雙樹結(jié)構(gòu),一樹生成變換的實(shí)部,一樹生成虛部[4-5],變換后產(chǎn)生了6個(gè)方向的高頻子圖像,分別指向±15°,±45°,±75°。但是分析方向數(shù)目還是無(wú)法滿足自然圖像角度分辨力的要求。由此看來(lái),小波變換只能最優(yōu)描述零維奇異目標(biāo)函數(shù),表示二維或更高維奇異性信號(hào)存在明顯缺陷。
最近幾年,出現(xiàn)了一些新的圖像變換表示方法:如脊波(Ridgelet)、曲波(Curvelet)、輪廓波(Contourlet)、線波(Beamlet)、楔波(Wedgelet)、板波(Platelet)等。這些方法的基本思想是為了使基函數(shù)能更好地表現(xiàn)圖像特征,放寬了對(duì)基函數(shù)的正交性要求,改用一組超完備的框架基作為圖像稀疏表示的原子。事實(shí)證明,基于超小波變換的圖像表示方法可以更加稀疏地表示圖像。
超小波關(guān)注如何表達(dá)圖像的不連續(xù)性(或奇異性),沿襲小波的理論模式,構(gòu)造出一些列能夠多分辨力表達(dá)圖像的“基”或“標(biāo)架”,這些超小波的母函數(shù)具有各向異性的特點(diǎn),通過(guò)靈活地調(diào)整基的方向和支撐區(qū)間的形狀,可以用較少的系數(shù)快速有效地捕捉圖像的奇異信息。它們具有下列共同特點(diǎn):
1)具有幾何規(guī)則性,能夠逼近圖像中任意方向的線、曲線的不連續(xù)性;
2)有容易計(jì)算的分析(正變換)和綜合(反變換)表達(dá);
3)對(duì)分析(變換)域的結(jié)果有明確的物理解釋,便于實(shí)施去噪、壓縮的近似處理,以及超分辨重建的進(jìn)一步工作。
脊波理論由Emmanuel J Candes在1998年提出[6],一個(gè)典型的Ridgelet母函數(shù)如圖1所示,具有各向異性的特點(diǎn)。小波變換是逐點(diǎn)刻畫點(diǎn)的奇異性,而Ridgelet變換是沿脊線刻畫線的奇異性。因此,Ridgelet變換在方向選擇和識(shí)別方面,比小波變換性能優(yōu)越,可以更有效地表示信號(hào)的一維方向奇異特征。
用脊波作為基函數(shù)來(lái)檢測(cè)直線特征,可以有效地捕獲各個(gè)尺度、各個(gè)位置和各個(gè)方向上的信息,逼近直線型奇異函數(shù)具有優(yōu)越性。然而自然圖像的邊緣不一定都是直線型的,脊波變換不能很好地處理曲線奇異性,這樣脊波變換就滿足不了要求。
圖1 Ridgelet母函數(shù)
為了表示圖像中的曲線奇異性,文獻(xiàn)[7]提出了單尺度脊波變換,把圖像固定尺度均勻剖分,每個(gè)剖分塊中的曲線近似看作直線。在剖分塊中,再對(duì)每個(gè)分塊進(jìn)行脊波變換。單尺度Ridgelet變換巧妙地將曲線奇異轉(zhuǎn)化為直線奇異來(lái)處理。
以單尺度Ridgelet變換為基礎(chǔ),E.J.Candes和D.L.Donoho構(gòu)造了多尺度Ridgelet,也就是第一代Curvelets變換[8]。第一代Curvelet先對(duì)圖像作小波變換,然后對(duì)不同尺度的子帶圖像采用不同大小的尺寸分塊后進(jìn)行脊波變換。Curvelets變換能在所有可能的尺度上進(jìn)行Ridgelet變換,克服了單尺度脊波變換固定尺度的缺陷,對(duì)曲線狀奇異特征具有稀疏表示的能力。
但是Curvelet變換存在數(shù)字實(shí)現(xiàn)復(fù)雜、數(shù)據(jù)冗余量巨大的缺陷。而且,由于Curvelet變換是基于塊剖分的變換,重構(gòu)圖像中存在塊邊界效應(yīng)。為了解決這一問(wèn)題,需要預(yù)先對(duì)各剖分塊進(jìn)行疊加處理。這樣不僅運(yùn)算復(fù)雜度增大,還加大了變換系數(shù)的冗余度。于是,Candes等人又提出了實(shí)現(xiàn)更簡(jiǎn)單、更便于理解的第二代Curvelet變換[9]。定義徑向窗函數(shù)W(r)和角度窗函數(shù)V(t),它們滿足可允許條件
對(duì)于每一個(gè)j≥j0,定義傅里葉頻率的頻率窗:Uj(r,,其中?」表示下取整,Uj的支撐區(qū)間是受W和V支撐區(qū)間限制獲得的楔形區(qū)域,方向數(shù)目隨尺度隔層加倍。對(duì)應(yīng)的時(shí)域支撐區(qū)域具有各向異性,如圖2所示。Curvelet變換能用極少的非零系數(shù)精確表達(dá)圖像邊緣,可以在確保低均方誤差的約束下,實(shí)現(xiàn)圖像表示數(shù)據(jù)精簡(jiǎn)性與精確性的平衡。
圖2 Curvelet變換
鑒于Curvelet變換是一種頻率定義的方法,導(dǎo)致笛卡兒坐標(biāo)與極坐標(biāo)間轉(zhuǎn)換需要插值計(jì)算。M.N.Do和Martin Vetterli直接從離散時(shí)間域提出一種與Curvelet類似的方向性多分辨變換——Contourlet變換[10],更適合數(shù)字圖像表示。
Contourlet變換作為Curvelet變換的另一種快速數(shù)字實(shí)現(xiàn)方式,繼承了Curvelet變換支撐區(qū)間各向異性的多尺度關(guān)系特點(diǎn)。如圖3所示,它將多尺度分析和方向分析分拆進(jìn)行,首先用拉普拉斯塔形分解方法搜索邊緣奇異點(diǎn),再用方向?yàn)V波器組將位置相近的奇異點(diǎn)集結(jié)成輪廓線段。Contourlet變換基的支撐區(qū)間是“長(zhǎng)條形”結(jié)構(gòu),其長(zhǎng)寬比隨尺度變化,如圖4所示。Contourlet表示圖像邊緣的系數(shù)能量更加集中,對(duì)于曲線有更“稀疏”的表達(dá)。圖5、圖6分別為小波變換和Contourlet變換用相同數(shù)量的系數(shù)重建圖像的效果。
2007年,Guo和Labate等人提出了一種新的接近最優(yōu)的多維函數(shù)表示方法——剪切波(Shearlet)變換[11]。相對(duì)于輪廓波變換來(lái)說(shuō),Shearlet變換具有完備的理論和數(shù)學(xué)基礎(chǔ),它與小波變換類似,通過(guò)一個(gè)基本函數(shù)的膨脹、剪切和平移變換來(lái)構(gòu)造基函數(shù),可以在廣義多分辨分析的框架下進(jìn)行研究,它在頻率空間沿斜率方向逐層加倍細(xì)分,并且對(duì)剪切操作在方向數(shù)目上沒有限制。Shearlet變換是一種更為靈活的數(shù)字圖像表示方法,可以對(duì)圖像進(jìn)行靈活的多分辨和多方向分解,對(duì)圖像中的邊緣和紋理等細(xì)節(jié)信息給出接近最優(yōu)的性能表示。
為了確定圖像中線段的端點(diǎn)及長(zhǎng)度信息,Donoho提出了連續(xù)Beamlet變換及其在多尺度分析中的應(yīng)用[12],Xiaoming Huo提出了離散Beamlet變換[13]。在文獻(xiàn)[14]中,Donoho用Beamlet分析的理論框架將Beamlet變換和Wedgelet變換統(tǒng)一為Beamlet多尺度幾何分析理論。
在n×n的二進(jìn)方塊內(nèi)連接邊界上任意兩個(gè)像素點(diǎn)就構(gòu)成了一條離散小線基,基上的像素點(diǎn)可通過(guò)插值法確定。各種方向、尺度和位置的小線基的集合形成小線庫(kù)。數(shù)字圖像在一條小線基上的離散Beamlet變換,就是這條小線基上各像素灰度值的和。Beamlet變換對(duì)線定位精確、簡(jiǎn)單易行,變換系數(shù)以金字塔方式組織,從而實(shí)現(xiàn)多尺度分析。
Donoho進(jìn)而提出了Wedgelet變換,與Beamlet變換結(jié)合,使用多尺度Wedgelet基對(duì)圖像輪廓進(jìn)行分段線性近似[15]。一個(gè)圖像子塊借助一條分割線分成兩個(gè)楔塊,每一個(gè)楔塊用唯一的特征值表示。Wedgelet變換使用線的位置、兩個(gè)楔塊的特征值近似描述了這個(gè)子塊的性質(zhì)。
在應(yīng)用中先利用Beamlet詞典生成Beamlet基,Wedgelet基在Beamlet基的基礎(chǔ)上生成。在Wedgelet變換中,圖像中的邊緣用所選取的最優(yōu)Beamlet基來(lái)分段近似表示。
自然圖像是包含多種形態(tài)結(jié)構(gòu)成分(Morphological Diversity)的復(fù)雜信號(hào),而現(xiàn)在常用的傅里葉變換和小波變換無(wú)法最優(yōu)地表達(dá)圖像中各種類型的結(jié)構(gòu)。本文針對(duì)傅里葉變換和小波變換稀疏表示圖像存在的問(wèn)題,較為全面地分析了近來(lái)新出現(xiàn)的各種超小波表示圖像方法。超小波建立在冗余框架下,用過(guò)完備字典分解圖像?;姆N類和個(gè)數(shù)有所增加,便于表示圖像中的各種幾何結(jié)構(gòu),如邊緣、輪廓、角點(diǎn)、紋理等,為圖像稀疏表示提供了更好的選擇。
從圖像稀疏表示的發(fā)展進(jìn)程來(lái)看,圖像表示的基函數(shù)經(jīng)歷了從非冗余的正交基到適度冗余的緊框架變遷,正在向過(guò)完備字典演進(jìn)。過(guò)完備字典放棄了正交性約束,能夠凸顯圖像中有意義的局部特征,更好地抵御噪聲干擾。
[1]VINJE W E,GALLANT J L.Sparse coding and decorrelation in primary visual cortex during natural vision[J].Science,2000,287(5456):1273-1276.
[2]COIFMAN R R,WICKERHAUSE M V.Entropy-based algorithms for best basis selection[J].IEEE Trans.Information Theory,1992,38(2):713-718.
[3]BERGEAUD F,MALLAT S.Matching pursuit of imgaes[C]//Proc.International Conference on Image Processing.[S.l.]:IEEE Press,1995,1:53-56.
[4]KINGSBURY N.Image processing with complex wavelets[J].Phil.Trans.Roy.Soc.Lond.A.,1999,357(1760):2543-2560.
[5]KINGSBURY N.The dual-tree complex wavelet transform:a new efficient tool for image restoration and enhancement[C]//Proc.European Signal Processing Conf.Rhodes:EURASIP Press,1998:319-322.
[6]CANDES E J,DONOHO D L.Ridgelets:a key to higher-dimensional intermittency?[J].Phil.Trans.R.Soc.Lond.A.,1999,357(1760):2495-2509.
[7]CANDES E J.Ridgelets and the representation of mutilated Sobolev functions[J].SIAM Journal on Mathematical Analysis,2001,33(2):347-368.
[8]CANDES E J,DONOHO D L,Curvelets:A surprisingly effective nonadaptive representation for objects with edges[R].USA:Department of Statistics,Stanford University,2000.
[9]CANDES E J,DEMANET L,DONOHO D,et al.Fast discrete curvelet transforms[J].Multiscale Modeling Simulation,2006,5(3):861-899.
[10]DO M N,VETTERLI M.The contourlet transform:an efficient directional multiresolution image representation[J].IEEE Trans.Image Processing,2005,14(12):2091-2106.
[11]GUO K,LABATE D.Optimally sparse multidimensional representation using shearlets[J].SIAM Journal on Mathematical Analysis,2007,39(1):298-318.
[12]HUO Xiaoming.Sparse image representation via combined transforms[D].Stanford:Stanford University,1999.
[13]HUO Xiaoming,CHEN Jihong.JBEAM:multiscale curve coding via beamlets[J].IEEE Trans.Image Processing,2005,14(11):1665-1677.
[14]DONOHO D L,HUO Xiaoming.Beamlets and multiscale image analysis[M].Berlin:Springer Press,2001.
[15]DONOHO D L.Wedgelet:Nearly minimax estimation of edges[J].Annuals of Statistics,1999,27(3):859-897.