宋允東,王永芳,2,商習(xí)武,張兆楊,2
(1.上海大學(xué) 通信與信息工程學(xué)院,上海 200072;2.新型顯示技術(shù)及應(yīng)用集成教育部重點(diǎn)實(shí)驗(yàn)室,上海 200072)
當(dāng)今信息社會(huì),海量數(shù)據(jù)加劇了信息處理、傳輸以及存儲(chǔ)的難度。在信息的獲取上,采集到的數(shù)據(jù)量并不一定都是必需的,能不能直接采集少量的必需數(shù)據(jù)來(lái)表示原來(lái)的信息呢?此外,數(shù)據(jù)量的增大對(duì)硬件設(shè)備的要求徒然提高,迫使需要轉(zhuǎn)換思路去解決問(wèn)題,壓縮感知正是在這種背景下應(yīng)運(yùn)而生。
壓縮感知(Compressive Sensing,CS)最早是由Donoho等人在2006年正式提出的一種新數(shù)學(xué)方法[1],廣泛地應(yīng)用于信號(hào)處理領(lǐng)域,引起了國(guó)內(nèi)外科學(xué)界的高度關(guān)注。傳統(tǒng)的信號(hào)采樣是在奈奎斯特采樣定理的規(guī)則下進(jìn)行的,信號(hào)帶寬的增大使得兩倍以上信號(hào)帶寬的采樣頻率變得越發(fā)困難。壓縮感知指出可以以低于奈奎斯特帶寬的頻率進(jìn)行采樣,并且能夠精確地重建原始信號(hào)。
目前國(guó)內(nèi)外把壓縮感知應(yīng)用于圖像編碼的研究已經(jīng)有了相當(dāng)?shù)倪M(jìn)展。文獻(xiàn)[2]提出了圖像采用分塊2D-DCT的CS比1D-DCT的CS在減少?gòu)?fù)雜度的基礎(chǔ)上能更好地重建原始信息。文獻(xiàn)[3]提出了新的觀測(cè)矩陣CHT,實(shí)驗(yàn)證明此方法可用更少的測(cè)量數(shù)來(lái)重建信號(hào)。文獻(xiàn)[4]提出對(duì)基于CS分塊的DWT進(jìn)行OMP重建,與整幅圖像相比不但降低重建復(fù)雜度,而且減少所需內(nèi)存空間。
本文在分析壓縮感知基本原理的基礎(chǔ)上,提出了對(duì)DCT系數(shù)進(jìn)行JND(Just Noticeable Distortion)預(yù)處理以增加其稀疏性。實(shí)驗(yàn)結(jié)果表明,基于JND的CS圖像編碼減少CS的重建時(shí)間,提高圖像的重建質(zhì)量,并且對(duì)加性噪聲具有很好的穩(wěn)健性。
壓縮感知理論基本思想是只要信號(hào)在某一個(gè)正交空間具有稀疏性,就可以用一個(gè)與變換基不相關(guān)的觀測(cè)矩陣把高維信號(hào)投影在低維空間,然后通過(guò)求解最優(yōu)化問(wèn)題從少量投影中以高概率重構(gòu)原信號(hào)。壓縮感知理論包括3個(gè)核心問(wèn)題[1,5]:信號(hào)稀疏性變換、觀測(cè)矩陣設(shè)計(jì)以及重建算法。首先,信號(hào)X∈RN在某個(gè)正交基或緊框架ψ上是稀疏的(變換系數(shù)Θ=ψTX,Θ是ψ的等價(jià)或逼近稀疏表示);然后,設(shè)計(jì)一個(gè)平穩(wěn)的與變換基ψ不相關(guān)的M×N維的觀測(cè)矩陣Ф,對(duì)Θ進(jìn)行觀測(cè)得到觀測(cè)集合Y=ФΘ=ФψTX;最后,通過(guò)利用L0范數(shù)意義下的優(yōu)化問(wèn)題求解X的精確或近似逼近。國(guó)內(nèi)外專家對(duì)CS理論的研究主要是針對(duì)以上3個(gè)核心內(nèi)容展開的。
1)稀疏性
信號(hào)的稀疏性是應(yīng)用壓縮感知理論的前提條件。自然界中的大多數(shù)信號(hào)很難滿足稀疏性,但是可以采用某個(gè)變換基使其成為稀疏的表示,也就是其滿足可壓縮性,這種信號(hào)同樣可以適用于壓縮感知理論。常見的稀疏變換基有DCT變換基、DWT變換基、離散傅里葉變換基、Walsh變換基等。
2)觀測(cè)矩陣
觀測(cè)矩陣是觀測(cè)向量獲取和信號(hào)重建的關(guān)鍵,觀測(cè)矩陣的性能不僅對(duì)信號(hào)的壓縮和采樣過(guò)程有著重要的影響。觀測(cè)矩陣的設(shè)計(jì)通常建立在約束等距性理論(Restricted Isometry Principle,RIP)[6]基礎(chǔ)上,其等價(jià)條件是觀測(cè)矩陣Ф和稀疏基ψ不相關(guān),在RIP指導(dǎo)下,目前常用的觀測(cè)矩陣分為隨機(jī)觀測(cè)矩陣和確定性觀測(cè)矩陣。常用的隨機(jī)觀測(cè)矩陣如高斯隨機(jī)觀測(cè)矩陣、傅里葉隨機(jī)觀測(cè)矩陣、貝努利觀測(cè)矩陣等。其優(yōu)點(diǎn)在于它幾乎與任意稀疏信號(hào)都不相關(guān),因而所需的觀測(cè)次數(shù)最少,且能較好地重建原始信號(hào),但其缺點(diǎn)是占有大量存儲(chǔ)空間,且計(jì)算復(fù)雜度較高,難以在硬件中實(shí)現(xiàn)。
3)重建算法
在一定程度上,壓縮感知的重建算法就是求一個(gè)欠定方程的解,即從一個(gè)低維的采集數(shù)據(jù)中重建出高維的原始信號(hào)。重建質(zhì)量的好壞也直接影響著壓縮感知能否從理論研究走向?qū)嶋H的應(yīng)用。重建是一個(gè)非線性過(guò)程,必須要找到信號(hào)的最稀疏系數(shù)[5],即解決一個(gè)最小L0范數(shù)問(wèn)題[7]。目前正交匹配追蹤(Orthogonal MP,OMP)[8]算法研究廣泛。
JND是基于心理學(xué)和生理學(xué)最小可察覺失真的視覺冗余表征模型,能夠很好地描述人眼的視覺敏感特性。它通過(guò)設(shè)置一個(gè)閾值屏蔽掉人的視覺不能察覺到的噪聲變化,從而達(dá)到去除視覺冗余的目的。在圖像和視頻的預(yù)處理、碼流控制、自適應(yīng)量化以及運(yùn)動(dòng)估計(jì)中都可以得到廣泛的應(yīng)用,精確的JND模型對(duì)于改善圖像視頻的編碼復(fù)雜度有著至關(guān)重要的作用。
JND模型主要有3種:基于像素域的JND模型、基于DCT域的JND模型和基于DWT的JND模型。目前基于DCT變換的JND模型得到了廣泛研究。然而,由于目前還沒有完全掌握人類視覺系統(tǒng)的特性,JND模型不能與人言特性完全吻合,精確度有待提高。本文是在文獻(xiàn)[9]的基礎(chǔ)上融合壓縮感知進(jìn)行圖像編碼,取得了顯著效果。
從壓縮感知原理中得知,信號(hào)的稀疏性對(duì)信號(hào)的重建具有決定性的意義。隨著信號(hào)稀疏性增大,信號(hào)的解碼復(fù)雜度會(huì)降低,重建效果有一定的提高。本文采用分塊DCT變換作為稀疏基。
引入JND模型對(duì)圖像DCT變換的系數(shù)進(jìn)一步稀疏化。采用JND模型對(duì)7個(gè)測(cè)試圖像的DCT系數(shù)進(jìn)行濾波處理,對(duì)低于JND閾值的DCT系數(shù)置零處理,如表1可以看出,經(jīng)過(guò)JND處理后的系數(shù)出現(xiàn)很多的零,信號(hào)變得更稀疏了。這也表明在不影響主觀質(zhì)量的基礎(chǔ)下,增加了DCT系數(shù)的稀疏性。
表1 DCT系數(shù)變化表
本文在分析CS圖像編碼和JND模型的各自特點(diǎn)后,提出了在原有CS圖像編碼重建中嵌入JND模型的方法,通過(guò)對(duì)DCT系數(shù)進(jìn)行JND預(yù)處理來(lái)增加DCT零系數(shù)的數(shù)量。鑒于分塊DCT變換可以減少存儲(chǔ)空間,提高圖像重構(gòu)質(zhì)量,提出采用分塊變換的編碼方法,其框圖如圖1所示。
圖1 基于JND的CS編解碼框圖
具體的編碼步驟如下:
1)對(duì)信號(hào)進(jìn)行稀疏變換,采用分塊DCT變換,通過(guò)DCT變換可得到K稀疏的圖像信號(hào);
2)采用DCT域的JND對(duì)DCT系數(shù)進(jìn)行預(yù)處理;
3)產(chǎn)生一M×N(M 4)采用OMP重建算法對(duì)DCT系數(shù)進(jìn)行重建; 5)對(duì)重建的DCT信號(hào)進(jìn)行分塊DCT反變換,這就得到了原始圖像信號(hào)。 本實(shí)驗(yàn)中選取128×128的測(cè)試圖像Lena,Organ,F(xiàn)oreman,Cameraman。將提出的算法與文獻(xiàn)[10]作比較,對(duì)比圖像的重建效果和運(yùn)算復(fù)雜度。本文采用隨機(jī)矩陣作為觀測(cè)矩陣,每一次重建結(jié)果會(huì)有可允許的變化(±2%)。 表2給出了有無(wú)JND處理的壓縮感知圖像重建時(shí)間和圖像的PSNR的實(shí)驗(yàn)數(shù)據(jù)。由表2可以明顯看到加入JND后,同樣的觀測(cè)數(shù)下壓縮感知的OMP重建時(shí)間平均提高50%以上,也就是復(fù)雜度相應(yīng)地減小了一半多;隨著觀測(cè)數(shù)的增多,圖像重建時(shí)間的減少幅度也增大。當(dāng)觀測(cè)數(shù)M小于90時(shí),重建圖像的PSNR有所增大;然而隨著觀測(cè)數(shù)M進(jìn)一步增大,由于JND模型對(duì)人眼不敏感信息的濾除,重建圖像的PSNR也不再提高,甚至有所下降,但圖像的主觀質(zhì)量相當(dāng)。 表2 有無(wú)JND處理的實(shí)驗(yàn)結(jié)果對(duì)比 此外,對(duì)不同類型的測(cè)試圖像可以看到對(duì)于細(xì)節(jié)變化緩慢的Organ圖像,PSNR提高的幅度顯著增大,這進(jìn)一步證明了壓縮感知在細(xì)節(jié)緩慢變化圖像如MRI的巨大應(yīng)用價(jià)值。分析以上實(shí)驗(yàn)的結(jié)論,還是要回歸到壓縮感知的本質(zhì)上,正是由于JND閾值的引入,使得圖像的DCT稀疏性大大增強(qiáng),這使得其在重建時(shí)間和效果上有了相應(yīng)提高。圖2a和圖3a為本文方法的重建圖像,圖2b和圖3b是文獻(xiàn)[10]方法的重建圖像。由圖表明采用本文方法的CS重建圖像,在相同的觀測(cè)下,主觀效果優(yōu)于文獻(xiàn)[10]方法的重建效果。 根據(jù)壓縮感知的原理,測(cè)量后的任何一個(gè)觀測(cè)數(shù)據(jù)在重建原始數(shù)據(jù)上的貢獻(xiàn)相同,這就決定了少數(shù)數(shù)據(jù)的丟失損壞不會(huì)影響最終的重建效果。這一特性使信號(hào)在面對(duì)加性噪聲的干擾時(shí),能夠有好的穩(wěn)健性,不失真地重建出原始圖像。 在上述實(shí)驗(yàn)平臺(tái)下,基于JND的CS圖像編碼對(duì)觀測(cè)數(shù)據(jù)引入不同的加性噪聲。表3給出了數(shù)據(jù)對(duì)比,在兩種不同信噪比的噪聲下,重建圖像的PSNR只有略微的降低。通過(guò)圖4和圖5可以看到,在觀測(cè)數(shù)據(jù)加入10 dB加性噪聲時(shí)重建圖像的主觀質(zhì)量并沒有下降。 通過(guò)實(shí)驗(yàn)可驗(yàn)證加入加性噪聲對(duì)圖像的效果影響不大,加之考慮到隨機(jī)測(cè)量矩陣隨機(jī)性影響的誤差,可以得出壓縮感知具有很好的編碼穩(wěn)健性。 表3 有無(wú)噪聲的重建效果對(duì)比 圖4 Lena本文算法重建圖(M=80) 圖5 Organ本文算法重建圖(M=80) 本文在對(duì)壓縮感知原理分析探索的基礎(chǔ)上,提出了用JND模型來(lái)稀疏DCT系數(shù)的算法,實(shí)驗(yàn)證明基于JND的CS可以降低重建算法復(fù)雜度,同時(shí)有很好的穩(wěn)健性。綜上所述,在JND壓縮感知框架下的圖像編碼方法是一個(gè)新的課題,值得深入地探討。未來(lái)還需要研究適應(yīng)于JND模型下的測(cè)量矩陣,以及進(jìn)一步降低復(fù)雜度的重建算法,使此方法向?qū)崟r(shí)應(yīng)用發(fā)展。 [1]DONOHO D L.Compressed sensing[J].IEEE Trans.Information Theory,2006,52(4):1289-1306. [2]BAI Huihui,WANG Anhong,ZHANG Mengmeng.Compressive sensing for DCT image[C]//Proc.2010 International Conference on Computational Aspects of Social Networks.[S.l.]:IEEE Press,2010:378-381. [3]KUMAR N R,XIANG Wei,SOAR J.A novel image compressive sensing method based on complex measurements[C]//Proc.2011 International Conference on Digital Image Computing Techniques and Applications.[S.l.]:IEEE Press,2011:175-179. [4]SERMWUTHISARN P,AUETHAVEKIAT S,PATANAVIJIT V.A fast image recovery using compressive sensing technique with block based orthogonal matching pursuit[C]//Proc.2009 International Symposium on Intelligent Signal Processing and Communication Systems.[S.l.]:IEEE Press,2009:212-215. [5]TRALIC D,GRGIC S.Signal reconstruction via compressive sensing[C]//Proc.ELMAR.[S.l.]:IEEE Press,2011:5-9. [6]CANDES E J,TAO T.Decoding by linear programming[J].IEEE Trans.Information Theory,2005,51(2):4203-4215. [7]CANDES E J,ROMBERG J,TAO T.Robust uncertainty principles:exact signal reconstruction from highly incomplete frequency information[J].IEEE Trans.Information Theory,2006,52(2):489-509. [8]TROPP J,GILBERT A.Signal recovery from partial information via orthogonal matching pursuit[J].IEEE Trans.Information Theory,2007,53(12):4655-4666. [9]WEI Z,NGAN K N.Spatio-temporal just noticeable distortion profile for grey scale image/video in DCT domain[J].IEEE Trans.Circuits and Systems for Video Technology,2009,19(3):337-346. [10]SHEN Mingxin,LIU Wenbo.Image reconstruction technique based on the compressed sensing theory[J].Electronic Science and Technology,2011,24(3):9-12.2 實(shí)驗(yàn)結(jié)果及分析
2.1 基于JND的CS性能仿真
2.2 基于JND的CS的穩(wěn)健性仿真
3 結(jié)論