馬 蕾,賀鵬飛
(1.北京電子科技職業(yè)學(xué)院電信工程學(xué)院,北京 100176;2.中國人口與發(fā)展研究中心信息網(wǎng)絡(luò)部,北京 100081)
多媒體圖像信息壓縮是實(shí)現(xiàn)網(wǎng)絡(luò)圖像快速檢索的關(guān)鍵步驟。壓縮方法主要包含有損與無損兩種。無損壓縮就是在整個壓縮過程中圖像信息不會丟失,在解壓后圖像質(zhì)量保持不變。有損壓縮是對熵壓縮,通常用于聲音與圖像等數(shù)據(jù)的壓縮,因此會存在失真現(xiàn)象,出現(xiàn)較多冗余零系數(shù),導(dǎo)致圖像模糊。如何增強(qiáng)壓縮后的圖像質(zhì)量已經(jīng)成為圖像處理領(lǐng)域的研究重點(diǎn)與難點(diǎn)。相關(guān)學(xué)者也提出了研究成果。
索士堯等[1]針對壓縮后的圖像存在塊效應(yīng)問題,采用壓縮模型進(jìn)行壓縮圖像的塊效應(yīng)消除處理,通過壓縮比獲取壓縮信息并建立圖像壓縮程序模型。這種方法在最大后驗(yàn)框架下,構(gòu)建塊效應(yīng)去除算法,并且通過代價函數(shù)對算法的性能進(jìn)行驗(yàn)證。試驗(yàn)表明,該方法具有更可靠的客觀參數(shù)與主觀視覺效果。杜秀麗等[2]針對圖像的壓縮失真問題,采用灰度共生矩陣進(jìn)行圖像的壓縮感知處理,構(gòu)建共生矩陣進(jìn)行圖像的紋理特征提取,使紋理較為復(fù)雜的字塊獲取較高采樣率。這種方法對壓縮后的圖形進(jìn)行重構(gòu),以提高圖像的壓縮質(zhì)量。試驗(yàn)結(jié)果顯示,該方法改善了局部圖像畫質(zhì)。
上述兩種方法在一定程度上解決了壓縮后的圖像模糊現(xiàn)象,但不能有效去除冗余零系數(shù)。為進(jìn)一步提升海量多媒體圖像壓縮后的質(zhì)量,本文設(shè)計(jì)了一種冗余零系數(shù)消除算法,用于海量多媒體圖像的壓縮過程。
離散余弦變換(discrete cosine transform,DCT)算法是將圖像從空域轉(zhuǎn)換到頻域??沼蛑芯哂休^強(qiáng)相關(guān)性的信息在頻域中會集中能量,因此需在頻域中實(shí)現(xiàn)高能區(qū)域處理而忽視低能區(qū)域部分,以達(dá)到減少空間冗余的目的[3-4]。
通過計(jì)算多媒體圖像的信息熵[5],可以明確圖像中信息的不確定性。信息隨機(jī)變量的期望值如式(1)所示。
(1)
式中:q(x)為圖像信息隨機(jī)變量;I(x)為期望值。
多媒體圖像中各灰度值像素點(diǎn)分布概率與區(qū)域不同,使得圖像表現(xiàn)出不同形態(tài)[6]。一般情況下,圖像灰度點(diǎn)區(qū)間為[0,255]。在灰度點(diǎn)區(qū)間范圍內(nèi)構(gòu)建灰度信息熵計(jì)算式如式(2)所示。
(2)
式中:pt為灰度像素t的出現(xiàn)概率。
若將不同灰度值的熵進(jìn)行累加并定義成圖像信息熵,則多媒體圖像信息熵的計(jì)算式如式(3)所示。
(3)
綜上所述,計(jì)算信息熵的過程就是獲取圖像中離散隨機(jī)變量,即獲取像素點(diǎn)灰度值概率分布函數(shù)的過程[7]。
輸入:掃描行Li中的像素點(diǎn)數(shù)量與所處位置像素點(diǎn)灰度值。
輸出:掃描行信息熵。
計(jì)算圖像信息熵可分為以下步驟。
①利用差值算法在灰度值一維數(shù)據(jù)中獲得Pi,j灰度值Gi,j。結(jié)合Gi,j值,將灰度值分成不同灰度階級,以獲取每個灰度階級相對的像素分布概率。
②根據(jù)圖像信息熵表達(dá)式,求取不同灰度階級[8]相對的信息熵值Ei。
完成多媒體圖像信息熵的計(jì)算后,本文采用尺度不變特征變換(scale invariant feature transform,SIFT)算法[9]提取多媒體圖像的特征。在SIFT算法尺度不變理論的支持下,目標(biāo)在不同尺度下的信息可準(zhǔn)確表示。其模仿人眼對事物的感知方式,對圖像壓縮具有重要意義。
圖像特征提取的本質(zhì)是將圖像分割為尺度空間[10],在該空間中挑選關(guān)鍵點(diǎn),以獲得關(guān)鍵點(diǎn)的位置、尺度等信息,并消除對比度較低、平穩(wěn)性較差的點(diǎn)。
1.2.1 極值點(diǎn)檢測
多媒體圖像存在多尺度特征。通過對應(yīng)的尺度空間構(gòu)建圖像信息處理模型,獲取尺度參數(shù)并對其進(jìn)行轉(zhuǎn)換處理,完成視覺信息的分析,以實(shí)現(xiàn)圖像特征提取[11]。其具體步驟如下。
①構(gòu)建多媒體圖像的尺度空間。尺度空間的計(jì)算式如式(4)所示。
L(x,y,σ)=G(x,y,σ)?Q(x,y)
(4)
式中:G(x,y,σ)為高斯函數(shù);Q(x,y)為卷積圖像;?為卷積過程;σ為標(biāo)準(zhǔn)差,σ和圖像平滑程度正相關(guān)。
②構(gòu)建高斯函數(shù)G(x,y,σ)。
(5)
③尺度歸一化處理。平穩(wěn)的圖像特征是對高斯函數(shù)作尺度歸一化處理獲得的。因?yàn)榻?jīng)過歸一化的高斯函數(shù)極值能夠形成穩(wěn)定的圖像特性。因此,通常利用高斯差分算子代替拉普拉斯算子對極值點(diǎn)進(jìn)行檢測。極值點(diǎn)檢測的計(jì)算式為:
D(x,y,σ)=[G(x,y,kσ)-G(x,y,σ)]×I(x,y)
(6)
這些點(diǎn)和鄰近圖像全部像素點(diǎn)進(jìn)行比較后,可根據(jù)像素點(diǎn)大小判斷其是否屬于極值點(diǎn)。
1.2.2 不穩(wěn)定極值點(diǎn)消除
真實(shí)連續(xù)空間極值點(diǎn)與利用函數(shù)獲取的極值點(diǎn)存在差異。因此,需要消除不穩(wěn)定的極值點(diǎn)。DoG函數(shù)的擬合函數(shù)表達(dá)式如式(7)所示。
(7)
(8)
根據(jù)式(7)與式(8)的計(jì)算結(jié)果,可以構(gòu)建極值點(diǎn)穩(wěn)定性判定閾值。判斷閾值的計(jì)算式如式(9)所示。
(9)
通過確定重要點(diǎn)基準(zhǔn)方向,可使極值點(diǎn)存在轉(zhuǎn)換穩(wěn)定特點(diǎn)。(x,y)的梯度、模值與方向的計(jì)算式分別如式(10)~式(12)所示。
(10)
(11)
(12)
根據(jù)式(10)~式(12),即可實(shí)現(xiàn)海量多媒體圖像特征提取。
1.3.1 一維DCT壓縮
定義一維序列{z(n):n=0,1,…,N-1}的長度為N,則可以構(gòu)建DCT的表達(dá)式為:
(13)
一維DCT表達(dá)式如式(14)所示。
(14)
1.3.2 二維DCT壓縮
本文設(shè)某二維多媒體圖像序列為{z(n,m);n=0,1,…,N-1,m=0,1,…,M-1},則其DCT壓縮表達(dá)式如式(15)所示。
(15)
二維DCT表達(dá)式為:
(16)
式中:L為N×N大小的圖像塊;CN為正交變換系數(shù)。
1.3.3 系數(shù)量化
量化的主要目的是在確保圖像質(zhì)量的前提下去除視覺影像不明顯的信息,以獲取較高壓縮比。在量化矩陣中的相同位置都存在一個量化值,區(qū)間為0~255。結(jié)合實(shí)際硬件存儲容量與理想的圖像質(zhì)量,即可確定最佳量化值。
針對E分量的圖像,可以通過方差閾值Mt-E來判斷子塊屬性。如果Mi,j>Mt-E,則子塊為復(fù)雜塊;反之,為平坦塊。子塊可按照復(fù)雜程度進(jìn)行歸類。
海量多媒體圖像經(jīng)過DCT壓縮后,DCT系數(shù)會表現(xiàn)出圖像頻率分布特征。本文對隨機(jī)一幅圖像進(jìn)行壓縮處理,獲得一個二維函數(shù)F1(u,v)。隨著(u,v)的不斷增大,與其相對應(yīng)的DCT系數(shù)也逐漸變大。該系數(shù)大致分成低頻、中頻與高頻系數(shù)三類。在邊緣信息豐富的清晰部分,高頻零系數(shù)則較少。綜上可知,內(nèi)容子塊會經(jīng)歷模糊-清晰-模糊的變換過程,與其相對應(yīng)的高頻零系數(shù)數(shù)量也會發(fā)生改變。
同樣位置的子塊在壓縮過程中的DCT零系數(shù)數(shù)量變換曲線如圖1所示。
圖1 DCT零系數(shù)數(shù)量變換曲線
由圖1可知,在多媒體圖像中內(nèi)容子塊存在的零系數(shù)在聚焦位置處數(shù)量最小,并且曲線變化情況與理想聚焦函數(shù)變換曲線走勢基本相同。背景子塊的冗余零系數(shù)在一定范圍內(nèi)波動幅度較小,不會影響算法后續(xù)使用。若將全部子塊零系數(shù)相加,獲得的總數(shù)量為聚焦評價函數(shù),則其最低值點(diǎn)就是聚焦位置。
本文分析DCT系數(shù)直方圖基本特征保持情況。本文假設(shè)P(R=r)為初始圖像DCT系數(shù)是r的概率,P(S=s)為壓縮后圖像DCT系數(shù)是s的概率。系數(shù)取值概率的計(jì)算式如式(17)~式(21)所示。
P(R=1)>P(R=2)>P(R=3)>P(R=4)
(17)
P(R=1)-P(R=2)>P(R=2)-P(R=3)>
P(R=3)-P(R=4)
(18)
(19)
(20)
(21)
根據(jù)聚焦評價函數(shù)構(gòu)建的冗余零系數(shù)消除模型如式(22)所示。
(22)
式(22)所構(gòu)建的模型可消除冗余零系數(shù),使原始多媒體圖像特征得到保持。
試驗(yàn)使用ImageNet數(shù)據(jù)庫。該數(shù)據(jù)庫是目前較大的多媒體圖像數(shù)據(jù)庫,包括14 197 122張圖像。圖像類別十分豐富,包括植物、爬行動物、運(yùn)動、結(jié)構(gòu)、工具、樹木、器皿、蔬菜、車輛、人,可以滿足此次試驗(yàn)對于海量圖像的使用需求。從ImageNet中選取7 000張不同內(nèi)容的圖像。圖像大小為265×265到640×480不等。圖像品質(zhì)因素確定為85。圖像嵌入信息大小設(shè)置為3 KB。
試驗(yàn)使用本文算法對選取的圖像進(jìn)行壓縮,得到的小波提升系數(shù)曲線如圖2所示。
圖2 小波提升系數(shù)曲線
高頻小波系數(shù)即細(xì)節(jié)分量值。當(dāng)細(xì)節(jié)分量閾值設(shè)為30時:1級分解細(xì)節(jié)信號共有圖像6 072個,包括非零值圖像143個;2級分解細(xì)節(jié)信號共有圖像536個,包括非零值圖像119個;3級分解細(xì)節(jié)信號共有圖像268個,包括非零值圖像90個。3級提升得到的低頻圖像有269個。由圖像壓縮的機(jī)制可知,只需要保存非零值的圖像。因此,需要保存的圖像共有269+143+119+90=621個。這大幅減少了數(shù)據(jù)所占空間。
本文在評價模型中計(jì)算所有通道中信號誤差并對其進(jìn)行加權(quán)處理。經(jīng)過加權(quán)的誤差再結(jié)合掩蓋效應(yīng)模型進(jìn)行調(diào)整,并累計(jì)誤差函數(shù)以獲取圖像質(zhì)量。本文算法、文獻(xiàn)[1]方法與文獻(xiàn)[2]方法的峰值信噪比對比結(jié)果如圖3所示。
圖3 峰值信噪比對比結(jié)果
圖像的峰值信噪比越高,說明圖像的失真度越低。由圖3可知,本文算法獲得的多媒體圖像峰值信噪比更高。隨著圖像數(shù)量的不斷增加,本文算法消除冗余零系數(shù)后,圖像的峰值信噪比明顯得到了提高,最高峰值信噪比為8.5 dB。而文獻(xiàn)[1]方法與文獻(xiàn)[2]方法處理后,圖像的峰值信噪比最高不超過6.5 dB。這說明本文算法在不降低圖像質(zhì)量的情況下,消除了圖像中的冗余零系數(shù)。
圖像所占空間對比結(jié)果如圖4所示。
圖4 圖像所占空間對比結(jié)果圖
由圖4可知,三種方法壓縮后圖像所占空間呈現(xiàn)上升趨勢。這是由于圖像數(shù)量增多導(dǎo)致的,屬于正常現(xiàn)象。但是,通過分析壓縮后圖像所占空間,仍然能夠判斷出不同方法的性能。三種方法中,本文算法的所占空間最低。當(dāng)試驗(yàn)圖像數(shù)量為7 000張時,本文算法壓縮后圖像所占空間為340 KB。在相同的試驗(yàn)圖像數(shù)量下:文獻(xiàn)[1]方法壓縮后圖像所占空間為590 KB;文獻(xiàn)[2]方法壓縮后圖像所占空間為470 KB;本文算法處理后的圖像所占空間更小。這是由于本文方法在壓縮過程中對圖像進(jìn)行量化與歸類,使其占用更小的儲存空間。
為提高壓縮后多媒體圖像質(zhì)量,本文設(shè)計(jì)了一種海量多媒體圖像壓縮中的冗余零系數(shù)消除算法。本文首先根據(jù)多媒體圖像的信息特征,進(jìn)行一維與二維DCT壓縮;然后確定圖像的最佳聚焦位置,構(gòu)建冗余零系數(shù)消除模型,完成壓縮圖像冗余零系數(shù)消除。測試結(jié)果表明,本文算法能夠提高海量多媒體圖像壓縮的峰值信噪比、降低圖像所占用的空間。這說明本文算法可以提高海量多媒體圖像壓縮的效果與質(zhì)量。該算法的性能較為優(yōu)異,具有較高的實(shí)際應(yīng)用價值。但由于條件限制,試驗(yàn)只能在虛擬機(jī)上進(jìn)行。為實(shí)現(xiàn)更加顯著的效果,后續(xù)研究將在實(shí)體計(jì)算機(jī)上構(gòu)建Hadoop平臺進(jìn)行試驗(yàn),以徹底消除圖像中的冗余零系數(shù),使圖像具有更高的信噪比。