侯阿臨,吳 亮,廖 慶,王崇錦,郭俊良
(長春工業(yè)大學計算機科學與工程學院,吉林長春130012)
全息術能夠展現(xiàn)所有視點和距離上的3D深度感知,在空間呈現(xiàn)真正的立體像,實現(xiàn)信息的三維顯示,被認為是最理想的三維顯示技術[1-2]。但全息圖記錄的信息量十分龐大,若要使全息圖用于實際的通信傳輸和存儲,高效快速的數(shù)據壓縮是首先必須考慮的,因而近年來全息圖的壓縮成為全息領域的研究熱點。傳統(tǒng)的全息圖壓縮技術是用光學方法進行干涉條紋的抽除或通過研究全息圖的記錄、再現(xiàn)原理及其頻譜特性,降低采樣頻率來實現(xiàn)壓縮[3-4],還有如 Lucente[5]提出的面向衍射的計算全息帶寬壓縮理論及最近 Naughton[6-7]和 Darakis[8]等人提出的壓縮方法雖然取得了一定的效果,但也存在如計算較復雜,操作步驟繁瑣等問題,也有學者利用小波分析方法[9-10]進行壓縮,還有運用最新的壓縮傳感理論提出的基于壓縮傳感的全息圖壓縮方法[11],但方法還不夠成熟,算法有待優(yōu)化,且計算較復雜。
由于全息圖各像素間存在著很高的自相似性,且各像素分布為非線性,這種特性和神經元的聯(lián)系很相似,而神經網絡具有很強的學習能力,對不同的訓練樣本都可以產生合理的輸出,這為神經網絡用于全息圖壓縮提供了可能[12]。通過構造BP網絡模型,可以減少全息圖的數(shù)據冗余,實現(xiàn)全息圖的壓縮。針對全息圖在輸入空間是不均勻分布的,為了獲取更好的網絡性能和更高的壓縮效率,本文提出一種全息圖的小波域BP神經網絡壓縮算法,結合小波分析的多分辨分析特性和神經網絡非線性映射和自學習能力,能夠獲得更好的全息圖壓縮效果。最后通過實驗驗證,本算法在保持較好的再現(xiàn)像質量的同時,能有效提高壓縮率和運算速度。
全息圖的信息分布類似隨機噪聲的非線性分布,其各像素間的自相似性正好對應于神經網絡中各神經元間的連接關系,且神經網絡具有很強的魯棒性和容錯性,能提高壓縮后的全息圖再現(xiàn)質量。因此用神經網絡來處理全息圖比較合適,但也存在網絡訓練收斂速度慢,易陷入局部極小值等問題。為克服此缺點且考慮到作為訓練樣本的全息圖的不均勻分布特點,希望在數(shù)據稠密區(qū)以高分辨率學習,而在稀疏區(qū)以低分辨率學習,用以獲得更好的壓縮效果,本算法將小波分析的多分辨優(yōu)勢應用于神經網絡,既解決在不同區(qū)域以不同分辨率學習的問題,也能大大提高網絡的收斂速度,使網絡不易陷入局部最小值,獲得更好的網絡性能。且本算法具有很強的特征提取和屏蔽隨機噪聲能力,特別適合全息圖這樣非平穩(wěn)、非線性信號的壓縮。
根據以上思想,設計出本算法的結構圖,如圖1所示。壓縮算法分兩步完成,首先對未壓縮的全息圖進行小波域內的處理,然后再完成神經網絡中的處理。
圖1 本文算法的結構圖
小波變換能把圖像進行多分辨率分解,分解成不同空間、不同頻率的子圖像,通過對子圖像的系數(shù)編碼,能有效地從圖像中提取高頻和低頻信息。在本算法中,先用小波變換對信號進行預處理,將小波基與信號的內積進行加權和來實現(xiàn)信號的特征提取,然后將提取的特征向量代入神經網絡以完成函數(shù)逼近、分類等功能。即將待壓縮的全息圖經過小波變換后,再輸入給BP神經網絡來實現(xiàn)壓縮。在小波域中對全息圖處理步驟為:
(1)實驗前制作并生成N×N像素大小的全息圖及其再現(xiàn)像。
(2)讀取并顯示全息圖,并對全息圖進行小波的二層分解。
(3)設置全局閾值,對所有的高頻系數(shù)進行同樣的閾值量化處理,得到經小波變換處理后的全息圖。
因為隱含層的神經元個數(shù)小于輸入層的神經元個數(shù),所以輸入層和隱含層的變換可看成壓縮過程,隱含層和輸出層的變換可看成解壓縮過程。圖2是BP神經網絡圖像壓縮原理圖,其中輸入層輸入的是原圖像,隱含層就是壓縮的結果,輸出層是重建的圖像。易知若隱含層神經元個數(shù)越少,壓縮率就會越大,通過改變隱層神經元的個數(shù),可以調整壓縮率及輸出圖像質量。
圖2 BP神經網絡實現(xiàn)圖像壓縮原理圖
圖3是一個N-K-N的三層BP網絡壓縮計算模型。在模型中將輸入層和隱含層間的連接權值矩陣表示成{wij∶1≤j≤K,1≤i≤N},隱含層第 j個神經元的閾值表示成{bj∶1≤j≤K};將輸出層和隱含層間的連接權值矩表示成{w'ij∶1≤i≤N,1≤j≤K},輸出層第i個神經元的閾值可以表示成{bi'∶1≤i≤N}。通過不斷訓練網絡,調整網絡權重,使網絡的輸入與輸出的均方差達到最小,那么最終能將N維矢量壓縮成K維矢量(K<N)。則隱含層第j個神經元的輸出值為:
輸出層的第i個神經元的輸出可表示為:
其中,f1和f2分別是隱含層和輸出層的激活函數(shù);bj是隱含層第j個神經元的閾值;b'i是輸出層第i個神經元的閾值。
圖3 BP神經網絡全息圖壓縮模型
根據以上網絡壓縮原理,把已經在小波域內處理好的全息圖作為訓練樣本,用訓練好的網絡對其進行壓縮。具體步驟為:
(1)將經小波變換處理后的全息圖分割為M個子圖像塊,其中每個子圖像塊都由P×P的子像素塊構成。將每一個子圖像塊轉換成一個P2×1維向量,P2對應輸入節(jié)點個數(shù)。則全息圖的數(shù)據就被劃分成(N/P)2個訓練向量,將其作為神經網絡的訓練樣本。
(2)創(chuàng)建BP網絡。通過輸入層和隱含層中神經元個數(shù)比,壓縮全息圖。再通過隱含層和輸出層中的神經元個數(shù)比,重構壓縮后的全息圖。
(3)對神經網絡進行訓練。用合適的算法訓練網絡,然后進行仿真實驗。
(4)對仿真結果進行熵編碼,重構壓縮后的全息圖。
(5)用菲涅爾衍射積分公式計算像平面上的光場分布,從而得到壓縮后的全息圖再現(xiàn)像。
在配置為Intel(R)Core(TM)i5-2450M CPU@2.50GHz 4.00GB內存的PC機上使用MATLAB R2010b對一幅256×256像素大小的圖像進行仿真實驗。根據全息圖生成和再現(xiàn)原理,制作出未壓縮的全息圖及其再現(xiàn)像,如圖4所示。為減少復雜性,防止神經網絡規(guī)模過大,在網絡訓練前先對樣本進行分塊處理,將子圖像塊設為8×8像素大小,則全息圖被劃分成為1024個8×8的子圖像塊。網絡的訓練次數(shù)設為500次,網絡目標誤差設為0.001。圖5則是壓縮后的全息圖;圖6是壓縮后恢復的再現(xiàn)像??梢钥闯觯S著壓縮比的不斷增大,恢復出來的再現(xiàn)像清晰度不斷下降,變得越來越模糊,這是因為隨著壓縮比的增大,隱含層神經元個數(shù)也不斷減少,使得神經元之間連接關系變得簡單,導致重構的全息圖像素之間的自相似性降低,從而影響再現(xiàn)像質量。實驗中可以看出,當壓縮比達到 124.52∶1即0.803%的壓縮率時,仍能獲得像質較好的再現(xiàn)像。
圖4 未壓縮的全息圖及其再現(xiàn)像
圖5 壓縮后的全息圖
圖6 不同壓縮比下的再現(xiàn)像
表1是本算法與BP算法的PSNR和MSE比較,從八組對比數(shù)據看出,前三組數(shù)據表明在近似一致的壓縮比下,本算法得到的峰值信噪比明顯高于單純使用BP網絡的壓縮算法且獲得更低的均方誤差。第四到第六組數(shù)據表明本算法不僅能夠獲得比BP算法更高的壓縮比,還能獲得更高的再現(xiàn)像峰值信噪比和更好的再現(xiàn)像質量。而最后兩組數(shù)據則完全體現(xiàn)了本壓縮算法的優(yōu)越性,在實驗中壓縮比高達124.52∶1,比BP算法的壓縮比幾乎高出一倍,且獲得了更為清晰的再現(xiàn)像,充分證明了對于全息圖這樣非平穩(wěn)、非線性信號的分類壓縮,本算法有著明顯的優(yōu)勢。
表1 本算法與BP算法的PSNR和MSE比較
從表中還可以看出不同壓縮比所用的運算時間是不同的,總體變化趨勢是隨著壓縮比的不斷增加,網絡運算所需的時間越少,這是因為在神經網絡中壓縮比不斷增加導致隱含層神經元個數(shù)不斷減少,使得神經元之間連接關系變得越來越簡單,從而降低了網絡的計算復雜度,加快了運算速度。通過數(shù)據對比發(fā)現(xiàn),本算法比BP算法的網絡運算速度更快,能有效節(jié)省15% ~37.35%的時間,例如在壓縮比近似為8∶1時,本算法少用了5.2063 s,節(jié)省了近37.35%的時間,證明了本算法在運算速度方面表現(xiàn)較好,值得在后續(xù)的工作中進一步的研究和探索。
本算法將小波分析和神經網絡二者各自的優(yōu)勢結合起來,很好地優(yōu)化了網絡性能,減短了訓練時間,且使網絡不易陷入局部最小值,從而提高全息圖的壓縮效率。另外,通過在小波域內進行的信號重建為網絡訓練提供了更加精準可靠的輸入樣本,使得整個網絡模型具有很強的特征提取和去除隨機噪聲的能力,因而最終能獲得更高的壓縮比和更為清晰的再現(xiàn)像。
本文結合小波分析和神經網絡理論,提出一種基于小波域的BP神經網絡壓縮算法,實現(xiàn)了對計算全息圖信息量的有效壓縮,通過實驗證實了該算法的可行性和有效性,且算法結構簡單,計算速度快。在壓縮效果方面比目前出現(xiàn)的一些壓縮方法獲得的壓縮率都要高,達到124.52∶1即0.803%的壓縮率,且獲得更為理想的再現(xiàn)像質量。本研究最大的特點是為計算全息圖的數(shù)據壓縮提供了一個新的解決途徑和研究思路,有助于解決全息圖在實際傳輸和存儲中遇到的應用問題,推進三維全息立體顯示技術的快速發(fā)展。
[1] PEI Chuang,JIANG Xiaoyu,DING Sheng,et al.Three -dimensional display of computer-generated hologram based on spatial light modulator[J].Journal of Applied Optics,2013,34(5):772 -777.(in Chinese)裴闖,蔣曉瑜,丁晟,等.利用空間光調制器實現(xiàn)計算全息 三 維 顯 示[J].應 用 光 學,2013,34(5):772-777.
[2] K Matsushima,Y Arima,S.Nakahara.Digitized holography:modern holography for 3D imaging of virtual and real objects[J].Applied Optics,2011,50(34):H278 - H284.
[3] JIN Hongzhen,LI Yong,ZHANG Haihua,et al.A method for compressing the holographic information by use of the phase information only[J].Optical Technique,2008,34(5):761 -76.(in Chinese)金洪震,李勇,張?;?,等.通過保留相位進行全息圖信息壓縮的方法[J].光學技術,2008,34(5):761-763.
[4] LI Xu,LI Yong.A method for compressing off- axis digital hologram with spectrum shifting[J].Laser & Infrared,2008,38(8):856 -859.(in Chinese)李旭,李勇.采用移頻法進行離軸全息圖壓縮的研究[J].激光與紅外,2008,38(8):856 -859.
[5] M Lucente.Computational holographic bandwidth compression[J].IBM System Journal,1996,35(3&4):349-365.
[6] T J Naughton,J B McDonald,B Javidi.Efficient compression of Fresnel fields for internet transmission of threedimensional images[J].Applied Optics,2003,42(8):4758-4764.
[7] T J Naughton,Y Frauel,B Javidi,et al.Compression of digital holograms for three-dimensional object recognition[J].Appl.Opt.,2002,41:4124 -4132.
[8] Darakis E,Naughton T J,Soraghan J J.Compression defects in different reconstructions from phase-shifting digital holographic data[J].Applied Optics,2007,46:4579-4586
[9] CAI Xiaoou,WANG Hui,LI Yong,et al.Hologram compression by wavelet analysis[J].Acta Photonica Sinica,2000,29(8):738 -743.(in Chinese)蔡曉鷗,王輝,李勇,等.全息圖壓縮的小波分析方法[J].光子學報,2000,29(8):738 -743.
[10] HAN Pengfei.Preliminary investigations on information compression of holograms[D].Harbin:Harbin Institute of Technology,2007.(in Chinese)韓鵬飛.全息圖信息壓縮的初步研究[D].哈爾濱:哈爾濱工業(yè)大學,2007.
[11] LI Ke,LI Jun.Hologram Compression Based on Compressive Sensing[J].Journal of South China Normal University:Natural Science Edition,2012,44(4):61 - 65.(in Chinese)李科,李軍.基于壓縮傳感的全息圖壓縮研究[J].華南師范大學學報:自然科學版,2012,44(4):61-65.
[12] HOU ALin,LIAO Qing,JIN Zhi- Juan,et al.Research on compression of computer-generated hologram based on artificial neural network[J].Journal of Jilin University:Engineering and Technology Edition,2013,43(Sup.):21-24.(in Chinese)侯阿臨,廖慶,靳志娟,等.計算全息圖的人工神經網絡壓縮算法[J].吉林大學學報:工學版,2013,43(Sup.):21 -24.