馮帆,王建華,張政保,王惠萍,戚紅軍,張海龍
1.白求恩軍醫(yī)學(xué)院基礎(chǔ)部,石家莊 050081
2.軍械工程學(xué)院計(jì)算機(jī)工程系,石家莊 050003
基于CSR-ICA模型的隱寫信息盲提取算法
馮帆1,2,王建華1,張政保2,王惠萍1,戚紅軍1,張海龍1
1.白求恩軍醫(yī)學(xué)院基礎(chǔ)部,石家莊 050081
2.軍械工程學(xué)院計(jì)算機(jī)工程系,石家莊 050003
隨著網(wǎng)絡(luò)技術(shù)和多媒體技術(shù)的迅速發(fā)展,隱寫術(shù)已成為實(shí)現(xiàn)網(wǎng)絡(luò)隱蔽通信的全新技術(shù)手段。隱寫分析技術(shù)作為隱寫術(shù)的對(duì)抗技術(shù),其目的是揭示出隱秘載體中秘密信息的存在,進(jìn)而進(jìn)行提取、篡改或破壞。鑒于隱秘信息提取的困難性,目前關(guān)于隱秘信息的提取技術(shù)研究較少,并且主要集中于特定算法的研究上[1-4]。ICA是一種統(tǒng)計(jì)計(jì)算技術(shù),對(duì)于通常情況下,以大量樣本數(shù)據(jù)庫(kù)形式給出的多元觀測(cè)信號(hào),它定義了一個(gè)問題生成模型,模型假設(shè)觀測(cè)數(shù)據(jù)變量是內(nèi)在變量的線性組合,且內(nèi)在變量和混合系統(tǒng)均是未知的,如果內(nèi)在變量滿足統(tǒng)計(jì)上相互獨(dú)立,且至多只有一個(gè)非高斯信號(hào),則該變量可通過ICA的方法實(shí)現(xiàn)分離提取。ICA作為當(dāng)今信號(hào)處理領(lǐng)域的一個(gè)研究熱點(diǎn),主要用于解決信號(hào)的分離提取、增強(qiáng)、降噪、分類等問題,近幾年來,研究者們開始將ICA模型技術(shù)用于水印及主動(dòng)隱寫分析技術(shù)的研究[5-9]。
加性隱寫模型和乘性模型是數(shù)據(jù)隱寫嵌入研究應(yīng)用最多的模型,而乘性隱寫模型從數(shù)學(xué)角度上可轉(zhuǎn)化為加性模型。因此,針對(duì)加性隱寫模型,進(jìn)行隱秘信息盲提取技術(shù)研究更具有通用性。隱寫信息盲提取實(shí)際上是從混疊信號(hào)中分離提取出隱寫信息的過程。對(duì)于圖像載體加性隱寫嵌入模型,隱秘信息可以看成載體和秘密信息的線性混疊信號(hào)。因絕大多數(shù)自然圖像,其概率密度函數(shù)為非高斯分布,且隱秘信息和載體信息一般為非高斯信號(hào),唯一可能成為高斯信號(hào)的只有秘密信息,滿足ICA模型的約束條件。但是,對(duì)于隱寫分析者而言,往往不能夠得到滿足條件的兩個(gè)觀測(cè)信號(hào)。所以,隱寫信息盲提取屬于BSS問題中“欠定”ICA模型問題。研究表明[10]:源信號(hào)的非高斯性以及ICA學(xué)習(xí)算法本身的性能對(duì)源信號(hào)分離提取精度影響較大。而信號(hào)的非高斯性與其稀疏性又有著直接的關(guān)系:信號(hào)的稀疏性越好,非高斯越強(qiáng)。自然圖像基本上沒有稀疏性可談,但是通過相應(yīng)變換可以實(shí)現(xiàn)圖像稀疏性表示。輪廓波(Contourlet)是一個(gè)空間多分辨率分析工具,能夠根據(jù)實(shí)際應(yīng)用的具體情況,選擇所需要的空間和方向進(jìn)行分析,其變換較小波變換具有更好的圖像稀疏表示,是二維圖像稀疏表示最有效的工具,圖像通過Contourlet稀疏性表示,能夠增強(qiáng)其非高斯性[11]。
鑒于上述分析,為便于解決問題,同時(shí)提高隱寫信息盲提取的精度,筆者將圖像稀疏性表示(CSR)與ICA有機(jī)結(jié)合,提出一種基于CSR-ICA的隱寫信息盲提取算法。算法能夠有效實(shí)現(xiàn)隱寫信息的盲提取,隱寫信息的平均提取精度達(dá)90%,運(yùn)行效率高于典型FastICA算法,綜合性能優(yōu)于典型的Chandramouli算法。
2.1 ICA數(shù)學(xué)模型
ICA模型分為超“欠定”(Overunderminded)ICA(m>n)、“適定”(derminded)ICA(m=n)和“欠定”(undermined)ICA (m<n)。關(guān)于超欠定和適定ICA問題的研究較為成熟,而對(duì)于“欠定”ICA問題研究才剛剛起步。因此本算法是在適定ICA模型基礎(chǔ)上進(jìn)行研究。模型約束條件:各個(gè)源信號(hào)之間統(tǒng)計(jì)上相互獨(dú)立,若隨機(jī)變量y1,y2,…,yi,…,ym統(tǒng)計(jì)上獨(dú)立,當(dāng)且僅當(dāng)它們的聯(lián)合概率密度是其邊緣概率密度之積,見式(2);源信號(hào)至多有一個(gè)高斯信號(hào),對(duì)于模型y=Wz= WVx=WVAs=WA~s,如果y具有較強(qiáng)的非高斯型,則WA~=I,此時(shí)的分離信號(hào)則等于源信號(hào);源信號(hào)混疊矩陣是一個(gè)常矩陣,且列滿秩。此時(shí)的ICA便能實(shí)現(xiàn)源信號(hào)的分離和提取。
ICA模型實(shí)際上是通過對(duì)“隱變量”生成過程的描述,在源信號(hào)和傳輸通道參數(shù)先驗(yàn)知識(shí)未知的情況下,對(duì)源信號(hào)作一個(gè)非常弱的假設(shè),然后根據(jù)其分布特性,確定目標(biāo)函數(shù)、選擇學(xué)習(xí)優(yōu)化算法,估計(jì)源信號(hào)混疊矩陣,進(jìn)而實(shí)現(xiàn)對(duì)源信號(hào)的分離提取。假設(shè)存在n個(gè)獨(dú)立源信號(hào)s= [s1,s2,…,si,…,sn]T和m個(gè)觀測(cè)信號(hào)x=[x1,x2,…,xi,…,xm]T,且觀測(cè)信號(hào)x的n個(gè)隨機(jī)變量由信號(hào)s的m個(gè)隨機(jī)變量線性組合得到。則隨機(jī)變量xi表示為:
2.2 盲信號(hào)估計(jì)方法
常用ICA估計(jì)方法有極大化非高斯性估計(jì)算法、極小化互信息估計(jì)算法等。研究表明源信號(hào)非高斯強(qiáng)弱影響ICA分離精度??紤]到算法的研究對(duì)象,在此僅對(duì)簡(jiǎn)單而直觀的極大化非高斯性的ICA估計(jì)方法進(jìn)行研究分析。在ICA算法估計(jì)中,峭度是一種經(jīng)典的非高斯度量指標(biāo),是隨機(jī)變量的四階累計(jì)量,用于度量源信號(hào)偏離高斯性的程度。若隨機(jī)變量的均值為0,則其峭度:
若峭度kurt(x)=0,則隨機(jī)變量的分布為高斯分布;若峭度kurt(x)<0,則隨機(jī)變量為次高斯分布;若峭度kurt(x)>0,則隨機(jī)變量為超高斯分布,并且超高斯性越強(qiáng),其峭度絕對(duì)值則越大。
3.1 欠定ICA問題的適定化轉(zhuǎn)換
利用隱寫分析者僅有的一幅隱秘圖像z(k),生成滿足適定ICA問題模型約束條件的另一幅觀測(cè)信號(hào)z1(k)。則圖像載體加性隱寫模型:
由上式可知,z(k)實(shí)際上是s(k)和w(k)的加權(quán)線性組合,見式(6),式(5)在β=1情況下的特例。
將隱秘載體z(k)作為新的載體,按照加性隱寫模型公式,嵌入一獨(dú)立同分布的隨機(jī)信號(hào)n(k),得一新的含秘載體信號(hào)z1(k),原信號(hào)的分布特性不受影響,并且z1(k)仍然是連續(xù)穩(wěn)定的非高斯信號(hào),可通過s(k)和w(k)的加權(quán)線性組合得到,則:
3.2 源信號(hào)CSR前置處理
在混合信號(hào)輸入ICA前,首先采用CSR進(jìn)行前置處理得到稀疏性較好,即非高斯性最大的輸入信號(hào)。自然圖像并不是簡(jiǎn)單的一維分段光滑線段的簡(jiǎn)單堆積,而是包含著內(nèi)在的幾何結(jié)構(gòu),其突變信息通常為圖像的邊緣信息,并且位于光滑的輪廓曲線上。傳統(tǒng)的二維可分離小波是由一維小波的張量積構(gòu)成,在表示一個(gè)光滑輪廓時(shí),其不同分辨率下的支撐空間為不同尺寸大小的正方形,對(duì)奇異曲線的逼近表現(xiàn)為奇異點(diǎn)的逼近。而輪廓波(Contourlet)是一種多尺度、多方向的圖像表示方法,其支撐區(qū)間具有隨尺度而長(zhǎng)、寬比變化的“長(zhǎng)條形結(jié)構(gòu)”,類似于線段的基結(jié)構(gòu)來逼近原始圖像。因此增強(qiáng)源信號(hào)的非高斯性,有利于源信號(hào)分離精度的提高。峭度可以作為信號(hào)極大化非高斯性的無量綱度量標(biāo)準(zhǔn)。Contourlet變換是圖像稀疏性表示的優(yōu)秀工具,在數(shù)字水印、隱寫分析等方面得到了成功應(yīng)用[12-15]。圖像CSR表示能夠獲得非高斯性較小波變換更強(qiáng)的高頻子圖。表1為不同變換方式所得到的高頻子圖峭度的大小對(duì)比。
表1 兩種變換方式的高頻子圖概率密度函數(shù)的峭度
表1中數(shù)據(jù)顯示:圖像經(jīng)Contourlet DBF三層分解所得16個(gè)方向高頻子圖的概率密度函數(shù)的峭度最大為67.47,32個(gè)方向高頻子圖的概率密度函數(shù)的峭度最大為90.09,而圖像經(jīng)DWT三級(jí)小波分解,所得HL、LH和HH三個(gè)方向9個(gè)高頻子圖的概率密度函數(shù)的峭度最大只有36.66。因此,圖像的Contourlet變換能夠得到較DWT變換稀疏性更好的高頻子圖。所以,根據(jù)Contourlet變換高頻子圖的歸一化峭度,選擇非高斯性較強(qiáng)的高頻子圖作為ICA模型的輸入數(shù)據(jù),以提高ICA估計(jì)矩陣精度。
3.3 ICA學(xué)習(xí)方法確定
算法選擇簡(jiǎn)單直觀的極大化非高斯性ICA估計(jì)方法,通常情況下,選擇峭度作為度量非高斯性的無量綱標(biāo)準(zhǔn),但因峭度對(duì)異常值比較敏感,所以,將歸一化峭度作為代價(jià)函數(shù)的自然梯度學(xué)習(xí)法,實(shí)現(xiàn)分離矩陣的估計(jì),以消除異常值的影響。代價(jià)函數(shù):
3.4 隱寫信息提取
首先對(duì)ICA模型所涉及到的觀測(cè)信號(hào)x(含密圖像)、白化信號(hào)z和源信號(hào)s(載體和隱寫信息)的估計(jì)信號(hào)y(提取的秘密信息)分別進(jìn)行Contourlet變換:
式中,C(.)表示Contourlet變換,A、V和W分別為源信號(hào)的混疊矩陣、觀測(cè)信號(hào)的白化矩陣和源信號(hào)分離矩陣。
因Contourlet變換是一個(gè)線性變換,源信號(hào)混疊矩陣在變換前后保持不變。所以,基于CSR-ICA模型得到的估計(jì)矩陣與時(shí)域矩陣相同,可直接用于隱寫信息的分離和提取。此外,因圖像稀疏性表示子圖與原始圖像相比,尺寸要小很多,所以,基于CSR-ICA的源信號(hào)分離提取,不僅提高分離矩陣的估計(jì)精度,而且還縮短了算法運(yùn)行的時(shí)間。
為與典型的Chandramouli算法性能進(jìn)行對(duì)比,實(shí)驗(yàn)分別采用“三觀測(cè)信號(hào)”和“兩觀測(cè)信號(hào)”算法模型實(shí)現(xiàn)隱寫信息的盲提取。
4.1 仿真實(shí)驗(yàn)
實(shí)驗(yàn)采用大小為256×256的lena.bmp灰度圖像作為原始載體圖像c(k),隱秘載體圖像z(k)通過擴(kuò)頻隱寫,在DCT和DWT高頻系數(shù)中,選取嵌入長(zhǎng)度為L(zhǎng)的隱寫信息得到最大系數(shù)。在此隱寫信息w(k)為均值為0、方差為1的隨機(jī)序列,若隨機(jī)序列的長(zhǎng)度為L(zhǎng),則L分別取10、50、100、500、1 000、3 000、7 000。
(1)“兩觀測(cè)信號(hào)”。將待測(cè)圖像z(k)作為新的載體對(duì)象,采用加性隱寫嵌入模型嵌入一獨(dú)立同分布的隨機(jī)序列,生成另一觀測(cè)信號(hào)x1(k),并分別對(duì)x(k)、x1(k)進(jìn)行j=3的LP分解,lj=2j的多方向DBF分解,優(yōu)化選擇峭度較大的高頻子圖C(x(k))、C(x1(k))作為CSR-ICA模型觀測(cè)信號(hào)[C(x(k)),C(x1(k))]T,然后采用歸一化峭度自然梯度學(xué)習(xí)法,實(shí)現(xiàn)源混疊信號(hào)的分離和提取。其中C(·)為Contourlet變換。
(2)“三觀測(cè)信號(hào)”。將(1)中的x1(k)替換Chandramouli算法中原始信號(hào)的估計(jì)信號(hào)x?(k),并與已知的非高斯隨機(jī)序列f(k)進(jìn)行線性組合,生成另外兩個(gè)觀測(cè)信號(hào),按照(1)中相同的方法生成[C(x(k)),C(x1(k)),C(x2(k))]T,實(shí)現(xiàn)隱寫信息的分離提取。
初始值隨機(jī)產(chǎn)生,算法運(yùn)行20次所提取隱寫信息長(zhǎng)度平均錯(cuò)誤率見表2,DCT域隱寫嵌入長(zhǎng)度分別為50和100的秘密信息的提取見圖1。
表2 基于SCR-ICA的信息長(zhǎng)度平均估計(jì)錯(cuò)誤率
圖1 秘密信息嵌入長(zhǎng)度提取
此外,算法因?qū)τ^測(cè)信號(hào)進(jìn)行Controulet變換,使圖像大小縮小了很多,降低了ICA學(xué)習(xí)算法的計(jì)算復(fù)雜度,提高了算法學(xué)習(xí)效率。表3是LP=3,DBF分解方向數(shù)為16的高頻子圖混疊信號(hào)與原始圖像混疊信號(hào)采用典型的固定點(diǎn)學(xué)習(xí)算法的耗時(shí)情況。
表3 算法耗時(shí)
4.2 結(jié)果分析
表2中的數(shù)據(jù)顯示:算法隱寫信息提取的正確率最大為95%、最小為86%,明顯高于Chandramouli文獻(xiàn)[5]提出的“三觀測(cè)信號(hào)”模型算法的提取正確率(最大70%、最小62%),雖然與Chandramouli文獻(xiàn)[6]中的“兩觀測(cè)信號(hào)”模型算法的實(shí)驗(yàn)結(jié)果(最大為100%、最小為92%)相比,低了幾個(gè)百分點(diǎn),但因其算法要求兩觀測(cè)信號(hào)必須是不同嵌入強(qiáng)度下的相同載體和秘密信息線性組合生成,限制條件過于苛刻,對(duì)于隱寫分析者來講,實(shí)現(xiàn)起來難度較大,甚至根本無法實(shí)現(xiàn),如果隱寫分析者具備Chandramouli算法中觀測(cè)信號(hào)生成條件,可將其引入Chandramouli算法中,進(jìn)一步提高算法的性能;如果不具備其條件,采用本文提出的算法,效果則會(huì)更好。
表3的數(shù)據(jù)顯示,F(xiàn)astICA算法的運(yùn)行時(shí)間為0.361 6,而SCR-FastICA算法的運(yùn)行時(shí)間為0.004 1,因此,采用圖像CSR對(duì)ICA模型輸入數(shù)據(jù)進(jìn)行前置處理能夠提高算法運(yùn)行效率。
本文對(duì)通用隱寫嵌入模型、隱寫信息盲提取原理以及ICA模型技術(shù)進(jìn)行了綜合分析和研究,給出了隱寫信息盲提取“欠定”ICA問題“適定”化解決的思路,在此基礎(chǔ)上,將圖像Contourlet稀疏性表示與ICA模型技術(shù)進(jìn)行有機(jī)的結(jié)合,提出了一種基于CSR-ICA模型實(shí)現(xiàn)隱寫信息盲提取算法。算法僅需一幅隱寫圖像,即可實(shí)現(xiàn)隱寫信息的提取,克服了典型Chandramouli算法約束條件的限制,降低了提取信息的錯(cuò)誤率,同時(shí)提高了算法的運(yùn)行效率,其綜合性能優(yōu)于典型Chandramouli算法。
[1]Fridrich J,Soukal D,Goljan M.Maximum likelihood estimation of secret message length embedded using±K steganography in spatial domain[C]//Proceedings of the SPIE-Security Steganography and Watermarking of Multimedia Contents VII,San Jose,CA,2005:595-606.
[2]張衛(wèi)明,李世取,劉九芬.對(duì)空域圖像LSB隱寫術(shù)的提取攻擊[J].計(jì)算機(jī)學(xué)報(bào),2007,30(9):1625-1630.
[3]Lou Der-Chyuan,Liu Chiang-Lung,Lin Chih-Linn.Message estimation for universal steganalysis using multi-classification support vector machine[J].Computer Standards&Interfaces,2009,31(2):420-427.
[4]Kodovsky J,F(xiàn)ridrich J.Quantitative structural steganalysis of Jsteg[J].IEEE Transactions on Information Forensics and Security,2010,15(4):681-693.
[5]Chandramoouli R.A mathematical framework for active stenanalysis[J].Multimedia Systems,2003,9(3):301-311.
[6]Chandramouli R,Subbalakshmi K P.Active steganalysis of spread spectrum image steganography[C]//2003 IEEE International Symposium on Circuits and Systems(ISCAS 2003):General&Nonlinear Circuits and Systems,2003:830-833.
[7]劉曉芹,王嘉禎,徐波.基于HMT和ICA的主動(dòng)隱寫分析算法[J].武漢大學(xué)學(xué)報(bào):信息版,2008,33(10):1060-1066.
[8]Malik H.Blind watermark estimation attack for spread spectrum watermarking[J].Informatica,2009,33(1):49-68.
[9]Umaamaheshvari A,Thanushkodi K.Digital image watermarking based on independent component analysis and ridgelet transform[J].International Journal of Computer Science and Network Security,2011,11(4):14-17.
[10]史習(xí)智.盲信號(hào)處理——理論與實(shí)踐[M].上海:上海交通大學(xué)出版社,2008.
[11]焦李成,侯彪,王爽,等.圖像多尺度幾何分析理論與應(yīng)用——后小波分析理論與應(yīng)用[M].上海:上海交通大學(xué)出版社,2008.
[12]樓偶俊,王鉦旋.基于特征點(diǎn)模板的Contourlet域抗幾何攻擊水印算法研究[J].計(jì)算機(jī)學(xué)報(bào),2009,32(2):308-317.
[13]Sajedi H,Jamzad M.Using contourlet transform and cover selection for secure steganography[J].International Journal of Information Security,2010,9(5):337-352.
[14]石慧,林闖,李明楚,等.基于Contourlet變換的抗幾何攻擊數(shù)字水印算法[J].光電子·激光,2011,22(10):1575-1581.
[15]Sajedi H,Jamzad M.CBS:Contourlet-Based Steganalysis method[J].Journal of Signal Processing Systems for Signal,Image,and Video Technology,2010,61(3):367-373.
FENG Fan1,2,WANG Jianhua1,ZHANG Zhengbao2,WANG Huiping1,QI Hongjun1,ZHANG Hailong1
1.Department of Basic Courses,Bethune Military Medical College,Shijiazhuang 050081,China
2.Department of Computer Engineering,Ordnance Engineering College,Shijiazhuang 050003,China
Aiming at steganography adding model,a blind extraction algorithm of embedded messages is proposed based on CSR-ICA.It attains estimated signal of original cover signals using linear combination just one digital image,which consists with constrain of ICA model.Then signals with optimal normalization kurtosis are selected and inputted to ICA model by optimization algorithm.In order to eliminate effect of outlier,normalization kurtosis is taken as objective function of separation algorithm on precision.The algorithm has higher comprehensive performance and conquers the localization of proposed algorithm by Chandramouli.Average extraction correct rate is 90%.The results of simulation experiments prove its validity further.
Contourlet Sparse Representation(CSR);Independent ComponentAnalysis(ICA)model;steganography;blind extraction
針對(duì)加性隱寫模型,提出一種基于CSR-ICA的隱寫信息盲提取算法。算法僅需一幅隱寫圖像,在滿足ICA模型線性約束條件下得到載體信號(hào)的估計(jì)信號(hào),通過Contourlet稀疏性表示(CSR)對(duì)模型輸入信號(hào)進(jìn)行前置處理,優(yōu)化選取歸一化峭度性較大的信號(hào)作為模型輸入信號(hào),將歸一化峭度作為分離算法學(xué)習(xí)的目標(biāo)函數(shù),避免異常值給分離算法帶來的誤差。算法具有較好的綜合性能,并且克服了Chandramouli算法的局限性,提取正確率平均為90%。仿真實(shí)驗(yàn)結(jié)果給出了算法的有效性驗(yàn)證。
Contourlet稀疏性表示(CSR);獨(dú)立成分分析(ICA)模型;隱寫;盲提取
A
TP393
10.3778/j.issn.1002-8331.1203-0628
FENG Fan,WANG Jianhua,ZHANG Zhengbao,et al.Blind extraction algorithm of embedded messages based on CSR-ICA. Computer Engineering and Applications,2013,49(24):70-73.
河北省基金項(xiàng)目(No.052135,No.11213527D)。
馮帆(1971—),女,博士,主要研究方向?yàn)樾畔踩煌踅ㄈA(1977—),女,博士,主要研究方向?yàn)閳D像處理;張政保(1964—),男,博士,主要研究方向?yàn)樾畔踩-mail:fengfan_2357@163.com
2012-03-27
2012-06-14
1002-8331(2013)24-0070-04
CNKI出版日期:2012-08-08http://www.cnki.net/kcms/detail/11.2127.TP.20120808.1548.019.html