劉召斌 金甌 賀建飚 李躍強(qiáng)
摘要:針對DCT域的視頻隱寫,提出一種放大連通數(shù)(MCN,MagnifiesConnectedNumbers)的視頻隱寫分析新方法。在DCT域中隱寫秘密消息時(shí),秘密消息會不規(guī)則地分布到整個(gè)幀中。通過選取特殊的歸一化系數(shù)的方法,被隱寫幀的連通數(shù)會發(fā)生脈沖式增加,放大了隱寫產(chǎn)生的影響,極大地提高了檢測隱寫的靈敏度。該方法能確定隱寫位置、容量,且健壯性強(qiáng),能抵抗噪聲、濾波、剪切、旋轉(zhuǎn)、分辨率重建、插入幀、刪除幀等處理與攻擊。
關(guān)鍵詞:視頻隱寫分析;離散余弦變換;放大連通數(shù);靈敏;健壯
中圖分類號:TP391文獻(xiàn)標(biāo)識碼:A
1引言
隨著多媒體信息技術(shù)、網(wǎng)絡(luò)技術(shù)的飛速發(fā)展,信息安全越來越受到人們的重視。上世紀(jì)90年代初,出現(xiàn)在多媒體中隱藏秘密信息的隱寫術(shù)(Steganography),給網(wǎng)絡(luò)信息安全造成極大的威脅。隱寫術(shù)也被恐怖分子、毒品交易者以及其他犯罪分子等用來傳輸秘密信息,據(jù)美國新聞媒體報(bào)道,“9.11”恐怖事件的恐怖分子就利用了信息隱藏技術(shù)將含有密謀信息和情報(bào)的圖片,通過互聯(lián)網(wǎng)實(shí)現(xiàn)了恐怖活動信息的隱蔽傳輸。因此,與隱寫對抗的隱寫分析(Stegananalysis)的研究受到各國安全、軍事、情報(bào)等部門以及大學(xué)、科研機(jī)構(gòu)的高度重視。
隱寫分析可用于監(jiān)控網(wǎng)絡(luò)中傳播的秘密信息,其需求主要是情報(bào)、軍事及安全部門等,可以在預(yù)防犯罪、維護(hù)國家安全及公共安全、軍事等領(lǐng)域起著非常重要的作用。從另一方面來看,隱寫分析也反過來促進(jìn)了隱寫技術(shù)的提高。
隱寫分析可分為定性分析[1]、定量分析[2]兩類。定性分析主要目的是隱寫存在性檢測,即隱寫分析等同于隱藏信息檢測[3],這是隱寫分析的初級目標(biāo)。雖然這樣的初級目標(biāo)不能截獲隱蔽的秘密信息,若能確定隱寫存在,可采取刪除、主動攻擊等手段破壞隱寫的信息,使之不能被提取,從而達(dá)到阻斷隱蔽通信的目的;定量分析主要目的是以定性分析為基礎(chǔ),進(jìn)一步估計(jì)隱寫秘密信息的容量[4]、判斷嵌入位置[5]、破譯信息加密的密鑰[6]、分析隱寫采用的算法等[7],最終截獲隱蔽的秘密信息,這是隱寫分析的終極目標(biāo)。當(dāng)然,實(shí)現(xiàn)終極目標(biāo)還有很長的路要走。
隱寫的載體有圖像、聲音、視頻等媒體,隨著攝像機(jī)、手機(jī)、監(jiān)視設(shè)備的迅速普及,視頻獲取越來越容易。由于視頻是由大量的幀序列組成,有比圖像、聲音更高的嵌入容量,這是以視頻作為隱寫載體所具有的優(yōu)勢,視頻隱寫將會成為信息隱藏的主體。因此,與視頻隱寫對抗的視頻隱寫分析研究必將越來越受到重視。
2放大隱寫影響
一般說來,隱寫有兩種方法:時(shí)域法和變換域法。時(shí)域法簡單、速度快,但健壯性較差,抗干擾能力較低,如:LSB算法;變換域法是采用數(shù)學(xué)變換的方法,將一個(gè)域內(nèi)的信號映射為另一個(gè)域內(nèi)的信號,然后嵌入秘密消息,再逆變換為原來域中的信號,如:離散傅里葉變換DFT、離散余弦變換DCT、離散小波變換DWT等。由于是在變換后的域中隱寫秘密消息,在進(jìn)行逆變換后秘密消息會不規(guī)則地分布到整個(gè)圖像上,使得攻擊者很難識別和篡改,具有健壯性強(qiáng)、難識別和篡改的優(yōu)點(diǎn),因而隱寫秘密消息大多采用了變換域法。
DCT是信號處理中一種非常有力的工具,與其他變換域法相比,DCT具有其獨(dú)特的特點(diǎn):重要信息都集中在DCT變換后的少部分系數(shù)(低頻部分)中,而大部分系數(shù)(即中頻、高頻部分)中只包含少量信息,重建時(shí)只需低頻系數(shù),就可還原大部分信息。由于DCT的這些特性,使得DCT在隱寫中得到較廣泛應(yīng)用。
當(dāng)幀圖像載體被隱寫了秘密信息時(shí),會破壞載體的某些特征量。對于視頻隱寫分析來說,關(guān)鍵是找出視頻中可以反映秘密消息存在的某種特征量[8],然后通過隱寫信息量大小和統(tǒng)計(jì)特性偏差之間的對應(yīng)關(guān)系進(jìn)行分析,實(shí)現(xiàn)對隱寫秘密信息的檢測。
當(dāng)視頻隱寫的信息量較小時(shí),對載體的特征量的影響也比較小,不足以實(shí)現(xiàn)對隱寫秘密信息的檢測,從而給視頻隱寫分析造成較大的困難。若能把因隱寫造成特征量的變化放大,問題即可迎刃而解。針對基于DCT變換的視頻隱寫的特點(diǎn),沿著放大隱寫影響的思路,設(shè)計(jì)研究框架如下:
1)選取連通數(shù)作為幀的特征量。如何在顏色、灰度、像素、紋理、偏斜度、峰度、連通數(shù)、歐拉數(shù)[8]等眾多種特征量中找出可以敏感地反映秘密消息存在的某種特征量,是視頻隱寫分析的關(guān)鍵。通過對比發(fā)現(xiàn),選用連通數(shù)作是檢測的特征量較好。這主要出于兩方面的考慮:一是在視頻幀中隱寫秘密消息時(shí),幀的連通數(shù)會發(fā)生變化,根據(jù)連通數(shù)的變化可實(shí)現(xiàn)對隱寫秘密信息的檢測。二是連通數(shù)是一個(gè)與圖像的幾何形狀無關(guān)的特征量,當(dāng)圖像產(chǎn)生橡皮薄膜那樣伸縮變化時(shí)(如:平移、旋轉(zhuǎn)、拉伸、壓縮、扭變等),連通數(shù)保持不變。因此,選擇連通數(shù)作為特征量具有較好的健壯性。
2)放大連通數(shù)(MCN)。視頻隱寫是在DCT變換后的域中隱寫秘密消息,通過逆變換后秘密消息會不規(guī)則地分布到整個(gè)幀上。由于對幀圖像影響較小,人的視覺系統(tǒng)HVS(HumenVisualSystem)不會覺察,這是DCT算法的優(yōu)點(diǎn)。但DCT逆變換會將秘密消息“彌漫”到整個(gè)幀上,變化雖小但影響范圍很大,這也是DCT算法的缺點(diǎn)。
若將這些較小的變化放大,則能容易地檢測是否存在隱寫。因此,如何將較小的變化放大是解決問題的關(guān)鍵。經(jīng)過研究發(fā)現(xiàn),選擇合適的歸一化系數(shù),被隱寫幀的連通數(shù)會發(fā)生脈沖式增加,極大地放大隱寫造成的影響。以下舉例說明其放大連通數(shù)的原理:
用字母“M”的點(diǎn)陣作為原始單色圖像(見圖1),其四連通的連通數(shù)為5。將“M”圖像DCT變換后的系數(shù),隨機(jī)挑選4組相鄰的系數(shù)進(jìn)行交換,相當(dāng)于隱寫秘密信息時(shí)修改了8個(gè)數(shù)據(jù)點(diǎn)。交換后的系數(shù)經(jīng)DCT逆變換后的結(jié)果見表2。選取特殊的歸一化系數(shù)(如:大于0.99),將其轉(zhuǎn)換成單色圖像。這樣,其四連通的連通數(shù)為10,結(jié)果見圖2。
由此可見,選擇特殊的歸一化系數(shù),幀的連通數(shù)由5變化為10,發(fā)生了非常大的變化,從而放大了隱寫造成的影響。
3視頻隱寫分析方法
對視頻進(jìn)行隱寫分析的步驟如下:
Step1將待檢測視頻轉(zhuǎn)換為一維幀圖像序列。
Step2將幀圖像轉(zhuǎn)換為二值圖像。
Step3選取特殊的歸一化系數(shù),計(jì)算二值幀圖像的連通數(shù)。
Step4判斷視頻幀是否存在隱寫。其判斷條件是:將第i幀的連通數(shù)與相鄰的i-1幀、i+1幀平均連通數(shù)比較,若超過閾值D,則判定為隱寫了秘密信息,即:
2Ci-(Ci-1+Ci+1)(Ci-1+Ci+1)≥D(1)
其中:閾值D的取值為0.2-0.4。也就是說,某幀與相鄰幀平均連通數(shù)比較,若突然增加20-40%時(shí),即判定該幀隱寫了秘密信息,同時(shí)要判斷隱寫秘密信息幀的位置。通過連通數(shù)增加的幅度,還可估計(jì)隱寫量的大小。若某些幀的連通數(shù)增加幅度60-100%時(shí),則可判定其隱寫時(shí)采用了DCT變換算法。
為評估隱寫分析的檢測結(jié)果,本文采用文獻(xiàn)[10]]的隱寫分析評價(jià)指標(biāo)體系進(jìn)行評估。這些指標(biāo)主要有:
1)檢出率P1:P1=M1/M。其中:M是視頻中隱寫了秘密信息的幀數(shù);M1是在視頻中檢測出含有秘密信息的幀數(shù)。
2)漏報(bào)率P2:P2=M2/M。其中:M是視頻中隱寫了秘密信息的幀數(shù);M2是視頻中隱寫了秘密信息但沒有被檢測出來的幀數(shù)。
3)虛警率P3:P3=N1/N,其中:N是視頻中沒有隱寫秘密信息的幀數(shù);N1是把視頻中沒有隱寫秘密信息的幀誤判為含有隱寫秘密信息的幀數(shù)。
4)否定率P4:P4=N2/N,其中:N是視頻中沒有隱寫秘密信息的幀數(shù);N2是把視頻中沒有隱寫秘密信息的幀正確地判斷為不含有隱寫秘密信息的幀數(shù)。
好的隱寫分析算法應(yīng)該有較大的檢出率P1和否定率P4以及較小的漏報(bào)率P2和虛報(bào)率P3。
3.1定性分析及隱寫幀位置判斷
為檢測隱寫秘密信息后數(shù)字視頻幀連通數(shù)的變化情況,將寬高分別為360×288像素、幀速為25fps、AVI格式、非壓縮、真彩色、總幀數(shù)為500幀的原始數(shù)字視頻作為隱寫載體樣本。
選擇樣本中能被10整除的幀(如:第10、20、30、……)隱寫秘密信息,幀隱寫率為10%。
為了檢測不同容量隱寫的影響,分別把40×40、32×32、24×24、16×16、8×8等不同像素的單色二值圖像作為秘密信息嵌入載體中,嵌入率分別為:1.543%、0.987%、0.556%、0.247%、0.062%。
秘密信息的隱寫算法是:先將選中的視頻幀進(jìn)行分塊,然后在每塊的DCT域中頻系數(shù)中隱寫秘密信息。
圖3是原始視頻第80幀的圖像。圖4是在原始視頻中隱寫40×40秘密信息后第80幀的圖像。隱寫前后的NC為42.071,人眼觀察的結(jié)果是:隱寫前后幾乎沒有差別。
圖5是在原始視頻中隱寫40×40后的檢測連通數(shù)變化結(jié)果,圖6是在原始視頻中隱寫8×8后的檢測連通數(shù)的變化結(jié)果。從圖中可以看出,隱寫了秘密信息的幀,其連通數(shù)發(fā)生了脈沖式增加。
表1是按照上述視頻隱寫分析步驟,分別用閾值D為0.2、0.3、0.4、0.5、0.6,分別對視頻隱寫載體的檢測得到的結(jié)果。從表1可以看出,其檢出率P1、否定率P4較大,檢出率P1最高達(dá)98%,否定率P4最大為100%。漏報(bào)率P2、虛警率P3較小,漏報(bào)率P2最小為2%,虛警率P3最小為0,結(jié)果令人非常滿意。從表1還可以看出,檢測的準(zhǔn)確度與隱寫秘密信息的容量有關(guān),會隨著隱寫容量的減少而降低。特別要指出的是,在寬高分別為360×288的幀圖像中隱寫8×8的秘密信息,即幀內(nèi)隱寫率僅為0.062%時(shí),檢出率P1還能達(dá)到72%,說明其檢測靈敏度非常之高!從表1還可以看出,閾值的選取在0.2-0.4之間比較恰當(dāng)。3.2估計(jì)隱寫容量
在視頻載體中隱寫秘密信息時(shí),隱寫的容量越大,修改幀像素點(diǎn)個(gè)數(shù)就越多,導(dǎo)致連通體數(shù)增加越大。因此,隱寫容量與連通體數(shù)之間應(yīng)該存在某種聯(lián)系。
S、不同閾值D基本無關(guān)。
2)隱寫幀的連通數(shù)平均值a與隱寫容量S關(guān)系密切,與不同閾值D基本無關(guān)。不同隱寫量S的幀連通數(shù)平均值a不同,隱寫容量S越大,隱寫幀的連通數(shù)平均值a就越大;隱寫容量S越小,隱寫幀的連通體平均值a就越小。
通過對表2數(shù)據(jù)分析,發(fā)現(xiàn)隱寫容量S和判斷為隱寫幀的連通數(shù)Ca的平均值a、判斷為非隱寫幀的連通數(shù)Cb的平均值b之差可用以下近似公式表示:
s≈a-b164(2)
其中:容量S單位為bit;a是隱寫幀在相同隱寫容量S、不同閾值D的幀連通數(shù)Ca的平均值;b是非隱寫幀在相同隱寫容量S、不同閾值D的幀連通數(shù)Cb的平均值;由于Ca與a、Cb與b相差不大,計(jì)算時(shí)可互換。
4健壯性檢測
為了檢測本視頻隱寫分析方法的健壯性,分別對隱寫40×40秘密信息的視頻子樣本實(shí)施添加強(qiáng)度為0.01的椒鹽噪聲(Salt&PepperNoise)、添加泊松噪聲(PoissonNoise)、中值濾波、剪切(在圖像左上角剪切64×64像素點(diǎn))、旋轉(zhuǎn)(旋轉(zhuǎn)45度、
旋轉(zhuǎn)15度)、不同分辨率轉(zhuǎn)換(放大100%、縮小50%)、插入幀、刪除幀等視頻處理操作。檢測閾值D設(shè)定為0.2,分別進(jìn)行隱寫分析檢測,定性分析結(jié)果分別見圖7-圖14,定量分析結(jié)果見表3。
5與其它視頻隱寫分析比較
將本文采用的MCN方法與文獻(xiàn)[11]所使用的隱寫分析工具NsF5、PQ、JPH&S方法進(jìn)行比較。檢測的結(jié)果見表4。從結(jié)果可以看到,MCN方法即使在嵌入率相差數(shù)量級的情況下,檢出率優(yōu)于NsF5、PQ、JPH&S(其數(shù)據(jù)采用了平均檢出率)。
6結(jié)語
本文針對采用DCT算法隱寫的視頻,采用選取特殊歸一化系數(shù)的方法,使隱寫幀的連通數(shù)發(fā)生了脈沖式增加,放大隱寫產(chǎn)生的影響,極大地提高了隱寫檢測的靈敏度。本方法能確定隱寫位置,估計(jì)隱寫容量,猜測隱寫是否采用DCT算法,檢測嵌入率小至0.062%的隱寫。且健壯性強(qiáng),能抵抗噪聲、濾波、剪切、旋轉(zhuǎn)、分辨率重建、插入幀、刪除幀等處理與攻擊。
參考文獻(xiàn)
[1]KHANS,KHANMN,IQBALS.BitPositionbasedQualitativeandQuantitativeAnalysisofDCTandSpatialDomainStegnography[J].InternationalJournalofComputerScienceIssues,2013,10(3):169-173.
[2]KODOVSKYJ,F(xiàn)RIDRICHJ.QuantitativesteganalysisofLSBembeddinginJPEGdomain[C].//Proceedingsofthe12thACMworkshoponMultimediaandsecurity.ACM,2010:187-198.
[3]徐長勇,平西建.基于時(shí)空相關(guān)性的視頻隱寫分析[J].中國圖象圖形學(xué)報(bào),2010,15(9):1331-1337.
[4]ABBAST,BEIJIZ,F(xiàn)EDHAOPN.SuggestedMethodforEstimatingMaximumCapacityofImagesforDifferentIntensities[J].InternationalJournalofComputerScienceIssues,2013.10(2):73-82.
[5]QUACHTT.Optimalcoverestimationmethodsandsteganographicpayloadlocation[J].InformationForensicsandSecurity,IEEETransactionson,2011,6(4):1214-1222.
[6]劉靜,湯光明.空域序列隱寫圖像的密鑰估計(jì)算法[J].計(jì)算機(jī)應(yīng)用研究,2010,(010):3896-3898.
[7]PEVNYT,BASP,F(xiàn)RIDRICHJ.Steganalysisbysubtractivepixeladjacencymatrix[J].informationForensicsandSecurity,IEEETransactionson,2010,5(2):215-224.
[8]YueqiangLi,QiujuLiu.BreakingtheDigitalVideoSteganography[J].TELKOMNIKA,2013,11(3):1691-1696.
[9]徐長勇,平西建,張濤.視頻信息偽裝技術(shù)綜述[J].計(jì)算機(jī)應(yīng)用研究,2006,(12):8-11.
[10]龔劬,郭吉強(qiáng).基于FCM算法的隱寫分析算法綜合評估[J].計(jì)算機(jī)工程,2009,35(4):175-179.
[11]Ashu,Rita,Chhikara.PerformanceEvaluationofFirstandSecondOrderFeaturesforSteganalysis[J].InternationalJournalofComputerApplications,2014,92(16):0975-8887.