岳占峰
摘要:本文的主要工作是提出一種新穎的三維小波域視頻水印。首先,對(duì)目標(biāo)視頻進(jìn)行三維小波變換,并在小波域內(nèi)估計(jì)視頻運(yùn)動(dòng)和紋理信息,以此為基礎(chǔ)提取一組視頻關(guān)鍵幀。然后,利用碼分多址和乘性調(diào)制技術(shù),將水印信息嵌入在視頻關(guān)鍵幀的三維小波域內(nèi)。為了提升水印檢測(cè)性能,利用三維小波系數(shù)的統(tǒng)計(jì)特性對(duì)局部最優(yōu)檢測(cè)器進(jìn)行優(yōu)化,并利用它提取水印信息。實(shí)驗(yàn)表明,本文方案在水印不可感知性和魯棒性兩方面都獲得了良好的性能。
關(guān)鍵詞:數(shù)字水印;二值文本圖像;雙域;魯棒性;打印–掃描
中圖分類號(hào):TP393 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2016)28-0196-04
Abstract: This paper presents a video watermarking method in three dimensional discrete wavelet transform (3D DWT). In this method, the target video first undergoes the 3D DWT, and in the DWT domain, a set of key frames are extracted based on the motion and texture information of video. Then, with code divisionmultiple access (CDMA) and Multiplicative modulation techniques, watermark messages are embedded into the 3D DWT domain of the extracted key video frames. In order to improve the detection performance, a locally optimum detector is applied for watermark extraction, which is altered according to the properties of 3D DWT. The experimental results show that the presented video watermarking scheme achieves the good performance both in invisibility and robustness.
Key words: Video watermarking; DWT; CDMA; locally optimum detector; robustness
1 引言
近年來(lái),隨著計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)的迅速發(fā)展和信息時(shí)代的到來(lái),信息表達(dá)朝著高效率、高質(zhì)量的方向邁進(jìn)了一大步。但是在另一方面也隨之出現(xiàn)了十分嚴(yán)重的問(wèn)題,如作品侵權(quán)和篡改,因此以數(shù)字水印技術(shù)為重要組成部分的數(shù)字產(chǎn)品版權(quán)保護(hù)技術(shù)的市場(chǎng)需求更為迫切,數(shù)字水?。╠igitwatermarking)技術(shù)就是將數(shù)字、序列號(hào)、文字、圖像標(biāo)志等版權(quán)信息嵌入到多媒體數(shù)據(jù)中,以起到信息隱藏、版權(quán)保護(hù)、防篡改和數(shù)據(jù)文件的真?zhèn)舞b別等作用,在近幾年,雖然數(shù)字水印技術(shù)得到了迅猛的發(fā)展,但主要集中在靜止圖像水印方面,視頻水印研究仍然是當(dāng)前數(shù)字水印技術(shù)研究方向的一個(gè)熱點(diǎn)和難點(diǎn)。
本文研究的是一種基于三維離散小波變換域的數(shù)字視頻水印的方法,小波變換由于其特有的時(shí)頻局部性等特性,使它比傳統(tǒng)的DCT變換在圖像處理等領(lǐng)域可以取得更好的效果,張立和等[1]將視頻看作三維信號(hào),隱藏水印在視頻信號(hào)三維Gabor變換系數(shù)的幅度上,Swanson等[2]利用時(shí)域小波變換和頻率掩蔽特性相結(jié)合,提出了一種多分辨率的視頻水印算法。De-guillaume等[3]提出將擴(kuò)頻水印嵌入視頻序列的3D-DFT的中頻系數(shù)上。這類視頻水印算法都是對(duì)整個(gè)視頻幀進(jìn)行三維變換,計(jì)算比較復(fù)雜。
本文提出了一種基于三維小波變換的魯棒視頻水印方案。第二節(jié)介紹了三維離散小波變換的概念和原理,第三節(jié)說(shuō)明了關(guān)鍵幀的提取方法,第四節(jié)闡述了水印生成和嵌入的方法,第五節(jié)介紹了水印提取的方法,最后給出實(shí)驗(yàn)結(jié)果,證明了算法的有效性。
2 三維離散小波變換
數(shù)字視頻從本質(zhì)上來(lái)說(shuō)是一系列內(nèi)容連續(xù)并按時(shí)間順序排列的數(shù)字圖像。因?yàn)槿说囊曈X(jué)具有停留效應(yīng),當(dāng)圖像連續(xù)播放并且速度很快時(shí)會(huì)形成平滑的連續(xù)視覺(jué)效果即視頻。構(gòu)成視頻信號(hào)的圖像也叫幀,每幀圖像都可表示成一個(gè)二維像素矩陣,因此由幀按時(shí)間順序排列的視頻可以表示為三維矩陣,其中每幀圖像是兩維的,形成視頻的空間域,時(shí)間軸表示第三個(gè)維度。
三維離散小波變換(three dimensional discrete wavelet transform,3D DWT)是處理三維信號(hào)的一個(gè)有力工具。3D DWT可以通過(guò)在每一維信號(hào)上依次使用一維離散小波變換獲得。一維DWT的原理可以描述如下。給定任意一維離散信號(hào)x(n),小波函數(shù)為,式中為母小波,n,j和k都是整數(shù)。小波變換和逆變換定義為
3D DWT就是幀間一維和幀內(nèi)兩維DWT的組合,即對(duì)三維空間的每一維依次進(jìn)行一維離散小波變換。圖1(a)給出了3D DWT的算法框圖。圖中x,y和z代表信號(hào)維度,
3D DWT用于處理視頻信號(hào)具有顯著優(yōu)點(diǎn):1)低頻系數(shù)能很好保持頻率特性,高頻信息有很強(qiáng)的空間選擇性。2)不僅能對(duì)視頻信號(hào)進(jìn)行平面空間的多分辨率分析,還能為其進(jìn)行時(shí)間軸方向的多分辨率分析。3)既能分析各幀圖像的紋理特性,還能分析各幀圖像在時(shí)間方向上的相關(guān)性。4)利用3D DWT的特性可使水印具有良好的魯棒性及不可見(jiàn)性。
3 關(guān)鍵幀的提取
視頻序列中,存在太多冗余的圖像幀。在所有幀中加入水印不僅運(yùn)算量大,而且不利于提升水印的魯棒性。為了減少分析的信息量,可以從視頻中提取若干關(guān)鍵幀,這些關(guān)鍵幀表示視頻的主要內(nèi)容,后文只在關(guān)鍵幀中進(jìn)行水印的嵌入和提取。
假設(shè)給定的視頻信號(hào)Vo為非壓縮的信號(hào)或者解壓縮后的信號(hào),且只表達(dá)視頻的亮度分量。首先,對(duì)Vo按時(shí)間軸進(jìn)行一維DWT,獲得低頻分量VL和高頻分量VH。計(jì)算高頻分量VH中每幀信號(hào)的能量,記為,其中表示q-范數(shù), i表示幀的在時(shí)間軸上的位置。然后,計(jì)算序列的平均值,記為,作為選取關(guān)鍵幀的第一個(gè)閾值。將每幀信號(hào)的能量與做比較,當(dāng)大于時(shí),證明所對(duì)應(yīng)的視頻幀具有較多的活動(dòng)信息,刪掉該幀會(huì)對(duì)視頻造成嚴(yán)重破壞,在這幀嵌入水印不易被發(fā)現(xiàn),選取該幀作為下一步使用的關(guān)鍵幀,共選取一組N個(gè)關(guān)鍵幀。
接下來(lái),對(duì)選定的N個(gè)關(guān)鍵幀在空間域做三級(jí)二維小波變換,得到10個(gè)子帶。使用l ∈ {0, 1, 2}表示小波變換的分辨率,θ ∈ {0, 1, 2, 3}表示二維小波變換的方向,三級(jí)二維小波變換分解圖如圖2所示。計(jì)算第i個(gè)關(guān)鍵幀的子帶,和的總能量如下:
當(dāng)<時(shí),認(rèn)為該幀具有低紋理區(qū),反之認(rèn)為是高紋理區(qū)。最終將水印嵌入具有高紋理區(qū)的視頻幀內(nèi)。經(jīng)過(guò)這三步選定的視頻幀含有豐富的時(shí)間域和空間域紋理信息和活動(dòng)信息,適合嵌入水印。
4 水印生成與嵌入
設(shè)Vo表示一段的視頻,待嵌入的水印信息為m。圖3給出了3D DWT的水印生成及嵌入過(guò)程,具體描述如下。
4.1 水印生成
水印生成過(guò)程可以分解為三步:水印信息編碼、水印模板信號(hào)生成和水印信號(hào)調(diào)制。
步驟一:水印編碼采用了CDMA技術(shù),以提高水印信息的容量。先將m編碼成一個(gè)水印字符序列b ∈ B p,其元素bj ∈ B,這里B = {0,1,…,B},B = | B |。該過(guò)程可采用糾錯(cuò)編碼技術(shù),以提高水印信息解碼的正確率。
步驟二:水印模板信號(hào)生成。以秘鑰K為種子,利用偽隨機(jī)數(shù)發(fā)生器產(chǎn)生一組高斯分布的隨機(jī)數(shù),組成B×p個(gè)二維矩陣,記為,i = 1, …, B,j = 1, …, p。矩陣記為的大小與待嵌入水印的載體信號(hào)相同。為了減小這些矩陣在嵌入水印過(guò)程中的相互干擾,可以對(duì)這些矩陣進(jìn)行標(biāo)準(zhǔn)正交化,但是會(huì)提高水印嵌入的復(fù)雜度。
步驟三:水印信號(hào)調(diào)制。選擇與bj對(duì)應(yīng)的水印模板信號(hào),將其合并為一個(gè)調(diào)制后的水印信號(hào)Wm,即
當(dāng)B = 2時(shí),稱為二元水印。此時(shí),為嵌入水印信息m,需要生成p log2 B個(gè)隨機(jī)數(shù)矩陣。顯然,隨著嵌入信息量的增加,B元水印需要生成的隨機(jī)數(shù)向量個(gè)數(shù)相對(duì)二元水印較小。相應(yīng)的,水印的魯棒性會(huì)提高。
4.2 水印嵌入
現(xiàn)將調(diào)制后的水印信號(hào)Wm嵌入到給定的視頻Vo中,具體步驟描述如下。
步驟一:將原始視頻Vo實(shí)行3D DWT,根據(jù)前一節(jié)描述的算法提取一組視頻關(guān)鍵幀,從而將Vo分成兩部分:適合嵌入水印的關(guān)鍵幀序列Vm和其余部分Vr。
步驟二:提取Vm中每幀圖像的分量作為水印載體信號(hào),并將獲得的信號(hào)Wm以乘性調(diào)制技術(shù)嵌入到中,得到信號(hào),即
其中,符號(hào)“.”表示矩陣的對(duì)應(yīng)元素相乘,α表示全局水印嵌入強(qiáng)度,可以根據(jù)視頻信號(hào)質(zhì)量確定。α越大,水印的魯棒性越強(qiáng),但是不可感知性會(huì)下降。因此,選擇α需要對(duì)水印魯棒性越強(qiáng)和不可感知性進(jìn)行折中考慮。
步驟三:使用每個(gè)嵌入水印的代替,并進(jìn)行相應(yīng)的3D IDWT,最終得到加水印后的視頻信號(hào)Vw。
從上述水印嵌入過(guò)程可以看出,該方案為提升水印性能綜合考慮了多種因素,主要包括:1)采用基于3D DWT的關(guān)鍵幀提取技術(shù),水印嵌入只在關(guān)鍵幀上進(jìn)行操作,有利于改善水印的復(fù)雜度和魯棒性;2)水印信號(hào)經(jīng)過(guò)CDMA后嵌入在視頻信號(hào)中,可以提升水印魯棒性。3)水印的嵌入位置選擇在視頻信號(hào)的分量,并且水印嵌入使用了乘性調(diào)制技術(shù),有利于在水印的不可見(jiàn)性和魯棒性獲得良好的折衷效果。
5 水印提取
本節(jié)先給出水印的提取原理,然后描述水印的提取過(guò)程。
5.1 水印提取原理
水印提取問(wèn)題是從待處理的視頻中提取每一個(gè)嵌入的水印字符bj,j = 1, …, p,然后進(jìn)行解碼得出嵌入水印信息m的過(guò)程。為了方便描述,假設(shè)是從視頻Vu的一個(gè)關(guān)鍵幀中獲得的3D DWT分量,b表示某個(gè)需要提取的水印字符。提取b的方法實(shí)際是判斷中是否有水印字符b所對(duì)應(yīng)的水印模板信號(hào)。這屬于二元假設(shè)問(wèn)題??紤]到式(4)和(5),此問(wèn)題可以描述為
對(duì)于此二元假設(shè)問(wèn)題,文獻(xiàn)[11]提出了一種局部最優(yōu)檢測(cè)器(locally optimum detector, LOD)。LOD假設(shè)的每個(gè)分量都符合獨(dú)立的一般高斯分布,其形狀參數(shù)構(gòu)成矩陣C,標(biāo)準(zhǔn)差構(gòu)成矩陣D,因此LOD的決策統(tǒng)計(jì)量具有如下的形式
式中,函數(shù)用于計(jì)算輸入矩陣的所有分量之和,函數(shù)定義為
其中,是Gamma函數(shù),且如果的輸入變量為矩陣時(shí),則對(duì)輸入矩陣的每一分量分別操作。
對(duì)于3D DWT系數(shù),形狀參數(shù)矩陣C的所有分量可設(shè)為1。標(biāo)準(zhǔn)差矩陣D可使用極大似然估計(jì)獲得[12]。
5.2 水印提取過(guò)程
基于3D DWT視頻水印的提取過(guò)程如圖4所示。詳細(xì)描述如下。
步驟一:對(duì)視頻Vu實(shí)行3D DWT操作,3D DWT的計(jì)算過(guò)程與嵌入水印時(shí)的相同。
步驟二:根據(jù)第3節(jié)提出的關(guān)鍵幀提取算法提取關(guān)鍵幀序列,以及的3D DWT 分量。
步驟三:再次利用密鑰K產(chǎn)生B×p個(gè)高斯分布的隨機(jī)數(shù)矩陣,i = 1, …, B,j = 1, …, p。
步驟四:對(duì)的第k幀和隨機(jī)數(shù)矩陣,按式(8)計(jì)算LOD決策統(tǒng)計(jì)量,并且水印字符序列的每個(gè)分量根據(jù)下式?jīng)Q定
得出位序列,其中,η為決策閾值,可根據(jù)水印檢測(cè)性能確定。
步驟五:對(duì)由式(9)獲得的水印字符序列進(jìn)行解碼,得到水印信息。
6 實(shí)驗(yàn)結(jié)果
為了說(shuō)明本文方案的性能,我們進(jìn)行了大量的仿真實(shí)驗(yàn)。實(shí)驗(yàn)采用了四段視頻,如圖5所示,主要對(duì)水印的不可感知性和魯棒性進(jìn)行測(cè)試。所有實(shí)驗(yàn)由MATLAB R2010a完成。
A 水印的不可感知性
利用本文方案在每個(gè)測(cè)試視頻中分別嵌入長(zhǎng)為240位,480位和720位的隨機(jī)信息,并計(jì)算每種情況下的峰值信噪比(peak signal-to-noise ratio,PSNR)。表1顯示了視頻質(zhì)量的測(cè)試結(jié)果。當(dāng)PSNR值越大時(shí),說(shuō)明視頻的質(zhì)量越好。測(cè)試獲得的所有PSNR都大于38dB,對(duì)于視頻,一般來(lái)說(shuō)當(dāng)PSNR大于30dB時(shí),人眼是難于分辨的。而且,通過(guò)人眼觀察我們注意到,每個(gè)嵌入水印的視頻確實(shí)具有良好的質(zhì)量,水印嵌入引起的失真是可以接受的。水印具有很好的自適應(yīng)性和不可感知性,主要?dú)w功于我們只在視頻關(guān)鍵幀中嵌入水印,而且水印被嵌入在小波域中的中頻帶。
B 水印的魯棒性
為了評(píng)價(jià)算法的魯棒性,我們采用位錯(cuò)誤率(Bit Error Ratio, BER)作為性能評(píng)價(jià)指標(biāo)。表2給出了在各種攻擊下的魯棒性測(cè)試結(jié)果,相應(yīng)的測(cè)試條件為,所有加水印的視頻的PSNR都設(shè)為39 dB,水印信息長(zhǎng)度為480位。
1)對(duì)噪聲攻擊的魯棒性。
該測(cè)試使用了加性高斯白噪聲,攻擊的強(qiáng)度由噪聲的標(biāo)準(zhǔn)差σn來(lái)衡量。表2顯示,本文方案對(duì)高斯噪聲具有很強(qiáng)的魯棒性,當(dāng)噪聲標(biāo)準(zhǔn)差為0.2時(shí),提取水印信息的BER在0.1左右,而且,當(dāng)噪聲強(qiáng)度的減小到0.04時(shí),嵌入信息能被準(zhǔn)確提取。
2)對(duì)濾波攻擊的魯棒性。
接著,對(duì)水印進(jìn)行了高斯低通濾波攻擊,攻擊強(qiáng)度由濾波器寬度wf來(lái)測(cè)量。測(cè)試結(jié)果如表2所示。很明顯,相對(duì)噪聲攻擊,本文方案對(duì)濾波攻擊較為敏感。當(dāng)wf = 0.6時(shí),嵌入信息能被準(zhǔn)確提取,但是隨著濾波器寬度wf的增加,它的性能迅速下降,當(dāng)wf = 0.8時(shí),BER超過(guò)30%。
3)對(duì)Gamma校正的魯棒性。
Gamma校正是視頻處理中最常用的操作之一,其攻擊強(qiáng)度可以由γ因子衡量。Gamma校正對(duì)水印的作用效果如表2所示??梢钥闯?,本文方案對(duì)Gamma校正具有很強(qiáng)的抵抗能力。當(dāng)γ = 0.5時(shí),嵌入信息能被準(zhǔn)確提取,而且,隨著γ因子的變大, BER的上升速度很慢。
4)對(duì)幀平均攻擊的魯棒性。
幀平均操作是一種典型的針對(duì)視頻水印的惡意攻擊,其性質(zhì)是一種低通濾波。在該測(cè)試中,幀平均1使用了最近鄰兩幀的平均值代替當(dāng)前幀,幀平均2使用了最近鄰四幀的平均值代替當(dāng)前幀。測(cè)試結(jié)果如表2所示。測(cè)試表明,本文方案對(duì)幀平均攻擊具有極佳的魯棒性,在該攻擊下,水印信息的BER都接近零。
5)對(duì)幀刪除攻擊的魯棒性。
視頻在傳輸中容易產(chǎn)生丟幀。丟幀對(duì)水印的影響可以用幀刪除操作進(jìn)行評(píng)價(jià)。在該測(cè)試中,我們對(duì)每個(gè)視頻隨機(jī)刪除3幀。測(cè)試結(jié)果見(jiàn)表2??梢钥闯?,該攻擊對(duì)水印的影響與幀平均操作類似,本文方案對(duì)這種攻擊不敏感。這是因?yàn)椋覀兊姆桨钢辉谝曨l關(guān)鍵幀中嵌入水印。
6)對(duì)MPEG壓縮攻擊的魯棒性。
為了節(jié)省存儲(chǔ)空間和方便傳輸,視頻信號(hào)常常需要壓縮,MPEG是一種常用的視頻壓縮標(biāo)準(zhǔn)。測(cè)試采用了MPEG-2標(biāo)準(zhǔn)對(duì)視頻信號(hào)進(jìn)行壓縮,壓縮比為10:1,測(cè)試結(jié)果見(jiàn)表2。很顯然,本文方案對(duì)MPEG壓縮是魯棒的。在壓縮比高達(dá)10:1時(shí),水印信息的BER仍然在20%以下。
7 結(jié)論
本文提出了一種基于3D DWT的魯棒視頻水印。首先,我們給出了一種新的關(guān)鍵幀提取方案。該方案利用3D DWT的特性估計(jì)視頻幀的場(chǎng)景和紋理信息,使得提出的關(guān)鍵幀能更好地隱蔽水印信息。然后,采用CDMA技術(shù)將水印嵌入在關(guān)鍵幀的3D DWT域內(nèi),水印提取使用了一種局部最優(yōu)檢測(cè)器。實(shí)驗(yàn)表明,本文提出的水印方案不僅具有理想的水印不可感知性,而且能有效抵抗普通的視頻處理操作,對(duì)視頻幀操作和視頻壓縮也具有良好的魯棒性。
參考文獻(xiàn):
[1] 唐松生, 董穎.基于DWT的視頻數(shù)字水印算法[J].信息技術(shù),2008(4):116-117.
[2] 江玉珍,朱映輝,楊群生.基于三維小波低頻域的彩色視頻盲水印算法[J]. 計(jì)算機(jī)工程與應(yīng)用,2009,45(21).:103-105.
[3] 文靜.韓葉飛.基于三維小波變換的視頻散列算法[J].計(jì)算機(jī)工程,2010, 36(19): 239-240
[4] Huang D.,Yan H..Interword distance changes represented by sine waves for watermarking text images[J]. IEEE Transactions on Circuits Systems for Video Technology, 2001, 11(12): 1237-1245.
[5] Thiemert S., Steinebach M., and Wolf P.. A digital watermark for vector-based fonts. Proceedings of the 8th ACM Multimedia and Security Workshop, Geneva, Switzerland, 2006: 120-123.
[6] Bensaad M. L. and Yagoubi M. B.. Boosting the capacity of diacritics-based methods for information hiding in Arabic text. Arabian Journal for Science and Engineering, 2013, 38(8): 2035-2041.
[7] Chen Yan-Ming. Study on digital watermarking for document security [D]. Yangzhou: Yanghzou University, 2011 .
[8] Dong P, Brankov J G, Galatsanos N P, et al. Digital watermarking robust to geometric distortions[J]. IEEE Transactions on Image Processing, 2005, 14(12): 2140-2150.
[9] 譚海曙,趙慧民,丁曉艷. 視頻圖像的3D DIWT數(shù)據(jù)隱藏算法[J]. 電路與系統(tǒng)學(xué)報(bào), 2011(3): 62-67.
[10] 徐達(dá)文, 王讓定.基于分塊三維小波變換的盲視頻水印算法[J]. 東南大學(xué)學(xué)報(bào):自然科學(xué)版,2007: 201-205.
[11] Qiang cheng, Thomas S.Huang. Robust Optimum Detection of Transform Domain Multiplicative Watermarks[J]. IEEE Transactions on Signal Processing, 2003: 906-924.
[12] MN Do,M Vetterli. Wavelet-based texture retrieval using generalized gaussian density and Kullback-Leibler distance[J]. IEEE Trans Image Process. 2002,11(2): 146-158.