李景麗 高玲
摘 要: 提出了一種強魯棒性的基于能量差值比較的時域音頻數(shù)字水印算法。根據(jù)要嵌入的水印序列將音頻載體分為長度相等的若干節(jié),每節(jié)再分為長度相等的若干段,通過比較每節(jié)前兩段和后兩段的能量差值,結(jié)合要嵌入的水印序列和人類聽覺系統(tǒng)的時域掩蔽效應(yīng),采取修改每節(jié)前兩段或后兩段能量差值的方法將水印序列嵌入到音頻載體中。實驗結(jié)果表明,該算法透明性良好,對多種音頻攻擊均具有良好的魯棒性,并可實現(xiàn)盲檢測。
關(guān)鍵詞: 時域算法; 音頻數(shù)字水?。?能量差值; 掩蔽效應(yīng); 盲檢測
中圖分類號: TN911.7?34; TP309.7 文獻標識碼: A 文章編號: 1004?373X(2014)11?0085?03
Abstract: A robust time?domain audio digital watermark algorithm based on energy difference comparison is proposed. The audio carrier is divided into several sections with equal length according to the watermark sequence being to be embedded, and each section is divided into several segments with equal length. The watermark sequence is embedded into the audio carrier by comparing and modifying the energy difference of the first two segments and the last two segments of each section, and combinating the time?domain masking effect of human auditory system and the watermark sequence being to be embedded. The simulation results show that the algorithm has good transparency and good robustness against various audio attacks, and can realize blind detection.
Keywords: time?domain algorithm; audio digital watermark; energy difference; masking effect; blind detection
0 引 言
數(shù)字水印技術(shù)是近年來興起的前沿研究領(lǐng)域,在多媒體信息的版權(quán)保護和完整性認證方面得到迅猛發(fā)展,已成為多媒體信息安全研究領(lǐng)域的一個熱點[1]。音頻數(shù)字水印技術(shù)就是在原始音頻文件中嵌入水印信息的過程,不同應(yīng)用場合下,水印內(nèi)容可以是一段文字、一幅圖像[2]、一段音頻或者視頻[3]等。由于人類聽覺系統(tǒng)對噪聲的存在非常敏感,且現(xiàn)有眾多音頻處理軟件可方便地對音頻文件進行多種操作,故通常要求水印信息的嵌入要與人類聽覺系統(tǒng)相結(jié)合,不能對原始音頻文件造成人耳可察覺的失真影響,并能夠抵御常見音頻攻擊,此外,一般還應(yīng)滿足易于提取和能實現(xiàn)盲檢測等條件。
根據(jù)水印信息的隱藏位置不同,音頻數(shù)字水印有時域和變換域之分。時域音頻水印易于實現(xiàn)且計算復(fù)雜度較低[4],但抵抗攻擊的能力即魯棒性較差[5]。變換域音頻水印[6?8]通常具有較強的魯棒性,但在計算復(fù)雜度、嵌入和提取速度、實時性等方面不如時域音頻水印。本文旨在設(shè)計一種強魯棒性的音頻數(shù)字水印算法,這在對實時性要求較高的秘密通信領(lǐng)域顯得尤為重要。該算法采用分段求取能量差值并進行比較的方式,結(jié)合人類聽覺系統(tǒng)的時域掩蔽效應(yīng)實現(xiàn)水印信息的嵌入。實驗結(jié)果表明,該算法滿足對魯棒性的設(shè)計要求,透明性好,并可實現(xiàn)盲檢測。
1 水印序列的嵌入
1.1 音頻載體的劃分
將音頻載體信號表示為:
[M={m(i), 1≤i≤L}]
式中:[M]為音頻載體信號;[L]為音頻載體的長度。
將要嵌入到音頻載體中的二值水印序列表示為:
[W={w(i),1≤i≤N}, w(i)∈{0,1}]
式中:[W]為二值水印序列;[N]為水印序列的長度。
將音頻載體信號劃分為[X]節(jié),每節(jié)長度相等。為保證水印序列可被完整的嵌入到音頻載體中,需滿足條件:[X≥N]。再將每節(jié)劃分為等長的[Y]段(本算法要求[Y≥4]),每段長度為[S]。分別用[Mx1]和[Mx2]表示第[x]([1≤x≤X])節(jié)音頻載體信號的前兩段,用[Mx3]和[Mx4]表示第[x]節(jié)的后兩段,則劃分后第[x]節(jié)的前兩段和后兩段可分別表示為:
1.3 水印序列的嵌入
在音頻載體信號的每一節(jié)實現(xiàn)一位水印信息的嵌入。根據(jù)對音頻載體信號每一節(jié)的能量差值[EDx1]和[EDx2]進行比較的結(jié)果,結(jié)合要嵌入的水印序列和人類聽覺系統(tǒng)的時域掩蔽效應(yīng),通過修改相應(yīng)段中音頻載體信號取樣值的方法實現(xiàn)在時域嵌入水印信息。
1.3.1 水印比特為“1”時的嵌入算法
當要嵌入的水印比特為“1”時,若[EDx1>EDx2,]則對該段音頻載體信號的取樣值不做改變。
若[EDx1≤EDx2,]則通過修改相應(yīng)段的取樣值使得[EDx1]增大、[EDx2]減小,直到兩者之間滿足條件[EDx1>EDx2]為止。具體算法如下:
如果[Ex1>Ex2,]表明音頻載體信號有減小的趨勢,根據(jù)人類聽覺系統(tǒng)的時域后掩蔽效應(yīng),通過修改相應(yīng)段的取樣值以增大[Ex1],同時令[Ex2]保持不變的方法實現(xiàn)增大[EDx1]的目的,則[Ex1]前面的強音能夠掩蔽增大[Ex1]對音頻載體信號造成的影響。
如果[Ex1≤Ex2,]表明音頻載體信號有增大的趨勢,根據(jù)人類聽覺系統(tǒng)的時域前掩蔽效應(yīng),通過修改相應(yīng)段的取樣值以增大[Ex2,]同時令[Ex1]保持不變的方法實現(xiàn)增大[EDx1]的目的,則[Ex2]后面的強音能夠掩蔽增大[Ex2]對音頻載體信號造成的影響。
同理,如果[Ex3>Ex4,]則通過修改相應(yīng)段的取樣值以減小[Ex3,]同時令[Ex4]保持不變以減小[EDx2;]如果[Ex3≤Ex4,]則通過修改相應(yīng)段的取樣值以減小[Ex4,]同時令[Ex3]保持不變以減小[EDx1]。
1.3.2 水印比特為“0”時的嵌入算法
當要嵌入的水印比特為“0”時,若[EDx1≤EDx2,]則對該段音頻載體信號的取樣值不做改變。
若[EDx1>EDx2,]則通過修改相應(yīng)段的取樣值使得[EDx1]減小、[EDx2]增大,直到兩者之間滿足條件[EDx1≤EDx2]為止。具體算法如下:
如果[Ex1>Ex2],則采取減小[Ex1]同時讓[Ex2]保持不變的方法以減小[EDx1。]
如果[Ex1≤Ex2,]則采取減小[Ex2]同時讓[Ex1]保持不變的方法以減小[EDx1。]
如果[Ex3>Ex4],則采取增大[Ex3]同時讓[Ex4]保持不變的方法以增大[EDx1]。
如果[Ex3≤Ex4,]則采取增大[Ex4]同時讓[Ex3]保持不變的方法以增大[EDx1]。
2 水印序列的提取
采用該算法在音頻載體信號中嵌入的水印序列,在提取水印序列時也要首先對含水印的音頻信號進行劃分,且節(jié)與段的劃分方式要與嵌入水印時的劃分方式一致。然后針對含水印的音頻信號分別計算每節(jié)前兩段的能量差值[ED′x1]和每節(jié)后兩段的能量差值[ED′x2,]根據(jù)各節(jié)能量差值[ED′x1]和[ED′x2]的比較結(jié)果,即可實現(xiàn)水印序列的提取,具體提取算法如下:若[ED′x1>ED′x2,]則提取水印比特為“1”;若[ED′x1≤ED′x2,]則提取水印比特為“0”。
可見,采用該算法在音頻文件中嵌入的水印序列提取非常簡單,并且在提取水印序列時不需要原始音頻載體信號,可實現(xiàn)音頻水印序列的盲提取。
3 實驗與結(jié)果分析
實驗用原始音頻樣本選用文件大小為861 KB、取樣頻率為11.025 kHz、位深為16 b、持續(xù)時間為40 s的單聲道Wave波形文件。嵌入音頻樣本中的水印選用文件大小為1.15 KB、像素為93×93的BMP格式的單色二值圖像。將該水印圖像降維處理成一維序列,降維后的水印序列長度為8 469。原始音頻樣本長度為441 002,根據(jù)本算法將音頻樣本按照每節(jié)50個取樣點進行劃分,每節(jié)再劃分為25個具有2個取樣點的段。采用基于能量差值比較的音頻數(shù)字水印算法將水印序列嵌入到音頻樣本中。
3.1 透明性檢測[9]
采用本算法嵌入水印前后的音頻信號與誤差信號的時域波形如圖1所示,其中圖1(a)所示為原始音頻信號時域波形,圖1(b)所示為采用本文算法嵌入水印之后的音頻信號時域波形。
由圖1可見,采用本算法在音頻文件中嵌入水印信息,對原始音頻文件的改變很小,再結(jié)合人類聽覺系統(tǒng)的時域前掩蔽效應(yīng)和時域后掩蔽效應(yīng),這種改變是人耳很難感知到的,故嵌入水印對音頻數(shù)據(jù)的品質(zhì)影響較小,該算法透明性良好。
3.2 魯棒性檢測[10]
通常用歸一化相關(guān)系數(shù)(NC)來計算提取的水印圖像與原始水印圖像之間的相似性[11]。設(shè)[W]為原始水印序列,[W]為提取的水印序列,[N]為水印長度,則歸一化相關(guān)系數(shù)的計算公式為:
[NC=i=1NW(i)W(i)i=1NW(i)2i=1NW(i)2] (11)
為檢測該算法的魯棒性,分別對已嵌入水印的音頻文件進行疊加噪聲攻擊、重采樣攻擊、音頻格式轉(zhuǎn)換攻擊、低通濾波攻擊等常見的音頻攻擊測試,攻擊后所提取的水印和相應(yīng)的歸一化相關(guān)系數(shù)(NC)如表1所示。其中,疊加噪聲①攻擊是對已嵌入水印的音頻文件添加1%高斯白噪聲;疊加噪聲②攻擊是添加10%均勻分布白噪聲;重采樣攻擊是對含水印的音頻文件由11.025 kHz上采樣至22.05 kHz;格式轉(zhuǎn)換①攻擊是在保持采樣率為11.025 kHz的情況下,將含水印的音頻文件由WAV格式轉(zhuǎn)換為MP3格式,再轉(zhuǎn)換為WAV格式;格式轉(zhuǎn)換②攻擊為將含水印的音頻文件由WAV格式(采樣率為11.025 kHz)轉(zhuǎn)換為MP3格式(采樣率為22.05 kHz)再轉(zhuǎn)換為WAV格式(采樣率為11.025 kHz);低通濾波①攻擊為將含水印的音頻文件經(jīng)過通帶內(nèi)允許最大紋波為1 dB的2階ChebyshelⅠ型低通濾波器;低通濾波②攻擊為將含水印的音頻信號經(jīng)過2階Butterworth低通濾波器。通過在多種典型音頻文件攻擊下的測試結(jié)果可見,該水印能夠有效抵御多種攻擊,具有較強的魯棒性。
4 結(jié) 語
本文提出了一種強魯棒性的音頻數(shù)字水印時域算法,該算法采用分段求取能量差值并進行比較的方法,結(jié)合要嵌入的水印序列和人類聽覺系統(tǒng)的時域掩蔽效應(yīng)修改相應(yīng)段中的取樣值,實現(xiàn)在音頻載體中嵌入水印信息。通過對含水印的音頻信號采取相同的分段求取能量差值并進行比較的方式實現(xiàn)水印信息的盲提取。實驗結(jié)果表明,該算法透明性良好,且能夠有效抵御疊加噪聲、重采樣、音頻格式轉(zhuǎn)換、低通濾波等多種常見的音頻攻擊,具有較強的魯棒性。
參考文獻
[1] 金聰.數(shù)字水印理論與技術(shù)[M].北京:清華大學出版社,2008.
[2] 趙波,卞金來,高飛.基于可視密碼術(shù)的小波域音頻數(shù)字水印研究[J].現(xiàn)代電子技術(shù),2008,31(11):84?86.
[3] LU Chun?shien, LIAO Hong?yuan Mark, CHEN Liang?hua. Multipurpose audio watermarking [C]// Proceedings of International Conference on Pattern Recognition. Barcelona: [s.n.], 2000, 3: 282?285.
[4] 孫素靜,管會生,王妍妍,等.音頻水印算法復(fù)雜性評估[J].計算機工程與設(shè)計, 2008,29(11):2848?2851.
[5] 李偉,袁一群,李小強,等.數(shù)字音頻水印技術(shù)綜述[J].通信學報,2005,26(2):100?111.
[6] WANG Hong?xia, FAN Ming?quan. Centroid?based semi?fra?gile audio watermarking in hybrid domain [J]. Science China Information Sciences, 2010, 53(3): 619?633.
[7] CHEN Ning, ZHU Jie. Multipurpose audio watermarking algorithm [J]. Journal of Zhejiang University (Science A: An International Applied Physics & Engineering Journal), 2008, 9(4): 517?523.
[8] CHEN Bao?yuan, ZHU Yi?qiang, TIAN Lei?lei, et al. Robust audio blind watermarking algorithm based on haar transform [J]. Journal of Harbin Institute of Technology, 2013, 20(3): 104?108.
[9] 王讓定,柴佩琪.基于聽覺模型的自適應(yīng)音頻數(shù)字水印盲檢算法[J].同濟大學學報:自然科學版,2004,32(11):1516?1520.
[10] 馮濤,韓紀慶.基于聽覺特性的音頻水印能量估計及自適應(yīng)嵌入算法研究[J].聲學學報,2006,31(1):48?54.
[11] 楊義先,鈕心忻.數(shù)字水印理論與技術(shù)[M].北京:高等教育出版社,2006.