楊 洋,陳耿彪
YANG Yang,CHEN Geng-biao
(上海工程技術大學 高職學院, 上海 200437)
隨著互聯(lián)網(wǎng)技術與數(shù)字音頻壓縮技術的發(fā)展,數(shù)字化的信息傳播變得極為快速和便捷,非法傳播帶有版權保護的音樂作品也因此得以盛行,這使得音樂作品的創(chuàng)作者和發(fā)行者的利益受到極大損害。數(shù)字音頻水印技術作為音頻作品版權保護的有效手段,已經(jīng)引起人們的高度重視,并逐步成為多媒體信息處理和信息安全領域的一個研究熱點,并陸續(xù)提出了一系列數(shù)字音頻水印嵌入方案。目前的數(shù)字水印算法有LSB[1]、回聲隱藏算法[2],相位隱藏算法[2]和擴頻算法[3]等以及隨后的各種變換域水印算法[4,5]。近年來,結(jié)合機器學習[6]的水印算法成了水印研究中一個新的熱點。
在嵌入算法確定后,嵌入位置的選擇對水印性能有很大的影響。然而在以往的研究中,嵌入位置的選擇僅考慮了不可感知性的需求,卻未綜合考慮抗攻擊的魯棒性。本文在基于音頻信號DCT域嵌入同步水印方案的基礎上,引入遺傳算法優(yōu)化嵌入位置,進一步改善水印算法性能。
為了有效地抗擊剪裁攻擊,在加入同步信號的基礎上,還添加了每個水印值的序號,在檢測時通過同步信號確定水印嵌入在音頻作品中的位置,在恢復圖象時利用水印序號確定每個水印值在圖象中的位置,將同步信號,水印序號,水印信號均嵌入DCT域的低頻系數(shù)中。圖1給出了嵌入數(shù)據(jù)的結(jié)構(gòu)。
圖1 嵌入數(shù)據(jù)的結(jié)構(gòu)
同時由人類聽覺系統(tǒng)(HAS)掩蔽特性知:高能量信號前后短時間發(fā)生的少量畸變難以被覺察,且滯后掩蔽區(qū)持續(xù)時間較長??梢娔芰枯^高的數(shù)字音頻區(qū)更適合嵌入水印。
另外,為了消除二值水印圖像的像素空間相關性,避免音頻作品在遭受大面積剪裁后,提取的水印圖象會出現(xiàn)整塊區(qū)域無法恢復的情況,可對待嵌入的水印圖像進行置亂加密處理。本文采用Logistic映射,首先產(chǎn)生一個混沌系列,對水印圖象與混沌系列進行異或運算,即可生成置亂加密后的安全水印信息。用混沌序列排序的方法對圖像進行置亂有很高的保密度,只有確切密鑰才能恢復原圖像。
對每個水印元素按照同步碼,水印序號,水印的順序組成一個水印的數(shù)據(jù)組,首先將數(shù)字音頻信號進行分段處理,根據(jù)能量關系選擇合適的音頻數(shù)據(jù)段,然后再將該音頻數(shù)據(jù)段分割成L1,L2,L3三部分,分別進行DCT變換,每幀選取頻率較低的交流分量嵌入同步碼,水印序號和水印信息。本文采用量化調(diào)制策略,對所選低頻系數(shù)進行量化處理,其嵌入規(guī)則如下:
遺傳算法GA(Genetic Algorithm)由美國Miehigan大學的Holland教授提出的模擬自然界遺傳機制和生物進化論而成的一種并行隨機搜索最優(yōu)化方法。它將“優(yōu)勝劣汰,適者生存”的生物進化原理引入優(yōu)化參數(shù)形成的編碼串聯(lián)群體中,按所選擇的適配值函數(shù)并通過遺傳中的復制、交叉及變異對個體進行篩選,使適配值高的個體被保留下來,組成新的群體,新的群體繼承了上一代的信息,又優(yōu)于上一代。這樣周而復始,群體中個體適應度不斷提高,直到滿足一定的條件。
音頻水印希望有更好的不可察覺性和更高的魯棒性。因此,GA全局搜索要盡量提高不可察覺性和魯棒性的綜合性能。不可感知性選取的量化標準:信噪比SNR。魯棒性考慮選取對音頻進行攻擊測試后,提取水印的相關系數(shù):Nc和誤碼率:Ber。根據(jù)上面的嵌入方案,取得Snr和三組不同攻擊下的Nc、Ber數(shù)據(jù),設定適應度函數(shù)時,必須考慮到以下兩個條件:
1)以提高以上3個參數(shù)的綜合值為遺傳算法的進化目標。
2)進化過程中,GA不能以犧牲過大的對立數(shù)據(jù)值來提高整體綜合值。也即避免出現(xiàn)很高的音頻質(zhì)量,而抗攻擊能力極低或過大地降低音頻質(zhì)量來提高對攻擊的魯棒性等情況。
將Snr,Nc‘,Ber’線性合成適應度函數(shù):
其中Xι表示遺傳算法進化過程中的個體,考慮到不可感知性和魯棒性是一對此消彼長的矛盾對立,必須平衡兩方參數(shù)的對fitness值的收益。
根據(jù)遺傳算法的基本思想,具有越高適應度能力的個體有越高的能力把本身的基因遺傳到下一代。因此,本文算法以個體適應度能力為標準采用輪盤法確定被選擇直接復制到下一代的個體。
完成選擇算子后,剩余的個體中,根據(jù)輪盤法選定個體參與交叉,交叉配對雙方隨機確定且每個個體只能參與一次交叉行為。交叉過程采用單點交叉法:隨機確定在基因序列中的某個位置,交叉的父代在這個位置以后的基因片段進行對換。
數(shù)字水印發(fā)展至今,沒有一個完善的標準來評價某個音頻信號的最佳水印方案。因此,本文遺傳算法迭代沒有預期最優(yōu)解,而是盡量提高水印算法的綜合性能,因此設定終止條件為進化100代。
利用遺傳算法進行水印信息嵌入的步驟如下:
1)隨機生成2O個初始染色體S;
2)設置進化代數(shù)計數(shù)器t=0,最大進化代數(shù)T=100,種群規(guī)模N=10;
3)采用賭輪盤法從S中選出N個染色體,構(gòu)成SI即S(t);
4)個體評價,根據(jù)公式(5)計算每個個體的適應度值;
5)檢驗算法收斂終止準則,如果滿足則轉(zhuǎn)到(11)
6)按60%的概率將SI的N/2對染色個體進行兩點交叉;
7)按2%的概率進行變異得N個新染色體,存入S2,即S(t+1);
8)終止條件判斷,若t≤T,則t=t+1;轉(zhuǎn)到3);若t>T,終止計算,轉(zhuǎn)到9);
9)以進化過程中所得到的具有最好適應能力個體對應的數(shù)據(jù)音頻數(shù)據(jù)段適合同步碼和水印信息的嵌入。。
本文采用量化策略將水印數(shù)據(jù)組嵌入音頻信號中,該算法屬于盲水印檢測,即檢測數(shù)字水印信號時不需要原始音頻載體。數(shù)字水印提取過程如下:
1)對嵌入水印后的音頻進行嵌入時相同的分幀,根據(jù)嵌入時由GA得到的位置信息,對嵌入位置的數(shù)據(jù)段進行DCT變換。
3)通過同步碼對水印元素定位,若受到隨機裁剪攻擊,必然會丟失部分水印信息,將缺失的水印元素被置0,使提取的水印與原水印有相同的長度,以此來恢復水印圖像。
4)將所有的語音數(shù)據(jù)段處理后,得到一個水印混沌序列V'1,再對V'1與原混沌序列進行異或運算,得到解密后的水印信息V'1,對其進行升維處理,最終可以把圖象水印給恢復出來。
為了驗證本文數(shù)字音頻水印算法的高效性,以下分別給出了檢測性能測試,抗攻擊能力測試的實驗結(jié)果,并與文獻[4]算法進行了對比。實驗中,采用8bit量化精度,22.05kHz采樣率,長度為68.34秒的數(shù)字音頻信號,采用L1=12bark碼作為同步碼,水印圖象是32*32的“洋”二值圖象,總的水印元素為1024個,由于log2(1024)=10,所以水印序號長度定為L2= 10,僅在每個子段的DCT系數(shù)的第2個位置上嵌入水印信息,所以L3=1,每個子段的數(shù)據(jù)長度取為8,量化步長Δ取值為0.1,K=8。水印的嵌入結(jié)果如圖2所示,其中圖2(a)為原始的音頻信號,(b)為嵌入水印后的音頻信號。
圖2 原始音頻信號和嵌入水印的音頻信號
仿真試驗分別對本文算法和文獻[4]算法獲得的含水印音頻信號進行了一系列的攻擊,如加高斯白噪聲(均值為0,方差為0.01)、低通濾波(10階,截至頻率是7000Hz的巴特沃斯濾波器)、重采樣(8-16-8)、重量化(22050-44100-22050)、MP3壓縮(壓縮比為4.4:1)及任意剪裁(剪切音頻作品中間部分的10%長度)等。圖3中的(a)到(g)分別是原始水印、未攻擊提取水印和依次經(jīng)過上述攻擊后提取的水印圖象。
圖3 經(jīng)歷不同攻擊后提取的水印圖像
表1 不同嵌入水印方案的性能比較
仿真試驗結(jié)果表明,本文算法不僅具有較好的不可感知性,而且對諸如疊加噪聲、重采樣,重量化、低通濾波、有損壓縮和隨機剪切等攻擊均有較好的魯幫性。但是采用遺傳算法訓練耗時較多,在MATLAB環(huán)境下,運行時間較長,還需進一步研究如何進一步改善算法來提高水印的不可見性和魯幫性。
[1]Neubauer C,Herre J.Advanced Audio watermarking and its Application[C].109th AES Conv,USA,2000,Preprint 5176.
[2]趙朝陽,劉振華,王挺.數(shù)字音頻信號的回聲隱藏技術[J].計算機應用研究,2000,17(2) pp42-44.
[3]Cveji C,Keskinarkaus A,Seppanen T.Audio watermarking using m-sequence and temporal masking[C].Proceedings of the 7th IEEE Workshop on Application of Signal Processing to Audio and Acoustics,New York.NY,2001,227—230.
[4]鄭曉勢趙彥玲等.基于量化DCT域數(shù)字音頻水印方法[J].計算機工程與應用, 2006.20:40-43.
[5]王向陽,楊紅穎,牛盼盼.性能優(yōu)越的混合域數(shù)字音頻盲水印算法[J].通信學報,2007,28:109-114
[6]Wang Chong, Ma Xiao-hong, Cong Xiang-ping, Yin Fuliang.An audio atermarking scheme with neural network[C]. ISNN2005,LNCS3497, 2005:795-800.