王 靜,劉正輝,祁傳達(dá),王宏霞
(1.信陽(yáng)師范學(xué)院 數(shù)學(xué)與信息科學(xué)學(xué)院,河南 信陽(yáng) 464000;2.信陽(yáng)師范學(xué)院 計(jì)算機(jī)與信息技術(shù)學(xué)院,河南 信陽(yáng) 464000;3.西南交通大學(xué) 信息科學(xué)與技術(shù)學(xué)院,四川 成都 610031)
數(shù)字信號(hào)處理技術(shù)和高速網(wǎng)絡(luò)的發(fā)展,一方面使數(shù)字信號(hào)代替模擬信號(hào),成為人類信息傳遞的主要載體;另一方面使得多媒體編輯工具更加豐富,為不法分子偽造、篡改多媒體數(shù)據(jù)提供了便利。大量偽造多媒體信號(hào)的出現(xiàn),嚴(yán)重威脅了數(shù)字內(nèi)容的可信度和認(rèn)可度,破壞了數(shù)字世界的秩序,給人們的生活帶來(lái)了諸多不和諧因素。
數(shù)字語(yǔ)音信號(hào)是常被采用的信息傳遞與信息交流的數(shù)字載體之一,廣泛應(yīng)用于新聞報(bào)道、語(yǔ)音通信、醫(yī)療記錄以及法庭舉證等方面。和音頻信號(hào)相比,語(yǔ)音信號(hào)內(nèi)容表示的更多的是事關(guān)緊要的指令,更容易引起攻擊者的興趣而被攻擊。被攻擊信號(hào)傳遞的內(nèi)容和原始內(nèi)容相比,有較大區(qū)別。若被攻擊信號(hào)的指令被人們采用或執(zhí)行,將會(huì)帶來(lái)嚴(yán)重的后果。大量被篡改、偽造的語(yǔ)音信號(hào),已經(jīng)影響了數(shù)字語(yǔ)音信號(hào)表示的數(shù)字證據(jù)和新聞報(bào)道的可信度與認(rèn)可度。數(shù)字語(yǔ)音內(nèi)容的真實(shí)性和完整性取證問(wèn)題已成為當(dāng)前多媒體信息安全領(lǐng)域的研究熱點(diǎn)[1]。
數(shù)字水印技術(shù)為數(shù)字語(yǔ)音信號(hào)真實(shí)性和完整性的取證問(wèn)題提供了一種可行的方法。該技術(shù)在音頻版權(quán)保護(hù)方面被廣泛應(yīng)用,并已取得了豐碩的研究成果[2-4],而在語(yǔ)音取證方面的研究成果則相對(duì)較少[5-7]?;跀?shù)字水印的語(yǔ)音取證算法,根據(jù)水印的生成方式不同,可以分為兩類:基于附加水印信息的取證算法和基于內(nèi)容的取證算法?;诟郊有畔⒌娜∽C技術(shù),在傳輸過(guò)程中,除了傳輸含水印的信號(hào)之外,還需要傳輸用來(lái)生成水印的附加信息。增加了傳輸帶寬,也增加了由于傳輸錯(cuò)誤而帶來(lái)的水印檢測(cè)的虛警率[5]?;趦?nèi)容的取證算法,水印由載體信號(hào)本身的特征來(lái)生成。生成水印的特征和語(yǔ)音信號(hào)一起傳輸給認(rèn)證端,減少了傳輸帶寬,提高了傳輸?shù)陌踩浴?/p>
對(duì)基于內(nèi)容的取證水印算法而言,若水印生成和嵌入采用的特征是公開的,攻擊者便可以從含水印的語(yǔ)音信號(hào)中獲取生成水印和嵌入水印的特征,然后找到特征相同內(nèi)容不同的其他語(yǔ)音信號(hào)來(lái)替換含水印的語(yǔ)音信號(hào),實(shí)施特征分析替換攻擊[8],并且被攻擊的信號(hào)能夠通過(guò)驗(yàn)證端的驗(yàn)證。
為了解決基于公開特征的取證水印算法存在的安全隱患,本文定義了一種保密語(yǔ)音特征,給出了基于該特征水印嵌入的理論依據(jù),通過(guò)實(shí)驗(yàn)分析了該特征的魯棒性和嵌入算法的抗信號(hào)處理能力。本文提出的算法具有較好的不可聽性,在對(duì)惡意攻擊進(jìn)行篡改定位的同時(shí),提高了水印系統(tǒng)的安全性。
文獻(xiàn)[8,9]分析了基于公開特征的水印算法存在的安全缺陷,解決此類問(wèn)題的一種方法是采用保密的特征來(lái)嵌入水印信息。為此,本文給出了一種保密的特征——能量比,并討論了基于能量比的水印嵌入方法。
假設(shè)A和B表示兩段語(yǔ)音信號(hào),A={a(i),1≤i≤N},B={b(i),1≤i≤N},定義A對(duì)B的能量比為
( 1 )
ER(A,B)表示了信號(hào)A和信號(hào)B的能量差別。ER(A,B)的值和10lg101相差越小,表明A和B的能量差別越??;ER(A,B)的值和10lg101相差越大,表明A和B的能量差別越大。
在信號(hào)B恒定不變的情況下,ER(A,B)刻畫了信號(hào)A的能量大小。ER(A,B)越大,表示信號(hào)A的能量越大;反之,則越小。
在信號(hào)B已知的情況下,記A為原始語(yǔ)音信號(hào);E為信號(hào)A對(duì)B的能量比;Q={q(i),1≤i≤N},表示對(duì)A量化后的信號(hào)(A對(duì)應(yīng)的含水印信號(hào));QE為信號(hào)Q對(duì)B的能量比。由式( 1 )可得
( 2 )
( 3 )
結(jié)合式( 2 )和式( 3 ),有
( 4 )
式( 4 )中,假設(shè)a(i)、E和QE為已知量,而q(i)為未知量,1≤i≤N。易得,滿足式( 4 )的解q(i)不唯一,其中的一個(gè)解可由式( 5 )計(jì)算得到。
( 5 )
如上所述,式( 5 )給出了一種通過(guò)量化信號(hào)能量比來(lái)獲取含水印信號(hào)的方法,即信號(hào)A對(duì)應(yīng)的含水印信號(hào)可由式( 5 )得到。
將原始語(yǔ)音信號(hào)記為A={al|1≤l≤L},其中L表示語(yǔ)音信號(hào)的長(zhǎng)度,al表示第l個(gè)樣本點(diǎn)。
步驟1分幀、分段,方法如圖1所示,詳細(xì)的步驟為:
(1)把A分為P幀,第i幀記為Ai;
(2)將Ai分為前后兩部分,分別記為AFi和ABi;
(3)AFi、ABi等分為M段,第j段分別記為AFi,j、ABi,j,1≤i≤P,1≤j≤M;
(4)將AFi,j等分為3段,分別記為AF1i,j、AF2i,j和AF3i,j;同樣,將ABi,j等分為3段,分別記為AB1i,j、AB2i,j和AB3i,j。
圖1 分幀、分段方法
步驟2由Logistic混沌映射[10]生成偽隨機(jī)信號(hào),記為X={xn,1≤n≤N},其中xn由式( 6 )生成,本文中N=L/6MP。
xn+1=μxn(1-xn)x0=k
3.569 9≤μ≤4
( 6 )
式中:k為偽隨機(jī)信號(hào)的初值,作為水印系統(tǒng)的密鑰。
步驟3由式( 7 )將各幀的幀號(hào)i映射為整數(shù)序列Wi={w1,w2,…,wM}。Wi作為第i幀的水印信息分別嵌入到AFi和ABi中。
i=w1·10M-1+w210M-2+…+wM
( 7 )
以w1嵌入到AFi,1中為例,介紹水印的嵌入方法。
步驟1由式( 1 )計(jì)算AF1i,1、AF2i,1和AF3i,1對(duì)X的能量比,分別記E1、E2和E3;取E1、E2和E3小數(shù)點(diǎn)后第一位整數(shù),并記為z1、z2和z3。
步驟2計(jì)算U=f(z1,z2,z3)
U=f(z1,z2,z3)=mod(z1+z2×2+z3×3,10)
( 8 )
表1 不同條件下水印嵌入的量化方法
( 9 )
采用上述方法,將Wi={w1,w2,…,wM}分別嵌入到AFi和ABi中,1≤i≤P。最終獲取含水印的語(yǔ)音信號(hào)。
假設(shè)含水印的語(yǔ)音信號(hào)為A′,取證過(guò)程如圖2所示,詳細(xì)步驟如下。
圖2 內(nèi)容取證過(guò)程框圖
步驟2由式( 6 )生成偽隨機(jī)信號(hào)X={xn,1≤n≤N}。
步驟5篡改定位。若含水印的語(yǔ)音信號(hào)被篡改,并假設(shè)第1幀到第i幀的內(nèi)容是真實(shí)的,接下來(lái)的L/P個(gè)樣本不能通過(guò)驗(yàn)證,在此情況下,篡改定位的方法為:
i′=y1·10M-1+y210M-2+…+yM
(10)
(3)第i幀和第i′幀之間的內(nèi)容,即為被定位到的被攻擊的部分。
本文采用80段采樣頻率為44.1 kHz的單聲道語(yǔ)音信號(hào)作為測(cè)試樣本。其中一部分是由錄音筆錄制于4種不同場(chǎng)景的語(yǔ)音信號(hào)(錄音筆型號(hào)為SONY PCM-D100),記為Type 1、Type 2、Type 3和Type 4,錄制環(huán)境分別為安靜的辦公室、討論會(huì)、嘈雜的車站和空曠的野外。另一部分是隨機(jī)取自于樣本庫(kù)中的語(yǔ)音信號(hào),記為Type 5。實(shí)驗(yàn)采用的軟件為Matlab 2010a,其他實(shí)驗(yàn)參數(shù)分別為L(zhǎng)=60 000,P=20,M=5,k=0.314 5,μ=3.897 2。
采用主觀和客觀兩種方法對(duì)本文所提算法的不可聽性進(jìn)行測(cè)試。主觀的評(píng)價(jià)方法是將原始語(yǔ)音信號(hào)及含水印的語(yǔ)音信號(hào)提供給一組聽眾,由聽眾根據(jù)主觀感覺來(lái)區(qū)分兩個(gè)信號(hào)之間的差別,并按照主觀區(qū)分度[9]打分,將這一組聽眾最后打分的平均值作為測(cè)試結(jié)果??陀^評(píng)價(jià)是利用測(cè)試工具PEAQ(Perceptual Evaluation of Audio Quality)得到聽覺質(zhì)量客觀區(qū)分度ODG[9],由此來(lái)測(cè)試水印的不可聽性。
表2給出了含水印語(yǔ)音信號(hào)的主觀區(qū)分度SDG和客觀區(qū)分度ODG,其中SDG由12位聽眾現(xiàn)場(chǎng)打分所得。由測(cè)試結(jié)果可以看出本文所提算法嵌入的水印是不可聽的。
表2 不同類型語(yǔ)音信號(hào)的SDG和ODG
隨機(jī)選取一段含水印的語(yǔ)音信號(hào)如圖3所示,并對(duì)該信號(hào)進(jìn)行信號(hào)處理操作。圖4給出了重采樣(44.1 kHz→11.025 kHz→44.1 kHz)前后含水印信號(hào)各幀的能量比,圖5給出了低通濾波(截止頻率為11 kHz)前后各幀的能量比。由圖4和圖5所示結(jié)果可知,信號(hào)處理前后的能量比幾乎保持不變,表明語(yǔ)音信號(hào)的能量比具有一定的魯棒性。
圖3 隨機(jī)選取的含水印語(yǔ)音信號(hào)
圖4 重采樣前后信號(hào)的能量比
圖5 低通濾波前后信號(hào)的能量比
采用誤碼率[9]測(cè)試本文算法水印的抗信號(hào)處理能力。表3列出了含水印的語(yǔ)音信號(hào)在經(jīng)過(guò)一些信號(hào)處理后,水印提取誤碼率BER的統(tǒng)計(jì)均值,并和文獻(xiàn)[3]進(jìn)行了對(duì)比。由測(cè)試結(jié)果可知,與文獻(xiàn)[3]相比,本文所提算法的誤碼率較低,具有一定的容忍信號(hào)處理的能力。
表3 不同類型信號(hào)處理后水印提取的BER值
對(duì)于基于內(nèi)容的取證水印算法,如果生成水印的特征是公開的,攻擊者可以得到生成水印的特征,同時(shí)找到特征相同的其他語(yǔ)音信號(hào)來(lái)替換含水印的語(yǔ)音信號(hào),實(shí)施特征分析替換攻擊。由于被攻擊信號(hào)生成水印的特征沒有改變,驗(yàn)證端將檢測(cè)不到攻擊的存在[9]。
對(duì)本文所提算法而言,若要得到嵌入水印的特征,需要先獲取偽隨機(jī)信號(hào)X。圖6給出了不同偽隨機(jī)信號(hào)初值對(duì)應(yīng)的能量比,可以看出偽隨機(jī)信號(hào)初值不同時(shí),信號(hào)的能量比也有較大的不同。本文中,偽隨機(jī)信號(hào)初值是保密的,攻擊者很難獲取正確的偽隨機(jī)信號(hào),并得到水印嵌入采用的特征,進(jìn)而實(shí)施特征分析替換攻擊。如果攻擊者隨機(jī)選取一幀信號(hào)進(jìn)行攻擊,攻擊內(nèi)容能夠通過(guò)驗(yàn)證的概率為1/10M。于是對(duì)一幀信號(hào)而言,本文所提算法的抗攻擊能力為
(11)
圖6 偽隨機(jī)信號(hào)不同初值對(duì)應(yīng)的能量比
以上分析表明,與基于公開特征的水印算法[3-5]相比,本文所提算法提高了水印系統(tǒng)的安全性。
效率是衡量一個(gè)算法性能的重要指標(biāo),影響到水印系統(tǒng)的實(shí)時(shí)性和實(shí)用性。水印系統(tǒng)采用特征的計(jì)算復(fù)雜度直接影響到水印算法的效率。計(jì)算復(fù)雜度越低,算法的效率就越高;反之,算法的效率就越低。表4給出了幾種常見水印算法采用的特征,并對(duì)比了對(duì)應(yīng)特征的計(jì)算復(fù)雜度,其中,N表示語(yǔ)音信號(hào)的長(zhǎng)度。由表4所示結(jié)果可以看出,和文獻(xiàn)[3,5,11]相比,本文所提算法采用特征的計(jì)算復(fù)雜度較低,具有較高的效率,有利于算法的實(shí)時(shí)性,也提高了水印系統(tǒng)的實(shí)用性。
表4 不同水印算法采用特征的計(jì)算復(fù)雜度
隨機(jī)選取一段含水印的語(yǔ)音信號(hào),如圖7所示。實(shí)驗(yàn)測(cè)試本文所提算法對(duì)不同類型惡意攻擊的篡改檢測(cè)和篡改定位能力,攻擊類型包括刪除攻擊、插入攻擊和特征分析替換攻擊。篡改檢測(cè)結(jié)果中僅顯示了可以被正確提取的幀號(hào),而被攻擊內(nèi)容的幀號(hào)則沒有顯示。其中,Ti=1表示第i幀的內(nèi)容是真實(shí)的。
圖7 含水印語(yǔ)音信號(hào)
對(duì)含水印信號(hào)進(jìn)行刪除攻擊,刪除從5 001到10 000個(gè)樣本點(diǎn)之間的內(nèi)容,刪除攻擊的信號(hào)如圖8所示,對(duì)應(yīng)的篡改定位結(jié)果如圖9所示。由篡改檢測(cè)結(jié)果可知,第2幀和第3幀對(duì)應(yīng)內(nèi)容的幀號(hào)無(wú)法被正確提取,故該部分內(nèi)容是被攻擊的部分。
圖8 刪除攻擊后的含水印語(yǔ)音信號(hào)
圖9 對(duì)刪除攻擊的篡改定位結(jié)果
從其他語(yǔ)音信號(hào)中選取6 000個(gè)樣本點(diǎn),并插入在含水印信號(hào)的第20 000個(gè)樣本點(diǎn)的位置。攻擊后的信號(hào)如圖10所示,對(duì)應(yīng)的篡改定位結(jié)果如圖11所示。由篡改檢測(cè)結(jié)果可知,第7幀對(duì)應(yīng)內(nèi)容的幀號(hào)無(wú)法被正確提取,所以第7幀是被攻擊的部分。
圖10 插入攻擊后的含水印語(yǔ)音信號(hào)
圖11 對(duì)插入攻擊的篡改定位結(jié)果
攻擊者對(duì)含水印的信號(hào)實(shí)施特征分析替換攻擊,假設(shè)攻擊第14幀的內(nèi)容,步驟簡(jiǎn)述為:
步驟1選取含水印信號(hào)第14幀的內(nèi)容,記為A14,并依照本文所提算法將該幀分為前后兩部分,分別記為AF14和AB14。
步驟2分別將AF14和AB14等分為3段,記為AF14,h和AB14,h,1≤h≤3。
步驟3隨機(jī)選取初值k=0.56,由式( 6 )生成和AF14,h(或AB14,h)等長(zhǎng)的偽隨機(jī)信號(hào),并由式( 1 )計(jì)算AF14,h和AB14,h對(duì)偽隨機(jī)信號(hào)的能量比,記為EFh和EBh,1≤h≤3。
步驟4找到長(zhǎng)度和AF14,h相等,并且對(duì)偽隨機(jī)信號(hào)的能量比等同于EFh和EBh的其他語(yǔ)音信號(hào),1≤h≤3,替換第14幀的內(nèi)容。
替換后的信號(hào)如圖12所示,對(duì)應(yīng)的篡改檢測(cè)結(jié)果如圖13所示。由于攻擊者選取的偽隨機(jī)信號(hào)初值和驗(yàn)證者不同,生成的能量比也不同。從而,被替換的內(nèi)容不能通過(guò)驗(yàn)證。圖13的篡改定位結(jié)果也驗(yàn)證了本文所提算法的抗特征分析替換攻擊的能力。
圖12 替換攻擊的含水印語(yǔ)音信號(hào)
圖13 對(duì)替換攻擊的篡改定位結(jié)果
以上分析結(jié)果表明,本文所提算法具有較好的不可聽性和一定的容忍信號(hào)處理能力,對(duì)惡意攻擊能夠有效地篡改檢測(cè),同時(shí)可以抵抗特征分析替換攻擊。
為了解決基于內(nèi)容的數(shù)字語(yǔ)音取證水印技術(shù)存在的安全隱患,提出了一種抗特征分析替換攻擊的語(yǔ)音內(nèi)容取證算法。給出了語(yǔ)音信號(hào)保密特征的定義,并討論了基于該特征的水印嵌入方法。將幀號(hào)映射為整數(shù)序列,并作為各幀的標(biāo)識(shí)嵌入到語(yǔ)音信號(hào)中。含水印信號(hào)被攻擊后,通過(guò)重構(gòu)幀號(hào)來(lái)定位被攻擊的內(nèi)容。實(shí)驗(yàn)分析表明,本算法具有較好的不可聽性和抗信號(hào)處理的能力,能夠?qū)阂夤暨M(jìn)行篡改檢測(cè)和定位,同時(shí)能夠有效地抵抗特征分析替換攻擊,提高了水印系統(tǒng)的安全性。
參考文獻(xiàn):
[1]PUN C M,YUAN X C.Robust Segments Detector for De-synchronization Resilient Audio Watermarking[J].IEEE Transactions on Audio,Speech,and Language Processing,2013,21(11):2 412-2 424.
[2]XIANG S J,KIM H J,HUANG J W.Audio Watermarking Robust Against Time-scale Modification and MP3 Compression[J].Signal Processing,2008,88(10):2 372-2 387.
[3]WANG X Y,MA T X,NIU P P.A Pseudo-zernike Moments Based Audio Watermarking Scheme Robust Against Desynchronization Attacks[J].Computers and Electrical Engineering,2011,37(4):425-443.
[4]WANG Y,WU S Q,HUANG J W.Audio Watermarking Scheme Robust Against Desynchronization Based on the Dyadic Wavelet Transform[J].Journal of Advances in Signal Processing,2010(13):1-17.
[5]王宏霞,范明泉.基于質(zhì)心的混合域半脆弱音頻水印算法[J].中國(guó)科學(xué):信息科學(xué),2010,40(2):313-326.
WANG Hongxia,FANG Mingquan.Centroid-based Semi-fragile Audio Watermarking in Hybrid Domain[J].Science China Information Sciences,2010,40(2):313-326.
[6]寧超魁,和紅杰,陳帆,等.基于近似分量能量的半脆弱音頻水印算法[J].鐵道學(xué)報(bào),2013,35(1):46-50.
NING Chaokui,HE Hongjie,CHEN Fan,et al.Semi-fragile Audio Watermarking Scheme Based on the Approximate Components Energy[J].Journal of the China Railway Society,2013,35(1):46-50.
[7]ZHAO H,MALIK H.Audio Recording Location Identification Using Acoustic Environment Signature[J].IEEE Transaction on Information Forensics and Security,2013,8(11):1 676-1 759.
[8]LIU Z H,WANG H X.Pseudo-zernike Moments-based Audio Content Authentication Algorithm Robust Against Feature-analysed Substitution Attack[J].Multimedia Tools and Applications,2014,70(3):2 271-2 291.
[9]LIU Z H,WANG H X.A Novel Speech Content Authentication Algorithm Based on Bessel-fourier Moments[J].Digital Signal Processing,2014,24(1):197-208.
[10]黃誠(chéng),易本順.噴泉碼的Logistic映射實(shí)現(xiàn)[J].北京郵電大學(xué)學(xué)報(bào),2009,32(1):103-107.
HUNG Cheng,YI Benshun.Implementation of Fountain Codes Using Logistic Map[J].Journal of Beijing University of Posts and Telecommunications,2009,32(1):103-107.
[11]XIANG S J,HUANG J W,YANG R.Robust Audio Watermarking Based on Low-order Zernike Moments[C]//Proceedings of the 5th International Workshop of Digital Watermarking.Berlin:Springer-Verlag Press,2006:226-240.