張新鵬,殷趙霞
多媒體信息隱藏技術(shù)
張新鵬,殷趙霞
1948年是不尋常的一年,香農(nóng)(C.E.Shannon)發(fā)表了重要文章《通信的數(shù)學(xué)理論》,標(biāo)志著信息論的創(chuàng)始;同樣在1948年,諾伯特·維納(Norbert Wiener)發(fā)表了《控制論——關(guān)于在動物和機(jī)器中控制和通信的科學(xué)》,標(biāo)志著控制論的誕生。第二次世界大戰(zhàn)對技術(shù)革命有重大的推動作用。在第二次世界大戰(zhàn)中,香農(nóng)關(guān)注的問題是如何使通信系統(tǒng)更加安全,阿蘭·麥席森·圖靈(Alan Mathison Turing)專注于破譯密碼,維納解決如何根據(jù)信息的反饋,使得系統(tǒng)保持穩(wěn)定或最佳狀態(tài)。3個(gè)人關(guān)心的問題分別圍繞信息的傳輸、計(jì)算與利用,這實(shí)際上是信息課題所面臨的3大問題。今天回過頭看,作為信息科技最重要、最根本的原理在60年前就已經(jīng)奠定了堅(jiān)實(shí)的基礎(chǔ)。1948年,香農(nóng)的《通信中的數(shù)學(xué)理論》討論了信息的定量刻畫、信息的存儲以及信息如何才能有效地、可靠地傳輸。香農(nóng)信息論提供了理論支撐,同時(shí)給出了編碼性能的理論極限。香農(nóng)考慮的是傳輸?shù)臅r(shí)候沒有背景信號的情況。也就是說,無論是信息傳輸還是信息表示,相當(dāng)于在白紙上寫字,沒有任何背景;當(dāng)你把寫了字的紙裝進(jìn)信封里,旅途傳輸中可能有灰塵進(jìn)來;收信方打開之后,這張紙可能已經(jīng)被灰塵覆蓋了一些,但他可能還能看出寫的字?;覊m就相當(dāng)于噪聲。這就是1948年香農(nóng)所考慮的問題。30多年后,有學(xué)者考慮了這樣的問題:在臟紙上寫字(writing on dirty paper)。
在白紙上寫字,覆蓋了灰塵之后還有多少字能看到的問題香農(nóng)已經(jīng)回答。但有的情況下,我們拿到的不是一張白紙,因?yàn)橛械男畔l(fā)射機(jī)有背景信號,相當(dāng)于我們寫字的時(shí)候那張紙不是白紙。在臟紙上寫字似乎要比在白紙上寫字效果差,但實(shí)際情況不是這樣。研究表明:在有背景信號情況下與無背景信號情況下傳輸?shù)男畔⒘肯嗤?。這個(gè)結(jié)果很有意思,后續(xù)也有很多人做了一些工作,但當(dāng)時(shí)這個(gè)問題并沒有像今天這樣引起廣泛的關(guān)注,直到20世紀(jì)末互聯(lián)網(wǎng)興起。一方面人們需要方便快捷地傳輸信息;另一方面人們交流要有內(nèi)容來支撐。大部分帶寬用來傳輸圖像、音樂、視頻,而如果要在這些內(nèi)容之上再承載一些內(nèi)容,那么可以把圖像、視頻、音頻這些內(nèi)容當(dāng)作我們要面臨的臟紙,也就是背景信號。如果要在背景信號之上做些事情,就是我們要談的主題——信息隱藏(information hiding)。信息隱藏是不過分影響載體信號將額外的信息嵌入數(shù)字媒體中,以實(shí)現(xiàn)版權(quán)保護(hù)、隱蔽通信等功能的技術(shù)。根據(jù)應(yīng)用領(lǐng)域和技術(shù)目標(biāo)不同,目前信息隱藏又可分為數(shù)字水?。╠igital water marking)、隱寫術(shù)(steganography)、密文域信息隱藏(information hiding in encrypted domain)等分支。
本文將從數(shù)字水印、隱蔽通信、密文域信息隱藏3個(gè)部分展開,分別介紹數(shù)字水印、隱蔽通信、密文域信息隱藏的原理、應(yīng)用及基本實(shí)現(xiàn)技術(shù)。
水印最早用于印刷頁,一般人們不太注意的時(shí)候看不到,但是如果做點(diǎn)處理,比如對著陽光,角度合適,水印就能被看出來。本文中說的水印不是印刷的水印,而是數(shù)字水印——在圖像、視頻及音頻等數(shù)字媒體中嵌入一定的信息達(dá)到保護(hù)載體版權(quán)的目的。所嵌入的信息能夠讓人們有效鑒別數(shù)字媒體的版權(quán)、所有人。嵌入的水印不能影響載體信號的商用價(jià)值,必要的時(shí)候可以從含水印的載體信號中提取水印信息。數(shù)字水印分為可見水印和不可見水印。不可見水印還可分為脆弱水印和穩(wěn)健水印,其中穩(wěn)健水印又可應(yīng)用于數(shù)字指紋。
所謂“可見水印”,指的是視覺上可以看見的水印。例如:數(shù)字水印“上海大學(xué)”很容易看到,是可見水印,表示這張圖像和上海大學(xué)有關(guān)系;電視臺左上角的臺標(biāo)也是一種可見水印,其主要目的在于明確標(biāo)識版權(quán),防止非法使用。但更多情況下,水印是不可見的。
脆弱水印(fragile watermarking)可根據(jù)被破壞的情況記錄產(chǎn)品受到過的攻擊,常常應(yīng)用于數(shù)字媒體完整性認(rèn)證。圖像被數(shù)字化以后,一方面便于存儲與傳輸,另一方面篡改現(xiàn)象也非常嚴(yán)重。
為了讓大家很明顯地看出來篡改,嵌入脆弱水印后交換兩張圖像的臉。如果認(rèn)真一點(diǎn)修改圖片,不難做出以假亂真的圖片。也就是說,在數(shù)字時(shí)代,偽造數(shù)字照片很容易,而且輕易就可以做得很逼真。脆弱水印即可用于鑒定數(shù)字照片是否被篡改的有效技術(shù)。比如在相機(jī)出片之前,我們先把一些額外的數(shù)據(jù)或者水印數(shù)據(jù)嵌入到圖像中,如果照片被篡改,根據(jù)預(yù)先所嵌入的數(shù)據(jù)是否被破壞,很容易判斷照片是真實(shí)的還是被篡改過的。一般的脆弱水印方法會把圖像分成很多塊,對每塊進(jìn)行保護(hù)。通過提取并驗(yàn)證每塊中所嵌入的水印數(shù)據(jù),可判別具體哪些部分是被篡改的。這就是脆弱水印的第二個(gè)應(yīng)用——篡改的定位。此外,還可以通過自嵌入技術(shù)實(shí)現(xiàn)具有無損恢復(fù)能力的脆弱水印方案,從篡改圖像完全無誤地恢復(fù)出原始圖像;克服篡改/丟失并發(fā)問題,支持高質(zhì)量大面積篡改恢復(fù);克服水印數(shù)據(jù)浪費(fèi)問題,支持自適應(yīng)恢復(fù)。
水印的第三個(gè)用途就是標(biāo)記數(shù)字產(chǎn)品的版權(quán)屬于誰。穩(wěn)健水?。╮obust watermarking)是指在惡意攻擊下仍然不能被修改、去除的水印,用于標(biāo)記數(shù)字產(chǎn)品的產(chǎn)權(quán)。我們將“上海大學(xué)”字樣的數(shù)字水印嵌入到圖像Lena中,得到含有數(shù)字水印的受保護(hù)圖像。該圖像看上去與原始圖像非常相似,人眼不能區(qū)分,也就是說水印的嵌入不影響原始的圖像或者視頻的商用價(jià)值。當(dāng)然這些含水印的圖像經(jīng)過一些處理,如壓縮、濾波等,“上海大學(xué)”四個(gè)字仍然能從圖像中正確提取,于是可以知道這個(gè)圖像版權(quán)的所有者。
把水印信息嵌入數(shù)字作品從而標(biāo)示所有權(quán)和保護(hù)版權(quán)等,這是“好人”做的事。然而,在信息隱藏領(lǐng)域,“好人”要充分考慮到“壞人”會做什么事?!皦娜恕毕M褕D像處理過后,使得嵌進(jìn)去的信息或標(biāo)記被抹掉。“壞人”的手段很多,大致分為四類:信號處理攻擊、幾何失真攻擊、協(xié)議攻擊和工具攻擊。信號處理攻擊包括壓縮、濾波、加噪、重采樣等,有惡意的,也有非惡意的。有時(shí)候?yàn)榱斯?jié)省傳輸?shù)臅r(shí)間和空間,降低通信的代價(jià)必須要壓縮,有時(shí)候卻以抹去水印為目的而惡意壓縮。對于這種攻擊,現(xiàn)有的數(shù)字水印技術(shù)往往是能有效克服的。例如:合理選擇嵌入位置、提高嵌入強(qiáng)度、重復(fù)嵌入、引入糾錯(cuò)編碼等辦法。但是,后面幾類攻擊就不那么容易對付了。
第二類幾何失真攻擊,包括旋轉(zhuǎn)、縮放、剪切、隨機(jī)幾何失真。比如拿一張圖像,左上角順時(shí)針轉(zhuǎn)0.5°,右上角逆時(shí)針旋轉(zhuǎn)0.3°,左下角放大一點(diǎn),只比原來大1%,右下角縮小一點(diǎn),只比原來小1%,但是絕大多數(shù)現(xiàn)有的方法在這種情況下就無法提取水印,因?yàn)樗z測的同步問題被破壞。這個(gè)問題仍然是水印領(lǐng)域難以克服的難題。雖然目前的研究中前兩類攻擊被考慮得更多,但協(xié)議攻擊和工具攻擊往往更體現(xiàn)“壞人”的智慧。
工具攻擊指攻擊者可以利用水印嵌入器或檢測器對嵌入的水印信號進(jìn)行估計(jì),然后刪除水印。如果某種水印系統(tǒng)有著比較廣泛的市場應(yīng)用,攻擊者得到嵌入器或檢測器并不困難。特別是在DVD版權(quán)保護(hù)框架里,每個(gè)DVD播放器中都要集成水印檢測器,而每個(gè)DVD刻錄器中不但要集成水印檢測器,還要集成水印嵌入器。
當(dāng)攻擊者得到含水印的合法媒體時(shí),可以在此媒體中嵌入另外一個(gè)相同的水印,那么他便可以知道水印信號引起的差異;從合法的含水印媒體減去這個(gè)差異,便可以得到非法的不含水印的數(shù)字媒體。另外,如果攻擊者擁有檢測器,可以根據(jù)含水印的合法媒體制作一個(gè)接近有無水印界限的媒體,通過分別調(diào)整采樣值,可以測試出每一個(gè)采樣點(diǎn)對水印的貢獻(xiàn),因此便可以大致得到水印信號,進(jìn)而刪除水印信號。
協(xié)議攻擊的模型:假設(shè)按照嵌入算法E把數(shù)字水印WA加到數(shù)字媒體I里,產(chǎn)生含水印媒體I′(I′和I非常相似,幾乎分辨不出來差異);所謂協(xié)議攻擊并不直接對I′進(jìn)行修改,而是使I′看起來就像把另一個(gè)水印WB按照嵌入算法EB嵌入到另外一幅圖像IB(與I相似)的結(jié)果;當(dāng)用DB的方式提取時(shí),從I′中提取出的是水印WB。因此,誰也無法判斷I′到底屬于誰。
協(xié)議攻擊之所以能夠成功是因?yàn)樗∷惴ㄊ强蓸?gòu)造的。為了克服協(xié)議水印攻擊問題,就要求水印算法難以逆向構(gòu)造。如果使用的水印算法是可逆向構(gòu)造的,那就說明有協(xié)議攻擊的嫌疑;如果使用的水印算法是不可逆向構(gòu)造的,那就證明沒有協(xié)議攻擊的意向和能力。換句話說,如果要證明有偷盜能力的人是“好人”,則要把偷盜的能力去除。這是第一種解決辦法,顯然不太合理。第二種解決辦法是可以保留作惡的能力,但是要有另外的機(jī)制使其無法作惡,也就是“把權(quán)力關(guān)在籠子里”。也即是水印信號不能任意設(shè)計(jì),需建立水印信號與算法之間的關(guān)系。
數(shù)字指紋屬于穩(wěn)健水印,是將使用者的信息嵌入數(shù)字媒體,如果發(fā)現(xiàn)非法復(fù)制品便可根據(jù)數(shù)字指紋確定非法復(fù)制品是從哪一個(gè)使用者那里得到的。就像指紋因人而異,復(fù)制品的水印各有不同。如果使用者知道所拿到的復(fù)制品中有數(shù)字指紋,但是仍然想謀取非法利益,應(yīng)該如何做呢?一種辦法是用各種信號攻擊或幾何失真攻擊把指紋去掉;另一種方法是使用者聯(lián)合起來,兩個(gè)使用者比對拿到的復(fù)制品,一樣的地方肯定是原始的,不一樣的地方肯定是有問題的。兩個(gè)使用者“勾結(jié)”,就知道哪些地方是標(biāo)注的。如果有3個(gè)使用者就更方便:3個(gè)復(fù)制品共享,用多數(shù)投票的方法。如果某部分有兩個(gè)以上使用者的復(fù)制品一樣,就遵從它的數(shù)據(jù)形式,這樣可以得到原始數(shù)據(jù)——我們將其稱為共謀攻擊。作為數(shù)字產(chǎn)品所有者,應(yīng)該認(rèn)識到有多個(gè)使用者可能聯(lián)合起來對付自己,這時(shí)就需要抗共謀攻擊。
總而言之,正反雙方都要充分考慮到對方要怎樣做,“道高一尺,魔高一丈”,雙方在對抗中發(fā)展進(jìn)步。
隱蔽通信又叫隱寫術(shù),比如中國古代的藏頭詩就是一種隱蔽通信技術(shù)。隱寫和加密不同:加密是把保密通信的內(nèi)容藏起來;而隱寫則把正在進(jìn)行保密通信這個(gè)事實(shí)本身都隱藏起來,是更深層次的保密。加密算法把有意義的內(nèi)容變成亂碼,讓人看不懂。但讓人看不懂的同時(shí)也提示人們這是“不同尋常的東西”,從而采取各種各樣的密碼破譯手段。在互聯(lián)網(wǎng)時(shí)代,或者說多媒體時(shí)代,網(wǎng)絡(luò)上更多的數(shù)據(jù)是圖像、視頻、音頻。如何將秘密信息以不可察覺的方式嵌入普通的圖像、視頻、音頻中進(jìn)行隱蔽通信是目前隱寫研究的主流。
最簡單的隱蔽通信方法是LSB(lefast significant bits substitution)算法:用二進(jìn)制的秘密信息代替原始圖像像素的最低有效位。假設(shè)原始圖像中有3個(gè)像素,其像素值分別為130、123、117,則它們的最低有效位分別為0、1、1;為了隱藏秘密數(shù)據(jù)1、0、1,可將像素值修改為131、122、117,使得修改后的像素值的最低有效位為1、0、1;該圖像經(jīng)過互聯(lián)網(wǎng)傳輸后,接收方根據(jù)131、122、117的最低有效位提取出1、0、1,完成隱蔽通信。
在數(shù)字媒體中隱寫一定會對原始數(shù)據(jù)造成影響,其核心問題是如何盡量減少對載體的修改而嵌入更多的信息。現(xiàn)階段的技術(shù)已經(jīng)接近理論上的最佳結(jié)果。當(dāng)然,有正向就有反向。當(dāng)“壞人”使用隱蔽通信進(jìn)行非法活動,“好人”就要做反隱蔽通信。2001年“9·11”事件對于美國來說是一個(gè)非常深刻的事件,很大程度上改變了世界的格局。2001年2月5日《Today America》雜志就報(bào)道了本·拉登追隨者用隱寫術(shù)將恐怖計(jì)劃藏入圖片經(jīng)互聯(lián)網(wǎng)傳輸。美國人再返回來看這件事情時(shí),才發(fā)現(xiàn)當(dāng)時(shí)的忽略是不可原諒的失誤。因此從美國開始,隨后其他國家也陸續(xù)跟進(jìn),對互聯(lián)網(wǎng)上的隱蔽傳輸投入了相當(dāng)大的研究。一方面是研究怎么進(jìn)行隱寫;另一方面是怎么判斷圖片正常還是含密,我們稱之為反隱寫技術(shù)。
反隱寫技術(shù)有隱寫分析和主動攻擊兩種方式。隱寫分析的目的是檢測數(shù)字載體中秘密信息的存在性。警察需要判斷一張圖像是正常還是含密,目的之一是逮捕發(fā)布照片的人;目的之二是通過網(wǎng)絡(luò)監(jiān)控破壞圖像,讓接收方無法接收信息;第三個(gè)目的,要求更高,不僅截獲圖像,還要知道圖像中隱藏的內(nèi)容,從這幅圖像里面恢復(fù)出“壞人”要傳輸?shù)膬?nèi)容。這是隱寫和反隱寫中的最高水平,但是難度相當(dāng)大,往往依據(jù)載體數(shù)據(jù)統(tǒng)計(jì)特征的異常,用統(tǒng)計(jì)學(xué)的一些方法去判斷、攻擊。只有在非常強(qiáng)的前提條件下,才能做到局部的恢復(fù)。主動攻擊廣泛地在數(shù)字載體中引入干擾,使得秘密信息無法提取。這類攻擊有較大的局限性:一是干擾必須不影響正常媒體的使用,而干擾太弱又不能對密寫造成足夠的威脅;二是無法確定發(fā)送者和接收者。另外,大面積地干擾數(shù)字載體也不太現(xiàn)實(shí)。
信號處理和數(shù)據(jù)加密是信息科技中兩個(gè)重要領(lǐng)域,但這么多年的發(fā)展,二者的關(guān)系一直比較松散。圖像處理、壓縮、計(jì)算等有一個(gè)先決條件——必須知道圖像的內(nèi)容,而加密則是為了保護(hù)圖像安全,使圖像內(nèi)容難以看懂,所以在傳統(tǒng)條件下,信號處理和加密完全不相關(guān)。圖像處理、壓縮、計(jì)算,一定是對明文信號處理,要么在加密之前進(jìn)行,要么在解密之后進(jìn)行。密文域信息隱藏則是要在圖像加密之后做計(jì)算。為什么要做這個(gè)事情呢?因?yàn)樵拼鎯驮朴?jì)算的興起和普及。以前我們存儲數(shù)據(jù)、編輯文檔、處理圖像等都在本地的PC上進(jìn)行,但是時(shí)代不同,移動互聯(lián)網(wǎng)興起、智能終端的普及以及云計(jì)算技術(shù)的日趨成熟讓存儲和計(jì)算全部由公共云平臺提供服務(wù)。為了保護(hù)數(shù)據(jù)安全和個(gè)人隱私,人們希望將數(shù)據(jù)先加密,從而催生了密文壓縮、密文檢索、外包計(jì)算、密文信息隱藏等密文域信號處理技術(shù)。
比方說國家機(jī)密文件的管理,達(dá)到某種級別的機(jī)密,就算是加密的數(shù)據(jù)也不應(yīng)該在公網(wǎng)上傳輸。加密后無法檢查文件的密級,如何防止把絕密的機(jī)密文件當(dāng)成普通加密的文件通過公網(wǎng)傳輸呢?我們可以給加密的數(shù)據(jù)打上標(biāo)記,標(biāo)明密級,當(dāng)密文通過公網(wǎng)傳輸時(shí),網(wǎng)關(guān)檢查到超過閾值的標(biāo)記則立馬攔截下來。這時(shí)就需要密文域的信息隱藏技術(shù)。密文域信息隱藏可以對密文信號以可逆形式添加額外信息。從內(nèi)容上來說,密文圖像可逆信息隱藏是指在圖像加密后以可逆方式嵌入額外信息。對一幅含有額外信息的加密圖像,具有數(shù)據(jù)提取密鑰的合法接收者可以準(zhǔn)確地提取所嵌入的數(shù)據(jù)而不需要知道載體圖像內(nèi)容;具有圖像解密密鑰的合法接收者可以解密圖像獲取載體內(nèi)容(看起來與原始圖像無差異)而不能提取所嵌入的數(shù)據(jù);若兩個(gè)密鑰都具備,則既可以提取所嵌入的數(shù)據(jù),也可以無損恢復(fù)載體信息獲得原始圖像。非授權(quán)方難以將額外信息從密文數(shù)據(jù)中剝離,而合法用戶可提取信息并恢復(fù)原始明文圖像。額外信息可以是信源信宿信息、所有者使用者信息、密文圖像的標(biāo)注信息、認(rèn)證信息等,因此,密文圖像可逆信息隱藏技術(shù)既可實(shí)現(xiàn)密文圖像的傳輸監(jiān)控和安全管理,又不影響明文圖像的使用,具有廣泛的應(yīng)用價(jià)值。
借助密文圖像可逆信息隱藏技術(shù)可實(shí)現(xiàn)密文圖像傳輸路徑的記錄與跟蹤、特殊密文圖像的傳播控制,也可在不揭露圖像內(nèi)容和所有者隱私的前提下實(shí)現(xiàn)密文圖像的標(biāo)注、存儲查詢與使用管理等。但由于加密往往既掩蔽了明文內(nèi)容,又掩蔽了明文信號中的冗余,使得密文數(shù)據(jù)近似于隨機(jī)信號,信息熵逼近最大值,剩余熵空間極其有限,因此密文域可逆信息隱藏有效載荷普遍不高。今后有必要進(jìn)一步從多側(cè)面、多角度,廣泛開展深入研究,爭取在理論基礎(chǔ)、技術(shù)手段和實(shí)現(xiàn)方法等方面取得全面突破,推動密文域信息隱藏研究的發(fā)展。
回顧了多媒體信息隱藏研究的歷史,根據(jù)應(yīng)用領(lǐng)域和技術(shù)目標(biāo)的不同,從數(shù)字水印、隱蔽通信和密文域信息隱藏3個(gè)方面講述了多媒體信息隱藏技術(shù)如何在攻與防的對抗中互相促進(jìn)與發(fā)展。其中數(shù)字水印領(lǐng)域水印檢測的同步問題仍然是難以克服的難題;隱蔽通信方面隱寫分析大大落后于隱寫技術(shù)的發(fā)展,尤其是大數(shù)據(jù)環(huán)境下的隱寫分析更面臨諸多挑戰(zhàn);密文域信息隱藏作為信息隱藏和密文信號處理兩個(gè)研究領(lǐng)域的研究熱點(diǎn),正受到人們的廣泛關(guān)注,但由于密文數(shù)據(jù)近似于隨機(jī)信號,剩余熵空間有限,因此密文域可逆信息隱藏有效載荷普遍不高,在理論基礎(chǔ)、技術(shù)手段和實(shí)現(xiàn)方法等方面有待取得全面突破。?
【作者單位:上海大學(xué)通信與信息工程學(xué)院;安徽大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院】
(摘自《自然雜志》2017年第2期)
責(zé)任編輯:吳曉麗