吳秋玲 吳 蒙
?
基于小波變換的語音信息隱藏新方法
吳秋玲*①②吳 蒙①
①(南京郵電大學通信與信息工程學院 南京 210003)②(南京理工大學紫金學院 南京 210046 )
針對音頻載體在隱藏機密信息時,存在隱藏容量小、隱蔽性不高和魯棒性較差等不足,該文提出一種基于小波變換的音頻信息隱藏新算法。該算法利用人耳聽覺系統對語音信號的中高頻信息微小變化不敏感的特性,調節(jié)語音段小波變換的中高頻系數,進而改變每級小波變換高頻系數前后兩部分的能量狀態(tài)來隱藏二進制機密信息。首先測試隱藏深度、隱藏頻段和載體語音分段長度3個參數對載體語音質量和機密信息誤碼率的影響,選擇算法所需的最佳參數,然后測試算法的可行性和各項評價指標,最后對算法進行常見的5種攻擊測試。測試結果表明該算法能夠實現機密信息的盲提?。痪哂辛己玫碾[蔽性和魯棒性,能夠抵御加噪、低通濾波、重采樣、重量化和回聲干擾等多種攻擊;具有較大的隱藏容量,且語音分段長度越短,隱藏容量越大。
信息隱藏;小波變換;高頻系數;能量狀態(tài)
1 引言
信息隱藏技術是指將特定的信息嵌入到數字化的載體信息中,在隱藏信息內容的同時也隱蔽信息傳播這一行為,以保證密文不引起監(jiān)控者的注意從而減少被攻擊的可能性[1],其核心技術是信息隱藏與提取算法。與加密技術相比,信息隱藏技術是隱藏信息的存在性,讓攻擊者無法發(fā)現,因此信息隱藏更為安全[2,3]。信息隱藏技術常以語音、文字或圖像等媒體類型作為宿主載體。由于圖像媒體具有較大的冗余空間,人們常使用圖像作為隱藏機密信息的載體,如文獻[4]提出一種基于分塊自適應壓縮感知的可逆水印算法,文獻[5]提出一種魯棒可分離的密文域水印算法。語音是人們最常使用的信息傳輸方式,是通信系統和互聯網傳輸中最主要的業(yè)務類型,因此研究基于語音的信息隱藏技術在保密通信、軍事情報、版權標記和隱私保護等多個領域具有重要的研究意義和應用價值[6,7]。但是由于語音信號冗余信息較少,且語音傳輸信道較為復雜,因此國內外針對以語音信號為載體的信息隱藏方法研究還較少
隨著移動通信系統和互聯網語音通信的快速發(fā)展,近年來更多的國內外專家專注于語音信息隱藏方法的研究,出現了較多的理論和文獻。文獻[9]提出了一種基于振幅值修改的音頻隱寫算法,隱蔽性較好。文獻[10]提出了一種基于多小波域的水印算法。文獻[11]利用人耳對音頻的采樣倒置不敏感的特性,通過倒置小波系數正負極性隱藏機密信息。文獻[12,13]提出基于離散余弦變換的語音信息隱藏方法。文獻[14]提出基于奇異值分解的音頻信息隱藏方法取得了較好的隱藏效果。通過對當前國內外音頻信息隱藏方法分析發(fā)現,音頻信息隱藏方法主要有空間域隱藏和變換域隱藏兩大類[15],其中變換域方法由于具有很好的透明性和魯棒性獲得了更多的應用[16],但目前大多數變換域方法還存在一些不足,如算法復雜度高或僅在隱藏容量、隱蔽性和魯棒性3項指標間獲得某一項指標的突破,當3項指標要求發(fā)生變化時往往無法通過調整算法參數來兼顧三者平衡。
本文提出一種基于小波變換的語音信息隱藏的新方法,該方法首先對載體語音進行低通濾波,然后進行多級小波變換,利用人耳對中高頻信息微小變化的不敏感,通過比較各級小波高頻系數的能量來隱藏機密信息。首先測試在不同隱藏深度、不同隱藏頻段和載體語音不同分段長度的情況下載體語音質量和機密信息誤碼率,選擇算法所需的合適參數,然后測試算法的可行性和各項評價指標,最后對算法進行常見的5種攻擊測試。實驗結果顯示該方法簡單易行,可實現盲檢測,具有較大的隱藏容量、良好的隱蔽性和較強的魯棒性,能夠抵御加噪、低通濾波、重采樣、重量化和回聲干擾等多種攻擊。此外,在實際應用中可調整算法參數平衡隱藏容量、隱蔽性和魯棒性3項指標要求。
2 信息隱藏與提取算法原理及參數選擇
2.1 信息隱藏原理
人耳所能捕獲到的語音信號頻率主要分布在300~3400 Hz的頻段范圍內,低于300 Hz的低頻信號和超出3400 Hz以上的高頻信號人耳往往難以捕捉。利用人耳聽覺系統對語音中高頻能量的微小變化不敏感這一特點可以將機密信息隱藏到載體音頻信號中。把語音信號按一定時長分段后,對每一段語音進行級小波分解得到高頻段、中高頻段、中低頻段和低頻段等多個小波系數。把每一頻段的小波系數分為前后兩部分,按式(1)和式(2)計算前后兩部分的能量,根據機密信息的二進制值按式(3)、式(4)和式(5)調整各級小波系數,得到嵌入機密信息后的系數。
語音段高頻系數前半部分能量:
語音段高頻系數后半部分能量:
則嵌入機密信息后高頻系數為
其中,為小波分解級數,為語音段樣點數;為第級小波分解的高頻系數,為待嵌入第級高頻系數的二進制機密信息;為第級高頻系數的信息嵌入深度,為第級高頻系數的前半段放大增益,為第級高頻系數的后半段放大增益。根據和低頻系數進行小波逆變換,構建攜密語音信號。依據以上設計原理,每一語音段進行級小波分解后可得到組高頻系數,則最多可嵌入比特機密信息,但是為了保證信息隱藏算法的隱蔽性和魯棒性,還需對信息隱藏的頻段、嵌入深度和載體語音分段長度等參數進行實驗測試,尋找合適參數,在保證算法隱蔽性和魯棒性的條件下盡量提高算法的隱藏容量。
2.2 信息提取原理
提取機密信息時,首先對攜密語音按相同的時長進行分段,然后對每一語音段進行級小波分解,按式(1)和式(2)計算各段語音每一級高頻段系數前后兩部分的能量和()。最后按式(6)提取各級小波高頻系數中嵌入的二進制機密信息。
2.3 能量變化對語音質量的影響
按2.1節(jié)和2.2節(jié)所述方法修改語音段前后兩部分的能量后,語音段高頻系數前后兩部分能量和,可表述為
語音段前半部分能量變化為
語音段后半部分能量變化為
2.4 參數選擇
為了客觀評價隱藏算法的性能,采用語音信噪比SNR(Signal-to-Noise Ratio)、提取的機密信息誤碼率BER(Bit Error Rate)和PESQ(Perceptual Evaluation of Speech Quality)來評價算法性能。PESQ是ITU-T P.862建議書提供的客觀MOS值評價方法,其值在-1~4.5之間,當PESQ>3.5時語音質量較好,達到長途通話質量標準。
2.4.1信息隱藏頻段選擇 語音信號經過級小波分解后產生各個頻段下的小波系數,修改任一級小波系數對語音質量都會產生不同程度的影響。
圖1所示為經過3級小波(小波庫為db1)分解后,4個小波系數在不同嵌入深度下分別嵌入信息后載體語音SNR曲線對比圖(語音分段長度為20 ms)。圖2所示為在不同嵌入深度下,從4個小波系數上提取的機密信息的誤碼率曲線對比圖(40 dB噪聲攻擊)。圖1和圖2顯示,小波系數的頻段越高,載體語音質量下降越少,機密信息隱蔽性越好,但提取的機密信息誤碼率也越大;頻段很低的系數嵌入機密信息后載體語音質量受損嚴重,但其系數上提取的機密信息誤碼率幾乎為零??梢?,載體語音質量和機密信息提取誤碼率是一對矛盾,在最高頻和最低頻系數上隱藏信息都是不合適的,可選擇在中高頻和中低頻兩個系數上嵌入機密信息。
2.4.2 載體語音分段長度的選擇
把載體語音分為10 ms, 20 ms, 30 ms 3種不同長度的語音段,按2.1節(jié)所述方法在第2級高頻系數上嵌入機密信息,測試語音分段長度對攜密載體語音質量和機密信息誤碼率的影響。
圖3為不同語音分段長度下載體語音SNR對比圖。圖4為不同語音分段長度下提取的機密信息BER對比圖(由于在40 dB以上的噪聲攻擊下算法的誤碼率為零,因此圖4結果是在30 dB噪聲攻擊下完成的)。圖3和圖4顯示,語音分段長度越短,攜密載體語音質量受損越小,提取機密信息的誤碼率越高。究其原因是因為語音分段長度越短,語音段前后兩部分能量越小,按式(3)修改的高頻系數變化越小,從而語音質量變化越小,但在白噪聲攻擊下提取機密信息的誤碼率越高。此外,語音分段長度越短,單位時間內嵌入的機密信息比特數越多,隱藏容量越大。
以上實驗結果表明,載體語音SNR、機密信息BER和算法隱藏容量是一組矛盾,在實際應用中,應根據具體指標要求選擇合適的信息隱藏頻段、嵌入深度和語音分段長度。
圖 1 不同小波系數嵌入信息后語音SNR對比圖 圖 2 不同小波系數嵌入信息后機密信息BER對比圖
圖3 不同語音分段長度下載體語音SNR對比圖 圖4 不同語音分段長度下BER對比圖
3 基于小波變換的信息隱藏算法的實現
由2.4節(jié)參數選擇可見,選擇不同的信息隱藏頻段、載體語音分段長度和嵌入深度對攜密語音的語音質量、提取的機密信息的誤碼率以及算法隱藏容量都有不同程度的影響。根據2.4節(jié)的實驗結果,選擇以下參數測試算法的各項性能:(1)在經過3級小波變換的中高頻和中低頻系數上隱藏機密信息;(2)中高頻系數的隱藏深度,中低頻系數的隱藏深度; (3)語音分段長度為20 ms; (4)載體語音:采樣頻率16 kHz,量化位數16 bit; (5)機密語音:采樣頻率8 kHz,量化精度8 bit。
3.1 信息隱藏算法步驟
(1)機密信息經過加密和編碼形成長度為的二進制比特流,將分為奇偶兩組,每組二進制串前各添加2組8 bit全1的信息嵌入開始標記,二進制串后各添加2組8 bit全0的信息嵌入結束標記;
(2)載體語音經過低通濾波(通帶截止頻率7 kHz,阻帶截止頻率7.8 kHz,通帶衰減3 dB,阻帶衰減40 dB)后被分為20 ms長度的語音段,為語音段數,每一語音段樣點數為;
(3)對語音段進行3級小波分解,得到各級分解的高頻段系數1,2,3和低頻段系數3;
(4)按式(1)和式(2)計算語音段的2前后兩部分的能量EQ2和EH2,3前后兩部分的能量EQ3和EH3;
(6)根據嵌入信息后的各級系數進行小波逆變換,重構載體語音。
3.2 信息提取算法步驟
(3)對語音段進行3級小波分解,得到各級分解的高頻段系數,,和低頻段系數;
(5)按式(6)提取每段語音中的二進制信息。當出現2組8 bit全1的信息提取開始標記后,開始提取機密信息直到出現2組8 bit全0的提取結束標記時結束。每一語音段可提取2 bit信息。16 bit的開始或結束標記中出現2 bit以下誤碼時可忽略不計;
(6)將所有語音段提取的已加密機密信息重新組合并解密后恢復出機密信息。
4 實驗測試及結果分析
在無攻擊情況下按3.1節(jié)和3.2節(jié)所述步驟進行實驗測試。機密信息為一段時長674 ms的語音“南京”,載體語音為錄制的涵蓋中文男聲、中文女聲、英文男聲和英文女聲共4種類型的20條語音。
4.1 算法隱蔽性與隱藏容量分析
在20條載體語音上隱藏機密信息,每條語音做10次測試,總共進行200次測試。實驗所得結果取均值列于表1中。其中SNR1為載體語音的信噪比、PESQ1為載體語音客觀評分值,SNR2為提取的機密語音信噪比,PESQ2為載體語音客觀評分值,BER為提取的機密語音誤碼率,Cap為算法隱藏容量。由于算法在每個長度為20 ms的語音段上隱藏2 bit機密信息,因此隱藏容量Cap=2/20(bit/ms)=100 bit/s。表1結果顯示,載體語音具有較高的信噪比,且PESQ值在3.8以上,人耳基本感覺不到載體語音的細微變化,因此算法具有良好的隱蔽性和較高的隱藏容量。此外,不同語種的載體語音對語音質量和誤碼率略有影響。
4.2 算法可行性測試與分析
圖5為某段載體語音嵌入機密信息前后的波形對比圖(截取部分波形),由圖5以及表1中載體語音的SNR1和PESQ1實驗數據可見,載體語音波形圖和語音質量未發(fā)生明顯變化,說明算法具有較好的隱蔽性。圖6為機密信息提取前后的波形對比圖,由圖6及表1中機密信息的SNR2, PESQ2和BER實驗數據可見,機密信息波形未發(fā)生明顯變化,且提取的BER值非常小,即算法能夠在保證載體語音質量的條件下隱藏機密信息。
4.3 算法魯棒性測試與分析
信息隱藏算法的魯棒性是評價算法性能的重要指標,把原始載體語音和攜密載體語音同步進行以下常見的5種攻擊測試,從被攻擊后的原始語音信噪比SNR、攜密語音信噪比SNR1、機密語音信噪比SNR2、原始語音質量PESQ、攜密語音質量PESQ1、機密語音質量PESQ2以及提取的機密信息誤碼率BER等指標評價算法的魯棒性,各項指標測試結果的平均值列入表2。
(1)白噪聲攻擊:使用信噪比為20 dB, 30 dB和40 dB的白噪聲進行攻擊。
(2)低通濾波:兩種語音經過通帶截止頻率為6 kHz的Butterworth低通濾波器處理。
(3)重采樣:對兩種語音進行上、下兩種重采樣攻擊。上采樣:采樣率按16-32-16(kHz)變化;下采樣:采樣率按16-8-16(kHz)變化。
(4)重量化:對兩種語音進行升位和降位兩種重量化攻擊。升位量化:攜密載體語音的量化精度按16-32-16(bit)變化;降位量化:攜密載體語音的量化精度按16-8-16(bit)變化。
(5)回聲干擾:攜密載體語音加入10 ms的回聲干擾。
實驗測試結果表明:
(1)本文算法對白噪聲和低通濾波攻擊具有較好的魯棒性。在40 dB噪聲攻擊和低通濾波攻擊下,
表1 無攻擊測試實驗結果
圖5 載體語音嵌入信息前后波形對比圖 圖6 機密語音提取前后波形對比圖
表2 攻擊測試實驗結果
攜密載體語音具有較高的SNR1值和PESQ1值,提取的機密信息SNR2和PESQ2值較高,BER值極小,聽覺效果良好,與文獻[10-12]相比具有更好的魯棒性能。在30 dB和20 dB噪聲攻擊下,原始語音和攜密語音質量都有下降,提取的機密信息SNR2降低,BER值升高,說明較大的白噪聲攻擊對兩種語音質量影響都很大,原始載體語音即使未隱藏有機密信息其語音質量也受損嚴重。可見,本文算法對抗白噪聲和低通濾波這兩種攻擊具有較好的魯棒性。
(2)本文算法對上采樣和升量化攻擊具有較好的魯棒性,下采樣和降量化攻擊對算法魯棒性有一定影響。采樣改變的是語音采樣點的位置,量化改變的是采樣點的幅值。上采樣和升量化后采樣點位置和幅值基本無變化,所以載體語音質量非常好,提取的機密信息誤碼率較低。下采樣和降量化后采樣點數和采樣幅值變化較大,兩種載體語音的SNR和PESQ下降都較為明顯,但其PESQ值仍在3.5左右,提取的機密信息BER值略遜于文獻[10-12]。
(3)較小的回聲干擾對本文算法魯棒性基本無影響?;芈暩蓴_在10 ms左右時,本文算法性能非常好,說明延時較小的回聲干擾對算法性能影響較小。
(4)本文算法的魯棒性在白噪聲、上采樣、升量化、低通濾波和回聲干擾5種攻擊下比文獻[10-12]中所述算法優(yōu)越。下采樣和降量化攻擊時魯棒性稍遜于文獻[10-12]中算法。
5 結論
基于小波變換的信息隱藏算法根據機密信息的二進制狀態(tài)調節(jié)載體語音的各級高頻小波系數,從而改變語音段前后兩部分的能量狀態(tài)來隱藏信息,提取機密信息時通過對比語音段中前后兩部分的能量大小識別機密信息,無需原始載體語音,能實現機密信息的盲提取。針對具體的應用背景,可通過調節(jié)隱藏頻段、嵌入深度和語音分段長度3項參數平衡算法性能指標。實驗及分析結果表明,該算法具有較好的隱蔽性和魯棒性,能夠對抗白噪聲、低通濾波、重采用、升量化和回聲干擾等多種攻擊,在保證載體語音質量的條件下每一語音段內可實現2 bit的信息隱藏,且語音分段長度越小,小波分解級數越多,則隱藏容量越大。
[1] YANG Jun, BAI Sen, HUANG Yongfeng,Implementation of steganography based on HOOK[J]., 2012, 112(3): 133-141. doi: 10.1007/978-3-642-25194-8_16.
[2] MAZUROZYK W. VOIP steganography and its detection: A survey[J]., 2013, 46(2): 20-26. doi: 10.1145/2543581.2543587.
[3] HUANG X P, NOBUTAKA O, ISAO E,Reversible audio information hiding based on integer DCT coefficients with adaptive hiding locations[C]. Proceedings of the 12th International Workshop on Digital-Forensics and Watermarking (IWDW), Auckland, 2013: 376-388.
[4] 張秋余, 孫媛, 晏燕. 基于分塊自適應壓縮感知的可逆水印算法[J]. 電子與信息學報, 2013, 35(4): 797-804. doi: 10.3724/ SP.J.1146.2012.00914.
ZHANG Qiuyu, SUN Yuan, and YAN Yan. A reversible watermarking algorithm based on block adaptive compressed sensing[J].&, 2013, 35(4): 797-804. doi: 10.3724/SP.J.1146.2012.00914.
[5] 肖迪, 鄧秘密, 張玉書. 基于壓縮感知的魯棒可分離的密文域水印算法[J]. 電子與信息學報, 2015, 37(5): 1248-1254. doi: 10.11999/JEIT141017.
XIAO Di, DENG Mimi, and ZHANG Yushu. Robust and separable watermarking algorithm in encrypted image based on compressive sensing[J].&, 2015, 37(5): 1248-1254. doi: 10. 11999/JEIT141017.
[6] MOHAMMED K and ABDELLAH A. Audio watermarking with high embedding capacity based on multiple access techniques[J]., 2014, 34(1): 116-125. doi: 10.1016/j.dsp.2014.07.009.
[7] 趙學敏, 郭宇弘, 鄒學強, 等. 用于版權管理的數字音頻水印算法[J]. 電子與信息學報, 2011, 33(10): 2384-2389. doi: 10.3724/SP.J.1146.2011.00009.
ZHAO Xuemin, GUO Yuhong, ZOU Xueqiang,Digital audio watermarking algorithm for media copyright management[J].&, 2011, 33(10): 2384-2389. doi: 10.3724/SP.J.1146. 2011.00009.
[8] NUGRAHA R M. Implementation of direct sequence spread spectrum steganography on audio data[C]. Proceedings of the 2011 International Conference on Electrical Engineering and Informatics, Bandung, 2011: 1-6.
[9] 鄒明光, 李芝棠. 基于振幅值修改的wav音頻隱寫算法[J]. 通信學報, 2014, 35(z1): 36-40. doi: 10.3969/j.issn.1000-436x. 2014.z1.008.
ZOU Mingguang and LI Zhitang. Wav-audio steganography algorithm based on amplitude modifying[J]., 2014, 35(z1): 36-40. doi: 10.3969/j.issn. 1000-436x.2014.z1.008.
[10] 彭宏, 王珣, 王衛(wèi)星. 基于音頻特征的多小波域水印算法[J].計算機研究與發(fā)展, 2010, 47(2): 216-222.
PENG Hong, WANG Xun, and WANG Weixing. Audio watermarking approach based on audio features in multi wavelet domain[J]., 2010, 47(2): 216-222.
[11] 譚良, 吳波, 劉震, 等. 一種基于混沌和小波變換的大容量音頻信息隱藏算法[J]. 電子學報, 2010, 38(8): 1812-1818.
Tan Liang, Wu Bo, Liu Zheng,An audio information hiding algorithm with high-capacity which based on chaotic and wavelet transform[J]., 2010, 38(8): 1812-1818.
[12] TEWARI T K, SAXENA V, and Gupta J P. A digital audio watermarking scheme using selective mid band DCT coefficients and energy threshold[J]., 2014, 17(4): 365-371. doi: 10.1007/ s10772-014-9234-8.
[13] BAI Yinglei, ING Y S, and ZHEN Li. Blind and robust audio watermarking scheme based on SVD-DCT[J]., 2011, 91(8): 1973-1984. doi: 10.1016/j.sigpro. 2011.03.001.
[14] ALI A H. A dual transform audio watermarking algorithm[J]., 2014, 73(3): 1897-1912. doi: 10.1007/s11042-013-1645-z.
[15] 劉磊, 苗啟廣, 石程. 面向小波域的加權分數階微積分圖像數字水印新算法[J]. 計算機應用, 2011, 31(11): 3048-3052. doi: 10.3724/SP.J.1087.2011.03048.
LIU Lei, MIAO Qiguang , and SHI Cheng. New image digital watermark algorithm with weighted fractional calculus based on wavelet coefficients[J]., 2011, 31(11): 3048-3052. doi: 10.3724/SP.J.1087.2011.03048.
[16] HU Hwaitsu, HSU Lingyuan, and CHOU Hsienhsin. Variable-dimensional vector modulation for perceptual-based DWT blind audio watermarking with adjustable payload capacity[J]., 2014, 31(1): 115-123. doi: 10.1016/j.dsp.2014.04.014.
吳秋玲: 女,1979年生,博士生,研究方向為信號處理、信息安全.
吳 蒙: 男,1963年生,教授,研究方向為信息安全.
Foundation Items: Jiangsu Province Postgraduate Scientific Research and Innovation Project (KYLX_0815), Jiangsu Province University Science Research Foundation (10KJA510035)
Novel Audio Information Hiding Algorithm Based on Wavelet Transform
WU Qiuling①②WU Meng①
①(College of Telecommunications and Information Engineering, Nanjing University of Posts & Telecommunications, Nanjing 210003, China)②(College of Zijin, Nanjing University of Science and Technology, Nanjing 210046, China)
In view of the small hiding capacity, low concealment and poor robustness of the audio carrier, a novel audio information hiding algorithm is proposed based on wavelet transform. The algorithm regulates the high-frequency wavelet coefficients in every audio segment, and then changes the energy values of the former and the latter part in each audio to hide confidential information according to the characteristic that human auditory system is not sensitive to small changes in high frequency information of audio. First, the influence of embedded depth, hidden frequency-band and segment length of carrier audio on voice quality and bit error rate is tested to choose the best parameters, then algorithm is verified for the feasibility and robustness by several kinds of common attacking means. Experimental rdsults show that the proposed algorithm, which does not require the original audio signal in the watermark extraction, not only has good concealment and large hiding capacity, but also has strong robustness for resisting the common attacking behaviors, such as noise, low-pass filter, re-sampling, re-quantitative and echo interference. In additional, the audio segment is shorter, the hiding capacity is larger.
Information hiding; Wavelet transform; High-frequency coefficients; Energy values
TP391; TP309
A
1009-5896(2016)04-0834-07
10.11999/JEIT150856
2015-07-16;改回日期:2015-12-11;網絡出版:2016-02-19
吳秋玲 redpond2000@163.com
江蘇省普通高校研究生科研創(chuàng)新計劃項目(KYLX_ 0815),江蘇省高校自然科學研究重點資助項目(10KJA510035)