黃其娟,王讓定,嚴(yán)迪群
(寧波大學(xué)信息科學(xué)與工程學(xué)院,浙江 寧波 315211)
基于比例因子轉(zhuǎn)移概率的AAC音頻壓縮歷史檢測算法
黃其娟,王讓定,嚴(yán)迪群
(寧波大學(xué)信息科學(xué)與工程學(xué)院,浙江 寧波 315211)
音頻壓縮歷史的檢測是音頻取證的重要組成部分,對判斷音頻是否經(jīng)過篡改和偽造有著十分重要的意義。通過研究發(fā)現(xiàn),AAC音頻比例因子的值會隨著壓縮次數(shù)的增加而逐漸減小。基于此,提出了一種基于比例因子轉(zhuǎn)移概率差值統(tǒng)計特性的AAC音頻壓縮歷史檢測算法。實驗結(jié)果表明,該算法能對多次壓縮的AAC音頻進行準(zhǔn)確分類,其低碼率轉(zhuǎn)高碼率間AAC音頻平均分類準(zhǔn)確率達到了99.75%,同碼率間準(zhǔn)確率達97.28%。另外,對比實驗也證明了本文算法的性能優(yōu)于現(xiàn)有算法。
AAC音頻;壓縮歷史;比例因子;轉(zhuǎn)移概率
隨著多媒體和互聯(lián)網(wǎng)的不斷發(fā)展,人們可便捷地借助音頻、圖像、視頻設(shè)備來分享、獲取各種各樣的重要信息。這些多媒體信息無時無刻不縈繞在人們的生活中,在給人們生活帶來便利的同時,也存在著很多信息安全隱患。信息化的快速發(fā)展使得信息安全形勢愈加嚴(yán)峻[1,2],由此,多媒體取證技術(shù)應(yīng)運而生,并得到了快速發(fā)展。作為多媒體取證技術(shù)的重要分支之一,音頻取證也得到迅速發(fā)展。
音頻壓縮歷史檢測是音頻取證技術(shù)中的熱點問題之一,在對音頻進行篡改、插入等操作時,都會對音頻進行壓縮,導(dǎo)致音頻壓縮歷史的改變。音頻壓縮歷史的檢測是判斷音頻是否被篡改或偽造的一個必要條件。
壓縮域音頻歷史的檢測主要集中于雙壓縮音頻的檢測。近年來,國內(nèi)外研究者對MP3壓縮域音頻的壓縮歷史的檢測取得了一些研究成果。D’alessandro等人[3]通過分析不同比特率下音頻的功率譜,發(fā)現(xiàn)其在16~20 kHz頻帶內(nèi)呈現(xiàn)不同分布,從而提出通過頻譜分析檢測MP3音頻真實比特率的方法。Liu等人[4]通過修正離散余弦變換(modified discrete cosine transform,MDCT)系數(shù)絕對值高于設(shè)定閾值的比例,實現(xiàn)單壓縮音頻和雙壓縮音頻分類,但該閾值的設(shè)定基于作者經(jīng)驗值,不具備普適性。Qiao等人[5]使用小值MDCT系數(shù)數(shù)量、相鄰幀間過渡連續(xù)性及系數(shù)離散數(shù)值分布等特征進行雙壓縮音頻檢測。在非壓縮域音頻壓縮歷史檢測方面,Luo等人[6]通過提取MDCT系數(shù)作為其壓縮歷史檢測的有效特征,在檢測是否經(jīng)過有損編碼器重壓縮的基礎(chǔ)上檢測其壓縮采用的比特率。Luo等人[7]通過增加梅爾倒譜系數(shù)(Mel frequen-cy cepstrum coefficient,MFCC)作為檢測特征,提高了算法檢測準(zhǔn)確率,但特征維數(shù)較高,增加了計算量。Ren等人[8]去除待測音頻的前200個采樣點,重新壓縮得到校準(zhǔn)音頻,并利用待測音頻與校準(zhǔn)音頻量化 MDCT系數(shù)的不同,進行MP3雙壓縮音頻檢測和壓縮音頻原始碼率估計。
在AAC音頻壓縮歷史檢測方面,Seichter等人[9]利用卷積神經(jīng)網(wǎng)絡(luò)對AAC壓縮音頻進行分類并估計壓縮音頻的原始碼率。Jin等人[10]使用Huffman碼表索引出現(xiàn)的概率以及其Markov單步轉(zhuǎn)移概率作為特征,利用LIBSVM對單壓縮和雙壓縮AAC音頻進行分類。雖然該方法在低碼率轉(zhuǎn)高碼率的壓縮音頻取得了較好的檢測效果,但在同碼率的壓縮音頻方面,識別率較低。李晗等人[11]利用AAC在重壓縮過程中頻率成分的變化、能量值的不同,使用堆棧自動編碼器(SAE)進行雙壓縮歷史的檢測,但其并沒有對具體碼率的單雙壓縮的音頻進行檢測,且檢測準(zhǔn)確率較低。
本文的研究對象僅為經(jīng)過三次及三次以下的AAC壓縮音頻??梢园l(fā)現(xiàn),在音頻壓縮過程中,比例因子隨壓縮次數(shù)而發(fā)生變化,隨著壓縮次數(shù)的增加,比例因子會逐漸減小。根據(jù)音頻壓縮前后比例因子統(tǒng)計特性的差異,提出了一種基于比例因子統(tǒng)計特性的AAC音頻壓縮歷史檢測算法。該算法將比例因子轉(zhuǎn)移概率差值作為檢測特征,利用LIBSVM對多壓縮的AAC音頻進行分類。實驗結(jié)果表明,本文算法檢測準(zhǔn)確率較高,能有效檢測AAC音頻的壓縮歷史。
AAC是高級音頻編碼(advanced audio coding)的簡稱,是ISO/IEC MPEG-2和MPEG-4標(biāo)準(zhǔn)的重要組成部分[12]。MPEG-2 AAC于1997年發(fā)布,因其在相同碼率,尤其是低碼率的情況下,有著比MP3音頻更好的音質(zhì)[13],因此被看好能取代 MP3成為新一代的音頻編碼標(biāo)準(zhǔn)。AAC編碼框架如圖1所示,主要由心理聲學(xué)模型、增益控制、濾波器組、時域噪聲整形、強度立體聲耦合、預(yù)測、M/S編碼、量化和無噪聲編碼等部分組成。
圖1 AAC編碼框架
AAC進行MDCT時使用長窗塊、短窗塊、開始塊和結(jié)束塊這4種變換塊類型:瞬時特性變化較為平穩(wěn)的塊使用長窗,變化較為劇烈的塊使用短窗,另外兩種塊則用于長窗塊和短窗塊的過渡。使用長窗塊時,AAC具有較高的頻域分辨率和較高的編碼效率。而當(dāng)音頻信號變化劇烈時,AAC通過使用短窗塊來提高信號的時域分辨率。本文則主要關(guān)注長窗塊情況下的編碼。
AAC標(biāo)準(zhǔn)將1 024個頻域系數(shù)分成若干個連續(xù)的組分別進行量化,這樣的組就稱為比例因子帶。比例因子帶依據(jù)人耳聽覺系統(tǒng)的臨界帶劃分,其個數(shù)和長度取決于當(dāng)前塊類型和原始音頻的采樣率。如對原始采樣率為44.1 kHz的音頻,AAC將其長塊和短塊分別劃分為49個和14個比例因子帶。每個比例因子對應(yīng)一個比例因子帶,AAC中比例因子采用差分編碼和 Huffman編碼的方式,比例因子的最大值可取到255。AAC量化模塊利用心理聲學(xué)模型計算所得掩蔽閾值,求出各比例因子帶的最佳比特分配方案。
量化由幀循環(huán)、外循環(huán)和內(nèi)循環(huán)3個迭代循環(huán)完成,其中幀循環(huán)負(fù)責(zé)初始化變量、計算可用比特數(shù),外循環(huán)將量化環(huán)節(jié)的失真限制在可控范圍內(nèi),
內(nèi)循環(huán)則實施對頻譜系數(shù)的具體量化。AAC內(nèi)循環(huán)中的量化函數(shù)式為:
AAC壓縮音頻(多次壓縮)分為以下3類:低碼率轉(zhuǎn)高碼率的AAC音頻,這類壓縮音頻通常被稱為假音質(zhì)音頻,由較差音質(zhì)(低碼率)的音頻轉(zhuǎn)碼形成的虛假高品質(zhì)(高碼率)音頻;相同碼率的AAC音頻,該類音頻的產(chǎn)生多是由于原始壓縮音頻被篡改后,為了不讓格式的改變引起他人懷疑而重新以相同碼率重新壓縮回篡改前的音頻格式;高碼率轉(zhuǎn)低碼率的AAC音頻,這種情況雖也有可能發(fā)生,但目前在取證場景下的意義仍未被提出。因此,本文后續(xù)的壓縮音頻默認(rèn)為上述第一類和第二類音頻。
為驗證AAC多次壓縮對比例因子的影響,隨機選取100首10 s的WAV音頻,包括鄉(xiāng)村、藍(lán)調(diào)、流行、爵士等風(fēng)格。將這100首WAV音頻壓縮成60 kbit/s、120 kbit/s的AAC音頻,然后繼續(xù)進行壓縮操作,分別得到60 kbit/s→60 kbit/s、60 kbit/s→120 kbit/s的二次壓縮音頻,60 kbit/s→60 kbit/s→60 kbit/s、 60 kbit/s→120 kbit/s→120 kbit/s的3次壓縮音頻。提取每種碼率AAC音頻的比例因子,并對其出現(xiàn)概率進行統(tǒng)計。AAC比例因子的范圍為[0,255],如圖2所示,其比例因子值的分布近似服從拉普拉斯分布,且主要值集中于[140,200],為保證研究的普適性,本算法僅對這個范圍內(nèi)的比例因子出現(xiàn)概率進行統(tǒng)計。
圖2 100首AAC音頻比例因子出現(xiàn)概率
由圖2可以看出,隨著壓縮次數(shù)的增加,比例因子值相對減小。其中,同碼率音頻壓縮比例因子變化較小,由低碼率轉(zhuǎn)高碼率的音頻比例因子變化相對較大。由此認(rèn)為可通過分析比例因子的統(tǒng)計特性來判斷AAC的壓縮歷史。由圖2還可以看出,AAC音頻壓縮使比例因子發(fā)生相應(yīng)變化,但壓縮音頻與原始音頻比例因子較為接近,難以區(qū)分音頻的壓縮歷史。且隨著壓縮次數(shù)的增加,比例因子最大值即曲線峰值的出現(xiàn)概率逐漸減小,而其他比例因子的出現(xiàn)概率也會發(fā)生變換,這說明壓縮會使得部分比例因子發(fā)生轉(zhuǎn)化,即可能會發(fā)生比例因子的相應(yīng)轉(zhuǎn)移。
假設(shè)一次壓縮AAC音頻為M1,對其進行解壓再壓縮,得到新的AAC音頻M2,然后繼續(xù)進行三次壓縮,得到AAC音頻M3,如圖3所示。在本文的研究中,假設(shè)二次壓縮和三次壓縮得到的M2、M3音頻碼率相等。
圖3 特征提取流程
圖3中SF1、SF2、SF3表示將一次壓縮AAC音頻M1、二次壓縮 AAC音頻M2和三次壓縮AAC音頻M3解壓得到的比例因子矩陣,可將其定義為:
其中,n代表比例因子帶的個數(shù),若為單聲道,則m=2I;若為雙聲道,則m=4I。I代表待測音頻長窗幀的總數(shù)。
本文統(tǒng)計了 140~200內(nèi)的比例因子,但由于140~150、180~200內(nèi)的比例因子出現(xiàn)概率過小,在統(tǒng)計轉(zhuǎn)移概率時,僅選取在 150~180內(nèi)的比例因子進行統(tǒng)計。文中定義了兩種轉(zhuǎn)移概率的情況,分別是塊內(nèi)轉(zhuǎn)移概率和塊間轉(zhuǎn)移概率即:
∑31∑30δ(s fi,j= m, s fi,j+1=n)p{ s fi,j+1= n| s fi,j= m}=i=1j=13130(5)∑i=1∑j=1
δ(s fi,j=m)
∑30∑31δ(s fi,j= m, s fi+1,j=n)p{ s f = n| s f = m}=i=1j=1
i+ 1,j i, j30 31
∑i=1∑j=1
δ(s fi,j=m)
(6)
選取100首M1、M2和M3音頻,提取比例因子塊內(nèi)和塊間轉(zhuǎn)移概率,取其均值。圖4所示為M1、M2和M3塊內(nèi)和塊間轉(zhuǎn)移概率。圖4中(1)、(2)、(3)分別代表M1、M2和M3,橫坐標(biāo)共961維,代表比例因子由M轉(zhuǎn)變?yōu)镹,M、N如式(10)和式(11)所示,縱坐標(biāo)代表比例因子的轉(zhuǎn)移概率:
從圖4(a)和圖4(b)中可以看出,M1、M2和M3三次壓縮的比例因子轉(zhuǎn)移概率差別較小,無法利用其進行壓縮音頻的分類。
圖4 AAC壓縮音頻的轉(zhuǎn)移概率
利用得到的轉(zhuǎn)移概率矩陣P1、P2和P3,計算轉(zhuǎn)移概率的差值矩陣ΔP1、ΔP2,如式(12)和式(13)所示:
由上述100首M1、M2和M3音頻計算得到的比例因子轉(zhuǎn)移概率差值散點圖如圖5所示,圖5(a)為比例因子塊內(nèi)轉(zhuǎn)移概率差值,圖5(b)為比例因子塊間轉(zhuǎn)移概率差值,圖中“+”代表M1、M2差值,“o”代表M2、M3差值。從圖5中可以看出,M1、M2轉(zhuǎn)移概率差值大于M2、M3的差值,且區(qū)別較為明顯。
圖5 壓縮AAC音頻的轉(zhuǎn)移概率差值
本文采用的數(shù)據(jù)庫是隨機選取的800首10 s長的WAV音頻。這800首WAV音頻包含各種不同的風(fēng)格,如藍(lán)調(diào)、流行、古典、鄉(xiāng)村和民謠等。實驗中使用的 AAC編解碼器為使用最為廣泛的開源軟件FAAC-1.28和FAAD2-2.7。對上述數(shù)據(jù)庫的800首WAV音頻使用FAAC-1.28進行壓縮獲得單壓縮的AAC音頻,共7種比特率,60 kbit/s、75 kbit/s、90 kbit/s、120 kbit/s、135 kbit/s和150 kbit/s各 800首。而雙壓縮音頻是單壓音頻在經(jīng)FAAD2-2.7解碼后再次使用FAAC-1.28編碼得到的音頻,共得到28類二次壓縮音頻。再對該二次壓縮AAC音頻樣本解壓重壓縮,得到28類與二次壓縮碼率相同的三次壓縮AAC音頻樣本。
本文選擇LIBSVM作為分類器,并從上述一次、二次和三次壓縮樣本中隨機選取70%用于訓(xùn)練模型,而剩下的 30%作為測試模型。為了使測試的結(jié)果更加準(zhǔn)確,表1~表4中的檢測準(zhǔn)確率均是訓(xùn)練和測試重復(fù)10次結(jié)果的平均值。
在本實驗中,計算比例因子轉(zhuǎn)移概率時,共有961維特征,特征維數(shù)過高使得在用SVM進行分類時,其效果并不是很理想。因此,使用SVM-RFE(recursive feature elimination based on SVM,基于 SVM 的遞歸特征消除)[15]算法對選出的特征按照從優(yōu)到劣進行排序。SVM-RFE算法于2002年由Guyon等人提出。SVM-RFE是在RFE的過程中使用SVM作為分類器,它從全集出發(fā),根據(jù)所訓(xùn)練分類器的各項參數(shù)來制定特征排序的標(biāo)準(zhǔn),逐個剔除最不相關(guān)的特征,并通過迭代直到剩下最后一個特征,從而實現(xiàn)對特征的排序。
(1)塊內(nèi)轉(zhuǎn)移概率檢測結(jié)果
由表1可知,低碼率轉(zhuǎn)高碼率音頻檢測的平均正確率達到99.88%,同碼率間檢測的平均正確率為 97%。該特征集在低碼率轉(zhuǎn)高碼率的情況下取得了較好的檢測效果,均超過了 99%。但針對相同碼率的壓縮音頻,檢測率相對偏低約2.88個百分點,這是由于在音頻壓縮碼率相同時,其比例因子變化較小,轉(zhuǎn)移概率差值變化也相對較小。
表1特征集的檢測準(zhǔn)確率
表1特征集的檢測準(zhǔn)確率
BR1 BR2=BR3 60 75 90 105 120 135 150 60 100% 100% 100% 100% 100% 100% 100%75 94.5% 100% 100% 100% 100% 100%90 97.5% 99.5% 100% 100% 100%105 96.5% 100% 100% 100%120 95.83% 100% 99.93%135 98% 99.17%150 96.67%
(2)塊間轉(zhuǎn)移概率檢測結(jié)果
表2 特征集 interSFTPD 的檢測準(zhǔn)確率
(3)融合特征檢測結(jié)果
本文選取塊內(nèi)、塊間轉(zhuǎn)移概率差值作為檢測AAC壓縮音頻的特征,而塊內(nèi)、塊間轉(zhuǎn)移概率的差值特征均屬于單一特征。為證明實驗的可靠性,現(xiàn)將塊內(nèi)、塊間的轉(zhuǎn)移概率差值特征融合,即將塊內(nèi)、塊間轉(zhuǎn)移概率差值相加后,使用SVM-RFE對特征進行排序并選擇,最終得到融合特征。
表3是融合特征對AAC音頻壓縮歷史的檢測結(jié)果,其低碼率轉(zhuǎn)高碼率音頻檢測的平均正確率達 99.69%,同碼率間檢測的平均正確率為97.67%。與特征集 SFTPDintra、SFTPDinter對比發(fā)現(xiàn),其檢測準(zhǔn)確率在低碼率轉(zhuǎn)高碼率上相差不大,但在同碼率間檢測上有所提升,融合特征檢測準(zhǔn)確率比SFTPDintra高約0.67個百分點,比 SFTPDinter高約 1.5個百分點??傮w而言,融合特征在 AAC壓縮音頻分類準(zhǔn)確率上表現(xiàn)較好。
表3 融合特征的檢測準(zhǔn)確率
為了更加全面地評估本文提出的 AAC壓縮音頻的檢測方法,重構(gòu)了Jin等人[10]方法的特征,并與其進行了對比。在參考文獻[10]中,具體分類特征構(gòu)建的方法是:Huffman碼表在AAC音頻一次壓縮和二次壓縮的使用情況存在差異,將Huffman碼表索引出現(xiàn)的概率作為第一特征,將其Markov單步轉(zhuǎn)移概率作為第二特征,將第一特征與第二特征融合得到第三特征,并用 LIBSVM對單壓縮和雙壓縮AAC音頻進行分類,其低碼率轉(zhuǎn)高碼率檢測的平均正確率達99.72%,同碼率間檢測的平均正確率為77.38%。表4是參考文獻[8]實驗檢測率與本文特征集檢測率對比,“+”代表本文算法結(jié)果高于參考文獻[10]檢測率的百分點,“-”代表本文算法結(jié)果低于參考文獻[8]檢測率的百分點。
表4 參考文獻[10]與文中特征集 特征的雙壓縮檢測結(jié)果比較
表4 參考文獻[10]與文中特征集 特征的雙壓縮檢測結(jié)果比較
BR1 BR2=BR3 60 75 90 105 120 135 150 60 +22.83% 0 0 0 0 0 0 75 +15.92% 0 0 0 0 0 90 +21.75% ?0.33% 0 0 0 105 +22.87% +1.5% 0 0 120 +16.66% +2.33% +0.03%135 +15.92% ?0.26%150 +11.17%
上述結(jié)果表明,Jin等人[10]方法的特征對低碼率轉(zhuǎn)高碼率的AAC音頻其檢測率較高,與本文算法中的比例因子轉(zhuǎn)移概率差值的檢測結(jié)果相差不大,但是本文算法解決了參考文獻[10]中同碼率間的檢測效果較差的問題,將檢測準(zhǔn)確率提高了約18個百分點。
本文針對多次壓縮的AAC音頻,提出了一種基于比例因子轉(zhuǎn)移概率差值統(tǒng)計特性的 AAC音頻壓縮歷史檢測算法。通過研究壓縮過程中比例因子的變化,利用其轉(zhuǎn)移概率差值特征對多壓縮AAC音頻進行分類。實驗結(jié)果表明,低碼率轉(zhuǎn)高碼率間AAC音頻檢測準(zhǔn)確率達99.75%,而同碼率間檢測準(zhǔn)確率也達97.28%。雖然該算法在檢測AAC音頻的壓縮歷史時準(zhǔn)確率較高,但也存在著一定的局限性。如未考慮噪聲等其他因素攻擊情況下算法的頑健性;僅針對一種編解碼算法,未涉及相同編碼標(biāo)準(zhǔn)的不同編碼算法的壓縮歷史檢測算法。因此在今后的工作中將對上述問題進行更深入的研究。
[1] 鄭志彬. 信息網(wǎng)絡(luò)安全威脅及技術(shù)發(fā)展趨勢[J]. 電信科學(xué),2009, 25(2): 28-34.ZHENG Z B. Overview of mobile communication services security[J]. Telecommunications Science, 2009, 25(2): 28-34.
[2] 王帥, 汪來富, 金華敏, 等. 網(wǎng)絡(luò)安全分析中的大數(shù)據(jù)技術(shù)應(yīng)用[J]. 電信科學(xué), 2015, 31(7): 145-150.WANG S, WANG L F, JIN H M, et al. Big data application in network security analysis[J]. Telecommunications Science,2015, 31(7): 145-150.
[3] D’ALESSANDRO B, SHI Y Q. MP3 bit rate quality detection through frequency spectrum analysis[C]//ACM Workshop on Multimedia and Security, September 7-8, 2009, Princeton, USA.New York: ACM Press, 2009: 57-62.
[4] LIU Q, SUNG A H, QIAO M. Detection of double MP3 compression[J]. Cognitive Computation, 2010, 2(4): 291-296.
[5] QIAO M, SUNG A H, LIU Q. Improved detection of MP3 double compression using content-independent features[C]//IEEE International Conference on Signal Processing, Communication and Computing, Aug 5-8, 2013, Kunming, China. New Jersey: IEEE Press, 2013: 1-4.
[6] LUO D, LUO W Q, YANG R, et al. Compression history identification for digital audio signal[C]//2012 IEEE International Conference on Acoustics, Speech and Signal Processing, March 25-30, 2012, Kyoto, Japan. New Jersey: IEEE Press, 2012:1733-1736.
[7] LUO D, LUO W Q, YANG R, et al. Identifying compression history of wave audio and its applications[J]. ACM Transactions on Multimedia Computing, Communications, and Applications,2014, 10(3): 1-19.
[8] REN Y, FAN M, YE D, et al. Detection of double MP3 com-pression based on difference of calibration histogram[J]. Multimedia Tools & Applications, 2016, 75(21): 13855-13870.
[9] SEICHTER D, CUCCOVILLO L, AICHROTH P. AAC encoding detection and bitrate estimation using a convolutional neural network[C]//IEEE International Conference on Acoustics,Speech and Signal Processing, March 20-25, 2016, Shanghai,China. New Jersey: IEEE Press, 2016: 2069-2073.
[10] JIN C, WANG R, YAN D, et al. An efficient algorithm for double compressed AAC audio detection[J]. Multimedia Tools& Applications, 2016, 75(8): 4815-4832.
[11] 李晗. AMR和AAC音頻雙壓縮檢測研究[D]. 廣州: 華南理工大學(xué), 2015.LI H. Research on AMR and AAC audio dual compression detection[D]. Guangzhou: South China University of Technology, 2015.
[12] INSTITUTION B S. ISO/IEC 13838-7/FPDAM 1. Information technology. Generic coding of moving pictures and associated audio information. Part 7: advanced audio coding (AAC).Amendment 1: signalling of bandwidth extension[S].
[13] Wikipedia. Advanced audio coding[EB/OL]. (2011-06-15)[2017-07-13]. https://de.wikipedia.org/wiki/Advanced_Audio_Coding.
[14] GAO Z H, WEI G. The core technology of the broadband MP3 audio compression[J]. Electro Acoustic Technology, 2000, 9(5): 9-13.
[15] WESTON J, GUYON I. Support vector machine-recursive feature elimination (SVM-RFE): US, US 8095483 B2[P]. 2012.
AAC compression detection based on scaling factor transition probability
HUANG Qijuan, WANG Rangding, YAN Diqun
College of Information Science and Engineering, Ningbo University, Ningbo 315211, China
Audio compression history detection is an important part of audio forensics, which is important to detect whether audio has been tampered or forged. An algorithm of AAC audio compression history detection was presented by using the transition probability differences of scale factors as the discriminative feature. Experimental results demonstrate that the proposed method can distinguish the single, double and triple compressed AAC audios effectively, and from the low-bite-rate to high-bit-rate, the average classification accuracy achieves 99.75%, the same-bit-rate detection accuracy achieves 97.28%. In addition, the results of comparison experiments show that the proposed algorithm outperforms the state-of-the-art algorithm.
AAC audio, compression history, scale factor, transfer probability
s: The National Natural Science Foundation of China (No. 61672302, No.61300055), Natural Science Foundation of Zhejiang Province of China (No.LZ15F020010, No.Y17F020051), The Scientific Research Foundation of Ningbo University(No.XKXL1405, No.XKXL1420, No.XKXL1509, No. XKXL1503), K.C. Wong Magna Fund in Ningbo University
TP391
A
10.11959/j.issn.1000?0801.2017277
2017?07?13;
2017?09?26
王讓定,wangrangding@nbu.edu.cn
國家自然科學(xué)基金資助項目(No.61672302,No.61300055);浙江省自然科學(xué)基金資助項目(No.LZ15F020010,No.Y17F020051);寧波大學(xué)科研基金資助項目(No.XKXL1405,No.XKXL1420,No.XKXL1509,No.XKXL1503);寧波大學(xué)王寬誠幸?;鹳Y助項目
黃其娟(1993?),女,寧波大學(xué)信息科學(xué)與工程學(xué)院碩士生,主要研究方向為多媒體通信與信息安全等。
王讓定(1962?),男,博士,寧波大學(xué)高等技術(shù)研究院教授、博士生導(dǎo)師,主要研究方向為多媒體通信與取證、信息隱藏與隱寫分析、智能抄表及傳感網(wǎng)絡(luò)技術(shù)等。
嚴(yán)迪群(1979?),男,博士,寧波大學(xué)信息科學(xué)與工程學(xué)院副教授、碩士生導(dǎo)師,主要研究方向為多媒體通信、信息安全、基于深度學(xué)習(xí)的數(shù)字語音取證等。