• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      針對(duì)多種處理痕跡的數(shù)字語(yǔ)音取證算法

      2019-08-01 01:35向立嚴(yán)迪群王讓定李孝文
      計(jì)算機(jī)應(yīng)用 2019年1期

      向立 嚴(yán)迪群 王讓定 李孝文

      摘 要:現(xiàn)有的數(shù)字語(yǔ)音取證研究主要集中于對(duì)單一的某種操作進(jìn)行檢測(cè),無(wú)法對(duì)不相關(guān)的操作進(jìn)行判斷。針對(duì)該問(wèn)題,提出了一種能夠同時(shí)檢測(cè)經(jīng)過(guò)變調(diào)、低通濾波、高通濾波和加噪這四種操作的數(shù)字語(yǔ)音取證方法。首先,計(jì)算語(yǔ)音的歸一化梅爾頻率倒譜系數(shù)(MFCC)統(tǒng)計(jì)矩特征;然后通過(guò)多個(gè)二分類器對(duì)特征進(jìn)行訓(xùn)練,并組合投票得到多分類器;最后使用該多分類器對(duì)待測(cè)語(yǔ)音進(jìn)行分類。在TIMIT以及UME語(yǔ)音庫(kù)上的實(shí)驗(yàn)結(jié)果表明,歸一化MFCC統(tǒng)計(jì)矩特征在庫(kù)內(nèi)實(shí)驗(yàn)中均達(dá)到了97%以上的檢測(cè)率,且在對(duì)MP3壓縮魯棒性測(cè)試的實(shí)驗(yàn)中,檢測(cè)率仍能保持在96%以上。

      關(guān)鍵詞:語(yǔ)音取證;梅爾頻率倒譜系數(shù);處理痕跡;多分類器

      中圖分類號(hào): TP391.42; TN912.34

      文獻(xiàn)標(biāo)志碼:A

      Abstract: Most existing forensic methods for digital speech aim at detecting a specific operation, which means that these methods can not identify various operations at a time. To solve the problem, a universal forensic algorithm for simultaneously detecting various operations, such as pitch modification, low-pass filtering, high-pass filtering, and noise adding was proposed. Firstly, the statistical moments of Mel-Frequency Cepstral Coefficients (MFCC) were calculated, and cepstrum mean and variance normalization were applied to the moments. Then, a multi-class classifier based on multiple two-class classifiers was constructed. Finally, the classifier was used to identify various types of speech operations. The experimental results on TIMIT and UME speech datasets show that the proposed universal features achieve detection accuracy over 97% for various speech operations. And the detection accuracy in the test of MP3 compression robustness is still above 96%.

      Key words: speech forensics; Mel-Frequency Cepstral Coefficient (MFCC); operation trace; multi-class classifier

      0 引言

      隨著數(shù)字語(yǔ)音處理技術(shù)的快速發(fā)展,以及語(yǔ)音編輯工具功能越來(lái)越強(qiáng)大,使得數(shù)字語(yǔ)音可以輕易地被修改而不被察覺(jué)。數(shù)字語(yǔ)音偽造越來(lái)越頻繁地出現(xiàn)在我們的日常生活中,如電子語(yǔ)音變調(diào)、加噪等,這些偽造操作會(huì)導(dǎo)致很多嚴(yán)重的法律、倫理和道德問(wèn)題,因此,數(shù)字語(yǔ)音取證已經(jīng)受起越來(lái)越多的關(guān)注。到目前為止,已經(jīng)有許多針對(duì)不同操作的取證方法的研究[1-2],如變調(diào)語(yǔ)音檢測(cè)[3-5]、設(shè)備來(lái)源取證[6-8]、翻錄語(yǔ)音檢測(cè)[9]等,而大多數(shù)的研究?jī)H僅針對(duì)某一種特定的操作進(jìn)行檢測(cè)[10],即不考慮待測(cè)語(yǔ)音是否可能經(jīng)過(guò)了其他操作;然而在現(xiàn)實(shí)場(chǎng)景中,這樣顯然不符合實(shí)際情況,例如,將加噪的語(yǔ)音放入變調(diào)分類器中進(jìn)行分類,則其可能被分類為原始語(yǔ)音或變調(diào)語(yǔ)音,因?yàn)榇郎y(cè)語(yǔ)音往往是經(jīng)過(guò)了未知操作類型的,且通??赡芙?jīng)過(guò)了多種操作,從而對(duì)取證工作造成誤導(dǎo)。在語(yǔ)音取證領(lǐng)域中還缺乏關(guān)于多種操作檢測(cè)的算法,因此,有必要研究一種能夠通過(guò)某一種特征檢測(cè)出多種操作的算法。

      電子語(yǔ)音變調(diào)通過(guò)修改語(yǔ)音的音調(diào),使得該語(yǔ)音從聽覺(jué)上發(fā)生變化,例如提高一個(gè)男生的音調(diào),會(huì)使得該語(yǔ)音像一個(gè)女生的語(yǔ)音;在實(shí)際場(chǎng)景中,經(jīng)常會(huì)使用各種濾波器對(duì)一段語(yǔ)音進(jìn)行處理,達(dá)到特殊的效果,例如降噪等;一段語(yǔ)音的錄制場(chǎng)景可能是不同的,而通過(guò)對(duì)語(yǔ)音進(jìn)行加噪可以改變一段語(yǔ)音的錄制場(chǎng)景,如一段安靜的語(yǔ)音,通過(guò)向其加入學(xué)校環(huán)境的背景噪聲,會(huì)讓人以為該語(yǔ)音的錄制場(chǎng)景是學(xué)校。以上幾種操作都是在實(shí)際生活中幾種較為常見的語(yǔ)音的操作,且都會(huì)對(duì)語(yǔ)音進(jìn)行大量修改,從而對(duì)取證工作造成誤導(dǎo)。

      為了研究一種對(duì)多種操作都能夠檢測(cè)的技術(shù),本文提出了一種利用歸一化的梅爾頻率倒譜系數(shù)(Mel-Frequency Cepstral Coefficient, MFCC)統(tǒng)計(jì)矩特征對(duì)變調(diào)、高通濾波器、低通濾波器、加噪四種操作進(jìn)行分類檢測(cè)的方法,利用TIMIT(the DARPA TIMIT Acoustic-Phonetic Continuous Speech Corpus)語(yǔ)音庫(kù)以及UME(advanced Utilization of Multimedia to promote higher Education Reform speech database)語(yǔ)音庫(kù)進(jìn)行實(shí)驗(yàn)。結(jié)果證明,該方法能夠?qū)@四種操作進(jìn)行鑒別。

      1 歸一化MFCC統(tǒng)計(jì)矩特征

      MFCC特征是一種在語(yǔ)音識(shí)別中被廣泛使用的特征。梅爾頻率是基于人耳聽覺(jué)特性提出來(lái)的,它與Hz頻率成非線性對(duì)應(yīng)關(guān)系,MFCC則是利用它們之間的這種關(guān)系,計(jì)算得到的Hz頻譜特征。

      赣州市| 尉氏县| 西昌市| 定兴县| 驻马店市| 喀喇沁旗| 黄大仙区| 高雄市| 永清县| 宜都市| 色达县| 牙克石市| 托克托县| 调兵山市| 宝鸡市| 雅安市| 大安市| 漳州市| 白沙| 张家界市| 疏勒县| 武汉市| 开阳县| 扎兰屯市| 南华县| 岗巴县| 沙坪坝区| 石屏县| 台南县| 通州区| 湘阴县| 锡林浩特市| 抚远县| 万荣县| 大埔县| 阿图什市| 牙克石市| 金堂县| 德江县| 忻城县| 若羌县|