• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      一種改進(jìn)型的MEL濾波器混合特征參數(shù)提取方法研究*

      2014-02-09 09:02:08陸安江張正平
      通信技術(shù) 2014年12期
      關(guān)鍵詞:計(jì)算精度特征參數(shù)識(shí)別率

      黃 銳,陸安江,張正平

      (貴州大學(xué)大數(shù)據(jù)與信息工程學(xué)院,貴州貴陽(yáng)550025)

      一種改進(jìn)型的MEL濾波器混合特征參數(shù)提取方法研究*

      黃 銳,陸安江,張正平

      (貴州大學(xué)大數(shù)據(jù)與信息工程學(xué)院,貴州貴陽(yáng)550025)

      由于在說(shuō)話人識(shí)別中梅爾頻率濾波器組結(jié)構(gòu)分布不均勻,在低頻區(qū)域分布密集而在中心頻率、高頻率分布稀疏,影響了在中、高頻段的MEL倒譜系數(shù)(MFCC)的提取,本文提出適用于說(shuō)話人識(shí)別的改進(jìn)MEL濾波器與MidMel濾波器相結(jié)合得到兩種混合特征參數(shù),用此方式來(lái)提高中、高頻率特征參數(shù)提取的精度,從而提高系統(tǒng)識(shí)別率。實(shí)驗(yàn)結(jié)果顯示,在同一環(huán)境中,新的混合特征參數(shù)識(shí)別率與識(shí)別性能優(yōu)于傳統(tǒng)的特征參數(shù),且運(yùn)算量較少。

      說(shuō)話人識(shí)別 梅爾頻率濾波器 MidMel濾波器 MEL倒譜系數(shù)

      0 引 言

      說(shuō)話人識(shí)別是指根據(jù)說(shuō)話人所發(fā)出的語(yǔ)言信號(hào)來(lái)鑒定此人的真實(shí)身份或確定他所宣稱的身份與他的真實(shí)身份是否符合。怎樣確切的判別某個(gè)人的身份,并保護(hù)其信息安全已經(jīng)成為現(xiàn)今社會(huì)的一個(gè)焦點(diǎn)問(wèn)題。利用人的生理特征識(shí)別身份的技術(shù)利用其優(yōu)點(diǎn)可以在將來(lái)代替鑰匙、密碼等傳統(tǒng)技術(shù)。現(xiàn)今,可以通過(guò)計(jì)算機(jī)把語(yǔ)音信號(hào)建模,然后與說(shuō)話人的聲音進(jìn)行匹配,最后得到識(shí)別結(jié)果。因此,如何提高其識(shí)別率,怎樣提取更好的語(yǔ)音特征參數(shù)就成為了一個(gè)重要的課題[1]。

      當(dāng)前,常見(jiàn)的特征參數(shù)包括線性預(yù)測(cè)系數(shù)(LinearPrediction Cepstral Coefficent,LPCC)、梅爾倒譜系數(shù)(MelFrequency Cepstrum Coefficient,MFCC)[2]。最近,有學(xué)者提出了將各個(gè)說(shuō)話人特征參數(shù)組合來(lái)提高識(shí)別率的新方法,并有研究表明高頻部分含有大量表征說(shuō)話人個(gè)性的信息。用語(yǔ)音信號(hào)4 kHz~10 kHz的特征參數(shù)與0~4 kHz頻率范圍的特征參數(shù)做說(shuō)話人識(shí)別的結(jié)果可以達(dá)到一致,并且發(fā)現(xiàn)在500 Hz~2 kHz也包括說(shuō)話人的重要信息[3]。sandipan等[4]人

      對(duì)MFCC進(jìn)行了改進(jìn),對(duì)MFCC沒(méi)有側(cè)重的高頻部分用IMFCC(對(duì)MFCC濾波器進(jìn)行翻轉(zhuǎn)濾波)與MFCC結(jié)合得到新的混合特征參數(shù),在一定程度上提高了識(shí)別率;文獻(xiàn)[5]提出用fisher準(zhǔn)則來(lái)結(jié)合傅里葉分析和小波分析構(gòu)造出來(lái)的混合特征參數(shù);文獻(xiàn)[6]用MFCC于IMFCC結(jié)合提取出的混合特征參數(shù)再用fisher準(zhǔn)則擇優(yōu)降維,得到新的特征參數(shù)提高了識(shí)別率,但其并沒(méi)有考慮到中心頻率的重要性;文獻(xiàn)[7]采用MFCC、IMFCC、MID-MFCC結(jié)合的混合特征參數(shù),但其過(guò)程較復(fù)雜。

      本文首先計(jì)算MidMFCC參數(shù),然后再計(jì)算改進(jìn)的MEL濾波器。后者在低、高頻有較好的分辨率,再結(jié)合MidMFCC參數(shù),組成一種新的混合特征參數(shù)。

      1 語(yǔ)音特征參數(shù)提取

      1.1 Mel倒譜系數(shù)的提取

      梅爾倒譜系數(shù)(MFCC)采用Mel濾波器,它在低頻部分分辨率高而忽略了高頻部分,它把語(yǔ)音信號(hào)的線性頻譜轉(zhuǎn)化為Mel頻標(biāo)的非線性譜,再將其置換至倒譜域。兩種坐標(biāo)的變換關(guān)系如式(1)。

      提取MFCC參數(shù)的過(guò)程:

      1)把語(yǔ)音原始信號(hào)預(yù)處理加窗后變成短時(shí)信號(hào),然后用快速傅里葉變換(Fast Fourier Transform, FFT)把其變換為頻域信號(hào),并算出其短時(shí)能量譜。

      2)將短時(shí)能量譜用Mel濾波器進(jìn)行濾波,從而得到濾波系數(shù)。

      3)對(duì)得到的濾波系數(shù)根據(jù)式(2)進(jìn)行余弦變換,將信號(hào)映射到低維空間從而得到特征參數(shù)。

      式中,(m)表示MFCC第m維特征參S(n)表示濾波器系數(shù),M表示濾波器的階數(shù)。

      圖1 Mel尺度變換關(guān)系Fig.1 Mel scale variation relations

      圖2 Mel濾波器組分布Fig.2 Mel-filterbank distribution

      由圖2可以看出,濾波器在低頻上較密集,而在中、高頻上較稀疏,這樣就漏掉了很多有用的說(shuō)話人個(gè)性特征參數(shù)。因此,提高M(jìn)EL濾波器在中、高頻的分辨率,從而提高識(shí)別率。

      1.2 改進(jìn)的MFCC

      在MFCC特征參數(shù)中,側(cè)重說(shuō)話人低頻部分,對(duì)中、高頻計(jì)算精度教低,提取的特征參數(shù)不能更好的表征說(shuō)話人的語(yǔ)音特征。

      為了使提取出來(lái)的特征參數(shù)包含更多的說(shuō)話人個(gè)性特征和降低計(jì)算的難度,設(shè)計(jì)出改進(jìn)的Mel濾波器組,用以改進(jìn)其在中、高頻段特征參數(shù)計(jì)算精度,其模型如圖3所示。

      圖3 改進(jìn)的Mel濾波器組分布Fig.3 Modified Mel-frequency filter

      改進(jìn)的濾波器組在低于0~3 000 Hz的頻率范圍內(nèi)與Mel濾波器組是相同的;在3 000 Hz~4 000 Hz的頻率范圍,是基于反Mel刻度變換得到的。它是在Mel刻度變換的基礎(chǔ)上改進(jìn)提出來(lái)的,反Mel刻度的物理變換關(guān)系式如式(3)所示。

      反Mel濾波器的帶寬會(huì)根據(jù)頻率的增大而逐漸減小,所以在高頻部分分辨率較大,它的結(jié)構(gòu)特點(diǎn)與Mel濾波器剛好相反。

      圖4 IMFCC尺度變換曲線Fig.4 IMFCC scale variation curve

      因此,反Mel濾波器組提取出的特征參數(shù)能夠更好的表征高頻部分說(shuō)話人個(gè)性特征信息。反Mel變換關(guān)系如圖4所示。

      1.3 MidMFCC的提取

      在參數(shù)提取過(guò)程中,刻度的轉(zhuǎn)換關(guān)系主要體現(xiàn)在濾波器組的分布情況上,而由圖3可以看出,在改進(jìn)的MFCC參數(shù)中,濾波器主要集中在低頻和高頻的部分;而MidMFCC參數(shù),濾波器在中心頻率部分比較密集,而在低頻和高頻部分比較稀疏。MidMFCC的提取過(guò)程與MFCC的提取過(guò)程一致,MidMel刻度與Hz刻度的轉(zhuǎn)換關(guān)系如式(4)所示。

      MidMFcc變換關(guān)系如圖5所示。

      圖5 MidMel尺度變換曲線Fig.5 MidMel scale variation curve

      圖6 MidMel濾波器組分布Fig.6 MidMel-filterbank distribution

      用Mel濾波器組與反Mel濾波器組結(jié)合得到的特征參數(shù),再與MidMel濾波器組得到的特征參數(shù)結(jié)合,從而得到新的混合特征參數(shù)。它在低頻部分與Mel濾波器組的特點(diǎn)相同,在中頻部分與MidMel濾波器組特點(diǎn)相同,而在高頻部分具有反Mel濾波器組的特點(diǎn)。讓改進(jìn)的濾波器與Mel濾波器類似,并且符合人耳的聽(tīng)覺(jué)特性,在低、高頻同時(shí)具有較高的分辨率,其特征參數(shù)的維數(shù)不變,并且不會(huì)增加特征參數(shù)的提取時(shí)間。

      用改進(jìn)的Mel濾波器提取新的特征參數(shù)的步驟與MFCC特征參數(shù)的提取相同,只是把Mel濾波器換成改進(jìn)的Mel濾波器,然后與MidMel濾波器得到的特征參數(shù)結(jié)合得到新的特征參數(shù)。

      2 實(shí)驗(yàn)分析

      說(shuō)話人識(shí)別主要分為孤立詞說(shuō)話人識(shí)別、連接詞說(shuō)話人識(shí)別和連續(xù)說(shuō)話人識(shí)別。孤立詞說(shuō)話人識(shí)別中是把其中的詞語(yǔ)當(dāng)成一個(gè)整體來(lái)識(shí)別;連接詞說(shuō)話人識(shí)別一般是針對(duì)數(shù)字串進(jìn)行識(shí)別;而連續(xù)說(shuō)話人識(shí)別比較復(fù)雜,它針對(duì)說(shuō)話人日常生活中隨意所說(shuō)的話來(lái)進(jìn)行模式識(shí)別。本文主要從數(shù)字串的識(shí)別(連接詞語(yǔ)音識(shí)別)進(jìn)行判定,得到系統(tǒng)識(shí)別率,然后與傳統(tǒng)MFCC參數(shù)的識(shí)別率做對(duì)比。

      2.1 試驗(yàn)

      實(shí)驗(yàn)在MatlabR2010a環(huán)境下進(jìn)行,采用了8 KHz采樣率、16 bits量化,每幀32 ms(約256點(diǎn)),幀移16 ms,并利用漢明窗進(jìn)行短時(shí)分析,創(chuàng)建了從1~9的9個(gè)阿拉伯?dāng)?shù)字串的語(yǔ)音庫(kù),每個(gè)數(shù)字串用15個(gè)不同的人(11男4女),每人對(duì)9個(gè)數(shù)字串發(fā)音4遍并錄制,對(duì)錄制的樣本信息先采用雙門限端點(diǎn)檢測(cè)法,去掉冗余。選取其中360個(gè)作為測(cè)試樣本,其余的作為語(yǔ)音的訓(xùn)練樣本。其中一組使用12階Mel濾波器組得到MFCC特征參數(shù);另外一組使用改進(jìn)的Mel濾波器得到改進(jìn)的MFCC參數(shù)和MidMFCC參數(shù)結(jié)合的混合參數(shù)。這樣得到的混合特征參數(shù)就平均包含了整個(gè)說(shuō)話人語(yǔ)音頻域,增加了低、中、高頻段倒譜系數(shù)的計(jì)算精度。然后分別對(duì)測(cè)試樣本中的數(shù)據(jù)提取的MFCC系數(shù)序列矩陣和混合特征系數(shù)序列矩陣,按照?qǐng)D7的流程步驟實(shí)現(xiàn)說(shuō)話人識(shí)別系統(tǒng),其中改進(jìn)的過(guò)程只在特征參數(shù)提取上有所不同。

      圖7 總流程Fig.7 Total flow chart

      本文采用基于VQ[8]的說(shuō)話人識(shí)別系統(tǒng)對(duì)兩種系數(shù)矩陣進(jìn)行訓(xùn)練,分析結(jié)果。實(shí)驗(yàn)采用5交叉驗(yàn)證(5 Cross-validation)的方法進(jìn)行評(píng)判得到最后的識(shí)別率,即把5次得到的整體結(jié)果進(jìn)行計(jì)算得到最后的識(shí)別結(jié)果,每一次的模型總數(shù)為20個(gè),以識(shí)別正確或錯(cuò)誤來(lái)表征識(shí)別率,其識(shí)別率如表1所示。

      表1 不同特征參數(shù)的識(shí)別結(jié)果Table1 Identification results of different characteristic parameters

      從表2的結(jié)果可以看出,對(duì)于相同的說(shuō)話人語(yǔ)音樣本,在相同的環(huán)境下改進(jìn)后的MFCC混合特征參數(shù)比傳統(tǒng)的MFCC特征參數(shù)最后的識(shí)別率得到了提高。

      表2 不同特征參數(shù)的識(shí)別率Table 2 Identification rate of different characteristic parameters

      在試驗(yàn)中還發(fā)現(xiàn),用MFCC提取特征參數(shù)識(shí)別女性的誤識(shí)個(gè)數(shù)多,這是因?yàn)榕缘穆曇纛l率比男性的高,而Mel濾波器則是在低頻部分精度高,忽略了高頻部分的說(shuō)話人特征參數(shù)。而改進(jìn)后得到的參數(shù)卻彌補(bǔ)了這一不足,更好的提高了計(jì)算精度。

      3 結(jié) 語(yǔ)

      本文針對(duì)MFCC特征參數(shù)在說(shuō)話人語(yǔ)音信號(hào)的低頻部分有良好的計(jì)算精度,而忽略了中、高頻說(shuō)話人語(yǔ)音信號(hào)的計(jì)算精度。提出了采用MidMFCC與改進(jìn)的Mel濾波器相結(jié)合的算法。實(shí)驗(yàn)結(jié)果表明,在相同環(huán)境下,改進(jìn)的算法與經(jīng)典的算法相比較識(shí)別率有了一定程度的提高。下一步的工作,將繼續(xù)優(yōu)化改進(jìn)算法,對(duì)提取出的特征參數(shù)進(jìn)行擇優(yōu)選擇,提高識(shí)別的速度和效率。

      [1] 張曉俊,陶智,吳迪,肖仲喆,趙鶴鳴.采用多特征組合優(yōu)化的語(yǔ)音特征參數(shù)研究[J].通信技術(shù),2012,45 (12):98-101.

      ZHANG Xiao-jun,TAO Zhi,WU Di,XIAO Zhong-zhe, ZHAO He-ming.Study of Speech Chara-cteristic Parameters by Optimized Multifeature Combination[J].Communications Technology,2012,45(12):98-101.

      [2] DAVIS S B,MERMELSTEIN P.Comparison ofparametric repre-sentations for monosy-llabic word recognition in continuously spoken sentences[J].IEEE Transactins on Acoustics,Speech and Signal Process-ing,1980,28 (04):357-365.

      [3] 項(xiàng)要杰,楊俊安,李晉徽,陸俊.一種適用于說(shuō)話人識(shí)別的改進(jìn)Mel濾波器[J].計(jì)算機(jī)工程,2013(11):214 -218.

      XIANG Yao-jie,YANG Jun-an,LI Jin-hui,LUJun.An Improved Mel-Frequency Filter fo-r Speaker Recognition [J].Computer Engin-eering,2013(11):214-218.

      [4] SANDIPAN C,ANINDYAR,SOURAV M.Captur-ing complementaly information via reve-rsed filter bank and parallel implement-ation with MFCC for improved text-indep-endent speaker identification[C]//Proc-eedings of the 2007 International Confe-rence on Computing:Theory and Applicati-on.Piscataway:IEEE,2007:463-467.

      [5] 汪崢,連翰,王建軍.說(shuō)話人識(shí)別中特征參數(shù)提取的一種新方法[J].復(fù)旦學(xué)報(bào)(自然科學(xué)版),2005,44 (01):197-200.

      WANG Zheng,LIAN Han,WANG Jian-jun.App-lication of a New Mixed Feature in Spea-ker Identification [J].Journal of Fudan University(Natural Science), 2005,44(01):197-200.

      [6] 胡峰松,張璇.基于梅爾頻率倒譜系數(shù)與翻轉(zhuǎn)梅爾頻率倒譜系數(shù)的說(shuō)話人識(shí)別方法[J].計(jì)算機(jī)應(yīng)用, 2012,32(09):2542-2545.

      HU Feng-song,ZHANG Xuan.Speaker Recognition Method based on Mel-Frequency Cepstrum Coefficient and Inverted Mel-Frequency Cepstrum Coefficient[J].Journal of-Computer Applications,2012,32(9):2542-2544.

      [7] 鮮曉東,樊宇星.基于Fisher比的梅爾倒譜系數(shù)混合特征提取方法[J].計(jì)算機(jī)應(yīng)用,2014,34(02):558-561.

      XIAN Xiao-dong,FAN Yu-xing.Parameter Extraction Method for Mel-Frequency Cep-stralCoefficients based on Fisher Criterion[J].Journal of Computer Applications, 2014,34(2):558-561.

      [8] YANG Hai-Yan,JING Xin-Xing.Perfor-mance Test of Parameters for Speaker Recognition System based on SVM -VQ[C]//2012 International Conference on Machine Learning and Cybernetic-s(ICMLC),Xian:IEEE,2012: 321-325.

      黃 銳(1990—),男,碩士,主要研究方向?yàn)檎Z(yǔ)音識(shí)別;

      HUANG Rui(1990-),male,M.Sci.,majoring in voice recognition.

      陸安江(1978—),男,博士研究生,講師,主要研究方向?yàn)閭鞲衅骷夹g(shù);

      LU An-jiang(1978-),male,doctoral postgraduate,majoring in sensor technology.

      張正平(1964—),男,博士生導(dǎo)師,教授,主要研究方向?yàn)橥ㄐ判录夹g(shù)。

      ZHANG Zheng-ping(1978-),male,doctoral tutor,majoring in the new technology of communication.

      A M odified M ixture Feature Param eter Extraction
      M ethod of M el-Frequency Filter

      HUANG Rui,LU An-jiang,ZHANG Zheng-ping
      (School of Big Data and Information Engineering,Guizhou University,Guiyang Guizhou 550025,China)

      The nonuniform distribution ofmel-filterbank structure in speaker recognition,that is,too intensive in low frequency region while too sparse in high frequency andmid-frequency region,would affect the extraction of MFCC in mid-frequency and high frequency.In light of this,the paper proposes amethod to extract the twomixed feature parameters by combining Mel-filterbank and MidMel-filterbank,thismethod applicable to speaker recognition system could improve the accuracy ofmedium and high frequency feature parameters extraction and thus upgrade the system recognition rate.Experimental results indicate that the recognition rate and recognition performance of the novelmixed parameters is superior to that of traditional characteristic parameters,and moreover,with less computational complexity.

      speaker recognition;Mel-filterbank;MidMel-filterbank;Mel-frequency Cepstral Coefficient(MFCC)

      TN912.34

      A

      1002-0802(2014)12-1388-04

      10.3969/j.issn.1002-0802.2014.12.009

      2014-09-22;

      2014-10-22 Received date:2014-09-22;Revised date:2014-10-22

      貴州省社發(fā)攻關(guān)項(xiàng)目(黔科合SY字[2013]3105號(hào))

      Foundation Item:The Social Development Project in Guizhou Province(Guizhou Province SY[2013]3105)

      猜你喜歡
      計(jì)算精度特征參數(shù)識(shí)別率
      故障診斷中信號(hào)特征參數(shù)擇取方法
      基于特征參數(shù)化的木工CAD/CAM系統(tǒng)
      基于類圖像處理與向量化的大數(shù)據(jù)腳本攻擊智能檢測(cè)
      基于真耳分析的助聽(tīng)器配戴者言語(yǔ)可懂度指數(shù)與言語(yǔ)識(shí)別率的關(guān)系
      提升高速公路MTC二次抓拍車牌識(shí)別率方案研究
      基于SHIPFLOW軟件的某集裝箱船的阻力計(jì)算分析
      廣東造船(2018年1期)2018-03-19 15:50:50
      基于PSO-VMD的齒輪特征參數(shù)提取方法研究
      高速公路機(jī)電日常維護(hù)中車牌識(shí)別率分析系統(tǒng)的應(yīng)用
      統(tǒng)計(jì)特征參數(shù)及多分類SVM的局部放電類型識(shí)別
      單元類型和尺寸對(duì)拱壩壩體應(yīng)力和計(jì)算精度的影響
      满洲里市| 富裕县| 临夏市| 安乡县| 炉霍县| 博乐市| 宁化县| 许昌县| 中山市| 合山市| 济南市| 朝阳市| 宝鸡市| 当雄县| 安多县| 新绛县| 虹口区| 青州市| 驻马店市| 定安县| 青阳县| 渑池县| 兰西县| 长治县| 苍梧县| 杨浦区| 斗六市| 泰兴市| 佛山市| 宜黄县| 卢湾区| 永修县| 秭归县| 博野县| 睢宁县| 大悟县| 滦平县| 通许县| 鸡泽县| 谢通门县| 陈巴尔虎旗|