• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      說話人識別特征參數(shù)MFCC的提取與分析

      2016-12-26 21:41周春暉盧榮潘姿蓉
      電子技術(shù)與軟件工程 2016年22期
      關(guān)鍵詞:特征參數(shù)

      周春暉++盧榮++潘姿蓉

      摘 要

      提取特征參數(shù)在說話人識別系統(tǒng)內(nèi)是非常重要的步驟,說話人語音的很多特有個性信息包含于特征參數(shù)內(nèi),例如發(fā)聲特征或者語義特征,利用特征提取的方法一方面可以去掉聲音里沒用的冗余信息,剩下有用的體現(xiàn)說話人個性不同的特征信息,特別是可以有效減少計算量、模板數(shù)目以及存儲空間。選用的特征參數(shù)的會直接關(guān)系到整個系統(tǒng)的工作性能,良好的特征參數(shù)需要擁有好的穩(wěn)定性和好的獨(dú)立性,一方面可以不受到外界情況的干擾,不容易為其他的聲音所替代,另一方面,能夠較好的辨別不同說話人,說明說話人之間的差異。

      【關(guān)鍵詞】特征參數(shù) 倒譜系數(shù) LPCC MFCC

      1 前言

      當(dāng)今說話人識別領(lǐng)域使用的特征參數(shù)有多種,它們各具特點(diǎn),能夠用于各種不一樣的場合,其中應(yīng)用較為廣泛的具有代表性的特征參數(shù)是:基音頻率、線性預(yù)測系數(shù)(LPC)、線性預(yù)測倒譜系數(shù)(LPCC)、梅爾倒譜系數(shù)(MFCC)。

      2 MFCC的提取與分析

      梅爾倒譜系數(shù)(MFCC),MFCC是利用人耳聽覺模型建立的倒譜系數(shù),人類的聽覺系統(tǒng)可以看成一個非線性系統(tǒng),它對于不同的頻率信號的靈敏度是不一樣的,一般是對數(shù)型關(guān)系。正是由于Mel倒譜系數(shù)基于人耳感知這種特殊的特性,Mel倒譜系數(shù)在抗噪聲能力以及魯棒性這些方面都比其它特征參數(shù)要優(yōu)秀了很多。

      對于不一樣頻率的語音,人耳有不一樣的感知能力,聲音的物理頻率表示單位是梅爾(Mel)。頻率和MFCC系數(shù)的關(guān)系如下式:

      其中,f的單位為Hz。參照Zvick的研究所說,臨界帶寬按照頻率不同而改變,在1000Hz以下時,維持線性分布,帶寬在100Hz附近;在1000Hz以上時,表現(xiàn)為對數(shù)增長形式,如圖1所示。

      Mel參數(shù)的提取過程:

      (1)把之前預(yù)處理過的語音信號,即時域信號做傅里葉變化(DFT)。計算得到線性頻譜x(k),其轉(zhuǎn)換公式為:

      (2)把上面的頻譜x(k)通過Mel濾波器組生成Mel頻譜。

      (3)接著對Mel頻譜做對數(shù)能量處理,得到對數(shù)頻譜S(m)。圖2所列即為得到的線性能量譜,Mel能量譜和對數(shù)能量譜。

      上述第2步驟中提及的Mel頻率濾波器組是在語音的頻譜范圍內(nèi)設(shè)置的若干個帶通濾波器表示濾波器的個數(shù)。f(m)表示濾波器組中的每個濾波器的中心頻率,其傳遞函數(shù)如下所示:

      式中Fs表示采樣頻率,N表示窗寬,f1、fh分別代表濾波器的頻率應(yīng)用范圍的最低頻率和最高頻率,N表示窗寬,,為促進(jìn)結(jié)果對噪聲和譜估計的誤差有更佳的魯棒性,把上面通過Mel濾波器組獲取到的Mel頻譜取對數(shù)。因此經(jīng)過線性頻譜X(k)到對數(shù)頻譜,S(m)的總傳遞函數(shù)是:

      最后,將S(m)通過離散余弦變換(DCT)獲得倒譜頻域,即Mel頻譜倒譜系數(shù)(MFCC參數(shù)):

      參考文獻(xiàn)

      [1]M.Chetouani,M.Faundez-Zanuy,B.Gas,and JL.Zarader.Investigation onLP-residual representation for speaker identification,Pattern Recognition.2009,3(42):487-494.

      [2]林琳,王樹勛,郭剛.短語音說話人識別新方法的研究.系統(tǒng)仿真學(xué)報, 2007,19(10):2272-2275.

      [3]姚志強(qiáng).說話人識別中提高GMM性能方法的研究[D].北京:中國科技大學(xué),2006:9-12.

      作者簡介

      周春暉,男,浙江省人。碩士研究生學(xué)歷?,F(xiàn)為廣東科技學(xué)院講師。

      作者單位

      廣東科技學(xué)院 廣東省東莞市 523083

      猜你喜歡
      特征參數(shù)
      邊界條件含有特征參數(shù)的四階微分算子的自伴性和特征值的依賴性
      R290空調(diào)器制冷劑泄漏判斷特征參數(shù)選取與分析
      故障診斷中信號特征參數(shù)擇取方法
      基于特征參數(shù)化的木工CAD/CAM系統(tǒng)
      冕洞特征參數(shù)與地磁暴強(qiáng)度及發(fā)生時間統(tǒng)計
      融合LPCC和MFCC的支持向量機(jī)OSAHS鼾聲識別
      基于交通特征參數(shù)預(yù)測的高速公路新型車檢器布設(shè)方案研究
      基于PSO-VMD的齒輪特征參數(shù)提取方法研究
      基于視頻的車輛特征參數(shù)算法研究
      基于數(shù)字圖像處理的粗集料二維形態(tài)特征參數(shù)分析
      临洮县| 万州区| 固镇县| 七台河市| 蓬溪县| 交口县| 于田县| 武安市| 汉川市| 金山区| 广河县| 罗山县| 赤城县| 恩施市| 临潭县| 天峻县| 罗城| 邵武市| 和田市| 松溪县| 乌兰浩特市| 河西区| 绥德县| 吉隆县| 临澧县| 安溪县| 将乐县| 陆良县| 屏南县| 花莲市| 子长县| 常熟市| 衡南县| 左云县| 南昌县| 剑川县| 太康县| 雷波县| 青州市| 张掖市| 枣庄市|