汪海彬 余正濤 毛存禮 郭劍毅
摘 要:目的的介紹有點散,請?zhí)釤捯幌氯绾蚊枋龈‘敚恳话愕膶懛ㄊ轻槍?..中存在的...問題,提出...方法針對說話人識別系統(tǒng)中存在的有效語音特征提取以及噪聲影響的問題,提出了一種新的語音特征提取方法——基于S變換的美爾倒譜系數(shù)(SMFCC)。該方法是在傳統(tǒng)美爾倒譜系數(shù)(MFCC)的基礎上利用S變換的二維時頻多分辨率特性,以及奇異值分解(SVD)方法的二維時頻矩陣有效去噪性,并結合相關統(tǒng)計分析方法最終獲得語音特征。采用TIMIT語音數(shù)據(jù)庫,將所提的特征和現(xiàn)有特征進行對比實驗。 SMFCC特征的等錯誤率(EER)和最小檢測代價(MinDCF)均小于線性預測倒譜系數(shù)(LPCC)、MFCC及其結合方法LMFCC,比MFCC的EER和MinDCF08分別下降了3.6%與17.9%。實驗結果表明所提方法能夠有效去除語音信號中的噪聲,提升局部分辨率。
關鍵詞:S變換;奇異值分解;基于S變換的美爾倒譜系數(shù);高斯混合模型通用背景模型;說話人識別
中圖分類號: TN912.34補充中圖分類號及其對應英文 文獻標志碼:A英文標題