鄭碧君++劉濤
摘 要: 針對英文語音發(fā)音標準化評價準確性不高的問題,提出一種基于發(fā)音特征倒譜系數(shù)感知的英文語音發(fā)音標準化的模式識別對比方法。首先構建英文語音發(fā)音的語音信號采集模型,對采集的英文語音信號進行發(fā)音器官的動作屬性配對描述。然后提取英文語音發(fā)音信號的倒譜特性,采用梅爾頻率倒譜系數(shù)感知方法進行英文語音發(fā)音特征建模和發(fā)音位置及方式的模式識別,為語音發(fā)音提供標準化對比模式。最后進行實驗分析,測試結果表明,采用該方法進行英文語音發(fā)音特征檢測和模式識別的準確度較高,對發(fā)音特征的聲學建模有效可靠。
關鍵詞: 英文發(fā)音; 語音信號; 模式識別; 發(fā)音標準化評價
中圖分類號: TN911?34; TP391.42 文獻標識碼: A 文章編號: 1004?373X(2017)12?0028?03
Abstract: Aiming at the problem that the evaluation accuracy of English pronunciation standardization is not high, a pattern recognition and contrast method for English pronunciation standardization based on the perceptual standard of pronunciation characteristic cepstral coefficient is proposed in this paper. Speech signal acquisition model of English voice pronunciation is built to pair and describe action attributes of pronunciation organ for the acquired English voice signal first, and then extract the cepstrum characteristics of English speech signal. The sensing method of Mel frequency cepstral coefficients is used to carry out English speech pronunciation feature modeling, and recognize the pattern of pronunciation position and mode, so as to provide a standardized comparison mode for voice pronunciation. The experimental analysis and the test results show that the proposed method is effective and reliable for the acoustic modeling of the pronunciation features, and has the high accuracy for the feature detection and pattern recognition of English speech pronunciation.
Keywords: English pronunciation; speech signal; pattern recognition; pronunciation standardization evaluation
在進行英文發(fā)音的學習和訓練中,目前主流的方法是采用語音識別系統(tǒng)進行發(fā)音的標準化糾正和對比。通過提取英文發(fā)音過程中的發(fā)音器官的動作特征和語音信號,對比發(fā)音器官的動作屬性,對不同的說話人進行差異性特征匹配,分析發(fā)音器官隨著對不同英文發(fā)音類別的變化動作特征,分析送氣音、清音、鼻音等各種英文語義發(fā)音標準化模式,構建語音發(fā)音標準化的模式識別系統(tǒng)。對語音信號頻譜分析,提高英文語音發(fā)音的標準性。研究英文語音發(fā)音標準化的模式識別對比方法在改善英文教學和培訓質量方面具有重要意義。對英文語音發(fā)音的語音識別分析方法典型的有高階譜分析方法[1?2]、梅爾頻率倒譜分析方法[3]、模糊識別方法和專家系統(tǒng)識別方法[4?6],通過提取語音信號的譜特征,實現(xiàn)模式識別,提高英文語音發(fā)音的標準化水平。
1 英文語音發(fā)音標準化模式識別對比實現(xiàn)
2 實驗測試分析
實驗中以金山詞霸的2013版本Shake英文語音發(fā)音數(shù)據(jù)集為標準發(fā)音訓練樣本,選擇10位不同性別和不同年齡段的測試對象進行英文語音發(fā)音的模式識別和信號分析,采集各個測試對象的英文語音發(fā)音作為測試集,得到標準英文語音發(fā)音訓練集信號和測試集信號如圖2所示。
以上述語音信號為研究對象,提取英文語音發(fā)音信號的倒譜,采用梅爾頻率倒譜系數(shù)感知方法進行英文語音發(fā)音特征建模和發(fā)音位置及方式的模式識別和配對,得到結果如圖3所示。
從圖3可見,采用本文方法進行英文語音發(fā)音信號的倒譜特征提取,能有效反應語音信號的特征信息量,通過語音信號與發(fā)音器官的動作屬性配對處理,進行發(fā)音動作糾正。表1給出了不同的模式識別類型進行英文發(fā)音標準化識別對比的糾正結果,分別以替代錯誤率(Sub)、發(fā)音器官錯誤率(Org)、聲源錯誤率(Source)和統(tǒng)計平均錯誤率(Err)為評價指標,從表1結果可見,采用本文方法進行英文語音發(fā)音的標準化模式識別對比,能有效降低語音發(fā)音的錯誤率,說明利用該方法進行英文語音發(fā)音特征檢測和模式識別的準確度較高。
3 結 語
本文研究了英文語音發(fā)音的標準化模式識別和對比方法構建問題,提出一種基于發(fā)音特征倒譜系數(shù)感知的英文語音發(fā)音標準化的模式識別對比方法。首先構建英文語音發(fā)音的語音信號采集模型,對采集的英文語音信號進行發(fā)音器官的動作屬性配對描述,提取英文語音發(fā)音信號的倒譜特性,采用梅爾頻率倒譜系數(shù)感知方法進行英文語音發(fā)音特征建模和發(fā)音位置及方式的模式識別,為語音發(fā)音提供標準化對比模式。實驗結果表明,采用本文方法進行英文語音發(fā)音特征檢測和模式識別的準確度較高,對發(fā)音特征的聲學建模有效可靠,在指導英文發(fā)音學習和矯正中具有重要的實踐價值。
參考文獻
[1] 田莎莎,唐菀,佘緯.改進MFCC參數(shù)在非特定人語音識別中的研究[J].科技通報,2013,29(3):139?142.
[2] BOUDIA O R M, SENOUCI S M, FEHAM M. A novel secure aggregation scheme for wireless sensor networks using stateful public key cryptography [J]. Ad hoc networks, 2015, 32(C): 98?113.
[3] CHEN S, WANG G, JIA W. Cluster?group based trusted computing for mobile social networks using implicit social behavioral graph [J]. Future generation computer systems, 2016, 55: 391?400.
[4] CHANG Y L, LIN T L. Network?based H.264/AVC whole frame loss visibility model and frame dropping methods [J]. IEEE transactions on image processing, 2012, 21(8): 3353?3363.
[5] DU Qinsheng, JIANG Baohua. Design and implementation of the embedded based Web camera system [J]. Journal of software, 2012, 7(11), 2560?2566.
[6] 閆峰.基于小波變換語音信號去噪及DSP算法實現(xiàn)[D].哈爾濱:哈爾濱工業(yè)大學,2008.
[7] 李晶皎,安冬,王驕.基于EEMD和ICA的語音去噪算法[J].東北大學學報(自然科學版),2011,32(11):1554?1557.
[8] 李優(yōu),林煜明,黃德根.模擬語音信號的加噪去噪實驗研究[J].儀器儀表學報,2006,27(6):993?994.
[9] 張婷,何凌,黃華,等.基于臨界頻帶及能量熵的語音端點檢測[J].計算機應用,2013,33(1):175?178.