周春榮
摘要:語音識別技術是人機實現(xiàn)互動的主要方式之一,本文對該技術進行探究。文章首先概述了語音識別技術的原理及方法;其次分析了語音識別技術在機器人控制中的設計與實踐,包括系統(tǒng)總體結構、系統(tǒng)各個功能模塊、機器人語音控制流程三大模塊以及具體的實踐分析;最后對提取特征參數(shù)以及語音識別算法進行改進,對改進后的機器人運動情況進行測試,并提出筆者的思考。
關鍵詞:語音識別技術;機器人控制;改進措施;應用實踐
中圖分類號:TN912. 3 文獻標識碼:A 文章編號:1007-9416(2018)01-0001-02
語音識別、自然語言理解以及語音合成是人機交互的三種主要方式,為充分發(fā)揮計算機的作用,多數(shù)學者對人機交互的技術進行了深入的探究,并提出較多的技術措施,本文重點從語音識別角度對人機交互進行探究,在利用現(xiàn)有的技術進行設計實踐之后,分析了其中可改進的部分,并對改進后的技術進行了實踐,以期為其他相關研究人員提供一定的參考。
1 語音識別技術的原理及方法
1.1 語音識別技術的基本原理
語音識別技術出現(xiàn)的時間雖然相對較短,但是多為學者對此進行了深入的研究,并且提出了多種設計方案,雖然方案各有不同,但是其原理基本一致,即通過一個模式識別系統(tǒng)使語音轉換為計算機可以識別的數(shù)據(jù)。該模式主要包括三個基本單元,即特征提取、模式匹配以及參考模式庫,其中語音信號預處理階段主要是對原始語音的端點檢測、語音分幀等,從而為后續(xù)的設計提供參數(shù)依據(jù);特征提取階段主要是對能夠反映語音信號特征的關鍵參數(shù)進行提取;通過參考模型庫中的樣本語音等對相似度進行度量,最后進行識別。
1.2 語音識別的基本方法
當前語音識別的基本方法主要有四種,分別是隱馬爾可夫模型、矢量量化技術、動態(tài)時間規(guī)整技術以及人工神經網絡。其中隱馬爾可夫模型主要是通過對語音特征分布的概率進行統(tǒng)計得出語音信號的時變序列,進行語音識別;矢量量化技術主要是通過對數(shù)據(jù)壓縮,將語音信號波形矢量化,對每一幀進行分析,最后進行語音識別;動態(tài)時間規(guī)整技術主要是通過將原始語音樣本語音進行時間規(guī)整,進行語音識別;人工神經網絡則是依據(jù)生物神經網絡的特征所構建的一種算法模型,通過學習和存貯大量的輸入-輸出模式映射關系來實現(xiàn)語音的識別。
2 語音識別技術在機器人控制中的設計與實踐
2.1 系統(tǒng)總體結構設計
語音識別技術在機器人控制中應用,主要是通過語音輸入設備輸入語音,再通過相應的軟件、程序等使計算機分辨出人類語音的內容,實現(xiàn)人與計算機之間的交互。故而語音識別系統(tǒng)的總體結構設計應包括語音控制端以及機器人運動控制端,具體的結構設計如圖1所示。
2.2 系統(tǒng)各個功能模塊的設計
機器人語音識別系統(tǒng)各個功能模塊直接影響著系統(tǒng)運行的質量,具體來說,該系統(tǒng)主要包括七大模塊,分別是運動輸出模塊、圖像采集系統(tǒng)模塊、運用控制模塊、機器人主控系統(tǒng)模塊、語音識別模塊、語音輸入模塊以及端口程序模塊。
該系統(tǒng)的協(xié)作主要通過初始化模型、請求/應答模式、命令模式以及時間模式實現(xiàn)。其中命令模式主要是完成啟動或者停止語音識別的命令,事件模式則是依據(jù)客觀實際情況自動停止語音識別活動,且顯示識別結果。
2.3 機器人語音控制流程設計
機器人語音識別系統(tǒng)中機器人語音控制是最為重要的部分,設計情況直接影響著整個系統(tǒng)的運行,也影響著系統(tǒng)的功能的完成情況。具體來說,計算機控制系統(tǒng)的功能主要包括三大部分,分別是語音識別、機器人的運動控制以及各項數(shù)據(jù)流管理,依據(jù)以上功能,設定機器人語音控制流程。
2.4 機器人運動情況測試與分析
在系統(tǒng)構建完成之后進行測試,分別在安靜環(huán)境以及嘈雜環(huán)境中進行,分別的測試數(shù)據(jù)如表1與表2所示。
由上可以看出,在固有技術上進行的測試,嘈雜環(huán)境中識別率較低,故而需進行完善。
3 提取特征參數(shù)以及語音識別算法的改進及實踐
經過分析,筆者改進了LPC譜估計共振峰參數(shù)構造了新的語音特征參數(shù),并且選用了TSMS算法以及DTW高效算法,并依據(jù)以上的模型進行重新架構,流程不變,最后構成的計算機語音識別系統(tǒng)在安靜環(huán)境中以及嘈雜環(huán)境中的識別效果如表3與表4所示。
由上可知,改進之后語音識別系統(tǒng)在嘈雜環(huán)境中的識別效率也有提升,可以看出計算機語音識別系統(tǒng)仍有較大的提升空間。
4 結語
本文是對語音識別技術在機器人控制中應用的探究,文章在概述了語音識別技術的相關理論之后針對改進前后的語音識別技術進行了實踐,并提出自己的思考,以期為其他研究人員提供一定的參考,同時拋磚引玉,希望有更多的學者參與其中進行探究,以優(yōu)化語音識別技術,從而促進人機的進一步交互。
參考文獻
[1]張鳳美.基于語音識別的移動機器人遠程控制系統(tǒng)研究[D].武漢科技大學,2013.
[2]劉旸.面向機器人對話的語音識別關鍵技術的研究[D].西安電子科技大學,2016.