• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      語(yǔ)音機(jī)器人隱馬爾可夫算法探究

      2018-07-12 13:23:42黃哲彬
      現(xiàn)代信息科技 2018年4期

      摘 要:一直以來(lái),人們?cè)谔剿饕环N人與機(jī)器交流的方法。隨著科學(xué)技術(shù)的飛速發(fā)展,語(yǔ)音機(jī)器人的出現(xiàn),實(shí)現(xiàn)了真正意義上的人機(jī)交流。隱馬爾可夫模型(HMM)作為非特定語(yǔ)音識(shí)別系統(tǒng)的主流技術(shù)在語(yǔ)音機(jī)器人系統(tǒng)中被廣泛地使用。傳統(tǒng)的隱馬爾可夫模型由于初始化方法過(guò)于簡(jiǎn)單,精度和速度都達(dá)不到預(yù)期結(jié)果。實(shí)驗(yàn)證明,改進(jìn)語(yǔ)音特征參數(shù)相鄰幀相關(guān)性的隱馬爾可夫模型初始化算法能有效地解決這一問(wèn)題。

      關(guān)鍵詞:非特定人語(yǔ)音識(shí)別;隱馬爾可夫模型;初始化算法

      中圖分類(lèi)號(hào):TN912.34 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):2096-4706(2018)04-0095-03

      Abstract:All along,people are exploring a way of communication between people and machines. With the rapid development of science and technology,the emergence of the voice robot has realized the real sense of man machine communication. Hidden Markov Model(HMM)is widely used in speech robot system as the mainstream technology of non specific speech recognition system. Because the initialization method is too simple for the traditional HMM,the accuracy and speed are not as good as expected. Experiments show that the HMM initialization algorithm with improved speech feature parameters and adjacent frames can effectively solve this problem.

      Keywords:speaker independent speech recognition;hidden Markov model;initialization algorithm

      0 引 言

      語(yǔ)言是人類(lèi)獨(dú)特的標(biāo)志,是人類(lèi)進(jìn)行信息交互的重要媒介。人們嘗試用人類(lèi)語(yǔ)言與機(jī)器人進(jìn)行交流,讓機(jī)器人聽(tīng)懂語(yǔ)音并完成相關(guān)指令,從而實(shí)現(xiàn)人機(jī)交流的功能。我們認(rèn)為這種機(jī)器人有“人工耳朵”,這種“人工耳朵”就是語(yǔ)音識(shí)別技術(shù)的應(yīng)用。語(yǔ)音識(shí)別技術(shù)是語(yǔ)音機(jī)器人將語(yǔ)音轉(zhuǎn)換成計(jì)算機(jī)可讀文本或命令,進(jìn)行模式識(shí)別的過(guò)程。根據(jù)不同的識(shí)別對(duì)象,語(yǔ)音識(shí)別可分為兩類(lèi)。

      (1)特定發(fā)音人語(yǔ)音識(shí)別(Speaker Dependent):指語(yǔ)音數(shù)據(jù)庫(kù)由單人提供,只識(shí)別訓(xùn)練人的語(yǔ)音命令,其他人的語(yǔ)音幾乎無(wú)法識(shí)別;

      (2)非特定發(fā)音人語(yǔ)音識(shí)別(Speaker Independent):指語(yǔ)音數(shù)據(jù)庫(kù)由多人提供,根據(jù)不同人的語(yǔ)音特點(diǎn)進(jìn)行訓(xùn)練,能識(shí)別不同人的語(yǔ)音命令。

      人類(lèi)言語(yǔ)過(guò)程是一個(gè)雙重隨機(jī)的過(guò)程,由可觀測(cè)序列和隱含狀態(tài)組成。語(yǔ)音信號(hào)是一個(gè)可觀測(cè)序列,大腦語(yǔ)音中樞產(chǎn)生發(fā)音參數(shù)流屬于隱含狀態(tài)。HMM模型很好地描述了這一過(guò)程,將語(yǔ)音信號(hào)頻譜特征的整體非平穩(wěn)性和局部穩(wěn)定性通過(guò)模型表示出來(lái)。

      1 HMM模型在語(yǔ)音識(shí)別系統(tǒng)中的應(yīng)用

      1.1 HMM模型基本原理

      我們研究發(fā)現(xiàn),語(yǔ)音的前后兩個(gè)發(fā)音音素之間存在某種特殊關(guān)聯(lián)。我們可以根據(jù)人類(lèi)語(yǔ)言學(xué)的特點(diǎn)推測(cè)后一個(gè)音素發(fā)生的最大可能。在極短時(shí)間內(nèi),語(yǔ)音信號(hào)趨于穩(wěn)定狀態(tài),由于某種可預(yù)測(cè)關(guān)聯(lián)的存在,可用一個(gè)全極點(diǎn)模型描述這段語(yǔ)音,我們稱(chēng)之為“線性可預(yù)測(cè)模型”。將這些線性模型串接起來(lái)就是“馬爾可夫鏈”??深A(yù)測(cè)關(guān)聯(lián)是語(yǔ)音識(shí)別模型雙狀態(tài)鏈中的隱含狀態(tài),這種具有隱含性的馬爾可夫雙鏈模型就是“隱馬爾可夫模型”。

      1.2 隱馬爾可夫模型的基本算法

      隱馬爾可夫模型是一種推測(cè)隱含狀態(tài)鏈、轉(zhuǎn)換概率和結(jié)果概率的統(tǒng)計(jì)模型。

      1.2.1 概率P(O|λ)計(jì)算

      這是解決輸出概率的計(jì)算問(wèn)題的方法。由已知隱含狀態(tài)和轉(zhuǎn)換概率,根據(jù)可見(jiàn)狀態(tài)鏈,計(jì)算結(jié)果概率。

      1.2.2 Viterbi識(shí)別算法

      這是解決狀態(tài)序列的解碼問(wèn)題的算法。在給定觀察序列Ot和模型算法λ時(shí),確定一個(gè)最佳序列q*。我們定義δ(t)為不同t時(shí)刻不同路徑產(chǎn)生觀察序列的最大概率:

      1.2.3 Baum-Welch算法

      這是解決模型參數(shù)估計(jì)問(wèn)題的算法。利用遞歸思想,讓P(O|λ)達(dá)到最大,確定模型參數(shù)λ={A,B,π}。我們用εt(i,j)表示Markov鏈在已知O和λ時(shí),t時(shí)狀態(tài)為i和t+1時(shí)狀態(tài)為j的概率。

      1.3 HMM模型的實(shí)現(xiàn)

      設(shè)定識(shí)別基元是HMM模型最基本的工作,識(shí)別基元的全部集合組成樣本數(shù)據(jù)庫(kù)。以漢語(yǔ)為例,識(shí)別基元可為音節(jié)、聲韻母、音素等。我們對(duì)三種不同的識(shí)別基元進(jìn)行了實(shí)用性探究。如表1所示。

      一般選取音素作為識(shí)別基元,用HMM訓(xùn)練算法對(duì)每個(gè)詞匯進(jìn)行樣本多次訓(xùn)練,結(jié)合語(yǔ)言學(xué)中的語(yǔ)境、語(yǔ)意,建立對(duì)應(yīng)的HMM最佳模型λi。

      識(shí)別過(guò)程是根據(jù)Veterbi算法求出對(duì)待識(shí)別對(duì)象的觀測(cè)序列O對(duì)應(yīng)的最優(yōu)狀態(tài)序列。在訓(xùn)練好的數(shù)據(jù)庫(kù)中,用前向-后向算法找出每個(gè)λi對(duì)應(yīng)模型中最大概率P(O|λi)的樣本參數(shù)作為識(shí)別結(jié)果。

      2 HMM初始化算法改進(jìn)

      2.1 算法概述

      HMM模型訓(xùn)練中的關(guān)鍵是參數(shù)初值的估計(jì),不同的參數(shù)值會(huì)產(chǎn)生不同的訓(xùn)練結(jié)果,影響最終識(shí)別結(jié)果的準(zhǔn)確度。訓(xùn)練過(guò)程中我們發(fā)現(xiàn),傳統(tǒng)初始化算法采取均分方式對(duì)語(yǔ)音進(jìn)行較粗糙的劃分,識(shí)別難度大,準(zhǔn)確度低。針對(duì)這一問(wèn)題,我們對(duì)該方法進(jìn)行了改進(jìn),提出基于語(yǔ)音特征參數(shù)的相鄰幀相關(guān)性重新劃分初始化的改進(jìn)型HMM初始化算法。

      我們用這種方法重新進(jìn)行初始化:

      (1)計(jì)算語(yǔ)音特征參數(shù)相鄰幀的距離,距離與相關(guān)性成反比;

      比如:計(jì)算IMFCC參數(shù)相鄰幀的距離:

      (2)從數(shù)組D=[d1,d2,…,dN-1]中找出N-1個(gè)極大值點(diǎn);

      (3)將觀測(cè)序列O分成N段,每個(gè)極大值點(diǎn)對(duì)應(yīng)一個(gè)幀號(hào)的狀態(tài),重新進(jìn)行分段聚類(lèi),對(duì)每一段的均方值、權(quán)重進(jìn)行計(jì)算。

      不難發(fā)現(xiàn),這種初始化算法更符合語(yǔ)音信號(hào)的特征,識(shí)別基元的表征和判斷也更加準(zhǔn)確。

      2.2 算法驗(yàn)證

      我們采集了5男5女的錄音文本,內(nèi)容為漢語(yǔ)一到五,每個(gè)數(shù)字錄10遍,共采集500個(gè)錄音樣本。從每個(gè)人的樣本中隨機(jī)提取3次錄音樣本用于訓(xùn)練。每個(gè)識(shí)別基元有30個(gè)訓(xùn)練樣本。我們根據(jù)兩種不同的初始化算法,對(duì)語(yǔ)音訓(xùn)練的迭代次數(shù)和訓(xùn)練時(shí)間進(jìn)行比較。如表2所示。

      根據(jù)初始化算法的不同,我們對(duì)識(shí)別可能出現(xiàn)的錯(cuò)誤的概率進(jìn)行重新的驗(yàn)證。如表3所示。

      實(shí)驗(yàn)結(jié)果:相比于傳統(tǒng)HMM初始化算法,改進(jìn)HMM初始化算法在訓(xùn)練0-5的識(shí)別基元時(shí),迭代次數(shù)由平均20.2減少到18.2次,訓(xùn)練時(shí)間由平均每個(gè)訓(xùn)練樣本71.65s減少為62.47s,識(shí)別錯(cuò)誤率由9.8%降低至6.5%。

      3 結(jié) 論

      改進(jìn)HMM初始化算法比傳統(tǒng)HMM初始化算法在初值狀態(tài)的劃分上更加合理,更好地反應(yīng)了語(yǔ)音的平穩(wěn)特性。節(jié)省了重估訓(xùn)練的時(shí)間成本,并且提高了語(yǔ)音識(shí)別的準(zhǔn)確度。因此,改進(jìn)HMM初始化算法更具優(yōu)越性和實(shí)用性。

      參考文獻(xiàn):

      [1] 顧亞強(qiáng).非特定人語(yǔ)音識(shí)別關(guān)鍵技術(shù)研究 [D].長(zhǎng)沙:國(guó)防科學(xué)技術(shù)大學(xué),2009.

      [2] 胡航.現(xiàn)代語(yǔ)音信號(hào)處理 [M].北京:電子工業(yè)出版社,2014.

      [3] 朱淑琴.語(yǔ)音識(shí)別系統(tǒng)關(guān)鍵技術(shù)研究 [D].西安:西安電子科技大學(xué),2004.

      作者簡(jiǎn)介:黃哲彬(1995-),男,漢族,福建南安人,華北水利水電大學(xué)信息工程學(xué)院,學(xué)士學(xué)位。研究方向:自然語(yǔ)言處理、語(yǔ)音識(shí)別。

      两当县| 冕宁县| 商河县| 扎鲁特旗| 安新县| 武夷山市| 富锦市| 鄢陵县| 姚安县| 泰顺县| 永泰县| 准格尔旗| 正蓝旗| 水富县| 桓仁| 台南县| 望谟县| 盈江县| 长岭县| 全州县| 青岛市| 上栗县| 涟水县| 环江| 翼城县| 景东| 民乐县| 昌吉市| 连平县| 高尔夫| 班戈县| 襄汾县| 封丘县| 巢湖市| 宜兰市| 汉沽区| 东安县| 临泉县| 栾城县| 文昌市| 安顺市|