• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      清濁音分離抗噪的語音識別算法的研究

      2018-01-17 12:32李云
      電子技術(shù)與軟件工程 2017年24期
      關(guān)鍵詞:濁音清音語音識別

      摘 要

      針對噪音環(huán)境下,語音識別率嚴重下降,根據(jù)清濁音發(fā)音原理的不同,提出一種清濁音分離抗噪的語音識別算法。實驗結(jié)果表明,該方法能在噪音環(huán)境下明顯提高語音識別率。

      【關(guān)鍵詞】語音識別 清音 濁音 高斯模型 超高斯模型

      語音識別技術(shù)就是讓機器接收,識別和理解語音信號,并將其轉(zhuǎn)換成相應數(shù)字信號的技術(shù)。1956年,普林斯頓大學RCA實驗室成功運用模擬電路將識別語音與模板語音進行對比(運算),從而開發(fā)出單音節(jié)識別系統(tǒng)。1959年,英國的Fry和Denes等人共同開發(fā)出一個改進的語音識別器,它能識別出9個輔音和4個元音,同時他們還制定了一些與音素序列有關(guān)的規(guī)則,這標志著人類開始對語音中元音和輔音的分別研究。上個世紀八十年代,一種由馬爾可夫鏈演變而來,并用參數(shù)表示的用于描述隨機過程統(tǒng)計特性的概率模型得到了空前的發(fā)展,目前大部分語音識別系統(tǒng)都是以它作為基本框架來建模,這便是隱馬爾可夫模型(Hidden Markov Model,HMM)。該模型能在安靜環(huán)境中或某種特定噪音環(huán)境中,取得很好的識別效果。但對于復雜的噪音環(huán)境,識別率下降顯著。針對這一弊端,本文提出一種清濁音分離抗噪的語音識別算法,它將清音和濁音進行分離,并針對各自不同的特點分別進行處理。實驗結(jié)果表明,該方法能有效降低噪音,提高噪音環(huán)境下的語音識別率,具有很高的實用性。

      1 語音的聲學原理

      用數(shù)字技術(shù)來描述產(chǎn)生模擬信號的語音,這一過程稱為語音信號的聲學模型。根據(jù)發(fā)音原理的不同,語音信號分為清音和濁音。清音是發(fā)音時聲帶不振動而與空氣摩擦產(chǎn)生的音。當氣流通過聲門時,如果聲道中某處面積很小,氣流高速沖過此處時產(chǎn)生湍流,當氣流速度與橫截面積之比大于某個臨界速度便產(chǎn)生摩擦音即清音。將發(fā)音時聲帶振動而產(chǎn)生的音稱為濁音,人平時說話以濁音居多。清音由白噪聲序列激勵一個線性系統(tǒng)而產(chǎn)生,這個線性系統(tǒng)僅由激勵源和輻射模型級聯(lián)而成。濁音的產(chǎn)生原理則不一樣,它是由一個周期性的δ脈沖串激勵一個線性系統(tǒng)而產(chǎn)生的輸出,該線性系統(tǒng)由激勵源、聲道模型和輻射模型級聯(lián)而成。清音和濁音的產(chǎn)生過程如圖1所示。

      其中,系數(shù)Av和Au分別用來調(diào)節(jié)濁音和清音的幅度和能量。

      3 實驗結(jié)果

      實驗中,加入一個白噪聲序列,將普通算法,高斯模型抗噪算法與超高斯模型抗噪算法三者進行測試,分別識別不同語音,得到識別率如表1所示。

      由表1可知,在白噪音的環(huán)境下,普通算法識別率非常低,不能滿足要求。而高斯模型抗噪算法,識別率明顯上升,能滿足一些要求不高的場合。超高斯模型抗噪算法識別率最高,能基本滿足實際需要。且三種算法,隨著識別語音總量的增加,其識別率都有所下降。

      4 結(jié)束語

      語音信號按照其發(fā)音原理的不同,可分為清音和濁音,清音靠與空氣摩擦發(fā)音,濁音靠聲帶振動發(fā)音,各自也具有不同的聲學模型。在帶噪音干擾語音識別中,超高斯分布模型考慮到語音信號自身的分布特點,以及人耳對不同頻譜相位的敏感度不同,更加真實地反映出語音頻譜的參數(shù)分布,提高了噪音下的語音識別率。但仍然忽略掉一些高階多項式,而這些多項式在特定場合下是需要考慮的,這正是今后需要進一步研究的。

      參考文獻

      [1]李云.基于HMM的語音分組識別系統(tǒng)的研究[D].廣州:廣東工業(yè)大學,2013:1-3.

      [2]李云.語音分組識別技術(shù)的研究[J].廣東工業(yè)大學學報,2014,31(02):1-4.

      [3]李云.快速語音識別算法的研究[J].信息技術(shù),2017,17(02):27-28.

      [4]何勇軍.語音識別中寬帶失配的補償研究[J].計算機學報,2011,34(09):1629-1637.

      [5]嚴斌峰.語音識別確認中的置信特征和判定算法[J].軟件學報,2006,17(12):2547-2553.

      [6]袁勝龍.基于深層神經(jīng)網(wǎng)絡(luò)的藏語識別[J].模式識別與人工智能,2015,28(03):209-213.

      [7]楊淑瑩.基于免疫貓群優(yōu)化算法的矢量量化的碼書設(shè)計及語音識別[J].模式識別與人工智能,2014,27(07):577-583.

      [8]崔金鐘.基于DHMM的嵌入式語音識別系統(tǒng)的實現(xiàn)與優(yōu)化[J].電子科技大學學報,2013,42(06):930-934.

      [9]劉曉峰.Logistic核函數(shù)及其在語音識別中的應用[J].華南理工大學學報(自然科學版),2015,43(05):100-106.

      [10]王憲亮.基于SVM一對一分類的語種識別方法[J].清華大學學報(自然科學版),2013,53(06):808-812.

      [11]Zhang Rui.Facilitating the applications of support vector machine by using a new kernel[J]. Expert Systems with Applications,2011,38(11):14225-14230.

      [12]王國勝.核函數(shù)的性質(zhì)及其構(gòu)造方法[J].計算機科學,2006,33(06):172-174.

      [13]Du pei-jun.Wavelet SVM in reproducing kernel Hilbert space for hyperspectral remote sensing image classification[J].Optics Communications,2010,283(24):4978-4984.

      [14]李冠宇.藏語拉薩話大詞表連續(xù)語音識別聲學模型研究[J].計算機工程,2012,38(05):189-191.

      [15]Hinton G E. A Fast Learning Algorithm forDeep Belief Nets.Neural Computation[J].2006,18(07):1527-1554.

      作者簡介

      李云(1984-),男,四川省廣漢市人。碩士學位。助教。2013年6月畢業(yè)于廣東工業(yè)大學,現(xiàn)在四川信息職業(yè)技術(shù)學院擔任教師工作。主要研究方向為語音識別,從事語音識別算法研究及語音識別產(chǎn)品開發(fā)。

      作者單位

      四川信息職業(yè)技術(shù)學院 四川省廣元市 628000endprint

      猜你喜歡
      濁音清音語音識別
      《山水清音》
      《園林清音》
      通話中的語音識別技術(shù)
      基于計算聽覺場景分析的改進清音分離方法
      母語干涉在語音方面對日語學習者的影響
      ——以送氣與否與清濁音的混淆為中心
      《山水清音圖》
      日語與永州方言濁音相似點小議①
      大余县| 屯门区| 乐昌市| 桑植县| 汝州市| 和平区| 寻乌县| 棋牌| 肥西县| 德格县| 图们市| 涞水县| 新干县| 封丘县| 晴隆县| 榆林市| 固镇县| 慈利县| 永泰县| 年辖:市辖区| 抚顺县| 淮北市| 三河市| 凌源市| 颍上县| 长乐市| 大余县| 临汾市| 泽州县| 双江| 顺平县| 海原县| 巴青县| 吉隆县| 花垣县| 宿州市| 铜川市| 北海市| 汾阳市| 元阳县| 方正县|