• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于DSP的語音編碼識別系統(tǒng)的設計與研究

      2010-08-23 04:47:04韓劍波
      制造業(yè)自動化 2010年10期
      關鍵詞:語音編碼芯片

      韓劍波

      HAN Jian-bo

      (廊坊師范學院,廊坊 065000)

      0 引言

      近年來,隨著DSP技術的普及和低價格、高性能DSP芯片的出現(xiàn),DSP已越來越多地被廣大的工程師所接受,并越來越廣泛地被應用于各個領域,例如:語音處理、圖像處理、模式識別及工業(yè)控制等,并且已日益顯示出其巨大的優(yōu)越性。DSP是利用專門或通用的數(shù)字信號處理芯片,以數(shù)字計算的方法對信號進行處理,具有處理速度快、靈活、精確、抗干擾能力強、體積小及可靠性高等優(yōu)點,滿足了對信號快速、精確、實時處理及控制的要求。

      與機器進行語音交流,這是人們長期以來夢寐以求的事情。語音識別技術就是讓機器通過識別和理解過程把語音信號轉變?yōu)橄鄳奈谋净蛎畹母呒夹g。語音識別是一門交叉學科,它正逐步成為信息技術中人機接口的關鍵技術,語音識別技術與語音合成技術結合使人們能夠通過語音命令進行操作。語音技術的應用已經(jīng)成為一個具有競爭性的新興高技術產(chǎn)業(yè)。

      1 語音識別技術的現(xiàn)狀

      語音識別技術發(fā)展到今天,對特定人語音識別系統(tǒng)的識別精度很高。這些技術已經(jīng)能夠滿足通常應用的要求。由于大規(guī)模集成電路技術的發(fā)展,這些復雜的語音識別系統(tǒng)也已經(jīng)完全可以制成專用芯片,大量生產(chǎn)。在西方經(jīng)濟發(fā)達國家,大量的語音識別產(chǎn)品已經(jīng)進入市場和服務領域。一些用戶交機、電話機、手機已經(jīng)包含了語音識別撥號功能,還有語音記事本、語音智能玩具等產(chǎn)品也包括語音識別與語音合成功能。人們可以通過電話網(wǎng)絡用語音識別口語對話系統(tǒng)查詢有關的機票、旅游、銀行信息,并且取得很好的結果。調查統(tǒng)計表明多達85%以上的人對語音識別的信息查詢服務系統(tǒng)的性能表示滿意。

      我國語音識別研究工作起步于五十年代,但近年來發(fā)展很快。研究水平也從實驗室逐步走向實用。從1987年開始執(zhí)行國家863計劃后,國家863智能計算機專家組為語音識別技術研究專門立項,每兩年滾動一次。我國語音識別技術的研究水平已經(jīng)基本上與國外同步,在漢語語音識別技術上還有自己的特點與優(yōu)勢,并達到國際先進水平。其中具有代表性的研究單位為清華大學電子工程系與中科院自動化研究所模式識別國家重點實驗室。

      可以預測在近五到十年內,語音識別系統(tǒng)的應用將更加廣泛。各種各樣的語音識別系統(tǒng)產(chǎn)品將出現(xiàn)在市場上。人們也將調整自己的說話方式以適應各種各樣的識別系統(tǒng)。在短期內還不可能造出具有和人相比擬的語音識別系統(tǒng),要建成這樣一個系統(tǒng)仍然是人類面臨的一個大的挑戰(zhàn),我們只能一步步朝著改進語音識別系統(tǒng)的方向一步步地前進。至于什么時候可以建立一個像人一樣完善的語音識別系統(tǒng)則是很難預測的。就像在60年代,誰又能預測今天超大規(guī)模集成電路技術會對我們的社會產(chǎn)生這么大的影響。

      近二十年來,語音識別技術取得顯著進步,開始從實驗室走向市場。人們預計,未來10年內,語音識別技術將進入工業(yè)、家電、通信、汽車電子、醫(yī)療、家庭服務、消費電子產(chǎn)品等各個領域很多專家都認為語音識別技術是2000年至2010年間信息技術領域十大重要的科技發(fā)展技術之一。

      隨著人們對多媒體通信要求的日益提高,現(xiàn)代通信網(wǎng)的傳輸量越來越大,媒體壓縮技術迅速發(fā)展。語音壓縮技術也處于不斷發(fā)展中,實用系統(tǒng)的最低壓縮速率已經(jīng)達到2.4kbps甚至更低,在大大節(jié)省信道帶寬的同時還保證了話音質量。由于大容量通信信道的引入,一段時間內曾認為語音壓縮技術已沒有研究的必要,因為語音壓縮量相對于光纖信道容量來說已微不足道。實際上,光纖信道目前也只是在骨干網(wǎng)上得到應用,在接入網(wǎng)及支線的大規(guī)模應用仍需一定時間。另外,無線領域的信道帶寬始終是一個突出的問題。由此可見低速率語音編碼技術仍然有廣泛的應用前景。

      2 系統(tǒng)的實現(xiàn)

      語音編碼既可用軟件也可用硬件的方法實現(xiàn)。軟件實現(xiàn)就是將壓縮算法用軟件方法實現(xiàn),這樣做的好處是成本低、修改方便靈活,但處理速度較慢,不易保證處理的實時性。采用硬件實現(xiàn)就是將語音壓縮算法固化到專用DSP芯片中,這樣處理速度快,便于實時處理。

      隨著性能高的DSP芯片的推出,數(shù)字語音系統(tǒng)成為一個研究新方向,也是適應人們需求的一個新熱點,語音編碼和語音識別的研究日漸廣闊,新的理論不斷推出,這就需要有新的硬件去實現(xiàn)它,同時以促進理論的不斷發(fā)展。

      采用的研究方法是理論與實際相結合,硬件與軟件相結合,把新的理論應用到實際當中去,把好的語音編碼技術G.728與DSP相結合,保證有好的語音壓縮和高質量的語音保持,應用好的DSP芯片――TMS3205402,把語音識別技術更好的發(fā)揮出來,把算法固化到硬件當中去,可以最大限度的加快運算速度,減少制作成本,提高本系統(tǒng)的實時處理能力。

      圖1 編碼器

      本系統(tǒng)擬通過G.728語音編碼的編碼器如圖1、解碼器如圖2所示。

      圖2 解碼器

      本系統(tǒng)的語音壓縮采集部分,可適用不同的DSP芯片,加上一些必要的系統(tǒng)即可成為一個獨立的系統(tǒng),無機械噪聲,存儲容量大,時間長,易錄放,如圖3所示:

      圖3 語音采集

      本系統(tǒng)的語音識別部分擬采用以下過程,框圖4如下:

      圖4 語音識別

      3 系統(tǒng)的創(chuàng)新點

      在于把語音編碼和語音識別技術很好的與DSP芯片相結合,開發(fā)出一種功能相對強大的多功能數(shù)字語音處理系統(tǒng),為以后的實際應用打下良好的基礎,能夠迅速的開發(fā)出一系列的應用型產(chǎn)品,滿足社會的需求。

      將語音信號采集后,利用DSP芯片,如TMS320VC5402,作現(xiàn)場處理,以便減少信息存儲量,對語音信號采用ITU-T G.728語音編碼標準編碼,以保證有好的語音質量,然后采用半導體器件作為語音信號的存儲載體,如果內容非常巨大時,可再通過DSP與PC機之間進行通信,保存在硬盤中。本系統(tǒng)不僅能夠實現(xiàn)語音信號的錄音、隨機播放,而且可對信息進行加密、分段查詢、編輯等功能,無需機械裝置。

      對已存儲的信息,根據(jù)信息的關鍵詞,本系統(tǒng)可進行語音控制,能方便的進行信息查詢。語音輸入方式與手寫方式相比,具有操作簡便、查詢方便、識別準確率高等優(yōu)點,省去了大量的輸入時間,降低了信息檢索的復雜度,且語音識別,語音編碼可在同一個DSP芯片上實現(xiàn)。

      4 結束語

      本系統(tǒng)可作為多功能數(shù)字記錄系統(tǒng),如作數(shù)字采訪機;聲控電子記事本;稍作改進后可實現(xiàn)數(shù)字留言電話系統(tǒng)的功能;語音電話撥號功能;語音玩具等等。本課題的研究主要是通過語音編碼和語音識別技術,把TMS320C5402的功能充分的開發(fā)出來,形成一整套的語音數(shù)字處理系統(tǒng),既可以作為一個整體來使用,也可以根據(jù)不同的需要把其中一部分拿出來單獨使用。

      本系統(tǒng)是一個有著廣闊前景的實用系統(tǒng),能夠迅速的開發(fā)出成品,很好的適應人們對數(shù)字語音系統(tǒng)的不斷增長的要求,應用面非常的廣泛,幾乎包含了語音應用的各個方面,具有很好的經(jīng)濟效益和社會效益。

      [1]蘇濤.等.高性能數(shù)字信號處理器與高速實時信號處理[M].陜西:西安電子科技大學出版社,1999.

      [2]戴明幀,周建江.TMS320C54X DSP結構原理及應用[M].北京:北京航空航天大學出版社,2000.

      [3]邵蔚,吳開杰,李剛.54X系列DSP與計算機井口通信的設計方案[J].電子技術應用, 2002,3(3):23-26.

      [4]曹延偉,林家宇,唐朝京.用定點DSP實現(xiàn)ITU G.728[J].微處理器.2001,7(3):26-27.

      猜你喜歡
      語音編碼芯片
      基于SAR-SIFT和快速稀疏編碼的合成孔徑雷達圖像配準
      《全元詩》未編碼疑難字考辨十五則
      子帶編碼在圖像壓縮編碼中的應用
      電子制作(2019年22期)2020-01-14 03:16:24
      魔力語音
      基于MATLAB的語音信號處理
      電子制作(2019年14期)2019-08-20 05:43:38
      基于MQ3與MP3的價廉物美的酒駕語音提醒器
      電子制作(2019年9期)2019-05-30 09:42:10
      Genome and healthcare
      對方正在輸入……
      小說界(2018年5期)2018-11-26 12:43:42
      芯片測試
      多通道采樣芯片ADS8556在光伏并網(wǎng)中的應用
      潞西市| 英山县| 南投市| 建德市| 佛学| 长岭县| 周口市| 延川县| 西昌市| 化州市| 榕江县| 汉寿县| 界首市| 山丹县| 新郑市| 穆棱市| 常熟市| 务川| 柘城县| 海门市| 项城市| 陆川县| 偏关县| 子洲县| 临汾市| 弋阳县| 江川县| 建平县| 防城港市| 英超| 漳州市| 麻江县| 泊头市| 政和县| 商城县| 龙游县| 江安县| 浪卡子县| 余干县| 定兴县| 康保县|