• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于MATLAB語音信號處理一體化方法分析構建

      2017-09-25 08:53:09王永飛
      陜西學前師范學院學報 2017年9期
      關鍵詞:濁音清音信號處理

      王永飛

      (銅陵職業(yè)技術學院,安徽銅陵 244000)

      ■哲學·政治·法學研究

      基于MATLAB語音信號處理一體化方法分析構建

      王永飛

      (銅陵職業(yè)技術學院,安徽銅陵 244000)

      隨著語音信息應用重要性突顯,語音信息的分析方法是當前計算機應用的一個熱點。通過隨機采集的語音數(shù)據(jù),分析語音數(shù)據(jù)信息,可以尋求一種“一體化”語音數(shù)據(jù)分析方法,對清音和濁音進行實驗論證,與其它語音數(shù)據(jù)方法比較,能更好分析語音數(shù)據(jù)。

      “一體化”分析法;激勵;線性預測分析

      MATLAB是一種用于數(shù)據(jù)可視化和數(shù)據(jù)分析等方面的標準計算軟件。語音信息是人類重要的信息交換形式。語音信號處理是將數(shù)字信號處理技術與語音學和心理學等多學科相結合的新興交叉學科,也是目前信息學研究領域的前沿。本研究通過對隨機采樣的語音信息從產生機理和信息特征兩方面進行探索,提出了“一體化”研究語音方法,并識別清音、濁音,期望能為語音在線識別研究提供一定的依據(jù)。

      1 語音信號理論基礎

      語音是聲門氣流通過聲道時產生振動而形成的,并與發(fā)音時的嘴型有關,按其激勵方式可分為清音和濁音。設定每次聲帶開閉時長為一個基音周期,基音的頻率范圍一般在80-450HZ左右,聲道改變形狀時,通過聲道管的共振峰(聲道管諧振頻率)可識別濁音。

      經(jīng)驗表明,聲道面積在10-20ms內,語音音效可認為是穩(wěn)態(tài)的,準周期脈沖發(fā)濁音,隨機噪聲發(fā)清音,語音形成過程可仿真為一個漸變的線性模型。

      語音信號自1940年Dudley聲碼器語音信號起,出現(xiàn)了數(shù)字濾波器、傅立葉變換、隱馬爾可夫模型和人工神經(jīng)網(wǎng)絡等語音信號處理技術;1990年后,魯棒語音識別結合隱馬爾可夫模型處理技術語音處理技術的熱點[1],提出了一種平行子狀態(tài)隱馬爾可夫模型用作噪聲魯棒語音識別的聲學模型。本文提出的“一體化”分析方法是基于語音產生機理分析,目前,還未見到這種分析方法介紹,是一種探索語音信號處理技術的新途徑。

      2 語音“一體化”分析方法模型

      本研究從產生語音的聲門、聲道振動和發(fā)音時嘴型變化出發(fā),整合聲門、聲振和發(fā)音時嘴型變化等特征,建立相應的模擬函數(shù),形成語音“一體化”分析方法,其工作原理如圖1所示。

      圖1 “一體化”分析方法工作原理

      3 實驗與分析

      根據(jù)Nyquist定理,語音取樣率須是信號帶寬的2倍以上,保證取樣過程中不丟失信息[2]。對輸入的語音信號先濾波,截樣頻率由語音實際帶寬確定,語音波形動態(tài)范圍一般為55dB。本研究采用量化位數(shù)為10位以上,以保證實驗效果。語音信號數(shù)字分析前,需要高頻提升和分幀處理等預處理。分幀時每幀時長約為10-20ms。將此段語音信號進行取樣,獲取以時間為基礎的離散數(shù)字信號。我們隨機選取一段采樣率為44100HZ,16位量化,時長5s的語音,內容為“我是中國人,我來自安徽”的音頻作為實驗數(shù)據(jù)。

      3.1 實驗數(shù)據(jù)“一體化”法有效性分析

      本研究隨機采集的語音波形如圖2所示。為進一步驗證“一體化”法有效性,實驗中再隨機選取一段采樣率為44100HZ,16位量化,時長5s的白噪聲,波型如圖3所示。實驗采集的語音加入白噪聲及濾波后如圖4所示。

      圖2 采集的語音波形

      圖3 白噪音波形

      圖4 加白噪音及濾波后波形

      通過“一體化”分析方法,對上述兩部分語音數(shù)據(jù)段進行16K、8K和4K抽樣和恢復比較,實驗結果如圖5。

      圖5 16K、8K和4K抽樣和恢復比較

      實驗表明,原始數(shù)據(jù)信息與含有白噪音語音段在不同頻率段中的波型相似度較高,恢復比較實驗中不同頻率的頻譜信息高度相似。表明“一體化”方法處理后對語音數(shù)據(jù)處理的有效性。

      3.2 “一體化”法語音清、濁音識別

      清音和濁音是語音信息中最重要的組成部分,語譜圖直接反映語音能量分布[3]。我們先對合成語音數(shù)據(jù)繪制語譜圖,窗長分別為512和128,如圖6所示。

      圖6 合成語音數(shù)據(jù)語譜圖

      通過圖示的語音信號能量分布比,濁音因其準周期性,顯示為條紋圖形,清音部分的圖形顯示為細密,由圖6可初步識別清、濁音分布情況。為了更進一步驗證“一體化”在識別清音和濁音上的有效性,我們從以下幾個方面進行深入探討。

      3.2.1 從過零角度分析

      計算過零率如圖7。

      圖7 過零率

      由圖7可知,不同的窗口長度,過零率接近相同。雖然濁音能量相對清音能量高,濁音過零率較清音過零率低,但清音和濁音能量有部分相互交疊,僅僅依據(jù)過零率高低來準確判別清音和濁音很不合理。為準確識別清音和濁音,我們考慮從其它角度分析語音特征。

      3.2.2 從能量和幅度角度分析

      圖8 語音能量

      圖9 語音幅度

      實驗表明,因語音基音周期值時變性,從語音能量和語音幅度兩個角度入手,對語音數(shù)據(jù)進行分幀處理,對語音數(shù)據(jù)一體化處理后,清、濁音由圖9可更直接識別。

      3.2.3 從發(fā)音機理角度分析

      我們對實驗數(shù)據(jù)利用上述的矩形窗函數(shù)結合自修正函數(shù)對第5幀(清音幀)和第10幀(濁音幀)信息分幀分析如圖10所示。

      圖10 語音信息分幀分析

      實驗表明,從語音能量和幅度識別第5幀是清音幀、第10幀是濁音幀。我們從發(fā)音機理角度對識別的清音幀和濁音幀進行相關性驗證,實驗結果證明了“一體化”分析語音的有效性。

      3.3 “一體化”法與線性預測分析(LPC)比較

      線性預測分析是目前研究語音信息的一種重要方式。線性預測分析經(jīng)常采用的模型有3類,分別是AR(全極點模型)、MA(全零點模型)和ARMA(既有零點又有極點的模型)[4]。線性預測分析是在假定語音短時平穩(wěn)基礎上進行的,實踐表明LPC參數(shù)是反映語音信號特征的良好參數(shù)。

      線性預測分析采用AR模型對本研究數(shù)據(jù)處理如圖11所示,在語音能量大的區(qū)域(譜峰)LPC譜和信號譜匹配較好;而在能量低(谷底)的區(qū)域譜匹配不理想。另外,對于濁音譜在諧波成分處比諧波間匹配程度好。與圖9和圖10比對后,經(jīng)“一體化”法處理后的數(shù)據(jù),更能直接和準確的反映語音基本特征。

      圖11 線性預測分析

      本研究通過對隨機采樣的語音信息進行研究,構建了語音“一體化”分析方法,通過“一體化”分析方法對語音進行合成、抽樣和恢復分析;結合不同的窗函數(shù)對清音和濁音從不同的角度進行判別;與線性預測分析進行比對,驗證了“一體化”分析方法的更優(yōu)性。

      [1] 王艷芬,劉衛(wèi)東.信號處理課程群專業(yè)課“語音信號處理”的改革實踐[J].中國電力教育,2013(7):75-76.

      [2] 王玉靜.語音信號的盲源分離算法研究[D].無錫:江南大學,2012.

      [3] 趙力.語音信號處理[M].2版.北京:機械工業(yè)出版社,2010.

      [4] 陶華偉,査誠,梁瑞宇,張昕然,趙力,王青云.面向語音情感識別的語譜圖特征提取算法[J].東南大學學報(自然科學版),2015,05:817-821.

      [責任編輯朱毅然]

      AStudyontheMethodsoftheSpeechSoundsSignalProcessingConstructionBasedonMATLAB

      WANGYong-fei

      (TonglingVocationalTechnologyCollege,Tongling244000,China)

      As it is more and more important of speech sounds application, the analysis methods of speech sounds is a hot topics today. This paper analyzed the data information of speech sounds, proposed the countermeasure methods, did the practical demonstration, compared with other data analyzing methods by deeply researching the randomly collecting data information.

      unified analyzing methods; encouragement; linear prediction analysis

      2017-03-15;

      :2017-04-11

      安徽省教育廳人文重點課題(SK2016A0941)

      王永飛,男,安徽池州人,銅陵職業(yè)技術學院副教授,主要研究方向:智能信息處理。

      TP391

      : A

      : 2095-770X(2017)09-0135-05

      http://sxxqsfxy.ijournal.cn/ch/index.aspxdoi: 10.11995/j.issn.2095-770X.2017.09.030

      猜你喜歡
      濁音清音信號處理
      《山水清音》
      娘子關(2022年6期)2023-01-09 09:03:38
      《園林清音》
      人文天下(2022年5期)2022-08-11 14:49:26
      日語半濁音的變化規(guī)律研究
      青年與社會(2019年4期)2019-03-29 12:03:32
      《信號處理》征稿簡則
      信號處理(2018年5期)2018-08-20 06:16:02
      《信號處理》第九屆編委會
      信號處理(2018年5期)2018-08-20 06:16:00
      《信號處理》征稿簡則
      信號處理(2018年8期)2018-07-25 12:25:42
      《信號處理》第九屆編委會
      信號處理(2018年8期)2018-07-25 12:24:56
      清濁音分離抗噪的語音識別算法的研究
      有關鼻濁音使用實態(tài)的研究
      ——以NHK新聞為中心
      小說月刊(2017年14期)2017-12-06 12:37:01
      基于計算聽覺場景分析的改進清音分離方法
      瑞丽市| 夹江县| 鹤峰县| 交城县| 会昌县| 林芝县| 罗城| 永宁县| 阿城市| 金门县| 大埔县| 且末县| 江北区| 潞西市| 柳江县| 原平市| 陈巴尔虎旗| 渝北区| 乐陵市| 山丹县| 哈巴河县| 嘉义市| 临洮县| 织金县| 惠州市| 陈巴尔虎旗| 页游| 工布江达县| 乌兰县| 柘荣县| 乌拉特后旗| 上杭县| 黄大仙区| 永川市| 黎川县| 桐柏县| 峨眉山市| 高邮市| 日喀则市| 华宁县| 武宁县|