• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      雙譜圖在語音分析中的應用

      2018-01-27 01:41:54周麗紅雷金輝
      傳感器與微系統(tǒng) 2018年2期
      關鍵詞:雙譜譜峰圖譜

      周麗紅, 雷金輝

      (昆明理工大學 信息工程與自動化學院,云南 昆明 650500)

      0 引 言

      目前,語音識別技術作為信息社會朝著智能化和自動化方向發(fā)展的關鍵技術之一,具有重要的研究意義和實用價值。經(jīng)過近50年的艱苦探索和研究,語音識別技術研究獲得了極大的發(fā)展,其中,有些比較成熟的技術已經(jīng)逐步應用于日常生活中。但總體來說,語音識別在研究和實用化方而的難度還比較大。由于每個人發(fā)出的語音中均包含有各自的語音信號特征,語音信號也具有和其他信號共有的一些特征參數(shù),比如周期、頻率、能量等[1]。

      為了更直觀地對這些擁有共同特征參數(shù)的不同說話者進行語音識別,本文采用了增強實現(xiàn)(augmented reality,AR)參數(shù)模型雙譜估計計算語音信號的雙譜。利用雙譜進行語音信息的分析與研究,語音信息特征可以在雙譜圖上得以體現(xiàn),使得語音信息特征的研究更加直觀,對于語音辨識具有一定效果。

      1 數(shù)據(jù)采集

      本文使用Windows附件的錄音機程序驅(qū)動聲片采集、播放和簡單語音信號處理[2]。語音錄音在相對安靜的環(huán)境中進行,不摻雜外來噪音,實驗人員均在語速和緩、心情平穩(wěn)下錄制語音。為了清晰地闡明對語音信號進行頻譜分析,實驗對象直接錄制一段語音,并保存為.WAV格式文件,供MATLAB相關函數(shù)直接讀取、寫入或播放。最后使用MATLAB讀取錄制的語音文件的數(shù)據(jù)進行處理、加工。

      如表1,本文設置了不同地域、不同性別以及不同語言類型3個變量,共采集了4次語音數(shù)據(jù),參與人年齡在18~20歲之間,共有80人參與錄制語音,本文選取16個雙譜圖特征明顯者進行圖譜分析。

      2 AR模型與雙譜原理

      在語音信息特征分析中,將語音信號看作白噪聲激勵線性時不變系統(tǒng)的結(jié)果,如圖1所示。

      表1 4次實驗采集表

      圖1 系統(tǒng)模型

      設輸出{y(t)}為零均值的k階平穩(wěn)隨機過程,則k階累積量ck,y(τ1,…,τk-1)定義為[3]

      ck,y(τ1,…,τk-1)=cum{y(t),y(t+τ1),…,y(t+τk-1)}

      (1)

      根據(jù)由Bartlett,Brilinger和Rosenblatt推導出的BBR公式,對于穩(wěn)定的線性系統(tǒng)H(z),設驅(qū)動信號a(t)為獨立同分布的非高斯白噪聲時,考慮因果關系的非最小相位系統(tǒng),則輸出y(t)的累積量函數(shù)為

      h(t+τ3)

      (2)

      式中k為累積量的階數(shù);τ為滯后量;h(t)為系統(tǒng)的單位脈沖響應函數(shù)。

      聲帶振動的氣流激勵聲道之后產(chǎn)生出語音,輸出的隨機信號中含有系統(tǒng)的豐富動態(tài)信息,可以建立AR模型

      (3)

      式中α(i),i=1,2,…,p為自回歸系數(shù);p為自回模型的階數(shù)。

      根據(jù)定義,隨機量y(t)的雙譜為3階矩的二維傅里葉(Fourier)變換三階譜。雙譜不僅能夠提取信號的幅值信息,而且能反映系統(tǒng)的相位信息,二次非線性相位耦合信息[4]。設高階累積量ck,y(τ1,…,τk-1)絕對可和

      (4)

      則k階累積量譜定義為k階累積量的k-1維Fourier變換,即

      τk-1)·exp[-j(ω1τ1+ω2τ2+…+ωk-1τk-1)]

      =γa,kH(ω1)H(ω2)…H(ωk-1)

      H*[ω1+ω2+…+ωk-1]

      (5)

      式中ω為頻率;H(ω)為系統(tǒng)的傳遞函數(shù);H*(ω)為H(ω)的共軛函數(shù);Sy,k(ω1,ω2,…,ωk-1)為k階譜,亦稱為k階累積量譜。當k=2,3,4時,分別為功率譜P(ω)、雙譜B(ω1,ω2)和三譜T(ω1,ω2,ω3)。因此,雙譜可以表示為[5~7]

      B(ω1,ω2)=γ3aH(ω1)H(ω2)H*(ω1+ω2)

      (6)

      3 實驗數(shù)據(jù)分析

      圖2為實驗一中男女生的雙譜圖,4人均為云南省昆明市人。從男生的雙譜圖可以看出,2人的雙譜圖均存在非常明顯的譜峰,且譜峰較為清晰,圖像比較集中,譜峰幅值層次非常清楚,主要集中在對角區(qū)域,即(50,50)和(200,200)附近,而另外一個對角線區(qū)域卻未出現(xiàn)明顯的譜峰,中間部分亦無較為明顯的譜峰,其譜峰底部較為細小。從女生的雙譜圖可以看出,雙譜圖底部均較為粗大,波峰個數(shù)較多,較雜,圖形更為紊亂,且除了一個對角線上出現(xiàn)較為明顯的譜峰外,另一對角線上(50,200)和(200,50)處也出現(xiàn)了非常明顯的譜峰。另外,其譜峰覆蓋頻率較廣,幾乎覆蓋整個圖譜區(qū)域。

      圖2 男女生的語音雙譜圖

      圖3 不同語言類型語音雙譜圖

      圖3為具有不同語言類型人的雙譜圖,2人均為云南省昆明人,且均為男生。普通話時的雙譜圖可以看出,雙譜圖譜峰明顯,底部較細小,且譜峰層次清晰,較為有序。譜峰主要集中在(50,50)和(200,200)附近,除對角線出現(xiàn)明顯譜峰外,其余各處也出現(xiàn)少許譜峰,但并不明顯。07#和08#圖為講方言時的相應雙譜圖,其圖形紊亂,譜峰較多,底部粗大,譜峰覆蓋頻率面積廣,與第一組中的雙譜圖差異明顯。

      圖4 不同地域人講普通話時的語音雙譜圖

      圖4為4位不同地域人講普通話時的語音雙譜圖,均為男生。可以看出,4人的語音雙譜圖差別較大。

      圖5為兩種性別、不同語言(方言)、不同地域人的語音雙譜圖,4人語音雙譜圖中,13#圖4中大的譜峰較少,底部也很細小,14#圖譜峰頻率覆蓋面均很大,出現(xiàn)很多譜峰,且相對雜亂,15#圖的譜峰底部較粗,16#圖的峰值主要集中在(125,125)附近,即雙譜圖中心位置,16#圖較15#圖譜峰寬很多。

      圖5 不同性別與語言(方言)及地域的語音雙譜圖

      從上述實驗可以看出:

      1)實驗一中2個男生的語音雙譜圖較為相似,但男女生的2組語音雙譜圖差別明顯。故從實驗一2組圖可以看出男生和女生的語音可以由雙譜圖很容易區(qū)分。實驗二中不同語言類型人的兩組圖語音雙譜圖差別較大。實驗三與實驗四中具有各自特征人的雙譜圖亦較易辨別。

      2)由本實驗采集的數(shù)據(jù)情況看,每個人的語音雙譜圖與其性別、語言和地域相關,不同之處越多,其雙譜圖越容易區(qū)分。

      3)雙譜圖更直觀地表達了峰值所對應的頻率位置,清晰表明個人語音雙譜圖的特征。雙譜圖可以有效辨別每人的語音特色,進一步驗證了雙譜圖在語音分析領域的重要作用。

      通過雙譜圖中體現(xiàn)的信息進行分析,可以辨識圖譜中的語音特征。由于能夠影響語音雙譜圖的因素很多,語音中的任何一個部分都會引起雙譜圖的變化,對于語音特征辨識的判斷比較復雜。因此,語音的識別仍有待于進一步的研究。

      4 結(jié) 論

      語音雙譜圖之所以有很大不同,是因為受各方面因素的影響,不同因素越多,雙譜圖差別越明顯。不論何種語音,因素不同,譜峰位置也不同,這是由于頻率成分以及各頻率分量之間發(fā)生二次相位耦合的情況不同而反映出的必然結(jié)果。因此,從雙譜三維圖形上的特征頻率處表現(xiàn)出的幅值特性上能有效地區(qū)別不同說話人的類型,方法能大幅提高語音辨別的準確性,且對語音變化很敏感,對處理語音信號有一定效果,為語音辨識提供了一種可供選擇的方法。

      [1] 張 節(jié).語音信號的預處理和特征提取技術[J].電腦知識與技術,2009,22(5):6280-6282.

      [2] 趙淑敏.基于MATLAB實現(xiàn)對語音信號分析[J].信息通信,2010(4):15-17.

      [3] 張賢達.時間序列分析[M].北京:清華大學出版社,1996:4.

      [4] 蔣雨燕.基于高階累積量AR模型參數(shù)的液壓閥故障識別[D].廈門:廈門大學,2009.

      [5] 張賢達.現(xiàn)代信號處理[M].北京,清華大學出社,1995:90-93,274-280.

      [6] Raghuveer M R.Time-domain approaches to quadratic phase coupling estimation [J].IEEE Transaction on Automatic Control,1990,35(1):48-56.

      [7] Collis W B,White P R,Hammond J K.Higher-order spectra:The bispectrum and trispectrum[J].Mechanical Systems and Signal Processing,1998,12(3):375-394.

      猜你喜歡
      雙譜譜峰圖譜
      連續(xù)波體制引信多譜峰特性目標檢測方法
      X射線光電子能譜復雜譜圖的非線性最小二乘法分析案例
      基于無基底扣除的數(shù)據(jù)趨勢累積譜峰檢測算法
      色譜(2021年6期)2021-05-06 02:18:56
      繪一張成長圖譜
      巖性密度測井儀工作原理與典型故障分析
      科技資訊(2020年12期)2020-06-03 04:44:20
      矩形積分雙譜和半監(jiān)督鑒別分析下的通信輻射源識別
      補腎強身片UPLC指紋圖譜
      中成藥(2017年3期)2017-05-17 06:09:01
      基于雙譜特征融合的通信輻射源識別算法
      主動對接你思維的知識圖譜
      基于小波包域雙譜的風力機振動信號監(jiān)測方法研究
      兴文县| 静安区| 寿光市| 会宁县| 新平| 九龙坡区| 乌兰县| 兴海县| 巴彦县| 建始县| 谷城县| 浪卡子县| 安达市| 津南区| 黄石市| 项城市| 仙居县| 石阡县| 金平| 中超| 渝北区| 沙河市| 肇庆市| 鹤山市| 新巴尔虎右旗| 兴文县| 邹城市| 邓州市| 平邑县| 阿克陶县| 唐山市| 韶关市| 离岛区| 宜良县| 牟定县| 宁安市| 磴口县| 广汉市| 讷河市| 宣恩县| 新田县|