• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      結(jié)合差分陣列與幅度譜減的雙麥語音增強算法

      2018-07-26 02:14:02吳長奇
      信號處理 2018年7期
      關(guān)鍵詞:麥克風(fēng)差分信噪比

      徐 娜 吳長奇

      (1. 燕山大學(xué)信息科學(xué)與工程學(xué)院,河北秦皇島 066004;2. 河北省信息傳輸與信號處理重點實驗室,河北秦皇島 066004)

      1 引言

      麥克風(fēng)陣列語音增強由于引入了空域信息,能夠更好的抑制方向性噪聲干擾,取得更好的增強效果。通常隨著麥克風(fēng)數(shù)量的增加,往往能夠獲得更好的噪聲抑制性能。但是大多數(shù)基于麥克風(fēng)陣列的語音增強算法由于陣列尺寸、麥克風(fēng)數(shù)量、運算速度等限制并不能用于諸如助聽器之類的小型設(shè)備??紤]到這些因素,雙麥克風(fēng)陣列則在算法性能與可應(yīng)用性兩方面做到了平衡,常用于小型設(shè)備[1-2]。

      差分麥克陣列(Differential microphone arrays, DMAs)具有超強方向性,體積小并且其波束模式幾乎是頻率不變,這使得即使在強混響和噪聲環(huán)境下也能得到高可懂度的語音信號[3- 4],適合用于小型設(shè)備。

      經(jīng)過差分陣列處理后能對噪聲進行一定的抑制,但是仍會有殘留噪聲,且噪聲源跟聲源越接近,則殘留噪聲越多。文獻[5]提出了一種算法,該算法將一階差分麥克風(fēng)陣列技術(shù)與譜減法相結(jié)合,利用靜音段和參考噪聲對語音通道中的噪聲進行估計,并進行譜減,與普遍采用的自適應(yīng)零限波束形成技術(shù)相比有明顯的信噪比改善。但該算法依賴于對靜音段的估計,當(dāng)對測試語料靜音段估計不準時,該算法會對語音造成一定損傷,算法整體的魯棒性不高。文獻[6]提出了一種基于相關(guān)函數(shù)的雙麥克語音增強算法,該算法首先利用兩輸入信號相關(guān)函數(shù)的實部與虛部對輸入信噪比進行估計,然后利用估計的信噪比構(gòu)造維納濾波增益函數(shù),進行后置濾波。該方法避免了對靜音段的估計,與已有的波束形成算法相比,在語音可懂度上有明顯提高,適用于助聽器設(shè)備。文獻[7]在此基礎(chǔ)上對噪聲模型進行了改進,但兩者依舊是利用相關(guān)函數(shù)來對估計信噪比,并沒有將兩麥克構(gòu)成的差分陣列優(yōu)勢充分利用起來。

      本文算法首先利用一階差分陣列技術(shù),對兩麥克風(fēng)采集到的帶噪語音信號進行處理,得到語音通道信號和噪聲通道信號。接著對語音通道信號和噪聲通道信號進行理論推導(dǎo)與數(shù)學(xué)分析。參考利用相關(guān)函數(shù)進行信噪比求解的方法,利用兩通道信號構(gòu)造方程,求解語音通道信號的信噪比。然后將求得的信噪比用于幅度譜減法,實現(xiàn)對殘留噪聲的消除。針對語音通道信號信噪比求解方程的構(gòu)造,本文給出了兩種不同計算方法。本文所提算法既利用了陣列的空間濾波特性來處理方向性的噪聲干擾,又借助傳統(tǒng)的譜增強技術(shù)實現(xiàn)了進一步語音增強。最后通過仿真實驗,對本文算法的性能進行了評價,并與其他算法進行了比較。

      2 雙通道信號模型

      假設(shè)遠場聲源信號在自由場中以平面波的形式傳播,聲音到達2個麥克風(fēng)的傳播模型[8]如圖1所示。

      假設(shè)目標聲源來自端射方向即0°方向,噪聲來自θ方向。以第一個麥克風(fēng)作為參考麥克,則兩麥克風(fēng)接收到的信號可表示為:

      y1(k)=x(k)+ν(k)

      (1)

      y2(k)=x(k-τ0)+ν(k-τ0cosθ)

      (2)

      式中k為離散時間單位,x(k)為目標信號,ν(k)為干擾信號,δ為兩麥克風(fēng)之間的間距,τ0=δ/c*fs為目標聲源在端射方向時兩麥克風(fēng)間的時延,fs為信號采樣頻率,c為聲速(c=340 m/s),在差分陣列中有δ?λ(λ為聲學(xué)波長)。

      將式(1)和式(2)中的時域離散信號加窗分幀處理后轉(zhuǎn)換到短時離散傅里葉變換域表示,可得:

      Y1(ωl,m)=X(ωl,m)+V(ωl,m)

      (3)

      Y2(ωl,m)=e-jωτ0X(ωl,m)+e-jωτ0cos θV(ωl,m)

      (4)

      3 算法描述

      3.1 一階差分陣列

      為了抑制干擾噪聲V(ωl,m),首先設(shè)計兩個一階心形差分陣列,形成聲源入射方向即0°方向增益為1,180°方向的增益為0的前向心形波束和0°方向增益為0,180°方向增益為1的后向心形波束,對兩麥克風(fēng)采集到的帶噪語音信號進行處理,實現(xiàn)初步語音增強。經(jīng)差分陣列處理后的信號分別表示為CF(ω)和CB(ω)。

      (5)

      (6)

      (7)

      將式(3)、式(4)和式(7)分別帶入式(5)和式(6)可得:

      (8)

      (9)

      從式(8)和式(9)可以看出,經(jīng)過差分陣列處理后CF(ω)中包含語音項和殘留噪聲項,CB(ω)中僅含噪聲項,所以可以利用CF(ω)與CB(ω)對CF(ω)中的信噪比進行估計,并構(gòu)造后置濾波增益G(ω)對CF(ω)中的殘留噪聲進行進一步消除。整體算法系統(tǒng)框圖如圖2所示。

      圖2 算法系統(tǒng)框圖Fig.2 Algorithm diagram

      3.2 后置濾波增益估計

      本節(jié)首先對CF(ω)中的殘留噪聲進行了理論分析,接著利用了背對背心形波束的輸出CF(ω)與CB(ω)對CF(ω)中信噪比進行估計,并給出了兩種不同的計算方法。之后利用估計的信噪比構(gòu)造后置濾波增益G(ω)對CF(ω)中的殘留噪聲進行進一步消除。

      分別求CF(ω)與CB(ω)的互功率譜密度和各自的自功率譜密度,如下:

      ΦVV(ω)

      (10)

      (11)

      (12)

      由式(10)可知CF(ω)中的信噪比為:

      (13)

      結(jié)合式(13)可得CF(ω)與CB(ω)的自功率譜比值為:

      (14)

      由式(14)可解出SNR(ω)即:

      (15)

      (16)

      (17)

      式中μ為過減因子,Gmin為最小增益。后續(xù)的實驗中設(shè)置μ=1.3,Gmin=0.02。

      3.2.1 信噪比估計方法1

      當(dāng)θ很小時有sinθ≈θ所以可做如下近似:

      (18)

      (19)

      (20)

      ΦY1Y1(ω)=ΦXX(ω)+ΦVV(ω)

      (21)

      圖3給出了以上三個近似項與真實項之間的誤差(L=256,c=340 m/s,δ=0.018 m,fs=16 kHz),從圖中可以看出對同一頻率而言在120°~180°范圍內(nèi)誤差要小,對同一角度而言,在低頻區(qū)域誤差要小,綜合分析可以看出在1≤l≤32范圍內(nèi)對于所有的角度而言,整體的誤差幾乎為0。所以后續(xù)可以利用這些頻點的信息對信噪比進行估計。

      圖3 真實項與近似項誤差分析Fig.3 Error analysis of real item and approximate item

      令:

      (22)

      對式(22)進行整理可得:

      (M(ω)+1)cos2θ+2(1-M(ω))cosθ+

      (M(ω)-3)=0

      (23)

      利用求根公式可以解得在1≤l≤32(l為整數(shù))對應(yīng)頻點的值cosθ(ω)。

      (24)

      利用求根公式得到了兩個解,但由于-1≤cosθ≤1,所以其中一個恒為1的解并沒有實際的價值可以舍去,所以有:

      (25)

      為了消除估計誤差,將各頻點的值求平均,并利用遞歸的方式對每一幀的cosθ(m)進行平滑可得:

      (26)

      cosθ(m)=α.cosθ(m-1)+(1-α).cosθ(m)

      (27)

      α為平滑因子,后續(xù)試驗中α取0.68,將式(27)帶入式(15)可得到SNR(ω)。

      3.2.2 信噪比估計方法2

      方法2跟方法1的求解思路相同,只是利用了不同的功率譜來構(gòu)造二次方程。

      令:

      (28)

      對式(28)進行整理可得:

      (M(ω)+1)cos2θ-2M(ω)cosθ+(M(ω)-1)=0

      (29)

      利用求根公式可以解得在1≤l≤32(l為整數(shù))對應(yīng)頻點的值cosθ(ω)值:

      (30)

      同方法一,將各頻點的值平均并對相鄰幀進行平滑可得cosθ(m),進而得到CF(ω)中的信噪比。

      4 仿真實驗與性能評價

      本節(jié)通過Matlab仿真實驗來驗證本文所提算法的有效性,通過兩個客觀指標對一階差分陣列算法(這里簡稱DMA算法)與本文提出的兩種方法及文獻[6]提出基于相干函數(shù)的算法(這里簡稱為Coherence算法)進行評估比較,分析其性能差異。仿真實驗中兩麥克風(fēng)接收到的信號按照第2節(jié)給出的雙通道信號模型生成(這里暫不考慮混響和反射因素)。在諸如助聽器類的小型設(shè)備中,麥克風(fēng)間的間距通常小于20 mm??紤]到實際應(yīng)用中尺的限制,在仿真實驗中將兩麥克風(fēng)間距δ設(shè)為0.018 m,這與文獻[7]中的陣列尺寸相同。目標聲源方向為陣列端射方向,方向性干擾取自Noisex92庫中的Babble噪聲及一段音樂(歌曲寧夏片段),目標信號與干擾信號均假設(shè)為遠場信號。采用加窗分幀的方式處理對信號進行預(yù)處理,信號采樣頻率為16 kHz,窗函數(shù)為漢明窗,幀長256,幀移128。最后處理完的信號經(jīng)IFFT以重疊相加的方式轉(zhuǎn)換到時域。

      為了評估不同算法處理后語音信號的質(zhì)量,這里采用主觀語音質(zhì)量評估[10](Perceptual Evaluation of Speech Quality, PESQ)和頻率加權(quán)分段信噪比[11](frequency-weighted segmental SNR, fwsegSNR)進行評測。文獻[12]指出PESQ和fwsegSNR這兩個客觀評估指標與語音的整體質(zhì)量及語音信號損傷程度關(guān)聯(lián)很大,更適合評估語音增強算法的性能。PESQ的得分在1.0到4.5之間,分值越高表示語音質(zhì)量越好。本文所用到的PESQ及fwsegSNR的Matlab代碼均來自文獻[11]。

      本文選取了文獻[13]中用到的12組不同性別不同內(nèi)容的純凈句子語料分別在信噪比為10 dB、-5 dB、0 dB、5 dB、10 dB的情況下進行加噪。加噪過程語音的幅度保持恒定,根據(jù)期望的信噪比來對噪聲幅度進行修改。在同一組信噪比條件下,分別使用Coherence算法和DMA算法及本文提出的算法進行處理。同一信噪比下同一種類型噪聲經(jīng)過同一增強算法處理可以得到一種測試條件,再將這種測試條件下的12組句子的fwsegSNR和PESQ的平均值作為最終的數(shù)值。這樣的測試條件共有4×5×4即80種。

      圖4和圖5分別給出了輸入信噪比取-10 dB~10 dB,噪聲分別為Babble與Music,方向為120°和90°情況下四種算法得到的fwsegSNR和PESQ分值。從圖4和圖5可以看出,當(dāng)干擾方向與目標聲源方向接近時,所有算法的性能都會有所下降。本文提出的兩種計算方法在所有測試條件下性能基本接近。與DMA算法相比,噪聲位于90°方向時PESQ平均有0.61分提高, fwsegSNR平均有4.6 dB提升;噪聲位于120°方向時PESQ平均有0.9分提高, fwsegSNR平均有3 dB提升。這表明本文所提算法對經(jīng)一階差分陣列處理后的殘留噪聲起到了進一步的抑制。本文的兩種算法與Coherence算法相比在所有噪聲下PESQ平均有0.25分提高, fwsegSNR平均有1.5 dB提升,去噪效果及語音質(zhì)量均優(yōu)于Coherence算法。

      圖4 不同噪聲下不同算法平均PESQ得分Fig.4 Average PESQ scores of different algorithms with different noise

      圖5 不同噪聲下不同算法平均fwsegSNR值Fig.5 Average fwsegSNR values of different algorithms with different noise

      5 結(jié)論

      本文提出了一種結(jié)合差分陣列與幅度譜減的雙麥語音增強算法,該算法首先在STFT域設(shè)計了一階差分陣列,形成了兩個零點分別在180°和0°的背對背心形波束,對兩麥克風(fēng)采集到的帶噪語音信號進行處理,得到語音通道信號和噪聲通道信號。接著對語音通道信號中的殘留噪聲進行了分析,利用差分陣列處理后的兩通道信號對語音通道信號的信噪比進行估計,然后利用幅度譜減法對殘留噪聲進行消除。針對語音通道信號的信噪比估計,本文給出了兩種計算方法。最后對本文所提算法在不同噪聲場景下從噪聲抑制和語音質(zhì)量兩方面進行了評測,客觀評測參數(shù)顯示該算法有效的抑制了方向噪聲,改善了語音的質(zhì)量,與其他算法相比頻率加權(quán)分段信噪比和語音主觀質(zhì)量評估打分都有一定提升??偟膩碚f本文所提算法能夠?qū)Ψ较蛐栽肼暺鸬讲诲e的抑制作用,且計算復(fù)雜度低易于實時實現(xiàn),可以用于諸如助聽器之類的小型設(shè)備。

      猜你喜歡
      麥克風(fēng)差分信噪比
      數(shù)列與差分
      基于深度學(xué)習(xí)的無人機數(shù)據(jù)鏈信噪比估計算法
      Binaural Rendering based on Linear Differential Microphone Array and Ambisonic Reproduction
      基于數(shù)字麥克風(fēng)的WIFI語音發(fā)射機
      電子測試(2018年23期)2018-12-29 11:11:24
      低信噪比下LFMCW信號調(diào)頻參數(shù)估計
      電子測試(2018年11期)2018-06-26 05:56:02
      低信噪比下基于Hough變換的前視陣列SAR稀疏三維成像
      麥克風(fēng)的藝術(shù)
      麥克風(fēng)
      保持信噪比的相位分解反褶積方法研究
      基于差分隱私的大數(shù)據(jù)隱私保護
      宣武区| 澄城县| 克什克腾旗| 玉环县| 甘泉县| 平阳县| 赫章县| 南和县| 嵊泗县| 商丘市| 张家川| 望城县| 普兰店市| 永济市| 五峰| 会昌县| 故城县| 冷水江市| 建宁县| 茂名市| 固始县| 湖南省| 廊坊市| 洛阳市| 江达县| 久治县| 汾阳市| 满城县| 铁岭县| 蒙阴县| 宜黄县| 措勤县| 东阳市| 洪雅县| 澜沧| 论坛| 龙海市| 翁源县| 奇台县| 儋州市| 黑水县|