• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      槍聲背景下的語音降噪技術研究

      2021-06-02 02:47:14李忠新
      兵器裝備工程學報 2021年5期
      關鍵詞:語譜槍聲噪音

      莊 培,李忠新

      (南京理工大學 機械工程學院, 南京 210094)

      當前,語音識別在軍事領域的應用愈加廣泛,語音識別技術使得軍事通信與戰(zhàn)爭決策更加迅捷、可靠,從而掌握戰(zhàn)爭的主動權。但在以往的軍用語音識別系統(tǒng)中,都側重于無噪音或弱噪音環(huán)境下的語音分析識別,并未關注強噪音干擾下裝備的魯棒性[1-2]。在實際使用中,軍用語音識別系統(tǒng)應用場景惡劣,戰(zhàn)場噪音會嚴重影響語音識別的準確率,導致作戰(zhàn)任務的失敗。槍聲是戰(zhàn)場較為典型的強噪聲干擾,根據(jù)試驗測試,槍械造成的噪聲可以達到100 dB,個別槍聲甚至可以達到150 dB,在這種環(huán)境下進行偵查、作戰(zhàn)的裝備會受到極大干擾,需要具備強大的語音降噪能力,能準確區(qū)分噪音與指令,完成對指令的精確識別。因此,有必要研究槍聲特性,并據(jù)此提出有效的降噪方法,以便語音識別系統(tǒng)能適應戰(zhàn)場惡劣的語音環(huán)境。

      槍聲背景下的語音系統(tǒng)運行離不開語音降噪過程,語音降噪的主要目的是從帶噪語音中提取出盡可能純凈的原始語音,提高語音識別率。常見的語音降噪算法有自適應濾波[3]、維納濾波[4]、深度神經(jīng)網(wǎng)絡[5]等,其中自適應濾波算法是最經(jīng)典且成熟的降噪方法,適合處理局部平穩(wěn)的噪音信號。自適應濾波器利用前一時刻的已知結果,自動調(diào)節(jié)現(xiàn)在時刻的參數(shù),適用于噪聲未知的隨機特性。最小方均(Least Mean Square,LMS)自適應算法就是最典型的自適應濾波法,以最優(yōu)化的數(shù)學算法調(diào)節(jié)脈沖響應,得到最佳輸出信號[6]。LMS算法自1959年被提出以來,廣泛的應用在語音降噪中,針對收斂速度和穩(wěn)態(tài)誤差的矛盾,人們還提出了歸一化LMS[7]、變步長LMS[8]等改良算法,現(xiàn)如今已經(jīng)極為完善。

      本文探討戰(zhàn)場強噪音環(huán)境下的語音識別技術,以槍聲為典型強噪音代表,通過對槍聲信號的特性分析,提出使用LMS算法濾除槍聲噪音,并在LMS算法前加入FIR低通濾波器。選取5種不同信噪比下槍聲背景干擾的語音信號進行仿真和試驗驗證,分析算法的降噪效果和語音識別準確性。結果表明,相比于其他降噪算法,該算法具有更優(yōu)的降噪效果,將其應用于語音識別系統(tǒng),可大大提高識別準確率。

      1 典型槍聲特性分析

      目前,業(yè)界對槍聲特性的分析大多用于槍聲定位[9]、槍聲檢測識別[10-11]等,研究目的多是為了去除其他噪聲得到純凈槍聲,和上述的研究目標不同,本文通過槍聲特性分析則是為了更好的濾除槍聲。槍械射擊時可以產(chǎn)生2種瞬態(tài)聲音信號:第1種是子彈被擊發(fā)過程中子彈的火藥爆炸,高溫高壓氣體推彈出膛口的激波;第2種是彈丸在大氣中超音速飛行時產(chǎn)生的沖擊波[12]。用時域波形圖和語譜圖可以直觀分析槍聲的信號特性。語音信號的時域分析是應用最廣泛的數(shù)字信號分析方法,將信號分解為簡單信號得出短時能量、短時過零率等特征量,而頻域分析則是分析信號頻率的成分大小,并用彩色語譜圖來表示,直觀明了。

      1.1 時域分析

      語音信號的時域分析可以得到短時平均幅度、短時能量和短時過零率,這些短時參數(shù)在信號處理中都有重要的作用。

      設槍聲信號為x(m),經(jīng)過分幀后第n幀的信號為xn(m),其短時能量為

      (1)

      En是度量幅度值變化的參數(shù),可以用來區(qū)分清音和濁音,清音的短時能量要比濁音小得多。由于用信號的平方來計算,短時能量對高電平很敏感。為更好的表征語音信號幅度變化,還可用短時平均幅度函數(shù):

      (2)

      Mn同樣能夠表示信號能量,它與短時能量的區(qū)別就在于不會因為計算取樣值的平方造成小取樣值與大取樣值差異較大。

      短時過零率定義為一幀語音中信號波形通過零電平的次數(shù)。連續(xù)語音信號的過零意味著波形穿過坐標橫軸,而離散信號的過零率是計算樣本值改變符號的次數(shù)。第n幀的語音信號xn(m)的短時過零率Zn為

      (3)

      式中,sgn[·]是符號函數(shù),返回參數(shù)的正負:

      (4)

      在實際使用過程中,還會用另外一個方法來計算短時過零率。根據(jù)定義,離散信號相鄰值改變符號,則他們的乘積一定為負數(shù):

      xi(m)*xi(m+1)<0

      (5)

      根據(jù)定義,對某槍聲信號進行短時時域分析,得到槍聲波形圖如圖1所示。槍聲信號時長2 s,采樣率為44 100 Hz。槍聲波形信號在時域上具有強脈沖信號的特點[13],有很高的辨識度,幅值上升趨勢很陡,峰值持續(xù)時間極短,對應槍聲的瞬時性。槍聲短時幅度在0~50之間波動,短時能量在0~25之間波動,峰值變化區(qū)間較大,而短時過零率在槍械擊發(fā)穩(wěn)定后大多維持在5~15之間。可以看出,槍聲信號是非平穩(wěn)的、非線性的。對圖1波形圖進行局部放大得到圖2,可以看出,連發(fā)時每一次擊發(fā)產(chǎn)生的聲波形狀上大致相似,僅幅度值不同。

      1.2 頻域分析

      語音信號的頻域分析是以頻率為主分析不同頻率的成分大小,使用短時傅里葉變換可以很容易得到語音頻譜信息。短時傅里葉分析假設非平穩(wěn)信號在10~30 ms的短時間內(nèi)是平穩(wěn)的,用穩(wěn)態(tài)分析法來處理非平穩(wěn)信號。

      圖1 連發(fā)槍聲短時時域分析

      圖2 連發(fā)槍聲信號波形局部放大圖

      設槍聲信號為x(m),經(jīng)過分幀后第n幀的信號為xn(m),那么xn(m)滿足以下關系式:

      xn(m)=w(m)x(n+m),0≤m≤N-1

      (6)

      信號xn(m)的短時傅里葉變換為

      (7)

      式中,m為幀時間序號;w為角頻率:w=2πk/N,則:

      (8)

      數(shù)字信號處理過程中常用離散傅里葉變換Xn(k)代替Xn(ejw),可以用來計算功率譜函數(shù)P(n,k):

      P(n,k)=|Xn(k)|2

      (9)

      則P(n,k)是二維的非負實值函數(shù)。以時間為橫軸,頻率k作為縱軸,可以將P(n,k)的函數(shù)值表示為二維圖像,用來反映語音信號的頻譜特征,稱之為語譜圖,圖像精細化和色彩映射后就得到彩色的語譜圖。彩色的語譜圖可以直觀展現(xiàn)語音信號的共振峰與帶寬,由與橫軸平行的橫杠花紋對應的頻率和帶寬確定,而平行于縱軸的豎直條的疏密對應基音頻率的低高。

      某典型槍械連發(fā)音頻的語譜圖如圖3所示,可以清晰的看出槍聲的語譜包絡。槍聲信號時長2 s,采樣率為 44 100 Hz。從槍聲聲波形成原理來看,彈丸被高溫高壓火藥氣體推出后,在槍管中產(chǎn)生摩擦并且擠壓空氣,產(chǎn)生彈道聲波,表現(xiàn)為譜圖中具有濃郁顏色的能量分布[14]。槍口射出的氣流對空氣分子造成非線性擾動,對應語譜圖中的亂紋。連發(fā)槍聲存在明顯間隔,每次擊發(fā)造成的聲波能量條紋相似,共振峰帶寬大致相當。

      圖3 連發(fā)槍聲信號語譜圖

      通過槍聲信號的時域和頻域分析,可以得出槍聲共性特征,是非平穩(wěn)、非線性的隨機信號。但同時,連發(fā)時每一次擊發(fā)產(chǎn)生的聲波形狀上大致相似,只是幅度值不同,語譜形狀也大致相當,因此可以利用先前擊發(fā)的槍聲信號來推測后續(xù)信號。在信號處理中,將這種特性的噪聲信號看作是局部平穩(wěn)的。

      2 語音降噪研究

      在語音信號處理中,局部平穩(wěn)的噪聲信號意味著帶噪語音中的噪音和語音前導無話段噪音的統(tǒng)計特性相一致,且在后續(xù)語音段中保持不變,通常根據(jù)前導噪音來預測語音中疊加的噪音統(tǒng)計特性[15]。利用自適應濾波器可以很好地濾除這種局部平穩(wěn)噪聲。

      最小方均(Least Mean Square,LMS)自適應算法就是典型的利用自適應濾波器來處理信號,它將已知期望響應和濾波器輸出信號之間誤差的最小方均值作為標準,根據(jù)輸入信號的迭代估計梯度矢量,并更新權系數(shù)以獲得最優(yōu)濾波器。LMS算法是梯度最速下降法,運算簡單,無需先驗知識。最簡單的LMS濾波器結構如圖4所示。

      圖4 LMS濾波器結構示意圖

      濾波器的輸出矢量y(n)為

      (10)

      其中,X(n)為輸入矢量;W(n)為權系數(shù)矢量;N為濾波器階數(shù)。得到誤差e(n)為:

      e(n)=d(n)-y(n)

      (11)

      則方均誤差ε為

      ε=E[e2(n)]=E[d(n)-y(n)]2

      (12)

      將y(n)代入均方誤差式中得到

      ε=E[d2(n)]+WT(n)RW(n)-2PW(n)

      (13)

      式中,R(n)=E[X(n)+XT(n)]是N維的自相關矩陣,P=E[d(n)XT(n)]為互相關矢量。

      LMS算法是梯度最速下降法為原則的迭代算法,即可用均方誤差性能平面法的斜率來調(diào)節(jié)增量大?。?/p>

      [4]Myers-Scotton,C.A theoretical introduction to the markedness model.In Myers-Scotton.ed.Code and Consequence:Choosing Linguistic Varieties.New York,Oxford:OUP,1998:18-38.

      W(n+1)=W(n)-μ▽(n)

      (14)

      μ是自適應步長,和迭代收斂速度相關。▽(n)是梯度,用E[e2(n)]的斜率表示

      (15)

      在Widrow-Hoff的LMS算法中,用瞬時值來替代梯度估算,則最終迭代公式為

      W(n+1)=W(n)+2μe(n)x(n)

      (16)

      那么,綜上所述,對于n=1,2,3,…,迭代執(zhí)行下述步驟1)~ 4)得到最佳濾波器系數(shù)W(n),就可以構成濾波器完成對語音信號的處理:

      1) 獲得信號序列x(n)和d(n);

      2) 由式(10)計算y(n);

      3) 由式(11)估計誤差e(n);

      4) 由式(16)更新濾波器權系數(shù)W(n+1);

      3 試驗分析

      為了了解LMS自適應濾波法的降噪能力,進行語音降噪仿真實驗。實驗中,背景噪聲為某自動步槍連發(fā)槍聲,降噪前語音信號通過了FIR低通濾波器,LMS濾波器的抽頭數(shù)設置為M=32,步長因子μ=0.001。LMS降噪算法仿真波形示例如圖6所示,帶噪語音信號在降噪后語音波形幾乎保持不變,語音無明顯失真,噪聲被大大削弱,且后半段效果明顯好于前半段。

      圖5 濾波器的幅頻曲線和相頻曲線

      圖6 信噪比為5 dB時的LMS算法仿真波形

      為了考察FIR低通濾波器對降噪算法的改良作用,設置了對照試驗。同時,考慮到惡劣的戰(zhàn)場環(huán)境,更側重于噪聲嚴重場景的測試,添加槍聲噪音,根據(jù)一定比例將正常語音和噪音信號進行線性相加,得到信噪比為-15 dB、-10 dB、-5 dB、0 dB、5 dB的含噪語音信號,這五組語音信號疊加的槍聲分別來自五支不同槍械,在有無FIR低通濾波器的情況下,利用LMS算法對其降噪處理,結果如表1所示。表中可知,LMS算法對不同信噪比的槍械噪聲降噪效果不同,但都能起到很好的效果,信噪比增益都在8 dB以上;而FIR低通濾波器對信噪比的提升效果在1 dB以上,最大能達到3 dB,表明低通濾波器對槍聲高頻段和工頻噪聲起到了抑制作用。

      表1 FIR低通濾波器對降噪效果的影響結果

      為了橫向?qū)Ρ润w現(xiàn)LMS算法的優(yōu)越性,試驗另外選取了5種經(jīng)典降噪算法,分別為基本譜減法、基于多窗譜估計的改進譜減法、基于Boll的改進譜減法3種譜減法以及基本維納濾波法、基于先驗信噪比的維納濾波法兩種維納濾波法,試驗結果如圖7所示。圖中可見,在這幾種算法中,先驗維納濾波法降噪效果不佳,在5 dB時幾乎沒有效果,其他5種方法均能起到不同程度的降噪作用,LMS自適應濾波法明顯優(yōu)于其他降噪算法,在各個信噪比段均對語音信噪比有較大提升,且在實際應用中可以處理不同采樣頻率的噪聲。

      圖7 降噪算法降噪效果對比

      表2列舉了6種降噪算法在-5 dB槍聲環(huán)境下的平均運行時間,6種算法的運行環(huán)境均在同一電腦上運行,系統(tǒng)為Windows7,cpu為i5-4590。由表2可知:基本譜減法運行時間最短,但去噪效果不明顯,基于多窗譜估計的改進譜減法運行時間最長,超過1 s。LMS 濾波法運行時間為0.574 s,考慮到降噪效果,LMS自適應濾波器法在保證良好的去噪效果的同時,運行時間也控制在合理的范圍內(nèi)。

      表2 -5 dB環(huán)境下運行時間

      單獨檢驗了LMS降噪模塊的作用效果后,將其加入語音識別系統(tǒng)中,以識別準確率驗證該算法在整體識別系統(tǒng)中的降噪效果。語音識別系統(tǒng)選擇MFCC作為語音特征參數(shù),基于高斯混合模型的隱馬爾可夫模型GMM-HMM[16]作為模式匹配方法。試驗利用Matlab的數(shù)據(jù)采集工具箱控制計算機接收麥克風輸入的語音信號并傳入Matlab中,方便進行語音的存儲、播放以及信號的分析。試驗采集了5位試驗者的語音數(shù)據(jù),參與人員沒有發(fā)音障礙,對口音不做要求。每位試驗者分別朗讀8個二字指令,重復10次,記錄時長為2 s的語音數(shù)據(jù),采樣率為16 000 Hz,試驗相關參數(shù)如表3所示。隨機抽取5組作為訓練項,另外5組作為測試項。整個試驗在實驗室安靜環(huán)境下進行。同時為保證語音集的有效性,試驗前每人熟悉詞匯表5 min。試驗選擇槍聲噪音作為戰(zhàn)場環(huán)境模擬,分別以不同的信噪比將純凈語音和噪音進行合成。

      表3 試驗參數(shù)

      在0 dB信噪比下,識別系統(tǒng)對帶噪語音信號的識別效果如圖8所示。

      圖8 信噪比為0 dB時語音識別效果

      圖8中可知,LMS算法很好地濾除了語音信號中的槍聲,為后續(xù)準確的語音識別打下良好基礎。相應的語音識別結果如表4所示。表4中可見,該語音識別系統(tǒng)具有較高的識別準確率,即使對槍聲污染嚴重的語音也有80%以上的識別準確率,語音質(zhì)量得到了改善,系統(tǒng)識別率得到顯著提高。從主觀評價角度,降噪后的音頻主體指令清晰無失真,背景槍聲幾乎消失,語音可懂度較高。5種信噪比下,識別系統(tǒng)的運行時間大致相同,單個指令的平均識別時間在0.8 s左右,系統(tǒng)降噪所需時間與背景信噪比并無關聯(lián)。

      表4 仿真結果

      4 結論

      1) 槍聲波形信號在時域上具有強脈沖信號的特點,幅值上升趨勢很陡,峰值持續(xù)時間極短,連發(fā)槍聲存在明顯間隔,每次擊發(fā)造成的聲波波形大致相同,能量條紋相似,共振峰帶寬大致相當。

      2) 雖然槍聲是非平穩(wěn)、非線性的隨機信號,但通過研究發(fā)現(xiàn)可以看作局部平穩(wěn),LMS自適應濾波法可以用來削弱語音中的槍聲干擾。在LMS濾波器前先將帶噪語音信號通入FIR低通濾波器可以抑制槍聲高頻段和工頻噪聲,提升LMS濾波器降噪效果。

      3) LMS自適應濾波器法對含槍聲語音的降噪達到8 dB以上,比其他5種降噪算法效果更佳,運行時間也在可接受范圍;應用于語音識別系統(tǒng)中對孤立詞識別準確率在80%以上,主觀評價也較好,語音可懂度令人滿意,且系統(tǒng)識別單個指令只需0.8 s左右,同時具有背景噪聲信噪比不影響系統(tǒng)降噪耗時的優(yōu)點。

      猜你喜歡
      語譜槍聲噪音
      水禽耳邊有槍聲
      噪音,總是有噪音!
      鹿伏嶺的抗日槍聲
      文史春秋(2020年1期)2020-03-16 13:13:36
      無法逃避的噪音
      HR-DCGAN方法的帕金森聲紋樣本擴充及識別研究
      紅六軍團的正義槍聲
      基于時頻域特征的場景音頻研究
      噪音的小把戲
      白噪音的三種用法
      Coco薇(2017年9期)2017-09-07 22:09:28
      語譜圖二次傅里葉變換特定人二字漢語詞匯識別
      海南省| 墨江| 泌阳县| 额尔古纳市| 临沧市| 舒城县| 蓝田县| 金沙县| 永济市| 永泰县| 汉川市| 洛浦县| 瓦房店市| 无为县| 长垣县| 澄迈县| 略阳县| 金秀| 凤山市| 涿州市| 梨树县| 郎溪县| 铜山县| 敦化市| 调兵山市| 万荣县| 平阴县| 绍兴县| 乡宁县| 出国| 延边| 乌兰县| 翁牛特旗| 武宁县| 黄骅市| 易门县| 松溪县| 孟州市| 新源县| 武隆县| 乌审旗|