冀虹光,楊輝華
(1. 北京郵電大學(xué)現(xiàn)代郵政學(xué)院(自動(dòng)化學(xué)院),北京 100876;2. 北京郵電大學(xué)人工智能學(xué)院,北京 100876)
隨著科學(xué)技術(shù)和互聯(lián)網(wǎng)技術(shù)的飛速發(fā)展,不同工作領(lǐng)域產(chǎn)生的噪聲引起了社會(huì)各界學(xué)者的高度重視,噪聲的存在會(huì)對(duì)人類(lèi)的生產(chǎn)生活以及身心健康產(chǎn)生比較嚴(yán)重的影響,同時(shí)還會(huì)對(duì)機(jī)器設(shè)備產(chǎn)生負(fù)面影響,導(dǎo)致設(shè)備無(wú)法正常運(yùn)行,嚴(yán)重危害設(shè)備的使用壽命。為了更好地解決上述問(wèn)題,相關(guān)專(zhuān)家針對(duì)智能測(cè)控設(shè)備噪聲功率自適應(yīng)控制技術(shù)進(jìn)行了大量的研究[1,2],并取得了比較不錯(cuò)的研究的研究成果。例如劉覺(jué)夫等人[3]在滿(mǎn)足主用戶(hù)和其他用戶(hù)正常通信交流的條件下,將信道狀態(tài)對(duì)應(yīng)的概念全部應(yīng)用到效用函數(shù)中,增強(qiáng)對(duì)系統(tǒng)中理性用戶(hù)的自私性懲罰,確保噪聲功率得到有效控制。張啟軍[4]分析發(fā)動(dòng)機(jī)萬(wàn)有特性曲線(xiàn),將轉(zhuǎn)速和負(fù)載兩者進(jìn)行科學(xué)合理地匹配,通過(guò)匹配結(jié)果有效實(shí)現(xiàn)降噪控制。上述已有控制方法未能對(duì)設(shè)備中存在的噪聲進(jìn)行識(shí)別,導(dǎo)致穩(wěn)態(tài)誤差增加,控制結(jié)果不理想,同時(shí)音質(zhì)質(zhì)量降低。提出一種數(shù)字化智能測(cè)控設(shè)備噪聲功率自適應(yīng)控制方法,仿真結(jié)果表明,所提方法能夠全面提升音質(zhì)質(zhì)量,降低穩(wěn)態(tài)誤差,獲取滿(mǎn)意的噪聲功率自適應(yīng)控制結(jié)果。
利用圖1給出數(shù)字化智能測(cè)控設(shè)備噪聲識(shí)別的具體操作流程圖。
圖1 數(shù)字化智能測(cè)控設(shè)備噪聲識(shí)別流程圖
數(shù)字化智能測(cè)控設(shè)備噪聲識(shí)別主要?jiǎng)澐譃閮蓚€(gè)不同的階段:①異常噪聲特征提取,需要借助傳感器完成數(shù)字化智能測(cè)控設(shè)備的聲音采集[5,6],但是在實(shí)際操作的過(guò)程中存在頻譜泄露問(wèn)題,需要利用Hannning自卷積窗替換Hannning窗和Mel濾波器,得到HSCW-MFCC作為數(shù)字化智能測(cè)控設(shè)備異常噪聲特征值,同時(shí)將其輸入到SVM中進(jìn)行模式識(shí)別[7,8]。②第二階段為模式識(shí)別。
當(dāng)聲頻感知高于1000Hz時(shí),會(huì)呈非線(xiàn)性。為了更好地描述語(yǔ)音信號(hào),在對(duì)其進(jìn)行處理的過(guò)程中,主要通過(guò)Mel標(biāo)度進(jìn)行描述。利用式(1)給出感知頻率和實(shí)際頻率兩者之間的近似關(guān)系
(1)
式中,F(xiàn)Mel代表感知頻率,單位為Mel;f代表實(shí)際頻率,單位為Hz。
Mel倒頻譜系數(shù)分析方法主要是通過(guò)非線(xiàn)性劃分方法對(duì)獲取的頻譜特征進(jìn)行計(jì)算。其中,在語(yǔ)音信號(hào)預(yù)處理階段,需要通過(guò)Hanning窗截取重要的音頻信息。但是在實(shí)際操作的過(guò)程中,會(huì)存在比較嚴(yán)重的頻譜泄露問(wèn)題,同時(shí)也無(wú)法精準(zhǔn)反映數(shù)字化智能測(cè)控設(shè)備中的音頻信息。當(dāng)數(shù)據(jù)被截取,則說(shuō)明頻率一定會(huì)被泄露,導(dǎo)致各個(gè)窗函數(shù)對(duì)于頻譜泄露的抑制效果也存在十分明顯的差異,需要針對(duì)實(shí)際環(huán)境選擇符合條件的窗函數(shù)。
分別對(duì)比HSCW窗和Hanning窗頻譜特征,其中數(shù)據(jù)長(zhǎng)度為M的二階HSCW窗頻域W2(ω)計(jì)算式如下
(2)
式中,WR(ω)代表數(shù)字化智能測(cè)控設(shè)備的窗頻率響應(yīng)曲線(xiàn);e代表數(shù)據(jù)點(diǎn)的數(shù)量;j代表旁瓣的衰減速率。
通過(guò)上述分析能夠獲取兩種不同窗函數(shù)的旁瓣性能。經(jīng)過(guò)對(duì)其分析可知,HSCW窗對(duì)頻譜泄露的抑制效果明顯優(yōu)于Hanning窗,同時(shí)對(duì)異常噪聲提取的準(zhǔn)確率也明顯更高一些。
利用圖2詳細(xì)給出MFCC參數(shù)的具體提取流程。
圖2 MFCC參數(shù)提取流程圖
1)預(yù)加重
由于聲音信號(hào)高頻信噪比取值較低,借助預(yù)加重能夠全面增加信號(hào)的高頻分量和信噪比取值。其中,預(yù)加重是通過(guò)數(shù)字濾波器H(z)實(shí)現(xiàn)的,具體的計(jì)算式如下
H(z)=1-μz-1
(3)
式中,μ的取值單位在0.93至0.97范圍內(nèi);z代表信號(hào)的高頻分量。
2)分幀
將取值單位在10~30ms時(shí)間長(zhǎng)度的數(shù)據(jù)點(diǎn)設(shè)定為幀長(zhǎng),選取幀長(zhǎng)的1/5~3/5作為幀移。
3)加窗
分別對(duì)不同的幀數(shù)據(jù)進(jìn)行HSCW加窗處理。
4)對(duì)經(jīng)過(guò)預(yù)處理的音頻xi(x)進(jìn)行快速傅里葉變換,獲取音頻頻譜,信號(hào)也由時(shí)域轉(zhuǎn)換為頻域,對(duì)應(yīng)的計(jì)算式為
X(i,k)=FFT[xi(m)]
(4)
式中,X(i,k)代表信號(hào)的頻域信息。
5)計(jì)算能量譜,對(duì)應(yīng)的計(jì)算式如下
E(i,k)=FFT[xi(m)]
(5)
式中,E(i,k)代表能量譜。
6)Mel濾波器:
各個(gè)三角濾波器對(duì)應(yīng)的傳遞函數(shù)Hm(k)能夠表示為
(6)
式中,k代表三角濾波器的總數(shù);f(m)代表數(shù)字化智能測(cè)控設(shè)備對(duì)應(yīng)的信號(hào)譜能量,對(duì)應(yīng)的計(jì)算式為
(7)
7)計(jì)算采用Mel濾波器處理前后的頻譜分量。數(shù)字化智能測(cè)控設(shè)備中各幀信號(hào)主要利用Mel濾波器獲取對(duì)應(yīng)的頻譜能量,其中頻譜能量是信號(hào)頻譜能量E(i,k)和Mel三角濾波器頻域響應(yīng)Hm(k)兩者的乘積和S(i,m),具體的計(jì)算公式為
(8)
8)進(jìn)行離散余弦變換處理,獲取對(duì)應(yīng)的MFCC系數(shù)。
9)將全部特征參數(shù)進(jìn)行歸一化處理。
在上述分析的基礎(chǔ)上,采用人工蜂群算法對(duì)SVM中的全部參數(shù)進(jìn)行優(yōu)化處理[9,10],結(jié)合人工蜂群算法的優(yōu)勢(shì),解決全局和局部最優(yōu)解兩者之間存在的矛盾,有效克服SVM進(jìn)行參數(shù)尋優(yōu)時(shí)存在的弊端,更好實(shí)現(xiàn)噪聲識(shí)別。對(duì)SVM參數(shù)進(jìn)行優(yōu)化的目的是:通過(guò)ABC算法對(duì)SVM的懲罰因子C和核函數(shù)參數(shù)σ進(jìn)行選擇,確保SVM的識(shí)別結(jié)果達(dá)到最佳。以下給出數(shù)字化智能測(cè)控設(shè)備噪聲辨識(shí)的具體操作步驟:
1)將全部參數(shù)進(jìn)行初始化處理;
2)形成M個(gè)初始坐標(biāo)解xi;
3)在M個(gè)已知坐標(biāo)附近分別進(jìn)行搜索,獲取對(duì)應(yīng)的目標(biāo)函數(shù)值;
4)將初始坐標(biāo)解和目標(biāo)函數(shù)值兩者進(jìn)行對(duì)比,同時(shí)利用貪婪選擇算法判定是否需要進(jìn)行坐標(biāo)更新;
5)獲取已知坐標(biāo)系在新一輪搜索過(guò)程中被選中的幾率;
6)通過(guò)貪婪選擇算法選擇局部最優(yōu)解和對(duì)應(yīng)的坐標(biāo)值;
7)相同坐標(biāo)被搜索多次如果依據(jù)沒(méi)有更新,則直接拋棄該坐標(biāo),同時(shí)采取xij替換坐標(biāo),有效實(shí)現(xiàn)全局最優(yōu)搜索;
8)通過(guò)計(jì)算得到目標(biāo)函數(shù)的最大值和具體坐標(biāo)值,其中坐標(biāo)值即為算法的最優(yōu)解;
9)判斷算法是否達(dá)到最大收斂次數(shù),如果達(dá)到,則輸出最優(yōu)解;反之,則跳轉(zhuǎn)至步驟2)。
為了更好實(shí)現(xiàn)噪聲功率自適應(yīng)控制,需要借助噪聲功率自適應(yīng)控制系統(tǒng)完成控制。通過(guò)橫向結(jié)構(gòu)FIR濾波器進(jìn)行濾波處理,其中長(zhǎng)度設(shè)定為M。實(shí)際應(yīng)用過(guò)程中,不需要考慮次級(jí)源噪聲對(duì)控制系統(tǒng)產(chǎn)生的影響。
設(shè)定r(n)代表濾波-x信號(hào),具體的表達(dá)形式為
r(n)=[r(n),r(n-1),…,r(n-M+1)]T
(9)
通過(guò)一系列推導(dǎo)能夠獲取濾波-x遞歸最小二乘算法的權(quán)重矢量更新關(guān)系,表示為[11,12]
(10)
式中,W(n-1)代表橫向?yàn)V波器的權(quán)重系數(shù);R-1代表聯(lián)合估計(jì)參數(shù);e(n)、g(n)和μ(n)分別代表不同的權(quán)重矢量;rT(n)代表預(yù)測(cè)誤差向量的取值范圍;λ代表聯(lián)合估計(jì)參數(shù)的最優(yōu)解。
基于QR分解的最小二乘格型自適應(yīng)濾波器算法是通過(guò)多個(gè)不同的階段完成的,具體如下所示:
1)自適應(yīng)前向預(yù)測(cè);
2)自適應(yīng)后向預(yù)測(cè);
3)自適應(yīng)聯(lián)合估計(jì)。
結(jié)合上述分析,能夠獲取濾波算法對(duì)應(yīng)的有源前饋噪聲功率控制系統(tǒng)。進(jìn)行格型聯(lián)合估計(jì)的主要目的就是根據(jù)參考濾波構(gòu)建級(jí)源信號(hào),利用式(11)給出格型的具體預(yù)測(cè)過(guò)程
(11)
式中,fm(n)和bm(n)代表不同類(lèi)型的次級(jí)源信號(hào);kf,m和kb,m分別代表fm(n)和bm(n)對(duì)應(yīng)的前向反饋系數(shù)。
其中,控制系統(tǒng)的殘余噪聲e0(n)能夠表示為
e0(n)=d(n)-y(n)·hs(n)
(12)
式中,y(n)代表后向反射系數(shù);hs(n)代表聯(lián)合估計(jì)過(guò)程對(duì)應(yīng)的權(quán)值系數(shù)取值范圍。
針對(duì)自適應(yīng)前后向預(yù)測(cè)過(guò)程,需要將采集到的信號(hào)全部轉(zhuǎn)換為濾波-x信號(hào)r(n)。同時(shí)應(yīng)引用自適應(yīng)聯(lián)合估計(jì)器對(duì)數(shù)字化智能測(cè)控設(shè)備噪聲功率自適應(yīng)控制系統(tǒng)內(nèi)的全部參數(shù)進(jìn)行自適應(yīng)修正,得到各個(gè)類(lèi)型信號(hào)對(duì)應(yīng)的聯(lián)合估計(jì)回歸參數(shù)更新式
1)全局誤差關(guān)系更新式Βm-1(n)為
Βm-1(n)=λΒm-1(n-1)+εb,m-1(n)
(13)
式中,εb,m-1(n)代表各階殘余誤差的更新關(guān)系。
2)各階殘余誤差的更新關(guān)系εb,m-1(n)表達(dá)式為
εb,m-1(n)=bm-1(n-1)+kb,m(n)-d(n)
(14)
通過(guò)上述分析,將濾波器結(jié)構(gòu)和自適應(yīng)算法相結(jié)合,對(duì)控制器的內(nèi)部結(jié)構(gòu)進(jìn)行有效簡(jiǎn)化,最終有效控制測(cè)控設(shè)備噪聲功率,詳細(xì)的操作步驟如下所示:
1)優(yōu)先對(duì)數(shù)字化智能測(cè)控設(shè)備噪聲進(jìn)行辨別,有效識(shí)別異常噪聲。
2)經(jīng)過(guò)步驟1)操作后,確保在理想狀態(tài)下,由傳遞函數(shù)、脈沖響應(yīng)以及系數(shù)更新共同組建的通路是完全相等的。
3)將濾波器算法和自適應(yīng)算法兩者進(jìn)行有效結(jié)合,同時(shí)確保更新環(huán)節(jié)中全部關(guān)鍵參數(shù)之間的關(guān)聯(lián)。
4)對(duì)系統(tǒng)內(nèi)的輸入信號(hào)進(jìn)行初始化處理,將其輸入到經(jīng)過(guò)簡(jiǎn)化處理的控制器中,最終完成數(shù)字化智能測(cè)控設(shè)備噪聲自適應(yīng)控制。
為了驗(yàn)證所提數(shù)字化智能測(cè)控設(shè)備噪聲功率自適應(yīng)控制方法的綜合有效性,進(jìn)行仿真測(cè)試。
1)噪聲功率自適應(yīng)控制效果分析
優(yōu)先采集數(shù)字化智能測(cè)控設(shè)備的噪聲功率變化情況,將其作為測(cè)試對(duì)象,分別采用所提方法、文獻(xiàn)[3]方法和文獻(xiàn)[4]方法進(jìn)行噪聲自適應(yīng)功率控制,具體的控制結(jié)果如圖3所示。
圖3 不同方法的噪聲功率自適應(yīng)控制效果對(duì)比
分析圖3可知,所提方法的噪聲功率自適應(yīng)控制效果明顯優(yōu)于另外兩種方法。主要是因?yàn)樗岱椒ㄔ趯?shí)際應(yīng)用的過(guò)程中,針對(duì)數(shù)字化智能測(cè)控設(shè)備噪聲進(jìn)行辨識(shí),及時(shí)剔除異常噪聲,有效為后續(xù)的噪聲功率控制奠定了堅(jiān)實(shí)的基礎(chǔ),確??刂菩Ч_(dá)到最佳狀態(tài)。
2)音質(zhì)質(zhì)量評(píng)估
將三種經(jīng)過(guò)噪聲功率自適應(yīng)控制后的語(yǔ)言樣本分別輸入到感知語(yǔ)音質(zhì)量評(píng)估軟件中,分別從噪聲殘留以及語(yǔ)言失真等多個(gè)方面進(jìn)行評(píng)估,獲取各組測(cè)試語(yǔ)音的客觀評(píng)分。其中采用百分制評(píng)分機(jī)制,具體實(shí)驗(yàn)結(jié)果如表1所示:
表1 不同方法的音質(zhì)質(zhì)量評(píng)估結(jié)果對(duì)比
分析表1中的實(shí)驗(yàn)數(shù)據(jù)可知,所提方法能夠獲取比較滿(mǎn)意的音質(zhì)質(zhì)量評(píng)估結(jié)果,評(píng)估得分明顯高于文獻(xiàn)[3]方法和文獻(xiàn)[4]方法,充分證明了所提方法的優(yōu)越性。
3)穩(wěn)態(tài)誤差/%
為了更進(jìn)一步驗(yàn)證所提方法的優(yōu)越性,以下實(shí)驗(yàn)測(cè)試對(duì)比三種不同方法的穩(wěn)態(tài)誤差,具體實(shí)驗(yàn)結(jié)果如圖4所示。
圖4 不同方法的穩(wěn)態(tài)誤差對(duì)比結(jié)果
分析圖4中的實(shí)驗(yàn)數(shù)據(jù)可知,穩(wěn)態(tài)誤差的取值越小,則說(shuō)明噪聲功率自適應(yīng)控制結(jié)果越理想。在三種方法中,所提方法的穩(wěn)態(tài)誤差明顯更低一些,充分驗(yàn)證了所提方法的優(yōu)越性,同時(shí)更進(jìn)一步證明了所提方法能夠獲取更好的控制效果。
針對(duì)已有噪聲功率自適應(yīng)控制方法存在的問(wèn)題,提出一種數(shù)字化智能測(cè)控設(shè)備噪聲功率自適應(yīng)控制方法。測(cè)試結(jié)果表明,所提方法能夠大幅度降低穩(wěn)態(tài)誤差,增加音質(zhì)質(zhì)量,獲取更加理想的噪聲功率自適應(yīng)控制結(jié)果。
對(duì)于一個(gè)完整的噪聲功率控制方法而言,不僅需要考慮控制系統(tǒng)的控制性能,同時(shí)還需要考慮聲源以及聲場(chǎng)等相關(guān)信息,所以所提方法仍然存在不足,后續(xù)將繼續(xù)對(duì)該方法進(jìn)行改進(jìn)。