王永雄,劉 杰,陳家運(yùn)
(青島理工大學(xué),山東 青島 266520)
基于傳聲器陣列的聲定位系統(tǒng)研究與設(shè)計
王永雄,劉杰,陳家運(yùn)
(青島理工大學(xué),山東青島266520)
摘要:對當(dāng)前傳聲器陣列定位技術(shù)特點(diǎn)、關(guān)鍵技術(shù)等做了深入分析后,提出一種改進(jìn)的廣義互相關(guān)(GCC)時延估計算法,在元GCC算法基礎(chǔ)上,加入了加窗分幀與靜音檢測(VAD)判斷法,彌補(bǔ)了原算法針對室內(nèi)回響混響干擾的不足。系統(tǒng)以LabVIEW結(jié)合MATLAB為仿真平臺,討論了五元十字陣列在不同條件下的定位精度,實(shí)驗表明:系統(tǒng)能夠比較準(zhǔn)確的對半空間域的低空聲源進(jìn)行定位,并能夠?qū)崿F(xiàn)多個聲源判決定位,具有一定現(xiàn)實(shí)意義。
關(guān)鍵字:傳聲器陣列;廣義互相關(guān);被動定位;五元十字陣
聲源定位技術(shù)是利用聲學(xué)和電子裝置接受并處理聲場信號,以確定聲源位置的一種技術(shù)。傳聲器陣列是指由若干個傳聲器按一定的幾何結(jié)構(gòu)排列而成的陣列,它具有很強(qiáng)的空間選擇性,可以在一定的范圍內(nèi)實(shí)現(xiàn)聲源的定位與跟蹤[1]。目前,傳聲陣列主要有:一字陣、十字陣、圓形陣和球星陣。它們被廣泛應(yīng)用與軍事和工業(yè)領(lǐng)域,此外,在視頻會議、視頻監(jiān)控、故障診斷、聲控機(jī)器人等民用項目中也風(fēng)靡開來。
基于聲傳感器陣列的定位技術(shù)大體上分為三類:(1)基于可控波束形成的定位技術(shù);(2)基于子空間的定位技術(shù);(3)基于到達(dá)時延估計的定位技術(shù)[2]。本文采用基于時延估計的定位技術(shù),與其他定位技術(shù)相比,它計算量小,有利于實(shí)時快速處理。為盡可能地降低室內(nèi)混響和噪聲的影響,提高聲源定位系統(tǒng)精度,提出一種改進(jìn)的廣義互相關(guān)(GCC)時延估計算法,在元GCC算法基礎(chǔ)上,加入了加窗分幀與靜音檢測(VAD)判斷法,彌補(bǔ)了原算法針對室內(nèi)回響混響干擾的不足。在定位陣列上,文中選擇具有陣列冗余、分維特性小的平面五元十字陣,以達(dá)到測量誤差最小的目的[3]。仿真結(jié)果表明設(shè)計的聲陣列定位成像系統(tǒng)行之有效。
時延估計(Time-delay estimation, TDE)即時間延時估計,就是利用聲傳感器陣列接受目標(biāo)聲源信號,不同位置位置傳感器接受到的聲源信號所需要的時間不同,然后根據(jù)這個時間差值來確定目標(biāo)信號的空間位置[4]。
對于TDE算法,其中廣義互相關(guān)(GCC)算法應(yīng)用最為廣泛[5]。通過求兩信號之間的互功率譜,并在頻域內(nèi)給予接受信號一定的加權(quán),來抑制噪聲和反射的影響,再將加權(quán)后信號反變換到時域得到兩信號之間的互相關(guān)函。其峰值位置即為兩信號之間的相對時延。
以兩個拾音器為例,設(shè) X1(n),X1(n), 分別是拾音器到信號源之間的數(shù)字信號波形,分別為:
式中,V1(n),V2(n)表示通道噪聲,假設(shè)為高斯白噪聲。
拾音信號間的廣義互相關(guān)函數(shù)為:
圖1 時延估計流程
在各種陣型定位方式中,五元十字陣有利于室內(nèi)布陣,對三維空間的目標(biāo)定位精度高。平面五元十字陣的定位原理如圖2所示。
圖2 平面五元十字陣原理圖
經(jīng)過處理化簡最后可得:
對于室內(nèi)混響模型的建立,我們針對性對其設(shè)計了一種改進(jìn)的廣義互相關(guān)時延估計(GCC)算法,以盡可能地消除降低室內(nèi)混響和噪聲的影響,提高聲源定位系統(tǒng)精度。改進(jìn)后的廣義互相關(guān)時延估計算法框圖如圖3所示:
圖3 改進(jìn)算法框圖
假設(shè)兩傳聲器信號經(jīng)過帶通濾波處理和幅值標(biāo)準(zhǔn)化,A/D 數(shù)模轉(zhuǎn)換后分別為x1(n),x2(n),加窗選擇漢明窗,采樣點(diǎn)為512,重疊1/2,選擇半重疊漢明窗的好處是可以使互相關(guān)函數(shù)的峰值更加尖銳,語音信號互功率譜估計的精度也就得以提高。
4.1傳感器
該系統(tǒng)的硬件包括一個含4個高保真監(jiān)聽拾音器組成的平面十字傳聲器陣列。
4.2數(shù)據(jù)采集卡
數(shù)據(jù)采集卡采用北京啟創(chuàng)莫非電子科技公司的MPS-010602,它是基于USB總線。該數(shù)據(jù)采集卡提供了采用C,C++,LabVIEW等多種編程語言編寫的庫函數(shù),方便使用者編寫調(diào)用。
4.3信號調(diào)理
為了將信號調(diào)整到A/D轉(zhuǎn)換器的輸入范圍,以便充分利用A/D轉(zhuǎn)換器的滿量程分辨率,這里對由高通濾波器輸出的信號進(jìn)行再次放大。主要放大器電路如圖4所示。
圖4 信號調(diào)理電路
4.4軟件設(shè)計
近幾年流行的LabVIEW是一種圖形化編程方式,LabVIEW實(shí)現(xiàn)界面簡便,但對算法的支持非常有限;Matlab具有強(qiáng)大的科學(xué)計算功能、大量穩(wěn)定可靠的算法庫,但界面開發(fā)能力較差?;谝陨显?,利用混合編程技術(shù)在LabVIEW中調(diào)用和操作Matlab,就可以相互補(bǔ)充,充分發(fā)揮兩者的優(yōu)勢。系統(tǒng)組成如圖5所示。
圖5 系統(tǒng)軟件組成
采用LabVIEW實(shí)現(xiàn)主控程序界面如圖6所示。
圖6 主控程序界面
對于平面十字陣進(jìn)行實(shí)際實(shí)驗操作,通過傳感器采集信號,并在系統(tǒng)中對所采集的信號進(jìn)行處理。用多路傳感器進(jìn)行采集,采集的信號及處理結(jié)果如圖7所示。
圖7 輸入信號時域波形
時延估計值對應(yīng)圖中相關(guān)函數(shù)峰值的位置,采樣率由于受到了限制,時延估計的大小只能取到199Ts,這種情況滿足不了實(shí)驗要求,為了提高時延估計精度,采用插值法和時域相關(guān)法,進(jìn)行時延估計處理采集到的實(shí)驗信號。
圖8 改進(jìn)的廣義互相關(guān)時延估計
將所得時延值代入編寫好的對聲源點(diǎn)的計算的LabVIEW中的Matlab窗口程序中,我們選擇陣形大小L=0.705m,將陣形用于室內(nèi)聲源目標(biāo)定位,聲速取C=340m/s。圖9是平面五元十字陣的定位仿真。
圖9 五元十字陣定位結(jié)果
仿真結(jié)果表明設(shè)計的系統(tǒng)可行,能夠達(dá)到比較高的定位精度,定位誤差小,能滿足精確被動聲定位的要求。本文的研究對室內(nèi)低空目標(biāo)的定位跟蹤和識別均有重要的研究參考價值和工程應(yīng)用前景。
參考文獻(xiàn):
[1]陳華偉.低空目標(biāo)聲測無源定向理論與算法研究[D].西安:西北工業(yè)大學(xué),2004.
[2]張偉.基于傳聲器陣列的被動聲定位研究[D].南京:南京理工大學(xué),2006.
[3]張莉.基于傳聲器陣列的聲源定位方法研究[D].成都:電子科技大學(xué)圖書館,2007.
[4]孫韶杰,孫紹俊,一種改進(jìn)的聲測定位時延估計算法[J].計算機(jī)應(yīng)用,2006(11):2696-2698;
[5]Bian X, Rehg J, Abowd G.Sound Source Localization in Domestic Environment.in:Pervasive Computing:Third International Conference.2004.19-36.
[6]Allen J, Berkley D.Image method for efficiently simulating small-room acoustics.J.Acoust.Soc.Am.1979(04):943-950.
[7]周浩洋.基于麥克風(fēng)陣列的聲源定位方法研究[D].大連:大連理大學(xué),2007.