孫杰英 孔睿迅 黃偉彬 許蘊(yùn)盈
(1.威凱檢測(cè)技術(shù)有限公司 廣州 510663;2.中國電器科學(xué)研究院股份有限公司 廣州 510300;3.廣東中創(chuàng)智家科學(xué)技術(shù)有限公司 廣州 510663)
噪聲錄制的方法手段各異,從最簡(jiǎn)單的使用帶MIC的設(shè)備(例如手機(jī)、電腦等)直接在聲源附近錄制,到使用高精度MIC陣列通過特定的拓?fù)浣Y(jié)構(gòu)在消聲室與聲源通過特定的角度進(jìn)行錄制。同樣噪聲回放也存在不同維度的異同,最簡(jiǎn)單的使用具有揚(yáng)聲器的設(shè)備(手機(jī)、電腦等)直接播放聲音文件,復(fù)雜的則需要與錄制時(shí)候的環(huán)境、設(shè)備、距離等進(jìn)行復(fù)雜的邏輯運(yùn)算及解碼后,在特定的環(huán)境使用特定的設(shè)備進(jìn)行回放。上文中不同的錄制回放手段,實(shí)現(xiàn)難度不同,在真實(shí)還原錄制時(shí)聲場(chǎng)環(huán)境時(shí)的表現(xiàn)也各異[1,2],下文則分別從錄制手段、回放手段、回放性能等方面進(jìn)行分析。
噪聲錄制環(huán)境主要指噪聲錄制場(chǎng)地的地點(diǎn)、內(nèi)外部混響,本底噪聲等。目前一般的噪聲錄制場(chǎng)地有設(shè)備使用環(huán)境(例如家居環(huán)境、咖啡廳等)、專業(yè)聲學(xué)環(huán)境(消聲室、半消聲室、混響室等)、其它自然環(huán)境(公園、森林、車流附近等)。本文主要研究智能家居測(cè)試用噪聲,所以下文主要分析典型的家居場(chǎng)景,在國內(nèi)家居場(chǎng)景一般按功能分成客廳、臥室、廚房、衛(wèi)生間等場(chǎng)景,主要分析這些場(chǎng)景及周圍的一些聲學(xué)參數(shù)及影響這些聲學(xué)參數(shù)的因素。所以本文中典型家居場(chǎng)景分為浴室、客廳、臥室以及廚房這四個(gè)場(chǎng)景。下面從這幾個(gè)場(chǎng)景特征來進(jìn)行說明。
1.1.1 混響時(shí)間
最廣泛使用來表征房間的聲學(xué)特征的參數(shù)是它的混響時(shí)間,它表示的是聲壓衰減 60 dB 所需的時(shí)間。通用標(biāo)準(zhǔn) ISO 3382-1[3]提供測(cè)量指南,通過ISO 3382-1[3]第6.2 條的擴(kuò)展的方法來確定[4],然后平均各個(gè)麥克風(fēng)的混響時(shí)間來確定總混響時(shí)間,見表1。
表1 典型家居場(chǎng)景的混響時(shí)間
1.1.2 場(chǎng)景底噪
場(chǎng)景中的本底噪聲,一般和周圍環(huán)境噪聲及場(chǎng)景中的布置有關(guān)系,一般建議在45 dB左右。
1.1.3 場(chǎng)景大小
家居場(chǎng)景的大小各不相同,但是場(chǎng)景的大小會(huì)影響到混響等聲學(xué)參數(shù),也影響使用場(chǎng)景,表2約定了一般的典型場(chǎng)景大小。
表2 典型家居場(chǎng)景的大小
1.1.4 場(chǎng)景布置
這里一般指場(chǎng)景中的一些影響聲音傳輸或者吸收的部分,例如窗簾、地毯等,也包含一般的功能性的物品,例如廚具、床等,見表3。
表3 典型家居場(chǎng)景的布置
1.2.1 手機(jī)/PC等終端
這種方法操作非常簡(jiǎn)單,直接打開設(shè)備即可以錄音,但是這些麥克風(fēng)一般具有主動(dòng)降噪的功能,在錄制環(huán)境噪聲時(shí),部分噪聲可能會(huì)被主動(dòng)降噪算法所識(shí)別,會(huì)做些降噪處理,從而影響部分真實(shí)性。
1.2.2 錄音筆等便攜設(shè)備
同樣的,錄音筆錄音操作很簡(jiǎn)單,但是錄音筆一般對(duì)人聲有加強(qiáng)作用而對(duì)噪聲會(huì)有一定的抑制,從而保障更好的錄音效果,但是在用到噪聲錄制或者交互人聲的錄制時(shí),同樣會(huì)存在失真的問題。
1.2.3 家電內(nèi)麥克風(fēng)或其它工業(yè)麥克風(fēng)
直接使用被測(cè)物品或者其它同型號(hào)的工業(yè)麥克風(fēng)測(cè)試思路非常直接,操作也很方便,但是用這些設(shè)備錄制的噪聲,回放后卻不一定能保證無失真,因?yàn)檫@些麥克風(fēng)的靈敏度和能錄制的頻率范圍一般比較低,在錄制時(shí)信息會(huì)有部分丟失,回放測(cè)試時(shí)針對(duì)性比較強(qiáng),對(duì)于錄制麥克風(fēng)和測(cè)試麥克風(fēng)不同的場(chǎng)景失真可能比較大,同時(shí),由于部分家電為了加強(qiáng)語音識(shí)別的效果,會(huì)有部分降噪和語音增強(qiáng)的算法或者處理,這些也會(huì)導(dǎo)致錄制的噪聲失真。建議用于直接測(cè)試而不是錄制需要回放的噪聲。
1.2.4 高精度麥克風(fēng)
這里主要討論靈敏度高,無降噪等處理的高精度麥克風(fēng),這些麥克風(fēng)的自噪聲較低,頻率范圍比較廣,靈敏度高,錄制的單點(diǎn)噪聲的信息量足夠。這些麥克風(fēng)一般價(jià)格相對(duì)比較昂貴,錄制時(shí)需要配套其它的設(shè)備才能錄制,錄制時(shí)的距離角度等及回放的設(shè)備都會(huì)相應(yīng)的影響還原的性能。
1.2.5 麥克風(fēng)陣列
麥克風(fēng)陣列使用多個(gè)麥克風(fēng)通過一定的拓?fù)渑帕薪M合到一起來錄制噪聲源,麥克風(fēng)陣列的結(jié)構(gòu)和麥克風(fēng)數(shù)量都會(huì)影響到錄制的難度和方法,也影響噪聲真實(shí)再現(xiàn)的難度。
波束還原技術(shù)[5]利用麥克風(fēng)陣列能非常真實(shí)的還原聲場(chǎng),但是對(duì)于麥克風(fēng)的數(shù)量要求非常多,實(shí)現(xiàn)難度較高。
本節(jié)主要討論典型的家居場(chǎng)景的錄制的聲源,在錄制的時(shí)候通過各種排列來模擬各種真實(shí)的使用場(chǎng)景,見表4。
表4 典型家居場(chǎng)景的聲源
本節(jié)主要討論典型的家居場(chǎng)景的點(diǎn)位,即典型家電的位置信息,見表5。
表5 典型家居場(chǎng)景的點(diǎn)位
噪聲回放的環(huán)境影響最后回放的效果,在一般的家居場(chǎng)景回放、則會(huì)有家居場(chǎng)景的混響和環(huán)境噪聲和錄制的混響和噪聲進(jìn)行了疊加,最終的效果則可能和錄制的噪聲存在一定的差異。
噪聲回放的設(shè)備一般是揚(yáng)聲器,可以是帶揚(yáng)聲器的設(shè)備,例如手機(jī)電腦,單獨(dú)的揚(yáng)聲器,也可以是揚(yáng)聲器陣列,一般來說,如果要真實(shí)的還原錄制的噪聲,則揚(yáng)聲器數(shù)量需要大于等于麥克風(fēng)數(shù)量且揚(yáng)聲器需要能在全頻范圍內(nèi)聲場(chǎng)平坦,能無損的播放錄制的聲源。一般這種揚(yáng)聲器的要求很難達(dá)到,數(shù)量和拓?fù)浣Y(jié)構(gòu)也很難和錄制的麥克風(fēng)保持一致,在實(shí)際使用過程中會(huì)有一定的調(diào)整。
本節(jié)提到的噪聲回放方法主要涉及以下兩個(gè)方面,一個(gè)是音源的編碼解碼問題,另一個(gè)方面在于揚(yáng)聲器陣列的控制問題。
環(huán)繞聲技術(shù)[6]使用了特殊的環(huán)繞編碼器,允許將 5通道信號(hào)從特殊的調(diào)音臺(tái)編碼到 5.1 數(shù)字?jǐn)?shù)據(jù)流。播放系統(tǒng)由一個(gè)特殊的解碼器組成,允許再次分離5個(gè)通道并將它們分配到 5.1 揚(yáng)聲器播放系統(tǒng)上。這些系統(tǒng)兼容單聲道和立體聲,可以通過特定解碼器處理較舊的 4 聲道環(huán)繞技術(shù)。環(huán)繞聲技術(shù)旨在創(chuàng)建聲學(xué)圖像,而不是接近原始錄音和再現(xiàn)。
波場(chǎng)合成技術(shù)[5]應(yīng)用惠更斯波的原理。將此原理應(yīng)用于聲學(xué)意味著可以使用揚(yáng)聲器陣列再現(xiàn)任何形式的波前,從而可以將虛擬聲源放置在聆聽區(qū)域內(nèi)的任何位置。在實(shí)際使用中,有必要將揚(yáng)聲器放置在播放室的四周。為了生成逼真的聲場(chǎng),必須單獨(dú)計(jì)算每個(gè)揚(yáng)聲器的輸入信號(hào)。為此,必須單獨(dú)記錄每個(gè)單個(gè)聲源。如果錄音是在房間里完成的,錄音室的特征也必須單獨(dú)錄制。然后在后期編輯過程和再現(xiàn)過程中混合和處理所有產(chǎn)生的音軌。然后在播放室的廣闊區(qū)域內(nèi)實(shí)現(xiàn)自然逼真的空間聲音再現(xiàn)。這種方法的缺點(diǎn)在于所需的組件:復(fù)雜的錄音系統(tǒng)、用于實(shí)時(shí)混合大量錄制音軌的強(qiáng)大計(jì)算單元以及必須安裝在聽音室中的揚(yáng)聲器數(shù)量。
HATS錄制再現(xiàn)[2]方式是為了再現(xiàn)使用人工頭部技術(shù)記錄的雙耳信號(hào)。它改善了方向和距離的印象。四個(gè)揚(yáng)聲器通常圍繞中心點(diǎn)等距放置在方形結(jié)構(gòu)中,例如2米。在人工頭部的左耳通道處測(cè)量來自兩個(gè)左側(cè)揚(yáng)聲器的傳遞函數(shù)用來均衡。以此結(jié)果設(shè)計(jì)了 IIR 和 FIR 濾波器,通過它們?cè)诨胤牌陂g對(duì)左側(cè)、右側(cè)揚(yáng)聲器的輸入信號(hào)進(jìn)行濾波,使得隨后在人工頭部左側(cè)通道上測(cè)量的傳遞函數(shù)在頻譜上是平坦的。
最小均方方法[1,7],通過八個(gè)記錄聲道記錄和八個(gè)揚(yáng)聲器回放,以達(dá)到良好的再現(xiàn)效果。 該方法基于八個(gè)重要測(cè)試位置,例如 HATS 附近,主要是手機(jī)的麥克風(fēng)位置。再現(xiàn)時(shí)相應(yīng)八個(gè)點(diǎn)的錄音聲場(chǎng)的合理再現(xiàn),在這些點(diǎn)之間也產(chǎn)生良好的再現(xiàn)精度。
聲場(chǎng)記錄技術(shù)[1,7](多點(diǎn)聲場(chǎng)記錄技術(shù))是基于聲音的優(yōu)化空間不同點(diǎn)的場(chǎng)再現(xiàn)。優(yōu)化標(biāo)準(zhǔn)基于復(fù)制的最小化每個(gè)麥克風(fēng)位置的誤差?;谶@一原則,麥克風(fēng)的位置可以在很寬的范圍內(nèi)選擇聲場(chǎng)再現(xiàn)最準(zhǔn)確的空間。方法是這些位置可以適應(yīng)要測(cè)試的設(shè)備類型,如果被測(cè)設(shè)備 (DUT) 集成了麥克風(fēng)陣列的多點(diǎn)聲場(chǎng)記錄麥克風(fēng)可以定位在 DUT 的麥克風(fēng)區(qū)域。如果要測(cè)試免提設(shè)備多點(diǎn)聲場(chǎng)記錄麥克風(fēng)位于免提設(shè)備區(qū)域。
原聲場(chǎng)和還原聲場(chǎng)應(yīng)該在聲壓[8]上保持還原,原聲場(chǎng)與模擬聲場(chǎng)對(duì)比,如表6可見,麥克風(fēng)聲壓[2]的差異應(yīng)該在±3 dB 范圍內(nèi)。
表6 聲壓對(duì)比
原始替代參考噪聲記錄的幅度曲線與再現(xiàn)寬帶噪聲的幅度曲線(均以 dB 為單位測(cè)量)應(yīng)在 ±3 dB 范圍內(nèi)。以 50 Hz 到 10 kHz 的 1/3 倍頻程和 ±6 dB 測(cè)量,所有麥克風(fēng)的平均頻譜精度應(yīng)在 ±3 dB 以內(nèi)。如圖1和圖2所示為原始聲場(chǎng)和再現(xiàn)聲場(chǎng)的頻譜對(duì)比。
圖1 原始聲場(chǎng)頻譜
圖2 再現(xiàn)聲場(chǎng)頻譜
在 100 Hz ~1 kHz 的頻率范圍內(nèi),復(fù)相干幅值應(yīng)大于0.9,以 1/3 倍頻程測(cè)量。
1~1.5 kHz 范圍內(nèi)復(fù)相干相位應(yīng)在的 ±10 度以內(nèi)和±30 度以內(nèi),以 1/3 倍頻程測(cè)量,見圖3、圖4。
圖3 100~1 000 HZ復(fù)相關(guān)幅度
圖3 1 000~1 500 HZ復(fù)相關(guān)幅度
噪聲錄制和回放的“真實(shí)”性依賴于實(shí)施方案的科學(xué)性和復(fù)雜度,綜合考慮實(shí)施的復(fù)雜度和“真實(shí)”程度,標(biāo)準(zhǔn)[1,3]涉及到的噪聲錄制回放方法都已經(jīng)形成了系統(tǒng)性的方法,實(shí)施和回放都比較方便,但是二者在應(yīng)用領(lǐng)域存在一定的差異,HATS錄制方法更適用于測(cè)試噪聲的降噪等方面的性能,而最小均衡方法和多點(diǎn)還原對(duì)于還原智能家居設(shè)備的麥克風(fēng)處的噪聲存在一定的優(yōu)勢(shì)。