梅鐵民,苑麗蘋
(沈陽(yáng)理工大學(xué)信息科學(xué)與工程學(xué)院,遼寧 沈陽(yáng) 110168)
混響效應(yīng)是由聲音在封閉空間中經(jīng)內(nèi)部各個(gè)反射面多次連續(xù)反射而產(chǎn)生的。描述混響效應(yīng)強(qiáng)弱的一個(gè)重要參數(shù)是混響時(shí)間(reverberation time,RT)。根據(jù)國(guó)際標(biāo)準(zhǔn) ISO 3382-1:2009(E)(acoustics-measure ment of room parameters,part 1:performance spaces)§3.5,在一個(gè)封閉空間中,聲源停止發(fā)聲后,聲能密度的空間均值衰減60dB所需時(shí)間定義為混響時(shí)間[1]。
混響時(shí)間做為描述封閉空間內(nèi)聲音衰減快慢程度的物理量,是建筑物音響效果設(shè)計(jì)中的一個(gè)重要的客觀評(píng)價(jià)參數(shù)。在現(xiàn)代語(yǔ)音信號(hào)處理中,混響時(shí)間還是語(yǔ)音場(chǎng)景分析、錄音環(huán)境識(shí)別、去混響等研究中的重要參數(shù)[2-3]。根據(jù)混響時(shí)間對(duì)未知錄音環(huán)境進(jìn)行辨識(shí)技術(shù)將在刑偵、反恐、版權(quán)保護(hù)等領(lǐng)域有著重要應(yīng)用。
賽賓(Sabine)經(jīng)過大量實(shí)驗(yàn),第一個(gè)給出了混響時(shí)間計(jì)算公式[4-5],指出了混響時(shí)間與房間的體積、內(nèi)部反射面的面積及反射面吸聲系數(shù)之間的關(guān)系。當(dāng)聲反射較弱時(shí),賽賓公式誤差較大,因此Eyring提出一個(gè)修正公式[6-7]。為了更準(zhǔn)確描述混響問題,還有很多研究者提出進(jìn)一步的修正,如文獻(xiàn)[8-9]所給出的算法。
由賽賓等人的公式可見,混響時(shí)間是一個(gè)與聲源及聲接收器位置無(wú)關(guān)的量,它僅依賴于房間的幾何尺寸(容積及內(nèi)表面積)及聲學(xué)屬性(吸聲系數(shù)),因此混響時(shí)間又是一個(gè)表征封閉空間幾何結(jié)構(gòu)與聲學(xué)屬性的重要參數(shù)。
近年來(lái),盲混響時(shí)間估計(jì)問題已經(jīng)引起人們?cè)絹?lái)越多的重視[2,10]:在聲源信號(hào)未知的情況下,只根據(jù)一段錄音信號(hào)來(lái)估計(jì)錄音房間的混響時(shí)間。
混響時(shí)間估計(jì)的一個(gè)重要方法為施羅德法[11]?;诜块g沖激響應(yīng)的施羅德法估計(jì)的混響時(shí)間依賴于聲源及接收器在房間中的相對(duì)位置,因此在國(guó)際標(biāo)準(zhǔn)ISO 3382-1&2:2009(E)中規(guī)定進(jìn)行多點(diǎn)測(cè)量并取均值。這種方法并不能完全消除測(cè)量結(jié)果對(duì)聲源(接收器)位置的依賴關(guān)系。如何消除這種依賴關(guān)系將是本文研究的重點(diǎn)。
當(dāng)對(duì)一個(gè)給定房間進(jìn)行混響時(shí)間測(cè)量時(shí),通常并不是從賽賓等人的公式出發(fā),即通過測(cè)量房間的體積及總吸聲量來(lái)間接地計(jì)算混響時(shí)間,而是通過用聲源激勵(lì)房間,并根據(jù)接收到的聲音信號(hào)來(lái)估計(jì)混響時(shí)間。這是一種直接測(cè)量方法,比賽賓等人的計(jì)算公式更準(zhǔn)確。在國(guó)際標(biāo)準(zhǔn)ISO 3382-1&2:2009(E)中詳細(xì)地介紹了聲源激勵(lì)下房間混響時(shí)間的測(cè)量方法:噪聲信號(hào)突然中斷法和沖激響應(yīng)積分法(即施羅德方法)[1,10]。
由此得到T60所滿足的方程為
這就是混響時(shí)間的施羅德反向積分算法。
在實(shí)踐中,采用施羅德方法,通常選取能量衰減曲線的近似線性衰減部分,用最小二乘法進(jìn)行直線擬合,延長(zhǎng)擬合直線至與-60dB水平線相交,交點(diǎn)所對(duì)應(yīng)的時(shí)間即為估計(jì)的混響時(shí)間RT。
在仿真實(shí)驗(yàn)中,選取3個(gè)不同尺寸的矩形房間(長(zhǎng)×寬×高):房間A為15 m×7 m×3 m;房間B為11 m×7 m×3m;房間 C 為 9m×7m×3m。標(biāo)準(zhǔn)坐標(biāo)系下,聲源位于 S(3m,2m,1.2m);20 個(gè)接收器位置如下(單位:m):房間沖激響應(yīng)由聲學(xué)鏡像法仿真而得[12]。
理論上,聲源與接收器位置互換,沖激響應(yīng)是不變的,故在本實(shí)驗(yàn)中,聲源位置固定而改變接收器的位置。在仿真中,由于能量衰減曲線線性部分的分貝值變化較大(這可能與房間沖激響應(yīng)聲學(xué)鏡像模型有關(guān)),所以直接取其線性部分進(jìn)行最小二乘直線擬合并延長(zhǎng)該直線至-60dB而得到不同房間的RT值及其標(biāo)準(zhǔn)差,見表1。從表1可見,3個(gè)房間RT的標(biāo)準(zhǔn)差比較大,這反映了接收器(聲源)位置對(duì)RT的影響。圖1為房間A的20條能量衰減曲線及相應(yīng)的擬合直線,直觀地反映了施羅德方法估計(jì)的RT值對(duì)接收器(聲源)位置的依賴關(guān)系。房間B、C給出類似結(jié)果。
表1 3個(gè)不同大小房間混響時(shí)間的施羅德方法結(jié)果
圖1 房間A的能量衰減曲線及其線性部分?jǐn)M合直線
顯然,本仿真結(jié)果與混響時(shí)間不依賴于聲源及接收器位置的理論相矛盾。為解決這一問題,將對(duì)施羅德方法進(jìn)行修正。
通過仿真研究發(fā)現(xiàn),施羅德方法中不同接收器(聲源)位置所對(duì)應(yīng)的能量衰減曲線的擬合直線幾乎平行,但卻很分散,如圖1所示,從而影響到混響時(shí)間的估計(jì)。能量衰減曲線的分散性是由零時(shí)刻接收器接收信號(hào)的平均功率上下波動(dòng)所引起的。接收器零時(shí)刻的接收信號(hào)是聲源直達(dá)信號(hào)與零時(shí)刻之前的所有反射波的疊加,其平均功率可能大于聲源功率,也可能小于聲源功率,這完全取決于接收器(聲源)所在位置。但是在聲源停止發(fā)射后的短暫時(shí)間內(nèi),聲波經(jīng)過若干次反射后,整個(gè)空間中聲波將趨于均勻分布,與聲源及接收器所在位置無(wú)關(guān),任意點(diǎn)的接收信號(hào)的統(tǒng)計(jì)平均功率都相同,并且只依賴于聲源信號(hào)的強(qiáng)弱。正因?yàn)榻邮掌髁銜r(shí)刻的接收信號(hào)平均功率隨接收器(聲源)位置的這種波動(dòng),導(dǎo)致施羅德方法給出的能量衰減曲線將隨接收器(聲源)位置變化而上下偏移,從而導(dǎo)致所估計(jì)的混響時(shí)間也隨接收器(聲源)位置而上下波動(dòng)。
對(duì)于一個(gè)平穩(wěn)的聲源信號(hào),其平均功率與接收器(聲源)位置無(wú)關(guān),因此在修正的施羅德方法中,定義能量衰減曲線為麥克風(fēng)接收信號(hào)的平均功率與聲源信號(hào)的平均功率之比的對(duì)數(shù),即:
采用同樣一組數(shù)據(jù),修正的施羅德方法的仿真結(jié)果列于表2中。由表2可見,對(duì)同一個(gè)房間不同聲源(接收器)位置的混響時(shí)間估計(jì)值的標(biāo)準(zhǔn)差很小,說明混響時(shí)間幾乎不依賴于聲源(接收器)位置。在圖2中給出了房間A修正的施羅德方法的能量衰減曲線p′(t)。由圖2可見,修正的能量衰減曲線的線性部分幾乎重合,說明聲源(接收器)位置對(duì)混響時(shí)間估計(jì)沒有影響。此外,由圖2也看到,在t=0時(shí)刻,p′(0)的值有正有負(fù),說明由于房間內(nèi)各種反射面反射信號(hào)的存在,接收點(diǎn)信號(hào)可能得到加強(qiáng)或消弱,但這只是一個(gè)短暫的過程。當(dāng)經(jīng)過若干次反射之后,整個(gè)房間中聲波趨于均勻分布,因而聲源(接收器)位置對(duì)它的影響很快消失,從而所有p′(t)趨于一致。為比較起見,在圖2中給出了圖1中所有擬合直線的平均位置(圖中虛線),此圖說明施羅德方法中的空間平均只能部分地消除聲源(接收器)位置影響。
表2 3個(gè)不同大小房間混響時(shí)間的修正施羅德方法結(jié)果
圖2 房間A的修正施羅德方法的能量衰減曲線及其線性部分的擬合直線
對(duì)比表1和表2,A、B、C 3個(gè)房間的施羅德算法RT相對(duì)于修正施羅德算法RT′的偏差分別為58.3ms、-6.2ms和-33.2ms。對(duì)于這一偏差,解釋如下:
首先,比較式(1)和式(3),得到
在能量衰減曲線的線性部分,兩者的擬合直線的斜率相等(差別非常小,見圖1)且均為k,縱軸截距之差為
所以由兩者得到的混響時(shí)間之差為
對(duì)于給定房間,斜率k值恒定,因此平均混響時(shí)間偏差等于
計(jì)算結(jié)果列于表3,與直接由表1和2計(jì)算的偏差值一致。
表3 修正前后兩種方法估計(jì)RT的偏差計(jì)算
在施羅德方法中,接收器信號(hào)平均功率衰減60 dB是相對(duì)于其零時(shí)刻的平均功率,而這一平均功率依賴于接收器(聲源)位置,因而提出接收器信號(hào)平均功率相對(duì)于源信號(hào)的平均功率衰減60dB作為混響時(shí)間的定義。仿真實(shí)驗(yàn)表明,本文提出的修正的施羅德方法可以有效地消除接收器(聲源)位置對(duì)房間混響時(shí)間估計(jì)的影響。
[1]ISO 3382-1:2009(E)Acoustics—Measurement of room acoustic parameters—Part 1:Performance spaces[S].2009.
[2]Yilmaz E.Algorithms for estimating reverberation characteristics for single channel dereverberation [D].Aachen:RWTH Aachen University,2010.
[3]Larsen E,Schmitz C D,Lansing C R,et al.Acoustic scene analysis using estimated impulse responses[C]∥IEEE Proc the Thirty-Seventh Asilomar Conference on Signals,Systems and Computers 2003(1):725-729.
[4]孫廣榮.混響時(shí)間百年研究[J].電聲技術(shù),2008(6):4-5.
[5]李敏毅,孫海濤,吳杰歆,等.混響時(shí)間及測(cè)量方法簡(jiǎn)介[J].中國(guó)測(cè)試技術(shù),2005,31(1):18-20.
[6]Eyring C F.Reverberation time in‘dead’rooms[J].Journal of Acoustical Society of America,1930(1):217-241.
[7]張武威.關(guān)于室內(nèi)混響時(shí)間的計(jì)算問題[J].電聲技術(shù),2005(3):17-20.
[8]Fitzroy D.Reverberation formulae which seems more accurate with non-uniform distribution of absorption[J].Journal of the Acoustical Society of America,1959(31):893-897.
[9]Neubauer R O.Estimation of reverberation time in rectangular rooms with non uniformly distribued absorption using a modified Fitzroy equation[C]∥Proc of the Seventh International Congress on Sound and Vibration,2000:1709-1716.
[10]Ratnam R,Jones D L,Wheeler B C,et al.Blind estimation of reverberation time[J].Journal of the Acoustical Society of America,2003,114(5):2877-2892.
[11]Schr?der M R.New method of measuring reverberation time[J].Journal of the Acoustical Society of America,1965(3):409-412.
[12]Allen J B,Berkley D A.Image method for efficiently simulating small-room acoustics[J].Journal of the Acoustical Society of America,1979,65(4):943-950.