姚 越,楊立東,王 晶,董桂官
(1.內(nèi)蒙古科技大學(xué)信息工程學(xué)院,內(nèi)蒙古 包頭 014000; 2.北京理工大學(xué)信息與電子學(xué)院,北京 100081;3.中國(guó)電子技術(shù)標(biāo)準(zhǔn)化研究院,北京 100176)
傳統(tǒng)的三維音頻可以分為多聲道三維音頻和雙耳三維音頻。多聲道三維音頻主要通過(guò)揚(yáng)聲器的排列呈現(xiàn)三維音頻的效果,而雙耳三維音頻則是通過(guò)頭相關(guān)傳遞函數(shù)[1](HRTF,Head Related Transfer Functions)實(shí)現(xiàn)的,它利用原始音頻與其時(shí)域?qū)?yīng)的頭相關(guān)沖激響應(yīng)(HRIR,Head-Related Impulse Response)進(jìn)行卷積[2],從而得到包含聲源與聽音者間方位角、高度角和距離的雙耳三維音頻信號(hào),其對(duì)硬件需求較小,方便攜帶。但是,由于人耳對(duì)距離感知是由強(qiáng)度、混響、頻譜及雙耳間差異等復(fù)雜因素共同決定的[3],所以僅通過(guò)HRIR無(wú)法合成距離信息準(zhǔn)確的雙耳三維音頻。因此,探究人耳對(duì)三維音頻的距離感知特性,尤其是實(shí)際聲場(chǎng)環(huán)境下的表現(xiàn),對(duì)于提升三維音頻空間聽覺效果的研究及其應(yīng)用具有參考價(jià)值。
近年來(lái),一些學(xué)者提出了基于距離的三維音頻恢復(fù)和編碼的方法。2014年,Zahorik P等人結(jié)合混響與幅度調(diào)制技術(shù),提高了在混響環(huán)境中,單聲道音頻的距離感知效果[4]。2016年,Spagnol S等人提出了近場(chǎng)聲像濾波器模型,通過(guò)使用延遲回饋濾波器組實(shí)現(xiàn)距離恢復(fù)函數(shù)模型[5]。2017年,Koutny等人提出了利用球諧函數(shù)分解的聲源距離恢復(fù)算法,該算法主要用于多通道三維音頻系統(tǒng)中的雙耳三維音頻恢復(fù)[6]。2019年,李念等人研究了聽覺距離線索感知特性和定位機(jī)理及其在3D音頻編碼中的應(yīng)用[7]。
傳統(tǒng)的三維音頻感知特性的研究主要針對(duì)水平角和高度角,但隨著基于距離的音頻重建和編碼的提出,部分學(xué)者也展開了對(duì)三維音頻距離的感知特性的研究。2016年,法國(guó)布雷斯特大學(xué)的Mathieu Paquier等人開展了聽覺、視覺對(duì)距離感知影響的聯(lián)合研究[8]。2017年,武漢大學(xué)楊乘等人對(duì)三維空間距離感知特性進(jìn)行了研究[9]。
綜上所述,一方面實(shí)際應(yīng)用中對(duì)三維音頻空間距離感知性能的要求提高,另一方面?zhèn)鹘y(tǒng)的三維音頻感知特性的研究主要集中在水平面和垂直面,對(duì)三維空間內(nèi)距離感知特性的研究較少,相關(guān)實(shí)驗(yàn)主要是通過(guò)在消音室中不同位置的聲音進(jìn)行采集后,受試者利用耳機(jī)進(jìn)行測(cè)聽,最終得到三維音頻的感知特性,鮮有在實(shí)際的聲場(chǎng)環(huán)境下進(jìn)行測(cè)量。傳統(tǒng)的實(shí)驗(yàn)環(huán)境雖然可以滿足對(duì)不同方位感知敏感度的測(cè)量,但是削弱了對(duì)距離的感知。針對(duì)上述存在的問(wèn)題,筆者在三維音頻感知特性的實(shí)驗(yàn)基礎(chǔ)上,充分考慮其他因素對(duì)距離感知特性的影響,設(shè)計(jì)了三維音頻距離感知特性的實(shí)驗(yàn),采用受試者現(xiàn)場(chǎng)測(cè)聽,通過(guò)改變距離、角度得到相關(guān)數(shù)據(jù),并進(jìn)行統(tǒng)計(jì)分析得到三維音頻距離感知敏感度的變化情況和不同距離的距離感知閾值。
由于環(huán)境和人體自身的生理結(jié)構(gòu)等因素的影響,人耳對(duì)音頻方位的變化存在一定的感知閾值,只有當(dāng)空間方位的變化達(dá)到一定閾值時(shí),人才能感受到方位的變化,這種感知閾值被稱為恰感知差異(JND,Just Notice Difference)[10]。距離感知敏感度(DPS,Distance Perception Sensitivity)是指人耳對(duì)音頻在距離變化的感知特性。
傳統(tǒng)的感知敏感度實(shí)驗(yàn)主要圍繞角度的變化進(jìn)行測(cè)試,測(cè)試主要通過(guò)采集消音室中不同角度的聲音,通過(guò)耳機(jī)進(jìn)行角度辨別,最終得到感知敏感度。但是,這種傳統(tǒng)測(cè)試方式得到的DPS會(huì)受到一些因素的影響,首先,受試者在使用耳機(jī)進(jìn)行測(cè)聽實(shí)驗(yàn)時(shí),往往會(huì)因?yàn)轭^中定位(IHL,Inside-the-head Localization)的影響[11],感覺聲像主要集中在人頭內(nèi)部,不能很好地感知距離的變化;其次,根據(jù)研究,在混響情況下,人耳對(duì)聲源方向的定位能力不如在消音室中,相反,人耳對(duì)聲源距離的定位能力在混響情況下比消音室里更準(zhǔn)確[7]。綜上所述,本實(shí)驗(yàn)安排在長(zhǎng)6.2 m、寬3.4 m、高2.8 m的聽音實(shí)驗(yàn)室中進(jìn)行,該房間經(jīng)過(guò)吸聲處理,室內(nèi)環(huán)境噪聲不大于40 dB,混響時(shí)間約為0.4 s,該混響時(shí)間既可以滿足聽音室的混響時(shí)間要求,又更加接近日常室內(nèi)環(huán)境的混響時(shí)間。
對(duì)于研究不同距離DPS的實(shí)驗(yàn),把揚(yáng)聲器固定在一個(gè)標(biāo)有刻度且可以前后移動(dòng)的支架上,支架高度為使揚(yáng)聲器與人耳處在同一高度,通過(guò)控制移動(dòng)揚(yáng)聲器控制聲源到人耳的距離。對(duì)不同水平角度的DPS進(jìn)行測(cè)量的實(shí)驗(yàn),采用旋轉(zhuǎn)座椅來(lái)調(diào)整角度,如圖1所示。
圖1 距離感知敏感度測(cè)試示例
實(shí)驗(yàn)使用的揚(yáng)聲器為JBL Control 12C-VA吸頂揚(yáng)聲器,該揚(yáng)聲器的凈尺寸為3 in(7.6 cm),頻響范圍在68 Hz~17 kHz。該揚(yáng)聲器方便固定和移動(dòng),同時(shí)由于其尺寸較小,可以更好地滿足本次測(cè)試的需求。考慮到揚(yáng)聲器移動(dòng)過(guò)程中產(chǎn)生的噪聲影響測(cè)試結(jié)果,支架使用了靜音軌道,其在移動(dòng)過(guò)程中產(chǎn)生的輕微噪聲可以忽略不計(jì)。
由于高斯白噪聲沒有嚴(yán)格的周期性,可以有效地減少相位混淆現(xiàn)象的發(fā)生,同時(shí)高斯白噪聲包含全頻帶的頻率成分,所以本次實(shí)驗(yàn)使用高斯白噪聲作為主觀聽音測(cè)試的音頻信號(hào),由Audition生成,時(shí)為長(zhǎng)600 ms,采樣率48 kHz、精度16 bit單聲道,最高頻率為20 kHz,最低頻率為20 Hz。
參與本實(shí)驗(yàn)的有8名測(cè)試人員,其中5名男性,3名女性,年齡在20~25歲之間,都有主觀三維音頻的相關(guān)聽音實(shí)踐經(jīng)驗(yàn)。在測(cè)聽實(shí)驗(yàn)之前,受試者需要進(jìn)行三維音頻距離感知的聽音訓(xùn)練,使其可以更好地判斷遠(yuǎn)近。在聽音訓(xùn)練結(jié)束后,受試者需要完成參考音為100 cm,測(cè)試音為125 cm的固定點(diǎn)的聽音測(cè)試,測(cè)試過(guò)程中參考音和測(cè)試音會(huì)隨機(jī)播放,共40次,測(cè)試人員需要在2 s內(nèi)判斷聲音遠(yuǎn)近變化,最終只有當(dāng)正確率超過(guò)80%才可以參與正式的測(cè)聽實(shí)驗(yàn)??紤]到受試者需要對(duì)136個(gè)測(cè)試點(diǎn)進(jìn)行測(cè)聽,每個(gè)測(cè)試點(diǎn)可能需要測(cè)聽30次以上,所以在測(cè)試前會(huì)告知受試者本次測(cè)聽的具體步驟,同時(shí)在每個(gè)測(cè)試點(diǎn)測(cè)聽結(jié)束后,會(huì)讓受試者休息5 min,以提高受試者的測(cè)聽效率和測(cè)試結(jié)果的準(zhǔn)確性。
實(shí)驗(yàn)采用經(jīng)典心理聲學(xué)中1up/2down的心理測(cè)試方法[9],該方法包含了多輪測(cè)試,每一輪測(cè)試的測(cè)試信號(hào)都依賴于前一輪的測(cè)試結(jié)果。1up/2down的意思為:當(dāng)受試者連續(xù)兩次判斷正確時(shí),系統(tǒng)在當(dāng)前測(cè)試值的基礎(chǔ)上,減小參考音與測(cè)試音之間的步長(zhǎng);如受試者判斷錯(cuò)誤,則將增大參考音與測(cè)試音之間的步長(zhǎng),生成新的測(cè)試值。記每一次步長(zhǎng)變化為一次反轉(zhuǎn)(n)。
根據(jù)前期的預(yù)實(shí)驗(yàn)結(jié)果,實(shí)驗(yàn)將變化步長(zhǎng)(Sn)的初始值設(shè)為50 cm,步長(zhǎng)變換次數(shù)記為n,實(shí)驗(yàn)過(guò)程中步長(zhǎng)(Sn)變化公式:
對(duì)于步長(zhǎng)變化時(shí)存在的小數(shù)部分四舍五入,以保證實(shí)驗(yàn)過(guò)程中步長(zhǎng)變化的最小值為1 cm。
根據(jù)初始步長(zhǎng)和步長(zhǎng)變換公式,模擬使用1up/2down心理測(cè)試方法測(cè)試,當(dāng)參考音為50 cm時(shí)步長(zhǎng)的變化情況,如圖2所示。可以看到,測(cè)試音的初始值從100 cm降到接近參考音50 cm時(shí),需要經(jīng)過(guò)13次反轉(zhuǎn)。從第5次反轉(zhuǎn)之后,測(cè)試值接近平穩(wěn)。所以,在本次實(shí)驗(yàn)過(guò)程中將反轉(zhuǎn)次數(shù)設(shè)為13次,對(duì)最后五次的步長(zhǎng)變化后的測(cè)試距離求平均值,得到某一位置的DPS。
圖2 50 cm時(shí)測(cè)試音的變化情況示意圖
實(shí)驗(yàn)測(cè)量了聲源距離到人耳50 cm、65 cm、80 cm、100 cm、120 cm、140 cm、160 cm、180 cm、200 cm、225 cm、250 cm、275 cm、300 cm、340 cm、380 cm、420 cm、465 cm,共17個(gè)距離的數(shù)據(jù);對(duì)應(yīng)每個(gè)距離的測(cè)量垂直角均為0°,水平角如圖3所示,為0°、15°、30°、45°、75°、90°、135°、180°的DPS,每個(gè)實(shí)驗(yàn)人員共需要進(jìn)行136組聽音測(cè)試。
圖3 實(shí)驗(yàn)測(cè)量范圍示意圖
本實(shí)驗(yàn)具體流程,如圖4所示。
圖4 實(shí)驗(yàn)流程圖
步驟一:根據(jù)需要測(cè)聽的水平角和距離,確定固定測(cè)聽點(diǎn)作為參考音,選取水平角相同,距離相差一個(gè)初始步長(zhǎng)的音頻信號(hào)作為測(cè)試音。
步驟二:隨機(jī)播放參考音與測(cè)試音。兩段測(cè)試信號(hào)的長(zhǎng)度均為600 ms,兩段信號(hào)間的移動(dòng)的時(shí)間間隔控制在1 s內(nèi)。
步驟三:受試者需在2 s內(nèi)做出選擇,判斷步驟二中播放的音頻信號(hào)的位置變化情況,即判斷第二個(gè)音頻信號(hào)離第一個(gè)音頻信號(hào)更近或更遠(yuǎn)。測(cè)試人員做出選擇后無(wú)法更改,直接執(zhí)行下一步驟。
步驟四:當(dāng)連續(xù)兩次判斷正確時(shí),將減小距離步長(zhǎng);為了保證實(shí)驗(yàn)的準(zhǔn)確性,實(shí)驗(yàn)允許無(wú)法判斷的情況出現(xiàn),當(dāng)連續(xù)出現(xiàn)兩次無(wú)法判斷的情況時(shí),則按判斷錯(cuò)誤處理,增大距離步長(zhǎng);進(jìn)入步驟五。
步驟五:根據(jù)白噪聲的特性,長(zhǎng)時(shí)間的測(cè)聽實(shí)驗(yàn)可能會(huì)造成受試者產(chǎn)生疲勞,影響測(cè)試結(jié)果。所以,當(dāng)實(shí)驗(yàn)測(cè)試測(cè)試次數(shù)大于40次,記該位置的DPS為0,并退出本次測(cè)試;實(shí)驗(yàn)測(cè)試次數(shù)小于40次,同時(shí)反轉(zhuǎn)次數(shù)大于13次,則取最后五次的測(cè)試值的平均值為該位置的DPS,否則返回步驟二繼續(xù)進(jìn)行測(cè)聽。
受試者在測(cè)聽過(guò)程中可能會(huì)出現(xiàn)對(duì)某一位置的聲音信號(hào)無(wú)法準(zhǔn)確定位的情況。也就是,當(dāng)受試者經(jīng)過(guò)40次測(cè)聽,同時(shí)翻轉(zhuǎn)次數(shù)小于13次的情況時(shí),則將該點(diǎn)的DPS記為0。本次實(shí)驗(yàn)中共有三組數(shù)據(jù)出現(xiàn)這種情況。插值法是離散函數(shù)逼近常用的一種方法,通過(guò)插值方法可以構(gòu)造連續(xù)曲面經(jīng)過(guò)的全部離散點(diǎn),同時(shí)根據(jù)有限個(gè)已知點(diǎn)的值推導(dǎo)未知點(diǎn)的值。本實(shí)驗(yàn)利用多項(xiàng)式插值法對(duì)這些數(shù)據(jù)進(jìn)行替換。
多項(xiàng)式插值法[12]以表示某條線段的前一個(gè)端點(diǎn),表示該線段的后一個(gè)端點(diǎn),則對(duì)于在范圍內(nèi)的橫坐標(biāo)為x的點(diǎn),其高度y為:
其中,yi和yi+1的兩個(gè)參數(shù)稱為基函數(shù),二者之和為1,分別代表yi和yi+1對(duì)插值點(diǎn)高度的權(quán)值。
不同角度時(shí)D P S 隨距離的變化如圖5 所示,在50~160 cm時(shí),距離感知敏感度的變化較為緩慢;在160~465 cm時(shí),距離感知敏感度的變化較為明顯。在測(cè)量距離相同的情況下,不同角度的DPS的變化趨勢(shì)大致相同。
圖5 不同角度時(shí)DPS隨距離的變化情況
不同距離D P S 隨角度的變化如圖6 所示,在45°~75°時(shí),不同距離的DPS都有一個(gè)明顯的下降,即在這一區(qū)間內(nèi),人耳對(duì)距離的變化更為敏感;測(cè)量角度為0°和180°時(shí),在距離相同的情況下,DPS基本一致。
圖6 不同距離時(shí)DPS隨角度的變化情況
為了研究整個(gè)測(cè)量范圍內(nèi)DPS的變化情況,在已有的實(shí)驗(yàn)數(shù)據(jù)基礎(chǔ)上,采用三次樣條插值的方法對(duì)測(cè)量范圍內(nèi)數(shù)據(jù)進(jìn)行擬合。三次樣條插值是通過(guò)構(gòu)造分段多項(xiàng)式進(jìn)行插值,從而可實(shí)現(xiàn)較小的插值誤差[13],其定義為:
設(shè)在區(qū)間[a,b]上給定一個(gè)分割
如果定義在[a,b]上的一個(gè)函數(shù)S(x)滿足下列條件:
EDMUND:No.I walked out to the beach.I haven't seen him since this afternoon.
(2)在整個(gè)區(qū)間[a,b]上,S(x)為二階連續(xù)可導(dǎo)函數(shù),也就是說(shuō)在每個(gè)節(jié)點(diǎn)處
則稱S(x)為三次樣條插值函數(shù)。
通過(guò)對(duì)實(shí)驗(yàn)范圍內(nèi)各點(diǎn)進(jìn)行插值擬合,最終得到了距離感知敏感度的曲面圖,如圖7所示。隨著距離的增大DPS的整體變化呈現(xiàn)增大趨勢(shì),即隨著距離的增大,人對(duì)聲源距離的感知減小。在60°~90°區(qū)間內(nèi),DPS出現(xiàn)下降,即人對(duì)聲源距離變化的感知在左右兩側(cè)更為明顯,這與2017年武漢大學(xué)楊乘等人對(duì)不同DPS測(cè)量數(shù)據(jù)擬合得到的DPS變化趨勢(shì)基本一致[9]。
圖7 測(cè)量范圍內(nèi)距離感知敏感度曲面圖
傳統(tǒng)的實(shí)驗(yàn)僅僅對(duì)DPS的變化趨勢(shì)進(jìn)行分析,為了進(jìn)一步研究距離和角度對(duì)DPS的影響,實(shí)驗(yàn)對(duì)現(xiàn)有數(shù)據(jù)進(jìn)行多元線性回歸分析,其具體數(shù)學(xué)模型如下:
假設(shè)某一因變量y受k個(gè)自變量的影響,其中n組觀測(cè)值為。那么,多元線性回歸模型的結(jié)構(gòu)形式為:
通過(guò)對(duì)現(xiàn)有的實(shí)驗(yàn)數(shù)據(jù)進(jìn)行分析,得到角度(x1)和距離(x2)對(duì)DPS的影響。如圖8所示,圖中P-val的值表示樣本間差異由抽樣誤差所致的概率,當(dāng)P-val<0.05為顯著,P-val<0.01為非常顯著,可以看到x1=0.00,x2=0.95,由此可以得到距離是DPS的主要影響因素。
圖8 距離和角度對(duì)DPS的影響
距離感知閾值(DPT,Distance Perception Threshold)是指當(dāng)距離的變化達(dá)到一定閾值時(shí),人才能感受到距離的變化。通過(guò)對(duì)本實(shí)驗(yàn)數(shù)據(jù)的分析得到100 cm、200 cm、300 cm的距離條件下的DPT,方便進(jìn)行下一步的研究。上文已經(jīng)對(duì)影響DPS的因素進(jìn)行了分析,得到角度不是影響DPS的主要因素,所以在研究DPT時(shí),排除角度的因素。
通過(guò)對(duì)相同距離的DPS統(tǒng)計(jì),得到了測(cè)量距離為100 cm、200 cm和300 cm的DPT的分布情況,如圖9、圖10、圖11所示。從統(tǒng)計(jì)結(jié)果中發(fā)現(xiàn),當(dāng)測(cè)量距離為100 cm和200 cm時(shí),DPT較為集中,測(cè)量距離為300 cm時(shí)DPT分布的較為分散,和上文得到DPS隨距離變化的結(jié)論一致。
圖9 測(cè)量距離100 cm 距離感知閾值的分布情況
圖10 測(cè)量距離200 cm 距離感知閾值的分布情況
圖11 測(cè)量距離300 cm 距離感知閾值的分布情況
標(biāo)準(zhǔn)偏差用來(lái)描述各數(shù)據(jù)偏離平均數(shù)的距離(離均差)的平均數(shù)。標(biāo)準(zhǔn)差能反映一個(gè)數(shù)據(jù)集的離散程度,標(biāo)準(zhǔn)偏差越小,這些值偏離平均值就越少,反之亦然。其公式如下:
通過(guò)去除部分偏差較大的值后,對(duì)相關(guān)數(shù)據(jù)分析得到,測(cè)量距離為100 cm時(shí),距離感知閾值的平均值為7.62 cm,其中最小值為1 cm,最大值為14.4 cm,標(biāo)準(zhǔn)偏差為3.98 cm。測(cè)量距離為200 cm時(shí),距離感知閾值的平均值為15.76 cm,其中最小值5.4 cm,最大值28.2 cm,標(biāo)準(zhǔn)偏差為6.0 cm。
本實(shí)驗(yàn)設(shè)計(jì)了三維音頻感知敏感度的實(shí)驗(yàn),使用高斯白噪聲作為聲源,通過(guò)改變水平角和距離,測(cè)量了水平方向0~180°,距離50~465 cm內(nèi)136個(gè)測(cè)量點(diǎn)的DPS。根據(jù)實(shí)驗(yàn)數(shù)據(jù),分析了距離、角度對(duì)距離感知敏感度的影響規(guī)律。相較于角度等其他因素,距離為影響DPS的主要因素;50~160 cm時(shí),DPS的變化較小,160~465 cm時(shí),DPS的變化較大;人對(duì)聲源距離變化的感知在人耳的左右兩側(cè)更為明顯;得到了不同距離時(shí)的距離感知閾值。在后續(xù)工作中,將擴(kuò)大實(shí)驗(yàn)測(cè)量的范圍,加入高度角等因素,以及音量、混響等交叉因素的綜合影響,繼續(xù)完善三維音頻感知敏感度的研究。