何曉霖 張娟 王寧宇
聲源定位(sound localization,SL)是人們在雙耳聆聽的基礎上,輔助自身在復雜聽覺環(huán)境下溝通,并提高危險環(huán)境警惕性的能力[1]。聽障人群配戴輔聽設備后學習或重建聲源定位能力,可以提高其生活質量,有助于兒童學習、心理和發(fā)育等[2]。因此,聲源定位測試的開展成為目前研究的熱點。在其他聽覺相關測試中,如聽覺誘發(fā)電位(auditory brainstem response,ABR)。大量研究探討不同年齡段、不同聽力損失人群應當如何選擇適宜的刺激聲。但是,聲源定位測試中,針對刺激聲及其時程選擇的研究有限,各課題組使用的參數各有不同。在真實的聽音環(huán)境中,室內混響可能導致直達聲音方向發(fā)生扭曲,同時主導線索減弱使得聽者需要依靠其他線索定位,最終減弱聲源定位的準確性[3,4]。因此,本文對自由聲場下國內外相關研究進行總結,依照聲源定位測試基本概念、刺激聲及其時程影響的順序進行闡述。
評估聲源定位能力的主要行為學測試為角度識別測試(sound azimuth identification)及角度辨別測試(sound azimuth discrimination)。前者是獲得受試者聲源定位某一方位角或整體平面精密度的測試方法,通過受試者從多個隨機播放且空間分離的聲源位置中選擇發(fā)聲方位,獲取均方根誤差數值(root-mean-square error,RMSE)等衡量聲源位置識別誤差的指標。后者是獲得受試者聲源定位空間分辨率的測試方法,需要受試者在某一條件下分辨固定聲源位置的最小角度(minimum audible angle,MAA),又稱定位模糊度(localization blur)。人們主要依靠聲音信號到達雙耳時間及強度的不同,和耳廓對聲音改造后的頻譜特征進行聲源位置的定位,即耳間時間差(interaural time difference,ITD)、耳間強度差(interaural level difference,ILD)和耳廓波譜信號(spectral shape cues,SSC)。對于正弦聲,ITD等價于雙耳間的相位差,稱為耳間相位差(interaural phase difference,IPD)[5]。
非言語刺激聲在進行聲源定位測試時,主要因頻率和頻率范圍而影響結果。前者會使聽者使用不同的雙耳線索主導定位,后者根據頻率的范圍影響受聽者定位的準確性。①研究證實ITD和ILD會處理所有頻率信息,其中ITD對中低頻聲音信號起主導線索,ILD則為高頻聲音信號的主要線索,中高頻ITD和ILD的線索相較于低頻和高頻弱,故中高頻段的聲源定位相較于另外兩段差[6,7]。在言語聲的復雜聲中,人類主要使用低頻ITD線索定位聲源位置[8]。②頻率范圍足夠大,可以提供更多雙耳差異的信息,有助于提高水平面角度識別的準確性[9]。同時,聽覺系統(tǒng)可以通過對比不同頻帶的相位信息消除相位的混淆,減少選擇鏡像位置的可能[10]。
為研究聲音特性對聲源定位的影響,心理物理學研究先使用穩(wěn)態(tài)正弦聲音作為刺激聲,在耳機或消聲室環(huán)境下給聲測試[11,12]。對ITD、ILD及聲源定位測試作出了基本闡述,為之后的臨床研究奠定了有力基礎。雙工理論即低頻基于ITD,高頻基于ILD,但主要是針對純音聲源定位的解釋,在復雜聲中這一理論并不完全精確[10]。然而,在自由聲場下純音的頻率信息單一,聽者會不可避免地頭部微運動以獲取更多的定位線索[13]。因此,純音通過耳機以外的給聲形式使用存在爭議。
囀音可消除室內駐波引起的聲場不均勻性,常應用于聲場測聽。對純音不敏感的兒童、老人、耳鳴病史者,囀音更易被捕捉[14]。這是兒童純音測聽經常選擇囀音的原因。張娟等[15,16]曾使用囀音進行角度辨別測試,獲取低齡正常兒童的MAA值。但是,相比其他刺激聲,囀音是以一個頻率為中心音調周期性高低變化的聲音信號,發(fā)出的頻率信息較少,而白噪聲、帶寬較寬的窄帶噪聲等刺激聲頻率范圍較大,聽覺系統(tǒng)可通過對比不同頻帶信息消除相位混淆,因此對于嚴重耳聾患者采用囀音測試可能比白噪聲困難。4000 Hz的囀音相較于白噪聲、單音節(jié)詞、中心頻率250、2000、4000、8000 Hz的窄帶噪聲,在控制頭動和不控制頭動兩種狀態(tài)下,角度識別最難[17]。然而,這一推論還需進一步驗證。
因白噪聲等帶寬能量相等的性質,包含了ITD、ILD及SSC線索所需的頻段信號,故常見于聲源定位測試的應用。為進一步說明受聽者ITD、ILD的改變,常使用帶通濾波制作不同頻段的帶寬噪聲。噪聲的帶寬可能是影響自由聲場下水平面聲源定位測試結果的重要變量[9]。
帶寬噪聲若<1倍頻程,角度識別的準確性會受中心頻率影響[17]。研究使用中心頻率(central frequency,CF)為250、2000、4000Hz的不同帶寬噪聲進行水平前方位角度識別測試,發(fā)現(xiàn)帶寬噪聲<1倍頻程時,相較于ITD線索稍弱或ILD為主導線索的中高頻信號(CF=2000 Hz、CF=4000 Hz),以ITD為主導線索的低頻信號(CF=250 Hz)RMSE結果更好。同時隨著倍頻程的增大,3種刺激聲下的角度識別隨之準確性增高。其中,CF=250 Hz時的角度識別準確性較高,結果變化的幅度較為平緩,而CF為2000、4000 Hz時變化幅度陡峭。帶寬噪聲若>1倍頻程時,角度識別的準確性不受中心頻率影響[7,18]。因為頻率帶寬足夠寬時,確定聲源位置的ITD和ILD信息足夠多,此時定位準確性的水平相同,所以RMSE的結果便不會受中心頻率影響[7,19]。
根據以上結論證實了頻率線索增多,有助于在自由聲場下聲源位置識別的理論。與此同時,窄帶噪聲如果頻率范圍不夠大,在自由聲場下進行聲源定位測試時可能會出現(xiàn)聲像鏡像現(xiàn)象。但一般刺激聲持續(xù)時間足夠長且允許輕微頭動時,可避免聲像鏡像產生的混淆。
熟悉的揚揚格詞經常用于兒童的聲源定位測試。針對雙側人工耳蝸植入的語前聾兒童研究,言語材料可選用單音節(jié)詞、雙音節(jié)詞、有語義句子等[19~21]。部分實驗室在一組測試中使用同一言語刺激。然而,在角度識別測試中,需要刺激聲在不同位置中以一定次數播放,受試者經過幾十次甚至幾百次的反復可能形成聽覺經驗。因此,如果能豐富言語材料庫,讓刺激聲在不同位置上隨機出現(xiàn),可能有助于排除言語聲熟悉度對結果影響。
針對不同人群,可通過刺激聲豐富測試模式。Rana B等[22]對7名語后聾雙側人工耳蝸植入者進行研究,由海倫語句測試(helen sentence test)中提取男、女聲語句,這兩種刺激聲會單一或同時出現(xiàn)在同一聲源位置上,受試者不僅需要選擇聲音的位置,還需要選擇男聲、女聲、男女聲,并對句子中提出的問題做出答復。這一測試模式不僅評估了雙耳信息整合后位置的處理,還包含了認知和理解。
純音測聽為國際通用測量人聽敏度的測試,測試方法、校準等均有規(guī)范的國際標準。因時間積分效應的影響,純音測聽中刺激聲要求持續(xù)1~2 s,但在聲源定位研究中,對刺激聲時程的要求不明確。根據測試的需求,除言語聲外,刺激聲的選擇在30~700 ms不等[23~25]。但是有關刺激聲時程應當如何選擇的研究屈指可數。
不同學者均認為頭/身動會對耳的信息輸入產生積極影響[26,27]。所以測試過程中對頭動的控制尤為重要。若持續(xù)時間較短在1 s左右,受試者不需要通過特定方式去固定頭部,尤其是在中平面的研究中[28]。刺激聲時程若小于200 ms,受試者頭部會來不及在聽到聲音后運動尋找聲源[9]。然而,針對老年人及聽障人群時,刺激聲時程難免需要使用到1 s以上,此時建議對頭部進行簡單的支撐[28]。
為使用適宜的測試刺激聲,除其他因素(如頭動)對空間定位能力的影響,應探討刺激聲時程是否同空間定位能力有直接關聯(lián)。Pollack I等[29]使用耳機調控刺激聲時程發(fā)現(xiàn),在控制頭動的情況下,自3 ms起延長刺激聲時程到1000 ms,角度識別的偏差會從10°降至2°。同時Stecher GC[30]研究表明,虛擬聲場下刺激聲時長會影響耳間辨別閾,尤其是耳間時間差。由以上結論推斷,聲源定位的主要線索為ITD和ILD,其中ITD占主導。故理論上,在自由聲場下刺激聲時場亦對聲源定位能力產生影響。但Yost WA[31]對12名19~37歲健聽者使用時程25、150、450 ms的中心頻率為250、2000、4000 Hz的2倍及1/10倍頻程窄帶噪聲和寬帶白噪聲進行角度識別測試。發(fā)現(xiàn)自由聲場下聲源定位的準確性與刺激聲時長無關。此研究未將角度作為變量進行分析,僅評估了平面的整體識別能力。因此,在自由聲場下刺激聲時程對聲源定位測試的影響還有待考究。
綜上所述,為輔助不同聽力障礙者在輔聽設備狀態(tài)下?lián)碛懈玫穆犛X體驗,需要理解這一人群的空間聽覺能力。因此,聲源定位測試的開展至關重要。首先,刺激聲及刺激聲時程選擇的研究還需要進一步開展,為未來研究奠定有力基礎。其次,利用刺激聲的不同特點開發(fā)不同測試方法,全面評估受聽者的聲源定位能力,亦是學者可考慮的方向。