王煒宇 馬 蕙 王 超
(天津大學 建筑學院建筑技術(shù)研究所 天津 300072)
建筑安全問題一直是人們關(guān)注的焦點,當建筑內(nèi)發(fā)生火災等緊急情況時,提高疏散效率是疏散安全研究的重要內(nèi)容。在整個疏散過程中,減少預動階段(pre-movement)尤為重要[1],而高效的聽覺警報系統(tǒng)能夠快速地引起人們注意并提供明確的疏散信息[2],使人們更快地識別緊急情況,減少預動階段事件的不確定性,從而可以大大縮短疏散時間[3]。警報語聲相比于非語聲信號(警鈴等),可以更快地傳遞明確的行動指示,表現(xiàn)出比警報信號更短的反應時間[4]。在緊急情況下,保證緊急廣播語聲清晰明了有利于疏散成功,且人們對警報語聲的主觀感受也很重要。因此可懂度和感知緊迫性是衡量警報語聲是否有效的重要標準[5],高可懂度水平的疏散廣播保證人們更好地理解信息內(nèi)容,并在疏散尋路階段發(fā)揮重要作用[6],同時在緊迫危險的情況下,警報語聲能夠吸引聽者注意力并喚起人們的緊迫感[7],從而引起立即行動反應。
研究發(fā)現(xiàn),語速[8-11]、聲壓級[12-14]、有無警鈴[15]、語聲生成方式[16-17](自然聲或合成聲)等語聲特性因素都可能影響警報語聲的有效性。語速[8-9]是影響清晰度的重要因素,Chan 等[10]對比分析了7 種語速狀態(tài)對可懂度的影響,發(fā)現(xiàn)年輕群體在慢語速和正常語速下,可懂度保持在較高水平,語速加快至20%后,可懂度得分才逐漸下降,而老年人則在-20%慢語速下提高語速可懂度就開始下降;Yokoyama 等[11]指出在緊急情況下,應保持適當?shù)膹V播語速,慢語速可以降低感知聽聲困難程度,但所提供的緊迫感不足,不適合作為緊急語聲播報。語言聲壓級與可懂度也有顯著的正相關(guān)性且存在極限值[12],Peng[13]發(fā)現(xiàn)30 dBA 背景噪聲且語言聲壓級為55 dBA 及以下時,提高聲壓級可懂度有顯著增加;與非語言警告相同,提高語聲響度、聲壓級也可以增加感知緊迫性[14]。在警報語聲前添加警鈴等前景聲,也有助于提高可懂度和感知緊急程度[15]。此外,Mirenda 等[16]對比了不同年齡群體下3種合成語聲與自然聲在詞句可懂度上的差異,發(fā)現(xiàn)各語聲之間均存在顯著差異,且只有合成語聲單詞的可理解性得分都低于句子的可理解性得分。而Nilsson 等[17]進行的一項模擬疏散實驗中,對比了采用不同語聲生成方式的警報語聲對預移動時間的影響,發(fā)現(xiàn)合成聲警報的預移動時間更短,但兩種方式并沒有顯著差異,且合成聲音有很高的可信度。
噪聲和混響也是影響警報語聲有效性的重要因素。Peng[13]發(fā)現(xiàn)當信噪比(Signal-to-noise ratio,SNR)小于15 dB 時,可懂度隨SNR 的增加而增加;Fogerty 等[18]探究房間的聲學參數(shù),混響時間(Reverberation time,RT)和直達混響聲能比(Direct-to-reverberant ratio,DRR)對詞句的可懂度影響,其中可懂度隨RT 和DRR 的增加而降低,在RT 和DRR 的交互作用下,在低的DRR 時,RT對可懂度的影響更顯著;且噪聲和混響等條件的存在,語言理解需要調(diào)動更多的認知資源,Mishra等[19]發(fā)現(xiàn)隨著噪聲級的增加,聽聲困難程度評價也有所增加。此外語聲感知到的緊迫性也可能受到混響和噪聲影響,在無噪聲的環(huán)境下更容易感知到警告信號所帶來的緊迫感,而在噪聲環(huán)境下需要更高的響度才能彌補感知上的不足[20],而混響效果產(chǎn)生了更遠距離感和更長的持續(xù)時間[21],都可能導致感知緊迫性有所增加。
相較于年輕人,老年人感知能力、認知能力、身體機能等各方面能力水平都有所下降,當緊急情況發(fā)生時,老年人更難以感知和判斷緊急情況的發(fā)生,且信息處理能力下降,反應行動遲緩。其中在聽覺感知方面,由于老年人存在聽力受損等問題,更容易受到噪聲和高混響等不利聲學條件的影響[22],而且語言信息的理解需要分配更多注意力資源,聽清語聲內(nèi)容會更加困難[23]。因此一個安全的聲環(huán)境對老年人尤為重要,保證當發(fā)生火災等緊急情況時,老年人可以更容易地接收到清晰的警報語聲指導,從而迅速地進行安全撤離,保證生命安全。
但目前國內(nèi)外關(guān)于疏散警報語聲的研究,很少考慮實際場景中聲場因素的影響,而中文警報語聲可懂度和主觀感受評價與各因素之間的關(guān)系、各因素間的重要程度都不明確,且有必要對老年群體安全聲環(huán)境進行研究。因此,本研究通過可聽化的方法研究語聲特性及聲場因素對老年群體的警報語聲可懂度、聽聲容易程度和感知緊迫性評價的影響,并查明其主要影響因素,對比分析老年群體與年輕群體之間的評價差異,為疏散警報語聲及聲場的設計提供參考,有利于老年安全聲環(huán)境建立。
鑒于國內(nèi)并無警報語聲播報內(nèi)容的相關(guān)規(guī)范,本研究參考國外相關(guān)標準[24-25]、研究論文[2,4]及實際場景中應用的警報語聲,構(gòu)建了警報語聲素材。每句素材包含引起注意的警示語、有關(guān)緊急情況緣起的具體信息和采取的行動指示3 部分內(nèi)容,同時控制各部分信息量(3 部分信息總共控制在40 字以內(nèi)),其中各詞句均為常見的信息詞匯和指導用語,以保證句子難度處于適中水平。
采用句表評價方法,以關(guān)鍵詞正確率作為可懂度得分。通過揚聲器播放聽聲材料(如,“請注意,請注意!本賣場五層發(fā)生火災,請立即從最近的出口疏散離開,不要乘坐扶梯、電梯”),被試根據(jù)需要可在紙上記錄下劃線部分的關(guān)鍵信息,隨后進行復述,最終以復述關(guān)鍵信息的正確率作為可懂度得分。
為對可懂度進行多維評價并獲得更多的主觀評價信息,在被試完成可懂度任務后,再次播放聽聲材料,要求被試進行五尺度的聽聲容易程度和感知緊迫性主觀評價。在聽聲容易程度的評價中,要求被試回答“在您聽該警報聲的過程中,是否感覺很容易地聽清語聲內(nèi)容”問題,從“非常困難、比較困難、一般、比較容易、非常容易” (以-2 到2 代表)中進行選擇。在感知緊迫性評價中,要求被試回答“您認為該警報播放能否引起您的注意并給予足夠的緊迫感”,從“完全沒有、基本沒有、一般、有一點、完全能夠”(以-2到2代表)中選擇。
本次實驗招募被試28 人,其中老年被試共17人(男9 人,女8 人),年齡均在60 歲及以上,其平均年齡為63.4 歲;年輕被試11 人(男6 人,女5 人),平均年齡為24.7歲。采用氣導純聲聽力測試方法對其進行聽力損失測量,老年人中有9 位聽力損失在正常標準值范圍內(nèi)[26],8 位老年人存在輕度聽力損失問題,所有年輕被試聽力正常。
為探究語聲特性及聲場因素對老年人警報語聲可懂度、聽聲容易程度和感知緊迫性主觀評價的影響,進行了兩個序列實驗。
實驗序列1:語聲特性對比實驗
4 音節(jié)/秒(4 syllable/s)可以代表正常講話的速率[8],基于聽覺感受閾值和自然性[9],采用Audition 對語聲素材的時域進行壓縮或擴展20%,得到快語速(+20%)、正常語速(4 syllable/s)、慢語速(-20%)三種語速情況。語聲聲壓級的大小以去除靜聲后的聲音片段為標準(采用均方根聲壓級計算方式[27]),設置60 dB、70 dB 兩種聲壓級情況(該實驗采用A 計權(quán)聲壓級)。在部分警報語聲前添加警鈴進行對比,警鈴的基頻為500 Hz 純聲,并以1 s持續(xù)時間+0.2 s 間隔的循環(huán)方式播放5 s。專業(yè)播音員在消聲室中錄制用于本實驗的聽聲材料,為驗證自然聲(專業(yè)播音錄制)與合成聲在警報語聲可懂度方面是否存在差異,選擇合成語聲軟件制作額外的聽聲材料進行對比。在前期預實驗中,依據(jù)平均意見得分(Mean opinion score,MOS) 五尺度評價標準[28],5 名被試對7 條合成語聲的自然度進行評價,最終選定自然度評價較好(MOS=4.8)的Microsoft 合成語聲服務。實驗序列1 共包含16 個實驗刺激。
實驗序列2:聲場因素對比實驗
采用了兩種場景下的噪聲類型,一種為普通場景,另一種為緊急疏散情況下的緊急場景,前者直接在老年人常用的大型超市和醫(yī)院場景中錄制,后者在普通場景下添加呼喊聲、警報聲、碰撞聲以模擬事故現(xiàn)場的聲音。控制語言聲壓級為60 dB,并設定0 dB、10 dB 兩種SNR 情況,以模擬吵鬧和較為安靜的聲環(huán)境。RT選定為0.7 s 和2.2 s兩種條件,其中以RT 0.7 s (此數(shù)據(jù)為在超市中實際測得的RT)代表一般普通空間,RT 2.2 s 代表中庭大空間,采用Odeon 軟件進行聲學仿真,以實測0.7 s RT 為基準,通過調(diào)節(jié)各界面的吸聲材料,獲得實驗所需RT的脈沖響應。實驗序列2共包含8個實驗刺激。
聽聲材料與兩個實驗序列中的24 個實驗刺激組合后(見圖1),在半消聲室中,用左右兩個揚聲器以隨機順序播放實驗聲,實驗布置如圖2所示。信號聲壓級在聽聲位置處用聲級計進行標定,為減少地面反射對混響的影響,在桌子上鋪設毛毯。
圖1 實驗刺激組合Fig.1 Combination of experimental stimulus
圖2 實驗室揚聲器布置Fig.2 Layout of loudspeaker in laboratory
(1) 被試進入實驗室后,首先采用MAICO MA 51 聽力計進行聽力損失測試;(2) 就坐于左右兩個揚聲器位置中間,向被試講解實驗內(nèi)容流程并分發(fā)實驗記錄表后,進行實驗練習至熟練掌握;(3) 開始正式實驗,每組8 條實驗聲(每條實驗聲包含30 s 聽聲材料播放和1 min 評價)播放完成,進行3 min 短暫休息后,再進行下一組實驗,實驗共3 組,總時長約為40 min;(4) 實驗結(jié)束后,與被試進行訪談了解他們對此次實驗的感受。
結(jié)果顯示,語聲特性實驗(實驗序列1)中可懂度平均得分為79.66,老年人對所播報的大部分警報語聲內(nèi)容都能夠聽清,語速影響下的可懂度得分在72.06~86.03 之間,兩種不同語聲生成方式下的可懂度平均得分相差7.72 分,而在不同的語言聲壓級和有無警鈴影響下的可懂度得分接近平均值,結(jié)果如圖3 所示。聽聲容易程度和感知緊迫性均值分別為1.60 和0.5(評價范圍為-2~2),聽聲容易程度評價值較高且給予了一定的緊迫感。
圖3 語聲特性影響下的老年人警報語聲可懂度Fig.3 Elderly’s intelligibility score influenced by voice factors
為驗證各評價之間差異是否顯著并查明主要語聲特性影響因素,進行了多因素方差分析,結(jié)果如表1所示。
表1 (語聲特性因素)老年人可懂度及主觀評價方差分析Table 1 (voice factors) ANOVA analysis of intelligibility and subjective evaluation
在可懂度方面,語速和語聲生成方式對可懂度得分有顯著影響(p<0.05),是影響可懂度得分主要影響因素。隨著語速的提高,可懂度得分逐漸降低,慢語速(-20%)及正常語速下的可懂度得分均顯著高于快語速(+20%)下可懂度得分(p<0.01);自然聲播音的可懂度得分顯著高于合成聲(p<0.05),雖然合成聲滿足自然度方面的要求,但其可懂度仍與自然聲存在差異。而聲壓級、有無警鈴對可懂度得分沒有顯著影響。
在主觀感受評價方面,僅語速這一因素對聽聲容易程度評價有顯著影響(p<0.01)。當由慢語速(-20%)變化至快語速(+20%)后,聽聲容易程度評價逐漸降低,此時聽清并理解警報語聲內(nèi)容,明顯變得更加費力;而聲壓級大小、有無警鈴添加及不同的發(fā)音方式對聽聲容易程度評價均無顯著影響。在感知緊迫性方面,語速、聲壓級、語聲生成方式對其有顯著影響(p<0.01)。提高語速和聲壓級對感知緊迫性有顯著提升作用,經(jīng)過多重比較發(fā)現(xiàn),各語速水平下均存在顯著差異(p<0.01);合成警報語聲給予的感知緊迫性顯著低于自然聲(p<0.01);而在警報語聲前添加警鈴聲并沒有增加其感知緊迫性。綜上說明,語速、聲壓級、語聲生成方式對感知緊迫性的影響更大。
聲場因素實驗(實驗序列2)可懂度結(jié)果如圖4所示,單一聲場因素影響下的可懂度得分均值在20.96~53.73 之間,可懂度平均得分為39.21。較理想聲環(huán)境下的可懂度得分有了明顯降低,在SNR為0 dB 和RT為2.2 s 的最差聲環(huán)境下,可懂度得分僅為3.68,此時已經(jīng)無法聽清語聲內(nèi)容。聽聲容易程度和感知緊迫性均值分別為-0.87、0.12,聽聲容易程度評價值較低,感知緊迫性也有所下降。
圖4 聲場因素影響下的老年人警報語聲可懂度Fig.4 Elderly’s intelligibility score influenced by sound field factors
為驗證各評價之間差異是否顯著,并查明其主要聲場影響因素,進行了多因素方差分析,結(jié)果如表2所示。
表2 (聲場影響因素)老年人可懂度及主觀評價方差分析Table 2 (sound field factors) ANOVA analysis of intelligibility and subjective evaluation
在可懂度及容易程度主觀評價方面,SNR 和RT 均有顯著影響(p<0.01)。通過相關(guān)性分析發(fā)現(xiàn),在聲場影響因素下,可懂度和聽聲容易程度之間存在非常顯著的相關(guān)關(guān)系(皮爾遜系數(shù)為0.772)。可懂度得分和聽聲容易程度與SNR 呈正相關(guān)關(guān)系,與RT 呈負相關(guān)關(guān)系。而不同噪聲類型下的可懂度得分、聽聲容易程度主觀評價無顯著差異。而在感知緊迫性方面,噪聲類型、SNR和RT對老年人感知緊迫性也有一定的影響,但并不顯著,隨著SNR 的增加和RT 的降低,感知緊迫性有上升的趨勢。
為了比較分析老年群體警報語聲評價和感知特點,與年輕群體實驗數(shù)據(jù)進行對比發(fā)現(xiàn):
(1) 語速對老年組的影響更大。如圖5 所示,隨著語速的增加(見圖5(a)),老年組可懂度得分顯著下降(p<0.01),而年輕群體可懂度得分較高且較為穩(wěn)定,兩組群體的得分差距也隨語速增加逐漸拉開,說明語速對老年人可懂度的影響比年輕人的影響更大。在感知緊迫性上(見圖5(b)),在慢語速時,兩群體都認為警報語聲的緊迫性不足,慢速(-20%)與正常語速(4 syllable/s) 對比發(fā)現(xiàn),年輕組認為加快語速對感知緊迫性的提升更明顯;正常語速(4 syllable/s) 與快速(+20%) 進行對比發(fā)現(xiàn),快語速(+20%)對老年組的感知緊迫性有了明顯的提升,而年輕群體基本沒有增加。因此,老年人對正常語速之上的語速變化更敏感,且提升語速是增加老年人感知緊迫性的有效方法。
圖5 語速影響下可懂度得分、感知緊迫性群體對比Fig.5 Comparison of intelligibility score and perceived urgency under the influence of speech rate between the older and adult
(2) SNR 和RT 對老年組可懂度的影響是獨立的。如圖6所示,年輕組可懂度評價中SNR與RT存在顯著的交互作用,在低SNR 條件下,降低RT 對可懂度提升作用比在高SNR下更加顯著,且僅提高SNR就可以建立一個相對理想的聲環(huán)境。而對于老年組,雖然提高SNR或降低RT均可提高可懂度,但遠未達到可懂度上限,并不能實現(xiàn)較為理想的可懂度情況,因此針對老年特殊群體,為建立理想安全的聲環(huán)境,混響及SNR條件的改善都是必要的。
圖6 SNR 與RT 交互作用影響下可懂度得分群體對比Fig.6 Comparison of intelligibility score under the influence of SNR and RT interaction between the older and adult
(3) 聲壓級對老年組可懂度和聽聲容易程度的影響不大,噪聲類型對感知緊迫性沒有顯著影響。語言聲壓級由60 dB 提高至70 dB 時,老年組可懂度得分、聽聲容易程度評價均沒有進一步地提高,說明60 dB 及以上的聲壓級在足夠SNR 的情況下已經(jīng)可以保證老年人聽清內(nèi)容,基本達到可懂度上限;普通場景和緊急場景下的感知緊迫性沒有顯著差異。而年輕組60 dB 聲壓級未達上限,且緊急場景下感知緊迫性評價顯著高于普通場景(p<0.01)。
與前人研究對比發(fā)現(xiàn),適用于中文警報語聲的研究同國外相關(guān)研究結(jié)果一致,語速、SNR、RT 是影響可懂度和主觀感受聽聲容易程度的主要因素,且此結(jié)論也可以拓展到老年人這一特殊群體。通過本實驗再次明確了語速快慢、聲壓級大小以及語聲生成方式均對感知緊迫性評價有顯著的影響,而噪聲混響對其影響不大。特別地,本研究通過語聲特性及聲場因素兩個序列實驗,發(fā)現(xiàn)了各因素在3 個評價維度上影響的重要程度;并與年輕人的實驗結(jié)果對比,發(fā)現(xiàn)老年人對語速的變化更敏感,且更容易受到SNR 與RT 的獨立作用影響,因此針對老年人特殊考慮的理想且安全聲環(huán)境的建立,改善SNR、混響兩方面聲場條件都是必要的。
研究發(fā)現(xiàn)語速是影響老年人對于警報音可懂度及主觀感受評價的主要語聲特性因素,降低語速是提高可懂度的有效簡便手段。在本研究中,當語速由+20%逐漸降低至-20%時,雖然可懂度得分由72.06 提高至86.03,但感知緊迫性評價由1.09 降至-0.01,有了顯著降低,這也說明用于疏散場景下警報語聲語速不應過低,保持適當語速是有必要的。無論是年輕群體還是老年群體,采用人聲播報的警報語聲感知緊迫性顯著高于合成聲,自然聲主觀感受更加“高亢有力”。對兩種警報語聲的頻譜特性進行對比,發(fā)現(xiàn)在高頻部分(4~10 kHz)自然聲能量較合成聲更多,這可能是造成感知緊迫性有所差異的一個原因。且在可懂度方面,兩種警報語聲在年輕群體中不存在顯著差異,但對老年人而言,人聲播報的警報語聲可懂度顯著高于合成聲,根據(jù)實驗后對被試的采訪,發(fā)現(xiàn)這可能是由于合成聲所給予的緊迫感不足,老年被試認為其不符合緊急情況下語聲播報的場景,因此沒有注意聆聽所播報的內(nèi)容,并非是合成聲的播報內(nèi)容無法聽清,從而導致可懂度水平的下降。
綜上在語聲特性影響因素實驗中,發(fā)現(xiàn)可懂度得分在80 分及以上,聽聲容易程度(level>1)、感知緊迫性(level>0.5)均為正向評價時,可保證基本的警報語聲可懂度,更容易聽清播報內(nèi)容,且能夠給予人們一定的緊迫感。因此較為適合的警報語聲組合:正常語速(4 syllable/s)+自然聲播報的方式+70 dB語言聲壓級(有無警鈴均可)。
聽力損失是影響言語感知理解的主要因素,大多數(shù)老年人存有聽力損失的問題。為探究老年人聽力損失對警報語聲可懂度及主觀感受的影響,以純聲平均聽閾PTA>20 dB (WHO,2021)[26],將老年組劃分為聽力正常和聽力損失組,分別對語聲特性及聲場影響因素下的主觀評價進行單因素方差分析。在語聲特性因素實驗中,僅在感知緊迫性評價上組間產(chǎn)生顯著差異(p<0.05);在聲場影響因素實驗中,聽力損失組可懂度得分、聽聲容易程度和感知緊迫性均顯著低于正常組(p<0.01)。這表明在噪聲和混響等實際聲環(huán)境條件影響下,聽力損失對可懂度、聽聲容易程度和感知緊迫性的影響更大,因此在以老年人為主要人群的建筑場所中(如醫(yī)院、療養(yǎng)院等),需要進行更有針對性的聲環(huán)境設計。
本研究所選取的年輕人樣本較少(11 人),因此群體差異分析結(jié)果可能存在一定的局限性。但是統(tǒng)計年輕組各評價的標準差,發(fā)現(xiàn)在語聲特性實驗中,其數(shù)據(jù)結(jié)果的離散程度比較小,仍有一定代表性。關(guān)于群體差異分析結(jié)果,還需用大樣本數(shù)據(jù)對其做進一步驗證。
本文通過實驗室研究得出以下結(jié)論:
(1) 老年人警報語聲可懂度和聽聲容易程度評價主要受語速、SNR和RT的影響,且呈現(xiàn)一致的變化趨勢,即隨著語速和RT降低以及SNR的增加,老年人可懂度和聽聲容易程度得分均升高,而聲壓級(最低設置為60 dB)、有無警鈴和噪聲類型沒有顯著影響。感知緊迫性隨語速和聲壓級的增加而顯著增加,SNR、RT及有無警鈴聲對感知緊迫性并無顯著影響。采用人聲播報的警報語聲其可懂度和感知緊迫性顯著高于合成聲。
(2) 群體差異分析表明,語速對老年人的評價影響更大,且SNR和RT對可懂度的影響是獨立的;而60 dB 及以上聲壓級對可懂度和聽聲容易程度影響不大,且噪聲類型對老年人感知緊迫性沒有顯著影響。為建立老年人理想且安全的聲環(huán)境,應采用人聲播報并適當降低語速以保證可懂度,同時混響及SNR條件兩方面的改善都是必要的。
本文旨在查明在何種語聲播報特性和聲場條件下,警報語聲能夠被老年人警覺快速地識別、做出反應,并沒有針對語聲合成技術(shù)進行細致的研究,只是選用了一種預實驗中自然度評價較好的合成語聲,與自然聲進行了對比。隨著聲頻與語聲處理技術(shù)的發(fā)展,合成語聲在聽覺感知方面的失真已經(jīng)越來越小,特別像歐洲的編碼標準語聲質(zhì)量較好,并且通過語聲合成技術(shù)可以很方便地制作和調(diào)整警報語聲信息,在一定程度上可以作為人工警報音的補充替代。當然,由于老年人特殊的聽覺感知特點,如何應用合成語聲技術(shù)使之更好地服務于老年群體的緊急疏散還需要在未來進行更為深入的研究。
致謝向本課題組團隊研究成員致謝,感謝他們對本研究實驗設計、數(shù)據(jù)收集處理等工作所給予的寶貴意見,同時也對參與本次實驗的老年、青年被試們的支持表示由衷感謝。