陳飛帆 肖永濤 黃美佳
作者單位:浙江中醫(yī)藥大學(xué)醫(yī)學(xué)技術(shù)學(xué)院 杭州 310053
職業(yè)用嗓者是指以嗓音為核心工作工具的人,該群體用嗓強度高,加上個體對自身嗓音狀況認(rèn)識不一,往往是嗓音疾病的高發(fā)人群[1]。正常人嗓音疾病的患病率為6%~9%,而教師患病率為52.86%[2];營銷人員的嗓音發(fā)病率和教師群體無顯著性差異[3]。職業(yè)用嗓者群體的嗓音疾病主要為慢性喉炎、聲帶小結(jié)及聲帶息肉[4];王慧[5]對180名女性教師嗓音參數(shù)及嗓音障礙技術(shù)的調(diào)查顯示71.2%的教師存在嗓音不適感,以咽干,音啞,發(fā)聲易疲勞為突出表現(xiàn);嘶啞、喉痛喉癢等為演員的主要嗓音癥狀[6]。因此,職業(yè)用嗓者的嗓音問題是一個亟待解決的社會問題。
現(xiàn)有的嗓音聲學(xué)分析軟件主要以Dr.Speech,MDVP,EVA[7]為主,大多對測量環(huán)境的要求很高且設(shè)備價格高昂,難以在篩查和監(jiān)測中大范圍的使用。筆者在調(diào)研嗓音軟件和應(yīng)用市場的基礎(chǔ)上,構(gòu)思設(shè)計并研發(fā)一款基于安卓平臺的便攜式移動端嗓音聲學(xué)監(jiān)測APP,通過聲學(xué)分析對嗓音提供定量分析,評估發(fā)聲功能和嗓音現(xiàn)狀,為職業(yè)用嗓者提供客觀的參考指標(biāo)。此軟件適合日常工作生活中高強度用嗓的人群,包括教師、營銷人員、培訓(xùn)師、歌手、相關(guān)專業(yè)學(xué)生等。用戶喉部無明顯器質(zhì)性病變,但常出現(xiàn)聲嘶、咽癢、咽痛等喉部不適等情況。
軟件功能主要分為聲學(xué)參數(shù)分析與嗓音壓力分析與管理。
利用軟件對環(huán)境背景噪聲進行監(jiān)測,當(dāng)背景噪聲低于45 dB時則通過背景噪聲測試,進入測試界面。對首次使用用戶軟件有文本提示,測試時用戶距手機麥克風(fēng)10 cm,發(fā)/a/聲持續(xù)6 s,強度65~75 dB,具體流程見圖1。
圖1 軟件流程圖
不同于診斷,本軟件以監(jiān)測為主,所以選擇聲學(xué)參數(shù)時更注重各個參數(shù)的代表性以及覆蓋性。Jitter、Shimmer、HNR分別反映當(dāng)前的嗓音狀況的嘶啞度,疲勞度,粗糙度,較符合職業(yè)用嗓者日常所面臨的3種主要問題。
1.1.1 聲學(xué)參數(shù)設(shè)置 Jitter,Shimmer是反映嗓音信號相鄰周期之間的基頻和振幅的微小變化,稱為振幅微擾(Shimmer)及基頻微擾[8](Jitter)。正常發(fā)聲時,聲帶在氣流動力及喉的神經(jīng)肌肉協(xié)調(diào)作用下節(jié)律性開閉、振動,嗓音聲學(xué)性質(zhì)相對穩(wěn)定,當(dāng)聲帶病理改變時,將發(fā)生紊亂并摻入噪聲成分,上述噪音聲學(xué)參數(shù)將發(fā)生相應(yīng)增加。HNR[9]是信號聲與噪聲的比值,是嘶啞的一個客觀指標(biāo),喉病嘶啞的特點是噪音成分相對增多,諧波成分相對減少,對發(fā)現(xiàn)疾病、判定療效有重要意義,在病態(tài)時嗓音的比值顯著降低。
1.1.2 聲學(xué)參數(shù)標(biāo)準(zhǔn) 參考葉志騰[10]與龔齊[11]的成人嗓音分析參數(shù),基于軟件進行實測矯正。得出嗓音聲學(xué)參數(shù)結(jié)果評級見表1。
通過手機的麥克風(fēng),將聲音錄制成wav格式,后通過互聯(lián)網(wǎng)傳輸?shù)椒?wù)器,服務(wù)器儲存音頻文件并且通過后臺程序和Praat開源代碼合作,分析音頻后返還數(shù)據(jù)給APP,APP再自動生成分析報告。Praat是一種用于語音分析與合成的軟件,其主要功能是對自然語言的語音信號進行采集、分析和標(biāo)注,并執(zhí)行包括變換和濾波等在內(nèi)的多種處理任務(wù)。作為分析結(jié)果的文字報表和語圖,不但可以輸出到個人計算機的磁盤文件中和終端的顯示器上,更能夠輸出為精致的矢量圖或位圖。
1.3.1 嗓音壓力監(jiān)測 軟件根據(jù)用戶參數(shù)數(shù)據(jù)分析出嗓音壓力表。根據(jù)教師日常作息時間將每日分為3個主時段:早上8~12點(次時段到1點前)、下午14點~18點(次時段到18:30前)、晚上19點~23點。用戶每日需測試6次以上,每次間隔1 h以上,軟件后臺為了保證每日各時段的嗓音參數(shù)的代表性,每時段需測試兩次以上。從而將每個時段切割成至少兩段,每段至多兩小時。軟件將護嗓周期設(shè)置為從用戶此次測試后到下次測試前的最長時間間隔:2小時。用戶每次數(shù)據(jù)都會自動歸納到3個時段,后臺將數(shù)據(jù)進行統(tǒng)計計算,得出每一時段的嗓音壓力情況。若一時段中參數(shù)為一級的占比超過60%,則該時段為綠色,同理二級和三級分別為黃色和紅色。壓力表中綠色代表為用戶個人嗓音處于的正常壓力范圍,黃色代表嗓音的壓力略超出正常范圍,紅色代表嗓音壓力已超出用戶承受范圍。用戶可根據(jù)所反映的壓力值,適時休息以及調(diào)整嗓音使用的合理安排。
1.3.2 嗓音壓力管理 嗓音壓力管理模式是針對減緩慢性嗓音疾病所開發(fā)的實時護嗓模式。用戶通過2小時不同強度和組合的針對性護嗓,達到減輕喉部不適和聲音嘶啞、抑制嗓音病理性積累、預(yù)防嗓音疾病發(fā)生的效果。護嗓環(huán)參考耳鼻喉科醫(yī)師的指導(dǎo)和建議,建立了喝水頻率、休聲建議表和音量控制表,擁有簡單易行,即時有效,針對性強的特點。軟件以嗓音壓力表為衡量標(biāo)準(zhǔn),將用戶最近一次的所得等級與嗓音壓力表中相同時段的前后兩次統(tǒng)計值進行比較,會得出低于、等于、高于統(tǒng)計值3種結(jié)果。對于3種情況,軟件會給出如下的判斷,用戶便可在接下來2小時之內(nèi)按照要求進行護嗓,具體如表2。
設(shè)計完成后,項目組選擇15名嗓音正常志愿者進行測試。年齡不超過25歲;經(jīng)檢查確認(rèn)喉部結(jié)構(gòu)正常,口鼻腔功能正常,聲帶生理情況良好且無功能性嗓音障礙,能正常發(fā)聲;測試前兩周內(nèi)無嗓音疾病或不適以及呼吸道疾病。13名通過測試標(biāo)準(zhǔn),8男5女,耳齡20~23歲,平均年齡21.6歲。測試方法為分別在Praat軟件與本軟件測試,發(fā)/a/聲持續(xù)6 s,強度65~75 dB。
表1 聲學(xué)參數(shù)標(biāo)準(zhǔn)
表2 量化護嗓表(2小時內(nèi))
計算各參數(shù)在本軟件與Praat軟件測得的偏差值結(jié)果見表3。
表3 嗓音正常者本軟件與Praat軟件測試結(jié)果
結(jié)果顯示本軟件測試結(jié)果與Praat軟件的測試結(jié)果相比,Jitter與Shimmer值偏差值相對較小,HNR值偏差仍有待提高。究其主要原因可能為:由于本次測試模擬用戶測試真實環(huán)境,環(huán)境內(nèi)仍存在一定的背景噪聲,不同時段的噪聲組成不同,從而導(dǎo)致了偏差值,移動端和PC端的麥克風(fēng)質(zhì)量不同,從而在接收聲音時存在不同程度的失真導(dǎo)致了差異。次要原因可能為,個體在測試時狀態(tài)不同導(dǎo)致的偏差;軟件的程序存在問題,在傳輸音頻或?qū)С鼋Y(jié)果時存在誤差;但此結(jié)果并不會很大程度的影響軟件的準(zhǔn)確度,因為除聲學(xué)參數(shù)標(biāo)準(zhǔn)作為參考外,用戶仍應(yīng)主要關(guān)注每次測量結(jié)果的波動變化值。只要測試結(jié)果波動較小,內(nèi)部和外部誤差均可忽略。
計算機科技和互聯(lián)網(wǎng)等高速發(fā)展,不斷影響傳統(tǒng)行業(yè)和技術(shù)革新。嗓音分析設(shè)備主要服務(wù)于臨床和科研且收費較高,所以不易普及,同時對于關(guān)注患者嗓音狀況的軟件仍不多見。就教師群體來說,大多教師對嗓音疾病的認(rèn)識和重視程度仍然不足,當(dāng)前亟需提高教師對于嗓音健康的重視以及普及正確的護嗓用嗓知識。
使用移動端嗓音分析應(yīng)用軟件的優(yōu)勢有:①方便便攜。相比于PC端,手機更加的便攜,在任何場合下都可以進行測試;②即時且無地點限制。用戶在1分鐘之內(nèi)就可以完成測試并得到結(jié)果,相較于傳統(tǒng)的設(shè)備節(jié)省時間,同時用戶測試不受地點的約束和限制;③分時段監(jiān)測。軟件根據(jù)職業(yè)用嗓者的生活作息規(guī)律,將每日分成三個時段,從而使用戶更加精確的了解到自己每個時段的用嗓狀況;④可視化。對于很多嗓音微小病變,憑借主觀的聽或喉鏡觀察可能無法得出準(zhǔn)確或可靠的結(jié)果。軟件將抽象的聲學(xué)參數(shù)轉(zhuǎn)換成粗糙度,嘶啞度和聲門閉合程度,使用戶更好的理解各參數(shù)的意義和價值。⑤大數(shù)據(jù)分析。移動端軟件的數(shù)據(jù)交互更加的頻繁,從而更利于公司、醫(yī)院以及相關(guān)研究所對數(shù)據(jù)進行深度挖掘,從而解決醫(yī)療企業(yè)以及研究生缺少大量可靠的用戶使用數(shù)據(jù)的問題。
使用移動端嗓音分析應(yīng)用軟件的劣勢有:①數(shù)據(jù)準(zhǔn)確性。由于不同的手機軟硬件配置存在相當(dāng)?shù)牟罹?,不同品牌的手機會造成不同程度的誤差值,影響數(shù)據(jù)的準(zhǔn)確性。②測試環(huán)境噪聲。由于大多數(shù)職業(yè)用嗓者的生活和工作環(huán)境會存在不同種類和不同程度的環(huán)境噪聲,軟件難以解決對各種噪聲尤其言語噪聲的降噪。③數(shù)據(jù)保密性。由于互聯(lián)網(wǎng)的開發(fā)性,當(dāng)下仍存在許多公司私自盜取用戶私密個人數(shù)據(jù)以及非法出售數(shù)據(jù)的行為。
本軟件在未來仍需解決以下問題:①解決不同手機存在的誤差。由于不同手機的麥克風(fēng)質(zhì)量和手機配置質(zhì)量不齊,可能導(dǎo)致測試音頻存在誤差。軟件應(yīng)對不同規(guī)格的手機進行誤差的測量和修正。②提高用戶的測試習(xí)慣。由于職業(yè)用嗓者的護嗓意識較低,如果在實際使用中用戶并沒有日常測試的習(xí)慣,軟件無法真正起到監(jiān)測的作用。軟件應(yīng)采用多種策略如積分獎勵及社區(qū)搭建等提高用戶的使用頻率。
隨著移動互聯(lián)網(wǎng)時代的興起和“互聯(lián)網(wǎng)+”戰(zhàn)略的提出,互聯(lián)網(wǎng)醫(yī)療將會是未來的醫(yī)療領(lǐng)域的發(fā)展方向。而嗓音分析軟件不光可作為嗓音監(jiān)測軟件,其仍然有許多發(fā)展前景。①嗓音診斷疾病。嗓音不光可以反映喉部和聲帶的問題,還可為腫瘤的良惡定性,嬰兒哭聲的聽力檢測等多個領(lǐng)域提供服務(wù)[12];②建立中國人嗓音數(shù)據(jù)庫。當(dāng)軟件使用人群達到一定數(shù)量以后,可對用戶嗓音數(shù)據(jù)進行整理,建立中國人嗓音健康數(shù)據(jù)庫;③為其他領(lǐng)域提供數(shù)據(jù)支持??蔀榍楦姓Z音,語音可視化,人工智能等提供語音數(shù)據(jù)支持;④促進醫(yī)患溝通,提高就診效率。醫(yī)生可通過軟件獲知患者當(dāng)前的嗓音狀況,進行遠程的診斷和指導(dǎo)以及后期隨訪。