宋雪陽,許朝霞**,王寺晶,丁曉東,馮 路,王憶勤,張 勇
(1. 上海中醫(yī)藥大學(xué)基礎(chǔ)醫(yī)學(xué)院 上海 201203;2. 復(fù)旦大學(xué)附屬中山醫(yī)院呼吸科 上海 200032)
聞診是中國傳統(tǒng)醫(yī)學(xué)寶庫中的瑰寶,《黃帝內(nèi)經(jīng)·素問·陰陽應(yīng)象大論》曰:“善診者,察色按脈,先別陰陽;審清濁,而知部分;視喘息,聽聲音,而知所苦”[1]。聞診分為聽聲音與嗅氣味兩部分,其中聽聲音即聲診?!峨y經(jīng)》第四十難言:“金者肺,肺主聲,故令耳聞聲”[2]。故聲診與中醫(yī)肺系疾病關(guān)系最為密切。肺結(jié)節(jié)是隨現(xiàn)代科技發(fā)展而發(fā)現(xiàn)的疾病,也屬于中國傳統(tǒng)醫(yī)學(xué)中肺系疾病的范疇。肺結(jié)節(jié)指肺內(nèi)直徑小于等于3cm 的病灶,呈類圓形或不規(guī)則形,臨床根據(jù)其密度分為實(shí)性結(jié)節(jié)、部分實(shí)性結(jié)節(jié)和磨玻璃密度結(jié)節(jié),其中部分實(shí)性結(jié)節(jié)惡性概率最高,另兩者次之[3]。肺癌作為我國最常見的腫瘤之一,早診斷早治療極為重要,故對(duì)肺結(jié)節(jié)進(jìn)行有效地診斷與篩查非常關(guān)鍵。
呼吸器官、喉頭、咽頭、口腔與鼻腔五者共同組成語音生理基礎(chǔ),當(dāng)發(fā)元音時(shí),聲帶振動(dòng)產(chǎn)生基頻,發(fā)聲器官諧振則形成共振峰,基頻是由肌肉、軟骨各種動(dòng)作支配主動(dòng)形成的,而共振峰則是被動(dòng)地由發(fā)聲器官的形狀決定[4]。共振峰的形成首先由聲帶振動(dòng)后形成聲帶波到唇邊輻射波,整個(gè)發(fā)聲器官形成一個(gè)共振系統(tǒng),由于聲腔的特點(diǎn)不同,各群諧音波強(qiáng)烈傳遞后,在不同聲音中形成不同的能量集中區(qū)域,這些能量集中的區(qū)域就是共振峰。本研究運(yùn)用現(xiàn)代的客觀化語音采集及分析方法,在中醫(yī)辨證分型理論的指導(dǎo)下,觀察并分析肺結(jié)節(jié)患者發(fā)元音時(shí)語音共振峰特征,為肺結(jié)節(jié)的診斷篩查提供新思路。
本研究所有病例來源于2017 年1 月至2017 年10月間復(fù)旦大學(xué)附屬中山醫(yī)院呼吸科門診、上海中醫(yī)藥大學(xué)附屬曙光醫(yī)院呼吸科門診及病房、上海中醫(yī)藥大學(xué)附屬岳陽中西醫(yī)結(jié)合醫(yī)院和上海市強(qiáng)生職工醫(yī)院中醫(yī)內(nèi)科門診,肺結(jié)節(jié)患者病例共121 例。正常對(duì)照組為上海中醫(yī)藥大學(xué)在校健康學(xué)生、職工以及上海市老教授協(xié)會(huì)志愿者,共36例。
1.2.1 診斷標(biāo)準(zhǔn)
肺結(jié)節(jié)診斷參照《中國肺部結(jié)節(jié)分類、診斷與治療指南(2016 年版)》[3];中醫(yī)辨證參照《中醫(yī)診斷學(xué)(第2版)》[5]教材辨證標(biāo)準(zhǔn),分為虛證、實(shí)證和虛實(shí)夾雜證。
1.2.2 納入標(biāo)準(zhǔn)
肺結(jié)節(jié)組:①符合以上診斷標(biāo)準(zhǔn),經(jīng)胸部電子計(jì)算機(jī)斷層掃描(Computed Tomography, CT)、低劑量螺旋CT(low dose CT, LDCT)或正電子發(fā)射計(jì)算機(jī)斷層顯像掃描(Positron Emission Computed Tomography-CT, PET-CT)檢查,證實(shí)為肺結(jié)節(jié)的患者;②年齡、性別不限;③根據(jù)以上證型診斷標(biāo)準(zhǔn),經(jīng)由兩名副高以上職稱的中醫(yī)師判讀,取結(jié)果一致者;④知情同意。
正常對(duì)照組:①無明顯呼吸系統(tǒng)疾病者;②無嚴(yán)重心、肝、腎等器質(zhì)性疾病者;③年齡、性別不限;④知情同意。
1.2.3 排除標(biāo)準(zhǔn)
不符合上述的納入標(biāo)準(zhǔn)者;合并嚴(yán)重心、肝、腎等器質(zhì)性疾病者;已經(jīng)確診為肺癌者;發(fā)聲障礙者;拒絕配合者。
采用Jabra UC Voice 550 MS Mono 耳麥一體式電熔話筒,利用上海中醫(yī)藥大學(xué)與上海亞太計(jì)算機(jī)信息系統(tǒng)有限公司聯(lián)合研制的SmartTCM-1 型中醫(yī)生命信息分析系統(tǒng)的聲診模塊,在噪音小于45 分貝的環(huán)境內(nèi),囑受試者以正常說話的方式自然地分別發(fā)聲元音[a]和元音[e],以16 kHz 采樣頻率進(jìn)行錄音,保存為16bit采樣位數(shù)的wav格式音頻文件。
語音信號(hào)采集質(zhì)量直接關(guān)乎研究數(shù)據(jù)的準(zhǔn)確性,可以從以下各方面提高語音信號(hào)質(zhì)量。較為安靜的環(huán)境能夠明顯降低噪音對(duì)語音信號(hào)的干擾;同時(shí)由于語音具有社會(huì)性,過于嘈雜的環(huán)境會(huì)對(duì)受試者情緒產(chǎn)生影響,對(duì)語音本質(zhì)形成干擾;使用心型指向或者超心型指向的錄音設(shè)備可以有效減少來自周圍的噪音,追求最優(yōu)化甚至可選用槍型指向的錄音設(shè)備。由于共振峰的頻率最大時(shí)接近5000 Hz,根據(jù)采樣定理,語音信號(hào)采集時(shí)采樣頻率至少需要10 kHz,本研究則采用16 kHz采樣頻率以保證準(zhǔn)確性,若是需要分析頻率更高的語音信號(hào),則需相應(yīng)提高采樣頻率。
表2 肺結(jié)節(jié)患者不同證型分布情況
聲音起于聲源振動(dòng),語音則源于聲腔振動(dòng),語音的共振峰則是整個(gè)聲腔振動(dòng)的反映。共振峰與語音的生理基礎(chǔ)存在一定關(guān)系,不同共振峰受到開口度大小、舌位等發(fā)聲器官影響,也與音色等語音信息相關(guān)[6]。本研究將wav 格式的音頻文件導(dǎo)入Praat 6.0.34語音分析軟件,提取受試者發(fā)聲時(shí)聲腔的共鳴頻率,即第一共振峰(First Formant, F1)、第二共振峰(Second Formant, F2)、第三共振峰(Third Formant,F3)、第四共振峰(Fourth Formant, F4),共計(jì)四個(gè)反映語音特征的指標(biāo)。
語音信號(hào)的預(yù)處理可以針對(duì)一段聲音波形,精確選擇起始端點(diǎn)與結(jié)束端點(diǎn),從而準(zhǔn)確地截取語音信號(hào)的有效部分,良好的預(yù)處理不僅能夠去除不必要的噪音,同時(shí)能保證截取語音信息的一致性,增加研究結(jié)果的可靠性。
本研究采用SPSS 21.0軟件,采用秩轉(zhuǎn)換的非參數(shù)檢驗(yàn)方法,對(duì)121 例肺結(jié)節(jié)患者和36 例正常人語音樣本中元音[a]與元音[e]的各四個(gè)共振峰,總計(jì)八個(gè)共振峰頻率參數(shù)進(jìn)行統(tǒng)計(jì)學(xué)分析,多類比較使用Kruskal-Wallis H檢驗(yàn),兩兩比較使用Nemenyi檢驗(yàn),P <0.05表示差異具有統(tǒng)計(jì)學(xué)意義。
由表1、表2 可見,肺結(jié)節(jié)患者病例共121 例,平均年齡56.99±12.21歲,男女比例為1∶1.9,其中虛證41例,實(shí)證30 例,虛實(shí)夾雜證50 例。正常對(duì)照組共36例,平均年齡54.58±22.25 歲,男女比例為1∶1.8。患者組與正常對(duì)照組之間年齡、性別無統(tǒng)計(jì)學(xué)差異(P >0.05)。
表3 肺結(jié)節(jié)患者與正常組語音(元音[a])共振峰頻率比較()
表3 肺結(jié)節(jié)患者與正常組語音(元音[a])共振峰頻率比較()
?
表4 肺結(jié)節(jié)患者與正常人語音(元音[e])共振峰頻率比較()
表4 肺結(jié)節(jié)患者與正常人語音(元音[e])共振峰頻率比較()
注:與正常組比較,*P <0.05
?
表5 不同證型肺結(jié)節(jié)患者組及正常組間語音(元音[a])共振峰頻率比較()
表5 不同證型肺結(jié)節(jié)患者組及正常組間語音(元音[a])共振峰頻率比較()
?
表6 不同證型肺結(jié)節(jié)患者組及正常組間語音(元音[e])共振峰頻率比較()
表6 不同證型肺結(jié)節(jié)患者組及正常組間語音(元音[e])共振峰頻率比較()
注:與虛實(shí)夾雜證組比較,*P <0.05;與實(shí)證比較,#P <0.05
?
由表3、表4 可見,語音共振峰的分布有一定區(qū)域性,本研究中肺結(jié)節(jié)患者元音[e]的F1 分布區(qū)間為332.04 Hz 到731.88 Hz,均值為540.95 Hz;正常人元音[e]的F1 分布區(qū)間為440.86 Hz 到813.77 Hz,均值為592.67 Hz。由表1、表2 可見,肺結(jié)節(jié)患者組與正常對(duì)照組之間元音[e]的第一共振峰差異(P=0.019 <0.05)具有統(tǒng)計(jì)學(xué)意義。元音[a]各共振峰在肺結(jié)節(jié)患者與正常組間則無統(tǒng)計(jì)學(xué)差異(P >0.05)。
由表5、表6 可見,肺結(jié)節(jié)患者不同證型間語音共振峰比較,發(fā)現(xiàn)實(shí)證患者元音[e]的F3從2148.90 Hz到3189.97 Hz 均有出現(xiàn),其均值為2768.74 Hz;虛實(shí)夾雜證患者元音[e]的F3 區(qū)間為1823.35 Hz 到3549.79 Hz,共振峰均值為2934.83 Hz;經(jīng)統(tǒng)計(jì)學(xué)分析,肺結(jié)節(jié)實(shí)證與虛實(shí)夾雜證患者之間元音[e]第三共振峰差異(P =0.023 <0.05)具有統(tǒng)計(jì)學(xué)意義。虛證患者元音[e]的F4區(qū)間為3267.52 Hz 到4572.66 Hz,均值為3997.87 Hz;實(shí)證患者肺結(jié)節(jié)患者元音[e]的F4 范圍則是3265.71 Hz 到4488.95 Hz,均值為3782.41 Hz;經(jīng)統(tǒng)計(jì)學(xué)分析,虛證與實(shí)證患者之間元音[e]第四共振峰差異(P =0.014 <0.05)具有統(tǒng)計(jì)學(xué)意義。元音[a]各共振峰在不同證型肺結(jié)節(jié)患者與正常組間均無統(tǒng)計(jì)學(xué)差異(P >0.05)。
《醫(yī)宗金鑒》對(duì)于人體發(fā)聲器官的描述記載為“中空有竅,故肺主聲。喉為聲路,會(huì)厭門戶。舌為聲機(jī)。唇齒扇動(dòng),寬隘銳鈍,厚薄之故”[7],可見清朝對(duì)于聞診的生理基礎(chǔ)已經(jīng)有所研究。本研究以元音作為語音采集的目標(biāo),所觀察的語音共振峰雖不屬于語音四要素,但能有效反映發(fā)聲器官的特點(diǎn)。對(duì)于肺結(jié)節(jié)患者,與正常人語音差異集中在元音[e]上,主要體現(xiàn)于第一共振峰,且肺結(jié)節(jié)患者的第一共振峰范圍高于正常人的第一共振峰范圍。不同證型的肺結(jié)節(jié)患者語音差異集中于元音[e],實(shí)證與虛實(shí)夾雜證患者區(qū)別于第三共振峰,而實(shí)證與虛證患者語音共振峰則區(qū)別于第四共振峰。與之相應(yīng)的是元音[e]中第三共振峰上實(shí)證與虛證并無差異,第四共振峰上虛證與虛實(shí)夾雜也未出現(xiàn)差異,提示元音[e]的第三共振峰與第四共振峰對(duì)肺結(jié)節(jié)患者實(shí)證語音特點(diǎn)區(qū)別度較高。本研究中,共振峰頻率差異僅在元音[e]中出現(xiàn),或與兩個(gè)元音間發(fā)音的生理區(qū)別相關(guān)。就口腔的開合區(qū)分,[a]屬于開元音,口腔開度大,舌位較低;[e]則是半閉元音,口腔開度較小且舌處于半高位。就圓唇與不圓唇而言則兩個(gè)元音都屬于不圓唇[8]。共振峰中受舌位高低影響的是F1,而圓唇與不圓唇則同時(shí)影響F2和F3,影響共振峰數(shù)據(jù)更為直接的是前后腔比例[6]。肺結(jié)節(jié)患者的語音特征是否受到舌位影響,何種發(fā)聲方式能更好地表現(xiàn)肺結(jié)節(jié)患者語音共振峰特征,尚需進(jìn)一步研究。
語音的四要素分別是音高、音強(qiáng)、音長和音色,臨床上醫(yī)生對(duì)語音的判別更多集中在音強(qiáng)與音高方面,例如虛證患者多有聲低氣怯,主要是語音響度較低,反映在音強(qiáng)方面則是虛證患者音強(qiáng)低于常人;音高則更多反映男女語音的區(qū)別,女性語音頻率較高,男性較低,則在音高上兩者形成差異,此類判別大多較為主觀。語音共振峰的細(xì)節(jié)差異人耳較難辨認(rèn)區(qū)分,需要借助儀器進(jìn)行分析,可謂是聲診中的微觀辨證,遇到肺結(jié)節(jié)患者證候不明顯或是證候較為復(fù)雜時(shí),能夠發(fā)揮微觀辨證的優(yōu)勢(shì),為辨證提供參考依據(jù)。有研究顯示,除證候特點(diǎn)之外,聲診的語音信息還能反映五臟特點(diǎn),為臟腑辨證提供客觀依據(jù)[9-11]。
肺結(jié)節(jié)是由影像學(xué)檢查發(fā)現(xiàn),臨床多無明顯癥狀體征,語音共振峰還可以同影像學(xué)檢查結(jié)合,針對(duì)肺結(jié)節(jié)類型、肺結(jié)節(jié)大小以及肺結(jié)節(jié)位置與語音共振峰之間相關(guān)性進(jìn)行研究,對(duì)于肺結(jié)節(jié)的診斷篩查,乃至肺癌的預(yù)警都是極有價(jià)值的。依據(jù)肺結(jié)節(jié)類型、大小、位置等影像學(xué)表現(xiàn)進(jìn)行分組,結(jié)合語音共振峰以及其他語音特征進(jìn)行分析,是本課題組今后研究的方向。聲診研究屬于聞診的一環(huán),而聞診在中醫(yī)四診研究中尚處于薄弱的環(huán)節(jié),聲診研究一方面需要現(xiàn)代科學(xué)技術(shù)支撐,另一方面也需要中醫(yī)基礎(chǔ)理論支持。兩方面齊頭并進(jìn),聲診才能有長足發(fā)展。本研究以肺結(jié)節(jié)為研究病種,將共振峰作為觀察指標(biāo),通過中醫(yī)辨證理論,希望能夠?yàn)橹嗅t(yī)聲診發(fā)展提供基礎(chǔ),同時(shí)也拋磚引玉,為聞診客觀化研究做出一點(diǎn)貢獻(xiàn)。隨時(shí)代發(fā)展,科技進(jìn)步,語音信號(hào)處理模擬信號(hào)與數(shù)字信號(hào)的轉(zhuǎn)換都將更為先進(jìn),數(shù)據(jù)挖掘技術(shù)也將更為廣泛,聲診研究更需要融合新技術(shù),方能在客觀化與標(biāo)準(zhǔn)化的道路上創(chuàng)新邁進(jìn)。