王魯豫, 歐陽繕, 馬榮華, 張晨華
(桂林電子科技大學(xué) 信息與通信學(xué)院,廣西 桂林 541004)
目前,喉嚨腫痛作為常見并發(fā)癥,可能隱藏巨大的安全隱患,因此喉嚨健康的檢測成為醫(yī)學(xué)健康重要的檢測之一。因喉部器官位于人體口腔深處,生理結(jié)構(gòu)復(fù)雜,目前對喉部器官檢測主要有食道鏡、喉鏡檢測方法[1],CT掃描,活性檢查等方法。其中食道鏡、喉鏡檢測是最常用最簡單的檢查方法[2],可借助醫(yī)用器械直觀地檢測患者的喉部,但因喉鏡、食道鏡尺寸太大,且人體有咽反射的本能反應(yīng),患者無法很好配合醫(yī)生的檢查,約有1.5%~8.6%的患者不能使用食道鏡、喉鏡插管,否則會(huì)增加喉部損傷,嚴(yán)重的會(huì)威脅到生命。同時(shí)對于兒童患者,因發(fā)育特點(diǎn)難以觀察到喉部狀況[3]。而CT掃描即利用射線超聲波等對人體部位做斷面掃描,這種檢測方法可以不受制于生理結(jié)構(gòu)任意方位檢測,但是CT會(huì)產(chǎn)生電離輻射,輻射劑量比較大,孕婦不宜使用,而且難以發(fā)現(xiàn)密度變化小的早期病變,活動(dòng)及金屬容易產(chǎn)生偽影,導(dǎo)致醫(yī)生無法診斷,特別是小孩兒容易躁動(dòng),需要給予鎮(zhèn)靜?;钚詸z查即細(xì)胞活性檢測方法,需要從喉部器官上直接截取組織,提取活性細(xì)胞進(jìn)行細(xì)胞培養(yǎng)觀察,給患者增加疼痛,且檢測周期長。
本系統(tǒng)從喉部氣壓與外耳道氣壓的關(guān)聯(lián)性,通過喉部吞咽引發(fā)外耳道氣壓的變化,從而判斷喉部健康的狀況,設(shè)計(jì)了基于外耳道氣壓檢測喉部健康狀態(tài)軟硬件系統(tǒng),并對外耳道氣壓信號進(jìn)行分析處理和特征提取,最后在Weka平臺下學(xué)習(xí)、分類[4]。最終實(shí)現(xiàn)了以準(zhǔn)確率94.444 4%成功對17例輸入實(shí)例進(jìn)行分類。以非侵入式方法對喉部健康狀況進(jìn)行準(zhǔn)確判斷。
人體的耳鼻喉彼此相通,咽鼓管在正常情況下是閉合的,當(dāng)吞咽或打哈欠時(shí),咽鼓管作為溝通鼓室與咽喉的管道,借助咽肌收縮而開放,空氣由咽口經(jīng)咽鼓管進(jìn)入鼓室,平衡外耳道和鼓室內(nèi)氣壓,以維持鼓膜正常位置和自由震動(dòng)功能[5]。因此喉部發(fā)揮吞咽作用時(shí),內(nèi)部氣壓與鼓室、外耳道氣壓產(chǎn)生了一定的關(guān)聯(lián)性。從采集的外耳道氣壓信號來看,通過外耳道氣壓測試喉部吞咽信號是可行的。圖1、2分別為喉部健康(吞咽舒暢)和喉部不健康(吞咽困難)的外耳道氣壓信號波形。
圖1 健康喉部吞咽時(shí)的外耳道氣壓信號波形
圖2 不健康喉部吞咽時(shí)的外耳道氣壓信號波形
根據(jù)外耳道與喉部健康的關(guān)聯(lián)性,為判斷喉部健康,須采集吞咽時(shí)外耳道氣壓的信號,本系統(tǒng)設(shè)計(jì)了外耳道氣壓數(shù)據(jù)采集裝置。該裝置主要完成外耳道內(nèi)氣壓數(shù)據(jù)的采集,以及將采集到的數(shù)據(jù)進(jìn)行傳輸?shù)裙δ?。硬件裝置中微處理器選用的是ST公司的STM32F103VET6超低功耗32位單片機(jī),支持超小型封裝,3個(gè)12位模數(shù)轉(zhuǎn)換器,節(jié)能模式擁有3個(gè)級別。因外耳道氣壓變化微弱,探測空間狹小,故氣壓傳感器選用的是ST公司的LPS22HBTR高精度氣壓傳感器,是目前世界最小的壓力傳感器。該傳感器能夠以24位分辨率測量260~1260 hPa的壓力,壓力輸出數(shù)據(jù)速率為75 Hz。該系統(tǒng)整體結(jié)構(gòu)框圖如圖3所示。
圖3 外耳道氣壓信號分析喉部健康狀態(tài)系統(tǒng)結(jié)構(gòu)框圖
在外耳道氣壓數(shù)據(jù)采集系統(tǒng)中,高精度氣壓傳感器LPS22HBTR通信接口有SPI和I2C 2種方式。SPI傳輸方式是由Motorola公司推出的通信協(xié)議,一般有3根信號線,包括SCK(時(shí)鐘)、STB(片選)以及DATA(數(shù)據(jù)信號)。I2C是由飛利浦公司提出的通信協(xié)議,其通過2根信號傳輸線實(shí)現(xiàn)了雙工的同步數(shù)據(jù)傳輸,一根串行時(shí)鐘線(SCL)和一根串行數(shù)據(jù)線(SDA)。I2C總線相比SPI總線的讀寫時(shí)序比較統(tǒng)一化,設(shè)備間的通信也有嚴(yán)格的通信協(xié)議要求,所以在本系統(tǒng)中,氣壓傳感器與微控制器采用的通信方式為I2C。微控制器與藍(lán)牙模塊之間采用UART通信方式。
在外耳道氣壓采集系統(tǒng)中,系統(tǒng)軟件設(shè)計(jì)包括藍(lán)牙模塊和傳感器的初始化以及通信方式的選擇。各模塊軟件工作流程如圖4所示。初始化工作完成后,由STM32F103VET6控制器控制氣壓數(shù)據(jù)的采集以及發(fā)送過程。若發(fā)現(xiàn)傳感器初始化后無數(shù)據(jù)產(chǎn)生,則控制器會(huì)重新對傳感器進(jìn)行初始化,再通過藍(lán)牙模塊將采集到的氣壓數(shù)據(jù)發(fā)送給計(jì)算機(jī)。
圖4 氣壓采集系統(tǒng)軟件運(yùn)行流程
采集方法為將氣壓傳感器置入被采集者外耳道中,并使用PVC軟性的泡面耳塞密閉外耳道,啟動(dòng)外耳道氣壓信號采集裝置,待狀態(tài)平穩(wěn)后,讓被采集者做吞咽動(dòng)作并保持口鼻緊閉,同時(shí)記錄氣壓變化數(shù)據(jù)。
在外耳道氣壓信號采集過程中,應(yīng)注意4點(diǎn):1)在采集外耳道氣壓信號前,被采集者應(yīng)保持平穩(wěn)心率;2)在采集過程中,被采集者盡量保持頭部穩(wěn)定;3)多次采集時(shí),應(yīng)保持一定的時(shí)間間隔,減少前后信號的影響;4)為了能夠清晰采集到吞咽時(shí)的外耳道氣壓信號,應(yīng)保持雙耳有較好的密封性,并保持口鼻緊閉。
根據(jù)喉部健康和感冒等引起的喉部不健康特征,利用所設(shè)計(jì)的硬件系統(tǒng),成功采集了喉部吞咽時(shí)的外耳道氣壓信號信息,各采集了100組數(shù)據(jù)。
采集的100組數(shù)據(jù)分別為喉部健康吞咽時(shí)和喉部不健康(喉部發(fā)生微小形變,也就是不同程度的腫痛)吞咽時(shí)的外耳道氣壓信號,對其進(jìn)行時(shí)頻分析。
一般情況下,對平穩(wěn)信號分析時(shí)所采用的信號分析方法是比較基礎(chǔ)的傅里葉變換,但是對于非平穩(wěn)信號,不同頻率成分出現(xiàn)的先后在傅里葉變換中呈現(xiàn)不出具體信息,傅里葉變換只能獲取總信號中的頻率,卻無法分析出各個(gè)頻率信號出現(xiàn)的時(shí)間點(diǎn)。為了能夠分析出信號的局部化問題,觀察不同時(shí)刻的頻譜特性,在傅里葉變換的基礎(chǔ)上增加了可滑動(dòng)的“窗”,這個(gè)“窗”一旦固定下來就不會(huì)變化。圖5為信號短時(shí)傅立葉變換三維圖,圖6為信號短時(shí)傅立葉變換二維圖。
圖5 信號的短時(shí)傅里葉變換(三維)
圖6 信號的短時(shí)傅里葉變換(二維)
對于不同健康狀況下吞咽動(dòng)作引起的外耳道氣壓信號,短時(shí)傅里葉有局限性,想要觀察到清晰的頻譜圖,需要選擇更合適的窗函數(shù)。
相較于傅里葉變換,小波分析的強(qiáng)大在于無論是時(shí)域還是頻域,它都有更好的局部化性質(zhì)[6]。對于外耳道微弱的氣壓變化,能夠得到很好的頻率分辨效果。
圖7 小波包分解示意圖(3層)
利用小波的這種特性,可將外耳道氣壓信號S分解到3層空間共8個(gè)頻段。圖7中Sij表示第i尺度的第j(j=0,1,2,,2i-1)個(gè)小波包子空間,其中在第1層分解中S10和S11分別為S的低頻和高頻部分,繼而再對上層的低頻部分S10和高頻部分S11進(jìn)行分解形成第2層。
此外,小波包變換的特征提取相比于小波基的優(yōu)勢在于小波包分解擁有更強(qiáng)大的時(shí)頻分辨能力。通過對信號頻帶的多級劃分,相比小波分析,小波包分析對高頻部分更細(xì)的劃分,并且能夠自適應(yīng)地根據(jù)信號選擇相應(yīng)的頻帶,大大地提高了時(shí)頻分辨率。
因此小波包分解的頻域分析方法,能夠提取外耳道氣壓原始信號中更加細(xì)微的時(shí)頻局域信息特征,可以更細(xì)微地感受到不同類的外耳道氣壓信號的差別,識別的精細(xì)度很高,所以分類的結(jié)果更加準(zhǔn)確,從而判斷喉部的健康狀況。根據(jù)實(shí)驗(yàn)樣本顯示,健康狀況不同的外耳道氣壓信號在不同頻帶內(nèi)的能量是不一樣的,根據(jù)這一特點(diǎn),特征分析方法采用基于小波包分解的頻帶能量的特征提取。
外耳道氣壓信號最高頻率為37.5 Hz,將氣壓信號用小波包分解到3層空間,所以頻帶寬度為1/23×fs=4.687 5 Hz。小波包系數(shù)-頻帶范圍如表1所示。選取小波包分解的方式對外耳道氣壓信號進(jìn)行特征值提取,對得到的結(jié)果進(jìn)行分析討論。
表1 小波包系數(shù)-頻帶
圖8 小波包分解(健康喉部)
圖9 小波包分解(不健康喉部)
通過實(shí)驗(yàn)得到圖8健康喉部的小波包分解和圖9不健康喉部的小波包分解,從外耳道氣壓波形圖對比可知,在采集頻率相同的情況下,不健康喉部的外耳道氣壓波形相比健康喉部的外耳道氣壓波形的波峰波谷間過渡比較緩慢,而且伴隨著上下波動(dòng),氣壓信號的波形峰值點(diǎn)與波形低谷點(diǎn)的絕對差值較小,而健康喉部的外耳道氣壓波形波峰波谷間過渡較迅速,沒有過多的上下反復(fù)波動(dòng),波峰與波谷的絕對差值比較大,整體變化浮動(dòng)比較大??梢耘袛喑銎洳町惖脑?,主要在于在喉部不適的情況下,喉部杓會(huì)厭肌和甲狀會(huì)厭肌等相關(guān)肌肉神經(jīng)組織會(huì)使會(huì)厭活動(dòng)度降低,阻礙了吞咽功能,繼而相比健康的喉部,不健康狀態(tài)喉部在平衡喉部和耳內(nèi)氣壓時(shí)不暢,因此出現(xiàn)了外耳道氣壓波形的波峰波谷間過渡遲緩且反復(fù)的情況。
通過比較可發(fā)現(xiàn),健康咽喉和不健康咽喉所呈現(xiàn)的外耳道氣壓信號的小波包對應(yīng)的8個(gè)頻段的頻譜中,不同喉部健康狀態(tài)的頻段峰值不同,分布不相同,能量譜均值差距較大。健康喉部的外耳道氣壓經(jīng)小波包特征分析后,能量集中在高頻頻段S36、S37和低頻S30、S31、S32。而健康喉部的外耳道氣壓頻帶的能量分布在S30、S32、S34。小波包對應(yīng)的8個(gè)頻段能量譜值能夠反映不同咽喉健康狀態(tài)的特征分布,從而能夠咽喉健康狀態(tài)分類提供依據(jù)。因此,采用的是將外耳道氣壓信號的小波包三階深度的8個(gè)能量譜均值序列作為特征向量,然后通過特征向量進(jìn)行下一分類步驟。
通過由于人體咽喉部位的健康狀況所引起的外耳道氣壓信息特征的不同,運(yùn)用機(jī)器學(xué)習(xí)的方法,智能地識別和篩選出的健康和非健康實(shí)驗(yàn)數(shù)據(jù)。分類平臺采用的是WEKA平臺下的機(jī)器學(xué)習(xí)[7]。
機(jī)器學(xué)習(xí)是為了讓計(jì)算機(jī)能夠自動(dòng)地學(xué)習(xí)算法,這些算法是從已經(jīng)擁有的海量數(shù)據(jù)中挖掘出來,并且從中發(fā)現(xiàn)隱藏的特殊關(guān)系、規(guī)律和有用的知識,再對未知的數(shù)據(jù)進(jìn)行預(yù)測。數(shù)據(jù)挖掘在應(yīng)用領(lǐng)域當(dāng)中最重要的方法就是分類方法,它是通過對采集樣本的數(shù)據(jù)預(yù)處理,繼而過濾屬性不相關(guān)的信息,與此同時(shí),標(biāo)記一個(gè)數(shù)據(jù)類別的屬性,訓(xùn)練采集樣本的數(shù)據(jù)就是從標(biāo)記中而來,最后選用相關(guān)算法對數(shù)據(jù)挖掘以及輸出結(jié)果。分類方法有很多種,一般常見的有:決策樹分類,樸素貝葉斯分類,基于關(guān)聯(lián)的分類方法,粗糙集,K-最臨近法等[8]。決策樹相對來說計(jì)算量不大,運(yùn)算速度快,天然的可解讀性以及非常容易轉(zhuǎn)化生成規(guī)則,而且擁有可以處理連續(xù)型也可以處理離散型屬性的優(yōu)勢,所以采用決策樹方法來對數(shù)據(jù)進(jìn)行分類。
C4.5算法是基于ID3算法發(fā)展改進(jìn)的[9],重新修改了選擇屬性的標(biāo)準(zhǔn),加入了2個(gè)新概念,一個(gè)是分割信息量(split information),另一個(gè)是信息增益率(information gain ratio)。
熵的表達(dá)式:
(1)
信息增益表達(dá)式:
Gain(SA,A)=Entropy(SA)-
(2)
(3)
SplitInformation(S,A)=
(4)
信息增益率表達(dá)式:
(5)
即:
GainRatio(SA,A)=
(6)
在進(jìn)行對數(shù)據(jù)分類前,要將所有的外耳道氣壓數(shù)據(jù)都經(jīng)過小波包分解處理,生成多個(gè)實(shí)例。Weka對ARFF格式的文件有著非常好的支持,ARFF存儲數(shù)據(jù)有著特殊的方式,主要包含3個(gè)部分:文件頭信息,注釋行以及實(shí)例數(shù)據(jù)。將實(shí)例以ARFF格式存儲并導(dǎo)入Weka。
通過使用C4.5算法對該數(shù)據(jù)樣本處理建立模型。從結(jié)果中可知,分類實(shí)例總數(shù)為201個(gè),正確分類實(shí)例200,比例為99.502 5%。錯(cuò)誤學(xué)習(xí)分類的實(shí)例1個(gè),比例為0.497 5%。從混淆矩陣中可看出,有100個(gè)健康實(shí)例正確學(xué)習(xí)分類,101個(gè)不健康實(shí)例中有1個(gè)實(shí)例被分類到健康實(shí)例,100個(gè)不健康實(shí)例被正確分類。再通過實(shí)驗(yàn)采集獲得18個(gè)實(shí)例,包含8個(gè)健康實(shí)例和10個(gè)不健康實(shí)例,進(jìn)行分類與回歸。最終結(jié)果如圖11所示。
圖10 C4.5算法處理結(jié)果
圖11 分類結(jié)果
從分類結(jié)果混合矩陣可看出,主對角線上的數(shù)值很大,而非主對角線上的數(shù)值很小,甚至為零。正確分類的實(shí)例有17個(gè),比例高達(dá)94.444 4%。8個(gè)健康實(shí)例都被正確歸類,而10個(gè)不健康實(shí)例中,有9個(gè)被正確歸類,還有一個(gè)被錯(cuò)誤歸類到健康類中。分類總用時(shí)0.01 s,Kappa統(tǒng)計(jì)為0.888 9,平均絕對誤差0.059 9,均方根誤差0.233 2,ROC面積為0.95。
基于外耳道氣壓的喉部健康狀態(tài)分析方法,利用喉部吞咽與外耳道氣壓的關(guān)聯(lián)性,設(shè)計(jì)了通過外耳道氣壓信號診斷人體喉部健康狀況的診斷系統(tǒng)。相比傳統(tǒng)的喉鏡檢測方法更加方便,并設(shè)計(jì)出相應(yīng)的硬件和軟件,通過實(shí)例驗(yàn)證了系統(tǒng)的性能。此外通過機(jī)器學(xué)習(xí)的方法,對人體喉部是否健康的數(shù)據(jù)進(jìn)行分類識別,取得了良好的分辨效果,為實(shí)現(xiàn)自動(dòng)化的診斷系統(tǒng)打下基礎(chǔ)。