郭一楠 邵慧杰 鞏敦衛(wèi) 李海泉 陳 麗
(中國礦業(yè)大學(xué)人工智能研究院智慧醫(yī)療研究中心 徐州 221116)
(中國礦業(yè)大學(xué)信息與控制工程學(xué)院 徐州 221116)
(徐州醫(yī)科大學(xué)第二附屬醫(yī)院呼吸與危重醫(yī)學(xué)科 徐州 221006)
房顫是一種常見的心律失常,其發(fā)病率會在超過60歲以后每10年就增長1倍[1]。房顫會導(dǎo)致中風(fēng)、心力衰竭和其他心血管疾病的發(fā)病率增加[2]。房顫會導(dǎo)致女性全因死亡率增加2倍,男性增加1.5倍[3]。因此,房顫的早期檢測對患者盡早獲得治療至關(guān)重要。
心電(ElectroCardioGram, ECG)是一種方便快速且非侵入式的檢測方法,已經(jīng)廣泛應(yīng)用于臨床。12導(dǎo)聯(lián)的ECG是當(dāng)前識別房顫的金標(biāo)準(zhǔn)[4]。大體上,ECG可以分為P波、Q波、R波、S波、T波和U波。不規(guī)則的R-R間期和由P波轉(zhuǎn)化成的F波可以有效識別房顫[5]。然而,常規(guī)的12導(dǎo)聯(lián)ECG在醫(yī)院中只能記錄短時的ECG信號,不一樣的身體狀況導(dǎo)致該ECG信號不能完全真實地反映患者在醫(yī)院外的心律失常,導(dǎo)致漏檢[6]。近年來,隨著單導(dǎo)聯(lián)ECG可穿戴設(shè)備的快速發(fā)展,長時、低成本、實時的心電信號已能在醫(yī)院外及時獲取。由此,迫切需要設(shè)計基于單導(dǎo)聯(lián)ECG信號的房顫檢測方法,為患者提供更加及時、準(zhǔn)確的病程指導(dǎo)。
針對ECG房顫檢測,研究人員通?;谌斯ぬ崛〉奶卣鱽磉M行識別。Ebrahimzadeh等人[7]采用心律變異性的線性、非線性和時頻特征進行房顫檢測,分別取得了98.21%, 95.55%, 100%的準(zhǔn)確率、特異性和靈敏性。Mohebbi等人[8]采用2個單譜特征、6個雙譜特征和4個非線性特征,取得了96.3%,93.1%的房顫檢測靈敏性和特異性。基于人工提取特征的房顫檢測雖然取得較好的檢測性能,但是計算相對費時,且特征選擇依賴大量的人類經(jīng)驗。此外,可穿戴設(shè)備采集的心電信號會被電磁場和運動偽跡干擾,直接影響人工提取的特征,導(dǎo)致顯著的檢測誤差。人與人之間的身體狀況差異,也使人工提取的特征往往不具有普適性。
相比于傳統(tǒng)的房顫檢測方法,基于卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network, CNN)的檢測方法具有更強的特征提取能力,并已經(jīng)廣泛應(yīng)用于信號分類中。Acharya等人[9]通過CNN自動地區(qū)分兩秒心電信號的類型,并取得了92.5%, 98.09%, 93.13%的準(zhǔn)確率、靈敏性和特異性。蔣芳芳等人[10]在不同長度的心電片段和不同深度的CNN中尋找最佳組合,顯著提高了識別準(zhǔn)確率。為進一步提升CNN的表達(dá)能力,Petmezas等人[11]將CNN和長短期記憶神經(jīng)網(wǎng)絡(luò)(Long Short-Term Memory, LSTM)構(gòu)成的混合網(wǎng)絡(luò),結(jié)合焦點損失函數(shù)處理心電數(shù)據(jù)的不平衡問題,將靈敏性和特異性提升到97.87%和99.29%。楊萍等人[12]、顧佳艷等人[13]先后提出集成CNN-LSTM網(wǎng)絡(luò)和由殘差網(wǎng)絡(luò)、雙向LSTM與多頭注意力層構(gòu)成的混合網(wǎng)絡(luò),用于實時房顫檢測。Fan等人[14]則利用具有不同卷積核的兩路CNN提取不同尺寸特征,取得了98.13%, 93.77%和98.77%的準(zhǔn)確率、靈敏性和特異性。
在設(shè)計不同模型結(jié)構(gòu)的同時,研究人員還引入時頻分析,通過豐富原始信號的信息來改善房顫檢測算法的性能。Lai等人[5]將RR序列和F波頻譜相結(jié)合作為CNN的輸入,顯著提高了檢測準(zhǔn)確性能。Xia等人[15]則采用短時傅里葉變換(Short-Time Fourier Transform, STFT )和標(biāo)準(zhǔn)小波變換(Wavelet Transform, WT)將1維的心電信號轉(zhuǎn)換為2維的時頻信號。Ma等人[16]引入改進的頻率切片WT,結(jié)合人工提取特征來訓(xùn)練CNN和支持向量機混合模型,提高模型的泛化能力和魯棒性。楊淑瑩等人[17]利用小波分解和1維谷歌網(wǎng)絡(luò)(GoogLeNet),緩解了計算效率低、收斂困難和模型退化的問題。然而,在設(shè)計模型架構(gòu)和引入時頻分析時,現(xiàn)有的房顫檢測算法仍然存在以下不足:
(1) 傳統(tǒng)的時頻分析方法通?;诜e分變換,如STFT或WT等。這類時頻分析方法容易產(chǎn)生頻譜泄漏,無法很好地刻畫局部細(xì)節(jié)。
(2) 對1維信號進行時頻轉(zhuǎn)換,雖然可以豐富其特征,但是也會形成高維度特征空間,需要采用更加復(fù)雜的神經(jīng)網(wǎng)絡(luò)模型提取其特征,從而容易產(chǎn)生梯度消失,導(dǎo)致訓(xùn)練過程難以收斂。
基于以上原因,本文結(jié)合希爾伯特黃變換(Hilbert-Huang Transform, HHT)[18]和深度卷積神經(jīng)網(wǎng)絡(luò)(Deep Convolutional Neural Network, DCNN),構(gòu)建了一種新型房顫檢測模型。HHT將1維的時域心電信號轉(zhuǎn)換為2維的時頻矩陣。傳統(tǒng)的基于積分變換時頻分析方法(如STFT和WT)會受到時間分辨率和頻率分辨率的限制,容易導(dǎo)致偽影產(chǎn)生。與之不同,HHT能獲得瞬時頻率和幅度,獲得的時頻矩陣更加精細(xì)且不會發(fā)生頻譜泄漏。因此,HHT可以更有效地描述ECG的局部細(xì)節(jié)。基于此,引入 DenseNet[19]卷積神經(jīng)網(wǎng)絡(luò)來處理高精細(xì)度的時頻矩陣,可以有效緩解梯度消失、進行特征復(fù)用,并且所提算法在未被使用的驗證集上經(jīng)過了檢驗。
存在房顫的心電信號中,F(xiàn)波可能存在不同的振幅、形態(tài)和頻率[20]。此外,在運動偽跡的影響下,心電信號的基線也會隨時間發(fā)生改變[21]。因此,心電信號可以看作一類非平穩(wěn)時間序列。采用傳統(tǒng)的頻域分析方法處理心電信號時,難以提取到該類信號的有效特征。而HHT結(jié)合了經(jīng)驗?zāi)B(tài)分解(Empirical Mode Decomposition, EMD)和希爾伯特變換(Hilbert Transform, HT),可以計算瞬時頻率和幅度,適合處理心電信號這一類非平穩(wěn)時間序列。因此,本文采用HHT將只包含時域信息的原始ECG信號轉(zhuǎn)換為包含時域和頻域?qū)?yīng)關(guān)系的時頻圖。首先,采用EMD將多模態(tài)心電信號分解為若干個單一模態(tài)的信號;其次,通過HT計算出每個模態(tài)的瞬時頻率和幅度;最后,綜合所有模態(tài)信息,獲得心電信號的時頻圖。
2.1.1 經(jīng)驗?zāi)B(tài)分解
原始信號x(t)通過EMD可以得到若干個本征模態(tài)函數(shù)(Intrinsic Mode Function, IMF),每個IMF必須滿足兩個限制:(1)極值點和零點的數(shù)量之差不超過1;(2)在任意時刻點,局部最大值的包絡(luò)線和局部最小值的包絡(luò)線之間的均值為0。對原始信號x(t)的EMD計算過程如表1所示。
表1 EMD算法步驟
EMD分解的結(jié)果為
其中,N表示可以從原始信號分解出來的IMF數(shù)量,IMFi(t)代表了第i個IMF,r(t)為無法被繼續(xù)分解的殘余分量。
2.1.2 希爾伯特變換
在經(jīng)過EMD分解后,HT被用來對每一個IMF計算瞬時頻率和幅度。記HT的脈沖響應(yīng)為
本文利用DenseNet來處理具有高精度的時頻圖。DenseNet由大量的稠密塊組成。在稠密塊中,每層網(wǎng)絡(luò)都會和其他層之間通過前饋方式連接,如圖1所示。DenseNet通過不同層之間的跳連接可以緩解梯度消失并使網(wǎng)絡(luò)設(shè)計更深。另一個方面,DenseNet將不同通道的特征連接起來實現(xiàn)特征復(fù)用。這兩個方面可以讓DenseNet獲得強大的特征提取能力。本文采用的DenseNet結(jié)構(gòu)如表2所示。
圖1 稠密塊結(jié)構(gòu)
表2 DenseNet結(jié)構(gòu)
本文分別采用了MIT-BIH房顫數(shù)據(jù)集(MITBIH Atrial Fibrillation DataBase, AFDB)[22,23]和2017 PhysioNet Challenge 房顫數(shù)據(jù)集來驗證提出方法的有效性。其中,AFDB數(shù)據(jù)集包括23個長時的ECG,大多數(shù)ECG來自陣發(fā)性房顫患者。每個ECG包含兩通道且以250 Hz的采樣率采集。在本文中,只采用標(biāo)記為房顫和竇性心律的第一導(dǎo)聯(lián)ECG,并將ECG以每1250個采樣點進行分割。2017 PhysioNet Challenge數(shù)據(jù)集總共包含8528個30~60 s長度的ECG片段,其中包括5154個竇性節(jié)律、771個房顫、2557個其他節(jié)律以及46個噪聲片段。每段ECG的采樣頻率均為300 Hz。本文僅使用竇性節(jié)律和房顫的ECG,并將ECG以1250個采樣點進行分割。數(shù)據(jù)集的具體構(gòu)成如表3和表4所示,圖2展示了竇性節(jié)律和房顫的ECG片段。
圖2 ECG片段
表3 AFDB數(shù)據(jù)集
表4 2017 PhysioNet Challenge數(shù)據(jù)集
為合理評價模型性能,本文采用準(zhǔn)確率(ACCuracy, ACC)、靈敏性(SEnsitivity, SE)和特異性(SPecificity, SP)3個性能指標(biāo)。記真正例為TP(True Positive)、假正例為FP(False Positive)、假反例為FN(False Negative)和真反例為TN(True Negative),上述3個性能指標(biāo)定義為
面向兩類數(shù)據(jù)集,分別采用STFT,WT和HHT,將1維心電信號轉(zhuǎn)換為時頻圖,如圖3所示。可見,相比于STFT和WT,本文所采用HHT生成的100×1250 2維時頻矩陣具有更清晰的局部細(xì)節(jié),不會產(chǎn)生由頻譜泄露導(dǎo)致的偽影。分別基于上述3種時頻分析方法和傳統(tǒng)1維(1 Dimensional,1-D)心電,采用DenseNet對兩類數(shù)據(jù)集獲得的識別準(zhǔn)確率,如圖4所示。顯然,所提方法可以獲得最好的房顫識別性能,這是因為通過HHT時頻轉(zhuǎn)換能夠更清晰地反映局部特征。
圖3 不同變換方法的時頻圖
圖4 3種時頻分析和1維心電在驗證集上的準(zhǔn)確率曲線
可穿戴設(shè)備采集的ECG信號可能會受到電磁和運動偽跡的干擾。如圖5(a)所示,當(dāng)人體運動后,ECG信號幅度會在短時間發(fā)生劇烈變化,在人體恢復(fù)靜止時,ECG會慢慢地回復(fù)到正常狀態(tài)。在此期間,ECG信號的方差、均值等手動提取特征會嚴(yán)重失真。此外,如圖5(b)所示,電磁干擾會導(dǎo)致ECG信號出現(xiàn)細(xì)小的毛刺,影響到信號熵的計算。本文在AFDB數(shù)據(jù)集上分別選取了53段受運動偽跡影響和279段受電磁干擾影響的ECG片段作為數(shù)據(jù)集,單獨進行實驗來驗證模型的魯棒性,實驗結(jié)果見表5和表6。對比算法包括隨機森林、支持向量機和Adaboost,它們都采用模糊熵、樣本熵、符號序列熵、基本尺度熵,以及RR間期的均值和方差作為特征,實施模型訓(xùn)練。當(dāng)心電信號存在運動偽跡和電磁干擾時,與傳統(tǒng)基于手動提取特征的方法相比,本文所提方法在準(zhǔn)確率上提升了15.14%和3.94%,特異性提高了23.08%和4.58%,靈敏性改善了7.41%和3.18%。結(jié)果表明,基于深度學(xué)習(xí)算法的房顫檢測在信號出現(xiàn)異常時更具有魯棒性。
表5 運動偽跡時模型魯棒性驗證(%)
表6 電磁干擾時模型魯棒性驗證(%)
圖5 受干擾的ECG片段
為了驗證DenseNet對時頻圖的處理能力,引入常用的VGG[24]和ResNet[25]進行對比。VGG,Res-Net和DenseNet分別在兩個數(shù)據(jù)集上的準(zhǔn)確率如圖6所示??梢奃enseNet的正確率曲線大體高于另外兩種。在AFDB數(shù)據(jù)集上,最佳模型是經(jīng)過76次迭代的DenseNet,取得了99.2%的準(zhǔn)確率、98.57%的靈敏性和99.47%的特異性。在2017 PhysioNet Challenge數(shù)據(jù)集上,最佳模型是迭代了98次的DenseNet,取得了97.32%的準(zhǔn)確率、81.75%的靈敏性和99.64%的特異性。
為避免過擬合,模型在測試集上檢驗真實性能并和其他算法進行比較。表7對比了所提方法和其他常用算法的識別性能??梢姡疚乃岱椒ㄔ贏FDB和2017 PhysioNet Challenge 數(shù)據(jù)集都具有最佳的識別準(zhǔn)確性、特異性和次優(yōu)的靈敏性。在對比算法中,Xia等人[15]和Ebrahimzadeh等人[7]分別采用WT生成的時頻圖和手動提取的心律變異性特征,對房顫加以檢測;其他方法均基于1維心電信號,采用神經(jīng)網(wǎng)絡(luò)實現(xiàn)房顫識別。而本文將HHT和DenseNet相結(jié)合,取得了最好的綜合識別性能。特別是,本文采用的HHT和Xia等人[15]采用的WT通過時頻分析豐富了原始信號,有效提高了識別正確率。而Ebrahimzadeh等人[7]手動提取特征,從而使識別正確率受限。此外,Jin等人[27]采用ResNet緩解梯度消失,實現(xiàn)房顫檢測,取得了相對較好的正確率。相比而言,DenseNet不僅可以緩解梯度消失,還可以更有效地利用特征,并且圖6所示實驗結(jié)果表明DenseNet性能優(yōu)于ResNet。綜上所述,本文所提方法具有最優(yōu)的綜合性能。雖然所提方法通過HHT的時頻圖提供更加精細(xì)的信號信息,但是也導(dǎo)致模型訓(xùn)練時需要較大的算力。
圖6 VGG, ResNet和DenseNet在驗證集上的準(zhǔn)確率曲線
表7 不同算法的性能比較(%)
本文采用HHT將1維ECG信號轉(zhuǎn)換為2維時頻矩陣,進而采用DenseNet實現(xiàn)房顫識別,從而深入挖掘原始信號中的時間和頻率信息。通過在兩類數(shù)據(jù)集上的實驗對比可見,所提方法在房顫檢測中具有最好的識別性能,具有一定的臨床應(yīng)用潛力。然而,相比而言,所提方法需要相對較大的算力。為進一步提高所提時頻分析方法的性能,DenseNet網(wǎng)絡(luò)的最優(yōu)結(jié)構(gòu)搜索將是我們未來的研究工作。