關(guān)鍵詞:房顫;心電圖;連續(xù)小波變換;殘差網(wǎng)絡(luò)
中圖分類號(hào):TP391 文獻(xiàn)標(biāo)志碼:A
0 引言(Introduction)
心房顫動(dòng)是臨床上最常見的心律失常類型之一,其在我國(guó)經(jīng)過年齡校正后的患病率高達(dá)1.6%,這意味著房顫存量病人超過2 000萬[1]。臨床上對(duì)心房顫動(dòng)的預(yù)防和診斷主要依靠醫(yī)生的專業(yè)經(jīng)驗(yàn)及基于影像學(xué)資料的判斷,這種診斷方法是主觀的,缺乏客觀的科學(xué)理論依據(jù)[2]。通過延時(shí)心電監(jiān)測(cè)發(fā)現(xiàn),6%~40%的房顫病例可能被漏診[3]。因此,開發(fā)房顫的自動(dòng)診斷方法具有極其重要的意義[4]。深度學(xué)習(xí)技術(shù)的發(fā)展有效地提高了手動(dòng)提取特征的效率,已有的基于深度學(xué)習(xí)的心電信號(hào)分類方法有基于堆疊LSTM(Long Short-Term Memory)的遞歸神經(jīng)網(wǎng)絡(luò)的房顫預(yù)測(cè)算法、基于SE-ResNet(ResNet withSqueeze and Excitation Module)的房顫?rùn)z測(cè)算法、基于ResRNN(Residual Recurrent Neural Network)的心律失常(包括房顫)分類方法等[5-7]。這些方法增強(qiáng)了模型的抗干擾能力,但是其召回率較低,表明存在未檢測(cè)到正樣本問題。
基于上述分析,為了提高模型的預(yù)測(cè)準(zhǔn)確率和泛化能力,本研究提出一種基于連續(xù)小波變換和殘差神經(jīng)網(wǎng)絡(luò)的房顫預(yù)測(cè)方法。首先,采用小波閾值去噪方法去除心電圖信號(hào)中的干擾,其次,通過連續(xù)小波變換將一維的時(shí)序信號(hào)轉(zhuǎn)換為二維時(shí)頻圖,最后,使用改進(jìn)的殘差網(wǎng)絡(luò)進(jìn)行房顫預(yù)測(cè)。
1 數(shù)據(jù)采集(Data collection)
本研究使用的真實(shí)數(shù)據(jù)來自兩個(gè)數(shù)據(jù)庫(kù),一是AFPDB(PAF Prediction Challenge Database)[8],二是2001年針對(duì)自動(dòng)預(yù)測(cè)陣發(fā)性心房纖顫/顫振的開放性競(jìng)賽引入的新心電數(shù)據(jù)庫(kù)(該數(shù)據(jù)庫(kù)中所有患者在數(shù)據(jù)收集前提供了知情同意書)。
AFPDB數(shù)據(jù)集是一個(gè)雙導(dǎo)聯(lián)的心電圖記錄數(shù)據(jù)庫(kù),所有記錄的初始采樣頻率為128 Hz,分辨率為12。篩選100條非AF患者的數(shù)據(jù)和50條AF患者發(fā)作之前的記錄,將篩選的數(shù)據(jù)采樣至500 Hz并切片,劃分成長(zhǎng)度為5 s的片段,最終得到2 250條心電數(shù)據(jù)樣本。同時(shí),為避免實(shí)驗(yàn)過程中出現(xiàn)重復(fù)現(xiàn)象,按照7∶2∶1的比例,將數(shù)據(jù)隨機(jī)劃分為訓(xùn)練集、驗(yàn)證集和測(cè)試集,即包含1 575個(gè)樣本的訓(xùn)練集、225個(gè)樣本的驗(yàn)證集及225個(gè)樣本的測(cè)試集。對(duì)以上數(shù)據(jù)進(jìn)行標(biāo)記,其中“1”表示在記錄的30 d后發(fā)生AF,“0”表示在記錄的30 d后未發(fā)生AF。
本研究新引入的數(shù)據(jù)庫(kù)中,共包含來自246名AF患者和890名非AF患者的2 160條記錄,AF患者包括113名男性和133名女性。非AF患者包括442名男性和448名女性。心電數(shù)據(jù)包含12導(dǎo)聯(lián),采樣頻率為500 Hz,分辨率為8,每個(gè)導(dǎo)聯(lián)包含5 000個(gè)數(shù)據(jù)點(diǎn),采樣時(shí)長(zhǎng)為10 s。選取660條AF患者發(fā)作前30 d的I導(dǎo)聯(lián)數(shù)據(jù),并以1∶2的比例隨機(jī)選取1 320個(gè)正常樣本,按照7∶2∶1的比例隨機(jī)劃分為訓(xùn)練集、驗(yàn)證集和測(cè)試集。最終的數(shù)據(jù)集為包含924條數(shù)據(jù)的訓(xùn)練集、264條數(shù)據(jù)的驗(yàn)證集及132條數(shù)據(jù)的測(cè)試集。對(duì)以上數(shù)據(jù)進(jìn)行標(biāo)記,其中“1”表示在記錄的30 d后發(fā)生AF,“0”表示在記錄的30 d后未發(fā)生AF。圖1所示為非AF患者和AF患者發(fā)作前30 d的心電圖信號(hào)。不同類型的心電圖信號(hào)如圖1所示。其中,圖1(a)為非AF患者的心電圖信號(hào),圖1(b)為AF患者發(fā)作前的心電圖信號(hào)。
2 房顫預(yù)測(cè)方法(Atrial Fibrillation prediction method)
圖4為原始心電圖信號(hào)和CWT時(shí)頻圖。其中,圖4(a)和圖4(b)分別為非AF患者的心電圖信號(hào)和CWT時(shí)頻圖,圖4(c)和圖4(d)分別為AF患者發(fā)作前的心電圖信號(hào)和CWT時(shí)頻圖。這兩個(gè)信號(hào)都有2000個(gè)采樣點(diǎn),采樣頻率為500 Hz,并經(jīng)過Morlet小波分解。比較圖4(b)和圖4(d)發(fā)現(xiàn),圖4(d)在時(shí)域上存在RR間期的絕對(duì)不等,頻域上存在更多不規(guī)則的房顫波(也稱F波)。因此,利用CWT時(shí)頻圖的特點(diǎn)可以有效地進(jìn)行房顫信號(hào)的分類,進(jìn)而預(yù)測(cè)不同信號(hào)發(fā)生房顫的可能。
2.3 房顫預(yù)測(cè)模型
殘差網(wǎng)絡(luò)(ResNet)是一種深度神經(jīng)網(wǎng)絡(luò)架構(gòu),通過引入殘差塊(Residual Block),使用殘差連接解決深度網(wǎng)絡(luò)訓(xùn)練中梯度消失和梯度爆炸等問題,被廣泛應(yīng)用于圖像分類等任務(wù)。
受殘差學(xué)習(xí)的啟發(fā),本研究設(shè)計(jì)了基于殘差神經(jīng)網(wǎng)絡(luò)的房顫預(yù)測(cè)模型。該模型由3個(gè)部分組成:輸入層、改進(jìn)的殘差塊和全連接層。第一部分的輸入層采用7×7的二維卷積核對(duì)原始圖像進(jìn)行降采樣,提取圖像的基本特征,并盡可能地保留原始圖像信息。第二部分的卷積層包含3個(gè)殘差塊,每個(gè)殘差塊包含兩個(gè)卷積層。在第二個(gè)殘差塊和第三個(gè)殘差塊中引入下采樣(Down Sample),采用步幅為2的1×1卷積進(jìn)行特征的映射,防止梯度消失和梯度爆炸。第三部分為兩層全連接層,將殘差層學(xué)習(xí)得到的特征映射成一維向量并輸出。為防止神經(jīng)網(wǎng)絡(luò)過度擬合,全連接層之間設(shè)置了比率為0.5的Dropout層?;赗esNet的房顫預(yù)測(cè)模型如圖5所示。殘差塊中的卷積層以及下采樣層的具體參數(shù)如圖6所示,其中圖6(a)和圖6(b)分別為殘差塊A和B中卷積層的具體參數(shù),圖6(c)為下采樣層的具體參數(shù)。
3.2 實(shí)驗(yàn)結(jié)果分析
本研究基于兩個(gè)數(shù)據(jù)集進(jìn)行實(shí)驗(yàn),并比較了不同的預(yù)測(cè)模型。在AFPDB數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果如表1所示,在本研究新提出的數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果如表2所示。由表1中的數(shù)據(jù)可以得出,本研究提出的方法應(yīng)用于AFPDB數(shù)據(jù)集的精確度、F1值和準(zhǔn)確率均有顯著的提升,可以更好地識(shí)別房顫樣本。從表2中的數(shù)據(jù)可以得出,本研究提出的方法應(yīng)用于新數(shù)據(jù)集上的精確度、召回率、F1值和準(zhǔn)確度分別為92.4%、90.4%、91.4%和94.2%,均優(yōu)于其他比較模型。采用密集連接的DenseNet實(shí)現(xiàn)了特征的重復(fù)利用,減少了模型的參數(shù)數(shù)量,本次實(shí)驗(yàn)使用的參數(shù)數(shù)量為12.99 MB。本研究提出的模型在ResBlock結(jié)構(gòu)中融入了共享參數(shù)的下采樣卷積層,以減少模型參數(shù)數(shù)量,模型參數(shù)數(shù)量?jī)H為3.15 MB,并且模型效果也優(yōu)于DenseNet。相較于ResNet-18,本文提出模型的性能也有顯著提升。不同的模型在兩個(gè)數(shù)據(jù)集上的混淆矩陣如圖7所示。圖7(a)、圖7(b)和圖7(c)分別表示DenseNet、ResNet18和本研究提出的模型在AFPDB數(shù)據(jù)集上的混淆矩陣,圖7(d)、圖7(e)和圖7(f)分別表示DenseNet、ResNet18和本研究提出的模型在新數(shù)據(jù)集上的混淆矩陣。由圖7可見,本研究提出的模型在兩個(gè)數(shù)據(jù)集上的各項(xiàng)指標(biāo)均優(yōu)于其他模型,具有較強(qiáng)的泛化能力,適用于不同的房顫?rùn)z測(cè)任務(wù)。
3.3 討論
將本文提出的模型與最新的研究模型在AFPDB數(shù)據(jù)集上進(jìn)行比較,結(jié)果如表3所示。SUN等[5]開發(fā)了一種由堆疊LSTM構(gòu)成的遞歸神經(jīng)網(wǎng)絡(luò)SLAP,房顫預(yù)測(cè)的準(zhǔn)確率為92.0%,F(xiàn)1值為92.0%。YANG等[15]提出了一種混合模型,結(jié)合了CNN和LSTM(CNN-LSTM)的優(yōu)越性,提取嵌入于模式轉(zhuǎn)換特征中的局部空間特征和時(shí)間依賴特征,其準(zhǔn)確率達(dá)到了91.3%,召回率為82.2%;但是,較低的召回率表明其在檢測(cè)正樣本方面的能力較弱,需要進(jìn)一步改進(jìn)。WANG等[16]采用改進(jìn)的量子粒子群優(yōu)化算法(IQPSO)結(jié)合支持向量機(jī)(SVM)構(gòu)建了一個(gè)有效的預(yù)測(cè)模型,其對(duì)第二導(dǎo)聯(lián)心電圖信號(hào)的預(yù)測(cè)結(jié)果中,準(zhǔn)確率和召回率分別為92.5%和93.3%,然而該方法需手動(dòng)干預(yù),沒有實(shí)現(xiàn)端到端的方法。在AFPDB數(shù)據(jù)集上,本研究的方法在指標(biāo)上的表現(xiàn)均優(yōu)于其他模型。相較于機(jī)器學(xué)習(xí)算法,端到端的深度學(xué)習(xí)算法在大數(shù)據(jù)背景下展現(xiàn)出更為出色的性能,尤其在處理房顫分類任務(wù)時(shí)表現(xiàn)突出。在這一任務(wù)中,傳統(tǒng)的技術(shù)方法,例如時(shí)域特征提取、頻域特征提取及格拉姆角場(chǎng)等,主要應(yīng)用于將一維數(shù)據(jù)轉(zhuǎn)換為二維矩陣,以便作為神經(jīng)網(wǎng)絡(luò)的輸入進(jìn)行進(jìn)一步處理。然而,這些方法在實(shí)際應(yīng)用中的性能表現(xiàn)并不理想,存在一定的局限性。因此,本研究引入了一種將連續(xù)小波變換與殘差神經(jīng)網(wǎng)絡(luò)架構(gòu)相結(jié)合的房顫預(yù)測(cè)方法。通過在AFPDB數(shù)據(jù)集和本研究提出的新數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn),證明該方法適用于房顫預(yù)測(cè)任務(wù)。
4 結(jié)論(Conclusion)
心房顫動(dòng)是心律失常的重要類型,因此構(gòu)建準(zhǔn)確、穩(wěn)定的心房顫動(dòng)檢測(cè)系統(tǒng)對(duì)臨床輔助診斷具有重要意義。本研究提出了基于連續(xù)小波變換和殘差神經(jīng)網(wǎng)絡(luò)的房顫?rùn)z測(cè)方法。首先,對(duì)原始心電圖信號(hào)進(jìn)行預(yù)處理,使用軟閾值小波去噪方法濾除部分干擾信號(hào),其次,使用連續(xù)小波變換將一維時(shí)序信號(hào)轉(zhuǎn)換為二維時(shí)頻圖。在基于殘差神經(jīng)網(wǎng)絡(luò)的模型中引入改進(jìn)的殘差塊進(jìn)行特征提取和預(yù)測(cè)。所提出的模型在公開數(shù)據(jù)集上獲得較好的預(yù)測(cè)性能,精確度、召回率、F1值及準(zhǔn)確率分別為96.1%、92.5%、94.3%、94.2%,證明了此方法的有效性。在提出的數(shù)據(jù)集上也取得了較好的表現(xiàn),預(yù)測(cè)精確度、召回率、F1值和準(zhǔn)確率分別為92.4%、90.4%、91.4%、94.2%,從而進(jìn)一步驗(yàn)證本研究提出的方法具有較大的實(shí)用價(jià)值,并且可靠性較高。未來的研究方向?qū)⒖紤]更大的數(shù)據(jù)集和更多元化的信號(hào),以期進(jìn)一步提高預(yù)測(cè)的準(zhǔn)確性,縮短預(yù)測(cè)時(shí)間,提供更可靠的診斷。
作者簡(jiǎn)介:
朱宇翔(1998-),男,碩士生。研究領(lǐng)域:醫(yī)學(xué)信號(hào)處理,深度學(xué)習(xí)。
童基均(1977-),男,博士,教授。研究領(lǐng)域:醫(yī)學(xué)信號(hào)處理,醫(yī)療信息化。本文通信作者。
夏淑東(1978-),男,博士,主任醫(yī)師。研究領(lǐng)域:心律失常射頻消融,起搏器植入,冠心病介入治療和先天性心臟病封堵。
朱海航(1998-),男,碩士生。研究領(lǐng)域:醫(yī)學(xué)信號(hào)處理,深度學(xué)習(xí)。