周志波
摘 要:針對ECG信號分類問題,提出一種融合卷積神經(jīng)網(wǎng)絡(luò)和信號時頻統(tǒng)計特征的方法。該方法首先利用卷積神經(jīng)網(wǎng)絡(luò)提取ECG信號分布特征,再利用離散小波變換將ECG信號分解為高頻系數(shù)與低頻系數(shù),計算所有高頻系數(shù)及最后一個低頻系數(shù)的統(tǒng)計特征值,最后將計算所得的時頻統(tǒng)計特征融入卷積神經(jīng)網(wǎng)絡(luò)全連接層,并利用Softmax分類器進行分類。結(jié)果表明,該方法對三類心血管疾病的ECG信號分類識別率達93.4%,證明該方法可用于解決ECG信號分類問題。
關(guān)鍵詞:心電信號;卷積神經(jīng)網(wǎng)絡(luò);時頻統(tǒng)計特征;特征融合
DOI:10. 11907/rjdk. 201231????????????????????????????????????????????????????????????????? 開放科學(xué)(資源服務(wù))標(biāo)識碼(OSID):
中圖分類號:TP301 ? 文獻標(biāo)識碼:A ??????????????? 文章編號:1672-7800(2020)011-0046-04
Research on ECG Signal Recognition Method Based on Feature Fusion CNN Model
ZHOU Zhi-bo
(College of Computer Science and Engineering, Shandong University of Science and Technology,Qingdao 266590,China)
Abstract: In order to solve the problem of ECG signal classification, a method of fusion of convolutional neural network and time-frequency statistical characteristics of signals is proposed. Firstly, a convolutional neural network is used to extract the distribution characteristics of ECG signals, and then discrete wavelet transform is used to decompose the ECG signals into high frequency coefficients and low frequency coefficients, and the statistical characteristic values are calculated of all high frequency coefficients and the last low frequency coefficient are calculated. Finally,the calculated time-frequency statistical features are fused into the fully connected layer of the convolutional neural network and classified by using a Softmax classifier. The experimental results show that the method has an ECG signal classification recognition rate of 93.4% for three types of cardiovascular diseases, which proves that the method can be used to solve the ECG signal classification problem.
Key Words: ECG Signal; convolutional neural network; time-frequency statistical characteristics; feature fusion
0 引言
各種音頻信號和生命體征信號等時變信號(Time Varying Signal,TVS)是一類重要的、具有非線性和非平穩(wěn)特性的常見信號,涵蓋了信息提取的主要難點和熱點問題[1]。由于時變信號的復(fù)雜性和不確定性,時變信號分類研究面臨諸多挑戰(zhàn),如噪聲、時空對齊、量綱統(tǒng)一等問題。
心電信號(Electrocardiogram,ECG)是一種典型時變信號,該信號反映了心肌細(xì)胞在電激動時產(chǎn)生的電傳變換[2],它是診斷心血管疾病的有效手段之一。ECG信號分類問題是醫(yī)學(xué)診斷與人工智能相結(jié)合的一個熱點問題,許多研究人員做了大量相關(guān)工作,如心電圖心律失常檢測[3]、心肌梗死檢測[4]等,這些以深度學(xué)習(xí)模型為基礎(chǔ)的研究方法取得了豐碩成果。Brito等[5]利用一維卷積殘差網(wǎng)絡(luò)在MIT-BIH數(shù)據(jù)庫上進行四分類實驗,取得良好分類效果;Hasan等[6]利用經(jīng)驗?zāi)J椒纸鈱CG信號分解去噪,并使用一維卷積網(wǎng)絡(luò)對ECG信號特征進行提取和分類;李四海等[7]結(jié)合SVM分類器,對提取的心電信號QRS波特征值進行分類,并在MIT-BIH數(shù)據(jù)集上取得92.6%的平均分類準(zhǔn)確率;Das等[8]使用S變換和小波變換提取ECG心拍波形特征,再利用多層感知機神經(jīng)網(wǎng)絡(luò)[9]對提取的信號特征進行分類;顏菲等[10]提出一種疊加去噪自動編碼器與深度神經(jīng)網(wǎng)絡(luò)相結(jié)合的方法,并在3種不同的心電信號數(shù)據(jù)集上均取得很好效果;Alqudah等[11]提取ECG信號的高斯混合系數(shù)特征值和小波分解特征值,并將這兩種特征用概率神經(jīng)網(wǎng)絡(luò)和隨機森林兩種分類器進行心律失常分類;Osowski等[12]將模糊混合神經(jīng)網(wǎng)絡(luò)模型用于心拍分類,其分類準(zhǔn)確率達96%。
同時,上述方法也存在一些不足:一是僅使用深度學(xué)習(xí)模型,沒有充分利用ECG信號特征的多樣性;二是對心拍進行分類研究,需要完成從ECG信號中分割出心拍的復(fù)雜工作。針對以上問題,本文提出一種特征融合卷積神經(jīng)網(wǎng)絡(luò)模型,仿真實驗中該模型處理的數(shù)據(jù)對象是12導(dǎo)聯(lián)多心拍的ECG信號,因此不需要分割出心拍,從而省去了傳統(tǒng)方法獲取心拍的繁瑣工作。為了克服單一卷積網(wǎng)絡(luò)對信號特征提取的局限性,本文方法在傳統(tǒng)卷積神經(jīng)網(wǎng)絡(luò)中融合了ECG信號時頻統(tǒng)計特征,實驗結(jié)果表明,這種方法有效提高了傳統(tǒng)卷積神經(jīng)網(wǎng)絡(luò)對ECG信號的分類能力。
1 卷積神經(jīng)網(wǎng)絡(luò)與時頻統(tǒng)計特征
1.1 卷積神經(jīng)網(wǎng)路
卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)由Lecun等[13]提出,是深度學(xué)習(xí)領(lǐng)域經(jīng)典模型之一。CNN基本結(jié)構(gòu)包括卷積層、池化層及全連接層,其中卷積層用于數(shù)據(jù)特征提取,是卷積網(wǎng)絡(luò)的核心層;池化層用于數(shù)據(jù)降維并保證特征平移不變性;全連接層可以整合卷積層或者池化層中具有類別區(qū)分性的局部信息[14]。卷積神經(jīng)網(wǎng)絡(luò)特征計算核心公式如式(1)所示。
yl+1j=downσi∈Mjxli?wl+1ij+bl+1j ?????? (1)
其中,yl+1j為網(wǎng)絡(luò)l+1層第j個特征面,xli為網(wǎng)絡(luò)l層第i個特征面,wl+1ij為網(wǎng)絡(luò)l+1層第j個特征面與l層第i個特征面的連接權(quán)值,bl+1j為第l+1層第j個偏置量,σ為激活函數(shù),down?為下采樣函數(shù),?為卷積運算。
1.2 時頻統(tǒng)計特征
時變信號的時頻特性隨時間或空間變化而變化,處理這類信號,利用小波理論作為處理工具最為合適[15],小波理論中的離散小波變換(Discrete Wavelet Transform,DWT)[16]可用于獲取時變信號的頻率成分,即將原始信號分解為低頻分量和高頻分量。ECG信號是一種典型時變信號,因此DWT可用于ECG信號的時頻統(tǒng)計特征提取。采用DWT分解信號的理論公式如式(2)所示。
wxj,k=Rxtψj,ktdt ? (2)
其中,xt是原始信號,Wxj,k是子帶頻率,ψj,kt=12jψt2j-k是小波基函數(shù),j 是尺度系數(shù),k是平移系數(shù),R是實數(shù)集。
Mallat算法是實現(xiàn)DWT的有效方法之一,其分解信號公式[17]表示為如式(3)、式(4)所示。
xjk=nh0n-2kxj-1k ??? (3)
djk=nh1n-2kxj-1n ?? (4)
其中,xkj表示近似系數(shù),即低頻分量;dkj表示細(xì)節(jié)系數(shù),即高頻分量;h0k表示低通濾波器;h1k表示高通濾波器。
本文采用DWT獲取ECG信號時頻統(tǒng)計特征,其步驟可總結(jié)如下:①使用DWT分解ECG信號為近似系數(shù)A1和細(xì)節(jié)系數(shù)D1;②在細(xì)節(jié)系數(shù)D1保持不變的情況下,分解近似系數(shù)A1為A2和D2,重復(fù)上述過程,最終獲得ECG信號小波分解樹D1,D2,D3,…,Dn,An;③應(yīng)用數(shù)學(xué)統(tǒng)計方法,計算小波分解樹中D1,D2,D3,…,Dn,An每個頻率分量的統(tǒng)計特征值,包括均值、方差、峭度、峰值因子。
2 特征融合卷積神經(jīng)網(wǎng)絡(luò)模型
卷積神經(jīng)網(wǎng)絡(luò)能有效提取ECG信號的時域波形特征,但無法提取ECG信號的頻域特征,因此在ECG信號分類問題上,既能利用卷積網(wǎng)絡(luò)特征提取能力,又能結(jié)合信號頻域特征。本文提出一種融合信號時頻統(tǒng)計特征的卷積神經(jīng)網(wǎng)絡(luò)模型,該模型首先通過DWT分解ECG信號,獲取其時頻統(tǒng)計特征值,并利用卷積網(wǎng)絡(luò)獲取其波形特征,然后將兩種方法獲取的信號特征線性融合,最后采用Softmax分類器進行分類。本文特征融合卷積神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)如圖1所示。
特征融合的卷積神經(jīng)網(wǎng)絡(luò)特征提取公式如式(5)—式(7)所示。
a2=avgReluw2?x1+b2 ?? (5)
z=avg?avgReluw3?a2+b3 ????? (6)
y=z+ws ? (7)
其中,x1為網(wǎng)絡(luò)輸入數(shù)據(jù),w2為網(wǎng)絡(luò)第2層卷積核,b2為網(wǎng)絡(luò)第2層偏置量,Relu為激活函數(shù),avg為平均池化函數(shù),a2為網(wǎng)絡(luò)第2層特征面,z為網(wǎng)絡(luò)全連接層特征值,ws為信號時頻統(tǒng)計特征值,y為融合特征值。
特征融合需要考慮統(tǒng)一量綱問題,量綱問題指不同來源的特征值有著不同的量綱,使得它們的大小不在同一區(qū)間。為解決量綱統(tǒng)一問題,本文實驗采用Z-score標(biāo)準(zhǔn)化。
3 ECG信號分類實驗
3.1 數(shù)據(jù)集
ECG信號分類實驗數(shù)據(jù)集來源于中國心血管疾病數(shù)據(jù)庫(Chinese Cardiovascular Disease Database,CCDD)[18],CCDD數(shù)據(jù)庫包含大約18萬條12導(dǎo)聯(lián)ECG信號,覆蓋了絕大部分的心血管類疾病。本文選取CCDD數(shù)據(jù)庫中的3類ECG信號:正常心電圖、心房顫動、房性早搏。數(shù)據(jù)預(yù)處理包括抽稀、去噪,由于原始信號維度過高,特征不易提取,因此需要將原始信號抽稀降維至2 250個點的長度,同時原始ECG信號包含高頻噪聲,因此在實驗前采用巴特沃斯低通濾波器[19]對信號進行濾波處理。3種ECG信號的數(shù)據(jù)量以及訓(xùn)練與測試數(shù)據(jù)說明如表1所示。
3.2 網(wǎng)絡(luò)結(jié)構(gòu)與參數(shù)設(shè)置
本實驗特征融合卷積神經(jīng)網(wǎng)絡(luò)設(shè)置為五層卷積池化塊和兩個全連接層,卷積核大小為1×5,卷積步長為1×1,激活函數(shù)為Relu,池化函數(shù)為平均池化函數(shù),池化大小和步長均為1×4。離散小波變換使用‘db1小波將信號分解為3層小波分解樹,對于小波分解樹中所有高頻系數(shù)和第三層低頻系數(shù),計算它們的4種時頻統(tǒng)計特征,包括均值、方差、峭度、峰值因子,每條ECG信號樣本可獲取192個時頻統(tǒng)計特征。ECG信號時頻特征與卷積神經(jīng)網(wǎng)絡(luò)第一個全連接層的特征值相融合,模型采用Softmax分類器。
在訓(xùn)練階段,網(wǎng)絡(luò)訓(xùn)練數(shù)據(jù)的Batch大小設(shè)置為300,迭代次數(shù)設(shè)置為50次,網(wǎng)絡(luò)的第一個全連接層Dropout率設(shè)置為0.5,并使用學(xué)習(xí)率為1×10-2的Adam優(yōu)化器,在Intel Corei7-3537U CPU上運行約為20個小時。
3.3 實驗結(jié)果與分析
為驗證融合時頻統(tǒng)計特征的卷積神經(jīng)網(wǎng)絡(luò)(TFCNN)能夠提高一般卷積神經(jīng)網(wǎng)絡(luò)(CNN)對ECG信號的分類能力,本文先采用CNN模型對CCDD數(shù)據(jù)集進行分類,再利用TFCNN模型加以分類,通過兩個實驗的分類結(jié)果驗證TFCNN的有效性。模型分類能力用混淆矩陣和測試指標(biāo)(召回率、精確度、F1分?jǐn)?shù))體現(xiàn),其中混淆矩陣斜對角線數(shù)值為對應(yīng)標(biāo)簽疾病的分類準(zhǔn)確率,其它數(shù)值為對應(yīng)標(biāo)簽疾病的錯分率;測試指標(biāo)的召回率(Recall)代表實際為正的樣本中預(yù)測為正樣本的概率,精確度(Precision)代表被預(yù)測為正的樣本中實際為正樣本的概率,F(xiàn)1分?jǐn)?shù)(F1-score)是精確率和召回率的調(diào)和平均數(shù),F(xiàn)1分?jǐn)?shù)越高,說明分類模型越穩(wěn)健。
CNN模型混淆矩陣如表2所示,該模型對3種疾病的分類準(zhǔn)確率分別為99%、92.4%和78.6%,標(biāo)簽0和標(biāo)簽1的疾病樣本主要錯分為標(biāo)簽2的疾病類型,標(biāo)簽2的疾病樣本主要錯分為標(biāo)簽0的疾病類型。
CNN模型對3類疾病樣本的平均召回率、精確度及F1分?jǐn)?shù)分別為0.9、0.91和0.9,其中房性早搏疾病類型的召回率和F1分?jǐn)?shù)指標(biāo)測試結(jié)果較低,正常心電圖樣本的精確度指標(biāo)測試結(jié)果較低,CNN模型各項指標(biāo)測試結(jié)果如表3所示。
TFCNN模型對3種疾病的分類準(zhǔn)確率分別為99%、94.1%及86%,均高于CNN模型測試結(jié)果,并且在TFCNN模型混淆矩陣中,標(biāo)簽0和標(biāo)簽1的樣本錯分為標(biāo)簽2的錯分率為1%和5.82%,標(biāo)簽2的樣本錯分為標(biāo)簽0的錯分率為12%,其錯分率均低于CNN模型。TFCNN模型混淆矩陣如表4所示。
TFCNN模型的召回率、精確度及F1分?jǐn)?shù)測試平均結(jié)果為0.93、0.93和0.93,均高于CNN模型3項指標(biāo)測試平均結(jié)果。其中,房性早搏類型樣本召回率和F1分?jǐn)?shù)為0.86和0.88,相比于CNN模型有明顯提高,正常心電圖樣本精確度也由0.85提高到0.91。TFCNN模型各項指標(biāo)如表5所示。
TFCNN模型與CNN模型的混淆矩陣和分類指標(biāo)對比表明,TFCNN模型的分類準(zhǔn)確率高于CNN模型,同時TFCNN模型也能保持更好的穩(wěn)定性。為了進一步表明TFCNN模型的有效性,除上述兩組實驗,本文與趙勇等[20]的方法做了對比實驗,文獻[20]的方法是將提取的多種ECG信號特征用SVM加以分類。3組實驗對比結(jié)果表明,TFCNN模型在識別率與穩(wěn)定性上都有明顯優(yōu)勢,3組實驗結(jié)果如表6所示。
4 結(jié)語
針對ECG信號分類問題,本文提出了一種融合ECG信號時頻統(tǒng)計特征的卷積神經(jīng)網(wǎng)絡(luò)模型。該模型優(yōu)點在于既能提取ECG信號樣本分布特征,又融合了ECG信號樣本的時頻統(tǒng)計特征。針對3類ECG信號樣本的實驗表明,該方法能夠提高一般卷積神經(jīng)網(wǎng)絡(luò)對ECG信號的分類能力,但該方法對于樣本數(shù)量少的ECG信號類型分類效果不佳??刹捎脭?shù)據(jù)增強或選擇更具代表性的時頻統(tǒng)計特征進行改進,這是下一步研究的重點。
參考文獻:
[1] 高暢. 時變信號處理關(guān)鍵技術(shù)研究[D]. 黑龍江:哈爾濱工業(yè)大學(xué),2016.
[2] 趙靜,韓海成. ECG信號自適應(yīng)貝葉斯小波去噪算法研究[J]. 現(xiàn)代電子技術(shù),2019,42(5):62-65.
[3] SASHIKUMAR S P,SHAH A J,LI Q,et al. A deep learning approach to monitoring and detecting atrial fibrillation using wearable technology[C]. 2017 IEEE EMBS International Conference on Biomedical & Health Informatics(BHI),2017:141-144.
[4] ZHOU L,YAN Y,QIN X B,et al. Deep learning-based classification of massive electrocardiography data[C]. 2016 IEEE Advanced Information Management,Communicates,Electronic And Automation Control Conference,2016:780-785.
[5] BRITO C,MACHADO A,SOUSA A. Electrocardiogram beat-classification based on a ResNet network[J]. Studies In Health Technology And Informatics,2019,264:55-59.
[6] HASAN N I,BHATTACHARJEE A. Deep learning approach to cardiovascular disease classification employing modified ECG signal from empirical mode decomposition[J]. Biomedical Signal Processing and Control,2019,52:128-140.
[7] 李四海,滿自斌,張紅. 基于小波變換和SVM的心電早搏信號識別[J]. 計算機應(yīng)用與軟件,2014,31(8):182-185.