• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于堆疊分類器的心電異常監(jiān)測模型設(shè)計

      2021-03-18 13:45:58
      計算機應用 2021年3期
      關(guān)鍵詞:集上心電分類器

      (1.大連大學信息工程學院,遼寧大連 116622;2.大連大學物理科學與技術(shù)學院,遼寧大連 116622;3.周口師范學院網(wǎng)絡工程學院,河南周口 466001)

      0 引言

      心電圖(ElectroCardioGraph,ECG)記錄的數(shù)據(jù)包含關(guān)于心臟活動節(jié)奏屬性等重要數(shù)據(jù)。心電圖包括5 種基本波P、Q、R、S、T,有時也包括U 波。P 波代表心房去極化;T 波代表心室的復極;T 波跟隨著每一個QRS 復合物,通常情況下它與QRS 波有一個穩(wěn)定的間隔[1]。心律失常是心率或節(jié)律的不規(guī)則性,在某些情況下,可在受試者的日常生活中偶爾發(fā)生。為了捕獲這些不常見的事件,通常使用動態(tài)心電圖設(shè)備來記錄長期的心電圖數(shù)據(jù)[2]。心電圖波形檢查有助于各種異常的診斷,是研究心臟病最重要和常用的手段之一。

      目前心電監(jiān)測的方法主要包含以下幾種:人工監(jiān)測、基于機器學習的監(jiān)測[3]和基于深度學習的監(jiān)測[4]。由于人工觀測心電圖的步驟繁瑣,且需要大量的先驗知識做積累,而且很容易忽略心電圖中微小的波動變化從而導致判定出錯。

      近年來學者們主要使用機器學習和深度學習的方法來進行心電圖的監(jiān)測。深度學習方法在圖像檢測的問題上已經(jīng)取得了較好的效果。Al Rahhal等[5]使用深度神經(jīng)網(wǎng)絡動態(tài)神經(jīng)網(wǎng)絡(Dynamic Neural Network,DNN)使用堆疊降噪自動編碼器(Stack Denoising AutoEncoder,SDAE)從原始的兩導聯(lián)心電圖數(shù)據(jù)中進行適當?shù)奶卣鞅硎?。Zubair 等[6]使用蜂窩神經(jīng)網(wǎng)絡(Cellular Neural Network,CNN)對從MIT-BIH[7]數(shù)據(jù)庫獲得的44 個心電圖信號進行記錄,提取了R 峰的心電圖節(jié)拍模式,用于3 層CNN 的訓練,能92.70%準確地將心電圖的搏動分為各自的類別。Kiranyaz 等[8]研究了僅用R 峰波的3 層CNN 心電監(jiān)護系統(tǒng)。Acharya 等[9]使用9 層的CNN 算法可以對5 種不同的心電心跳類型進行分類,通過對有噪聲的MITBIH數(shù)據(jù)庫中的數(shù)據(jù)進行去噪和數(shù)據(jù)擴增處理,使得5種數(shù)據(jù)平衡化后檢測的識別率達到92.50%,對數(shù)據(jù)不平衡的原始數(shù)據(jù)集進行判定時識別率下降到了89.3%。該方法能減少患者的等待時間,減輕心內(nèi)科醫(yī)生的工作量,降低醫(yī)院心電信號處理的成本。Luo 等[10]提出基于時頻表示和特定于患者的心跳分類,通過使用具有1 024 個神經(jīng)元的一維編碼器和一個softmax 形成的DNN 模型使得心電圖識別識別率達到94.39%,其DNN 模型所需計算量較大,相同數(shù)據(jù)集下訓練時間約1 h。Mathews 等[11]開發(fā)了一個基于CNN 的分類系統(tǒng),它能自動從兩導聯(lián)ECG 數(shù)據(jù)中學習合適的特征表示,從而消除了手工制作特征的需要,但框架沒有涉及任何QRS 波檢測。在Acharya 等[12]的工作中,由11 層卷積神經(jīng)網(wǎng)絡處理分段ECG,使用短時程ECG 數(shù)據(jù)得到最大精度93.18%。Sun 等[13]利用8 682例多導睡眠儀數(shù)據(jù)集,構(gòu)建了一個由卷積網(wǎng)絡和長短時記憶網(wǎng)絡組成的5 個深度神經(jīng)網(wǎng)絡,利用心電圖和呼吸信號訓練深層網(wǎng)絡模型。

      深層網(wǎng)絡是“黑匣子”,研究人員不能完全了解深層網(wǎng)絡的內(nèi)部結(jié)構(gòu)。本文算法相較于深度學習模型在調(diào)整超參數(shù)更改模型設(shè)計時更加簡單。另一方面,醫(yī)療數(shù)據(jù)相對較少很難滿足龐大的深層網(wǎng)絡的需要。本文提出將合成少數(shù)過采樣技術(shù)(Synthetic Minority Over-sampling TEchnique,SMOTE)對稀缺的心電異常數(shù)據(jù)做了數(shù)據(jù)平衡化處理[14],解決了醫(yī)療數(shù)據(jù)稀缺并且數(shù)據(jù)的種類不平衡問題,實驗的結(jié)果證明平衡化后的數(shù)據(jù)可大幅減輕數(shù)據(jù)過擬合問題,提高分類器的性能。

      1 模型設(shè)計

      1.1 系統(tǒng)架構(gòu)

      本文堆疊分類器(Stacking Classifier)系統(tǒng)架構(gòu)如圖1 所示,通過小波變換得到每個心拍含有的25 個特征系數(shù),從特征提取以后的心拍中隨機取出其中的80%作為算法模型的訓練集,其余的20%數(shù)據(jù)作為測試集,再通過SMOTE 算法把原始的不平衡數(shù)據(jù)進行數(shù)據(jù)擴增以達到每種病例數(shù)量持平的效果。

      圖1 Stacking Classifier系統(tǒng)架構(gòu)Fig.1 Architecture of Stacking Classifier system

      1.2 心電監(jiān)測分類模型

      堆疊分類器是一種集合學習技術(shù),它是通過元分類器組合多個分類模型[15]。首先,通過完整的訓練集來訓練各個分類模型,再通過集合各個分類模型的輸出而得來的元特征來擬合元分類器。元分類器可以根據(jù)預測類標簽或來自集合的概率進行訓練。

      算法模型把訓練集的數(shù)據(jù)分別送入不同的分類模型分類器中,通過多個不同分類器獲得不同的預測結(jié)果,再通過元分類器迭代多個預測模型的分類結(jié)果,獲得最終的預測結(jié)果,過程如圖2所示。

      首先把訓練集分成N等份:train1,train2,…,trainN,然后構(gòu)造一個初級機器學習器,它是由K最近鄰(K-Nearest Neighbors,KNN)分類器、RandomForest 和極端梯度提升(eXtreme Gradient BOOSTing,XGBOOST)分類器三種基模型構(gòu)成的,依次使用train1,train2,…,trainN作為驗證集,其余N-1份作為訓練集,交叉驗證進行模型訓練;再在測試集上進行預測。這樣會得到在訓練集上由KNN 模型訓練出來的N份預測值和在測試集上的1 份預測值B1。將這N份縱向重疊合并起來得到A1。RandomForest 和XGBOOST 模型部分也運用類似的方法。

      3個基模型訓練完畢后,將3個模型在訓練集上的預測值作為分別作為3 個“特征”A1、A2、A3,然后再通過邏輯回歸(Logistic Regression,LR)模型進行訓練,建立LR 模型,這個LR模型就是次級分類器。使用訓練好的LR模型,用3個基模型在測試集上得到的預測值構(gòu)建的3個特征值(B1,B2,B3),當沒有概率時直接使用初級分類的輸出作為初級分類器的輸入,把初級分類器的結(jié)果均質(zhì)化以后作為次級分類器的輸入已達到疊加器的效果,進行預測可以綜合各種機器學習算法分類器的優(yōu)勢迭代出相對較好的結(jié)果。

      圖2 Stacking Classifier計算過程Fig.2 Stacking Classifier computation process

      1.3 樣本擴展

      類別不平衡問題(class-imbalance)是指在訓練分類器中所使用的訓練集的類別分布不均,數(shù)據(jù)集中存在某一類樣本,其數(shù)量遠多于或遠少于其他類樣本,從而導致一些機器學習模型失效的問題。心電數(shù)據(jù)就是一個典型的類別不平衡問題,正常的心拍數(shù)量遠遠多于異常心拍的數(shù)量,從而容易造成最終的分類結(jié)果不理想。為了解決該問題,本文采用SMOTE算法對數(shù)據(jù)集非平衡樣本進行了擴充,該算法思想是在少數(shù)類樣本之間進行插值來產(chǎn)生額外的樣本,自提出以來受到學術(shù)界和工業(yè)界的一致認同[16]。對心電數(shù)據(jù)及堆疊模型而言,比起簡單地將少數(shù)類別樣本復制添加到樣本集中等方式,該算法能夠避免模型學到的信息過分特別,不夠泛化,從而避免模型產(chǎn)生過擬合問題。

      SMOTE 算法的描述如算法1 所示,算法可以獲得新的少數(shù)類樣本,通過對每個少數(shù)類樣本a,從它的最近鄰中隨機選一個樣本b,通過在a、b之間的連線上隨機選一點作為新合成的少數(shù)類樣本。SMOTE算法的描述如圖3所示,(少量的數(shù)據(jù)樣本)圖表示少數(shù)類樣本中的xi到少數(shù)類樣本集中所有樣本的距離,(生成新的樣本)圖為根據(jù)采樣比例倍率,從xi的K近鄰中隨機選擇若干個樣本,分別與原樣本通過算法中的公式構(gòu)建新樣本。

      算法1SMOTE算法。

      輸入:數(shù)據(jù)集中的每個樣本a;

      輸出:產(chǎn)生出的屬于少數(shù)樣本類中的新樣本c;

      算法描述:

      1)通過歐氏距離,計算每個樣本的K近鄰樣本b,得到K鄰近值;

      2)根據(jù)樣本不平衡比例設(shè)置采樣倍率C,從少數(shù)樣本K近鄰中隨機選取b;

      3)根據(jù)下式生成新的樣本c。

      c=a+rand(0,1)*|a-b|

      圖3 SMOTE計算原理Fig.3 Calculation principle of SMOTE

      2 實驗結(jié)果與分析

      2.1 實驗環(huán)境與數(shù)據(jù)集

      本文使用的是MIT-BIH 心律失常數(shù)據(jù)庫[17],該數(shù)據(jù)庫是麻省理工大學(MIT)結(jié)合國際標準并通過專家標注解釋的心電數(shù)據(jù)庫,是目前學術(shù)界心電監(jiān)測領(lǐng)域最權(quán)威的心電數(shù)據(jù)庫。

      MIT-BIH心律失常數(shù)據(jù)庫包含48個30 min長度雙通道動態(tài)心電圖記錄片段,其中包含了十幾種心律失常類型,總計超過十萬多個心拍,當然其中大部分都是正常的心拍,異常心拍的種類包括房性早搏、室性早搏、束支阻滯、房顫等多類異常心拍。

      算法被部署在具有雙個E52620 CPU、1080TI 顯卡的塔式工作站上,在深度學習模型中使用sklearn 平臺架構(gòu)和Python-3.7 實現(xiàn)本文算法。把整體的心拍通過交叉驗證的方式分成N份,隨機抽取其中的N-1 份作為訓練集,剩下的1 份作為驗證集得以應用到訓練模型中來,使得本就稀有的醫(yī)療心拍數(shù)據(jù)得到充分的發(fā)揮,采用這樣的方式就可以使得模型的訓練精度得到了加強。這種交叉驗證的方式不僅提高了訓練結(jié)果的可信度,同時充分使用了所有的樣本數(shù)據(jù)。

      為驗證分類效果,對實驗結(jié)果計算多種評價指標值,包括召回率(Recall)又稱敏感性(Sensitivity)、精確率(Precision)以及F1系數(shù)。

      2.2 結(jié)果對比與分析

      基于以上的模型和訓練,將本文算法應用于公開數(shù)據(jù)集MIT-BIH 上進行了分類效果的測試。選取經(jīng)典機器學習算法支持向量機(Support Vector Machine,SVM)、邏輯回歸、隨機森林和主流的集成學習算法極端梯度提升(XGBOOST)、梯度提升決策樹(Gradient Boosting Decision Tree,GBDT),在同一個原始數(shù)據(jù)集上做分析比較,發(fā)現(xiàn)不同的機器學習算法在數(shù)據(jù)集上的表現(xiàn)不同,結(jié)果見表2、3。

      表2 原始數(shù)據(jù)集上不同算法準確率比較結(jié)果Tab.2 Accuracy comparison results of different algorithms on the original dataset

      表3 原始數(shù)據(jù)集實驗結(jié)果比較Tab.3 Comparison of experimental results on the original dataset

      從表2 中可以看出,隨機森林(RandomForest)和StackingClassifier 算法在訓練集上的準確率都達到了100%,相較于邏輯回歸算法、支持向量機(SVM)、極端梯度提升(XGBOOST)、梯度提升決策樹(GBDT)表現(xiàn)要好很多;但就在測試集上的驗證的準確率而言,隨機森林算法的準確率明顯高于StackingClassifier 算法,模型的精確率低于隨機森林模型,StackingClassifier 算法在數(shù)據(jù)類型不平衡的情況下出現(xiàn)了過擬合問題。

      從表3 中看出,在數(shù)據(jù)集中原始樣本數(shù)(未經(jīng)擴充的數(shù)據(jù)樣本數(shù))不均衡的情況下,StackingClassifier 的召回率和F1 值低于隨機森林算法,出現(xiàn)了嚴重的過擬合現(xiàn)象,在訓練集上達到效果100%的情況下,F(xiàn)1 值只能達到65%。實驗訓練時間128 s,優(yōu)于相同數(shù)據(jù)集下深度模型訓練時間[11]。

      基于上面的實驗結(jié)果,本文通過SMOTE 數(shù)據(jù)擴增算法得到類型趨于平衡的數(shù)據(jù),然后用同樣的算法再進行實驗,實驗結(jié)果的比較見表4、5。

      從表4 中看出,在通過SMOTE 算法進行數(shù)據(jù)擴增以后,隨機森林算法、邏輯回歸算法、SVM 算法、XGBOOST 算法、GBDT 算法分類性能都獲得了巨大的提升,特別是StackingClassifier 算法在測試集上的效果得到了顯著的提升,在測試集可以達到86%的準確率。

      從表5 中可以看出,StackingClassifier 算法在數(shù)據(jù)擴增以后的測試集上的召回率和F1值也得到了顯著的提升,均達到了86%,其他的機器學習算法的表現(xiàn)也都有了顯著的提高,表明對于不均衡的醫(yī)療數(shù)據(jù)而言,通過SMOTE 算法來消除數(shù)據(jù)不均衡的問題有利于精確度的提高。

      表4 擴增數(shù)據(jù)集上不同算法準確率比較結(jié)果Tab.4 Accuracy comparison results of different algorithms on the expanded dataset

      表5 擴增后數(shù)據(jù)集評價指標對比Tab.4 Comparison of evaluation indexes on the expanded dataset

      3 結(jié)語

      為了對監(jiān)測的心電異常分類,本文提出了一種通過StackingClassifier 疊加分類器的算法模型,把多種機器學習算法的優(yōu)勢相結(jié)合,通過疊加分類器的方式集成起來,彌補了單個機器學習算法學習的局限性,提高了心電分類的準確性。通過SMOTE 算法擴充了數(shù)據(jù)集樣本量,改善了數(shù)據(jù)非平衡性。接下來的工作可以結(jié)合深度學習的殘差網(wǎng)絡的算法對模型的精度進行進一步的提升。

      猜你喜歡
      集上心電分類器
      心電向量圖診斷高血壓病左心室異常的臨床應用
      Cookie-Cutter集上的Gibbs測度
      鏈完備偏序集上廣義向量均衡問題解映射的保序性
      基于非接觸式電極的心電監(jiān)測系統(tǒng)
      電子制作(2019年19期)2019-11-23 08:41:40
      穿戴式心電:發(fā)展歷程、核心技術(shù)與未來挑戰(zhàn)
      更正啟事
      BP-GA光照分類器在車道線識別中的應用
      電子測試(2018年1期)2018-04-18 11:52:35
      復扇形指標集上的分布混沌
      加權(quán)空-譜與最近鄰分類器相結(jié)合的高光譜圖像分類
      結(jié)合模糊(C+P)均值聚類和SP-V-支持向量機的TSK分類器
      平罗县| 香港| 城固县| 黔南| 绵阳市| 莲花县| 彰化县| 博野县| 玛多县| 巴马| 石棉县| 富民县| 浦北县| 华安县| 宿松县| 阳山县| 庆安县| 清水河县| 清水县| 屯留县| 简阳市| 武陟县| 灵山县| 同心县| 富锦市| 治多县| 鸡东县| 扶风县| 阳山县| 尚志市| 深州市| 托克托县| 铁力市| 夏邑县| 临泽县| 镇远县| 称多县| 锡林浩特市| 张北县| 永登县| 清苑县|