關(guān)鍵詞: MobileNetV3; Ghost模塊; 量化感知訓(xùn)練; 精準(zhǔn)門控機(jī)制; 隱匿性房室旁路心電圖識(shí)別
0 引言
隱匿性房室旁路(Concealed Accessory Pathway,CAP) 屬于心臟電活動(dòng)的一種結(jié)構(gòu)性異常,在特定的病理?xiàng)l件下,隱匿性房室旁路可能被激活,導(dǎo)致心律失常的發(fā)生,患者可能會(huì)出現(xiàn)心律失常的癥狀,嚴(yán)重時(shí)可能發(fā)展為心力衰竭,甚至導(dǎo)致猝死。因此,設(shè)計(jì)出合適的模型,在心電圖上檢測出CAP癥狀,對(duì)心電圖進(jìn)行識(shí)別成為一種合適的選擇。近年來,研究人員提出了基于心電圖的心血管疾病檢測模型,模型種類包括卷積模型[1-2]、transformer 模型[3]和LSTM 模型[4]。相比之下,卷積模型因其高效的特征提取能力、參數(shù)共享以及平移不變性,在心電圖識(shí)別中展現(xiàn)出更高的適用性。譬如,Tesfai[5]等人基于shufflenet架構(gòu),提出了一種一維架構(gòu)的輕量化卷積神經(jīng)模型,同時(shí)采用Focal損失函數(shù)用以解決數(shù)據(jù)不平衡的問題,實(shí)現(xiàn)對(duì)六類心律失常數(shù)據(jù)的有效分類;Chen等人構(gòu)建了一種基于單導(dǎo)聯(lián)心電圖的多尺度融合輕量化卷積模型,經(jīng)由3個(gè)亞神經(jīng)網(wǎng)絡(luò)提取各種縮放心電圖的特征并使用帶有擠壓激勵(lì)塊的通道注意力模塊自適應(yīng)融合不同的縮放特征。實(shí)驗(yàn)結(jié)果表明,該輕量化卷積模型對(duì)睡眠呼吸暫停的檢測具有有效性。
由于隱匿性房室旁路難以捉摸的特性,以及為了方便模型直接部署到嵌入式設(shè)備中,本文在輕量級(jí)MobileNetV3 模型基礎(chǔ)上,提出了一種融合qOgzV+/IW33ciQs8a6KbTg==Ghost 模塊、量化感知訓(xùn)練以及精準(zhǔn)門控機(jī)制的改進(jìn)Mobile?NetV3模型。最后在所收集的ECG12數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果表明,本文所提出的模型在保持較低計(jì)算復(fù)雜度的同時(shí),達(dá)到了較高的識(shí)別準(zhǔn)確率,可直接部署到嵌入式設(shè)備中,識(shí)別隱匿性房室旁路的心電圖。
1 基本原理
1.1 MobileNetV3模型
MobileNetV3 模型是MobileNetv2 模型的改進(jìn)版本。MobileNetV3模型優(yōu)化了每個(gè)塊,通過使用搜索全局模型技術(shù),找到針對(duì)于硬件平臺(tái)的MobileNetV3 模型;其次,將SE注意力機(jī)制應(yīng)用在MobileNetv3的瓶頸結(jié)構(gòu)中,提取全局信息對(duì)每個(gè)通道的特征進(jìn)行加權(quán),來提升MobileNetV3 的特征提取能力。Mobile?NetV3的瓶頸結(jié)構(gòu)如圖1所示。
其中,BN(Batch Normalization,BN)為數(shù)據(jù)歸一化層,用于加快模型收斂速度,使得模型更加穩(wěn)定,NL 為激活函數(shù),有兩種可供選擇的激活函數(shù),分別是Relu激活函數(shù)和HardSwish激活函數(shù),Dwise為深度可分離卷積,Pool為池化層,F(xiàn)C為線性層,Relu表示Relu 激活函數(shù),hard - σ 為HardSwish激活函數(shù),1×1表示1×1卷積,用于改變輸入特征圖的通道數(shù)。關(guān)于所使用的MobileNetV3的結(jié)構(gòu)框架如表1所示。
其中,輸入表示輸入的尺寸,框架結(jié)構(gòu)表示模型名稱和使用的卷積核大小,Conv表示卷積層,Bneck表示瓶頸結(jié)構(gòu),Pool表示池化層,擴(kuò)展表示瓶頸層結(jié)構(gòu)中使用1×1卷積層之后的通道數(shù),輸出表示輸出通道數(shù),SE表示SE注意力機(jī)制,√代表使用,-表示不使用,NL為激活函數(shù),可以是Relu激活函數(shù)或HardSwish激活函數(shù),它們的縮寫分別為RE和HS。步長表示是否對(duì)特征圖尺寸進(jìn)行處理,為1,輸出尺寸和輸入尺寸一致;為2,輸出尺寸的長寬縮減為輸入尺寸的一半。
1.2 改進(jìn)MobileNetV3模型
為了解決MobileNetV3 在心電圖識(shí)別中計(jì)算量大、性能不足的問題,使用Ghost模塊、QAT和PG機(jī)制,對(duì)MobileNetV3進(jìn)行改進(jìn),得到一種改進(jìn)型Mobile?NetV3 模型。本文分別從Ghost 模塊、QAT(Quantita?tion Aware Training,QAT)、PG(Precision Gate,PG)機(jī)制3方面進(jìn)行闡述。
1.2.1 引入Ghost 模塊
在MobileNetV3模型瓶頸結(jié)構(gòu)的第一個(gè)卷積處引入Ghost模塊,用于增強(qiáng)MobileNetV3模型的淺層特征提取能力。Ghost模塊通過卷積運(yùn)算生成少量內(nèi)在特征圖,然后通過使用簡單的線性變化生成高效特征圖,最后通過拼接內(nèi)在特征圖和高效特征圖獲得Ghost特征圖。Ghost模塊的結(jié)構(gòu)如圖2所示。
其中,Conv表示用于生成內(nèi)在特征圖的卷積運(yùn)算,Φ1,...,Φk 表示線性變換。當(dāng)Ghost模塊與Mobile?NetV3 的瓶頸結(jié)構(gòu)相結(jié)合時(shí),可以得到改進(jìn)Mobile?NetV3模型的瓶頸結(jié)構(gòu),通過保留輸入特征圖,讓模型擁有更強(qiáng)的淺層特征提取能力,結(jié)構(gòu)如圖3所示。
1.2.2 引入QAT
QAT由Jacob等人提出,是量化模型的一種常用手段,常用于模型壓縮。其核心思想是將深度學(xué)習(xí)模型參數(shù)與運(yùn)算精度從浮點(diǎn)型數(shù)據(jù)降低至低精度,如8 位整型。本文模型中,在MobileNetV3的卷積層里,使用QAT用于減少M(fèi)obileNetV3的計(jì)算量。在卷積運(yùn)算中,QAT的訓(xùn)練過程如圖4所示。
圖4中,float32表示32位浮點(diǎn)型數(shù)據(jù),uint8表示8 位整型數(shù)據(jù),uint32表示32位整型數(shù)據(jù)。輸入為8位整型數(shù)據(jù),將權(quán)重從32位浮點(diǎn)型數(shù)據(jù)轉(zhuǎn)化為8位整型數(shù)據(jù),通過8位整型輸入和8位整型權(quán)重之間的卷積運(yùn)算代替32位浮點(diǎn)型輸入和32位浮點(diǎn)型權(quán)重之間的卷積運(yùn)算,從而減少計(jì)算量,可得到的32位整型結(jié)果,并通過與32位整型偏置相加,經(jīng)激活函數(shù),量化轉(zhuǎn)變?yōu)?位整型輸出,所得到的8位整型輸出作為輸入,為下一階段的卷積運(yùn)算或者全連接運(yùn)算做準(zhǔn)備。
實(shí)際部署到嵌入式設(shè)備中時(shí),在QAT下,整個(gè)卷積的運(yùn)算過程如圖5所示。
在本文中,量化這一過程的計(jì)算公式如式(1) 所示。
其中:I 表示32位浮點(diǎn)型權(quán)重或32位整型激活輸出;A 表示量化后權(quán)重或激活輸出所對(duì)應(yīng)的8位整型;S 表示權(quán)重或激活輸出的正負(fù)號(hào);M 表示32位浮點(diǎn)型權(quán)重或32位整型激活輸出中的最大值。
1.2.3 引入PG 機(jī)制
為了讓本文模型的計(jì)算量和參數(shù)量進(jìn)一步減少,同時(shí)提升模型的泛化能力和深層特征提取能力,采用PG機(jī)制對(duì)使用QAT后的卷積進(jìn)行處理。PG機(jī)制可以分成兩個(gè)階段,分別是預(yù)測階段和更新階段。整個(gè)PG機(jī)制的結(jié)構(gòu)如圖6所示。
從圖6可以看出,8位整型輸入I 被分成高4位整型輸入Ihb 和低4位整型輸入Ilb。在預(yù)測階段,高4位整型輸入Ihb 左移4位后與8位整型權(quán)重進(jìn)行卷積運(yùn)算,得到結(jié)果Ohb。Ohb 經(jīng)過門控機(jī)制,得到二進(jìn)制決策掩碼mask,用于在更新階段,決定Ilb 中哪些位置參與卷積運(yùn)算。Ilb 經(jīng)過更新階段,得到Olb。將Ohb 與Olb 相加,最終得到卷積的輸出結(jié)果O。
2 實(shí)驗(yàn)結(jié)果與分析
2.1 ECG12心電圖數(shù)據(jù)集
本文的ECG12心電數(shù)據(jù)集來自無錫某醫(yī)院心電科,共有6 510張,類型為正常心電圖和隱匿性房室旁路心電圖,其中,訓(xùn)練集3 900張、驗(yàn)證集1 310張、測試集1 010張,隱匿性房室旁路和正常心電圖分別占總心電圖數(shù)目的30%和70%。數(shù)據(jù)集圖像樣本如圖7 所示。
2.2 實(shí)驗(yàn)設(shè)置
驗(yàn)證本文模型的實(shí)驗(yàn)平臺(tái)硬件為Intel I7 12600H 處理器、16G內(nèi)存、RTX3070顯卡,使用Python編程語言來實(shí)現(xiàn),版本為3.7,使用深度學(xué)習(xí)框架Py?torch1.11.0、Pycharm開發(fā)工具來實(shí)現(xiàn)。整個(gè)訓(xùn)練過程迭代70個(gè)epoch,為了保證模型的穩(wěn)定,在前10個(gè)ep?och 采用warmup 預(yù)熱學(xué)習(xí)策略,初始學(xué)習(xí)率設(shè)置為0.001,后續(xù)采用cosine用于控制學(xué)習(xí)率衰減,超參數(shù)衰減率為0.1,最低學(xué)習(xí)率為0.00001。計(jì)算量用于定量評(píng)估不同模型的大小。對(duì)于隱匿性房室旁路識(shí)別性能的評(píng)估,引入靈敏度(Sensitivity,Sen) ,精準(zhǔn)率(Precision,Pre) ,Macro-F1分?jǐn)?shù),它們被廣泛應(yīng)用在分類領(lǐng)域的性能評(píng)估,如式(2)-式(5)所示。
其中: TP、FP、FN 分別代表被模型預(yù)測為正類的正樣本、被模型預(yù)測為正類的負(fù)樣本和被模型預(yù)測為負(fù)類的正樣本;F1 - score1 和F1 - score2 分別代表隱匿性房室旁路為正樣本,正常心電圖為正樣本的F1 分?jǐn)?shù)。
2.3 實(shí)驗(yàn)分析
為了驗(yàn)證改進(jìn)MobileNetV3模型中的Ghost模塊、QAT和PG機(jī)制在隱匿性房室旁路識(shí)別中的有效性,進(jìn)行消融實(shí)驗(yàn)。消融實(shí)驗(yàn)結(jié)果如表2所示(最優(yōu)的結(jié)果加粗)。
ECG12數(shù)據(jù)集上的消融實(shí)驗(yàn)表明,相較Mobile?NetV3 模型,加入Ghost 模塊后,除了精準(zhǔn)率外,Mo?bileNetV3模型對(duì)于12導(dǎo)聯(lián)心電圖的各項(xiàng)性能有所增強(qiáng)。這表明,Ghost模塊可以增強(qiáng)MobileNetV3模塊的淺層特征表示能力并同時(shí)壓縮模型的計(jì)算量;加入QAT后,MobileNetV3模型的各項(xiàng)性能變差。這說明QAT所帶來的誤差導(dǎo)致MobileNetV3模型的各項(xiàng)性能變差;在加入QAT,再次加入PG機(jī)制,MobileNetV3模型的各項(xiàng)性能得到了一定的增強(qiáng),這表明PG機(jī)制可以增強(qiáng)MobileNetV3模型的泛化能力和深層特征提取能力,彌補(bǔ)QAT所帶來對(duì)于MobileNetV3模型在預(yù)測CAP上的誤差。融合Ghost模塊、QAT和PG機(jī)制后,MobileNetV3模型對(duì)于CAP病癥的預(yù)測達(dá)到了最佳。圖8為消融試驗(yàn)下各模型在測試集的性能曲線,包括靈敏度曲線,精準(zhǔn)率曲線和Macro-F1分?jǐn)?shù)曲線。
從圖8可以看出,在ECG12數(shù)據(jù)集上,改進(jìn)Mo?bileNetV3模型在靈敏度和Macro-F1分?jǐn)?shù)上強(qiáng)于其他消融下實(shí)驗(yàn)?zāi)P?,在精?zhǔn)率上也處于優(yōu)秀的程度。這證實(shí)了加入各模塊對(duì)于提升CAP病癥識(shí)別的有效性。使用Grad-Cam 對(duì)消融實(shí)驗(yàn)下各模型進(jìn)行可視化分析,隨機(jī)選取一張圖片,得到相關(guān)模型的熱力圖,熱力圖實(shí)驗(yàn)結(jié)果如圖9所示。
從消融實(shí)驗(yàn)的熱力圖可以看出,改進(jìn)Mobile?NetV3 模型的不僅強(qiáng)調(diào)了一些深層特征,還增強(qiáng)了對(duì)于一些淺特征的提取,所提取的特征范圍更廣,提取的區(qū)域更為合理,對(duì)于CAP 病癥的預(yù)測效果更佳。
3 結(jié)束語
針對(duì)隱匿性房室旁路心電圖識(shí)別問題,本文提出了一種基于MobileNetV3的改進(jìn)心電圖識(shí)別模型。該模型在MobilenNetV3的基礎(chǔ)上,通過引入Ghost模塊,提升MobileNetV3 的淺層特征提取能力;通過使用QAT和PG機(jī)制,在壓縮模型計(jì)算量的同時(shí),提升了模型的泛化能力和深層特征提取能力。在ECG心電圖數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn),結(jié)果表明,改進(jìn)MobileNetV3心電圖識(shí)別模型在壓縮原模型計(jì)算量的同時(shí),提升了原模型的性能,這表明MobileNet心電圖識(shí)別模型可直接部署到嵌入式設(shè)備中,用于實(shí)現(xiàn)對(duì)隱匿性房室旁路心電圖的識(shí)別。