王 銳,李 燦,李紅巖,郎許峰,周作建,黃 敏,程 俊
(南京中醫(yī)藥大學(xué)人工智能與信息技術(shù)學(xué)院,江蘇南京 210023)
房顫是最常見的心律失常類型。隨著年齡的增長,房顫發(fā)生率會不斷增加[1],其在有危重疾病風(fēng)險的慢性病老年患者中非常普遍[2]。在世界范圍內(nèi),房顫的發(fā)生率約為0.4%~2%[3-4],其與冠心病、高血壓和心力衰竭等疾病有密切關(guān)系。根據(jù)房顫發(fā)作的持續(xù)時間,可將其分為陣發(fā)性房顫、持續(xù)性房顫和永久性房顫3 種類型[5]。一些陣發(fā)性房顫在日常生活中很難被發(fā)覺,患者無臨床癥狀或出現(xiàn)臨床癥狀后很快便會消失,因此普通心電圖檢查無明顯異常。對于頻繁發(fā)作的陣發(fā)性房顫可通過24h 動態(tài)心電圖監(jiān)測,但監(jiān)測設(shè)備佩戴繁瑣,患者依從性較差。因此,研究快速便捷的房顫檢測手段具有重要臨床價值。
傳統(tǒng)房顫檢測算法大多基于房顫發(fā)生時的信號特征提取實現(xiàn)[6],但復(fù)雜的人工特征定義和繁瑣的特征提取過程等限制了其推廣和應(yīng)用。深度學(xué)習(xí)技術(shù)以原始數(shù)據(jù)作為輸入,并自動提取對檢測敏感的特征,具有更好的抗干擾能力,可提高房顫檢測算法的泛化能力[7]。目前基于深度學(xué)習(xí)的房顫檢測算法主要通過端到端的深度神經(jīng)網(wǎng)絡(luò)實現(xiàn),通過學(xué)習(xí)大量數(shù)據(jù)特征,可適用于更多場景。目前,國內(nèi)外學(xué)者對基于深度學(xué)習(xí)的房顫檢測算法進(jìn)行了大量研究,如Chen 等[8]采用決策級融合方法融合遞歸復(fù)雜網(wǎng)絡(luò)和卷積神經(jīng)網(wǎng)絡(luò)建立房顫檢測算法,獲得了98.92%的檢測準(zhǔn)確率;Chen 等[9]利用小波變換和滑動窗口濾波減少心電信號中的噪聲,然后使用前饋神經(jīng)網(wǎng)絡(luò)檢測房顫;Sanjana 等[10]基于深度殘差跳躍卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行房顫的自動檢測,準(zhǔn)確率可達(dá)99%;Petmezas 等[11]提出一種利用焦點損失處理不平衡訓(xùn)練數(shù)據(jù)的新型混合神經(jīng)模型,通過將卷積神經(jīng)網(wǎng)絡(luò)提取的心電圖特征輸入到長短期記憶模型中進(jìn)行時間動態(tài)記憶,從而更準(zhǔn)確地分析房顫心電圖類型。然而,深度學(xué)習(xí)技術(shù)仍存在一些局限性,如模型梯度易消失、對網(wǎng)絡(luò)的要求較高、數(shù)據(jù)庫比較單一等[12]。
早期識別房顫可降低卒中等并發(fā)癥的發(fā)生率,明顯改善患者預(yù)后,提高其生活質(zhì)量[13]。因此,本文運(yùn)用CiteSpace 軟件對中國知網(wǎng)中收錄的關(guān)于房顫檢測算法的文獻(xiàn)進(jìn)行系統(tǒng)分析,總結(jié)該領(lǐng)域的研究熱點和發(fā)展趨勢,為相關(guān)研究者提供參考和指引。
選擇中國知網(wǎng)數(shù)據(jù)庫,以房顫檢測、算法為主題詞進(jìn)行檢索,年限設(shè)定為2001-2022 年3 月16 日,結(jié)果共檢索到174 篇相關(guān)文獻(xiàn)。剔除無關(guān)算法以及僅含醫(yī)學(xué)知識、無作者等文獻(xiàn),篩選到符合條件的文獻(xiàn)共158篇。
將檢索結(jié)果以Refwork 格式導(dǎo)出,并保存為txt 格式。使用CiteSpace 軟件分析文獻(xiàn)中的摘要、關(guān)鍵詞、作者、所屬單位等信息,基于作者(Author)、機(jī)構(gòu)(Institution)、關(guān)鍵詞(Keywords)3 個模塊進(jìn)行分析,并繪制相應(yīng)的知識圖譜和表格。
由圖1 可以看出,2001-2007 年期間,關(guān)于房顫檢測算法的文獻(xiàn)年發(fā)文量不超過3 篇;而2008-2017 年,年發(fā)文量有所上升,但不超過10 篇;2018-2021 年,年發(fā)文量大幅上升,均超過20 篇,在2020 年甚至超過了25 篇;2022 年由于統(tǒng)計時長限制,發(fā)文量不具備參考價值。
Fig.1 Distribution of annual published literature number圖1 年度發(fā)表文獻(xiàn)數(shù)量分布
發(fā)文量排名前10位的作者及其單位信息見表1。
Table 1 Top 10 authors and their organizations表1 發(fā)文量前10位的作者及其單位信息
以“author”為節(jié)點,設(shè)置單個時間區(qū)間長度為1,展示發(fā)文量不少于2 篇的作者分布情況,結(jié)果見圖2,共出現(xiàn)202 個節(jié)點,83 條線,網(wǎng)絡(luò)密度為0.004 1。作者之間的連接可以反映出該領(lǐng)域中某個學(xué)者或團(tuán)隊作出的貢獻(xiàn)以及各個作者之間的合作強(qiáng)度。可以發(fā)現(xiàn),作者之間的合作較為松散,最大的合作團(tuán)隊由劉明、韓小岑、孟憲輝等人組成,其次劉廣雄團(tuán)隊和以孫亞楠、張瑞、韋杰英、王迪為主的團(tuán)隊也具有一定規(guī)模,其余為規(guī)模較小的團(tuán)隊和無合作的個人。這些團(tuán)隊均相對獨(dú)立,團(tuán)隊間未能展現(xiàn)合作關(guān)系。
Fig.2 Author distribution visualization map圖2 作者分布可視化圖譜
以“institution”為節(jié)點,單一時間間隔設(shè)為1年,發(fā)文機(jī)構(gòu)分布如圖3 所示,共出現(xiàn)70 個節(jié)點,10 條邊,網(wǎng)絡(luò)整體密度為0.004 1。在數(shù)據(jù)處理時,將河北大學(xué)電子信息工程學(xué)院和河北省數(shù)字醫(yī)療工程重點實驗室統(tǒng)一為河北大學(xué);西北大學(xué)醫(yī)學(xué)大數(shù)據(jù)研究中心統(tǒng)一為西北大學(xué);復(fù)旦大學(xué)數(shù)字醫(yī)學(xué)研究中心上海市醫(yī)學(xué)圖像處理與計算機(jī)輔助手術(shù)重點實驗室和復(fù)旦大學(xué)電子工程系統(tǒng)一為復(fù)旦大學(xué);河南科技大學(xué)機(jī)電工程學(xué)院和河南科技大學(xué)醫(yī)學(xué)技術(shù)與工程學(xué)院統(tǒng)一為河南科技大學(xué);東南大學(xué)儀器科學(xué)與工程學(xué)院生物電子學(xué)國家重點實驗室中心統(tǒng)一為東南大學(xué);中國礦業(yè)大學(xué)人工智能研究院智慧醫(yī)療研究中心與中國礦業(yè)大學(xué)信息與控制工程學(xué)院統(tǒng)一為中國礦業(yè)大學(xué);桂林電子科技大學(xué)電子工程與自動化學(xué)院和桂林電子科技大學(xué)生命與環(huán)境科學(xué)學(xué)院統(tǒng)一為桂林電子科技大學(xué);電子科技大學(xué)生命科學(xué)與技術(shù)學(xué)院和電子科技大學(xué)電子工程學(xué)院統(tǒng)一為電子科技大學(xué);浙江中醫(yī)藥大學(xué)信息技術(shù)學(xué)院與浙江中醫(yī)藥大學(xué)基礎(chǔ)醫(yī)學(xué)院統(tǒng)一為浙江中醫(yī)藥大學(xué);浙江大學(xué)生命科學(xué)學(xué)院和浙江大學(xué)生物醫(yī)學(xué)工程與儀器學(xué)院統(tǒng)一為浙江大學(xué)。經(jīng)統(tǒng)計,發(fā)文量排前3 位的單位依次為電子科技大學(xué)(21 篇)、河北大學(xué)(16 篇)和復(fù)旦大學(xué)(10 篇)。電子科技大學(xué)與四川省人民醫(yī)院合作發(fā)表了多篇文獻(xiàn);河北大學(xué)較為獨(dú)立;復(fù)旦大學(xué)與上海理工大學(xué)醫(yī)療器械與食品學(xué)院、上海微創(chuàng)電生理醫(yī)療科技股份有限公司開展了合作研究??傮w而言,研究機(jī)構(gòu)以高校為主,機(jī)構(gòu)間的合作較為松散,多為獨(dú)立發(fā)表。
Fig.3 Distribution of issuing agencies圖3 發(fā)文機(jī)構(gòu)分布
以“keywords”為節(jié)點,單一時間間隔設(shè)為1 年,閾值設(shè)置為TOP=50,得到關(guān)鍵詞共現(xiàn)分析結(jié)果如圖4 所示。圖中展示了頻次不少于2 的關(guān)鍵詞,節(jié)點為344 個,連線為423個,密度為0.007 2??梢钥闯鲈~頻較大的房顫、心電圖、心電信號、房顫檢測等與卷積神經(jīng)網(wǎng)絡(luò)、深度學(xué)習(xí)、機(jī)器學(xué)習(xí)、支持向量機(jī)等密切相關(guān)。
Fig.4 Keyword co-occurrence analysis圖4 關(guān)鍵詞共現(xiàn)分析
出現(xiàn)頻次較高的關(guān)鍵詞如表2 所示。排名首位的為房顫,其頻次遠(yuǎn)高于其他關(guān)鍵詞,其余依次為心電圖、心電信號、卷積神經(jīng)網(wǎng)絡(luò)、心率失常等。
Table 2 Keyword frequency表2 關(guān)鍵詞頻次
網(wǎng)絡(luò)模塊化值(值越大表示聚類效果越好)以及剪影值(剪影值越接近1 說明同質(zhì)性越高)是評估網(wǎng)絡(luò)整體結(jié)構(gòu)的重要指標(biāo)。聚類模塊值=0.724 4(>0.3),說明聚類有效;聚類平均輪廓值=0.880 3(>0.7),說明該聚類成員間同質(zhì)性非常高[13]。本文聚類采用tf*idf 聚類方法,共提取到31 個類,排名前16 位的分別為:超限學(xué)習(xí)機(jī)(#0)、r 波定位(#1)、希式束(#2)、模式識別(#3)、qrs 波檢測(#4)、心室纖顫(#5)、p 波(#6)、盲源提取(#7)、檢測(#8)、獨(dú)立成分分析(#9)、機(jī)器學(xué)習(xí)(#10)、預(yù)處理(#11)、混沌(#12)、信息熵(#13)、波動圖(#14)、統(tǒng)計性能(#15),結(jié)果見圖5。每種聚類包含4~5 個關(guān)鍵詞,表3 展示了聚類的規(guī)模、輪廓值以及所包含的關(guān)鍵詞。
Fig.5 Co-occurrence clustering map of keywords圖5 關(guān)鍵詞共現(xiàn)聚類圖譜
我國關(guān)于房顫檢測算法的文獻(xiàn)量總體呈上升趨勢,但關(guān)注度仍有待提高,發(fā)文總量仍處于較低水平。目前發(fā)文量最多的為河北大學(xué)的劉明團(tuán)隊,其研究方向為基于黎曼流形稀疏編碼的陣發(fā)性房顫檢測算法[14],該算法采用協(xié)方差矩陣計算RR 間期的變化,使數(shù)據(jù)處于黎曼流形空間中,計算心率變異信號,在可穿戴智能檢測設(shè)備中具有廣闊的應(yīng)用前景;其次是上海理工大學(xué)醫(yī)療器械與食品安全學(xué)院的陸宏偉團(tuán)隊,其利用時域、頻域和非線性分析技術(shù)識別基于體表的心電圖,提取RR 間期的房顫特征[15];然后是西北大學(xué)醫(yī)療大數(shù)據(jù)研究中心的孫亞楠團(tuán)隊,其采用心電信號去噪、心電信號的R 峰檢測和心電特征提取技術(shù)檢測陣發(fā)性房顫[16];接著是復(fù)旦大學(xué)的楊翠微團(tuán)隊,其采用功率譜分析、近似熵和樣本熵分析、遞歸分析以及時間序列符號化4 種方法進(jìn)行陣發(fā)性房顫檢測[17];最后是電子科技大學(xué)的劉廣雄團(tuán)隊,其采用主成分分析法提取房顫信號中的特征,然后使用分類器進(jìn)行分類[18]。目前對房顫檢測算法的研究主要集中在科研院所的重點實驗室,可能是受地域限制,機(jī)構(gòu)間的合作較為分散。
從關(guān)鍵詞頻次中可以看出,使用卷積神經(jīng)網(wǎng)絡(luò)等深度學(xué)習(xí)方法進(jìn)行房顫檢測的研究較多,相應(yīng)的心電信號處理方法包括小波變換、R 波檢測、獨(dú)立成分分析、QRS 波檢測、盲源提取等。關(guān)于房顫檢測算法的聚類標(biāo)簽包括超限學(xué)習(xí)機(jī)、R 波定位、希氏束、模式識別、QRS 波檢測、心室纖顫、盲源提取、檢測、經(jīng)驗?zāi)J椒纸?、機(jī)器學(xué)習(xí)、預(yù)處理、混沌、波動圖、性能統(tǒng)計。心電信號的預(yù)處理方法較多,如可利用灰度直方圖進(jìn)行房顫檢測,其中一個重要步驟就是心電信號分解[19];改進(jìn)切片頻率的小波變換處理低頻信號具有較好效果[20],但對高頻信號的處理差強(qiáng)人意;離散小波分解可對頻率信號進(jìn)行分層處理,因而對多種信號有較好的處理效果[21];利用統(tǒng)計模型與信息熵相結(jié)合的方式可分析RR 間期波形的分布規(guī)律,以提供多維時間序列的關(guān)聯(lián)信息,但該方法更適合長時序列,應(yīng)用于短時序列有一定的局限性[22]。心電信號特征提取常用方法包括黎曼流形、支持向量機(jī)、深度學(xué)習(xí)等。黎曼流形可定位異常波形的位置以完成特征提取,在數(shù)據(jù)量有限的情況下表現(xiàn)依舊較好,然而該方法具有一定的挑戰(zhàn)性[23];支持向量機(jī)可實現(xiàn)基于多個特征的自動診斷,但該方法依賴于QRS 波的檢測[21];深度學(xué)習(xí)法可直接提取特征,且具有一定的泛化能力[24],但當(dāng)數(shù)據(jù)量和種類有限時,其分類效果不如支持向量機(jī)。因此,需要依據(jù)實際情況選擇合適的心電信號特征提取方法。
房顫的智能化檢測對于預(yù)防嚴(yán)重心血管疾病的發(fā)生具有重要意義。本文通過對房顫檢測算法的相關(guān)文獻(xiàn)進(jìn)行分析發(fā)現(xiàn),近年來基于深度學(xué)習(xí)技術(shù)的房顫檢測研究熱度不斷上升,提取房顫信號特征的方法逐漸增多,分類模型也逐漸得到優(yōu)化,準(zhǔn)確度和精度不斷提高。然而,不同研究機(jī)構(gòu)之間的合作與交流有限,今后需加強(qiáng)交流與合作,互相取長補(bǔ)短,探索出準(zhǔn)確率更高的房顫檢測算法。例如可通過R 波、QRS 波、P 波、心室率等指標(biāo)檢測出房顫的具體類型,然后利用模式識別、盲源提取、獨(dú)立成分分析、信息熵等方法分析和提取心電信號,采用機(jī)器學(xué)習(xí)模型進(jìn)行分類,采用深度學(xué)習(xí)模型簡化特征提取步驟,以獲得更好的泛化能力。此外,本研究還存在一定局限性,如僅選取了中國知網(wǎng)數(shù)據(jù)庫作為研究對象,沒有納入外文數(shù)據(jù)庫,缺少國內(nèi)外研究的橫縱對比等,今后將擴(kuò)大研究范圍,以獲取最前沿的研究趨勢。
Table 3 Size,silhouette coefficient and keywords included in the cluster表3 聚類規(guī)模、輪廓值以及包含的關(guān)鍵詞