石 屹,金登男
(華東理工大學(xué) 信息科學(xué)與工程學(xué)院,上海 200237)
心電圖(ECG)是檢驗心血管疾病的一種很有效的方法,伴隨著計算機技術(shù)的發(fā)展,計算機輔助心電信號檢測已經(jīng)逐漸融入到了醫(yī)生的日常診斷過程中。ECG模式分類主要的兩個部分是特征提取和分類,大多數(shù)的ECG 特征提取可以通過傅里葉變換[1]等方法獲得較準(zhǔn)確的頻域信息[2-3]和時域信息[4],但是這種方法對于心電波形的形態(tài)特征提取的效果較差,提取的特征向量不能準(zhǔn)確的反應(yīng)出波形的形態(tài)特征,并且容易受到噪聲的干擾。基于Hermite函數(shù)的ECG 特征提取方法[5]雖然可以在高階的Hermite函數(shù)下達(dá)到較好的效果,但是由于函數(shù)的階數(shù)較高和時間較長等因素還需要進(jìn)一步改善。KPL 特征提?。?]、小波分析[7]和基于向量機分類[8]方法雖然各有特點,但從準(zhǔn)確性和抗干擾性上都存在不足[9]。不確定性推理模型[10]等基于知識模型的應(yīng)用為獲取診斷過程中隱含和潛在的知識提供了有效途徑。但是,領(lǐng)域知識完整性和不確定性問題仍然是此類方法研究中的難點。本文提出了一種新的心電信號波形形態(tài)的特征提取方法,目標(biāo)是準(zhǔn)確的提取心電波形的形態(tài)特征,并且減小噪聲帶來的干擾。結(jié)合之前做過的心電信號形態(tài)特征[11]以及神經(jīng)網(wǎng)絡(luò)分類[12]的研究,論文針對心電信號分段結(jié)合貝塞爾曲線來提取心電信號的特征,大大提高了心電信號特征提取的準(zhǔn)確度和效率,并且使用自組織神經(jīng)網(wǎng)絡(luò)針對提取的特征進(jìn)行分類,把形態(tài)相似的波形聚合到一起,達(dá)到了較好的效果。
ECG 是使用心電采集儀器(如心電監(jiān)護(hù)儀)記錄人體心臟電位變化,并據(jù)此應(yīng)用于臨床心臟疾病監(jiān)護(hù)、診斷的可見圖形記錄,主要分為P 波、QRS 波、ST 波和U 波(見圖1)。P波位于一次心動周期的開始,表示心房除極過程。QRS波群是主要結(jié)構(gòu),反映心室除極全過程。T 波反映了心室快速復(fù)極。PR 段、PR 間期、ST 段、QT 間期等則反映了心臟各項功能交替的時間。
圖1 心電信號波形
ECG 屬于典型的視覺信息,醫(yī)學(xué)專家對其判讀的過程中融入了大量經(jīng)驗知識。醫(yī)生們主要依據(jù)是ECG 波形的形態(tài),主要是P波段、QRS波段和ST 段來進(jìn)行診斷的。
心電信號數(shù)據(jù)庫:MIT-BIH 心率失常數(shù)據(jù)庫包含有48組30分鐘的心電圖記錄。每條記錄包含兩個導(dǎo)聯(lián)的數(shù)據(jù),采樣頻率為360Hz。MIT-BIH 數(shù)據(jù)庫包含10 萬條以上心拍,且每個心拍都經(jīng)過兩位及以上專家獨立標(biāo)注,MITBIH 數(shù)據(jù)庫包括了基本上全部類型的心電信號波形,并且噪聲相對較少,可以使用濾波算法對噪聲較大的波形先進(jìn)行預(yù)處理,過濾出高頻的噪聲信號,對波形的整體形態(tài)不會有很大的影響。
本文的實驗將主要針對MIT-BIH 數(shù)據(jù)庫進(jìn)行。
基于貝賽爾曲線的分段特征提取分為三個部分,一個是波形的分段,然后對分段的波形進(jìn)行貝塞爾特征提取,最后把分段信息和貝塞爾特征提取的信息結(jié)合起來作為ECG的波形特征。對波形分段的是為了降低波形的復(fù)雜程度,這樣在做貝塞爾特征提取的時候可以達(dá)到更高的精確度并且獲得更快的速度。
ECG分段分為兩個步驟:首先,根據(jù)醫(yī)學(xué)上的概念進(jìn)行ECG 波段的分割;然后基于波段分離基礎(chǔ)上的貝塞爾曲線分段,這樣可以獲得更快的特征提取速度以及精確程度。
按照醫(yī)學(xué)上的波形分段把波形分成P 波、QRS波以及T 波。分段可以使用麻省理工學(xué)院提供的ECGPuwave工具[13]。P波和T 波作為一次心跳的起始波和恢復(fù)波,其標(biāo)準(zhǔn)形態(tài)比較簡單,而QRS波則相對復(fù)雜,下面主要就QRS波的分段及特征提取來介紹基于貝塞爾曲線的特征提取。
QRS波段的基本形態(tài)如圖3的實線部分。可以直接使用原始的QRS波段進(jìn)行貝塞爾特征提取,但是因為QRS波段的頻率較高,很大程度上的影響到了波形特征提取的效果。針對這樣的情況,對QRS波段再進(jìn)行分段來提高貝塞爾特征提取的效率和精確程度。
假設(shè)圖2的實線波形為QRS的標(biāo)準(zhǔn)波形,對現(xiàn)有的波形進(jìn)行濾波和歸一化處理后都可以近似達(dá)到這樣波形形態(tài)。對波形進(jìn)行變化率分析(圖2虛線)后可以得出波形高頻分量的集中位置,結(jié)合原始波形數(shù)據(jù),根據(jù)差值原則取R點周圍導(dǎo)數(shù)為零的點為分割點,把波形分成4段(見圖3)。然后根據(jù)貝塞爾特征提取的原理,分別對4段波形進(jìn)行特征提取。
2.2.1 貝塞爾曲線
貝塞爾曲線是圖形學(xué)和數(shù)值分析中常用的參數(shù)曲線,它根據(jù)曲線的首末點和中間的控制點來構(gòu)成曲線。其中起重要作用的是位于曲線中央的控制線。這條線是虛擬的,中間與貝塞爾曲線交叉,兩端是控制端點。移動兩端的端點時貝塞爾曲線的曲率(彎曲的程度)也會發(fā)生對應(yīng)的變化,移動中間點時,貝塞爾曲線在起始點和終止點鎖定的情況下做均勻移動。
任意一條m 階的貝塞爾曲線可以用如下的方程描述
式中:q(ti)——ti點對應(yīng)的插值,m——貝塞爾曲線的階數(shù),Pk——第k個控制點。如果要在首末點插入n個插值點,那么參數(shù)ti就需要均勻的分成n-1段間隔,并且每段間隔的ti值都要在0到1之間。因此,三階貝塞爾曲線的方程如下
傳遞首尾點的值(P0和P3),擬合后得到曲線中間的控制點(P1和P2),由此來確定曲線的形態(tài)。因為分段后的心電信號特征去除了頻率變化率較大的波形的干擾,針對每段的曲線,可以使用貝塞爾曲線對每一段進(jìn)行擬合,從而提取曲線的控制點并整合作為波形的特征。
2.2.2 最小二乘法貝塞爾擬合
對于貝塞爾擬合的輸入數(shù)據(jù),可以把輸入的第一點和最后一點作為擬合的第一個和最后一個控制點,也可以通過定義初始的分割點可以把輸入分割成段來處理。擬合的目標(biāo)是使用最小二乘法確定三階貝塞爾曲線的中間控制點P1和P2。使用最小二乘法可以求出使擬合曲線和原始曲線誤差最小的控制點的位置。對于曲線上的n個點,pi和q(ti)分別是原始數(shù)據(jù)和擬合數(shù)據(jù),最小二乘法可以表示如下
帶入三階貝塞爾曲線方程,可得
其中P1和P2滿足
設(shè)參數(shù)
則可求出貝塞爾曲線的控制點
求出貝塞爾曲線的控制點后,可以使用控制點來擬合原始的心電信號波形。
假設(shè)心電信號的原始波形為O={p1,p2,…pn}我們使用三階貝塞爾曲線進(jìn)行擬合。輸入為心電信號的分割點和最大允許的誤差,心電信號根據(jù)分割點來確定分段的個數(shù),對每一段都使用三階貝塞爾曲線進(jìn)行擬合,生成擬合的曲線數(shù)據(jù)Q={q1,q2,…qn},然后使用最小二乘法測量原始數(shù)據(jù)和擬合數(shù)據(jù)的誤差,迭代進(jìn)行直到誤差達(dá)到標(biāo)準(zhǔn)范圍內(nèi)。
擬合的過程中使用分割擬合的策略。當(dāng)三階貝塞爾擬合不能達(dá)到標(biāo)準(zhǔn)誤差范圍內(nèi),則自動對原始的數(shù)據(jù)進(jìn)行分割,自動增加分割點,再對分割后的數(shù)據(jù)進(jìn)行擬合,直到擬合的數(shù)據(jù)達(dá)到標(biāo)準(zhǔn)誤差范圍內(nèi)。
自組織神經(jīng)網(wǎng)絡(luò)(self-organization mapping net)是基于競爭式學(xué)習(xí)的一種網(wǎng)絡(luò),它是一種無指導(dǎo)的聚類方法。它的基本特點是在樣本群中競爭尋找相似的特征、規(guī)則或是聯(lián)系,然后再將這些有共同特色的樣本聚集成同類。假設(shè)輸出神經(jīng)元之間互相競爭,在競爭的神經(jīng)元中,只有一個最終會被激發(fā),而其他的神經(jīng)元將會被抑制,然后在下一輪競爭中,之前被激發(fā)的神經(jīng)元才會進(jìn)行調(diào)整(學(xué)習(xí)),被抑制的神經(jīng)元保持不變,最終產(chǎn)生穩(wěn)定的分類網(wǎng)絡(luò)。自組織神經(jīng)網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)如圖4所示。
圖4 自組織神經(jīng)網(wǎng)絡(luò)基本結(jié)構(gòu)
輸入層神經(jīng)元和輸出層的神經(jīng)元相互連接。輸入神經(jīng)元的個數(shù)由輸入個數(shù)決定,輸出層的神經(jīng)元要根據(jù)實際情況來指定。一般來說,輸出層的神經(jīng)元個數(shù)遠(yuǎn)多于輸入層的神經(jīng)元個數(shù)。
自組織神經(jīng)網(wǎng)絡(luò)聚類的方法是為輸入神經(jīng)元和輸出神經(jīng)元找到最佳的匹配,最佳匹配的輸出神經(jīng)元和樣本特征之間距離最小。即若第n個樣本的獲勝單元為i,則有
式中:Xn——第n個輸入樣本向量,Wj——第j個輸出神經(jīng)元的相連的權(quán)向量。
SOM 網(wǎng)絡(luò)的學(xué)習(xí)算法過程如下:
(1)網(wǎng)絡(luò)初始化。對輸出層每個節(jié)點權(quán)重Wj賦初值,定義結(jié)束條件。
(2)將訓(xùn)練數(shù)據(jù)樣本的特征值逐一輸入自組織神經(jīng)網(wǎng)絡(luò),對每一個樣本執(zhí)行步驟3~6。
(3)計算輸出層和輸入層之間的神經(jīng)網(wǎng)絡(luò)節(jié)點距離。
(4)修改神經(jīng)網(wǎng)絡(luò)節(jié)點的權(quán)值。
(5)調(diào)整網(wǎng)絡(luò)結(jié)構(gòu),降低鄰域大小。
(6)迭代結(jié)束,檢查推出條件(達(dá)到最大迭代次數(shù)),否則重復(fù)步驟2。
心電信號實驗數(shù)據(jù)取自MIT-BIH 心律失常標(biāo)準(zhǔn)數(shù)據(jù)庫,數(shù)據(jù)庫中共有48組病人的心電信號,包含了幾乎所有種類的心電信號數(shù)據(jù)。這些心電信號的記錄中通常會摻雜一些噪聲,對數(shù)據(jù)處理帶來了困難。本實驗的心電信號對象是以R 峰為標(biāo)志的前后200個采樣點,共112605 段波形,這些采樣點波形已經(jīng)包含了心電信號的所有形態(tài)特征。
首先使用小波分析對波形進(jìn)行濾波處理,過濾掉心電信號的高頻噪聲。然后使用MIT 提供的ECGPuwave方法選取出每段波形QRS波。
針對QRS波段的R點,分別計算R點周圍距離最近的極值點。在計算極值點的過程中有可能受到噪聲信號的影響,比如對于圖5中灰色的波形的T 波處,突然的高頻噪聲對波形的形態(tài)產(chǎn)生了影響,因此在判斷極值點的過程中要結(jié)合平滑函數(shù)來計算極值點。本實驗在計算極值點的過程中采用5點平均法平滑R點周圍的數(shù)據(jù),當(dāng)確定了距離R點最近的極值點后恢復(fù)成原始波形。此方法保證了心電信號分段的準(zhǔn)確性,在之后的三階貝塞爾擬合的過程中使用原始的波形又可以確保波形形態(tài)特征的準(zhǔn)確性。
圖5 5點平均處理的心電信號
完成心電信號的分段之后使用三階貝塞爾函數(shù)分別對每段波形進(jìn)行特征提取。貝塞爾擬合的輸入為分段波形信號。因為之前的分段已經(jīng)保證了每段的心電信號的形態(tài)相對單一,因此貝塞爾擬合函數(shù)不需要額外的增加分割點。
使用三階貝塞爾函數(shù)進(jìn)行特征提取的結(jié)果如圖6所示,可以看出根據(jù)特征點還原的波形和原始波形基本相同,折線為波形控制點連線。使用三階貝塞爾曲線擬合之后,原始波形的誤差被有效的抑制,而且控制點很好的表述了波形的形態(tài)信息。因此三階貝塞爾擬合的特征提取達(dá)到了很好的效果。
圖6 三階貝塞爾擬合
采用三階貝塞爾函數(shù)對5000個心電信號波形采樣進(jìn)行分段擬合,最終得到擬合的均方誤差如圖7所示,可以看出三階貝塞爾函數(shù)對心電信號分段擬合達(dá)到了很好的效果。
圖7 貝塞爾擬合均方誤差
提取三階貝塞爾擬合的控制點的24個特征,使用自組織神經(jīng)網(wǎng)絡(luò)進(jìn)行分類。把24個特征作為神經(jīng)網(wǎng)絡(luò)輸入,映射到6*6的二維輸出上。使用Hextop作為自組織神經(jīng)網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu),設(shè)置初始的鄰域足夠大,使神經(jīng)網(wǎng)絡(luò)有足夠的空間訓(xùn)練調(diào)整。使用自組織神經(jīng)網(wǎng)絡(luò)對心電信號分類的結(jié)果如圖8所示。
圖8 自組織神經(jīng)網(wǎng)絡(luò)分類
通過擴大自組織神經(jīng)網(wǎng)絡(luò)的輸出神經(jīng)元可以映射更多的聚類中心,從而達(dá)到更好的分類效果,但是另一方面,過多的輸出也會對醫(yī)生的識別造成困難,6*6的輸出作為類別數(shù)和準(zhǔn)確度的權(quán)衡,在現(xiàn)階段達(dá)到了很好的效果。
通過對醫(yī)學(xué)專家診斷心電圖的思維過程和統(tǒng)計學(xué)的分析,本文提出了一種以醫(yī)生經(jīng)驗為基礎(chǔ),基于心電信號分段特征提取的方法,結(jié)合三階貝塞爾函數(shù)和自組織神經(jīng)網(wǎng)絡(luò)的心電信號分類方法。從MIT-BIH 數(shù)據(jù)的實驗結(jié)果來看,分段提取的貝塞爾特征可以很好描述心電信號的特征,結(jié)合自組織神經(jīng)網(wǎng)絡(luò)可以達(dá)到較好的分類效果。
與已有的心電信號模式分類方法相比,本文的創(chuàng)新在于:第一,重視統(tǒng)計數(shù)據(jù)和經(jīng)驗知識在計算機中的表示;第二,突破了心電信號模式分類器特征表示方式單一的局限,使用分段的方式更加準(zhǔn)確的描述心電信號的特征,構(gòu)造出了更有效的心電信號特征空間。第三,研究工作面向?qū)嶋H應(yīng)用,具有明確的背景和真實的臨床數(shù)據(jù)支持。
本文提出的方法是分類模型中引入形態(tài)特征的初步嘗試。在接下來的工作中,我們將繼續(xù)圍繞實際心電信號診斷過程,重點考慮經(jīng)驗知識在計算機的表達(dá)和表示,從而進(jìn)一步完善心電信號波形的分類。
[1]SHANG Yu,XU Ting,HE Yonghui.The applications of the fractional fourier transform in the ECG processing[J].Electronic Science and Technology,2011,24(8):116-118(in Chinese).[尚宇,徐婷,何永輝.分?jǐn)?shù)階傅里葉變換在心電信號處理中的應(yīng)用[J].電子科技,2011,24(8):116-118.]
[2]WANG Liping,ZHU Jiangchao,SHEN Min.An electrocardiogram classification method combining morphology features[C]//Chongqing:Pattern Recognition,2010:1-5(in Chinese).[王麗蘋,朱江超,沈蜜.一種結(jié)合形態(tài)特征的心電圖模式分類方法[C].重慶:全國模式識別學(xué)術(shù)會議,2010:1-5.]
[3]Kuo Kuang Jen.ECG feature extraction and classification using cepstrum and neural networks[J].Journal of Medical and Biological Engineering,2007,28(1):31-37.
[4]Mahesh A Nair.ECG feature extraction using time frequency analysis[M].Germany:Springer,2010:461-466.
[5]Park K S,Cho B H,Lee D H.Hierarchical support vector machine based heartbeat classification using higher order statistics and hermite basis function[J].Computers in Cardiology,2008,14(3):229-232.
[6]LI Xuehua,MO Zhiwen,SHU Lan.The research of KPL feature extraction method for ECG recognition[J].Microcomputer Information,2009,1(27):3-5(in Chinese).[李學(xué)華,莫智文,舒蘭.KPL特征提取在心電識別中的應(yīng)用研究[J].微計算機信息,2009,1(27):3-5.]
[7]Llamedo Soria M.An ECG classification model based on multilead wavelet transform features[C]//Durham,NC:Computers in Cardiology,2007:105-108.
[8]JIANG Xing,ZHANG Liqing,ZHAO Qibin,et al.ECG arrhythmias recognition system based on independent component analysis feature extraction[C]//IEEE Region 10Conference TENCON.Hong Kong:IEEE Press,2006:1-4.
[9]Karpagachelvi S.ECG feature extraction techniques a survey approach[J].International Journal of Computer Science and Information Security,2010,8(1):76-82.
[10]WANG Liping,SHEN Mi,TONG Jiafei,et al.A uncertain reason method for abnormal ECG detection[C]//IEEE International Symposium on IT in Medicine &Education.JiNan:IEEE Press.2009:1091-1096.
[11]ZHAO Xudong,JIN Dengnan.Extraction method based on construction operator and morphological characteristics of waves[J].Computer Era,2007(12):1-3(in Chinese).[趙旭東,金登男.基于結(jié)構(gòu)算子的波形形態(tài)特征提取方法的研究[J].計算機時代,2007(12):1-3.]
[12]WANG Jinjun,JIN Dengnan.Research on pattern classification of DCG based on NN[J].Computer Applications and Software,2006,23(3):83-85(in Chinese).[王進(jìn)軍,金登男.應(yīng)用神經(jīng)網(wǎng)絡(luò)的理論對動態(tài)心電信號模式分類的研究[J].計算機應(yīng)用于軟件,2006,23(3):83-85.]
[13]MIT-BIH ECGPuwave Tool[EB/OL].[2010-01-01].http://www.physionet.org/physiotools/ecgpuwave/.