林 娟, 趙治棟, 孫淑強(qiáng)
基于稀疏編碼的手指心電信號(hào)身份識(shí)別算法*
林 娟1, 趙治棟2, 孫淑強(qiáng)2
(1.杭州電子科技大學(xué) 通信工程學(xué)院,浙江 杭州 310018;2.杭州電子科技大學(xué) 電子信息學(xué)院,浙江 杭州 310018)
研究了心電(ECG)信號(hào)在身份識(shí)別中的應(yīng)用,提出了基于過(guò)完備字典下稀疏編碼的手指心電身份識(shí)別認(rèn)證算法。在預(yù)處理階段,對(duì)ECG信號(hào)進(jìn)行預(yù)處理消噪,去除心電信號(hào)里的噪聲、基線漂移和心率變異的干擾。在特征提取階段,提取單周期心電信號(hào)構(gòu)成特征向量并構(gòu)建字典模型,用核奇異值分解(KSVD)訓(xùn)練成冗余字典,然后對(duì)每一部分特征向量進(jìn)行稀疏編碼,實(shí)現(xiàn)在該字典上的稀疏表示。在分類識(shí)別階段,利用得到的稀疏系數(shù)矩陣構(gòu)建特征模板向量作為特征參數(shù)。通過(guò)歐氏距離匹配輸出個(gè)體身份信息,實(shí)現(xiàn)個(gè)體身份識(shí)別認(rèn)證。通過(guò)兩個(gè)手指心電信號(hào)數(shù)據(jù)庫(kù)對(duì)該算法進(jìn)行了性能測(cè)試,獲得了較高的識(shí)別率。
手指心電信號(hào); 稀疏編碼; 稀疏系數(shù)矩陣; 歐氏距離
心電信號(hào)(ECG)是人類較早研究并應(yīng)用于醫(yī)學(xué)臨床的生物電信號(hào)之一,從不同層面上反映了心臟的生理和病理狀態(tài),在臨床心診斷中得到了廣泛應(yīng)用。近年來(lái)越來(lái)越多的專家學(xué)者把目光投到了用ECG進(jìn)行身份識(shí)別上,它最早由Biel L等人[1]在2001年提出,利用ECG的波形信息(振幅,斜率,特征點(diǎn)之間的時(shí)間距離等)作為特征實(shí)現(xiàn)了個(gè)體的身份識(shí)別。隨著半導(dǎo)體、微電子和集成電路技術(shù)的發(fā)展,無(wú)需導(dǎo)電膠的小體積、低功耗和易集成心電采集芯片已經(jīng)出現(xiàn),ECG的采集方式也從多導(dǎo)聯(lián)到單導(dǎo)聯(lián),從胸、四肢到手指等的拓展。
2008年,Chan A D C等人[2]采用兩個(gè)Ag/AgCl按鈕電極從50受測(cè)者的手指上采集90s的心電信號(hào),檢測(cè)出QRS波群,最后通過(guò)殘差百分比、相關(guān)系數(shù)、基于小波的距離測(cè)量等完成分類識(shí)別,識(shí)別率分別為75 %,82 %,95 %;2012年,Louren?o等人[3]利用Ag/AgCl干電極從32個(gè)受測(cè)者的手指上采集心電信號(hào),濾波后檢測(cè)出QRS波群進(jìn)行分割、時(shí)間和幅值歸一化得到標(biāo)準(zhǔn)心電信號(hào),取5個(gè)連續(xù)的分割后的心電信號(hào)的平均波作為模板,分別通過(guò)最近鄰分類器和支持向量機(jī)完成識(shí)別,識(shí)別率為93.75 %和90.63 %;2013年,Silva H P等人[4]在Louren?o等人[3]工作基礎(chǔ)上,首次提出將分割后的心電信號(hào)送入異常值去除系統(tǒng)剔除異常心跳,然后通過(guò)支持向量機(jī)完成識(shí)別;2014年,Silva等人[5]將Ag/AgCl干電池和Electrolycra電極分別放置于手掌上和手指上成功采集到心電信號(hào),并將采集到的信號(hào)收集于CYBHi數(shù)據(jù)集中。
本文提出了一種基于冗余字典下稀疏編碼的心電身份識(shí)別方法,實(shí)驗(yàn)證明用本文方法得到的身份識(shí)別率高達(dá)98.333 %。
稀疏編碼是一種模擬哺乳動(dòng)物視覺(jué)系統(tǒng)主視皮層V1區(qū)簡(jiǎn)單細(xì)胞感受野的人工神經(jīng)網(wǎng)絡(luò)方法,該方法具有空間局部性、方向性和頻域的帶通性,是一種自適應(yīng)的圖像統(tǒng)方法,目前,稀疏編碼方法在盲源信號(hào)分離、語(yǔ)音信號(hào)處理、自然圖像去噪及特征提取和模式識(shí)別等方面已取得了很好的進(jìn)展,本文提出了一種基于冗余字典下稀疏編碼的心電身份識(shí)別方法,通過(guò)對(duì)心電信號(hào)進(jìn)行稀疏表示之后得到的稀疏系數(shù)對(duì)測(cè)試者的身份進(jìn)行分類識(shí)別。
本文算法流程圖如圖1所示。
圖1 基于超完備字典下稀疏編碼的手指心電身份識(shí)別算法流程圖
對(duì)心電信號(hào)進(jìn)行特征提取之前,需要先進(jìn)行去噪、R點(diǎn)檢測(cè)及單周期劃分,得到一系列的單周期手指心電波群,然后對(duì)其進(jìn)行取平均,得到平均單周期的歸一化心電信號(hào),最后對(duì)信號(hào)進(jìn)行稀疏編碼得到稀疏系數(shù)作為特征值用歐氏距離匹配算法進(jìn)行分類識(shí)別。
1.1 基于單周期信號(hào)特征向量K-SVD算法
稀疏的數(shù)學(xué)定義為:一個(gè)信號(hào)中僅有的少數(shù)采樣點(diǎn)為非零的,而其他采樣點(diǎn)都為零,則這個(gè)信號(hào)是稀疏的[7]。1993年,Mallat S G和Zhang Z[8]提出了信號(hào)在冗余字典上分解的思想。稀疏表示使得信號(hào)的很多重要信息只集中在少量原子上,然后用這些少量原子線性表示測(cè)試者的心電信號(hào),求出其稀疏系數(shù),這些非零系數(shù)對(duì)應(yīng)的原子揭示了信號(hào)的特征。
字典是稀疏分解的基礎(chǔ),其性質(zhì)直接影響稀疏分解的效果, 2005年Aharon M等人[9]提出了一種K-SVD算法,為稀疏表示設(shè)計(jì)過(guò)完備字典,在K-SVD算法訓(xùn)練得到的字典基礎(chǔ)上,通過(guò)稀疏分解去除圖像中存在的零均值高斯白噪聲。
本文提出用基于單周期信號(hào)特征向量的K-SVD字典學(xué)習(xí)方法,正交匹配跟蹤(orthogonal matching pursuit,OMP)稀疏編碼,這些算法常用于壓縮感知和圖像去噪方面[10],ECG信號(hào)在去噪之后,在采樣率為1 000 Hz時(shí),信號(hào)以R點(diǎn)為中心進(jìn)行分割,分別向前向后各取200個(gè)點(diǎn)和399個(gè)點(diǎn),這樣可以得到一系列長(zhǎng)度為m(m=600)的單周期信號(hào),把這些一系列單周期信號(hào)特征向量作為樣本集,初始化冗余字典。整個(gè)算法可分為兩步,首先是稀疏編碼(sparse co-ding):固定字典D,通過(guò)目標(biāo)函數(shù)(1)采用OMP匹配追蹤算法找到樣本的最佳稀疏矩陣;然后字典更新(dictionary update):按列更新字典,依據(jù)是MSE最小的原則,通過(guò)奇異值分解(SVD)循序的更新每一列和該列對(duì)應(yīng)的稀疏系數(shù)矩陣的值
(1)
本文中稀疏系數(shù)模型可以描述為
y=Dα=[d1,…,di,…,dN][α1,…,αi,…αN]T
(2)
式中y∈Rm×1為一測(cè)試單周期信號(hào),D為訓(xùn)練字典,由N個(gè)訓(xùn)練信號(hào)的單周期波形組成,di=[di1,…,dik]∈Rm×k為第i訓(xùn)練個(gè)體的所有k段單周期訓(xùn)練信號(hào),dij為第i個(gè)訓(xùn)練個(gè)體的第j段單周期波形,α為待求的稀疏解,αi=[αi1,…,αik]∈R1×k為第i個(gè)人的稀疏系數(shù)。對(duì)于任意一段測(cè)試信號(hào)yi可近似的由該訓(xùn)練字典中的原子線性組合而成,即
yi=Dα+ε=d11α11+…+dikαik+,…,+dNkαNk+ε
(3)
理性情況下,通過(guò)稀疏算法求得的稀疏解α=[α11,…,αi1,…,αik,…,αNk]T中,只有與第i類個(gè)體相對(duì)應(yīng)的稀疏不為零,其他的系數(shù)αjk(j≠i)全為零或者接近于零,即測(cè)試信號(hào)由相對(duì)較大的那一部分稀疏值線性表示。
為了減少稀疏編碼的運(yùn)行時(shí)間,可以通過(guò)降維技術(shù)將訓(xùn)練字典和測(cè)試信號(hào)分別進(jìn)行降維處理,以減少數(shù)據(jù)中的冗余信息。本文采用主成分分析(principal component analysis,PCA)降維的方法對(duì)原始數(shù)據(jù)進(jìn)行簡(jiǎn)化,訓(xùn)練數(shù)據(jù)經(jīng)過(guò)PCA降維處理之后,維數(shù)大大降低,減少了手指心電身份識(shí)別時(shí)間。
任選CYBHi數(shù)據(jù)庫(kù)中的55個(gè)測(cè)試者進(jìn)行稀疏分解,訓(xùn)練時(shí)長(zhǎng)18 s,通過(guò)去噪、單周期提取以及PCA降維后組成特征向量,通過(guò)KSVD以及OMP進(jìn)行稀疏分解之后,分解結(jié)果如圖2,圖3所示。
圖2 同一個(gè)人不同心跳信號(hào)的稀疏系數(shù)
圖3 不同人心跳信號(hào)的稀疏系數(shù)
由圖2和圖3可以看出,心電信號(hào)經(jīng)過(guò)OMP稀疏分解之后得到的稀疏系數(shù)大部分為零,僅有少數(shù)的幾個(gè)值接近于1,稀疏效果很好,而且同一個(gè)人即使不同心跳信號(hào)經(jīng)過(guò)稀疏分解之后得到的稀疏系數(shù)也很相近,而不同的人稀疏分解之后得到的稀疏系數(shù)值有很大差異,這樣測(cè)試信號(hào)就可以由訓(xùn)練字典和非零的稀疏系數(shù)值線性表示,從而實(shí)現(xiàn)個(gè)體的身份識(shí)別。
1.2 歐氏距離匹配算法
歐氏距離(Euclidean distance)也稱為歐幾里得度量、歐幾里得距離,它是在m維空間中兩個(gè)點(diǎn)之間的真實(shí)距離,在二維空間中歐氏距離就是兩點(diǎn)之間的直線段距離。本文由上節(jié)步驟得到稀疏系數(shù)矩陣組成的特征向量作為分類器的特征,用歐氏距離為度量函數(shù),當(dāng)輸入的手指心電信號(hào)的特征向量與訓(xùn)練集中的特征向量的距離越小,說(shuō)明這兩個(gè)樣本最相近。這里歐氏距離的公式為
(4)
式中X為手指心電信號(hào)特征向量訓(xùn)練集中的樣本,Y為待識(shí)別人的手指心電信號(hào)的特征向量。
識(shí)別時(shí),計(jì)算出訓(xùn)練集中的模板Xi與未知模板Xu之間的歐氏距離,當(dāng)?shù)玫阶钚W氏距離時(shí),未知樣本W(wǎng)u被判別為與Wi屬于同一個(gè)人的樣本
(5)
對(duì)上述提出的基于稀疏編碼的心電身份識(shí)別方法,通過(guò)MatlabR2007軟件驗(yàn)證算法的有效性和可靠性,討論測(cè)試時(shí)間固定為9s的條件下,不同的訓(xùn)練時(shí)間,不同的特征值個(gè)數(shù)以及不同的參數(shù)設(shè)置對(duì)身份識(shí)別的影響。實(shí)驗(yàn)中的數(shù)據(jù)來(lái)自于CheckYourBiosignalHereinitiative(CYBHi)數(shù)據(jù)庫(kù)[5]和SurfaceECGdata[2]數(shù)據(jù)庫(kù),受測(cè)者的人數(shù)分別為60,55,一共115人,全部為健康個(gè)體。
2.1 不同的訓(xùn)練時(shí)間對(duì)身份識(shí)別的影響
一般來(lái)說(shuō),訓(xùn)練時(shí)間過(guò)短的話,每個(gè)樣本中得到的單周期心電信號(hào)個(gè)數(shù)比較少,不能很準(zhǔn)確的表征個(gè)體,但是,如果訓(xùn)練時(shí)間過(guò)長(zhǎng),就會(huì)使得存儲(chǔ)信號(hào)空間增大,處理信號(hào)時(shí)間花費(fèi)更過(guò)的時(shí)間,所以需要討論訓(xùn)練時(shí)間對(duì)心電識(shí)別和識(shí)別時(shí)間的影響。令測(cè)試時(shí)間固定為9s,訓(xùn)練時(shí)間分別為9,12,15,18,20s,選取2個(gè)數(shù)據(jù)庫(kù)的115個(gè)個(gè)體進(jìn)行測(cè)試。
從圖4(a)可以看出,隨著訓(xùn)練時(shí)間的增長(zhǎng),識(shí)別率呈現(xiàn)增長(zhǎng)的姿勢(shì),并最終得到很高的值100 %,在訓(xùn)練時(shí)長(zhǎng)為20s時(shí),兩個(gè)數(shù)據(jù)庫(kù)的身份識(shí)別率都達(dá)到100 %。從圖4(b)可以看出,隨著訓(xùn)練時(shí)間的增長(zhǎng)個(gè)體識(shí)別時(shí)間也呈上升趨勢(shì)。綜合考慮,訓(xùn)練時(shí)間設(shè)置為18s比較好。
圖4 不同訓(xùn)練時(shí)長(zhǎng)對(duì)識(shí)別率和總識(shí)別時(shí)間的影響
2.2 PCA不同特征值對(duì)身份識(shí)別的影響
由2.1小節(jié)里的圖4可以看出,隨著訓(xùn)練時(shí)間的增加贈(zèng)的識(shí)別時(shí)間也在增加,當(dāng)樣本持續(xù)增加時(shí),識(shí)別時(shí)間也會(huì)加大,為了避免上述情況的發(fā)生,采用PCA對(duì)數(shù)據(jù)樣本進(jìn)行降維。設(shè)定特征值個(gè)數(shù)分別為10,20,30,40,50,對(duì)識(shí)別率和個(gè)體識(shí)別時(shí)間的變化進(jìn)行討論,選取2個(gè)數(shù)據(jù)庫(kù)的115個(gè)個(gè)體進(jìn)行測(cè)試。
由圖5(a)可以看出,一開(kāi)始隨著特征值的增加識(shí)別率增加,但當(dāng)特征值取到30的時(shí)候,識(shí)別率達(dá)到最大之后便趨于穩(wěn)定,結(jié)合看圖5(b),隨著特征值的增加個(gè)體識(shí)別時(shí)間也在增加,當(dāng)特征值小于30的時(shí)候,雖然識(shí)別時(shí)間相對(duì)較短但是識(shí)別率沒(méi)有達(dá)到最理想的狀態(tài),所以綜合考慮,特征值個(gè)數(shù)取30的時(shí)候,識(shí)別效果最好。
圖5 不同的特征值個(gè)數(shù)對(duì)識(shí)別率和總識(shí)別時(shí)間的影響
2.3 不同識(shí)別算法對(duì)身份識(shí)別率的影響
基于手指心電的身份識(shí)別算法近年來(lái)取得了很大發(fā)展,各種識(shí)別算法也是層出不窮,對(duì)識(shí)別算法的要求也隨之增高,身份識(shí)別率的大小和識(shí)別時(shí)間的長(zhǎng)短決定著算法的實(shí)用性和有效性,本文找了相同數(shù)據(jù)庫(kù)下不同文獻(xiàn)中的算法作對(duì)比,如表1所示。
表1 手指心電不同識(shí)別方法比較
方法數(shù)據(jù)庫(kù)(大小)識(shí)別算法識(shí)別率/%文獻(xiàn)[2]SurfaceECGdata(50)MeanECG+小波距離測(cè)度89文獻(xiàn)[4]CYBHi(37)MeanECG+SVM90.9文獻(xiàn)[11]CYBHi(56)SurfaceECGdata(50)廣義S變換+ZM96.498本文算法CYBHi(55)SurfaceECGdata(60)超完備字典下OMP+歐氏距離10098.333
本文利用超完備字典下的OMP算法進(jìn)行心電身份識(shí)別,實(shí)驗(yàn)參數(shù)設(shè)置為:訓(xùn)練時(shí)長(zhǎng)18 s,測(cè)試時(shí)長(zhǎng)9 s,單周期信號(hào)PCA降維之后特征值個(gè)數(shù)為30,采用OMP進(jìn)行稀疏分解,通過(guò)歐氏距離匹配算法進(jìn)行分類識(shí)別,該算法在不同數(shù)據(jù)庫(kù)中的識(shí)別性能如表2所示。
表2 本文提出的算法在不同數(shù)據(jù)庫(kù)中的識(shí)別性能
手指心電信號(hào)數(shù)據(jù)庫(kù)受測(cè)人數(shù)身份識(shí)別率/%個(gè)體識(shí)別時(shí)間/sCYBHi551000.601表面ECG數(shù)據(jù)6098.3330.857
從表2可以看出,本文提出的算法在兩個(gè)手指心電信號(hào)數(shù)據(jù)庫(kù)中的個(gè)體身份識(shí)別率都很高,而且高識(shí)別率條件下識(shí)別時(shí)間很短,該算法可以很好地應(yīng)用到系統(tǒng)及生活當(dāng)中。
基于手指心電信號(hào)的身份識(shí)別具有廣闊的應(yīng)用范圍,與臨床上相比,從手指上采集心電信號(hào)降低了其入侵水平,提高了以ECG為基礎(chǔ)的身份識(shí)別的實(shí)用性和用戶對(duì)其的接受能力。本文提出了基于冗余字典下稀疏分解的手指心電個(gè)體身份識(shí)別算法,通過(guò)實(shí)驗(yàn)證明,該方法原理簡(jiǎn)單,識(shí)別速度快,特別實(shí)在PCA降維之后,在調(diào)高速率的同時(shí)也保證了識(shí)別率的穩(wěn)定,更重要的是,在個(gè)體數(shù)很多的條件下仍能在較短的時(shí)間內(nèi)得到較高的識(shí)別率,具有具有實(shí)用性和有效性。
[1] Biel L,Pettersson O,Philipson L,et al.ECG analysis:A new approach in human identification[J].IEEE Transactions on Instrumentation and Measurement,2001,50(3):808-812.
[2] Chan A D C,Hamdy M M,Badre A,et al.Wavelet distance mea-sure for person identification using electrocardiograms[J].IEEE Transactions on Instrumentation and Measurement,2008,57(2):248-253.
[3] Lourenco A,Silva H,Fred A.ECG-based biometrics:A real time classification approach[C]∥Proceedings of the 22nd IEEE International Workshop on Machine Learning for Signal Processing,Santander,Spain,2012.
[4] Silva H P D,Fred A,Lourenco A,et al.Finger ECG signal for user authentication:Usability and performance[C]∥2013 IEEE the Sixth International Conference on Biometrics:Theory,Applications and Systems,2013.
[5] Silva H P D,Lourenco A,Fred A,et al.Check your biosignals here:A new dataset for off-the-person ECG biometrics[J].Computer Methods and Programs in Biomedicine,2014,113(2):503-514.
[6] 薛纏明,李麗宏.小波分析在激光測(cè)距傳感器中的應(yīng)用[J].傳感器與微系統(tǒng),2015,34(6):151-152.
[7] Hung S,Jan J C.Machine learning in engineering analysis and design: An integrated fuzzy neural network learning model[J].Computer-Aided Civil and Infrastructure Engineering,1999,14(3):207-219.
[8] Mallat S G,Zhang Z.Matching pursuits with time-frequency dictionaries[J].IEEE Transactions on Signal Processing,1993,41(12):3397-3415.
[9] Aharon M,Elad M.K-SVD and its non-negative variant for dictionary design[C]∥Proceedings of SPIE,The International Society for Optical Engineering,2005:327-339.
[10] 沈小正,王 彪.基于壓縮感知理論的聲矢量陣方位估計(jì)方法[J].傳感器與微系統(tǒng),2016,35(7):35-37.
[11] 鄒申申,趙治棟,袁昌成.基于廣義S變換和香農(nóng)熵的手指心電信號(hào)身份識(shí)別算法研究[C]∥2015浙江省信號(hào)處理學(xué)會(huì)2015年學(xué)術(shù)年會(huì)論文集,2015.
Algorithm for finger-ECG signal identity recognition based on sparse coding*)
LIN Juan1, ZHAO Zhi-dong2, SUN Shu-qiang2)
(1.School of Communication Engineering,Hangzhou Dianzi University, Hangzhou 310018,China; 2.School of Electronic Information,Hangzhou Dianzi University,Hangzhou 310018,China)
Application of ECG signal in identity recognition is studied and is proposed,sparse coding algorithm based on complete dictionary.In preprocessing stage,denoise noises in ECG like baseline wander and interference of heart rate variability.In feature extraction stage,extract single periodic signal to form feature vectors.Utilize the feature vectors to build the dictionary model and then be trained to be redundant dictionary by KSVD.Then every part of feature vectors is used for sparse coding,implement sparse representation in the dictionary. In classification stage,utilize sparse coefficient matrix to build characteristic template vector and use it as characteristic parameters.Then matched output individual identity information through Euclidean distance realize personal identity authentication.Performance test on the proposed algorithm is carried out through two fingers ECG database named CYBHi and surface ECG data and won high recognition rate.
finger ECG; sparse coding; sparse coefficient matrix; Euclidean distance
10.13873/J.1000—9787(2017)02—0142—04
2016—11—29
國(guó)家自然科學(xué)基金資助項(xiàng)目(61571173);浙江省自然科學(xué)基金資助項(xiàng)目(LY14F010021);浙江省公益性技術(shù)應(yīng)用研究計(jì)劃資助項(xiàng)目(2015C31086,2015C31085);浙江智慧城市區(qū)域協(xié)同創(chuàng)新中心資助項(xiàng)目
R 318
A
1000—9787(2017)02—0142—04