成謝鋒,單 煦,佘辰俊
(南京郵電大學 電子與光學工程學院、微電子學院,江蘇 南京 210023)
如今,生物識別技術得到了廣泛運用,為人類的生活提供了許多方便。例如人臉識別、指紋識別、語音識別等,然而這些技術或多或少潛藏著安全性、可靠性隱患。例如指紋可以通過一定的技術手段被復制下來,聲音也可以被錄制回放,人臉信息也能被竊取拍攝下來。為了提高生物識別技術的安全性和可靠性,目前一些研究人員開始把人體內部的生物信息作為新的識別特征來研究,例如心音信號、腦電信號、心電信號、基因(DNA)等,這是生物識別技術研究的一個新方向[1-4]。心音身份識別作為一種生物識別手段具有獨特優(yōu)勢,因為心音信號是來源于人體內部的一種動態(tài)生理信號,它蘊藏著與心臟相關的大量生理信息,心臟結構的復雜性也決定了心音信號不容易被仿制。心音信號的普遍性、易采集性、唯一性、不易偽造性等特點使其可以作為一種高安全性的生物識別特征,并且現在已經有大量研究結果證明將心音用于身份識別技術領域是可行的。但在目前心音識別的相關研究中,對心音樣本的位置來源并沒有明確規(guī)定。例如何圣康等人選取了肺動脈瓣聽診區(qū)心音,利用MFCC提取特征參數,并基于VQ實現了身份匹配[5];成謝鋒等人選取了二尖瓣聽診區(qū)心音,開發(fā)了基于Android的心音識別系統(tǒng)[6];劉佳佳等人提出了一種基于文化粒子群算法和最小二乘支持向量機的心音身份識別方法,獲得了較高的識別率,但沒有說明心音的采集位置[7]。所以本文研究不同聽診位置心音信號的差異性對身份識別的影響。首先對4通道心音信號進行去噪和分段預處理,再通過LPC方法提取S1和S2的共振峰頻率作為識別特征,并結合歐氏距離進行樣本間的相似性度量,給出識別結果,從而找出最適合用作個人身份識別的最佳聽診位置。
觀測對象:20例身體健康的青年人(主要是本校的研究生),男性12例,女性8例,平均年齡25歲。瓣膜性心臟疾病或因其他病因導致心臟雜音或心臟明顯增大者以及明顯肺氣腫者均不在本次觀測對象之列[8]。
實驗設備:采用自制的4通道同步心音傳感器進行心音信號采集,如圖1所示。本裝置根據人體胸腔體表的二尖瓣聽診區(qū)、肺動脈瓣聽診區(qū)、主動脈瓣聽診區(qū)和三尖瓣聽診區(qū),用金屬材料做成一個心臟形的底座,在底座正面對應4個聽診區(qū)安裝有4個心音傳感器,并且適當加壓力使心傳感器與人體心臟部位處緊密接觸,以獲取最佳心音。多路信號同步采集、結構合理、使用方便。
采集方法:觀測者在平靜狀態(tài)下以放松的坐立姿勢進行心音信號采集,將4通道同步心音傳感器放在胸腔體表,采樣頻率為16 000 Hz,采樣時間為30 s,采集過程中保持四周安靜。
心音是心臟血流動力與心血管系統(tǒng)相互作用的結果,是一種機械振動。正常心音的振動頻率范圍通常在20 Hz到200 Hz之間,心雜音的頻率一般不超過800 Hz。心音強度、頻率及相互關系可以反映心瓣膜、心肌功能及心內血流的狀況。心音信號具有周期性,在平靜狀態(tài)下采集到的一段心音可近似作為周期性平穩(wěn)信號來處理。一次心動周期可產生四個心音,心音主要組成成分如表1所示。
表1 心音主要組成成分
心臟瓣膜聽診區(qū)是心臟各瓣膜開放與關閉時所產生的聲音傳導至體表最易聽清的部位,與其解剖部位不完全一致。通過研究,在心臟血流動力學的基礎之上,對心音聽診的位置進行了明確的規(guī)定,如圖2所示。
心音聽診區(qū)主要包括二尖瓣聽診區(qū)、三尖瓣聽診區(qū)、主動脈瓣聽區(qū)、肺動脈瓣聽診區(qū)。本文采集的心音信號正來源于這四處。
各聽診區(qū)具體位置見表2。
表2 經典瓣膜聽診區(qū)具體位置
心音信號是一種比較微弱的生物信號,心音傳感器本身的靈敏度也很高,在采集過程中不可避免地會受到采集環(huán)境和采集設備的影響。例如,傳感器與被測試者之間的摩擦音;人體本身的呼吸音、肺音干擾;工頻干擾(50 Hz);機電干擾(35 Hz)和外部環(huán)境的高斯白噪聲等。這些噪聲會影響到有效信號,對有效特征的提取不利,這會導致身份識別的準確性降低,使得識別結果不可靠。因此對心音信號進行去噪處理很重要。
首先對心音信號進行降采樣處理,原始采樣頻率為16 000 Hz,降到1 000 Hz。本文使用3階巴特沃斯濾波器,對20 Hz~400 Hz之間的心音信號進行帶通濾波。原始心音和去噪后的心音如圖3所示。從波形上來看,原始心音中S1、S2得到很好的保留,濾波后雜亂的噪聲明顯減少。
心音特征向量的準確提取直接影響到識別效果,如果第一心音和第二心音不能進行精確分割,那么對S1和S2共振峰頻率的分析就會有誤差,這會導致身份識別的準確性降低,因此對S1和S2的精確分段至關重要。本文采用David等[9]提出的基于Logistic回歸的HSMM心音分割方法對心音信號的S1和S2進行精確分段,分段后的示意圖如圖4所示。
共振峰是指在聲音的頻譜中能量相對集中的一些區(qū)域,可以反映聲道(共振腔)的諧振特性,共振峰信息作為語音信號處理中重要的特征參數已經被廣泛地運用到語音識別技術中。心音信號同樣是一種聲音信號,若將心房、心室及動脈血管視作共振腔,心音信號在經過腔體時同樣會受到其共振作用,因此心音的共振峰頻率必然包含了大量有關心房、心室及動脈血管的形狀特征[10],將共振峰頻率作為心音特征應用于身份識別具有可行性與合理性。本文基于線性預測編碼(LPC)對心音共振峰進行了提取,它是共振峰分析最為有效的方法之一。這里使用萊文遜-杜賓的自相關方法來計算LPC線性預測系數,提取心音信號共振峰的步驟如下:
(1)類比語音信號的LPC模型,心音信號樣本s(n)可表示為
式中,u(n)為激勵函數,G為增益,ak,k=1,2,…,p是LPC系數。
(2)數字濾波器傳遞函數H(z)為
式(2)還可以表示為p個極點的級聯形式
其中,zk=rkexp(jθk)是H(z)在z平面上第k個極點。若H(z)是穩(wěn)定的,其所有極點都在z-平面的單位圓內。則第k個共振峰的頻率F(k)=θK/2πT,T是心音信號的采樣周期。
(3)計算心音信號的共振峰頻率
對H(z)進行多項式求根,也就是對H(z)的分母求零點,根據所得零點求得共振峰的極點及對應的共振峰頻率。將心音信號作為式(3)傳輸函數H(z)的輸入,對分段后的第一心音S1和第二心音S2分別進行共振峰分析,在功率譜中利用峰值檢測器檢測波峰即可得到S1和S2的共振峰頻率。以某一位觀測者的心音信號為例,提取S1和S2的共振峰頻率分別如圖5和圖6所示。
如圖5、圖6所示,S1和S2的共振峰頻率譜均存在4個峰值??紤]到心音信號的頻率主要分布在20~400 Hz范圍內,本文分別選取S1和S2的前兩個共振峰頻率{Fk;k=1,2,3,4}作為心音身份識別的特征向量進行研究,然后其作為歐氏距離相似性度量的輸入進行身份識別實驗。
本文分別對20人四個聽診區(qū)共80個心音樣本進行實驗分析,每個樣本取8個周期的心音信號,然后對這8個周期的信號提取S1和S2的共振峰頻率。其中T1,T2,T3,T4來源于30 s心音樣本中連續(xù)的幾秒,T5,T6,T7,T8來源于同一個心音樣本中的另幾秒。研究數據顯示,無論在哪一個聽診區(qū),同一個人的S1、S2共振峰頻率在連續(xù)和非連續(xù)周期內具有穩(wěn)定性,而不同人的S1、S2共振峰頻率則體現出差異性。由于數據較多不易全部展示,此處以二尖瓣聽診區(qū)為例,選取3個人的心音樣本數據進行穩(wěn)定性展示;選取8個人的心音樣本進行差異性展示。為了更直觀地展示出差異性,8個人的共振峰頻率取的是對應此人8個周期S1、S2共振峰頻率的均值。具體數據分別如表3和表4所示。
表3 二尖瓣聽診區(qū)同一個人多個周期的S1、S2共振峰頻率 Hz
表4 二尖瓣聽診區(qū)不同人的S1、S2共振峰頻率 Hz
根據表3可以看出,同一個人在不同周期的S1、S2共振峰頻率比較穩(wěn)定,數據比較集中,在安靜的采集環(huán)境以及盡量避免心音傳感器與胸腔體表發(fā)生摩擦的情況下,數據的微小波動在合理范圍之內。從表4可以看出,不同人的S1、S2共振峰頻率存在著明顯的差異,也就是個體之間是具有明顯區(qū)分度的。所以將S1、S2共振峰頻率作為識別特征具有合理性和可行性。圖7簡要展示了8位測試者在二尖瓣、三尖瓣、肺動脈瓣、主動脈瓣四個聽診區(qū)的共振峰頻率表現。S1、S2的共振峰頻率在四個聽診區(qū)都存在個體差異,哪一個聽診區(qū)的差異最大,將在下一小節(jié)結合歐氏距離進行評估。
本文采用歐氏距離來計算不同個體間的心音差異性。根據歐氏距離的計算方式和衡量特征,歐式度量需要保證各維度向量度量標準統(tǒng)一,本研究提取的特征向量量綱相同,符合歐式度量的適用條件。
歐氏距離(也稱歐幾里距離)是最常見的距離度量,衡量的是n維空間中各個點之間的絕對距離,在二維和三維空間中的歐氏距離就是兩點之間的實際距離。為了方便下面的解釋,先設定要比較X個體和Y個體之間的差異,它們都包含了n維特征,即X=(x1,x2,x3,…,xn),Y=(y1,y2,y3,…,yn),則X和Y之間的距離計算公式dist(X,Y)=
假設心音信號的訓練集數據樣本的特征向量為X=(x1,x2,x3,x4),測試集數據樣本的特征向量為Y=(y1,y2,y3,y4),其中xi,yi為心音特征向量,即S1和S2的共振峰頻率。由公式可得,X和Y之間的距離為
成謝鋒等[11]在S1和S2共振峰頻率在心音分類識別中的應用中指出,結合S1和S2的共振峰頻率作為特征向量比提取單一特征(S1共振峰頻率、S2共振峰頻率、未分段心音共振峰頻率)具有更好的識別效果。所以本文對四個聽診區(qū)身份識別準確率的研究中所提取的特征向量均結合了S1和S2共振峰頻率。
本研究的實驗對象共有20名,每位測試者分別記錄了四個聽診區(qū)的心音信號。以二尖瓣聽診區(qū)為例,每個心音樣本選取8個不同周期的心音信號,提取S1和S2的共振峰頻率作為特征向量,這樣每個人共有8組特征向量,訓練過程中,選取6組特征向量作為訓練數據,另外2組作為測試數據。實驗步驟如下:
(1)將20名測試者共120組訓練數據作為輸入,構成一個120*4的矩陣,訓練標簽為[1;1;1;1;1;1;2;2;2;2;2;2;…;20;20;20;20;20;20],構成一個120*1的矩陣。
(2)將20名測試者剩下的40組數據作為測試數據輸入,構成一個40*4的矩陣,測試標簽為[1;1;2;2;…;20;20],構成一個40*1的矩陣。
(3)將每一組測試數據分別與120組訓練數據做歐氏距離計算,然后對120個計算結果進行排序,選取距離最小的那組數據對應的訓練標簽作為預測結果。
(4)將預測結果與實際測試標簽進行比對,計算出識別率。
其他三個聽診區(qū)的實驗步驟同上。
用上述方法對40組測試樣本進行身份識別實驗,實驗結果見表5。表5顯示,本文所提出的基于心音共振峰頻率和歐式距離的身份識別方法達到了很好的識別效果,同時四個聽診區(qū)的識別效果也表現出差異性。其中識別率最高的聽診區(qū)是肺動脈瓣,達到了92.5%,主動脈瓣的識別率僅次于肺動脈瓣為90%,二尖瓣和三尖瓣的識別率分別為87.5%和85%。
表5 不同聽診區(qū)樣本組成及識別效果
根據上述實驗結果,可以得出:(1)將第一心音S1和第二心音S2的共振峰頻率應用于身份識別具有良好的識別效果。(2)不同采集位置心音的差異性會影響識別效果,對于青年人來說,識別效果最好的位置在肺動脈瓣,其次是主動脈瓣、二尖瓣、三尖瓣。(3)與性別關聯較小的聽診區(qū)為肺動脈瓣,男女生胸腔厚度有差異,心音采集時女生的二尖瓣、三尖瓣位置采集到的信號較不穩(wěn)定,而肺動脈瓣和主動脈瓣位置胸腔比較薄易于采集,實驗結果也證明了肺動脈瓣和主動脈瓣的識別效果要優(yōu)于另外兩個聽診區(qū)。(4)將肺動脈瓣和主動脈瓣進行特征融合可以提高識別率。
針對各聽診區(qū)的識別率差異,本文做出如下分析:肺動脈瓣和主動脈瓣聽診區(qū)都位于心臟的上半部分,靠近肺動脈和主動脈血管;二尖瓣和三尖瓣聽診區(qū)都位于心臟的下半部分,周圍是靜脈血管。動脈血管具有很大的彈性和收縮性,血液動力很大;靜脈血管壁較薄,平滑肌和彈力纖維較少,缺乏收縮性和彈性,管腔斷面較扁。當心臟血流動力與心血管系統(tǒng)相互作用產生心音時,肺動脈瓣和主動脈瓣聽診區(qū)心音的共振強度要大于二尖瓣和三尖瓣聽診區(qū),心音經過共振腔的共振作用所形成的共振峰頻率能夠更好地表征心音特征。在以后的研究中,可以嘗試提取除了共振峰頻率以外的其他共振參數作為心音識別的特征,以期將識別效果進一步提高。
綜上所述,將心音應用于青年群體的身份識別時,本文的研究結果比較推薦肺動脈瓣聽診區(qū)和主動脈瓣聽診區(qū)。
實驗過程中雖然盡量保持安靜的采集環(huán)境,但也很難避免外部的微弱噪聲和心音采集設備本身的影響,這些人為無法控制的因素或許會對最終的識別結果造成微小誤差,望各位讀者批評指正。
心音信號作為一種聲學信號,可以有效地表征心音共振腔結構的聲學特性,從而可以應用于身份識別。而不同聽診位置的心音信號具有一定的差異性,本文結合了醫(yī)學上常用的經典瓣膜聽診區(qū)(二尖瓣、三尖瓣、肺動脈瓣、主動脈瓣)對各聽診區(qū)識別效果進行了研究,更加細化地討論了心音身份識別問題。首先利用4通道同步心音傳感器采集心音信號,然后對原始心音進行去噪和分段預處理,再通過線性預測編碼(LPC)方法提取S1和S2的共振峰頻率作為識別特征,最后結合歐氏距離度量各樣本之間的相似性,給出識別結果。
對于青年群體的研究,本文的結論如下:(1)肺動脈瓣采集的心音特征表征的差異最大,而且與采集對象的性別關聯最小。(2)如果將主動脈瓣和肺動脈瓣進行融合處理,對于提高識別率具有積極的意義。