李思楠, 趙 海
(1.河北民族師范學院 物理與電子工程系,河北 承德 067000;2.東北大學 計算機科學與工程學院,遼寧 沈陽 110000)
本文研究的人體生理狀態(tài)判別機制,首先通過脈搏、呼吸和體溫三種傳感器來實時采集人體的三大生命體征信號,對信號進行預處理和特征提取后,按照各自信號的判別機制將人體的生理狀態(tài)分類為“普通狀態(tài)”和“事件狀態(tài)”兩大類,最后將3組判決結果進行數(shù)據(jù)融合,劃分出人體在連續(xù)時間段內(nèi)生理狀態(tài)所處于的不同狀態(tài)等級,使用戶可以根據(jù)自身生理狀態(tài)所處的等級高低對自身情況進行選擇性關注和感知。
利用反射式脈搏波傳感器[7]采集人體手腕處的脈搏波信號,脈搏波信號是一種低頻信號,頻率集中在10 Hz以下,采集過程中不可避免地會受到周圍環(huán)境中溫濕度、電磁場以及采集者自身呼吸和運動的影響。本文選擇Sym8小波作為基函數(shù),使用基于小波分解和重構的方法,消除采集過程中摻雜的高頻噪聲及基線漂移。
脈搏波的上升支時間(t1)和高度(H1)與血管壁彈性和射血速度等指標有關;脈搏波的下降支時間(t2)和高度(H2)與外周阻力有關;脈波周期(T)等于心跳周期;此外,反射指數(shù)(AI,AI=H2/H1)是反映動脈硬化程度的重要指標之一,可作為心血管健康的評價指標。在本文中,使用差分閾值方法[8]來提取脈搏波的每個周期中的特征參數(shù),并篩選出6個時域特征向量S=[t1,t2,H1,H2,T,AI]。采用主成分分析的方法[9]來減少數(shù)據(jù)的維數(shù)。從該6維向量中提取前兩個主成分元素pca1和pca2作為SVM的輸入向量。
訓練和測試的數(shù)據(jù)集由N對提取特征量后的樣本數(shù)據(jù)構成,形式為:(xi,yi),i=1,2,…,N,xi∈R,yi∈{0,1}。這里xi為一個二維的特征向量,分別包含了從脈搏波數(shù)據(jù)集進行特征向量提取和主成分分析后的第一和第二主成分pca1和pca2,即xi∈(pca1,pca2)。yi表示xi數(shù)據(jù)的標簽,如果yi=1,xi屬于事件狀態(tài),如果yi=0,xi屬于普通狀態(tài)。
SVM訓練應用于本文是一個帶約束的尋找最優(yōu)“超平面”的最小值求解問題[10]
(1)
式中w為最優(yōu)“超平面”的法向量,使‖w‖變得最小,就相當于使分類間隔達到最大,約束條件為
圍繞保障人民群眾飲食用藥安全這一中心任務,昆明市局全面落實“黨政同責”和“四有兩責”要求,把食品藥品安全納入各級政府公共安全體系、目標管理績效考核體系,權重提高到3%,實行“一票否決制”。2013年以來開展了50多項全市食品藥品安全整治行動。將食品藥品安全列入全市“十三五”重點專項規(guī)劃,每年專項經(jīng)費超過2000萬元。
yi(wTxi+b)≥1,i=1,2,…,N
(2)
式中b為超平面距離原點偏移量,而分類函數(shù)判別式為
f(x)=sgn{(wTx)+b}
(3)
由于在實際情況中,樣本數(shù)據(jù)中的“事件狀態(tài)”和“普通狀態(tài)”的特征向量分界可能并不明顯,不是線性可分的情況,有可能出現(xiàn)兩類數(shù)據(jù)的混疊。為此,引入松弛變量ξi≥0和誤差懲罰因子C
(4)
yi(wTxi+b)≥1-ξi,i=1,2,…,N
(5)
本文采用粒子群算法[11~13]來確定最優(yōu)的懲罰因子C和核函數(shù)的參數(shù)σ,使選擇C和σ的過程轉化為一個優(yōu)化搜索過程。
訓練和分類的過程歷經(jīng)3個階段,通過數(shù)據(jù)準備階段的脈搏波特征提取和主成分分析,確定了pca1和pca2作為SVM的2維輸入向量,在算法標定階段,利用粒子群算法來確定最優(yōu)懲罰因子C和核函數(shù)的參數(shù)σ,在分類判別階段由構建好的分類器對測試數(shù)據(jù)進行分類。分類的可能結果如表1所示,為了客觀分析該方法的分類效果,本文采用了SVM常用的幾項評價指標[14,15]:精確率:Precision=TP/(TP+FP);召回率:Recall=TP/(TP+FN);分類準確率:Accuracy=(TP+FN)/(TP+FN+TN+FN)。
表1 分類的可能結果匯總
以上的指標是反映分類器的靜態(tài)性能指標,為了評估分類判別的動態(tài)過程,需要通過觀察ROC(receiver opera-ting characteristic)曲線的變化趨勢。其中,真陽性率(true positive rate,TPR=TP/(TP+FN))和假陽性率(false positive rate,FPR=FP/(FP+TN))分別作為ROC曲線的橫坐標和縱坐標。AUC是用ROC曲線下的面積來評價分類器性能,計算公式為
(6)
本文中實驗者經(jīng)歷三種事件狀態(tài),包含為運動、酒精刺激和睡眠,普通狀態(tài)為人體處于靜止坐立狀態(tài)之下。選用紅外反射式脈搏傳感器采集人體手腕處的脈搏波信號,采樣率200 Hz。16名實驗者(年齡23~27歲),在實驗場景中依次經(jīng)歷4種實驗過程分別為:靜止坐立(10 min)、運動(10 min)、睡眠(80 min)和喝酒刺激(30 min),分類標簽如表2所示。采集得到的數(shù)據(jù)通過交叉驗證的方式,選取其中50 %為訓練集數(shù)據(jù),另50 %為測試集數(shù)據(jù)。
表2 人體生理狀態(tài)分類標簽
圖1(a)所示為SVM構建的訓練效果?!撂柎碛柧毤械钠胀顟B(tài)下對應數(shù)據(jù),實心圓點代表事件狀態(tài)下(運動、睡眠、喝酒)對應的數(shù)據(jù),兩類數(shù)據(jù)的邊界界限并不明顯,但SVM可以通過最優(yōu)分類曲線將數(shù)據(jù)進行區(qū)分。
圖1(b)為SVM的分類效果,方格符號記表示被分類為“普通狀態(tài)”的測試數(shù)據(jù),米字符號記表示被分類為“事件狀態(tài)”的測試數(shù)據(jù)。從中可以看到雖然邊界模糊,但兩種生理狀態(tài)可以被成功分類。
圖1 SVM訓練和分類效果
統(tǒng)計16名實驗者的4項分類指標如表3所示,精確率和召回率平均值分別達到了96.12 %和94.18 %,平均的分類準確率也達到了96.85 %。從實驗者1的ROC曲線中可以看出,分類器的TPR始終保持在90 %以上,并不斷提升,AUC值達到0.9476。
由于每個脈搏周期都會產(chǎn)生一組分類結果,本文利用脈搏波得到了一組分類判決結果(0/1),如果采集的時間較長,則判決結果同樣為大量數(shù)據(jù)。因此,本文會對判決的結果進行單位轉換,由每個脈搏周期生成一個判決結果轉化為1 min生成一個判決結果。采取的方法是:如果一分鐘內(nèi)判決結果中0(普通狀態(tài))的數(shù)量大于1(事件狀態(tài))的數(shù)量,則用二進制數(shù)0表示該1 min的判決結果,否則用1表示該1 min的判決結果。
利用呼吸波傳感器獲取呼吸信號,從得到的呼吸信號時域周期中可以計算出實時的呼吸頻率,然后跟設定好的閾值比較,來判定當前人的生理狀態(tài)。成年人在平靜狀態(tài)下的呼吸頻率為每分鐘16~20次,女性平均比男性快1~2次,低于12次/分屬于呼吸過緩。因此,文本中設置呼吸頻率的閾值為下限12次/分,上限20次/分。在閾值范圍內(nèi),人體的狀態(tài)被判定為“普通”(標記為0),超出閾值范圍則狀態(tài)被判定為“事件”(標記為1)。每個呼吸周期會產(chǎn)生一次判決結果,因此,同樣需要對呼吸的分類結果進行單位轉化,轉化方式同脈搏波的轉化方法相同,最終由呼吸波信號的分類結果得到一組每分鐘對應一個的判決結果(0/1)。
人體的體溫不會在短時間發(fā)生突變,本文中基于體溫信號的人體狀態(tài)分類先利用數(shù)字體溫傳感器采集人體的體溫信號,每分鐘采樣一次,再跟設定好的閾值進行比較,判斷人體生理狀態(tài)分類為0(普通狀態(tài))還是1(事件狀態(tài))。設定的閾值可以根據(jù)使用者的具體情況而調(diào)節(jié)。本文實驗者的閾值范圍設定在36~37 ℃。在這個閾值范圍內(nèi)分類結果為0(普通狀態(tài)),超過閾值范圍分類為1(事件狀態(tài))。最終生成一個只含有0或1的二進制數(shù)組。
本文提出一種基于二進制編碼的數(shù)據(jù)融合方法,將三種信號的判決結果進行決策級融合,得到人體生理狀態(tài)的綜合評價結果(1組3 Bit二進制編碼)。為了能夠直觀展示這種數(shù)據(jù)融合方法,本文選擇了一名實驗者,連續(xù)4 h內(nèi)通過三種傳感器采集脈搏波、呼吸和體溫信號,采集過程如圖2(a)所示,這4 h內(nèi)該實驗者經(jīng)歷了10 min的運動、80 min睡眠和40 min的喝酒刺激,各個時間節(jié)點已被標注。利用三種信號各自的判別機制對人體生理狀態(tài)生成了連續(xù)240 min的0/1判決數(shù)組如圖2(b)所示,三種信號都對人體經(jīng)歷的事件狀態(tài)的分類能力各不相同。
圖2 三種信號采集過程、時域波形及分類判決結果
在進行二進制編碼融合的過程中,需要先確定三組信號脈搏、呼吸、體溫各自分類判決結果的編碼順序,即確定融合后的3 bit二進制數(shù)中,最高位、中間位、最低位的優(yōu)先級排序。
三組狀態(tài)的分類結果由3組二進制序列(240個0或1)組成。其中1代表人體處于“事件”狀態(tài),0代表人體處于“普通狀態(tài)”。由一次的狀態(tài)分類結果到下一次的分類結果共存在4種情況:p1表示由前一狀態(tài)0變換為下一狀態(tài)1的次數(shù)占全部分類的比例;p2表示由前一狀態(tài)1變換為下一狀態(tài)0的次數(shù)占全部分類次數(shù)的比例;同理,p3表示由前一狀態(tài)0變換為下一狀態(tài)0的次數(shù)占全部分類次數(shù)的比例;p4表示由前一狀態(tài)1變換為下一狀態(tài)1的次數(shù)占全部分類次數(shù)的比例。
這里用p1和p2的和代表了生理狀態(tài)發(fā)生改變的頻率,它的值越小,說明此種信號越穩(wěn)定,越不容易發(fā)生突變。這里引入熵S的概念來衡量信號的狀態(tài)變換的頻度
S=-(p1+p2)log2(p1+p2)
(7)
三種信號的熵值統(tǒng)計如表3所示,熵值S的值越大,代表狀態(tài)發(fā)生改變的期望越高,即兩種狀態(tài)之間轉換的頻度越高,該信號自身的穩(wěn)定性越差;反之,信號的穩(wěn)定性越好。由表3統(tǒng)計可以看出,體溫信號的穩(wěn)定性最高,脈搏次之,呼吸信號的穩(wěn)定性最差。因此,本文選體溫信號的判決結果作為3 bit二進制編碼的最高位,脈搏信號的判決結果為中間位,呼吸信號的判決結果作為最低位。
表3 三種信號的熵值統(tǒng)計
經(jīng)過了二進制編碼融合方法之后形成的人體生理狀態(tài)綜合評價結果是由一組3 bit二進制數(shù),因為3 bit二進制數(shù)的取值范圍是0~7,本文也將人體的生理狀態(tài)分為8個等級,如表4所示。
利用二進制編碼融合的方法,將人體的生理狀態(tài)評價結果表示為8個等級的時間序列的形式。數(shù)據(jù)融合后的等級越高,表明人的生理狀態(tài)越值得關注,等級越低,表明人體的生理狀態(tài)越穩(wěn)定,越不必關注。處于等級0時則代表人此刻處于“普通狀態(tài)”。
表4 生理狀態(tài)的等級劃分
實驗者在4 h(240 min)的生理狀態(tài)等級分布情如圖3所示,時間分辨率為1 min,每條直線代表了人體生理狀態(tài)在該分鐘內(nèi)所處的等級,而線段的高度代表了所處等級的大小,一共分8個等級,線段越高,等級越高。從圖中可以看到,實驗者所經(jīng)歷的運動、睡眠、飲酒三種狀態(tài)在圖中都有不同等級的體現(xiàn)。高強度的運動對人體生理狀態(tài)的影響最大,該段時間內(nèi)人體被判定為最高等級,值得用戶重點關注,40 min喝酒過程,人體生理狀態(tài)先由等級2上升到等級6,隨后又下降回等級2,直接對映了人體生理狀態(tài)變化的過程,開始階段酒精對人體的影響逐漸加大,對心血管系統(tǒng)的刺激導致人體內(nèi)部的各種生理反應開始顯現(xiàn),體溫上升,而最后當酒精隨著人體汗液的排出及肝臟的處理,生理狀態(tài)又逐漸恢復為普通狀態(tài)。而睡眠過程在圖中的等級為2,說明了睡眠對人體的生理狀態(tài)的影響程度沒有運動和喝酒影響大,只在脈搏信號上得以區(qū)分,在呼吸和體溫信號上沒有顯現(xiàn)出區(qū)別。
圖3 1min分辨率的可視化效果
本文提出一種多傳感器融合的人體生理狀態(tài)分類方法,通過脈搏、呼吸、體溫三種傳感器采集的數(shù)據(jù)分別將人體生理狀態(tài)分類為“普通狀態(tài)”和“事件狀態(tài)”,隨后采用二進制編碼的方式將3組分類結果進行數(shù)據(jù)融合,得出了一組能夠反映人體所處生理狀態(tài)等級的可視化結果,不僅增強了使用者對自身生理狀態(tài)的感知,還能根據(jù)最終結果還原出每一組信號的分類情況。為體域網(wǎng)產(chǎn)品中如何處理和存儲海量人體生理數(shù)據(jù)提供了一個全新的方法。