陳濤
(佛山職業(yè)技術(shù)學院,廣州佛山,528000)
睡眠是一項非常重要的生理活動。人類有1/3 的時間是在睡眠中度過。睡眠質(zhì)量與身心健康有著密切的關(guān)聯(lián)。好的睡眠質(zhì)量有助于放松大腦,緩解疲勞,促進健康;反之則容易造成倦怠乏力,注意力不集中,嚴重者可引發(fā)焦躁、抑郁等疾病,損害身心健康[1]。研究表明,睡眠質(zhì)量的改善可以通過在特定的睡眠時期施加適當?shù)耐饨绺深A實現(xiàn)[2-3]。因此,正確識別睡眠時期具有重要的意義。
依照Rechtschaffe 和Kales(簡稱R&K)分期準則,睡眠過程分為清醒期(Wakefulness,W)、非快速眼動期(Non-Rapid Eye Movement,NREM)和快速眼動期(Rapid Eye Movement,REM)[4]。其中,NREM 期可具體劃分為非快速眼動1 期(N1),非快速眼動2 期(N2),非快速眼動3 期(N3)和非快速眼動4 期(N4)。2007 年,美國睡眠醫(yī)學會(AASM)對R&K 睡眠分期準則進行修訂,將N1 期和N2 期整合為淺睡期(Light Sleep,LS),N3 期和N4 期整合為深睡期(Slow Wave Sleep,SWS)[5]。本文遵照AASM 的睡眠分期標準。睡眠分期結(jié)構(gòu)圖如圖1 所示。
圖1 睡眠分期結(jié)構(gòu)圖
傳統(tǒng)的睡眠分期依靠睡眠專家標定實現(xiàn)。健康成年人整晚的睡眠時間為7~8h,相應的標定工作需要2~4 h,耗時久,工作量大,而且不同睡眠專家的判讀結(jié)果常存在出入,無法保證一致性。因此,發(fā)展自動睡眠分期算法具有重要的意義。
現(xiàn)階段,睡眠分期研究已經(jīng)取得了一定的進展。Liang等[6]研究20 位受試者的睡眠腦電(Elect roencephalogram,EEG)信號,提取多尺度熵(Multiscale Entropy)、自回歸模型(Autoregressive Model)作為特征,使用線性判別分類器(Linear Discriminant Analysis)對睡眠階段5 分類,準確率76.91%;Rodriguez 等[7]研究39 位受試者的睡眠EEG 信號,提取分形維數(shù)(Fractal Dimension,F(xiàn)D)、去趨勢流動分析(Detrended Fluctuation Analysi,DFA)、香農(nóng)熵(Shannon entropy,H)、近似熵(Approximate entrop,ApEn)、樣本熵(Sample Entrop,SampEn)以及多尺度熵(Multiscale Entropy,MSE)等特征,基于K-均值聚類算法對睡眠階段5 分類,準確率76.8%;Liang 等[8]研究4 位受試者的睡眠EEG 信號,提取功率譜(Power Spectrum),功率比(Power Ratio),譜頻率(Spectral Frequency)和時間比率(Duration Ratio)作為特征,使用帶有平滑規(guī)則的決策樹(Decision Tree)分類器對睡眠階段5 分類,準確率77.98%;Fraiwan[9]等研究16 位受試者的睡眠EEG 信號,應用Choi-Williams 分布提取Delta、Theta、Alpha 等節(jié)律波的能量譜特征,結(jié)合隨機森林分類器對睡眠階段5 分類,準確率78%;Flexer[10]等研究40 位受試者的睡眠EEG 信號,利用隱馬爾科夫模型(Hidden Markov Model,HMM)對睡眠階段3 分類,準確率接近80%。
本文提出了基于頻域分析與統(tǒng)計計算的自動睡眠分期算法。應用小波變換對原始腦電信號進行去噪,傅里葉變換提取頻譜特征,統(tǒng)計分析提取均值等特征,運用支持向量機(Support Vector Machine,SVM)對復合特征進行分類識別,達到了快速準確的分期效果。
本文的睡眠腦電(Electroencephalogram,EEG)信號數(shù)據(jù)來自美國麻省理工大學BIH 生理信息庫中的Sleep-EDF 數(shù)據(jù)庫[11]。選擇10 位健康成年人作為研究對象,年齡21 ? 35歲,無病史。睡眠腦電數(shù)據(jù)統(tǒng)一標識格式為SC4ssnE0,其中ss 對應對象標號(0 ≤ ss ≤ 82);n對應記錄的夜晚標號(1 或2)。數(shù)據(jù)采樣頻率100Hz,波幅單位μV,記錄時長20h,參考導聯(lián)Fpz?Cz、Pz?Oz。睡眠分期結(jié)果已由專家人工標注。
1.2.1 EEG 信號預處理
由于睡眠EEG 信號極其微弱,容易受到眼電(Electrooculogram,EOG)、肌電(Electromyogram,EMG)等噪聲信號的干擾,因此需要對原始的EEG 信號進行去噪預處理。小波變換是在傅里葉變換的基礎(chǔ)上發(fā)展起來的一種時頻域分析方法,在處理非平穩(wěn)信號方面,具有良好的時頻特性,廣泛應用于腦電信號的處理[12,13]。
通過實驗對比,當使用db4 小波基,分解層數(shù)為7,依據(jù)無偏風險閾值估計準則(Rigrsure regulation)篩選小波系數(shù)時,EEG 信號的高頻和低頻信息保留最為完整,去噪效果最理想。圖2 是依據(jù)上述方法對30 s EEG 信號去噪后的結(jié)果。
圖2 原始EEG 信號和降噪后EEG 信號波形圖
1.2.2 頻譜特征提取
頻譜能量特征是EEG 信號中的重要特征參數(shù)。小波變換,傅里葉變換、Hilbert-Huang 變換,Wingner-Ville 分布以及Choi-Williams 分布等都是典型的EEG 信號頻譜能量分析方法。本文以傅里葉變換為基礎(chǔ),提取睡眠EEG 信號能量特征[14]。
(1)頻譜中心值(Spectral centroid,Sc)
(2)頻譜寬度值(Spectral width,Sw)
(3)頻譜不對稱值(Spectral asymmetry,Sa)
(4)頻譜平坦度值(Spectral flatness,Sk)
(5)頻譜平坦度值(Spectrum flatness,SF)
(6)頻譜斜率(Spectral slop,Ss)
(7)頻譜衰減率(Spectral decrease,Sd)
ak代表信號做傅里葉變換后,的頻率值對應的頻譜幅值。
1.2.3 統(tǒng)計分析特征提取
研究表明睡眠EEG 信號是一種時變的、有源的、非平穩(wěn)的復雜的非線性動力學信號,可以結(jié)合統(tǒng)計分析方法,提取均值、方差以及信號的高階矩等統(tǒng)計特征[15],反映睡眠的變化過程,實現(xiàn)睡眠分期。
(1)原始信號平均值
(2)原始信號標準差
(3)原始信號一階導數(shù)絕對值的平均值
(4)標準化后信號一階導數(shù)絕對值的平均值
(5)原始信號二階導數(shù)絕對值的平均值
(6)標準化后信號二階導數(shù)絕對值的平均值
其中,x(n),n=1,…,N代表具有N 個數(shù)據(jù)點的去噪后的睡眠EEG 信號。
1.2.4 支持向量機分類
支持向量機(Support Vector Machine,SVM)是一種線性判別分類器,通過找到最優(yōu)超平面,實現(xiàn)樣本的正確分類,同時滿足樣本間的分類間隔達到最大,在腦電信號處理領(lǐng)域得到了廣泛的應用[16,17]。
本文選用線性核函數(shù)構(gòu)造分類器,n 倍交叉驗證法計算分類準確率。首先將所有的樣本進行n 等分,以其中的1份樣本作為測試數(shù)據(jù)集,利用其余的n-1 份樣本訓練得到的分類器對其進行測試,得到單次實驗的準確率。順次抽取測試數(shù)據(jù)集,得到n 個準確率。對準確率求平均,以平均值作為交叉驗證準確率。同時,為進一步提高準確率的可信度,上述過程可重復k 輪進行。以k 輪的均值準確率作為最終結(jié)果。算法過程如圖3 所示。
圖3 k 輪n 倍交叉驗證法示意圖
本文分別利用Sleep-EDF數(shù)據(jù)庫中的Fpz?Cz、Pz?Oz 通道的睡眠EEG 信號進行實驗。前者,平均準確率達到86.82%,卡帕系數(shù)0.83;后者,平均準確率達到86.01%,卡帕系數(shù)0.81。就單個睡眠時期分類準確率而言,兩個實驗中,清醒期和深睡期的分類準確率都超過90%。實驗結(jié)果驗證了本文算法的有效性和可靠性。
表1 Fpz ?Cz通道準確率與卡帕系數(shù)
表2 Pz ?Oz通道準確率與卡帕系數(shù)
將本文算法同文獻[18-21]中的算法進行比較,結(jié)果如表3 所示。由表3 可見,與文獻[18-21]中的算法相比,本文算法的準確率更高,算法結(jié)構(gòu)也更為簡單。
表3 不同算法的分類準確率比較
本文提出了一種基于頻譜能量值與統(tǒng)計分析的自動睡眠分期算法。使用db4 小波對EEG 信號去噪,傅里葉變換提取頻譜能量值特征,統(tǒng)計分析提取均值等特征,支持向量機分類,準確率達到86.82%,驗證了本文算法對睡眠分期的可行性和有效性。
本文的研究只是基于EEG。在今后的研究中,還應將其他的生物電信號引入睡眠分期的研究中,如EOG、EMG,進一步提升算法的分類準確率。