朱嘉誠 李穎潔 曹 丹 唐鶯瑩
(1. 上海大學通信與信息工程學院生物醫(yī)學工程研究所,上海 200444;2. 上海交通大學醫(yī)學院附屬精神衛(wèi)生中心腦電影像室,上海 200072)
抑郁癥是由各種原因引起的、常見的情感障礙疾病,主要臨床表現(xiàn)為與情緒相關的行為及認知等活動異常[1]。研究表明,抑郁癥患者的情緒認知存在一定偏差[2-3]。傳統(tǒng)的腦電線性分析研究發(fā)現(xiàn),與正常人相比,抑郁癥患者不同頻段中腦電功率的激活都存在異常[4]。但是,腦電作為典型的非線性時間序列[5],傳統(tǒng)線性分析的穩(wěn)定性和敏感性等均不盡如人意[6]。近二十年來,非線性分析方法逐步被應用到腦電分析中,例如“熵”就是測量復雜度的一個典型指標。Aftanas等應用非線性分析方法研究了受試者在不同情感刺激(正性、中性和負性)下的變化情況, 認為非線性分析相比線性分析對情感處理的細微方面更敏感[7]。但目前基于熵的抑郁癥腦電研究還存在一些問題,其中一個突出的問題是已有研究普遍關注的是全頻段的特性[8]。然而,這些全頻段的復雜度特性結果卻不統(tǒng)一。例如,有研究發(fā)現(xiàn)相比于正常人,抑郁癥患者的腦電復雜度下降[9]。另一些研究卻得出了相反的結論,認為由于抑郁癥患者負性情緒偏向導致腦電復雜度增加[10]。所以,需要更細致的研究。
為了解決或規(guī)避全頻段腦電復雜性結果不統(tǒng)一的問題,我們嘗試關注不同頻段腦電的復雜度。通常我們通過基于傅里葉變換的方法來獲取腦電某頻段信號,但是傳統(tǒng)的傅里葉變換要求系統(tǒng)必須是線性的,同時數(shù)據(jù)必須嚴格具有周期性或平穩(wěn)性[11]。針對非線性系統(tǒng),黃鄂等人在1998年提出了希爾伯特-黃變換[12],一種自適應的時頻分析方法[13]。他們通過一種經驗模式分解(empirical mode decomposition, EMD)方法,將復雜的信號分解為一些線性和平穩(wěn)的分量。研究表明,對于諸如腦電信號、心電信號這類非平穩(wěn),非線性的信號希爾伯特-黃變換有更好的應用效果[14-15]。提取的特征是否可以用于機器自動分類是檢驗特征魯棒性的一個有效方法。大部分的腦電信號分類研究在腦電特征提取時會選用信號的常規(guī)統(tǒng)計特征,如能量和功率譜密度。然而研究表明,針對大腦不同的活動,各腦區(qū)的活躍程度也不同[16]。而從不活躍的腦區(qū)中提取的特征,會包含許多冗余信息,從而可能影響腦電信號特征的分類結果。
同時,熵的具體計算方法也有很多種,它們各有特點。例如,研究表明近似熵可以作為腦電信號的一個特征來區(qū)分不同的腦部活動狀態(tài)[16];K-S熵允許通過信息生成率來分類不同狀態(tài)下的腦電活動[17],但容易受到噪聲影響,同時計算量大[18];樣本熵是由Richman等人在2000年提出的一種描述時間序列復雜度的度量參數(shù)[19]。相較于近似熵,樣本熵具有更好的精確度和魯棒性;同時樣本熵對于丟失數(shù)據(jù)不敏感,計算速度快。
針對抑郁癥患者在情緒加工中的腦電非線性特異性問題,本研究中我們采用希爾伯特-黃變換對原始腦電數(shù)據(jù)進行濾波獲取各頻段腦電,然后選取有特異性的腦電頻段計算樣本熵,進而分析比較抑郁癥患者的情緒加工與正常人之間的差異。最后再根據(jù)這些具有明顯差異的特征值分類正常人與抑郁癥患者,檢驗分類效果。
本實驗中,我們將受試者分成實驗組和對照組。實驗組中包括抑郁癥患者16名,其中男性6名,女性10名,平均年齡為37.75±14.19歲,平均受教育年限為12.06±2.91年,均為右利手。抑郁癥患者來自上海市精神衛(wèi)生中心的門診病人,均符合中國精神障礙分類與診斷標準(CCMD-3),無狂躁史;對照組中包括健康受試者14名,其中男性4名,女性10名,平均年齡為40.86±12.29歲,平均受教育年限為11.54±3.75年,均為右利手,沒有任何神經或精神病史。經過統(tǒng)計檢驗,兩組人在年齡和受教育年限上無統(tǒng)計學差異(見表1)。所有患者均未服藥或未服藥至少一個月,包括對照組的所有受試者都無藥物史和酗酒史,視力正?;蛘叱C正視力正常。在實驗前,所有受試者都經過了焦慮自評量表(self-rating anxiety scale,SAS)、抑郁自評量表(self-rating depression scale,SDS) 和漢密爾頓抑郁量表(Hamilton depression scale,HAMD) 的評定,對照組的評分在正常范圍內,表明無精神疾病,如表1所示[20]。所有受試者在實驗前均簽署了知情同意書,實驗結束后均給予受試者適當?shù)膱蟪?,實驗經過了上海市精神衛(wèi)生中心人類倫理委員會的批準。
表1 受試者自評量表
本實驗是根據(jù)Williams等人的心理物理實驗構建的[21]一個電生理的情緒面孔空間檢測任務。刺激圖片來源于Ekman情感數(shù)據(jù)庫[22],同一個人臉分別有三種情緒(積極的,消極的和中性的),每張面孔均沒有頭發(fā)、眼鏡、胡子,或其他面部配飾。所有圖片都使用Adobe Photoshop軟件編輯并轉換為灰度圖片。刺激圖片中,同一個人的六張面孔,其中五張為中性表情,另一張為帶有情緒的面孔(積極或消極)。這張情緒面孔隨機地出現(xiàn)在六邊形的六個頂點上。整個實驗包含4組,每組包含144張刺激圖片(即72個積極情緒,36個消極情緒,36個中性情緒),每張刺激圖片呈現(xiàn)時間為1500 μs,緊接著出現(xiàn)1000 μs的刺激間隔,此時電腦屏幕上呈現(xiàn)白色“+”號。然后,在屏幕中央單獨出現(xiàn)固定十字時,呈現(xiàn)1000 ms的刺激間隔(ISI)。實驗中的事件序列如圖1所示。實驗采用Go-Nogo范式,實驗程序由美國PST(Psychology Software Tools)公司的E-Prime 1.0軟件編寫。
圖1 實驗范式Fig.1 Experimental paradigm
實驗過程中,受試者舒適地坐在距離17英寸液晶顯示屏80厘米處,指示他們看著屏幕中央的”十”號,所有受試者被要求盡快盡準確的判斷是否有目標面孔出現(xiàn)并做按鍵反應。如果看到正性表情的面孔,要求他們按鍵“1”;如果看到負性表情的面孔,要求他們按鍵“5”。每組實驗之間有1分鐘的休息時間,整個實驗需要大約30分鐘。
實驗數(shù)據(jù)采集設備為德國Brain Productions(BP)公司的64 導高密度的腦電檢測儀; 記錄軟件采用該公司研發(fā)的Vision Recorder系統(tǒng); 數(shù)據(jù)預處理采用Vision Analyzer系統(tǒng)。本實驗從覆蓋整個頭皮的64個電極中去除了損壞的電極,最終選擇了59個電極,:Fp1,F(xiàn)pz,F(xiàn)p2,AF7,AF3,AF4,AF8,F(xiàn)7,F(xiàn)5,F(xiàn)3,F(xiàn)1,F(xiàn)z,F(xiàn)2,F(xiàn)4,F(xiàn)6,F(xiàn)8,F(xiàn)T7,F(xiàn)C5,F(xiàn)C3,F(xiàn)C1,F(xiàn)C2,F(xiàn)C4,F(xiàn)C6,F(xiàn)T8,T7,C5,C3,C1,Cz,C2,C4,C6,T8,TP7,CP5,CP3,CP1,CPz,CP2,CP4,CP6,TP8,P7,P5,P3,P1,Pz,P2,P4,P6,P8,PO7,PO3,POz,PO4,PO8,O1,Oz和O2,具體位置如圖2所示。數(shù)據(jù)記錄以鼻尖為參照,腦電信號的采樣頻率為1000 Hz,電極與頭皮間的接觸阻抗保持在5 kΩ以下。
圖2 腦電電極位置圖Fig.2 Electrode location
經過下面的預處理,我們便獲得了干凈的腦電信號:(1)使用BP公司的Vision Analyzer系統(tǒng)的眼電校正算法,將眼電偽跡去除;(2)對去除偽跡的數(shù)據(jù)進行0.05和100 Hz的帶通濾波;(3)將數(shù)據(jù)從刺激發(fā)生前200 μs到刺激后1000 μs進行分段,并且進行基線校正;(4)剔除偽跡大于100 μV 的數(shù)據(jù)段。最后將數(shù)據(jù)導出進入后續(xù)分析。
2.4.1 希爾伯特-黃變換
希爾伯特-黃變換包含兩個步驟:經驗模態(tài)分解和希爾伯特變換(Hilbert transform,HT)。通過EMD將信號分解成有限個內在模分量(intrinsic mode functions,IMF)和一個殘余信號,然后對得到的各個IMF分量進行希爾伯特變換。計算流程如圖3所示。
圖3 希爾伯特黃變換的流程圖Fig.3 Hilbert-Huang transform flowchart
本文中,設xi(t),(i=1,2,3,…,59)代表單個電極上的腦電信號,首先找到xi(t)的極大值和極小值,通過擬合,得到其上包絡Uix(t)和下包絡Lix(t),以及上下包絡的均值mi1(t)。然后,從xi(t)中減去均值mi1(t),得到第一個分量hi1(t)。
要判斷hi1(t)是否是一個真正的IMF分量,需要滿足兩個條件:(1)hi1(t)的極值點包括極大值和極小值,與過零點的數(shù)目相等,或不超過1個。(2)均值線的均值要趨于0。
如果不滿足這兩個條件,再次重復上述步驟直至其滿足條件。最終得到的hi1k(t)可以被認為是第一個IMF分量C1。然后將xi(t)中減去C1,從而得到殘余信號ri1(t)。重復計算,直至將最后的IMF分量分離出來。
因此,xi(t)可表示成以下公式(1):
(1)
其中,rin(t)表示最終的殘余信號,EMD分解的終止條件是當殘余信號是一個單調函數(shù),即找不到極值點時,分解完成。因此它是一個常數(shù)或者單調函數(shù),表示了單通道腦電信號xi(t)的趨勢變化。
通過EMD分解得到有限多個IMF分量后,第二步是對每一個IMF分量做希爾伯特變換,來找到信號的幅值-時間-頻率分布,也稱為希爾伯特譜。
首先,對每個IMF做希爾伯特變換,表示為公式(2):
(2)
(3)
解析信號的實部為各個IMF信號,虛部為經過希爾伯特變換后的信號。其中,ak(t)表示IMF分量ck(t)的瞬時幅值,?k(t)表示IMF分量ck(t)的瞬時相位。
從而,可以得出各個IMF分量ck(t)的瞬時頻率的公式(4):
ωk(t)=dθk(t)/dt
(4)
根據(jù)上述希爾伯特-黃變換的理論,我們在實驗中計算得出了各個IMF分量的瞬時頻率后,將單通道腦電信號劃分成了四個頻段,分別是:δ(1~4 Hz)、θ(4~8 Hz)、α(8~13 Hz)、 β(13~30 Hz),應用于后續(xù)的數(shù)據(jù)分析處理。
2.4.2 樣本熵
樣本熵是根據(jù)近似熵的算法進行改進得出的,本文用SampEn(m,r,N)來表示,其中N表示序列的長度,r表示相似容限,m表示維數(shù)。具體計算過程如下:
首先,將原始單通道腦電信號序列按特定順序組成一組m維的矢量:
X(i)=[x(i),x(i+1),…,x(i+m-1)],
i=[1,N-m+1]
(5)
定義X(i)與X(j)之間的距離dij為兩者對應元素中差值的最大值:
dij=max0-m-1|x(i+k)-x(j+k)|
(6)
(7)
然后再對i做平均,記為Bm(r)
(8)
把維數(shù)m加一,變?yōu)閙+1,重復上述公式(5)~(8),得到Am(r)。
因此,最終的樣本熵定義為:
(9)
從公式(9)可以發(fā)現(xiàn),樣本熵的值與參數(shù)m,r,N的選擇有關,根據(jù)文獻[23],在本研究中我們選取的參數(shù)值為N=Xi(t),m=2,r=0.2SD,按照此參數(shù)值計算得到的樣本熵具有較為合理的統(tǒng)計特性。
本實驗采用軟件SPSS 22.0進行統(tǒng)計分析,運用重復測量方差分析方法。組內因素為面孔表情(正性/負性),腦區(qū)域(額區(qū)/中央區(qū)/頂區(qū)/枕區(qū)),腦半球(左/右); 組間因素為組別(抑郁癥組/正常組)。若存在交互效應,則進行簡單效應分析。統(tǒng)計結果P值若小于0.05,則認為存在顯著性差異;如果P值在0.05到0.10之間,則認為存在差異性趨勢。
本文針對小樣本數(shù)據(jù),選擇支持向量機、K-近鄰算法、決策樹算法作為分類器,根據(jù)統(tǒng)計分析得出明顯差異的樣本熵特征送入分類器進行分類,比較各分類器對于本數(shù)據(jù)集的應用效果。
本數(shù)據(jù)集包括16名抑郁癥患者和14名正常人,以2/3的樣本作為訓練集,1/3的樣本作為測試集,最終19個樣本作為訓練集,11個樣本作為測試集。
支持向量機(SVM)的核心思想是通過使用核函數(shù)將低維空間線性不可分的樣本轉化為高維特征空間使其線性可分,并在特征空間中構建出最優(yōu)分割超平面。它在很大程度上解決了過擬合、非線性和維災等問題。
K-近鄰算法(KNN)通過計算不同特征值之間的距離作為各個樣本之間的非相似指標,一般使用歐氏距離。它的分類思路是如果一個測試樣本與特征空間中的K個最相似(即歐氏距離最近)的樣本中的大多數(shù)屬于某一類別,則該樣本也屬于這個類別。該算法需要已知訓練集中數(shù)據(jù)和標簽,并且不需要訓練模型,具有計算量小的優(yōu)點。
決策樹算法一般由兩個步驟來實現(xiàn),首先通過訓練集進行訓練來生成一個決策樹,進而建立決策樹結構。然后通過使用生成的樹來實現(xiàn)對輸入的測試樣本進行分類,對輸入的測試樣本,從根節(jié)點位置依次測試樣本的屬性,通過對比選擇合適的樹支,直到到達某個葉結點,從而得到該測試樣本的類別。
已有研究表明,β頻段與外部刺激和情緒認知反應顯著相關[24]。具有高比例β頻段的人思考快速,感到興奮,并處于高認知功能狀態(tài)[25]。在我們的研究中,盡管做了全頻段的分析,但最終我們的發(fā)現(xiàn)集中在β頻段上。具體地, 針對16名抑郁癥患者和14名健康受試者在β頻段的樣本熵數(shù)據(jù),分別進行均值和標準差的計算,并進行比較分析。結果顯示,抑郁癥患者呈現(xiàn)出顯著低于正常人的腦電樣本熵。樣本熵的值反映了腦電信號的隨機性[17]。樣本熵越高,代表神經動力學的規(guī)律性越小,隨機性越大[26]。研究表明,相比于情感障礙的患者,正常人的腦部活動具有不規(guī)則性[27],和更高的復雜性[28]。重復測量方差分析顯示,β活動呈現(xiàn)出顯著的區(qū)域主效應(F=14.390,P=0.001),以及區(qū)域與組的交互效應(F=4.533,P=0.024)。進一步固定區(qū)域做簡單效應分析,對于健康對照組,不同情緒刺激影響下的腦電樣本熵具有差異性趨勢(頂區(qū)F=4.257,P=0.060,枕區(qū)F=3.898,P=0.070),正性情緒刺激和負性刺激相比,誘發(fā)出更高的腦電樣本熵。但對于抑郁癥患者組的腦電樣本熵沒有顯著差異,這也證實抑郁癥患者對不同情緒的認知功能存在缺陷。表2給出了相關的簡單效應分析結果。
表2 不同腦區(qū)的腦電樣本熵的組間差異
同時,分析發(fā)現(xiàn),在正性面孔刺激下,顯示出區(qū)域的主效應(F=17.483,P=0.001),以及區(qū)域與組的交互效應(F=6.832,P=0.002)。分別對各腦區(qū)進行進一步分析,發(fā)現(xiàn)在大腦的中央區(qū)的腦電信號樣本熵上具有顯著組間差異(F=13.477,P=0.001),與正常人相比,抑郁癥患者在大腦的中央區(qū)的腦電樣本熵更低。(參見表3)。可見抑郁癥患者中后部腦區(qū)情緒加工確實存在異常[29-31]。
表3 正性情緒刺激下的組間差異
我們的研究結果表明抑郁癥患者對于正性情緒的加工出現(xiàn)了異常。許多研究表明,抑郁癥對負性情緒有認知偏向[19],抑郁癥患者更容易對負性情緒進行加工,對于負性情緒面孔的認知優(yōu)于正性情緒面孔[32]。在我們的研究中表現(xiàn)在其腦電樣本熵上明顯低于正常人,證實了抑郁癥患者認知正性情緒刺激的能力低于正常水平。
通過希爾伯特黃變換,首先得到每個電極的樣本熵,根據(jù)左額區(qū)(F3,F7)、右額區(qū)(F4,F(xiàn)8)、左中央區(qū)(C1,C3)、右中央區(qū)(C2,C4)、左頂區(qū)(P3,P7)、右頂區(qū)(P4,P8)、左枕區(qū)(O1)和右枕區(qū)(O2),將同一區(qū)域的電極樣本熵做平均,從而得到8個區(qū)域、4個頻段、2種情緒任務共64個樣本熵特征向量。經過重復測量方差分析得出抑郁組與正常組在β頻段具有明顯差異,于是選擇β頻段上各腦區(qū)的樣本熵特征,一共16個。將全頻段64個特征與β頻段16個特征分別送入三種分類器中,識別準確率如表4所示。
本研究的結論表明,抑郁癥患者與正常人腦電樣本熵存在顯著差異,可見腦電樣本熵是一種潛在的可用作抑郁癥患者分類的度量指標。根據(jù)表4的結果可見,通過本文統(tǒng)計分析后得到的具有明顯差異的特征值對分類準確率的提升有很大的幫助。統(tǒng)計結果表明所篩選出的β頻段各腦區(qū)樣本熵特征在兩類人群中具有明顯差異,此結論極大地消除了腦電信號中大量的冗余信息,為分類識別提供了更準確的特征,同時降低了訓練模型和分類的計算時間。本研究結果還顯示對于小樣本量的數(shù)據(jù)集,支持向量機算法相比K近鄰、決策樹算法具有更好的識別準確率,計算時間更短。能夠在保證降低誤診率的同時,極大節(jié)省計算機輔助診斷的等待時間。
此外,我們還比較了基于小波變換提取的樣本熵與基于希爾伯特黃變換提取的樣本熵的分類效果。本文選取db5小波函數(shù)對整段腦電信號進行分頻處理,根據(jù)各腦區(qū)的劃分,得到16個樣本熵特征。分類結果如表5所示。
表4 基于不同特征數(shù)的分類結果
表5 基于不同分頻方法的分類結果
從表5結果得出,基于希爾伯特黃變換的提取特征的方法時間復雜度遠遠小于基于小波變換的方法,在同等運行條件下的實際運算時間也更短。同時結合希爾伯特黃變換和樣本熵的分類準確率也遠高于小波變換結合樣本熵的分類準確率。本研究結果一定程度證明了希爾伯特黃變換能夠保留更豐富的腦電信號的非線性復雜度特征,刻畫出腦電信號的局部信息。
本研究結果顯示抑郁癥患者在做正性情緒刺激任務下,在大腦中央區(qū)上具有低于正常對照組的樣本熵,提示抑郁癥患者在正性情緒的加工上存在缺陷,為抑郁癥的發(fā)病機制提供了電生理證據(jù)。此外,本文所應用的基于希爾伯特黃變換的樣本熵特征,經過本實驗驗證,可以有效區(qū)分正常人與抑郁癥患者,在深入研究的基礎上,有望用于抑郁癥患者的分類識別,為醫(yī)生診斷抑郁癥提供一種可行的輔助方案。