王若凡,王浩東,石連栓
天津職業(yè)技術(shù)師范大學(xué) 信息技術(shù)工程學(xué)院,天津 300022
癲癇(EP)是一種慢性神經(jīng)系統(tǒng)疾病,其特征是大腦神經(jīng)元的陣發(fā)性異常放電[1]。根據(jù)最新流行病學(xué)數(shù)據(jù),全球約有6 500萬人受癲癇影響,近30%的患者無法通過抗驚厥藥物和手術(shù)控制[2]。癲癇發(fā)作的不可預(yù)測可能會對患者的大腦造成永久性損傷,并因癲癇發(fā)作期間身體失控而造成意外傷害。腦電圖(EEG)作為一種監(jiān)測電生理活動的技術(shù),已被證明是研究大腦功能的有效工具,具有無創(chuàng)性和高時間分辨率[3-4]。癲癇患者在發(fā)作狀態(tài)下會在頭皮腦電圖顯示振幅急劇增加與尖波、棘波或棘(或尖)慢波復(fù)合物,被認為是臨床檢測癲癇發(fā)作的有效手段[5-6]。然而,手工挑選癲癇腦電繁瑣、耗時且存在主觀因素影響[7-11]。因此,有必要尋找客觀且有效的特征來自動識別癲癇,達到臨床輔助診斷的目的。
近年來,將復(fù)雜網(wǎng)絡(luò)理論、圖論方法與非線性同步分析應(yīng)用到多維EEG信號分析,刻畫大腦神經(jīng)元、神經(jīng)元集群、腦區(qū)之間在各種時間-空間尺度上相互協(xié)調(diào)、相互作用,挖掘不同腦區(qū)之間的耦合關(guān)系及腦網(wǎng)絡(luò)拓撲結(jié)構(gòu)的變化規(guī)律,成為神經(jīng)疾病自動診斷的研究熱點[12-13]。復(fù)雜網(wǎng)絡(luò)是一種以節(jié)點和邊描述復(fù)雜系統(tǒng)中多個對象的相互關(guān)系,并利用圖論的相關(guān)理論將網(wǎng)絡(luò)中的復(fù)雜關(guān)系以數(shù)學(xué)公式進行量化的方法[14]。同步性是非線性科學(xué)、神經(jīng)科學(xué)研究領(lǐng)域中的重要量化方法之一,可度量多維EEG 信號之間神經(jīng)同步[15]。其中,相位同步指數(shù)(PSI)作為一種非線性量化指標,可以有效地量化信號瞬時相位之間的關(guān)系[16-17]。Cai等[18]構(gòu)建PSI網(wǎng)絡(luò)并將其應(yīng)用于阿爾茨海默癥檢測上,發(fā)現(xiàn)阿爾茨海默癥患者腦網(wǎng)絡(luò)連接異常,小世界屬性削弱。研究表明,基于復(fù)雜網(wǎng)絡(luò)的腦功能網(wǎng)絡(luò)參數(shù)(特征)相比于單通道信號特征,能更有效捕捉神經(jīng)元異常陣發(fā)性異常放電的協(xié)同作用[12,19]。且多特征進行組合有助于多角度全方位展示腦電異常,提升識別效率。Pei 等[20]利用表示通道內(nèi)信息和通道間信息的特征進行組合對EEG多類工作負載進行分類,結(jié)果發(fā)現(xiàn)相比于單特征,特征組合提高了分類準確率。Mahato等[21]將α、α1、α2、β、δ和θ功率以及θ不對稱性作為特征進行組合對抑郁癥患者EEG 進行識別,結(jié)果發(fā)現(xiàn)α2 和θ 不對稱性特征的組合在SVM 中顯示了最高的分類精度,達到了88.33%。Narayan[22]提取了AAR 參數(shù)、Barlow 參數(shù)、Hjorth 參數(shù)等8 個特征進行組合并作為向量輸入到SVM等三類分類器進行運動腦電信號識別,研究發(fā)現(xiàn),特征組合與SVM結(jié)合的方法分類精度最高,為98.8%。本課題組前期研究中,將網(wǎng)絡(luò)拓撲特征與時頻特征結(jié)合,發(fā)現(xiàn)特征組合可提高阿爾茨海默癥的識別準確率[23-25]。因此,將特征進行組合也為癲癇腦電信號的識別提供了新思路。
特征選擇通過消除或減少不相關(guān)且冗余的特征,確定最佳特征子集,即跨越類的不同屬性的一組互補特征,有助于提高分類系統(tǒng)的性能[26]。在特征組合過程中,隨著特征數(shù)量的增多,大量相關(guān)、不相關(guān)且冗余的特征會增加搜索空間,導(dǎo)致出現(xiàn)“維度災(zāi)難”[27]。而手工篩選特征,耗時、費力且無法保證準確性[28]。因此,引入粒子群優(yōu)化算法進行特征子集的自動尋優(yōu),粒子群優(yōu)化算法(PSO),Eberhart 和Kennedy[29]于1995 年提出,啟發(fā)于鳥類群集捕食的動物社會行為,是一種基于進化方式的穩(wěn)健隨機啟發(fā)式優(yōu)化方法[30-31],具有原理和結(jié)構(gòu)簡單、調(diào)節(jié)參數(shù)少、搜索速度快等優(yōu)點[32],常用于在多維數(shù)據(jù)集中進行特征選擇。Yadva等[33]提出一種新的基于濾波器的特征選擇技術(shù),并采用PSO 算法來確定最佳特征組合,發(fā)現(xiàn)PSO 能有效對特征集進行降維,且提高性能。Akbari等[34]構(gòu)建PSO算法與SVM分類器相結(jié)合的分類框架,對34 個空間特征進行特征篩選,可快速、準確地識別抑郁癥患者EEG 信號,準確率高達99.3%。然而,PSO 算法具有一定的局限性,容易陷入局部最優(yōu),并且存在局部搜索能力差、搜索精度低等缺點[35]。而遺傳算法(GA)通過選擇、交叉、變異三大操作算子可以增加種群的多樣性,擴大解搜索空間,可避免陷入局部最優(yōu)[36],但因過度依賴這三個算子使得GA 算法整體粒子群收斂速度減慢[37]。因此,在PSO算法基礎(chǔ)上引入GA算法,可進一步提升算法性能,實現(xiàn)快速收斂和種群高度多樣性[38-39]。
綜上,本文基于復(fù)雜網(wǎng)絡(luò)理論和PSI算法,在delta、theta、alpha、beta 四個子頻帶下構(gòu)建癲癇患者大腦功能網(wǎng)絡(luò),提取多重網(wǎng)絡(luò)拓撲特征,并進行支持向量機(SVM)分類分析;基于進化算法的優(yōu)勢,采用GA-PSO 算法作為特征選擇技術(shù),將其應(yīng)用于癲癇腦電網(wǎng)絡(luò)特征的選取上,實現(xiàn)對單頻帶以及交叉頻帶下特征組合的優(yōu)化與篩選,尋找最優(yōu)特征組合,提高癲癇患者EEG信號識別的分類準確率。
實驗分為EP患者組和正常對照組兩組,其中EP病人37例,正常人33例,均來自河北省唐山市工人醫(yī)院神經(jīng)內(nèi)科。患者病例均為EP 大發(fā)作,具體癥狀表現(xiàn)為右側(cè)頂中后顳持續(xù)大量中高幅尖波尖慢。此外,本實驗中所有被試在實驗前均已被告知完整的實驗流程,確保本人自愿參加實驗的情況下,由其本人或法律代表簽署了知情同意書。
實驗使用19 通道腦電圖監(jiān)測系統(tǒng)(采樣頻率為256 Hz,硬件濾波器的濾波范圍為0.5~100 Hz)進行EEG 記錄和采集,連續(xù)持續(xù)10 min。數(shù)據(jù)分析前,從每位被試的EEG 信號中截取發(fā)作時長為8 s 的數(shù)據(jù)(數(shù)據(jù)長度為256×8=2 048個采樣點),正常人和癲癇患者FP2通道腦電數(shù)據(jù)如圖1所示。采用0~30 Hz的有限沖擊響應(yīng)(finite impulse response,F(xiàn)IR)帶通濾波器分別對每段數(shù)據(jù)進行預(yù)處理,通過小波變換將EEG 信號分解為四個子頻帶:delta(0~4 Hz,δ)、theta(4~8 Hz,θ)、alpha(8~15 Hz,α)、beta(15~30 Hz,β)。
圖1 正常人和EP患者EEG信號(FP2通道)Fig.1 EEG signals of normal subjects and epileptic patients(channel FP2)
相位同步方法可用于分析大腦皮層不同區(qū)域之間的信息交互機制,通常使用相位同步指數(shù)(PSI)來量化EEG 通道間的瞬時相位同步性,以此構(gòu)建EP 組和對照組的大腦功能網(wǎng)絡(luò)。
原始各通道EEG數(shù)據(jù)設(shè)為實值信號x(t),對所有通道的腦電信號進行希爾伯特變換,記為(t):
其中,p·v表示用柯西主值定義變換。
瞬時振幅A(t)和瞬時相位φ(t)可由以下公式計算:
定義信號X和Y之間的相位差為:
其中,fm和fn分別是信號X和Y的中心頻率,且m和n是滿足條件m·fn=n·fm的整數(shù)。當存在fm和fn且fm=fn的頻帶內(nèi)耦合時,設(shè)置m=n=1,并計算此時的相位差。則PSI可以定義為:
相位同步指數(shù)定義了兩列腦電通道之間的相位變化。PSI取值范圍在[0,1]之間,數(shù)值越大則表示兩列信號之間的相位差波動越小,表明兩通道信號之間同步性越強[40]。
“節(jié)點”和“邊”是構(gòu)成圖的兩個重要概念?;趫D論的方法將每一個腦電通道作為“節(jié)點”,將通道與通道之間的PSI作為“邊”,從而構(gòu)建腦網(wǎng)絡(luò),進而進行復(fù)雜腦網(wǎng)絡(luò)分析。復(fù)雜腦網(wǎng)絡(luò)分析中最常用的度量包括兩類,其中一類是針對節(jié)點與邊屬性的;另一類是針對網(wǎng)絡(luò)總體結(jié)構(gòu)和功能屬性的,主要衡量網(wǎng)絡(luò)的小世界屬性。本文依據(jù)參考文獻[41-43],提取15個網(wǎng)絡(luò)特征,詳細含義如表1所示。其中,前7個特征為節(jié)點和邊特征,描述網(wǎng)絡(luò)的節(jié)點緊密度與連接強度等特性,后8個為結(jié)構(gòu)和功能特征,刻畫網(wǎng)絡(luò)的整體結(jié)構(gòu)層次和復(fù)雜程度。
表1 網(wǎng)絡(luò)特征含義Table 1 Explanation of network features
單因素方差分析(one-way ANOVA)是在保證其余因素保持不變的前提下,通過單因素實驗數(shù)據(jù)分析單因素A 對其觀察是否存在顯著影響。設(shè)原假設(shè)H0:u1=u2=…=ui,其中H1:u1,u2,…,ui不全相等,如果H0成立,說明因素A 的i個平均值相同,則稱因素A 差異不顯著,反之,如H1成立則稱因素A 差異顯著[44]。采用ANOVA 對EP 組與對照組的腦網(wǎng)絡(luò)拓撲特征進行統(tǒng)計分析,研究組間差異。一般情況下,ANOVA 返回值P<0.05 表明EP組與對照組之間存在差異,而P<0.01則表明存在顯著性差異。
由于不同的網(wǎng)絡(luò)拓撲特征物理含義有所不同,并且互相之間存在一定聯(lián)系[45]。此外,同一特征在不同子頻帶下的表現(xiàn)各不相同,頻帶之間存在耦合[46]。因此,考慮將多重網(wǎng)絡(luò)特征進行組合,探究不同特征組合在單頻帶以及交叉頻帶下的信息交互,將組合的特征向量輸入到SVM分類模型進行EP組與正常對照組的分類分析,其中SVM 類型為C-SVC,核函數(shù)為徑向基(radial basis function,RBF)。
然而,當進行頻帶交叉組合時,四個頻帶(每個頻帶15個特征,共計4×15=60個特征)可能產(chǎn)生260種特征組合,人工無法高效完成特征篩選和組合。因此,引入PSO以及改進的結(jié)合算法GA-PSO,自動篩選并優(yōu)化腦網(wǎng)絡(luò)的最優(yōu)特征組合,從而提高EP 組和正常組的分類精度。其中GA-PSO 算法流程圖如圖2 所示,具體算法流程如下:
圖2 GA-PSO算法流程圖Fig.2 Flowchart of GA-PSO
首先,將特征進行順序排列,按照delta(δ)、theta(θ)、alpha(α)、beta(β)頻帶由低頻到高頻的順序排布,每個子頻帶下,15特征按照表1的順序進行排布,第1個是DG 特征,第15 個代表GIC 特征。在文獻[29-34]中,粒子群大小設(shè)置30至幾百不等,其中,種群很小時容易陷入局部最優(yōu),但是當種群數(shù)目增長到一定數(shù)值時,算法的尋優(yōu)性能將不再提升,優(yōu)化結(jié)果達到收斂。因此根據(jù)本文260種特征組合,初始粒子群大小設(shè)置為100,在SVM分類器里每個粒子個體由長度為15~60位(單頻帶15位,雙頻帶30位,三頻帶45位,四頻帶60位)的0-1位點組成,其中1表示該特征被選中,0表示該特征未被選中。例如,單頻帶下的特征組合用粒子[010010000000100(δ)]表示選取擇delta 頻帶的第2 個(NB)、第5 個(EB)以及第13個(HR)特征進行組合。
接下來,將選取的初始特征輸入到GA-PSO算法中,設(shè)置算法總迭代次數(shù)為100。Manasrah 等[47]在GA-PSO算法前50%迭代使用GA,而后50%迭代使用PSO,證實該結(jié)合方法可以增加先通過GA算法增加種群多樣性,而后通過PSO達到快速收斂尋找最優(yōu)粒子,在復(fù)雜以及多維度問題具有良好的優(yōu)化能力。因此,本文在解決腦網(wǎng)絡(luò)特征組合尋優(yōu)問題上,采用GA和PSO各占50%迭代的GA-PSO 算法,即各迭代優(yōu)化50 次。第一階段中,GA通過選擇、交叉和變異三大操作算子傳遞粒子個體,進行種群更新。本文中選擇算子通過輪盤賭選擇和精英保留策略從一組個體中選擇出最佳的個體;交叉算子通過單點交叉改變每兩條染色體(粒子個體)內(nèi)基因的位置來產(chǎn)生新的個體,交叉率0.8;變異算子是使交叉算子生成的新個體且具有比現(xiàn)有個體更好的適應(yīng)度值,變異率為0.01。通過GA 迭代優(yōu)化,可以提高粒子群的多樣性,避免算法在尋優(yōu)過程中陷入局部最優(yōu)。第二階段中,PSO算法第一次迭代時的初始個體即為第50次GA優(yōu)化后的粒子輸出。而后在每次PSO迭代中,個體的速度和位置基于全局最優(yōu)位置gBest和粒子個體最優(yōu)位置pBest進行更新,更新公式如下:
首先,通過PSI算法在四個子頻帶下構(gòu)建腦功能網(wǎng)絡(luò),并計算其平均網(wǎng)絡(luò)連接,如圖3 所示。結(jié)果發(fā)現(xiàn)與對照組相比,EP患者組在δ、θ和β頻帶下的網(wǎng)絡(luò)連接更加稠密,表明EP是一種大腦異常放電的疾病。
圖3 四個子頻帶下正常對照組與EP組腦網(wǎng)絡(luò)Fig.3 Brain network of normal control and EP groups in four frequency bands
接下來,在四個子頻帶下,分別提取EP組和正常對照組腦網(wǎng)絡(luò)的拓撲特征,分別是:度(DG)、介數(shù)(NB)、聚類系數(shù)(CC)、最短路徑長度(SPL)、邊介數(shù)(EB)、全局效率(GE)、局部效率(LE)、傳遞性(TS)、同配性(AT)、小世界系數(shù)(SW)、模塊度(MD)、模體Z 分數(shù)(MZ)、層級系數(shù)(HR)、網(wǎng)絡(luò)熵(NE)、圖指數(shù)復(fù)雜度(GIC),并采用單因素方差分析(one-way ANOVA)研究EP組與正常對照組的腦網(wǎng)絡(luò)特征差異性,結(jié)果如圖4所示,其中圖4(a)表示的是網(wǎng)絡(luò)節(jié)點與邊特征,圖4(b)表示的是結(jié)構(gòu)和功能特征。當ANOVA的返回值P<0.05時用“*”表示,而P<0.01 時用“**”表示,詳細ANOVA結(jié)果的P 值如表2 所示,其中圖和表中的特征都用英文縮寫表示。為方便在圖里統(tǒng)一展示,將計算結(jié)果歸一化處理,因此所有特征值均在(0,1)之間。
表2 ANOVA結(jié)果(P值)Table 2 ANOVA results(P-value)
圖4 特征可視化Fig.4 Feature visualization
首先,在δ頻帶下,由圖4(a)和表2可知,EP組合與對照組的DG、NB和CC特征存在差異,相比對照組,EP組腦網(wǎng)絡(luò)的DG、CC、GE 和LE 特征升高,表明δ 頻帶下的EP腦網(wǎng)絡(luò)節(jié)點更緊密,網(wǎng)絡(luò)傳遞所消耗的能量更高;而EP組腦網(wǎng)絡(luò)的NB、SPL和EB特征降低,表明其腦網(wǎng)絡(luò)雖然密集,但是hub節(jié)點變少且節(jié)點之間傳輸效率降低。從圖4(b)和表2可知,HR、TS、MD、MZ和NE特征存在組間差異,其中后四個差異顯著。相比對照組,EP組腦網(wǎng)絡(luò)的TS、AT 和GIC 特征升高,表明EP 腦網(wǎng)絡(luò)的復(fù)雜性變高;而SW、MD、MZ、HR和NE特征卻降低,表明EP腦網(wǎng)絡(luò)小世界屬性和層次結(jié)構(gòu)降低且更混亂。其次,在θ 頻帶下,由圖4(a)可知,EP 組與對照組的DG、NB、GE 和LE 特征存在組間差異,其值變化呈現(xiàn)與δ 頻帶一致的結(jié)果。從圖4(b)可知,AT、MD、MZ、NE 特征存在組間差異,其中最后一個差異顯著。相比對照組,EP 組腦網(wǎng)絡(luò)的TS 和GIC 特征升高;而AT、MD、MZ 和NE 特征降低。EP 腦網(wǎng)絡(luò)的變化趨勢與δ 頻帶基本一致。再次,在α頻帶下,由圖4(a)可知,EP組與對照組的GE和LE特征存在組間差異,且DG、CC、SPL、GE和LE特征值變化呈現(xiàn)與δ和θ頻帶相反的結(jié)果,表明EP腦網(wǎng)絡(luò)更稀疏且信息傳遞效率降低;從圖4(b)可知,MZ 和SW特征存在組間差異,其中后者差異顯著,除了HR和GIC 特征,其他結(jié)構(gòu)與功能特征值變化呈現(xiàn)與δ 頻帶一致的結(jié)果。最后,在β頻帶下,由圖4(a)可知,EP組與對照組的DG、SPL 和GE 特征存在組間差異,其中后兩個差異顯著,DG、NB、SPL、EB和GE特征值變化呈現(xiàn)與δ、θ頻帶一致的結(jié)果,而CC和LE特征值的降低表明EP網(wǎng)絡(luò)局部聚集性降低;從圖4(b)可知,SW、NE、AT、MD、MZ 和GIC 特征存在組間差異,其中后四個差異顯著。相比對照組,EP組腦網(wǎng)絡(luò)僅GIC特征升高,其他結(jié)構(gòu)與功能特征降低,而TS值的降低表明EP網(wǎng)絡(luò)信息傳遞能力降低。
整體來看,δ、θ和β頻帶較好,在這三個頻帶下大部分特征存在組間差異,例如DG、MD、MZ、NE特征,其中EP組的DG特征值比對照組高,后三個特征值比對照組低。此外,GE與GIC雖然僅在β頻帶存在顯著性差異,但與DG 特征呈現(xiàn)相同的趨勢,都是EP組高于正常組。在四個頻帶下,NB、EB、SW、MD、MZ、NE 特征均呈現(xiàn)出EP組值低于對照組,DG、SPL、GE、GIC在α頻帶呈現(xiàn)出與其他頻帶相反的趨勢。以上結(jié)果表明,EP 在不同特征與子頻帶上的表現(xiàn)各不相同,因此,應(yīng)充分考慮特征與頻帶這兩個因素對EP腦電信號識別效果的影響。
為了進一步研究EP組和正常對照組EEG信號的特征差異,采用SVM 進行分類分析。每組實驗均對訓(xùn)練數(shù)據(jù)采用10折交叉驗證,訓(xùn)練集和測試集的比例是8∶2。為避免偶然性,實驗重復(fù)100次,分類結(jié)果以100次平均值表示,如表3所示。在四個子頻帶下平均準確率最高可達0.656、0.703 5、0.646 4 和0.611 2,分別對應(yīng)的特征是GIC、EB、DG和MZ。此外,四個頻帶分別有4、5、9、9個特征的分類準確率小于0.5,無法有效區(qū)分EP組和對照組??梢姡谒膫€子頻帶下,特征的分類表現(xiàn)各不相同,且大部分特征不具備區(qū)分功能。因此,將特征進行組合分析,聚合特征優(yōu)勢顯得尤為重要。
表3 四個子頻帶下特征的平均分類準確率Table 3 Average classification accuracy of features in four frequency bands
3.3.1 算法測試
為了驗證GA-PSO算法避免陷入局部最優(yōu)的能力,采用Ackley 和Rosenbrock 函數(shù)進行測試,其中Ackley主要用以測試算法的收斂率,Rosenbrock主要用于評價優(yōu)化算法的尋優(yōu)精度[48]。為避免偶然性,實驗進行100次,并以100 次結(jié)果中g(shù)Best適應(yīng)度值的變化為主要研究對象,其結(jié)果如圖5 所示,綠色線表示GA 算法,藍色線表示PSO 算法,紅色線表示GA-PSO 算法,所有測試函數(shù)均以最小值為最優(yōu)值,因此值越低優(yōu)化能力越好。由圖5(a)可知,GA 和GA-PSO 算法均能快速收斂找到最優(yōu)值,優(yōu)于普通PSO。而在圖5(b)中,GA-PSO 算法的尋優(yōu)精度高于GA 和PSO 算法。以上結(jié)果說明GAPSO算法比GA和PSO算法收斂速度快、尋優(yōu)精度高。
圖5 算法測試Fig.5 Algorithm test
3.3.2 單頻帶特征組合分類結(jié)果
本小節(jié)首先采用PSO 和GA-PSO 兩種算法對單頻帶下的15 個特征結(jié)合產(chǎn)生的特征組合進行篩選,實驗仿真進行100次。最低分類準確率、最高分類準確率以及平均分類準確率如表4所示。100次中最高準確率所對應(yīng)的特征組合如表5所示。由結(jié)果發(fā)現(xiàn),在PSO算法中,四個子頻帶下特征組合的平均分類準確率最高出現(xiàn)在α頻帶,為0.764 9;最低出現(xiàn)在β頻帶,為0.703 9。在GA-PSO算法中,四個子頻帶下特征組合的平均分類準確率最高出現(xiàn)在δ 頻帶,為0.768 0;最低出現(xiàn)在β 頻帶,為0.704 8??梢园l(fā)現(xiàn)四個子頻帶下的特征組合分類準確率均高于單特征,且GA-PSO 在δ、θ、β 頻帶下特征組合的平均分類準確率優(yōu)于PSO。此外,PSO 和GA-PSO兩種算法篩選的最高分類準確率都呈現(xiàn)δ頻帶>α頻帶>θ頻帶>β頻帶。兩種算法在δ頻帶對應(yīng)的特征組合分別為[GE-MD-MZ-NE]、[SPL-MZ-NE-GIC],其中GE、SPL、GIC 特征沒有組間差異(圖4 和表2),而將特征進行組合后,分類性能提高。
表4 單頻帶下PSO和GA-PSO算法尋優(yōu)結(jié)果Table 4 Optimization results of PSO and GA-PSO in single frequency band
表5 單頻帶下最優(yōu)特征組合Table 5 Optimal feature combination in single frequency band
3.3.3 交叉頻帶特征組合分類結(jié)果
由上述結(jié)果可知,相同特征在不同頻帶下的分類準確率不同,并且不同頻帶下的最高分類準確率也不相同,因此,應(yīng)用PSO 和GA-PSO 算法篩選最優(yōu)特征組合來進一步分析交叉頻帶組合下不同特征的組合對分類準確率的影響。實驗仿真進行100 次,最低分類準確率、最高分類準確率以及平均分類準確率如表6 所示,其中雙頻帶組合有δ-θ、δ-α、δ-β、θ-α、θ-β 和α-β 六種,三頻帶組合有δ-θ-α、δ-θ-β、δ-α-β、θ-α-β 四種,四頻帶組合僅有δ-θ-α-β一種。單頻帶與交叉頻帶下最高準確率對應(yīng)的ROC曲線如圖6所示,橫軸是假陽率(false positive rate,F(xiàn)PR),縱軸是真陽率(true positive rate,TPR)。
表6 交叉頻帶組合下算法尋優(yōu)結(jié)果Table 6 Algorithm optimization results of cross-band combination
圖6 單/多頻帶最優(yōu)特征組合的ROC曲線分布Fig.6 ROC curve distribution of optimal feature combinationin single/multi-band
由表6 可知,PSO 和GA-PSO 算法篩選出的特征組合平均準確率都已超過0.81,可有效區(qū)分EP 組和正常對照組,且在任意的交叉頻帶下GA-PSO算法得到的平均準確率均高于PSO算法,這是因為GA的引入可提高種群的多樣性,增加算法尋優(yōu)的可能性,能在維度更高更復(fù)雜的解空間尋優(yōu)。此外,不同交叉頻帶下的分類準確率不同。在GA-PSO算法中,雙頻帶交叉得到的平均分類準確率區(qū)間為[0.822 9,0.859 4],三頻帶為[0.864 8,0.908 8],四頻帶交叉為0.912 6,可知交叉頻帶數(shù)目越多,分類準確率越高。此外,由表4 可知,單頻帶下δ 頻帶的特征組合準確率最高,由表6 發(fā)現(xiàn),雙頻帶至四頻帶交叉下δ-α、δ-α-β、δ-θ-α-β獲得最高分類準確率,可知δ頻帶和α頻帶貢獻度最高。
3.3.4 PSO和GA-PSO算法的尋優(yōu)效果對比
為了進一步對比研究PSO 和GA-PSO 算法的尋優(yōu)能力,接下來分析了將gBest(最優(yōu)特征組合)作為SVM分類器輸入而得到的分類準確率隨迭代次數(shù)的變化規(guī)律。圖7 為單頻帶(δ)和交叉頻帶(δ-α、δ-α-β、δ-θ-α-β)的結(jié)果,橫坐標為迭代次數(shù),縱坐標為100 次實驗的SVM平均分類準確率。
圖7 PSO和GA-PSO最優(yōu)粒子準確率變化趨勢FIG.7 Optimal particle accuracy change trend of PSO and GA-PSO
隨著迭代次數(shù)增加,PSO和GA-PSO算法篩選得到的最優(yōu)特征組合的平均準確率呈上升趨勢,表明兩種算法都能尋找并接近最優(yōu)值。然而,PSO收斂快速且收斂后曲線較平緩,在圖7(a)至(d)中,單頻帶和交叉頻帶下得到的平均準確率趨向于0.759 5、0.855 4、0.901 6、0.906 7。此外,圖7(a)結(jié)果與圖5 一致,但是圖7(b)至(d)中,GA-PSO收斂速度減慢,尤其隨著交叉頻帶的增多收斂曲線的轉(zhuǎn)折點出現(xiàn)得更晚,但最終趨于平緩,在單頻帶和交叉頻帶下分別得到的準確率為0.768、0.859 4、0.908 8、0.912 6,可知GA-PSO在高維解空間能得到更高的全局最優(yōu)值,準確率更高。
接下來,將100 次實驗中單頻帶到四頻帶PSO 和GA-PSO尋優(yōu)的特征組合進行統(tǒng)計并均值化進行展示,如圖8所示。PSO算法在單頻帶、雙頻帶、三頻帶、四頻帶下尋優(yōu)找到的平均特征組合數(shù)為688、2 708、3 528、4 225;GA-PSO 算法在單頻帶、雙頻帶、三頻帶、四頻帶下尋優(yōu)找到的平均特征組合數(shù)為2 644、5 136、5 886、6 346。對比發(fā)現(xiàn),GA-PSO算法平均尋找的特征組合比PSO算法多,這表明GA-PSO由于GA的引入,通過變異操作持續(xù)增加新粒子,能擴大解空間搜索范圍并尋找到準確率最高的特征組合。
圖8 PSO和GA-PSO平均尋優(yōu)解數(shù)量Fig.8 Average number of optimal solutions of PSO and GA-PSO
最后,為了研究PSO 和GA-PSO 算法的運行效率,將算法每次實驗的運行時間進行統(tǒng)計,并求取均值,如表7 所示。其中,PSO 算法為:271.39 s(單頻帶)、380.33 s(雙頻帶)、427.06 s(三頻帶)、479.46 s(四頻帶);而GA-PSO 算法為:137.58 s(單頻帶)、195.64 s(雙頻帶)、228.78 s(三頻帶)、267.53 s(四頻帶)。從結(jié)果可知,GA-PSO算法整體上都要快于PSO算法,根據(jù)公式(6)可知PSO算法的每個粒子在進行位置和速度更新時,共進行了3 次“+”、2 次“-”和4 次“×”,以及1 次適應(yīng)度計算,同時伴隨著pBest和gBest更新,而GA算法每個染色體(粒子)在進行更新迭代時,交叉和變異算子僅是0-1值變換,運算量遠小于PSO算法。因此,GA-PSO算法的運行效率會遠高于PSO 算法,可快速、穩(wěn)定尋找到最優(yōu)組合。
表7 PSO和GA-PSO平均運行時間Fig.7 Average of running time of PSO and GA-PSO 單位:s
本文基于復(fù)雜網(wǎng)絡(luò)理論,采用相位同步指數(shù)(PSI)構(gòu)建大腦功能網(wǎng)絡(luò)并提取拓撲特征,以此識別癲癇(EP)患者發(fā)作時腦電信號。結(jié)果發(fā)現(xiàn),δ、θ 和β 頻帶下EP腦網(wǎng)絡(luò)連接顯著增加,但hub節(jié)點變少且節(jié)點之間傳輸效率降低,并且網(wǎng)絡(luò)小世界屬性、局部聚集性和層次結(jié)構(gòu)降低以及網(wǎng)絡(luò)更無序。其中δ頻帶和β頻帶下的特征組間差異明顯。通過SVM 分類分析發(fā)現(xiàn),單頻帶下單特征分類準確率較低,無法有效區(qū)分EP 腦電信號。在此基礎(chǔ)上,進行頻帶內(nèi)和頻帶間特征組合,并應(yīng)用PSO 算法和GA-PSO 算法尋找最優(yōu)特征組合。結(jié)果發(fā)現(xiàn),兩種算法獲得的平均準確隨交叉頻帶的增多而升高,且最高分別為0.906 7和0.912 6。由此可見GA-PSO可獲得更高的準確率,可有效識別EP 患者腦電信號。本文研究結(jié)果表明,拓撲特征能夠有效表征癲癇患者的腦網(wǎng)絡(luò)結(jié)構(gòu)的異常,并通過組合的方式提高分類準確率,這為癲癇的病理研究和臨床診斷提供了幫助。在后續(xù)的研究工作中,可進一步優(yōu)化GA和PSO算法的結(jié)合方式,提高算法避免陷入局部最優(yōu)的能力以及降低算法時間復(fù)雜度。