曹玉珍,高晨陽(yáng),余 輝,王 江
(1. 天津大學(xué)精密儀器與光電子工程學(xué)院,天津 300072;2. 天津大學(xué)電氣自動(dòng)化與信息工程學(xué)院,天津300072)
癲癇是一種由大腦神經(jīng)元異常放電引起的慢性大腦疾病,具有不確定性、反復(fù)發(fā)作的特點(diǎn)[1].癲癇狀態(tài)自動(dòng)識(shí)別不僅可以用于監(jiān)測(cè)病患是否發(fā)病,也為癲癇電磁刺激療法提供支持.對(duì)于一個(gè)閉環(huán)的電磁刺激控制系統(tǒng),對(duì)癲癇發(fā)作狀態(tài)應(yīng)具有較好的識(shí)別準(zhǔn)確率和實(shí)時(shí)性[2],而針對(duì)特定病患的癲癇發(fā)作狀態(tài)自動(dòng)識(shí)別算法是關(guān)鍵所在.
癲癇發(fā)作期間,腦電信號(hào)表現(xiàn)為棘波、尖波、棘慢復(fù)合波、尖慢復(fù)合波,被認(rèn)為是臨床上檢測(cè)癲癇樣放電最顯著的特征波形.癲癇狀態(tài)識(shí)別通常通過(guò)對(duì)腦電片段進(jìn)行特征提取后進(jìn)行分類(lèi)識(shí)別,目前主要基于時(shí)域分析、頻域分析、時(shí)頻分析以及非線性動(dòng)力學(xué)分析等技術(shù)提取特征.隨著深度學(xué)習(xí)方法理論日益完善,深度學(xué)習(xí)模型在圖像識(shí)別與分割、語(yǔ)音識(shí)別等領(lǐng)域都取得了很好的成果,在腦電信號(hào)分析處理中也逐漸取代了部分傳統(tǒng)模式識(shí)別方法,得到了較廣泛的關(guān)注.Acharya等[3]在2017年將卷積神經(jīng)網(wǎng)絡(luò)用于癲癇腦電數(shù)據(jù)處理,最終在BONN大學(xué)的iEEG數(shù)據(jù)集上達(dá)到了88.67%的識(shí)別準(zhǔn)確率;Yao等[4]基于雙向長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)(LSTM)對(duì)癲癇腦電發(fā)作檢測(cè)的平均精確度達(dá)到了88.63%.單紹杰等[5]在提取小波能量特征的基礎(chǔ)上,將LSTM應(yīng)用到單導(dǎo)聯(lián)癲癇腦電發(fā)作預(yù)測(cè)中.
然而,由于不同病患之間的個(gè)體差異較大,訓(xùn)練一個(gè)識(shí)別準(zhǔn)確的通用模型是很困難的,難以達(dá)到理想的識(shí)別效果.因此,考慮到病患的個(gè)體差異性,為其訓(xùn)練一個(gè)個(gè)性化的分類(lèi)識(shí)別模型,以提高識(shí)別準(zhǔn)確率,實(shí)現(xiàn)癲癇狀態(tài)識(shí)別的個(gè)性化.
基于深度學(xué)習(xí)構(gòu)建癲癇狀態(tài)識(shí)別模型[6-7],相比于現(xiàn)有的基于特征提取和機(jī)器學(xué)習(xí)方法,無(wú)需手動(dòng)提取、選擇特征.癲癇作為一種神經(jīng)系統(tǒng)疾病,不同病患之間異常腦電活動(dòng)存在一定的共性,因此,本文提出一種癲癇狀態(tài)識(shí)別的通用模型,采用一維卷積神經(jīng)網(wǎng)絡(luò)對(duì)不同病患的癲癇腦電進(jìn)行分類(lèi)辨識(shí).同時(shí)基于通用模型使用遷移學(xué)習(xí)的方法為每個(gè)病患訓(xùn)練特定的個(gè)性化模型以實(shí)現(xiàn)癲癇狀態(tài)識(shí)別.個(gè)性化模型基于遷移學(xué)習(xí)構(gòu)建,具有收斂快速、數(shù)據(jù)量需求小的優(yōu)點(diǎn)[8],在病患EEG數(shù)據(jù)庫(kù)更新時(shí)無(wú)需再次重新訓(xùn)練模型.
癲癇狀態(tài)識(shí)別通用模型基于一維卷積神經(jīng)網(wǎng)絡(luò)(1D-CNN)實(shí)現(xiàn).模型一共包含3個(gè)卷積層、3個(gè)最大池化層和2個(gè)全連接層.1D-CNN接收長(zhǎng)度為512的樣本作為原始輸入,卷積層和池化層的步長(zhǎng)分別設(shè)置為1 和2,其核的大小分別為5和2.3層卷積操作中卷積核的個(gè)數(shù)分別為16、32、64,在卷積過(guò)程中對(duì)樣本邊緣進(jìn)行補(bǔ)零填充,使得經(jīng)過(guò)卷積層的特征映射輸出與輸入尺寸相同.模型的結(jié)構(gòu)如圖1所示.
原始輸入經(jīng)過(guò)3個(gè)卷積層和3個(gè)池化層之后得到大小為64×64的特征映射,然后將二維特征映射展開(kāi)成一個(gè)長(zhǎng)度為4096的一維張量,再經(jīng)過(guò)兩個(gè)全連接層降維之后進(jìn)入Softmax層計(jì)算輸入樣本屬于各類(lèi)的歸一化概率,最后得到輸入樣本的模型判斷類(lèi)別.1D-CNN 模型使用ELU函數(shù)作為各中間層神經(jīng)元的激活函數(shù),同時(shí)基于Softmax函數(shù)輸出計(jì)算二值交叉熵?fù)p失函數(shù).
圖1 一維卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)與參數(shù)Fig.1 Structure and parameters of 1D-CNN
通用模型可以用于病患腦電狀態(tài)的初步判斷,在獲得新病患的腦電數(shù)據(jù)記錄時(shí)也可使用通用模型進(jìn)行預(yù)標(biāo)注,同時(shí)通用模型的參數(shù)以及訓(xùn)練過(guò)程也可以為特定病患個(gè)性化的癲癇狀態(tài)識(shí)別模型訓(xùn)練提供支持.
1.2.1 參數(shù)遷移方案
癲癇狀態(tài)識(shí)別個(gè)性化模型基于訓(xùn)練好的通用模型實(shí)現(xiàn)參數(shù)遷移.參數(shù)遷移有兩種方案:全面遷移和卷積層遷移.
全面遷移是將個(gè)性化模型的結(jié)構(gòu)與參數(shù)完全按照通用模型實(shí)現(xiàn),即在通用模型上更換不同的個(gè)性化數(shù)據(jù)集,調(diào)整學(xué)習(xí)率進(jìn)行二次訓(xùn)練從而得到特定病患的個(gè)性化模型.
卷積層遷移是把通用模型的卷積池化組合部分的結(jié)構(gòu)與參數(shù)遷移到個(gè)性化模型之中,但是模型最后幾層的參數(shù)做重新訓(xùn)練,且模型最后幾層的結(jié)構(gòu)也可以做出一定程度的調(diào)整以更好地適應(yīng)個(gè)性化狀態(tài)識(shí)別任務(wù).
1.2.2 個(gè)性化模型結(jié)構(gòu)與參數(shù)
癲癇狀態(tài)識(shí)別個(gè)性化模型結(jié)構(gòu)與通用模型的結(jié)構(gòu)(圖1)相似,都是基于3個(gè)卷積層、3個(gè)池化層和2個(gè)全連接層的組合.
個(gè)性化模型的激活函數(shù)與優(yōu)化方法與通用模型一致,分別使用ELU函數(shù)和Adagrad算法,未經(jīng)參數(shù)遷移的全連接層使用He方法進(jìn)行初始化.模型的損失函數(shù)也同樣使用二值交叉熵函數(shù).
本文使用的腦電數(shù)據(jù)來(lái)源于美國(guó)國(guó)家綜合醫(yī)學(xué)研究所(NIGMS)和國(guó)家生物醫(yī)學(xué)影像與生物工程研究所(NIBIB)提供支持的生物醫(yī)學(xué)信號(hào)研究資源網(wǎng)站PhysioNet中的CHB-MIT數(shù)據(jù)庫(kù)[9].?dāng)?shù)據(jù)庫(kù)包含了23例來(lái)自波士頓兒童醫(yī)院的病患的腦電數(shù)據(jù),記錄了實(shí)驗(yàn)被試在撤去抗癲癇藥物治療后的情況下連續(xù)幾天內(nèi)監(jiān)測(cè)采集到的頭皮EEG信號(hào),其中病患的年齡區(qū)間為3~22歲.?dāng)?shù)據(jù)庫(kù)給出了每個(gè)病患每次癲癇發(fā)作的起止時(shí)間標(biāo)注信息以便研究.?dāng)?shù)據(jù)庫(kù)中的EEG數(shù)據(jù)采用國(guó)際化標(biāo)準(zhǔn)的10~20雙極導(dǎo)聯(lián)法記錄,可以減少無(wú)關(guān)電極的干擾.采樣頻率為256Hz,數(shù)據(jù)庫(kù)記錄了病患們23個(gè)通道的差動(dòng)EEG數(shù)據(jù).
依據(jù)數(shù)據(jù)庫(kù)提供的癲癇發(fā)作起止標(biāo)注信息,首先截取每個(gè)記錄中病患發(fā)作期的數(shù)據(jù)片段.然后以2s時(shí)間窗對(duì)發(fā)作期數(shù)據(jù)進(jìn)行分段截取[10],得到若干病患EEG數(shù)據(jù)的正樣本.其中窗口重疊率為50%,即移動(dòng)步長(zhǎng)為1s,以此實(shí)現(xiàn)數(shù)據(jù)增強(qiáng).然后在病患非發(fā)作期時(shí)段以相同的時(shí)間窗設(shè)置,隨機(jī)截取和正樣本數(shù)目相同的非發(fā)作期EEG數(shù)據(jù)片段作為負(fù)樣本.
根據(jù)對(duì)23個(gè)病患的EEG數(shù)據(jù)經(jīng)過(guò)截取后單通道的正樣本數(shù)目分析可知,病患chb02、chb06、chb09、chb14、chb16和chb21的樣本數(shù)目比較少(低于200),因此選取除上述病患之外17名病患的EEG數(shù)據(jù)進(jìn)行分析研究.
2.2.1 通用模型數(shù)據(jù)集構(gòu)建
為了建立通用模型,需要構(gòu)建包含不同病患EEG數(shù)據(jù)樣本的通用模型數(shù)據(jù)集.首先把數(shù)據(jù)庫(kù)中各個(gè)病患原始EEG數(shù)據(jù)經(jīng)過(guò)預(yù)處理之后得到若干數(shù)量發(fā)作期樣本和非發(fā)作期樣本,然后按照一定比例k(0<k≤1)隨機(jī)選擇不同病患相同數(shù)目的兩類(lèi)樣本混合構(gòu)成通用數(shù)據(jù)集.為了平衡模型的效果與性能,k值不宜過(guò)大或過(guò)小,經(jīng)過(guò)驗(yàn)證與測(cè)試,當(dāng)k=0.45時(shí)模型各方面表現(xiàn)最好.通用樣本數(shù)據(jù)集一共包括17個(gè)病患的EEG樣本數(shù)據(jù)共167193個(gè).然后對(duì)樣本進(jìn)行Z-score標(biāo)準(zhǔn)化處理,以便通用模型的訓(xùn)練.
2.2.2 通用模型識(shí)別結(jié)果
通用模型數(shù)據(jù)集中的樣本分為發(fā)作期樣本和非發(fā)作期樣本共兩類(lèi),標(biāo)簽分別設(shè)置為1 和0.隨機(jī)選取全部樣本中的15%作為模型的測(cè)試集,剩余的樣本用于1D-CNN的訓(xùn)練.
模型使用反向傳播算法計(jì)算損失函數(shù)關(guān)于網(wǎng)絡(luò)參數(shù)的梯度,使用自適應(yīng)學(xué)習(xí)率算法Adagrad算法優(yōu)化網(wǎng)絡(luò)參數(shù).在網(wǎng)絡(luò)最后的全連接層引入隨機(jī)失活(失活率設(shè)置為0.5)以預(yù)防過(guò)擬合.在訓(xùn)練過(guò)程中全局學(xué)習(xí)率初值設(shè)置為0.0007~0.0020之間的隨機(jī)數(shù).通用模型樣本數(shù)據(jù)集的規(guī)模較大,為了節(jié)省計(jì)算資源,基于批處理方法訓(xùn)練模型,批處理大小設(shè)為300.抽取訓(xùn)練集10%作為驗(yàn)證集,圖2顯示了模型在訓(xùn)練過(guò)程中損失函數(shù)值Loss在訓(xùn)練集和驗(yàn)證集上的變化曲線.由圖2可以看出,隨著迭代次數(shù)增長(zhǎng),訓(xùn)練集和驗(yàn)證集的Loss逐漸下降.而驗(yàn)證集的Loss有相當(dāng)長(zhǎng)的平坦期,當(dāng)?shù)螖?shù)達(dá)到100次時(shí),驗(yàn)證集Loss偏離訓(xùn)練集Loss,有再次增大的趨勢(shì),說(shuō)明當(dāng)前模型在數(shù)據(jù)集上訓(xùn)練100次左右后,繼續(xù)訓(xùn)練可能會(huì)導(dǎo)致過(guò)擬合.因此,在過(guò)擬合之前,采取早停措施,故確定模型訓(xùn)練次數(shù)為100次.
使用準(zhǔn)確率(accuracy,ACC)、真陽(yáng)性率(true positive rate,TPR)和假陽(yáng)性率(false positive rate,F(xiàn)PR)這3個(gè)指標(biāo)評(píng)價(jià)模型的分類(lèi)結(jié)果,其計(jì)算式分別為
式中:TP為模型預(yù)測(cè)和真實(shí)標(biāo)簽都為陽(yáng)性的樣本個(gè)數(shù);FN為模型預(yù)測(cè)為陰性但真實(shí)標(biāo)簽為陽(yáng)性的樣本個(gè)數(shù);FP為模型預(yù)測(cè)為陽(yáng)性但真實(shí)標(biāo)簽為陰性的樣本個(gè)數(shù);TN為模型預(yù)測(cè)和真實(shí)標(biāo)簽都為陰性的樣本個(gè)數(shù);Ntotal為樣本總數(shù).
圖2 通用模型損失函數(shù)值的變化曲線Fig.2 Variation of the loss function value in the general model
當(dāng)模型參數(shù)k=0.45、學(xué)習(xí)率設(shè)置設(shè)為0.00095、迭代次數(shù)設(shè)為100時(shí),上述通用模型最終在測(cè)試集上的ACC、TPR 以及FPR 分別為72.52%、73.86%和28.35%.選擇未入選通用模型數(shù)據(jù)集的病患(chb02、chb06、chb09、chb14、chb16和chb21)的EEG 數(shù)據(jù)構(gòu)建新的測(cè)試集檢驗(yàn)?zāi)P停珹CC、TPR及FPR的均值分別為69.25%、71.45%和31.23%.以上結(jié)果表明,癲癇狀態(tài)識(shí)別通用模型對(duì)EEG 樣本數(shù)據(jù)具有一定程度的區(qū)分能力,但針對(duì)特定病患的癲癇狀態(tài)識(shí)別仍有一定的提升空間.
2.3.1 個(gè)性化模型數(shù)據(jù)集構(gòu)建
由于臨時(shí)工并非正式職工,多數(shù)都是外來(lái)人員,要想獲得正式編制很難,因此即使工作多年的老職工也缺乏主人翁意識(shí),只是做一天和尚撞一天鐘,遇到子女生孩子、家里老人生病等事情時(shí),會(huì)毫不猶豫的選擇離開(kāi);隨著現(xiàn)在社會(huì)的發(fā)展,工作機(jī)會(huì)很多,導(dǎo)致更多年輕人只是把目前工作作為一個(gè)跳板,一旦有其他薪酬高、工作條件好的工作,就會(huì)立刻選擇離開(kāi),造成臨時(shí)工隊(duì)伍不穩(wěn)定,流失率高。
個(gè)性化模型數(shù)據(jù)集的樣本混合是針對(duì)特定病患不同通道的樣本數(shù)據(jù)而言的.考慮到全通道腦電數(shù)據(jù)包含較多的冗余信息,會(huì)增加算法的計(jì)算復(fù)雜度且可能帶來(lái)模型的過(guò)擬合[11],采用卷積自編碼器和費(fèi)舍爾準(zhǔn)則[12],對(duì)病患的通道排序后,選擇與分類(lèi)任務(wù)相關(guān)性最高的若干個(gè)通道子集的樣本數(shù)據(jù)混合在一起.這里選擇通道子集數(shù)為5.
為了提升模型精度、預(yù)防過(guò)擬合的發(fā)生,需要對(duì)數(shù)據(jù)樣本進(jìn)行擴(kuò)增.?dāng)?shù)據(jù)擴(kuò)增的方法基于重截取,即針對(duì)上一步得到的通道子集中的原始EEG數(shù)據(jù),調(diào)整數(shù)據(jù)截取的起始點(diǎn)和步長(zhǎng)進(jìn)行二次樣本截取.?dāng)?shù)據(jù)樣本的時(shí)長(zhǎng)為2s,樣本點(diǎn)數(shù)為512.原始數(shù)據(jù)截取的窗口移動(dòng)步長(zhǎng)為1s,現(xiàn)將窗口移動(dòng)步長(zhǎng)降低為0.5s,也就是128個(gè)采樣點(diǎn),同時(shí)數(shù)據(jù)截取的起始點(diǎn)向后移動(dòng)64個(gè)數(shù)據(jù)點(diǎn)(1/4s).這樣可以保證重采樣的數(shù)據(jù)與原有樣本之間不產(chǎn)生重復(fù).
2.3.2 個(gè)性化模型識(shí)別結(jié)果
個(gè)性化模型數(shù)據(jù)集中的樣本標(biāo)簽設(shè)置與通用模型數(shù)據(jù)集中的一致.隨機(jī)選取病患個(gè)性化模型數(shù)據(jù)集中15%的樣本作為模型的測(cè)試集,剩余的樣本用于模型訓(xùn)練.
模型的訓(xùn)練基于反向傳播算法和Adagrad算法傳播誤差并優(yōu)化網(wǎng)絡(luò)參數(shù).除了在網(wǎng)絡(luò)最后的全連接層引入隨機(jī)失活(失活率設(shè)置為0.5)以外還使用早停來(lái)預(yù)防過(guò)擬合.個(gè)性化模型訓(xùn)練的全局學(xué)習(xí)率初值比通用模型的學(xué)習(xí)率初值稍小,設(shè)置為0.0004~0.0014之間的隨機(jī)數(shù).個(gè)性化模型樣本數(shù)據(jù)集的規(guī)模相對(duì)較小,為了增加批訓(xùn)練的次數(shù),適當(dāng)減小批處理大小,將其設(shè)置為100.抽取訓(xùn)練集5%作為驗(yàn)證集,圖3顯示了對(duì)于病患chb01,模型在訓(xùn)練過(guò)程中在訓(xùn)練集和驗(yàn)證集上準(zhǔn)確率ACC的變化曲線.由圖3可以看出,個(gè)性化模型的驗(yàn)證集ACC在20次左右迭代就達(dá)到了一個(gè)較高的水平并且趨于穩(wěn)定.模型在驗(yàn)證集上的ACC與訓(xùn)練集ACC變化趨勢(shì)一致,說(shuō)明當(dāng)前模型沒(méi)有發(fā)生過(guò)擬合.其他病患個(gè)性化模型在訓(xùn)練時(shí)經(jīng)過(guò)20次左右迭代也趨于收斂.對(duì)每一個(gè)病患都訓(xùn)練一個(gè)癲癇狀態(tài)識(shí)別個(gè)性化模型,訓(xùn)練完成之后用測(cè)試集對(duì)模型進(jìn)行檢驗(yàn),然后得到各個(gè)病患個(gè)性化模型的分類(lèi)結(jié)果.各個(gè)病患對(duì)應(yīng)的個(gè)性化模型最終在測(cè)試集上的ACC如圖4所示.從圖中可以看出癲癇狀態(tài)識(shí)別個(gè)性化模型的識(shí)別準(zhǔn)確率都較高.所有病患的平均ACC達(dá)到了91.04%.識(shí)別準(zhǔn)確率最高的是病患chb10,為95.48%;識(shí)別準(zhǔn)確率最低的是病患chb13,為85.78%.
圖3 個(gè)性化模型ACC的變化曲線Fig.3 Variation of ACC in the personalized model
圖4 各病患個(gè)性化模型在測(cè)試集上的ACCFig.4 ACC of the personalized model with different patients using a test set
同時(shí),各個(gè)病患對(duì)應(yīng)的個(gè)性化模型TPR均保持在較高水平,其中最高的是病患chb10,為97.10%;最低的是病患chb15,為88.24%;其平均值為92.05%,說(shuō)明個(gè)性化模型在病患處于癲癇發(fā)作狀態(tài)時(shí),將這個(gè)時(shí)期的腦電樣本片段判斷為癲癇發(fā)作狀態(tài)的可能性較大.各病患的FPR指標(biāo)都較低,F(xiàn)PR最低的是病患chb04,為4.84%;最高的是病患chb13,為17.70%;其均值為9.27%.另外,病患之間TNR 相差不大,TNR 最高的是病患chb04,為95.16%;最低的是病患chb13,為82.30%;其均值為90.73%.反映了病患腦電正常狀態(tài)可被正確識(shí)別的百分比較高.
2.3.3 癲癇發(fā)作起止時(shí)間判斷
癲癇狀態(tài)識(shí)別的個(gè)性化模型可用于癲癇病患長(zhǎng)程腦電的發(fā)作起止時(shí)間判斷,這使個(gè)性化模型的價(jià)值更大.病患chb12等的EEG部分?jǐn)?shù)據(jù)記錄中存在多次發(fā)作情況.排除其中用于通用模型和個(gè)性化模型數(shù)據(jù)集構(gòu)建的發(fā)作情況,將剩余發(fā)作情況對(duì)應(yīng)的長(zhǎng)程EEG數(shù)據(jù)作為癲癇發(fā)作起止時(shí)間判斷的測(cè)試數(shù)據(jù).
將測(cè)試數(shù)據(jù)按照時(shí)序以2s為窗長(zhǎng)截取EEG片段輸入個(gè)性化模型,其中窗口移動(dòng)步長(zhǎng)設(shè)置為1s.為了提高癲癇發(fā)作時(shí)間段識(shí)別的魯棒性和精度,當(dāng)連續(xù)兩次的識(shí)別結(jié)果為發(fā)作時(shí),才判定病患進(jìn)入癲癇發(fā)作狀態(tài);當(dāng)連續(xù)兩次的識(shí)別結(jié)果為正常時(shí),判定病患不再是癲癇發(fā)作狀態(tài).當(dāng)識(shí)別的狀態(tài)發(fā)生改變時(shí),輸出上個(gè)窗口起點(diǎn)對(duì)應(yīng)的時(shí)間戳,作為狀態(tài)改變的時(shí)刻.定義發(fā)作開(kāi)始時(shí)間偏差Tse和發(fā)作結(jié)束時(shí)間偏差Tee,以衡量癲癇發(fā)作起止時(shí)間判斷的準(zhǔn)確程度.Tse和Tee的計(jì)算式分別為
式中T0s、T1s、T0e、T1e分別代表癲癇發(fā)作開(kāi)始的標(biāo)定時(shí)間和模型判斷時(shí)間、癲癇發(fā)作終止的標(biāo)定時(shí)間和模型判斷時(shí)間.
圖5以病患chb04的某個(gè)發(fā)作片段為例癲癇發(fā)作起止時(shí)間判斷的結(jié)果.其中縱軸1和0分別表示發(fā)作和正常狀態(tài).
圖5 病患chb04癲癇發(fā)作起止時(shí)間判斷示意Fig.5 Seizure onset and ending time of patient chb04
統(tǒng)計(jì)上述7名病患所有發(fā)作片段在測(cè)試過(guò)程中的Tse和Tee,如表1所示.由表1可以看出,通過(guò)連續(xù)兩次判別狀態(tài)統(tǒng)一才確定狀態(tài)的方法,個(gè)性化模型對(duì)癲癇發(fā)作起止時(shí)間判斷的偏差絕大部分在3s以?xún)?nèi),其中Tse均值約為1.5s,Tee均值約為2.3s.考慮到樣本的窗長(zhǎng)為2s,如果模型識(shí)別出的癲癇發(fā)作起止時(shí)間偏差不大于3s,則認(rèn)為模型正確識(shí)別出了癲癇狀態(tài)[12].最終在測(cè)試數(shù)據(jù)集上模型對(duì)癲癇發(fā)作開(kāi)始狀態(tài)的檢出率為96.43%,結(jié)束狀態(tài)的檢出率為89.29%,識(shí)別效果較好.
表1 不同病患癲癇發(fā)作起止判斷時(shí)間偏差對(duì)比Tab.1 Comparison of the seizure onset and ending time deviations of different patients
針對(duì)個(gè)性化模型參數(shù)遷移的程度進(jìn)行討論以找出最適合建立病患個(gè)性化癲癇狀態(tài)識(shí)別模型的參數(shù)遷移方案.如表2所示,討論的情況分為4種,即全面遷移(A)、卷積層遷移(B)、卷積層遷移且全連接層網(wǎng)絡(luò)規(guī)模增加(C)、卷積層遷移且全連接層網(wǎng)絡(luò)規(guī)模減小(D)的個(gè)性化模型.
表2 個(gè)性化模型參數(shù)遷移方案Tab.2 Parameter transfer scheme of the personalized model
個(gè)性化模型全連接層網(wǎng)絡(luò)結(jié)構(gòu)為兩層,神經(jīng)元數(shù)目分別為256和128.對(duì)于每個(gè)病患都訓(xùn)練A、B、C、D 4個(gè)個(gè)性化模型,完成訓(xùn)練后記錄各個(gè)模型的評(píng)價(jià)指標(biāo).采用六折交叉驗(yàn)證,獲得最佳ACC列示在表3中.采用第2.3.2節(jié)所述隨機(jī)劃分的測(cè)試集和訓(xùn)練集做多次實(shí)驗(yàn),整體而言,約90%模型和最佳模型ACC相差在10%以?xún)?nèi).
表3 病患遷移程度不同的個(gè)性化模型在測(cè)試集上的最佳ACCTab.3 Optimal ACC of the personalized modelunder different transfer schemes on a test set
由表3可以看出4種遷移程度對(duì)應(yīng)的個(gè)性化模型都有較高的分類(lèi)準(zhǔn)確率.大部分病患卷積層遷移方案對(duì)應(yīng)的個(gè)性化模型的ACC高于全面遷移的方案.對(duì)于不同病患而言,最佳的遷移模型有所不同,可以認(rèn)為這一現(xiàn)象產(chǎn)生的原因是不同病患之間個(gè)性化數(shù)據(jù)集的樣本數(shù)不同,因而最適合該病患的模型容量也存在一定差異.
個(gè)性化模型訓(xùn)練使用的優(yōu)化函數(shù)和通用模型訓(xùn)練中一致.在通用模型訓(xùn)練時(shí)學(xué)習(xí)率初值lr的最佳取值范圍是[0.0007,0.0020].個(gè)性化模型由通用模型參數(shù)遷移而來(lái),網(wǎng)絡(luò)參數(shù)在源域上處于接近收斂的狀態(tài),因此在進(jìn)行二次訓(xùn)練的時(shí)候可以適當(dāng)降低學(xué)習(xí)率以免損失函數(shù)無(wú)法收斂到最小值附近.以病患chb01的個(gè)性化模型為例,不斷調(diào)整lr的值,統(tǒng)計(jì)多次實(shí)驗(yàn)中個(gè)性化模型在測(cè)試集上的最佳分類(lèi)準(zhǔn)確率的變化情況,實(shí)驗(yàn)結(jié)果如圖6所示.
圖6 最佳ACC隨學(xué)習(xí)率初值變化的曲線Fig.6 Variation of the optimal ACC when considering the initial value of the learning rate
從圖6可以看出,當(dāng)lr在0.0004~0.0014時(shí),病患chb01的個(gè)性化模型的最佳ACC取值較高.當(dāng)lr>0.005時(shí)影響模型的最佳ACC明顯降低.其他病患個(gè)性化模型的lr取值范圍討論結(jié)果與示例基本相同,選擇區(qū)間[0.0003,0.0015]作為個(gè)性化模型的學(xué)習(xí)率初值取值范圍.
本研究構(gòu)建了一個(gè)基于一維卷積神經(jīng)網(wǎng)絡(luò)的癲癇狀態(tài)識(shí)別通用模型;為了進(jìn)一步提升模型對(duì)病患癲癇狀態(tài)的特異性識(shí)別效果,構(gòu)建了基于遷移學(xué)習(xí)的個(gè)性化癲癇狀態(tài)識(shí)別模型,通過(guò)對(duì)個(gè)性化模型的關(guān)鍵參數(shù)討論分析,得到了一組較優(yōu)的模型訓(xùn)練參數(shù);最后基于個(gè)性化模型進(jìn)行癲癇發(fā)作狀態(tài)起止時(shí)間的判斷,具有一定的臨床應(yīng)用價(jià)值.未來(lái)的工作可以考慮在算法的實(shí)時(shí)性研究方面開(kāi)展工作,同時(shí)搭配嵌入式便攜腦電信號(hào)采集儀實(shí)現(xiàn)癲癇腦電狀態(tài)識(shí)別;將癲癇狀態(tài)識(shí)別的功能加入到病患日常監(jiān)護(hù)或者電磁刺激治療設(shè)備之中,一旦檢測(cè)到癲癇發(fā)作就立即通知相關(guān)人員對(duì)病患實(shí)施救助或啟動(dòng)電磁刺激設(shè)備進(jìn)行治療.