穆建秋
(貴州師范大學(xué)大數(shù)據(jù)與計算機科學(xué)學(xué)院,貴陽550000)
根據(jù)世界衛(wèi)生組織(WHO)報道[1],全世界約有5000 萬人患有癲癇癥。癲癇是一種由大腦局部放電異常并向周圍擴散引起的慢性腦部疾病,具有反復(fù)性和突發(fā)性。癲癇病的臨床表現(xiàn)具有多樣性,不同患者的癲癇發(fā)作持續(xù)時間和表現(xiàn)各有不同。目前,近30%的患者患有醫(yī)學(xué)上的頑固性癲癇,他們不能徹底避免癲癇發(fā)作,使用藥物只能減少癲癇發(fā)作的次數(shù),不能徹底根除。腦電信號(Electroencephalogram,EEG)分析是檢測癲癇發(fā)作的主要方法,經(jīng)驗豐富的專家可以從患者腦電信號的波形判斷患者的大腦狀態(tài),但是這樣的人工觀察存在一些弊端,例如:長時間觀察腦電信號會使人身心疲憊,使得效率變低、誤差變大。此外,醫(yī)生對癲癇患者的診斷往往是通過對腦電信號的觀察并結(jié)合患者是否出現(xiàn)異常抽搐,進而判斷癲癇是否發(fā)作。人工判斷是一個主觀過程,不同的專家對同一段腦電信號的診斷可能不同,導(dǎo)致得出的結(jié)果不同。因此,有必要尋找一種實時、準確的自動檢測技術(shù)對患者腦電信號進行智能檢測,這對癲癇病患者和患者家屬具有十分重要的現(xiàn)實意義。
基于腦電信號的研究方向諸多,例如Manzano[2]使用深度學(xué)對睡眠狀態(tài)分類;Alhagry[3]使用長短期記憶網(wǎng)絡(luò)(Long Short-Term Memory,LSTM)進行情感識別;林偉成[4]對認知任務(wù)模式分類;Hajinoroozi[5]預(yù)測司機睡意和警覺狀態(tài)等等,本文涉及的癲癇檢測只是其中之一。由于以上研究的本質(zhì)都是對腦電信號進行某種處理,所以即便研究方向不同,它們之間的研究方法卻存在著可互用、相似之處。
前期的腦電信號相關(guān)研究主要使用非深度學(xué)習(xí)模型[4,6-11],而近些年深度學(xué)習(xí)逐漸成為主流,研究人員越來越多的使用深度學(xué)習(xí)進行腦電信號處理。本文將從數(shù)據(jù)預(yù)處理,特征提取、模型選擇和訓(xùn)練對目前基于深度學(xué)習(xí)的腦電信號處理現(xiàn)狀進行介紹:
(1)數(shù)據(jù)預(yù)處理
腦電信號的數(shù)據(jù)預(yù)處理通常包括下采樣和高通濾波等。Hefron 等人[12]指出使用深度學(xué)習(xí)處理腦電信號時,需要經(jīng)過“大量的數(shù)據(jù)預(yù)處理”。作者將數(shù)據(jù)下采樣至512Hz、計算64 個電極的平均參考值、對數(shù)據(jù)頻率由低到高的進行高通濾波。Koelstra[13]在DEAP 數(shù)據(jù)集上進行情緒識別的研究中將腦電信號下采樣至256Hz,并對頻率為2Hz 的腦電信號進行高通濾波。
有一種技術(shù)叫“偽影處理”[11],用于消除特定類型的噪音,例如眼部和肌肉偽影,YANG 等人[14]認為去除偽影對于腦電信號實現(xiàn)良好的解碼性能至關(guān)重要。Nolan[15]提出偽影處理需要專家參與,即便沒有專家去除偽影,較少的人為干預(yù)也可以取得更好的結(jié)果,例如Sun 等人[16]利用獨立成分分析從腦電信號中分離出眼部活動信號。
(2)特征提取
Zhang 等人[17]提出特征提取是腦電信號處理中最苛刻的步驟之一,甚至Patanaik 等人[18]的主要目的之一就是通過深度學(xué)習(xí)自動學(xué)習(xí)有效特征。除了使用深度學(xué)習(xí)自動學(xué)習(xí)有效特征之外,Pouya 等人[19]使用手工設(shè)計的特征作為深度學(xué)習(xí)模型的輸入,作者將腦電信號轉(zhuǎn)換成一系列保留拓撲結(jié)構(gòu)的多光譜圖像,這樣能夠最大程度的保留原始腦電信號中的空間和時間結(jié)構(gòu)。Wulsin[20]在深度信念網(wǎng)絡(luò)(Deep Belief Network,DBN)使用未處理過的腦電信號和手工設(shè)計的特征作為輸入,比較了兩者在分類和異常檢測任務(wù)上的性能。結(jié)果表明,在深度信念網(wǎng)絡(luò)中使用原始腦電信號能取得更好的結(jié)果。Tsiouris 等人[21]發(fā)現(xiàn)LSTM 網(wǎng)絡(luò)無法從原始腦電信號中獲得有效特征,而使用手工設(shè)計的特征作為模型輸入時效果良好。田曉彬等人[22]提出了一種融合深度和淺層特征的多視角癲癇檢測算法。該算法首先使用快速傅里葉變換(Fast Fourier Transform,F(xiàn)FT)和小波包分解(Wavelet Packet Decomposition,WPD)來獲取腦電信號頻域和時頻域的淺層特征;然后使用卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)學(xué)習(xí)并得到頻域和時頻域的深層特征。
(3)模型的選擇
在2014 年前,研究人員進行腦電信號處理使用的主要是深度信念網(wǎng)絡(luò)。Wulsin 等人[20]使用深度信念網(wǎng)絡(luò)對臨床腦電信號進行快速分類和異常檢測;Zheng 等人[23]從多通道腦電信號中提取特征作為模型輸入,使用深度信念網(wǎng)絡(luò)進行情感分類;Turner[24]使用深度信念網(wǎng)絡(luò)在高分辨率多通道腦電信號中進行癲癇檢測。
從2015 年開始,由于CNN 在計算機視覺上的優(yōu)異表現(xiàn),許多研究人員開始使用CNN 進行腦電信號處理。Yang 等人[25]利用卷積神經(jīng)網(wǎng)絡(luò)和增廣特征對多類運動圖像進行腦電信號分類;Tsinalis 等人[26]使用CNN對單通道腦電信號的睡眠階段進行自動評分;Wei 等人[27]基于多通道腦電信號使用三維CNN 進行癲癇自動檢測。同時,由于循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Net?work,RNN)在處理時間序列上的優(yōu)勢,RNN 的使用率也不斷提高。Kuanar 等人[28]使用RNN 來學(xué)習(xí)特征和預(yù)測腦電信號中記錄的認知負荷水平;Talathi[29]基于RNN 設(shè)計了一個針對癲癇發(fā)作前的癲癇檢測系統(tǒng)。
一些文章專門研究了模型層數(shù)對性能的影響。Zhang 等人[30]評估了層數(shù)從2 到10 的模型在基于腦電信號的精神負荷分類任務(wù)中的表現(xiàn),結(jié)果表明層數(shù)為7層的模型優(yōu)于層數(shù)較淺的模型(兩層和四層),也優(yōu)于層數(shù)較深的模型(10 層)。Kwak 等人[31]在動態(tài)條件下對基于腦電信號的穩(wěn)態(tài)視覺誘發(fā)電位(Steady State Vi?sual Evoked Potential,SSVEP)進行分類,并研究了模型層數(shù)對CNN 性能的影響,文中設(shè)計了三個模型,它們分別為:①由兩層CNN 和輸入輸出層組成的模型1;②由兩層CNN 和一層全連接層和輸入輸出層組成的模型2;③兩個全連接層和輸入輸出層組成的模型3。結(jié)果表明,在提供足夠的訓(xùn)練數(shù)據(jù)(均為已標(biāo)注數(shù)據(jù))時,三種模型都表現(xiàn)出很好的性能,但是在訓(xùn)練數(shù)據(jù)不充分的情況下,層數(shù)較少的模型1 則表現(xiàn)得更加優(yōu)秀。
(4)模型訓(xùn)練
不同的訓(xùn)練方法和超參數(shù)的選擇會極大的影響模型的性能,本節(jié)主要討論以下三個方面:正則化、優(yōu)化器和超參數(shù)。
正則化是一種為了減少測試誤差的行為(有時候也會增加訓(xùn)練誤差),目的是讓模型在面對新的數(shù)據(jù)時可以有很好的表現(xiàn)。其中最常見的是權(quán)重衰減(L1 和L2 正則化)、Early Stopping(提前停止)、Dropout 和La?bel Smoothing(標(biāo)簽平滑)。目前關(guān)于腦電信號的研究中,超過一半的文章采用了至少一種正則化方法。例如,Hefron 等人[32]使用Dropout、L1&L2 正則化的組合來學(xué)習(xí)不同參與者的時域和頻域特征。Lngkvist 等人[33]在睡眠階段分類中使用權(quán)重衰減和稀疏性懲罰兩種正則化結(jié)合,還增加了一個懲罰項來鼓勵權(quán)重稀疏性,定義為所有訓(xùn)練樣本中每個隱藏單元的平均激活量與超參數(shù)之間的KL 散度。
通常,調(diào)整超參數(shù)會占用大量的訓(xùn)練時間。為了減少尋找最佳超參數(shù)花費的時間,常用的方法有網(wǎng)格搜索和貝葉斯優(yōu)化。網(wǎng)格搜索為每個要優(yōu)化的參數(shù)確定一個取值范圍,選擇該范圍內(nèi)的值,并評估模型。網(wǎng)格搜索的一個優(yōu)點是它具有高度的并行性,每個超參數(shù)集都是相互獨立的。貝葉斯優(yōu)化通過目標(biāo)函數(shù)的評估結(jié)果建立替代函數(shù)(概率模型),來找到最小化目標(biāo)函數(shù)的值。貝葉斯方法與網(wǎng)格搜索的不同之處在于,它在嘗試下一組超參數(shù)時,會參考之前的評估結(jié)果,因此可以省去很多無用功。
癲癇檢測的研究工作由來已久,傳統(tǒng)方法多使用“淺”模型[6-10,34],如支持向量機(Support Vector Machine,SVM)等。隨著深度學(xué)習(xí)技術(shù)的發(fā)展,如CNN、RNN 等“深度”模型開始廣泛應(yīng)用于癲癇檢測[21,22,24,27,29,35],并且取得不錯的效果,但仍然存在著一些問題:①已標(biāo)注腦電信號數(shù)據(jù)有限。深度學(xué)習(xí)應(yīng)用于癲癇檢測需要大量的已標(biāo)注數(shù)據(jù),目前可獲取的腦電信號大部分為未標(biāo)注數(shù)據(jù),有些文章使用的甚至是未公開的數(shù)據(jù)集。②存在不確定性。眾所周知,深度學(xué)習(xí)模型可能存在過擬合現(xiàn)象,模型可能在訓(xùn)練數(shù)據(jù)集上表現(xiàn)非常好,在其他數(shù)據(jù)集上表現(xiàn)一般。在已標(biāo)記數(shù)據(jù)不足的情況下,我們沒有更多的數(shù)據(jù)來驗證模型的泛化性能;③部分相關(guān)研究無法重現(xiàn)。未公開代碼、使用私有數(shù)據(jù)集等,都會導(dǎo)致所做研究別人無法重現(xiàn)。而重現(xiàn)性是推動該領(lǐng)域前進的基礎(chǔ),尤其是在深度學(xué)習(xí)等新思想迅速傳播的領(lǐng)域;④腦電信號的研究方向諸多,如何更有針對性的對腦電信號進行特征提取,目前尚未完全解決;⑤實際上,學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)參數(shù)是一個優(yōu)化問題,找到解決該問題的最佳方法仍然是許多研究人員的研究方向。