李景聰, 林鎮(zhèn)遠(yuǎn), 潘偉健, 吳潮煌, 潘家輝
(華南師范大學(xué)軟件學(xué)院, 廣州 510631)
腦電信號(hào)(Electroencephalogram,EEG)是由大腦活動(dòng)引起的一種生理電信號(hào)。由于其無(wú)創(chuàng)、安全和低成本的特點(diǎn),腦電信號(hào)技術(shù)已經(jīng)在醫(yī)療和娛樂(lè)等領(lǐng)域得到了廣泛的應(yīng)用,比如應(yīng)用于非侵入式的腦機(jī)接口系統(tǒng)[1-2]、癲癇疾病的檢測(cè)[3]和睡眠分期[4]。在腦電采集過(guò)程中影響正常腦電信號(hào)的不良腦電信號(hào)被定義為腦電偽跡[5],通常是由生理現(xiàn)象(比如眨眼、咀嚼、肌肉運(yùn)動(dòng)等)或外部來(lái)源(比如電極干擾)產(chǎn)生的。在腦電信號(hào)分析過(guò)程中,腦電偽跡往往會(huì)造成不利的影響。換句話說(shuō),為了使基于腦電信號(hào)技術(shù)的應(yīng)用保持足夠的性能,提高腦電信號(hào)的信號(hào)質(zhì)量是關(guān)鍵,而提高腦電信號(hào)的質(zhì)量關(guān)鍵是更好地檢測(cè)并處理腦電偽跡。
最早期的腦電偽跡檢測(cè)方法是使用偽跡避免和人工檢測(cè)的方法[6]。其中,使用偽跡避免的方法是通過(guò)指示受試者盡量避免進(jìn)行無(wú)關(guān)動(dòng)作來(lái)消除偽跡,易導(dǎo)致誘發(fā)電位振幅的變化以及給受試者帶來(lái)額外的認(rèn)知負(fù)荷[7];人工檢測(cè)的方法需要腦電圖專家人為地識(shí)別、檢測(cè)腦電圖中存在的偽跡,但該方法帶主觀性且耗時(shí)。因此,目前更多的研究集中在腦電偽跡的自動(dòng)檢測(cè)方面,旨在提供一種客觀、自動(dòng)的偽跡檢測(cè)方法。如:提出了一種基于信號(hào)處理和統(tǒng)計(jì)學(xué)的偽跡檢測(cè)方法,并成功地將該檢測(cè)方法在臨床上用于相關(guān)疾病的喚醒試驗(yàn)(Wake fulness Test,MWT)[8];提出了一種基于小波變換的自適應(yīng)濾波方法,以自動(dòng)去除腦電記錄中的眼電偽跡[9];提出了一種有效閾值小波變換與自適應(yīng)濾波相結(jié)合的方法,根據(jù)眼電偽跡在低頻域的分布情況提取參考信號(hào),并采用基于最小均方(Least Mean Square,LMS)算法的自適應(yīng)濾波方法去除腦電信號(hào)中的眼電偽跡[10];利用希伯特變換的方法自動(dòng)地去除幾種典型的腦電偽跡[11];提出基于獨(dú)立成分分析(Indepen-dent Component Analysis,ICA)的自動(dòng)偽跡檢測(cè)方法,該方法從混合信號(hào)中計(jì)算獨(dú)立分量:首先利用矩陣算法計(jì)算各信號(hào)分量,再通過(guò)信號(hào)重建排除與偽跡相關(guān)的信號(hào)成分,從而最大程度地保留原始腦電信號(hào)[12-14]。但是,使用ICA很難檢測(cè)和消除瞬態(tài)偽跡,如頭頸部肌肉收縮產(chǎn)生的肌肉偽跡。此外,ICA需要很高的計(jì)算能力,而且,僅使用ICA的偽跡檢測(cè)算法需耗費(fèi)巨大的時(shí)間成本和人工成本。近年來(lái),隨著機(jī)器學(xué)習(xí)和深度學(xué)習(xí)技術(shù)的發(fā)展,機(jī)器學(xué)習(xí)和深度學(xué)習(xí)的方法也被應(yīng)用在腦電偽跡檢測(cè)和去除的研究中,并且顯示出很大的潛力。如:提出了一種基于機(jī)器學(xué)習(xí)的自動(dòng)偽跡檢測(cè)算法,使用支持向量機(jī)結(jié)合人工神經(jīng)網(wǎng)絡(luò)的機(jī)器學(xué)習(xí)方法對(duì)ICA提取的特征進(jìn)行分類,實(shí)現(xiàn)了端到端的、自動(dòng)化的偽跡識(shí)別方式,在測(cè)試的腦電偽跡數(shù)據(jù)集上得到了95%的準(zhǔn)確率[15];使用了一種貝葉斯網(wǎng)絡(luò)結(jié)合注意力的深度學(xué)習(xí)方法來(lái)實(shí)現(xiàn)腦電偽跡的檢測(cè),改進(jìn)了傳統(tǒng)神經(jīng)網(wǎng)絡(luò)方法在訓(xùn)練過(guò)程可能無(wú)法準(zhǔn)確預(yù)測(cè)具有未知分布的數(shù)據(jù)的問(wèn)題,并取得了95.86%的檢測(cè)準(zhǔn)確率[16];提出一種基于卷積神經(jīng)網(wǎng)絡(luò)的多通道腦電信號(hào)偽跡檢測(cè)方法,在7種不同類型的偽跡分類實(shí)驗(yàn)中得到的平均準(zhǔn)確率為74%,且方法的分類準(zhǔn)確率以及所耗費(fèi)的計(jì)算資源均優(yōu)于基于ICA的偽跡檢測(cè)方法[17];為了檢測(cè)多通道腦電信號(hào)中的各種偽跡,提出了一種低復(fù)雜度的基于長(zhǎng)短時(shí)記憶神經(jīng)網(wǎng)絡(luò)(Long Short-term Memory,LSTM)的偽跡檢測(cè)模型,該模型在二分類實(shí)驗(yàn)中的偽跡檢測(cè)準(zhǔn)確率達(dá)到93.1%,優(yōu)于使用卷積神經(jīng)網(wǎng)絡(luò)和自回歸模型的偽跡檢測(cè)方法[18]。
雖然深度學(xué)習(xí)方法有較好的識(shí)別能力,但是需要依賴于大量的數(shù)據(jù)集且需要較長(zhǎng)的訓(xùn)練時(shí)間。而小樣本學(xué)習(xí)方法旨在使用較少的樣本數(shù)量來(lái)訓(xùn)練神經(jīng)網(wǎng)絡(luò),同時(shí)能夠得到接近基于大量樣本的訓(xùn)練模型的性能[19],因此,學(xué)者們著眼于小樣本學(xué)習(xí)方法的研究。如:提出一種用于單樣本任務(wù)圖像識(shí)別的孿生神經(jīng)網(wǎng)絡(luò)模型,在Omniglot數(shù)據(jù)集上的識(shí)別能力與人工識(shí)別圖像的能力相當(dāng)[20];提出一種用于單樣本任務(wù)圖像識(shí)別的匹配神經(jīng)網(wǎng)絡(luò)模型,在Ominiglot、ImageNet數(shù)據(jù)集上分別取得了98.1%、98.9%的準(zhǔn)確率[21];設(shè)計(jì)了一種用于解決小樣本分類問(wèn)題的原型網(wǎng)絡(luò),該網(wǎng)絡(luò)學(xué)習(xí)一個(gè)度量空間,在這個(gè)度量空間內(nèi)每個(gè)類用其原型表示,而不是單個(gè)的點(diǎn),然后通過(guò)計(jì)算與該類原型的距離來(lái)實(shí)現(xiàn)小樣本分類[22]。
為了解決腦電偽跡數(shù)據(jù)集不足的問(wèn)題,本文提出一種僅使用少量腦電偽跡進(jìn)行訓(xùn)練的腦電偽跡原型網(wǎng)絡(luò)模型,旨在使用小樣本學(xué)習(xí)方法,僅使用目標(biāo)類別少量的數(shù)據(jù)來(lái)實(shí)現(xiàn)腦電偽跡檢測(cè)并保持穩(wěn)定的性能。受最新的小樣本學(xué)習(xí)方法原型網(wǎng)絡(luò)[22]的啟發(fā),設(shè)計(jì)了一個(gè)基于原型網(wǎng)絡(luò)的腦電偽跡識(shí)別模型(EEG Artifact Prototype Network,EAPNet)。該模型由特征嵌入、距離模塊和分類模塊組成,僅需使用少量的訓(xùn)練數(shù)據(jù)進(jìn)行訓(xùn)練就能得到高效的檢測(cè)性能。最后,在公開(kāi)腦電偽跡數(shù)據(jù)集TUAR上,在2-wayK-shot(K=1,5,10)任務(wù)中分別進(jìn)行了EAPNet模型與7個(gè)機(jī)器學(xué)習(xí)模型和2個(gè)深度學(xué)習(xí)模型的對(duì)比實(shí)驗(yàn)、4種度量方法的EAPNet模型的對(duì)比實(shí)驗(yàn)以及探究樣本量對(duì)EAPNet模型影響的實(shí)驗(yàn)。
小樣本學(xué)習(xí)問(wèn)題[23]可描述為:首先給定一個(gè)數(shù)據(jù)集,其中數(shù)據(jù)可以表示為X={x1,x2,…,xn},其對(duì)應(yīng)的標(biāo)簽集合可以表示為Y={y1,y2,…,yn},(xi,yi)C表示第i個(gè)數(shù)據(jù)和對(duì)應(yīng)的標(biāo)簽,C表示所有類別數(shù)據(jù)和對(duì)應(yīng)標(biāo)簽的集合;然后,在數(shù)據(jù)集中切分可見(jiàn)類數(shù)據(jù)集Cseen和不可見(jiàn)類數(shù)據(jù)集Cunseen;最后,使用可見(jiàn)類數(shù)據(jù)訓(xùn)練模型,以便模型能夠很好地泛化不可見(jiàn)類數(shù)據(jù)。本文的目標(biāo)是首先使用來(lái)自Cseen的數(shù)據(jù)訓(xùn)練模型,將訓(xùn)練后得到的模型使用Cunseen上少量的數(shù)據(jù)實(shí)現(xiàn)模型的快速適應(yīng),進(jìn)而實(shí)現(xiàn)對(duì)Cunseen的分類。小樣本學(xué)習(xí)模型的每次迭代是以任務(wù)作為對(duì)象的,小樣本學(xué)習(xí)任務(wù)被稱為N-wayK-shot任務(wù)[20],該任務(wù)構(gòu)建時(shí)從集合Cseen和Cunseen中分別采樣N個(gè)類,并且從每個(gè)類中采集K+Q個(gè)帶標(biāo)簽的樣本構(gòu)成任務(wù)T。這K個(gè)帶標(biāo)簽的樣本稱為支持集用于評(píng)估模型性能的數(shù)據(jù)集稱為查詢集其中任務(wù)T中每個(gè)類都包含Q個(gè)測(cè)試樣本。在訓(xùn)練時(shí),從Cseen中采集樣本以構(gòu)造多個(gè)任務(wù)訓(xùn)練模型;在測(cè)試時(shí),從Cunseen中采集樣本構(gòu)造多個(gè)任務(wù)來(lái)最終評(píng)估模型的識(shí)別性能。
圖1展示的是一個(gè)解決2-wayK-shot小樣本任務(wù)的EAPNet模型框架,該框架包含1個(gè)編碼器F、1個(gè)距離模塊Dist和1個(gè)分類模塊Soft。圖中表示的2類偽跡分別是顫栗偽跡和電極偽跡,即Cunseen為顫栗偽跡和電極偽跡的數(shù)據(jù)集合。需要強(qiáng)調(diào)的是這里展示的是使用模型進(jìn)行實(shí)際分類時(shí)的場(chǎng)景,使用Cseen(眼電偽跡和咀嚼偽跡的數(shù)據(jù)集合)訓(xùn)練時(shí)的場(chǎng)景與圖1所示的框架是相同的,僅比圖1多了1個(gè)反向傳播的步驟,故在此省略。另外,該框架還可以擴(kuò)展到N-wayK-shot學(xué)習(xí)任務(wù)。
圖1 EAPNet模型框架圖
在Cseen上進(jìn)行EAPNet模型的訓(xùn)練過(guò)程可描述如下:首先,在Cseen上進(jìn)行訓(xùn)練,即編碼器F從眼電偽跡和咀嚼偽跡中提取特征,將其嵌入高維空間;然后,分類模塊使用Softmax激活函數(shù),將距離模塊計(jì)算的距離負(fù)值形成概率分布;最后,使用交叉熵?fù)p失函數(shù)根據(jù)概率分布和標(biāo)簽計(jì)算損失,通過(guò)反向傳播調(diào)整編碼器參數(shù)。在Cunseen上實(shí)際進(jìn)行腦電偽跡(顫栗偽跡和電極偽跡)的預(yù)測(cè)過(guò)程可描述如下:首先,分別計(jì)算通過(guò)編碼器的顫栗偽跡和電極偽跡的信號(hào)特征原型;然后,通過(guò)距離模塊計(jì)算信號(hào)特征原型和查詢信號(hào)特征的距離;最后,分類模塊使用Softmax激活函數(shù),將距離模塊計(jì)算的距離負(fù)值形成概率分布,根據(jù)概率分布輸出查詢信號(hào)的預(yù)測(cè)標(biāo)簽。
編碼器F是EAPNet的子網(wǎng)絡(luò)結(jié)構(gòu),每次以成對(duì)的K個(gè)支持樣本和1個(gè)查詢樣本作為輸入,該編碼器結(jié)構(gòu)參考了深度學(xué)習(xí)基線模型(EEGNet)[24],可以有效地提取腦電信號(hào)時(shí)間和通道間的特征信息。因此,EAPNet模型的編碼器包含2個(gè)卷積塊和1個(gè)非線性塊:第1個(gè)卷積塊由2個(gè)時(shí)域?yàn)V波器組成,第2個(gè)卷積塊包含1個(gè)空域?yàn)V波器,非線性塊包含1個(gè)全連接神經(jīng)網(wǎng)絡(luò)。為了方便輸入CNN網(wǎng)絡(luò),把數(shù)據(jù)增加了1個(gè)維度,即處理成1×250×22的數(shù)據(jù)矩陣,矩陣每一維分別表示維度、時(shí)間和通道。在第1個(gè)卷積塊中,第1個(gè)時(shí)域?yàn)V波器使用64個(gè)大小為25×1的卷積核,捕獲10 Hz及以上的頻率信息,然后以4×1的步長(zhǎng)通過(guò)卷積核大小為4×1的最大池化層;使用16個(gè)大小為5×1的卷積核,對(duì)第2個(gè)時(shí)域?yàn)V波器的特征圖進(jìn)行篩選,然后以4×1的步長(zhǎng)通過(guò)卷積核大小為4×1的最大池化層。在第2個(gè)卷積塊中,模型的空域?yàn)V波器使用10個(gè)大小為1×22的卷積核提取腦電數(shù)據(jù)22個(gè)通道的信息。每次卷積操作后,分別使用批歸一化和指數(shù)單元(ELU)進(jìn)行非線性化。為了防止過(guò)擬合,本文使用了隨機(jī)失活神經(jīng)元技術(shù)(Dropout),并將失活概率設(shè)置為0.25。最后,把經(jīng)過(guò)時(shí)域?yàn)V波和空域?yàn)V波后輸出的特征融合,通過(guò)1個(gè)包含128個(gè)神經(jīng)元的全連接層映射到非線性高維空間,從而把經(jīng)過(guò)編碼器輸出的樣本x的高維特征表示為F(x)。圖2展示了EAPNet模型的編碼器。
圖2 EAPNet模型的編碼器圖
距離模塊采用余弦距離作為度量方法,而不是傳統(tǒng)原型網(wǎng)絡(luò)[22]中使用的歐氏距離。主要原因?yàn)椋?1)歐氏距離是計(jì)算空間中樣本間各點(diǎn)的絕對(duì)距離,與各個(gè)點(diǎn)的坐標(biāo)相關(guān);而余弦距離使用2個(gè)向量的夾角余弦值來(lái)衡量2個(gè)樣本間的差異,更注重2個(gè)向量方向上的差異。(2)圖像中每個(gè)坐標(biāo)點(diǎn)的取值范圍為0~255,均為正數(shù),更適合使用歐氏距離作為度量方法;腦電數(shù)據(jù)由于電極的特性,每個(gè)電極采樣的數(shù)據(jù)點(diǎn)是電壓的幅值,所以腦電數(shù)據(jù)的數(shù)據(jù)點(diǎn)具有正負(fù)值,更適合使用強(qiáng)調(diào)方向差異的余弦距離作為度量方法。距離模塊Dist主要是負(fù)責(zé)計(jì)算經(jīng)過(guò)編碼器輸出后的不同樣本在高維空間的余弦距離。其計(jì)算公式如下:
(1)
其中,F(xiàn)(x1)、F(x2)分別為經(jīng)過(guò)編碼器編碼的樣本x1、x2的高維向量。
分類模塊Soft主要負(fù)責(zé)將編碼器和距離模塊的輸出通過(guò)Sotfmax激活函數(shù)形成概率分布,并根據(jù)最后的概率分布實(shí)現(xiàn)分類。
(2)
假設(shè)現(xiàn)在有1個(gè)查詢樣本zq,其高維空間特征向量可表示為F(zq)。利用模型的距離模塊來(lái)計(jì)算查詢樣本高維向量F(zq)與原型CN的余弦距離,計(jì)算公式如下:
(3)
得到查詢樣本和CN的余弦距離后,通過(guò)Softmax函數(shù),將查詢樣本zq和原型CN的余弦距離的負(fù)值在類上形成概率分布。計(jì)算公式如下:
(4)
其中,Cn(n=1,2,…,N)為第n類的原型。
為了訓(xùn)練時(shí)模型有良好的評(píng)價(jià)指標(biāo),本文使用交叉熵作為損失函數(shù)Loss進(jìn)行訓(xùn)練,然后最小化損失函數(shù)。計(jì)算公式如下。
(5)
其中,n為查詢樣本數(shù)量,yi為第i個(gè)樣本的實(shí)際標(biāo)簽。
2.1.1 數(shù)據(jù)預(yù)處理 TUAR數(shù)據(jù)集是天普大學(xué)提供的腦電偽跡數(shù)據(jù)庫(kù),是目前公開(kāi)的最大的偽跡數(shù)據(jù)集,包含213個(gè)病人的5種常見(jiàn)的腦電偽跡,分別是眼動(dòng)、咀嚼、顫抖、電極干擾、肌肉偽跡;所有數(shù)據(jù)采用250 Hz和400 Hz的采樣頻率進(jìn)行采樣,包含21個(gè)電極,電極位置按國(guó)際10-20系統(tǒng)的位置排列。該數(shù)據(jù)集旨在用于幫助提高腦電事件分類算法的性能,如癲癇檢測(cè)算法。
首先,為了更好地消除信號(hào)噪聲,并改善腦電圖信號(hào)的空間信息解釋,神經(jīng)科學(xué)家常使用TCP(Temporal Central Parasagittal)雙極導(dǎo)聯(lián)組合的方式查看腦電圖[25]。 因此,本文同樣使用TCP雙極導(dǎo)聯(lián)組合的方式處理信號(hào)數(shù)據(jù),從而得到22個(gè)通道的腦電數(shù)據(jù)重參考的通道電極位置(圖3)。
圖3 帶有22通道的TCP montage標(biāo)準(zhǔn)10-20系統(tǒng)的電極位置[26]
然后,將所有的腦電數(shù)據(jù)統(tǒng)一降采樣為250 Hz,即把1秒內(nèi)采集到的腦電信號(hào)作為1個(gè)樣本。另外,為了濾除數(shù)據(jù)中無(wú)關(guān)的噪聲,本文使用1個(gè)5階的巴特沃斯濾波器(Butterworth filter)保留全部通道中0~250 Hz的腦電信號(hào)。
最后,為了保留空間信息且符合網(wǎng)絡(luò)輸入,把一維的通道位置重建為二維通道[27]。因此,EAPNet模型最后的輸入為1×250×22的矩陣。 另外,隨機(jī)選取了每類樣本的170個(gè)樣本,選取4類腦電偽跡(眼動(dòng)、咀嚼、顫栗、電極干擾)作為本文的實(shí)驗(yàn)數(shù)據(jù)。其中,將眼動(dòng)和咀嚼2類偽跡數(shù)據(jù)作為可見(jiàn)類數(shù)據(jù),將顫栗和電極干擾2類偽跡數(shù)據(jù)作為不可見(jiàn)類數(shù)據(jù)。
2.1.2 實(shí)驗(yàn)設(shè)置 實(shí)驗(yàn)使用7折交叉驗(yàn)證。EAPNet模型在訓(xùn)練期間使用眼動(dòng)和咀嚼2類偽跡數(shù)據(jù)作為Cseen進(jìn)行訓(xùn)練。在每次迭代中,將Cseen中的樣本分成2組集合:每類50個(gè)樣本作為可選的支持集,剩余的120個(gè)樣本作為查詢集。同樣地,測(cè)試時(shí)使用顫栗和電極干擾2類偽跡數(shù)據(jù)作為Cunseen,將Cunseen中的樣本分成支持集和查詢集,分布情況和訓(xùn)練時(shí)保持一致。
為了更好地評(píng)估EAPNet模型的性能,觀察模型在2-wayK-shot(K=1,5,10)任務(wù)中的分類準(zhǔn)確率。當(dāng)K=1,5,10時(shí),從50個(gè)支持集樣本中隨機(jī)選取K個(gè)作為支持樣本。本文在相同設(shè)置下,將EAPNet模型與2個(gè)深度學(xué)習(xí)模型(EEGNet、全連接神經(jīng)網(wǎng)絡(luò)(Fully Connect Neural Network,F(xiàn)NN))、7個(gè)機(jī)器學(xué)習(xí)模型(高斯貝葉斯模型(Gaussian Naive Bayes,Gaussian NB)、隨機(jī)森林模型(Random Forest,RF)、邏輯回歸模型(Logistic Regression,LR)、 套索回歸模型(Lasso Regression,Lasso)、支持向量機(jī)模型(Support Vector Machines,SVM)、嶺回歸模型(Ridge Regression,Ridge)和最近鄰算法模型(K-Nearest Neighbor,KNN))進(jìn)行性能對(duì)比。
由于實(shí)驗(yàn)結(jié)果可能會(huì)因?yàn)檫x取的支持集樣本不同而出現(xiàn)差異,本文的實(shí)驗(yàn)重復(fù)進(jìn)行了30次支持集的隨機(jī)采樣,將平均準(zhǔn)確率和標(biāo)準(zhǔn)差作為最終的實(shí)驗(yàn)統(tǒng)計(jì)結(jié)果。
訓(xùn)練EAPNet模型時(shí)采用Adam優(yōu)化器加速訓(xùn)練過(guò)程。實(shí)驗(yàn)表明:學(xué)習(xí)率設(shè)置為10e-6時(shí),模型的訓(xùn)練效果最好。
不同模型的對(duì)比實(shí)驗(yàn)結(jié)果(圖4)表明: 在2-wayK-shot(K=1,5,10)任務(wù)中,EAPNet模型的性能最優(yōu)。具體表現(xiàn)在:
圖4 10個(gè)模型的準(zhǔn)確率對(duì)比
(1)在K=1,5,10時(shí),EAPNet模型的準(zhǔn)確率分別是69.44%、77.21%、80.01%, 均高于對(duì)比的7個(gè)機(jī)器學(xué)習(xí)模型和1個(gè)深度學(xué)習(xí)模型(EEGNet模型)。
(2)在K=5,10時(shí),EAPNet模型的性能提升幅度最高,且保持較好的穩(wěn)定性。
(3)EAPNet模型得益于神經(jīng)網(wǎng)絡(luò)強(qiáng)大的數(shù)據(jù)表征能力,對(duì)偽跡信號(hào)所提取的特征泛化能力強(qiáng)于7個(gè)機(jī)器學(xué)習(xí)模型。與EEGNet模型相比,有以下2個(gè)方面的優(yōu)點(diǎn):
①防止過(guò)擬合。EEGNet模型使用的基于原型網(wǎng)絡(luò)的方法是一種基于度量的小樣本學(xué)習(xí)方法,不僅有神經(jīng)網(wǎng)絡(luò)強(qiáng)大的數(shù)據(jù)表征能力,還很好地解決了因?yàn)閿?shù)據(jù)太少導(dǎo)致的過(guò)擬合問(wèn)題。具體地講,神經(jīng)網(wǎng)絡(luò)分類器會(huì)存在一個(gè)高維的嵌入空間。即在原型網(wǎng)絡(luò)中假設(shè)存在這樣一個(gè)嵌入空間,在這個(gè)嵌入空間中每個(gè)類別數(shù)據(jù)的點(diǎn)會(huì)圍繞一個(gè)原型。為了實(shí)現(xiàn)這一點(diǎn),需要使用神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)輸入到嵌入空間的非線性映射,并將其在嵌入空間中的支持集的平均值作為類的原型,可以把原型認(rèn)為是每個(gè)類的具有代表性特征的表示。但是,傳統(tǒng)的深度學(xué)習(xí)網(wǎng)絡(luò)存在目標(biāo)類別數(shù)據(jù)有限而造成的過(guò)擬合問(wèn)題,從而無(wú)法利用目標(biāo)數(shù)據(jù)學(xué)習(xí)到有效的嵌入空間。而原型網(wǎng)絡(luò)可以充分地利用非目標(biāo)類別的數(shù)據(jù),從而學(xué)習(xí)到一個(gè)在目標(biāo)類別數(shù)據(jù)中也表現(xiàn)良好的嵌入空間。因此,原型網(wǎng)絡(luò)在嵌入空間對(duì)非目標(biāo)數(shù)據(jù)進(jìn)行學(xué)習(xí)后,將少量的目標(biāo)數(shù)據(jù)輸入嵌入空間,然后從嵌入空間中計(jì)算原型和度量來(lái)實(shí)現(xiàn)分類,而無(wú)需使用目標(biāo)數(shù)據(jù)來(lái)學(xué)習(xí)這個(gè)嵌入空間,從而避免了傳統(tǒng)深度學(xué)習(xí)在數(shù)據(jù)量不足時(shí)容易帶來(lái)的過(guò)擬合問(wèn)題。
②提取的特征更加具有遷移性。原型網(wǎng)絡(luò)屬于度量學(xué)習(xí)的一種小樣本學(xué)習(xí)方法,可以用于判斷數(shù)據(jù)間的異同。該網(wǎng)絡(luò)的嵌入空間提取的信息是用于區(qū)別數(shù)據(jù)之間異同的高維特征,可以認(rèn)為該嵌入空間的信息是可遷移的,即使在面對(duì)訓(xùn)練時(shí)沒(méi)見(jiàn)過(guò)的類別數(shù)據(jù)時(shí)也能有良好的性能。而傳統(tǒng)的深度學(xué)習(xí)網(wǎng)絡(luò)一般只針對(duì)目標(biāo)數(shù)據(jù)進(jìn)行學(xué)習(xí),其嵌入空間只對(duì)網(wǎng)絡(luò)學(xué)習(xí)過(guò)的數(shù)據(jù)類別有效,無(wú)法遷移到其他數(shù)據(jù)類別。
本文分別采用歐氏距離(Euclidean)、余弦距離(Cosine)、切比雪夫距離(Chebyshev) 和曼哈頓距離(Manhattan)4種常見(jiàn)的度量方法進(jìn)行對(duì)比實(shí)驗(yàn),觀察將EAPNet模型的度量方法更換成其他度量方法后的模型準(zhǔn)確率。由實(shí)驗(yàn)結(jié)果(表1)可知在小樣本情況下,余弦距離在本實(shí)驗(yàn)中確實(shí)是最適用的度量方法:當(dāng)K=1,5時(shí),使用余弦距離為度量方式的準(zhǔn)確率最高;當(dāng)K=10時(shí),使用余弦距離為度量方式的準(zhǔn)確率僅略低于使用歐氏距離的。
表1 不同度量方法的EAPNet模型的準(zhǔn)確率
已有研究[21]表明在N-wayK-shot任務(wù)中,N和K的設(shè)置會(huì)影響準(zhǔn)確率:當(dāng)N越小或者K越大時(shí),準(zhǔn)確率越高。為了驗(yàn)證EAPNet模型是否符合這個(gè)規(guī)律,本文研究在2-wayK-shot(K=1,2,5,10,15,20)任務(wù)中的準(zhǔn)確率和標(biāo)準(zhǔn)差。由結(jié)果(圖5)可知:隨著K值的增加,EAPNet模型的準(zhǔn)確率不斷提高,模型的性能更加穩(wěn)定。究其原因?yàn)椋涸诰W(wǎng)絡(luò)結(jié)構(gòu)一定的情況下,每類數(shù)據(jù)選取的樣本越多,樣本所能涵蓋的范圍分布越廣,其特征平均值(原型)對(duì)該類的表征越準(zhǔn)確。
圖5 在2-way K-shot(K=1,2,5,10,15,20)任務(wù)中EAPNet模型的準(zhǔn)確率和標(biāo)準(zhǔn)差
本文使用小樣本學(xué)習(xí)方法來(lái)解決腦電偽跡檢測(cè)問(wèn)題,提出了一種基于原型網(wǎng)絡(luò)的腦電偽跡識(shí)別模型(EAPNet)。該模型在目標(biāo)類別樣本有限的情況下,實(shí)現(xiàn)了對(duì)腦電偽跡的正確識(shí)別,其檢測(cè)識(shí)別性能優(yōu)于其他基線方法的。另外,受益于深度學(xué)習(xí)網(wǎng)絡(luò)強(qiáng)大的數(shù)據(jù)表征能力,該模型僅對(duì)輸入信號(hào)數(shù)據(jù)做了極少的預(yù)處理,而由深度學(xué)習(xí)網(wǎng)絡(luò)自動(dòng)地從原始信號(hào)中提取更深層的特征,從而實(shí)現(xiàn)了端到端的腦電偽跡識(shí)別。
本研究也表明,在腦電偽跡檢測(cè)中,小樣本學(xué)習(xí)方法是一種具有優(yōu)越性能和發(fā)展前景的方法,其有望提高腦電偽跡的檢測(cè)能力,從而得到更高質(zhì)量的腦電信號(hào),因此,基于小樣本學(xué)習(xí)的偽跡檢測(cè)方法有利于提高基于腦電圖技術(shù)的腦機(jī)接口系統(tǒng)的性能。