付榮榮, 李 朋, 劉 沖, 張 揚
(1.燕山大學 電氣工程學院,河北 秦皇島 066004; 2.東北大學 機械工程與自動化學院,遼寧 沈陽 110819; 3.沈陽機床(集團)有限責任公司 設計研究院,遼寧 沈陽 110142)
腦-接口(brain-computer interface, BCI)檢測由大腦活動產(chǎn)生的電信號,并轉換為輸出,將用戶的意圖傳達給外界[1,2]。研究表明肢體運動的想象可以改變腦電活動,并且可以在特定運動想象任務下獲得不同的腦電圖(electroencephalography, EEG)模式[3]。腦機接口研究中廣泛應用的EEG信號主要有3種類型:事件相關電位、穩(wěn)態(tài)視覺誘發(fā)電位、運動想象電位(motor imagery potentials, MIs)。本文主要針對的是基于MI對BCI性能的研究。
為了從MI信號中解碼受試者的意圖,人們提出了各種方法來對MI信號進行識別并分類等,如線性判別分析(LDA)、高斯分類器(Gaussian classifier)、概率神經(jīng)網(wǎng)絡(probabilistic NN)。LDA的基本思想是通過一個線性映射將測試樣本的數(shù)據(jù)映射到特征空間,使同類模式樣本間距離較近,不同模式樣本間距離較遠[4],在對新樣本進行分類時,將其投影到同樣的直線上,再根據(jù)投影點的位置來確定新樣本的類別。QDA獲得二次邊界,其中二次曲面將可變空間劃分為區(qū)域[5]。QDA允許區(qū)分具有顯著不同的類特定協(xié)方差矩陣的類,并為每個類形成單獨的方差模型,而類群表示具有相同均值的多元正態(tài)分布[6]。RDA是LDA和QDA之間的折中,是一種正則化技術,因此更適用于存在許多潛在相關特征的情況。最近均值分類器是將最接近觀測量的訓練樣本類別的標簽分配給觀測量。加權最近均值分類器是其類權重與類內(nèi)測量變量的平均方差成反比。由于這些方法提供了不同的決策,融合多種方法整合[7]不同決策是一種可行的方法,以提高整體分類準確率。
在一些腦機接口研究中,融合方法的測量包括整合腦電圖模式、信號特征或分類決策。Liu等人將BCI決策與計算機版本相結合,實現(xiàn)了對目標圖像的高精度分類[8]。萬柏坤等人采用二維時頻分析結合Fisher分析的方法特征提取[9]。這些研究已經(jīng)證明了融合方法優(yōu)越性。王瑞敏等人用短時傅里葉變換分解轉變成多頻段的時頻信號[10],然后采用CSP[11]結合支持向量機(SVM)方法對單個導聯(lián)上的運動想象腦電信號分類識別,但在減少導聯(lián)時,識別正確率大幅下降。
本文的主要目的是整合兩種不同方法的決策協(xié)議,以提高腦-機接口系統(tǒng)的分類準確率??紤]到每次試驗腦電圖數(shù)據(jù)的分類結果,兩種方法通常給出不同的決策。通過識別一個錯誤判斷而另一個正確判斷的試驗,可以提高分類性能。融合他們的決策是提高整體性能的有效方法,基于這一思想,本文提出了一種新的決策選擇器(DS, decision selector),整合兩種基于LDA的算法選擇更有可能是準確的決策。本研究實現(xiàn)了BCI研究中常用的5種基于LDA的分類算法,即LDA、QDA、RDA、最近均值、加權最近均值,并評估所提出的DS方法的綜合性能。
為了評估DS方法的性能,通過離線實驗來獲得基準數(shù)據(jù)集。試驗在隔音效果良好的房間內(nèi)進行,實驗設備采用Emotiv頭盔采集受試者14導(AF3,F7,F3,FC5,T7,P7,O1,O2,P8,T8,FC6,F4,F8,AF4)的腦電信號,其電極分布采用10~20國際標準導聯(lián)定位,采樣頻率為128 Hz。試驗數(shù)據(jù)通過USB接口傳送到計算機。本試驗共10名(6男,4女)健康參與者參與試驗,排除標準是視覺、神經(jīng)或精神疾病或任何現(xiàn)有藥物的任何歷史,所有受試者均閱讀并簽署了知情同意書。每位受試者共進行6個線下實驗區(qū)塊,每個區(qū)塊包含120個實驗,左手和右手各為60。
正式采集之前,受試者均完成了練習試驗,以確保熟悉并正確理解任務。試驗時,受試者保持放松,盡量避免眼動,坐在距離眼睛約60 cm的舒適的LED顯示器前面并有數(shù)字鍵盤放置在受試者面前。在試驗過程中,受試者需要完成邊界回避任務,這是一種高難度的感覺運動任務,受試者需在規(guī)定的范圍內(nèi)操縱虛擬的呈有小球的碗,若碗從右側B位置超出邊框范圍,并且整個過程球未溢出碗則任務成功;若碗從左側A位置超出邊框范圍,或者在這個過程中球從碗中溢出,則任務失敗。碗-球的初始位置在A位置。針對本試驗的特點,截取下述兩組數(shù)據(jù)進行分析處理。假設在一段時間內(nèi)對碗施加一個方向向左的力,在受到這個力之前碗是向右移動的,而球相對于碗會向左;由于慣性的作用,一段時間之后碗才會向左移動,反之亦然。分別截取這一段時間內(nèi)的前1 s和后1 s的數(shù)據(jù)。
2.2.1 LDA
LDA基本思想是:將數(shù)據(jù)在低維度上進行投影,投影后希望最大化類間散度矩陣,同時最小化類內(nèi)散度矩陣[12~15]。具體過程如下:
(1) 計算每類樣本的均值向量μj
(1)
式中:j=1,2;μj為第j類樣本的均值;Xj為第j類樣本的集合;Nj是第j類樣本的個數(shù),即每次實驗的數(shù)據(jù)點數(shù)。
(2) 計算樣本的協(xié)方差矩陣∑j
(2)
可得到類內(nèi)散度矩陣Sw為:
Sw=∑1+∑2
(3)
同時定義類間散度矩陣Sb為:
Sb=(μ1-μ2)(μ1-μ2)T
(4)
(3) 優(yōu)化目標為J(w)
(5)
y=wTX
(6)
2.2.2 LDA方法的擴展
QDA旨在找到輸入特征的變換,它能夠最好地區(qū)分數(shù)據(jù)集中的類。QDA的基本思想如下:假設樣本數(shù)據(jù)服從多元高斯分布,其概率密度函數(shù)為:
(7)
式中:x是一個p維向量。
多元分類判別是將樣本歸于求對數(shù)后驗概率,對公式兩邊同時求對數(shù)簡化就可以得到QDA判別公式:
(8)
式中:|∑i|是廣義方差值;P(ωi)是先驗概率;μi是均值向量;∑i是第i個類別中所取樣本的每個特征之間的協(xié)方差所構成的協(xié)方差矩陣:
(9)
RDA思想,分類目的是根據(jù)從每個對象或觀察獲得的一組測量值X=(X1,X2,…,Xn)將對象分配給幾個(K)組類中的一組。在訓練數(shù)據(jù)中,數(shù)據(jù)類別是已知的,因此類別k的先驗概率和平均值為:
(10)
(11)
式中:ω是樣本總數(shù);ωk是類別k的樣本數(shù);c是類別總數(shù);xn是樣本點。類別k的協(xié)方差矩陣為:
(12)
在LDA中,每一類的協(xié)方差矩陣是相等的,即∑k=∑。正則判別分析(RDA)通過修改奇異協(xié)方差值來改善多重共線性的影響。每個類別的樣本協(xié)方差估計如下:
(13)
通過引入收縮參數(shù)γ進一步調整協(xié)方差矩陣。
(14)
式中:p是自變量的維數(shù);I是單位矩陣。
類判別得分可以記為:
ln|∑k(λ,γ)|-2 ln(πk)
(15)
最近均值分類器與Rocchio算法的相關性反饋相似,又稱為Rocchio分類器,基本原理是將最接近觀測量的訓練樣本類別的標簽分配給觀測量[16,17]。假設一組樣本為{(x1,y1),…,(xn,yn)},其中xi是p維度量空間的一個特征向量,標簽yi=[-1,+1],用f(x)表示樣本x的預測標簽,具體過程如下:
(1) 計算每一類樣本的均值μn:
(16)
式中:Cn是屬于類n∈Y的樣本索引集。
(2) 分配給一個樣本x的類別是
(17)
(18)
式中:p是特征向量的維度。
加權最近均值分類器是最近均值分類器的擴展,其類權重與類內(nèi)測量變量的平均方差成反比[18]。在此假設和第一步與上述最近均值分類器的相同,則分配給一個樣本x的類別是:
(19)
(20)
式中:M是一個對角陣,mjj=mj≥0,mj是特征或維度j的加權因子。加權最近均值的訓練定義為在必須正確分類所有訓練對象的條件下為給定訓練數(shù)據(jù)集找到適當?shù)臋嘀?。形式上可以寫成?/p>
(21)
在上文中對這些基于LDA的算法性能進行了研究和比較,其中QDA和RDA算法最為優(yōu)秀。但是,考慮到M1和M2兩種算法對所有試驗的分類結果,在很多試驗中M1決策是錯誤的,而M2決策是正確的,應該通過識別這些試驗并為它們選擇M2決策來提高分類性能。基于此思想,本文提出了一種DS方法,通過從M1和M2算法中選擇更有可能準確的決策來提高基于MI的BCIs的分類精度。使用兩種算法對同一試驗的腦電圖數(shù)據(jù)進行分類,就受試者的意圖做出了兩個獨立的決定。DS方法判斷哪個決策更可能是準確的。為了訓練DS方法,根據(jù)M1和M2算法的分類結果,將訓練試驗分為both-true、both-false、M1-false和M2-false共4類。在一次雙對試驗中,這兩種算法做出了相同且正確的決定。在雙假試驗中,兩種方法的決定都與被試的意圖不一致。所提出的從兩個錯誤決策中選擇一個的DS方法也會給出一個錯誤的結果。結果,M1-false和M2-false試驗被用來訓練DS方法。
DS方法主要是由特征提取、分類和決策選擇等3個模塊組成,如圖1所示。DS方法輸入M1和M2算法的決策和相關系數(shù),輸出更有可能是正確的決策。測量每一個決策的概率,提取模塊提取M1和M2的相關系數(shù)并生成一個特征向量F如下:
圖1 DS方法圖Fig.1 DS method chart
(22)
分類模塊使用線性SVM分類器將特征向量F分為M1-false和M2-false兩類。SVM分類器的目標是將特征向量F投影為標量值,具體如下:
(23)
(24)
式中:δj是松弛變量,表示樣本vj是否在邊緣內(nèi),需要調節(jié)程度;C是控制寬度和誤分類權衡的調節(jié)系數(shù)。
決策選擇模塊根據(jù)分類結果選擇M1或M2算法的決策輸出,如式(25)所示。如果得到一個M1-false結果,則輸出M2決策。否則,輸出M1決策。
(25)
圖2說明了所提DS方法的訓練和測試的過程。在訓練階段,使用另一個交叉驗證來提取M1-false和M2-false特征。具體來說,M1和M2算法使用訓練數(shù)據(jù)集中的4個塊進行訓練,并在每一輪中對剩余的塊進行分類。根據(jù)分類結果,在每個訓練周期的5輪中提取并記錄M1-false和M2-false試驗的DS特征F,即總共測試200次試驗。利用記錄的M1-false和M2-false特征來訓練DS方法。
圖2 DS方法的訓練和測試Fig.2 Training and testing of DS method
在測試階段,使用所提出的DS方法對LDA、QDA、RDA、最近均值、加權最近均值5種基于LDA的分類算法進行了綜合。估計了所有組合的分類準確率。估計了所有組合的分類準確率和信息傳遞率(ITR)。以bit/min為單位的ITR定義如下:
(26)
式中:P為準確率;N為類數(shù)(即本研究中N=120);T為一次選擇所需的時間。
綜合LDA、QDA、RDA、最近均值、加權最近均值5種基于LDA的分類算法,所提DS方法的分類準確率如表1所示。性能以1 s的數(shù)據(jù)長度進行評估。結果數(shù)據(jù)由5行5列組成,每一行對應一個分類算法。主對角線單元格表示各算法的平均精度,其他單元格表示將兩種相應算法集成在一起的DS方法的平均精度。在表1的DS結果中,加粗表示的單元格表示DS方法的性能優(yōu)于兩種算法,余下的單元格表示DS方法比兩種算法的精度第二高。例如,數(shù)據(jù)長度為1 s的DS-QDA&LDA方法的準確率為90.56%,高于LDA方法的86.36%,但低于QDA方法的93.70%。然而,QDA和LDA方法的準確率有7.34%的差異。表1中的測試結果也表明,將QDA或RDA算法與低精度算法相結合的DS方法性能下降。本研究計算了兩種算法在各DS組合前后的分類精度。這些結果表明,DS法融合兩種算法精度相差很大時候不提高整體分類準確率。而結合兩種性能比較接近的算法的DS-QDA&RDA方法,在數(shù)據(jù)長度為1 s時,準確率最高為94.21%。本研究采用DS-QDA&RDA方法作為進一步分析的代表性方法,并通過不同參數(shù)對其性能進行評估:數(shù)據(jù)長度(即s)、子帶數(shù)(即m)、訓練塊數(shù)(即t)。
表1 DS后的分類準確率Tab.1 Classification accuracy after DS (%)
圖3(a)顯示了DS-QDA&RDA方法受試者中的平均分類準確率。使用1.1~2 s之間的不同數(shù)據(jù)長度(間隔為0.1 s)評估性能。結果表明,提出的DS-QDA&RDA方法獲得了最高的精度,與數(shù)據(jù)長度無關。配對t檢驗顯示,DS-QDA&RDA方法的準確率顯著高于QDA方法(p<0.01),數(shù)據(jù)長度為1.3~2 s的準確性顯著高于RDA方法(p<0.001)。在數(shù)據(jù)長度為1.2 s時,DS-QDA&RDA與RDA的分類精度之間無顯著差異。圖3(c)顯示了用于訓練DS的QDA-false和RDA-false試驗的百分比。這些數(shù)值反映了所提出的DS方法在理論上可以取得理想的性能改善。
圖3 DS-QDA&RDAFig.3 DS-QDA&RDA
圖4比較了不同子帶數(shù)和不同訓練塊數(shù)的3種方法的分類準確率。數(shù)據(jù)長度設置為1 s,其中DS-QDA&RDA方法獲得的ITR最高。配對t檢驗顯示,無論子帶數(shù)目如何,DS-QDA&RDA方法的分類準確率均顯著高于RDA方法(p<0.001)。如圖4(b)所示,無論訓練塊數(shù)多少,3種方法每對之間均有顯著性差異(p<0.05)。值得注意的是,訓練塊由1塊用于測試QDA-false和RDA-false試驗,其他塊用于訓練QDA和RDA方法。如圖2所示,當訓練塊數(shù)為5時,QDA和RDA方法實際上使用的是4塊數(shù)據(jù)集進行訓練。
圖4 平均分類準確率Fig.4 The average classification accuracy
本文提出了一種新的DS方法,通過在決策層融合兩種基于LDA的算法來提高性能。為了驗證其在增強基于MI的BCI方面的有效性,本文實現(xiàn)了BCI研究中常用的5種算法,即LDA、QDA、RDA、最近均值、加權最近均值,并評價了DS方法對這些算法的綜合性能。實驗結果表明,DS方法結合了精度相近的算法對,提高了分類性能。如表1所示,驗證了所提出的DS方法可以提高多對基于LDA算法的性能。其中,DS-QDA&RDA方法在數(shù)據(jù)長度為1 s時的準確率最高,為94.21%。本研究采用DS-QDA&RDA作為實驗方法,在不同參數(shù)下,其準確性均優(yōu)于QDA和RDA算法。
雖然得到了較好結果,但DS方法也顯示出將精度相差很大的算法集成在一起的局限性。如數(shù)據(jù)長度為1 s的DS-LDA&QDA方法在綜合低精度的LDA算法(86.36%)后,綜合后(90.56%)精度比QDA算法(93.70%)低。實驗結果表明,LDA和加權最近均值算法的準確率相對接近,融合后也有提升(分別為86.36%和84.09%)。
提出了基于LDA的兩種不同分類決策方法的DS方法。提高DS性能的關鍵問題之一在于評估每個決策的不確定性。對QDA和RDA算法提取相對應的綜合相關系數(shù)ρn。為了訓練DS方法,提取了兩種方法的最大和第二大組合相關特征。
圖5(a)和圖5(b)是用于訓練DS-QDA&RDA方法的DS特征,在所有10名受試者的QDA-false和RDA-false試驗中獲得。紅色圓圈點表示QDA錯誤試驗的特征,藍色五邊形點表示RDA錯誤試驗的特征。
圖5 和的特點及和特點Fig.5 The characteristics of and and
本文中構造了如式(2)所示的特征向量,并訓練了一種用于分離QDA-false和RDA-false特征的DS-QDA&RDA方法。如圖3所示,DS-QDA&RDA顯著提高了分類精度和ITR。這些結果表明,本文提出的DS特征能有效地集成QDA和RDA等不同方法,提高基于MI的BCI的分類準確率。
為了顯示DS-QDA&RDA分類方案的有效性,將其與幾種現(xiàn)有的分類方法進行比較:1) 基于k-NN的方法。如果一個樣本在特征空間中的k個最相似樣本中的大多數(shù)屬于某個類別,則該樣本也屬于這個類別。2) 基于Tree的方法。通過把樣本集數(shù)據(jù)從根節(jié)點分裂到葉子節(jié)點來對樣本實現(xiàn)分類。在提取腦電特征之后,分別用上述方法進行分類,結果顯示在表2。
表2 DS方法與k-NN和Tree的性能比較Tab.2 Performance comparison of DS method with k-NN and tree
表2中,k-NN,Tree(使用MATLAB 2016a中的工具箱Classification Learner)和本文的DS-QDA&RDA方法以及集成前的兩種方法做比較。平均而言,本文提出的基于DS-QDA&RDA的方法所獲得的準確度比現(xiàn)有兩種方法獲得的準確度均要高,這表明提出的方案具有顯著的優(yōu)越性能。
本文提出了一種基于集成線性分析的決策融合分類方法,針對有約束的動態(tài)復雜對象控制任務中的腦電信號進行了分類研究,利用本文提出的方法結合試
驗任務的特點,將獲取的EEG信號進行預處理、提取,將得到的特征信息分別采用5種基于LDA的算法以及其融合后的方法法進行模式分類。尤其是DS-QDA&RDA,得到了較好的分類結果平均準確率為0.942 1±0.021 3,且均高于融合前的兩種方法的準確率。研究結果表明,融合后,分類效果有所提高,且兩種方法的分類效果越接近,提高的幅度越明顯。為了說明本文所提方法的有效性,與現(xiàn)有的幾種方法k-NN,Tree進行了比較。結果顯示,本文提出的基于集成線性分析的決策融合的方法所獲得的準確度比現(xiàn)有的兩種方法獲得的準確率均要高,在參數(shù)優(yōu)化方面更加靈活,這表明提出的方案具有顯著的優(yōu)越性能。