摘 要:文章針對(duì)BCI Competition 2003的Data set IIb競(jìng)賽數(shù)據(jù),取得了一個(gè)很高的字符分類識(shí)別準(zhǔn)確率,文章突出在數(shù)據(jù)預(yù)處理階段中,通過很多次程序驗(yàn)證比較不同頻帶域的測(cè)試準(zhǔn)確率,得出了一個(gè)最佳的頻帶范圍,用于原始數(shù)據(jù)的濾波過程。
關(guān)鍵詞:腦機(jī)接口;P300;預(yù)處理;特征提取;分類算法
1 引言
腦機(jī)接口(BCI)是一個(gè)系統(tǒng),允許用戶與環(huán)境的溝通,只有通過大腦活動(dòng),而無需使用肌肉輸出通道。它涉及了神經(jīng)科學(xué),信號(hào)檢測(cè),信號(hào)處理,模式識(shí)別等多種領(lǐng)域。要建立大腦和外界設(shè)備之間的聯(lián)系,首先要測(cè)量大腦活動(dòng),然后進(jìn)行處理分析信號(hào)數(shù)據(jù),再進(jìn)行機(jī)器學(xué)習(xí)(訓(xùn)練分類模型)實(shí)行分類,進(jìn)而實(shí)現(xiàn)用戶的意圖。P300電位是當(dāng)視覺受到外界特殊刺激時(shí)腦電信號(hào)出現(xiàn)一個(gè)波峰,其峰值大約出現(xiàn)在相關(guān)事件發(fā)生后的300ms。其優(yōu)勢(shì)特點(diǎn)是被試驗(yàn)之前不需要進(jìn)行訓(xùn)練即可成功誘發(fā)出來。因此P300電位是腦-機(jī)接口常用的一種信號(hào)。文中所用數(shù)據(jù)是BCI Competition 2003的Data set IIb離線數(shù)據(jù)集。大致處理過程可以描述為:原始信號(hào)數(shù)據(jù)→預(yù)處理→特征選擇與提取→選擇并訓(xùn)練分類模型→分類結(jié)果→測(cè)試分類算法效果→根據(jù)效果調(diào)整分類模型→得出理想的分類結(jié)果。
2 處理數(shù)據(jù)的算法步驟
2.1 單次樣本提?。阂?yàn)镻300電位一般出現(xiàn)在刺激后的300ms左右,所以通過分類精度驗(yàn)證后,本文截取從每次閃爍開始后100ms到700ms長度的數(shù)據(jù)作為一個(gè)單次樣本,這樣將訓(xùn)練集的前30個(gè)Trial的數(shù)據(jù)組成一個(gè)30×12×15×144×64維的原始特征空間。
2.2 數(shù)據(jù)預(yù)處理:由于采集到的原始數(shù)據(jù)中一般會(huì)含有眼電,肌肉以及外界干擾等因素(如測(cè)量儀器或環(huán)境干擾等)的噪音信號(hào),以及P300電位的低頻特性,所以需要對(duì)原始數(shù)據(jù)進(jìn)行預(yù)處理,本文主要涉及數(shù)據(jù)精度的轉(zhuǎn)化以及低通濾波。論文突出在打破了前人已有經(jīng)驗(yàn)的限制,將P300電位的頻帶范圍更加精確化,更是體現(xiàn)了P300電位的低頻特征,文章選擇采用Matlab自帶的信號(hào)處理工具箱設(shè)計(jì)了一個(gè)合適的濾波器,以帶通替代低通設(shè)計(jì)了10階Butterworth(IIR)帶通濾波器,帶寬為0.05Hz~7.5Hz。不同頻帶域?qū)?yīng)的實(shí)驗(yàn)準(zhǔn)確率如表1。其中10階可以通俗理解為過濾次數(shù),一般來說過濾次數(shù)越多濾波效果就越好,但是同時(shí)也加重了程序運(yùn)行負(fù)擔(dān),因此選擇適當(dāng)?shù)臑V波階數(shù)也是很關(guān)鍵的一步。
表1
2.3 特征選擇與提取:首先對(duì)電極進(jìn)行篩選,因?yàn)椴⒉皇撬须姌O都能明顯體現(xiàn)P300特征,所以需要把那些P300特征比較明顯的電極篩選出來。通過多次準(zhǔn)確率比較論文選擇了22個(gè)導(dǎo)聯(lián)(用Ne表示)作為特征電極,對(duì)應(yīng)編號(hào)為:11,13,14,18,19,20,34,47,51-64。比較準(zhǔn)確率時(shí)采用隨機(jī)增加通道,能提高準(zhǔn)確率的通道保留,反之舍棄的方法。其次,為了提高訓(xùn)練模型的速度,需要對(duì)特征空間進(jìn)行降維處理,本文嘗試過兩種降維方式,一是將相鄰6個(gè)采樣點(diǎn)的平均值作為一個(gè)特征點(diǎn),二是每隔6個(gè)采樣點(diǎn)取一個(gè)特征點(diǎn),事實(shí)證明后者的程序簡(jiǎn)單而且準(zhǔn)確率并高于前者,所以采用后者的方法將預(yù)處理后的數(shù)據(jù)降維。再關(guān)于試驗(yàn)重復(fù)次數(shù)求平均,至此每個(gè)Trial只剩24個(gè)特征點(diǎn)(用Ne表示)。并將其特征電極與特征點(diǎn)結(jié)合考慮作為每個(gè)Trial的特征向量。這樣將得到前30個(gè)訓(xùn)練數(shù)據(jù)的特征空間為(30·12)×(Ne·Nt)即為360×528維的特征空間。
2.4 規(guī)范化特征空間:就是將特征空間向量投射到特定的小范圍內(nèi),如-1.0~1.0或0.0~1.0。文章采用向量單位化的方法將其投射到0.0~1.0范圍內(nèi)。規(guī)范化可以消除數(shù)值型屬性因?yàn)榇笮〔灰欢鴰淼奶卣鞣诸惼?。這個(gè)過程對(duì)于提高腦機(jī)接口信息傳遞效率很重要。
2.5 訓(xùn)練分類模型:將特征提取得到的已知目標(biāo)字符的數(shù)據(jù)作為訓(xùn)練集,利用C-SVC(C-支持向量分類)選擇線性核函數(shù)u'*v對(duì)其進(jìn)行訓(xùn)練,其中樣本特征是屬于二分類樣本集,分別用-1和1標(biāo)記兩種樣本類別。
3 分類結(jié)果
將訓(xùn)練出的分類器應(yīng)用于等量的未知目標(biāo)字符的測(cè)試數(shù)據(jù)集,推斷出所選擇的字符。并計(jì)算分類準(zhǔn)確率:Accuracy=■×100%。論文通過上述算法得到的最高準(zhǔn)確率達(dá)90.00%。相應(yīng)不同重復(fù)次數(shù)文章分別測(cè)試了對(duì)應(yīng)準(zhǔn)確率,見圖1。
圖1
4 結(jié)束語
文中選擇了22個(gè)通道數(shù)據(jù)進(jìn)行處理得到了很好的分類效果,但是否這22個(gè)特征電極就適用任何群體的實(shí)驗(yàn)數(shù)據(jù),本文并未明確給出。但至少文中所用的通道及其篩選方法可以為相關(guān)研究者提供參考。論文關(guān)于P300電位的低頻特性到底低到什么程度也只是對(duì)文中所用數(shù)據(jù)作了驗(yàn)證,是不是普遍結(jié)論還有待這方面的研究者進(jìn)一步探討。總之本文所用的處理算法對(duì)提高整個(gè)BCI系統(tǒng)的總體數(shù)據(jù)傳輸率起了積極作用。
參考文獻(xiàn)
[1]程明,高上凱,張琳.基于腦電信號(hào)的腦-計(jì)算機(jī)接口[J].北京生物醫(yī)學(xué)工程,2000,19(2):113-118.
[2]楊立才,李佰敏,李光林,等.腦-機(jī)接口技術(shù)綜述[J].電子學(xué)報(bào),2005.
[3]Lin Zhonglin,Zhang Changshui.Enhancing classification by perceptual characteristic for the P300 speller paradigm [A].In :Proceedings of the 2nd International IEEE EMBS Conference on Neural Engineering,Arlington : IEEE EMBS,2005,574 -576.
作者簡(jiǎn)介:林亞靜(1985,11-),女,漢,陜西西安人,研究方向:信息理論與應(yīng)用,碩士學(xué)歷。