• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      一種對fMRI數(shù)據(jù)分類的加權(quán)隨機SVM集群算法

      2019-10-18 02:57:59王志剛胥茜畢夏安
      軟件導刊 2019年9期

      王志剛 胥茜 畢夏安

      摘 要:如何從小樣本、高維度特性的功能磁共振成像(fMRI)數(shù)據(jù)中識別出內(nèi)在的腦區(qū)活動模式,對理解人腦意義重大。隨著模式識別技術(shù)和機器學習算法的發(fā)展,fMRI的分類研究也引起了人們的重視。提出一種對fMRI數(shù)據(jù)分類的加權(quán)隨機SVM集群(WRSVMC)算法。該算法分為兩步,首先通過隨機選擇樣本和特征建立多個SVM,以構(gòu)建集成分類器;然后在投票過程中,對每個SVM賦權(quán)重,以優(yōu)化模型的集成性能。結(jié)合fMRI數(shù)據(jù)和圖論特征,采用WRSVMC算法對輕度認知障礙(MCI)患者數(shù)據(jù)展開分類研究。結(jié)果表明,準確率最高可達87.67%。該方法能幫助醫(yī)師對MCI患者進行輔助診斷。

      關(guān)鍵詞:fMRI分類;加權(quán)隨機SVM集群;圖論特征;輕度認知障礙

      DOI:10. 11907/rjdk. 191824 開放科學(資源服務)標識碼(OSID):

      中圖分類號:TP312文獻標識碼:A 文章編號:1672-7800(2019)009-0093-04

      A Weighted Random SVM Cluster Algorithm for Classifying fMRI Data

      WANG Zhi-gang, XU Qian, BI Xia-an

      (College of Information Science and Engineering, Hunan Normal University, Changsha 410081, China)

      Abstract: How to identify intrinsic brain activity patterns from small-sample and high-dimensional functional magnetic resonance imaging (fMRI) data is of great significance for understanding the human brain. With the development of pattern recognition technology and machine learning algorithm, the classification of fMRI has also attracted people's attention. This paper presents a weighted random SVM cluster (WRSVMC) algorithm for fMRI data classification. The algorithm is divided into two steps. Firstly, multiple SVMs are established by randomly selecting samples and features to construct an integrated classifier. Then, in the voting process, each SVM is weighted to optimize the integration performance of the model. Combined with fMRI data and graph theory characteristics, WRSVMC algorithm is used to classify the data of patients with mild cognitive impairment (MCI). The results show that the highest accuracy rate is 87.67%. This method can help doctors diagnose MCI patients.

      Key Words: fMRI classification; weighted random SVM cluster; graph theory characteristics; mild cognitive impairment

      0 引言

      在眾多神經(jīng)影像成像技術(shù)中,fMRI由于其無創(chuàng)傷、無需注射放射性示蹤物以及良好的時間和空間分辨率等優(yōu)點,在腦研究領域得到了廣泛應用。fMRI主要基于血氧水平依賴(Blood Oxygenation Level Dependent,BOLD)對比度增強原理間接反映神經(jīng)元活動,從而創(chuàng)建腦功能活動圖譜。它不僅專注于對大腦組織進行成像,而且能根據(jù)被執(zhí)行的外在刺激任務,跟蹤腦血液流向的不同區(qū)域,從而定位那些能夠?qū)崿F(xiàn)特定腦功能和認知的腦區(qū),為探討高級腦功能和研究腦疾病提供了技術(shù)基礎。

      文獻[1]利用fMRI圖像診斷輕度認知障礙(Mild Cognitive Impairment,MCI)癥狀時,選擇單個體素的BOLD曲線變化率作為數(shù)據(jù)特征并結(jié)合SVM算法進行分類,準確率最高可達75%;文獻[2]運用改進的譜聚類算法提取fMRI數(shù)據(jù)模式特征,再用SVM分類器進行分類,準確率達82%;文獻[3]在AD的fMRI分類研究中,通過使用獨立成分分析方法提取AD和正常認知的組間特征,再利用SVM分類器對AD患者進行識別,平均準確率最高達97.82%;文獻[4]在利用fMRI圖像判別精神抑郁癥時,使用SVM作為分類器,通過粒子種群算法提取最優(yōu)超參數(shù)組合,基于整體測試集的分類準確率可達到84.62%;文獻[5]通過提取BOLD-fMRI信號的獨立成分作為腦功能連接網(wǎng)絡的節(jié)點,用滑動時間窗口構(gòu)建動態(tài)功能網(wǎng)絡,然后將網(wǎng)絡特征輸入到SVM分類器中以識別精神分裂癥患者,準確率高達80.36%。

      Sidhu等[6]在注意缺陷多動障礙(Attention-Deficit Hyperactivity Disorder,ADHD)的分類研究中,基于表型數(shù)據(jù)(年齡、性別、手性、IQ等)和fMRI數(shù)據(jù),通過使用快速傅里葉變換和主成分分析進行降維,并結(jié)合SVM算法對ADHD患者和健康組對照分類,準確率高達76%;Khazaee等[7]對AD的fMRI分類研究中,通過構(gòu)建圖功能連接網(wǎng)絡獲取圖論特征,并將圖論特征輸入到SVM分類器里,在AD患者和正常認知的分類實驗中實現(xiàn)了100%的分類準確率;Sato等[8]在對重度抑郁癥(major depression,MD)的fMRI分類研究中,使用最大熵線性判別分析對MD患者和健康組進行對照識別,留一交叉驗證準確率高達78.26。2018年,F(xiàn)eczko等[9]在對ASD患者的fMRI分類研究中,使用功能隨機森林(Functional Random Forest,F(xiàn)RF)算法對ASD兒童和健康組對照進行分類,準確率達72.7%。

      在基于機器學習(ML)的fMRI應用研究中,SVM由于其特有的小數(shù)據(jù)學習方法、泛化性能強等優(yōu)點而受到廣泛關(guān)注,并在某些疾病的識別上取得了良好效果。但是fMRI圖像數(shù)據(jù)帶有大量噪聲,僅僅依靠單一的SVM模型很難實現(xiàn)穩(wěn)定和準確的分類。因此,傳統(tǒng)ML模型尤其是SVM算法還存在改進空間。

      本文提出的加權(quán)隨機SVM集群(WRSVMC)算法對隨機SVM分類器集群作進一步加權(quán),以提高模型的集成性能,用來提取最優(yōu)特征子集,并進一步檢測引發(fā)疾病的異常腦區(qū),為腦疾病的研究提供新的視角。所采用的靜息態(tài)fMRI數(shù)據(jù)來源于ADNI數(shù)據(jù)庫。

      1 隨機SVM集群簡介

      在研究靜息態(tài)fMRI數(shù)據(jù)構(gòu)成的功能網(wǎng)絡中,一般采用兩兩腦區(qū)時間序列之間的皮爾遜相關(guān)系數(shù),衡量腦區(qū)之間的功能性關(guān)系。近年來,圖論特征也被廣泛應用于fMRI分類。但這兩種特征都因其高維特性而易引發(fā)“維災難”。全面利用小樣本、高維度的fMRI數(shù)據(jù)集,并從中挖掘有意義的信息,是一項非常困難的工作。因此降維是分析的首要任務,傳統(tǒng)的降維技術(shù)有主成分分析(PCA)、等度量映射(Isomap)和線性判別分析(LDA)等,然而降維后會導致部分信息損失,且低維度特征不方便進行解釋。更好的方法是從原始特征中直接提取對算法分類性能具有強影響力的特征,以降低圖像噪聲給判別任務帶來的不利影響。

      SVM模型的數(shù)據(jù)分類表現(xiàn)優(yōu)秀,尤其是小樣本、高維度的fMRI圖像數(shù)據(jù)。但由于高圖像噪聲,單個SVM很難獲得穩(wěn)定、魯棒的泛化能力。2018年,文獻[10]提出了隨機SVM集群(Random SVM Cluster,RSVMC)的思想,運用多個SVM分類器進行組合預測,通過集成學習使得好壞不等的SVM分類器最終形成一個強大的集成分類器,從而獲得比單個SVM更加優(yōu)秀的泛化性能。

      RSVMC雖然解決了單個SVM分類算法中的弊端,也提升了分類準確率,但仍有改進空間。各SVM分類能力不同,其中部分SVM分類效果相對較差,而且采用同等權(quán)重的投票原則,忽略了分類器之間存在的強弱差異,影響了模型整體性能。

      2 加權(quán)隨機SVM集群原理

      2.1 基本原理

      為了提高RSVMC集群中分類能力優(yōu)秀的SVM在投票過程中的影響力,同時降低分類能力欠佳的SVM的作用,通過對不同SVM基分類器進行賦權(quán),最終形成更穩(wěn)定且準確率更高的加權(quán)隨機SVM集群,如圖1所示。

      2.2 實現(xiàn)方法

      在實驗數(shù)據(jù)集D的劃分過程中,將D隨機劃分為測試集Test和訓練驗證合集S,其中,測試集Test用來測試整個新集群的泛化能力。而合集S再被細分為訓練集[Strain]和驗證集[Svalidation],[Strain]用來訓練SVM基分類器,[Svalidation]用來獲取SVM的權(quán)重。在每次訓練SVM基學習器時,都要將合集[S]隨機劃分為[Strain]和[Svalidation],以保持基學習器的多樣性。算法主要分為4個步驟,WRSVMC構(gòu)建流程如圖2所示。

      步驟1:每次訓練SVM時,都要隨機挑選訓練樣本和特征。假設總共有d維特征,根據(jù)經(jīng)驗挑選特征數(shù)[d]。

      步驟2:用訓練集[Strain]訓練SVM基學習器。

      步驟3:用驗證集[Svalidation]獲取SVMs的分類結(jié)果,根據(jù)分類準確率對SVMs進行加權(quán),權(quán)重計算公式為:

      其中,[Tcorrectl]表示驗證集中,被第一個SVM分類正確的樣本數(shù),[TL]是驗證樣本總數(shù)。

      步驟4:將這些加權(quán)SVM分類器進行組合,從而實現(xiàn)加權(quán)集成。

      2.3 性能評價指標

      預測測試集中每一個待分類樣本的類別。首先,將每個樣本通過隨機SVM集群分類器檢測并經(jīng)過加權(quán)統(tǒng)計,屬于a類別的總票數(shù)記為[Sa]:

      其中,[fix]是測試樣本x被第i個SVM預測的結(jié)果,[Ι? ]是指示函數(shù),若測試樣本x被SVM預測為a類,取值為1,否則為0。

      對于新樣本的類別,經(jīng)過加權(quán)后選出票數(shù)最多的類別A作為樣本最終類別:

      由于樣本類別已知,通過對比預測類別和真實類別,可以得到測試集樣本分類正確的樣本數(shù)量,記為[Ttrue],若T為測試樣本總數(shù),則Pre是WRSVMC的分類準確率:

      3 WRSVMC在fMRI中的應用

      按圖論理論將fMRI數(shù)據(jù)構(gòu)建成腦功能網(wǎng)絡?;谧詣咏馄蕵擞洠ˋnatomical Automatic Labeling,AAL)圖譜將大腦劃分為90個腦區(qū),構(gòu)成90個網(wǎng)絡節(jié)點;通過計算節(jié)點之間的皮爾遜相關(guān)系數(shù)得到網(wǎng)絡的邊,這些邊代表靜息狀態(tài)腦區(qū)之間的功能連通性,生成一個90×90的對稱相關(guān)矩陣。用閾值[v∈[1,0]]對矩陣進行二值化處理,如果邊的權(quán)重絕對值大于[v],則邊值為1,否則為0。

      在構(gòu)建好的網(wǎng)絡中分別選取最短路徑、度數(shù)、局部效率和聚類系數(shù)4個局部圖論指標。每個網(wǎng)絡都有4 005條最短路徑特征,其它3個指標各有90個特征,共計4 275個特征用作WRSVMC分類器的原始輸入。

      定義原始實驗樣本集為[Hh,ChNh=1],其中,N為實驗樣本集總數(shù),[Hh=(Hh,1,Hh,2,?,Hh,k)T]為每位被試的k維樣本特征,[Hh,k]表示第h個被試的第k個樣本特征,[Ch∈{+1,-1}]為類別標簽。

      通過特征保留找到400個重要特征,從中提取最優(yōu)特征子集,最后搜尋相關(guān)腦區(qū)。

      在特征保留過程中,首先保留準確率大于50%的SVM基分類器,然后將這些SVM選擇的特征乘上對應的權(quán)重作為特征的權(quán)重系數(shù),記為[Weigthj]:

      將同一維樣本特征的權(quán)重系數(shù)合并,最終篩選出權(quán)重系數(shù)排名前400的特征為重要特征,流程如圖3所示。

      為了篩選出與疾病關(guān)聯(lián)密切的最優(yōu)特征子集,還需對重要特征作進一步優(yōu)化。在保留前q個特征的情況下計算分類準確率,q的取值范圍為[{70,72,?,400}]。最優(yōu)特征子集的個數(shù)為分類準確率最高時所對應的q值。

      異常特征次數(shù)與腦區(qū)頻率是相對應的,在獲得具有強分辨力的異常特征后,可以找到與之關(guān)聯(lián)的異常腦區(qū),其頻率可以用來度量不同腦區(qū)對WRSVMC分類性能的影響。某腦區(qū)的頻率越高,則其對WRSVMC的影響越大,與被研究的腦疾病越相關(guān)。

      4 WRSVMC性能分析

      在同樣環(huán)境下分別用WRSVMC、RSVMC和隨機森林算法對fMRI數(shù)據(jù)進行50次MCI分類對比實驗。從圖4所示的泛化性能對比可以看出,WRSVMC擁有相對較高的分類準確度,其范圍為75%~85%。而RSVMC和隨機森林的準確度范圍相對較低??梢奧RSVMC在MCI分類應用中的準確率更高,整體泛化能力也更好。

      當WRSVMC準確率達到最高時,其SVM基分類器數(shù)目即為最優(yōu)基分類器數(shù)目。將SVM的數(shù)量逐步從20個增加到600個,步長為10,計算在不同基分類器數(shù)量下WRSVMC的分類準確率。從圖5可以看出,隨著基分類器數(shù)目遞增,準確率呈現(xiàn)增加趨勢,在500時達到了83.56%的最高準確率,并趨于穩(wěn)定。因此,500被選為最優(yōu)基分類器數(shù)目。

      5 結(jié)語

      本文將靜息態(tài)fMRI與圖論相結(jié)合,運用WRSVMC算法輔助判別MCI患者。算法不僅可以提高判別準確率,而且可以用于檢測大腦異常區(qū)域,為MCI的診斷提供了有價值的視角。但實驗還存在一定缺陷:由于AAL模板將大腦劃分為90個腦區(qū),對于復雜的大腦而言這種劃分規(guī)模仍然不夠細;4個圖論指標的選定是基于現(xiàn)有文獻進行的,將來應考慮其它重要指標以增強指標的多樣性;實驗采用fMRI數(shù)據(jù),在后續(xù)研究中,可以考慮采用磁共振成像等其它模式數(shù)據(jù),使分類和預測信息更加全面。

      參考文獻:

      [1] 呂艷陽,相潔. 基于SVM的fMRI數(shù)據(jù)分類及MCI診斷應用[J]. 計算機工程與設計,2013,34(9): 3313-3317.

      [2] 趙冬琴,相潔. 基于譜聚類的MCI功能影像分類特征選擇研究[J]. 計算機工程與設計,2014,35(4):1379-1384.

      [3] 楊文璐,李彥. 基于功能磁共振影像的阿爾茨海默病分類研究[J]. 安徽大學學報:自然科學版,2015(3):88-95.

      [4] 張濤,張明輝,李清偉,等. 基于粒子群-支持向量機的時間序列分類診斷模型[J]. 同濟大學學報:自然科學版,2016,44(9): 1450-1457.

      [5] 馬士林,梅雪,李微微. fMRI動態(tài)功能網(wǎng)絡構(gòu)建及其在腦部疾病識別中的應用[J]. 計算機科學,2016,43(10): 317-321.

      [6] SIDHU G,ASGARIAN N,GREINER R,et al. Kernel principal component analysis for dimensionality reduction in fMRI-based diagnosis of ADHD[J]. ?Frontiers in Systems Neuroscience,2012(6): 74.

      [7] KHAZAEE A,EBRAHIMZADEH A,BABAJANI-FEREMI A. Identifying patients with Alzheimer's disease using resting-state fMRI and graph theory[J]. Clinical Neurophysiology,2015,126(11):2132-2141.

      [8] SATO JR,MOLL J,GREEN S, et al. Machine learning algorithm accurately detects fMRI signature of vulnerability to major depression[J]. ?Psychiatry Research: Neuroimaging,2015,233(2):289-291.

      [9] FECZKO E,BALBA N,MIRANDA-DOMINGUEZ O,et al. Subtyping cognitive profiles in autism spectrum disorder using a functional random forest algorithm[J]. Neuroimage,2018,172(12):674-688.

      [10] BI X,JIANG Q,SUN Q,et al. Analysis of Alzheimer's disease based on the random neural network cluster in fMRI[J]. ?Frontiers in Neuroinformatics, 2018(12): 60.

      [11] 張兆晨,冀俊忠. 基于循環(huán)神經(jīng)網(wǎng)絡的時序fMRI數(shù)據(jù)分類方法研究[J]. 小型微型計算機系統(tǒng),2018,39(7):1426-1430.

      [12] IIDAKA T. Resting state functional magnetic resonance imaging and neural network classified autism and control[J]. Cortex, 2015,63: 55-67.

      [13] DESHPANDE G,WANG P,RANGAPRAKASH D,et al. Fully connected cascade artificial neural network architecture for attention deficit hyperactivity disorder classification from functional magnetic resonance imaging data[J]. Ieee Transactions on Cybernetics, 2015, 45(12): 2668-2679.

      [14] SUK H,WEE C,LEE S,et al. State-space model with deep learning for functional dynamics estimation in resting-state fMRI[J]. Neuroimage,2016,129:292-307.

      [15] BI X,WANG Y,SHU Q,et al. Classification of autism spectrum disorder using random support vector machine cluster[J]. ?Frontiers in Genetics,2018(9): 18.

      (責任編輯:孫 娟)

      天祝| 嫩江县| 洪江市| 那曲县| 广南县| 岫岩| 英超| 山东| 方正县| 全南县| 汕尾市| 赫章县| 仲巴县| 龙陵县| 威宁| 嘉峪关市| 富平县| 合作市| 淳化县| 昆明市| 邵东县| 南丰县| 瓦房店市| 松原市| 巴马| 阿克苏市| 葵青区| 化州市| 大竹县| 年辖:市辖区| 三门峡市| 沛县| 吴堡县| 莱州市| 清河县| 湘阴县| 师宗县| 南通市| 堆龙德庆县| 榆社县| 夏津县|