劉舜琪 譚 穎* 崔文植 閆士林 宋建成
1(西南民族大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院 四川 成都 610041)2(杭州師范大學(xué)信息科學(xué)與工程學(xué)院 浙江 杭州 311121)
精神分裂癥對人類的感知覺、思維、情感和行為等都有著嚴(yán)重的負(fù)面影響,多發(fā)于15~34歲人群。這種疾病具有早期可控、晚期反復(fù)發(fā)作及認(rèn)知功能嚴(yán)重受損等特點(diǎn)[1],盡早診斷治療將減輕社會成本以及患者家庭負(fù)擔(dān)。隨著科學(xué)技術(shù)的快速發(fā)展,計(jì)算機(jī)輔助診斷已在大腦結(jié)構(gòu)磁共振成像(Structural Magnetic Resonance Image,sMRI)研究中廣泛應(yīng)用,比如腦腫瘤分割[2]、阿爾茲海默癥分類[3]和多動癥診斷[4]等,同時(shí)也為精神分裂癥的分類提供了有效方法。
從數(shù)學(xué)角度而言,輔助診斷即實(shí)現(xiàn)目標(biāo)的分類。實(shí)現(xiàn)輔助診斷的分類算法目前主要為統(tǒng)計(jì)分析方法、機(jī)器學(xué)習(xí)和深度學(xué)習(xí)算法。統(tǒng)計(jì)分析方法中,t檢驗(yàn)等參數(shù)分析法能有效應(yīng)對小樣本數(shù)據(jù),但找到高維特征分類的最優(yōu)決策邊界較困難。機(jī)器學(xué)習(xí)算法解決了這一問題,因此對于具有小樣本、高維特征特點(diǎn)的分類目標(biāo)sMRI數(shù)據(jù)相對適用,其中支持向量機(jī)(Support Vector Machine,SVM)性能最佳。在2014年至2018年間,超過55%的大腦疾病神經(jīng)影像研究中使用了SVM[5]。Lu等[6]的精神分裂癥sMRI研究計(jì)算了各個(gè)大腦感興趣區(qū)域(Regions of interest,ROI)的灰質(zhì)和白質(zhì)體積,并將兩者間的顯著差異作為輸入特征,利用SVM分類。Liu等[7]通過測量大腦每個(gè)ROI的皮質(zhì)厚度,構(gòu)建分層腦網(wǎng)絡(luò),提取網(wǎng)絡(luò)的節(jié)點(diǎn)及邊緣特征,輸入到SVM中實(shí)現(xiàn)精神分裂癥輔助診斷。相同地,將這些機(jī)器學(xué)習(xí)算法、統(tǒng)計(jì)分析方法應(yīng)用于sMRI輔助診斷的研究都需要人的先驗(yàn)知識去設(shè)計(jì)特征。
深度學(xué)習(xí)則是一種不依賴于先驗(yàn)知識的算法,它可以從數(shù)據(jù)中自動學(xué)習(xí)特征。Pinaya等[8]訓(xùn)練了深度信念網(wǎng)絡(luò)(Deep Belief Network,DBN)提取精神分裂癥sMRI數(shù)據(jù)的形態(tài)學(xué)數(shù)據(jù)特征。但深度學(xué)習(xí)依靠數(shù)據(jù)驅(qū)動的這一特點(diǎn)決定了其需要大量數(shù)據(jù)去訓(xùn)練網(wǎng)絡(luò),對于特征維數(shù)遠(yuǎn)大于樣本數(shù)的sMRI數(shù)據(jù)來說,可能效果表現(xiàn)不佳,會產(chǎn)生泛化能力差、過擬合等問題。而遷移已有的深度卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)作為特征提取器的方法,能成功地將CNN應(yīng)用于小規(guī)模醫(yī)學(xué)影像數(shù)據(jù)集[9]。Jain等[10]在阿爾茲海默癥分類研究中遷移了ImageNet數(shù)據(jù)集訓(xùn)練的VGGNet16[11]以提取sMRI數(shù)據(jù)特征。2019年,文獻(xiàn)[12]指出,遷移CNN模型作為特征提取器時(shí),遷移性能最佳的模型為Inception-ResNet V2[13],而不是目前在ImageNet上取得最高準(zhǔn)確率的網(wǎng)絡(luò)。但該研究僅針對ImageNet識別大賽中第一名的網(wǎng)絡(luò)結(jié)構(gòu)和目前最先進(jìn)、性能最好的網(wǎng)絡(luò),而許多取得很好遷移效果的sMRI分類研究中所使用的VGGNet并沒有在其中提及。
基于上述分析,本文提出了基于CNN結(jié)合SVM的精神分裂癥診斷分類方法。該方法首先預(yù)處理sMRI數(shù)據(jù),獲得合適的圖片信息;再遷移深度CNN模型VGGNet16的13層卷積層VGG13,將其作用于預(yù)處理后的精神分裂癥sMRI數(shù)據(jù)提取特征并利用主成分分析降維;最后再利用網(wǎng)格搜索算法(Grid Search Algorithm,GSA)尋優(yōu)最佳SVM進(jìn)行特征分類。將Inception-ResNet V2作為對比特征提取器、全連接網(wǎng)絡(luò)作為對比分類器,驗(yàn)證了本文方法對于精神分裂癥大腦sMRI具有更佳的適用性。
本實(shí)驗(yàn)數(shù)據(jù)集來自于美國生物醫(yī)學(xué)研究中心(Center for Biomedical Research Excellence,COBRE)的公開數(shù)據(jù)集,COBRE數(shù)據(jù)集獲取的地址為http://fcon_1000.projects.nitrc.org/indi/retro/cobre.html。本文數(shù)據(jù)集包含了年齡在18歲至65歲之間的146名樣本,其信息如表1所示。
表1 被試者信息表
本文的數(shù)據(jù)預(yù)處理分為基于體素的形態(tài)學(xué)分析(Voxel-Base Morphometry,VBM)和基于特征提取器的圖像預(yù)處理兩個(gè)部分。第一部分的VBM利用MATLAB 2017b平臺上的SPM12工具包生成灰質(zhì)和白質(zhì)密度圖;第二部分使用NIfTI_20140122工具包、mricro軟件將密度圖轉(zhuǎn)換為符合特征提取器輸入格式的圖像。
VBM的三個(gè)步驟具體如下:(1) 從腦組織sMRI中分割出灰質(zhì)和白質(zhì)密度圖,以便Dartel配準(zhǔn);(2) 通過迭代上一步所生成的密度圖創(chuàng)建一個(gè)平均的Dartel模板,將每個(gè)被試者配準(zhǔn)到Dartel模板;(3) 對配準(zhǔn)后的圖像仿射變換后標(biāo)準(zhǔn)化到MNI空間并做高斯平滑處理,最終生成體素大小為1.5 mm×1.5 mm×1.5 mm、維度為121×145×121的密度圖。
經(jīng)VBM預(yù)處理后的密度圖與特征提取器CNN架構(gòu)的輸入圖像通道、格式、大小并不一致,所以需要進(jìn)行圖像轉(zhuǎn)換。首先采用NIfTI_20140122工具包進(jìn)行三線插值和補(bǔ)全操作,并切割篩選掉無信息的部分,再使用mricro軟件對每個(gè)被試的密度圖平均切片,并將其轉(zhuǎn)為偽彩圖。最終每個(gè)樣本得到尺寸224×224、格式為PNG、RGB通道的灰質(zhì)密度圖90幅和白質(zhì)密度圖76幅,灰質(zhì)圖預(yù)處理流程如圖1所示。白質(zhì)與灰質(zhì)處理流程相同。
圖1 灰質(zhì)圖預(yù)處理流程
VGGNet16是由牛津大學(xué)的Simonyan等[11]提出的CNN模型。本文令其輸入為224×224的RGB三通道圖像,包含13個(gè)卷積核為3×3、步長為1、激活函數(shù)為ReLU的卷積層;5個(gè)max池化層,其參數(shù)為2×2,步長為2;3個(gè)全連接層(Fully connected layer,FC)和softmax層。卷積層表達(dá)式如下:
(1)
(2)
本實(shí)驗(yàn)不考慮全連接層和softmax層,遷移VGGNet16卷積池化層的結(jié)構(gòu)和預(yù)訓(xùn)練參數(shù)構(gòu)成特征提取器VGG13,作用于已預(yù)處理及過濾無信息切片的COBRE數(shù)據(jù)集去提取特征。用于本實(shí)驗(yàn)的VGG13結(jié)構(gòu)如圖2所示。本文將224×224的RGB圖依次輸入卷積層,攜帶共享權(quán)重的3×3卷積核在輸入圖像上進(jìn)行滑動,從而計(jì)算出不同時(shí)刻的局部感受野,再輸入到非線性激活函數(shù)ReLU形成特征圖,池化層通過最大子采樣的方式得到最具有代表性的特征,從而降低了上一層產(chǎn)生的輸出維度??拷斎雸D像的淺層卷積提取低級通用特征,比如邊緣特征、紋理特征等,經(jīng)過一系列卷積池化層后,呈現(xiàn)出更高級的抽象特征[14]。以5個(gè)池化層的特征為例,提取的部分特征變化過程如圖3所示。卷積和池化結(jié)構(gòu)簡化了模型的復(fù)雜度并減少了模型的參數(shù)量。圖片經(jīng)過VGG13提取特征得到灰質(zhì)和白質(zhì)特征向量分別為(146,90,25 088)、(146,76,25 088),括號中的三個(gè)參數(shù)分別表示樣本數(shù)量、每個(gè)樣本的灰質(zhì)或白質(zhì)圖片數(shù)量、每幅圖片特征維數(shù)。
圖2 VGG13結(jié)構(gòu)圖
圖3 部分特征變化過程
谷歌團(tuán)隊(duì)發(fā)布的Inception通過改變網(wǎng)絡(luò)結(jié)構(gòu),而不是一味地增加網(wǎng)絡(luò)深度和寬度來提升模型性能,Szegedy等[13]受ResNet的啟發(fā),在Inception的基礎(chǔ)上簡化了部分殘差區(qū)塊,引入了殘差連接加快網(wǎng)絡(luò)的訓(xùn)練速度,從而構(gòu)建了Inception-ResNet V2模型。本實(shí)驗(yàn)將其作為提取特征性能的對比對象,提取灰質(zhì)和白質(zhì)特征向量分別為(146,90,38 400)、(146,76,38 400)。
經(jīng)VGG13提取特征之后,每個(gè)樣本的灰質(zhì)特征維度為2 257 920維、白質(zhì)特征維度為1 906 688維;經(jīng)Inception-ResNet V2處理后的灰質(zhì)特征維度為3 456 000維,白質(zhì)特征維度2 918 400維。在這些特征數(shù)據(jù)中,60%以上是非零特征信息,而實(shí)驗(yàn)中樣本數(shù)總數(shù)只有146例,可見特征數(shù)遠(yuǎn)超過樣本數(shù),這將產(chǎn)生維數(shù)災(zāi)難問題。若直接將這些特征用于分類,則可能出現(xiàn)過擬合現(xiàn)象,從而導(dǎo)致測試集結(jié)果不理想。因此,需使用PCA對這些特征進(jìn)行降維處理。
PCA是一種將樣本從原始的高維空間映射到維度小于樣本數(shù)的新低維空間的降維方法。在新空間中存在這樣一個(gè)超平面,樣本點(diǎn)到其的距離最近,即最近重構(gòu)性[15]。本實(shí)驗(yàn)并非直接指定低維空間維數(shù),而是從重構(gòu)性的角度設(shè)定了重構(gòu)閾值,其公式如下:
(3)
式中:λi為樣本協(xié)方差矩陣所分解出的特征值;d為高維空間的維數(shù),當(dāng)式(3)成立時(shí),求得d′的最小值即為低維空間的維數(shù)。降維流程有以下5步:(1) 中心化所有樣本并計(jì)算樣本的協(xié)方差矩陣;(2) 從協(xié)方差矩陣中分解出特征值并將其從大到小排列;(3) 據(jù)式(1)求得低維空間維數(shù)d′;(4) 前d′個(gè)特征值對應(yīng)的特征向量被取出,構(gòu)成映射矩陣;(5) 樣本數(shù)據(jù)在映射矩陣作用下從原始空間轉(zhuǎn)換成新空間。本文將重構(gòu)閾值設(shè)為60%,經(jīng)PCA后的維數(shù)見表2。
SVM是常用的機(jī)器學(xué)習(xí)分類算法之一,能有效地解決小樣本高維度數(shù)據(jù)分類問題。其利用核函數(shù),將原始非線性可分的特征空間映射到更高維空間,并在新空間中構(gòu)造一個(gè)具有最大間隔的超平面,能最優(yōu)地將樣本分為兩類[16]。分類模型公式如下:
(4)
本實(shí)驗(yàn)使用GSA參數(shù)尋優(yōu)算法將一組SVM搜索參數(shù)(包含線性核linear的懲罰因子C;徑向基核rbf的C和系數(shù)gamma;多項(xiàng)式核poly的C、gamma和次數(shù)degree)劃分為網(wǎng)格,遍歷每個(gè)網(wǎng)格中的參數(shù),快速找出全局最優(yōu)的SVM參數(shù)值。6組特征降維后,將每一組數(shù)據(jù)按8 ∶2的比例劃分成訓(xùn)練集和測試集,對應(yīng)的標(biāo)簽被劃分為訓(xùn)練數(shù)據(jù)真實(shí)標(biāo)簽和測試數(shù)據(jù)真實(shí)標(biāo)簽。針對GSA中不同的核函數(shù)、不同的系數(shù)和不同的懲罰因子,本實(shí)驗(yàn)在6組訓(xùn)練集上采用五折交叉驗(yàn)證,分別選擇出本組中交叉驗(yàn)證準(zhǔn)確率最高的核參數(shù),即為此組最佳模型核參數(shù),如表3所示。本實(shí)驗(yàn)中將降維后的特征和被試信息標(biāo)簽分為訓(xùn)練集(訓(xùn)練分類模型)和測試集(預(yù)測分類結(jié)果),對比預(yù)測結(jié)果和真實(shí)標(biāo)簽,得到分類結(jié)果。
表3 GSA-SVM最佳核參數(shù)及交叉驗(yàn)證準(zhǔn)確率表
通常情況下,CNN模型的分類器一般為全連接層,因此本文還用VGG13提取的特征訓(xùn)練了其后三層全連接層并修改輸出為二分類,將傳統(tǒng)全連接網(wǎng)絡(luò)作為對比分類器。Inception-ResNet V2提取的特征同樣被用去訓(xùn)練全連接層。其中訓(xùn)練集和測試集與SVM所用數(shù)據(jù)保持一致,學(xué)習(xí)率為0.001,epoch迭代30次趨于平穩(wěn),實(shí)驗(yàn)結(jié)果見表4。本文實(shí)驗(yàn)的分類流程如圖4所示。
表4 全連接網(wǎng)絡(luò)作分類器時(shí)的驗(yàn)證準(zhǔn)確率表 %
圖4 分類流程
本實(shí)驗(yàn)屬于二分類問題,根據(jù)真實(shí)結(jié)果與預(yù)測結(jié)果組合可形成四種情況,分別為TP(預(yù)測為患病的被試其真實(shí)情況為患病)、FP(預(yù)測為健康的被試其真實(shí)情況為患病)、TN(預(yù)測為健康的被試其真實(shí)情況為健康)、FN(預(yù)測為患病的被試其真實(shí)情況為健康)。由以上四種情況定義準(zhǔn)確率Ace、靈敏度Sen和特異性Spe三項(xiàng)評價(jià)指標(biāo)如下:
(5)
(6)
(7)
此外,本文還利用受試者工作特征ROC曲線圖分析了模型性能,若一個(gè)模型的ROC曲線完全包裹住另一模型的曲線,則前者的性能優(yōu)于后者,若兩曲線交叉,則以ROC曲線下面積AUC來衡量模型優(yōu)劣。
本實(shí)驗(yàn)對精神分裂癥sMRI數(shù)據(jù)集進(jìn)行預(yù)處理并篩除無信息切片,采用VGG13和Inception-ResNet V2兩種CNN模型去自動提取76幅白質(zhì)和90幅灰質(zhì)密度圖切片的特征,白質(zhì)特征、灰質(zhì)特征和組合特征經(jīng)PCA降維后,再采用五折交叉驗(yàn)證對6組特征訓(xùn)練集分別訓(xùn)練GSA-SVM,最后測試集在最佳的分類SVM模型上進(jìn)行預(yù)測。與此同時(shí),用CNN模型特征訓(xùn)練全連接網(wǎng)絡(luò)作為對比分類器。分類結(jié)果及對比的現(xiàn)有方法指標(biāo)詳見表5。
表5 分類結(jié)果表 %
從特征提取器模型、分類器類型、特征種類三個(gè)方面進(jìn)行分析。(1) VGG13獲得的白質(zhì)密度圖和灰質(zhì)密度圖結(jié)合特征在SVM上分類的準(zhǔn)確率為83.33%,靈敏度為80.00%,這兩個(gè)指標(biāo)都是所有組中最高,且相較于文獻(xiàn)[17]方法的準(zhǔn)確率提高了6百分點(diǎn)左右。特異性最高為93.33%,其屬于Inception-ResNet V2提取的白質(zhì)密度圖和灰質(zhì)密度圖組合特征。SVM作為分類器時(shí),VGG13所提取的特征其三個(gè)指標(biāo)總體上都優(yōu)于Inception-ResNet V2模型。FC作為分類器時(shí),同樣是VGG13優(yōu)于Inception-ResNet V2特征提取器。(2) 當(dāng)VGG13作為特征提取器時(shí),白質(zhì)特征和灰質(zhì)特征在SVM分類器上三個(gè)指標(biāo)遠(yuǎn)高于在FC分類器的指標(biāo),而組合特征在SVM上與在FC的分類指標(biāo)相差較小,SVM指標(biāo)略高;當(dāng)Inception-ResNet V2作為特征提取器時(shí),兩個(gè)分類器指標(biāo)特點(diǎn)與VGG13一致。(3) 在表5的四組分類模型中,組合特征的準(zhǔn)確率、敏感度、特異性總體上優(yōu)于灰質(zhì)特征和白質(zhì)特征的指標(biāo);從單獨(dú)特征上看,灰質(zhì)特征的三個(gè)分類指標(biāo)整體上稍微高于白質(zhì)特征。
SVM作為分類器時(shí)的整體效果明顯優(yōu)于全連接網(wǎng)絡(luò),因此實(shí)驗(yàn)中重點(diǎn)呈現(xiàn)了兩種特征提取器在SVM上形成的6組ROC曲線,如圖5所示。其中VGG13模型3種特征組和Inception-ResNet V2模型3種特征組AUC最高的都是組合特征,分別為0.84、0.82,且VGG13組合特征的AUC最高。VGG13的白質(zhì)密度特征、灰質(zhì)密度特征、白質(zhì)灰質(zhì)密度組合特征模型的AUC分別為0.81、0.74、0.84,這三組模型的AUC都優(yōu)于Inception-ResNet V2對應(yīng)的三組特征模型。
圖5 6組模型的ROC曲線和AUC值
本文基于卷積神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)的精神分裂癥分類研究,以VGG13模型提取精神分裂癥sMRI數(shù)據(jù)的白質(zhì)密度圖切片和灰質(zhì)密度圖切片特征,經(jīng)PCA降維后,利用網(wǎng)格搜索算法尋找分類器的最優(yōu)參數(shù),最后通過SVM對精神分裂癥被試和健康被試進(jìn)行分類。并將Inception-ResNet V2作為對比特征提取器以及全連接網(wǎng)絡(luò)作為對比分類器,對模型性能進(jìn)行了分析。得到結(jié)論如下:
1) 本文方法可以自動地提取精神分裂癥結(jié)構(gòu)磁共振數(shù)據(jù)的特征,并實(shí)現(xiàn)較高的分類性能。遷移CNN模型作為精神分裂癥sMRI特征提取器時(shí),并不是越深越復(fù)雜的CNN模型遷移效果更好,VGG13模型自動提取的精神分裂癥sMRI特征,其測試集在支持向量機(jī)上分類性能更佳,即說明在作為精神分裂癥的特征提取器的情況下,VGG13的遷移效果更佳,更適合sMRI數(shù)據(jù)分類問題。
2) 無論是VGG13還是 Inception-ResNet V2作為特征提取器的情況下,SVM的三項(xiàng)分類指標(biāo)整體上都高于全連接網(wǎng)絡(luò),這說明針對本文中特征提取器所得的精神分類癥特征而言,其在SVM上的分類效果優(yōu)于CNN的傳統(tǒng)全連接網(wǎng)絡(luò)分類器。
3) 比較VGG13和Inception-ResNet V2特征提取方法,兩者的三組精神分裂癥特征在SVM上的分類指標(biāo)及ROC曲線下面積都具有相似的大小特點(diǎn),這說明組合特征的分類效果相較單獨(dú)特征更優(yōu)。在單獨(dú)特征中,灰質(zhì)密度圖切片特征明顯優(yōu)于白質(zhì)密度切片特征的分類效果。
4) 本文的GMWMVGG13-SVM的準(zhǔn)確率比現(xiàn)有方法提高了約6百分點(diǎn),這證明了該模型對于精神分裂癥診斷的適用性和有效性。
總體而言,本文方法旨在以深度CNN模型為基礎(chǔ)來自動提取精神分裂癥sMRI數(shù)據(jù)的特征并找到最優(yōu)分類方法,避免經(jīng)驗(yàn)不穩(wěn)定性、精力有限性等人為因素所導(dǎo)致的誤差,為精神分裂癥的輔助診斷提供了有效的思路和方法。精神分裂癥的分類研究還有許多方法,比如功能磁共振、正電子發(fā)射斷層掃描、腦電圖掃描等,本文只采用了結(jié)構(gòu)磁共振特征,考慮到特征的單一性,未來將進(jìn)一步研究多模態(tài)特征。