賈洪飛,劉 茜,王 瑜,肖洪兵,邢素霞
(北京工商大學(xué)人工智能學(xué)院,北京 100048)
阿爾茨海默癥(Alzheimer’s Disease,AD)是一種最常見的腦部神經(jīng)疾病,嚴(yán)重危害病人的生活和身體健康。截止到2019 年,國內(nèi)AD 患者人數(shù)超過1 000 萬,是目前全球患有AD 人數(shù)最多的國家[1]。AD 最先攻擊處理學(xué)習(xí)和記憶的海馬區(qū)[2],在病情初期,癥狀只是健忘、糊涂。隨著病情的加重,病人的視覺空間下降,對待事物無法辨別也無法獨自處理,記憶力嚴(yán)重下降,給患者和社會造成沉重負(fù)擔(dān),因此AD的早期診斷和及時治療意義重大。近幾年,隨著計算機(jī)和神經(jīng)影像技術(shù)的飛速發(fā)展,利用計算機(jī)與醫(yī)學(xué)影像輔助醫(yī)生進(jìn)行前期AD 診斷與分析已成為主流趨勢,目前的技術(shù)難點主要包括:醫(yī)學(xué)影像中有效分類特征的提取,以及魯棒性好、結(jié)構(gòu)簡單的分類模型的設(shè)計與構(gòu)建。
功能磁共振成像(functional Magnetic Resonance Imaging,fMRI)[3-4]是一種無創(chuàng)的研究方法,通過測量大腦腦區(qū)中血氧水平依賴(Blood Oxygen Level Dependent,BOLD)信號,可以準(zhǔn)確地知道被試者在某一時刻大腦氧活動量的大小,被廣泛應(yīng)用于AD 診斷研究中[5-8]。周文等[9]對fMRI 數(shù)據(jù)進(jìn)行預(yù)處理和雙樣本T 檢驗,分析得到病灶區(qū)的位置,然后利用核主成分分析(Kernel Principal Component Analysis,KPCA)進(jìn)行特征提取,結(jié)合Adaboost 算法對AD 進(jìn)行分類。李長勝等[10]根據(jù)現(xiàn)有的自動解剖標(biāo)記模板,把每個被試的大腦fMRI 圖像分為116 個腦區(qū),通過提取每個腦區(qū)的時間序列,構(gòu)建全腦功能連接矩陣,然后使用KPCA 進(jìn)行特征提取,最后用Adaboost 算法實現(xiàn)AD 分類。上述兩種方法都使用KPCA 提取圖像特征,雖然KPCA 能夠提取圖像的非線性特征,但無法提取圖像的深層特征。本文對傳統(tǒng)三維主成分分析網(wǎng)絡(luò)(Three-Dimensional Principal Component Analysis Network,3DPCANet)進(jìn)行了改進(jìn),在卷積層后添加最大池化層和激活函數(shù)層,增加網(wǎng)絡(luò)深度,同時提取圖像的深層特征和非線性特征,提高對AD 患者分類準(zhǔn)確度。
卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)是一種包含卷積計算且具有深度結(jié)構(gòu)的前饋神經(jīng)網(wǎng)絡(luò),是深度學(xué)習(xí)算法之一,主要應(yīng)用于圖像特征的提取和分類。越來越多的研究人員將CNN 與醫(yī)學(xué)影像相結(jié)合,輔助醫(yī)生診斷疾病[11-14]。Jain 等[15]采用了一種基于遷移學(xué)習(xí)卷積神經(jīng)網(wǎng)絡(luò)的PFSECTL數(shù)學(xué)模型,在該模型中使用ImageNet 數(shù)據(jù)集預(yù)訓(xùn)練VGG-16,然后對AD、正常對照組(Normal Control,NC)和輕度認(rèn)知障礙(Mild Cognitive Impairment,MCI)患者進(jìn)行分類。Zhang 等[16]自定義了一種卷積神經(jīng)網(wǎng)絡(luò),利用正電子發(fā)射型計算機(jī)斷層顯像(Positron Emission Computed Tomography,PET)和磁共振成像(Magnetic Resonance Imaging,MRI)雙模態(tài)作為輸入,得到的特征與簡易精神狀態(tài)量表(Mini-Mental State Examination,MMSE)和臨床 癡呆量 表(Clinical Dementia Rating,CDR)獲得的特征進(jìn)行融合,將特征輸入到CNN 中,實現(xiàn)對AD、NC 和MCI 分類。上述論文的研究內(nèi)容,大多數(shù)都是對AD、NC 和MCI 進(jìn)行分類,這種分類方式無法準(zhǔn)確診斷出患者處在AD 的哪個發(fā)展階段。因為在NC 與MCI 之間存在主觀記憶衰退(Subjective Memory Decline,SMD)階段,并且MCI 患者又分為早期輕度認(rèn)知障礙(Early MCI,EMCI)和晚期輕度認(rèn)知障礙(Late MCI,LMCI),由于相鄰發(fā)展階段的AD 患者大腦結(jié)構(gòu)變化小,很難提取有效的分類特征,因此分類困難,而本文提出的模型可以對AD 患者進(jìn)行更加細(xì)致的分類,能夠更好地輔助醫(yī)療人員對患者疾病進(jìn)行診斷。PCANet 是一種簡單的CNN,由Chan 等[17]提出,該模型以傳統(tǒng)的主成分分析(Principal Component Analysis,PCA)為基礎(chǔ),用非監(jiān)督式特征提取的方法學(xué)習(xí)樣本數(shù)據(jù)的深層次特征。李書通等[18]使用3DPCANet 完成MRI 圖像特征提取,并通過提取的特征信息結(jié)合支持向量機(jī)(Support Vector Machines,SVM)分類器,實現(xiàn)對MRI 圖像的自動分類診斷。3DPCANet 雖然能夠提取圖像的深度特征,但存在特征冗余現(xiàn)象,影響圖像分類。針對這一問題,本文對傳統(tǒng)3DPCANet 進(jìn)行了改進(jìn):在每層卷積層后增加最大池化層,減少冗余特征;增加激活函數(shù)層,即線性整流函數(shù)(Rectified Linear Unit,ReLU),使模型能夠?qū)W習(xí)非線性特征,并且總體加深模型深度,使其能夠提取圖像更深層次的特征。
雖然CNN 結(jié)合醫(yī)學(xué)影像在AD 輔助診斷中表現(xiàn)了優(yōu)異的性能,但CNN 大多數(shù)只能處理二維圖像,對高維數(shù)據(jù)涉及較少,尤其是對于四維fMRI 數(shù)據(jù)。因此,本文將四維fMRI 數(shù)據(jù)預(yù)處理成三維數(shù)據(jù),改進(jìn)傳統(tǒng)3DPCANet 模型,引入最大池化層和非線性激活函數(shù),提取fMRI 數(shù)據(jù)特征,并利用SVM進(jìn)行分類,實驗結(jié)果驗證了所提方法的有效性。
fMRI 數(shù)據(jù)是四維數(shù)據(jù),目前,針對高維數(shù)據(jù)進(jìn)行特征提取的CNN 較少,大多數(shù)適用于二維或三維圖像。Ju 等[19]對fMRI 數(shù)據(jù)進(jìn)行空間標(biāo)準(zhǔn)化、濾波,計算大腦(90 腦區(qū))功能連接矩陣,將四維fMRI 數(shù)據(jù)轉(zhuǎn)換為二維數(shù)據(jù)。Peraza 等[20]在研究路易體和阿爾茨海默病的區(qū)域功能同步性這一課題中,將fMRI 數(shù)據(jù)進(jìn)行旋轉(zhuǎn)、標(biāo)準(zhǔn)化和局部一致性(Regional Homogeneity,ReHo)[21]變換,將四維fMRI 數(shù)據(jù)轉(zhuǎn)換為三維數(shù)據(jù)。本文將fMRI 數(shù)據(jù)轉(zhuǎn)換為低頻波動幅度(Amplitude of Low-Frequency Fluctuation,ALFF)[22]圖像,然后進(jìn)行后續(xù)操作。
本文實驗中使用的fMRI 數(shù)據(jù)來自阿爾茨海默氏癥神經(jīng)成像組 織(Alzheimer’s Disease Neuroimaging Initiative,ADNI)。實驗數(shù)據(jù)共有202 名被試者的fMRI 圖像數(shù)據(jù),其中包含AD 患者34 例,EMCI 患者57 例,LMCI 患者35 例,NC 對照組50 名,SMD 患者26 例。實驗數(shù)據(jù)中每個被試者的基本信息如表1 所示。
表1 被試者信息統(tǒng)計分析Tab.1 Statistical analysis of subject information
fMRI 數(shù)據(jù)預(yù)處理使用基于Matlab 的DPABI(Data Processing&Analysis for Brain Imaging)[23]軟件包實現(xiàn)。fMRI圖像處理流程如下:剔除前10 個時間點,時間層校正,頭動校正,空間標(biāo)準(zhǔn)化,去線性飄移等處理。fMRI 預(yù)處理后樣本數(shù)據(jù)如圖1 所示。
圖1 fMRI預(yù)處理后的樣本圖像Fig.1 Sample images after fMRI preprocessing
本文將fMRI 數(shù)據(jù)轉(zhuǎn)換成ALFF 圖像,該圖像是三維圖像,方便使用CNN 進(jìn)行特征提取。ALFF 圖像值是計算低頻段(0.01 Hz~0.08 Hz)下BOLD 信號功率譜的均方根,利用低頻信號能量來表示大腦中不同腦區(qū)神經(jīng)元的活動強弱,其中:頻率在0.010 Hz~0.027 Hz 時,可以反映大腦皮層神經(jīng)元的活動;頻率在0.027 Hz~0.073 Hz 時,可以反映基底神經(jīng)節(jié)的活動。這些區(qū)域都會受到AD 影響,所以本文選擇ALFF進(jìn)行圖像轉(zhuǎn)換。
ALFF 計算過程如下所示:
1)將每個體素去除線性漂移后的時間序列先經(jīng)過0.01 Hz~0.08 Hz 帶通濾波器;
2)將濾波結(jié)果進(jìn)行快速傅里葉變化后得到功率譜;
3)將功率譜開方;
4)計算0.01 Hz~0.08 Hz 內(nèi)的功率譜開方后的平均值,即為ALFF。
將ALFF 除以全腦所有體素的平均ALFF,可以得到均值低頻波動振幅(mean ALFF,mALFF)。如果AD 患者大腦腦區(qū)結(jié)構(gòu)發(fā)生改變,則認(rèn)為各腦區(qū)中的神經(jīng)元活動強弱與正常對照組相比也會發(fā)生改變。對預(yù)處理后的fMRI 數(shù)據(jù)進(jìn)一步計算mALFF 值后的數(shù)據(jù)圖像如圖2 所示。
圖2 mALFF樣本圖像Fig.2 mALFF sample images
圖3 為本文方法全局流程圖,PCANet 是利用PCA 學(xué)習(xí)通道卷積核,二進(jìn)制哈希和分塊直方圖用于索引和池化的深度學(xué)習(xí)網(wǎng)絡(luò)。李書通等[18]將PCANet 模型三維化,輔助診斷AD,本文對3DPCANet 進(jìn)行改進(jìn),在模型卷積層后,引入最大池化層和激活函數(shù)層改進(jìn)網(wǎng)絡(luò)。假設(shè)有N幅大小為L×H×W的神經(jīng)影像輸入,改進(jìn)的3DPCANet 卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)如圖4 所示。
圖3 本文方法全局流程Fig.3 Overall flowchart of the proposed method
圖4 改進(jìn)3DPCANet卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)Fig.4 Structure of improved 3DPCANet convolutional neural network
算法具體步驟如下。
1)第一步。
利用所有N幅原始訓(xùn)練圖像和PCA 方法生成T1個濾波器,然后利用濾波器與原始訓(xùn)練圖像分別進(jìn)行卷積,則原始訓(xùn)練圖像中的每一幅圖像生成T1幅圖像,即共生成N×T1幅圖像。
模型輸入大小為L×H×W的N幅mALFF 圖像,在第j幅圖像上的每個像素周圍都截取k1×k2×k3大小的體素塊,每幅圖像截取體素塊總數(shù)為B1,將取出來的體素塊重新進(jìn)行排序,變成一列,并進(jìn)行標(biāo)準(zhǔn)化處理,使其均值為0,標(biāo)準(zhǔn)差為1,得 到其 中表 示第j幅訓(xùn)練圖像中的第i塊的列向量。按順序?qū)⑷〕龅膲K列向量排列成新的矩陣,如式(1)所示:
對所有N幅原始圖像進(jìn)行上述處理,處理好的N幅圖像按順序排列成新的矩陣X,得到如下矩陣。
對得到的矩陣X,利用PCA 方法進(jìn)行降維處理,PCA 在一組標(biāo)準(zhǔn)正交濾波器中最小化重構(gòu)誤差為:
其中:符號“*”表示卷積,利用濾波器對所有N幅原始圖像進(jìn)行卷積,生成T1×N幅圖像。
然后再對式(5)生成的圖像進(jìn)行最大池化層和非線性激活函數(shù)ReLU 處理,使用式(6)表示:
其中:符號“×”表示最大池化操作,P1表示第一步最大池化層,表示進(jìn)行最大池化層和激活函數(shù)處理后的圖像,對所有N幅圖像進(jìn)行式(6)操作。
2)第二步。
與第一步處理方法相似,N幅原始圖像經(jīng)過第一步生成T1×N幅圖像,以其中第l幅圖像的每個體素為中心,取k4×k5×k6大小的圖像塊,每幅圖像截取體素塊總數(shù)為B2,將取出來的體素塊重新進(jìn)行排序,變成一列,并進(jìn)行標(biāo)準(zhǔn)化處理,使其均值為 0,標(biāo)準(zhǔn)差為 1,得到,其中表示原始圖像中第j幅圖像與第l個濾波器新生成的第l幅圖像中的第b塊的列向量。
將所有N×T1幅圖像進(jìn)行上述處理,處理好的N×T1幅圖像按順序排列成新的矩陣Y,得到如下矩陣:
對所得矩陣Y,進(jìn)行PCA 降維處理,該等式的解為YYT的特征向量。PCA 濾波器的表達(dá)式為:
其中:qh(YYT)表示YYT的第h個特征向量為第二步生成的第h個濾波器。
將所得到的PCA 濾波器,第一步中式(7)生成的圖像進(jìn)行卷積,如式(10)表示:
其中:符號“*”表示卷積,利用第一步生成的N×T1中的每一幅圖像,通過式(10)生成T2幅圖像。
再對卷積后圖像進(jìn)行最大池化層和激活函數(shù)ReLU 處理,如式(11)所示:
其中:符號“×”表示最大池化操作,P2表示第二步中最大池化層,為最大池化層處理生成的圖像,并利用式(11)對所有N×T1×T2幅圖像進(jìn)行最大池化層和激活函數(shù)操作。
3)第三步。
第一步生成的N×T1圖像,對其中每一幅圖像經(jīng)過第二步生成的T2幅圖像進(jìn)行二進(jìn)制哈希,如式(12)所示,合并成一幅圖像,每幅圖像中每個像素都是整數(shù)值,范圍在[0,-1],即共生成N×T1幅圖像。
其中:H(·)的功能是將圖像中大于0 的元素變成1,小于等于0 的元素變成0。將T2幅圖像中相同位置處的每一個二進(jìn)制數(shù)值組成二進(jìn)制編碼向量,并將二進(jìn)制位向量轉(zhuǎn)變?yōu)槭M(jìn)制數(shù)值。這樣將T2幅圖像轉(zhuǎn)換為十進(jìn)制的一幅整數(shù)值圖像。
對哈希處理后的所有N×T1幅圖像進(jìn)行取塊處理,每幅圖像截取體素塊總數(shù)為B3,每個塊像素大小為k7×k8×k9,并統(tǒng)計每個塊的直方圖,并將同一幅圖像中取出塊的直方圖進(jìn)行串聯(lián),式(13)表示原始N幅圖像中的第j幅圖像產(chǎn)生的第l幅圖像,經(jīng)過取塊、直方圖統(tǒng)計和串聯(lián)處理后的一維特征向量fj,l。
Bhist(Oj,l)是 對Oj,l進(jìn)行取 塊、直方圖 統(tǒng)計和 串聯(lián)的 功能,將所有原始N幅圖像中的第j幅圖像產(chǎn)生的T1幅圖像中的每一幅圖像通過式(13)處理,并進(jìn)行串聯(lián),得到一維特征向量Fj,如式(14)所示:
利用式(13)和式(14)對N幅原始圖像中的每一幅圖像對應(yīng)產(chǎn)生的T1幅圖像分別進(jìn)行取塊、直方圖統(tǒng)計和串聯(lián)操作,N幅原始圖像中的每一幅圖像均可得到一個一維的特征向量,用所得到的特征向量代表該原始圖像,即最后生成N個特征向量,使用SVM 分類器進(jìn)行分類。
實驗中對數(shù)據(jù)集進(jìn)行二分類,分為正類(positive)和負(fù)類(negative),實驗中使用的分類評價指標(biāo)有準(zhǔn)確率(ACCuracy,ACC)、敏感度(SENsitivity,SEN)和特異 性(SPEcificity,SPE),計算式如式(15):
其中:TP表示真正類被試者數(shù)量,TN表示真負(fù)類被試者數(shù)量,F(xiàn)P表示假正類被試者數(shù)量,F(xiàn)N假負(fù)類被試者數(shù)量,實驗中正類標(biāo)簽為1,負(fù)類標(biāo)簽為0。為了對所提模型進(jìn)行綜合評估,還使用了F1 值和受試者工作特征(Receiver Operating Characteristic,ROC)曲線下與坐標(biāo)軸圍成的面積(Area Under Curve,AUC)作為評測指標(biāo),其中F1 值是由精確度(Precision)和敏感度計算得到,如式(16)所示:
為了探討ALFF 圖像對AD 分類有效性以及本文改進(jìn)3DPCANet 方法的魯棒性,本文設(shè)計了一系列實驗,并且使用5 折交叉驗證,減少實驗結(jié)果的偶然性。為了驗證ALFF 圖像轉(zhuǎn)換的有效性,將本文方法與文獻(xiàn)[18]方法進(jìn)行對比;為了驗證改進(jìn)PCANet 的有效性,將本文方法與文獻(xiàn)[24]方法進(jìn)行了對比,實驗結(jié)果如表2 所示。此外,本文對不同階段的AD 患者也進(jìn)行了分類實驗,實驗結(jié)果如表3 所示。
表2 不同方法實驗結(jié)果對比 單位:%Tab.2 Comparison of experimental results of different methods unit:%
表3 AD不同階段患者分類 單位:%Tab.3 Classification of patients with different stages of AD unit:%
從表2 的實驗結(jié)果可以得出如下結(jié)論:
第一,本文所提的3DPCANet+SVM+ALFF 方法與文獻(xiàn)[18]方法相比,NC vs.AD 準(zhǔn)確率提高了3.83 個百分點。此外,MCI vs.NC、MCI vs.AD 的準(zhǔn)確率和AUC 面積均有所提升,主要是因為ALFF 圖像能夠有效反映被試者各個腦區(qū)神經(jīng)元活動強弱,是一種很好的特征表達(dá)方法。與文獻(xiàn)[18]方法相比,本文使用較少的數(shù)據(jù)集,取得了更好的分類結(jié)果,可以證明ALFF 在AD 分類中的積極作用。
第二,對3DPCANet 模型進(jìn)行改進(jìn)后,AD 的分類性能顯著提高,例如NC vs.EMCI,LMCI vs.AD 分類,準(zhǔn)確率、F1 值、特異性等評測指標(biāo)均有所提升,其中前者特異性提升12 個百分點,AUC 提升11.66 個百分點。
第三,文獻(xiàn)[24]僅對AD 與NC 患者進(jìn)行了分類,而本文對AD 其他階段包括SMD、EMCI 和LMCI 也進(jìn)行了分類,能夠輔助醫(yī)療人員更加準(zhǔn)確地診斷患者所處AD 的不同發(fā)展階段,更具有實際意義。
第四,SMD 與LMCI,LMCI 與AD 的分類性能也有所改善,證明了本文算法對病變差異微弱的SMD 和MCI 患者分類也具有有效性,主要原因在于,由于在卷積層后加入最大池化層,可以有效減少特征圖中冗余信息,防止過擬合,增加激活函數(shù),使模型能夠提取出非線性特征,以便易于區(qū)分不同發(fā)展階段患者的病變差異,從而具有更好的分類性能。
由表3 中的數(shù)據(jù)可以看出,因為SMD 是AD 疾病的初始階段,與AD 患者腦部結(jié)構(gòu)具有很大差異,因此SMD 與AD,以及EMCI 與AD 的分類效果更好,準(zhǔn)確率分別為92.42%和88.42%。NC vs.SMD、SMD vs.EMCI 都是相鄰AD 發(fā)展階段之間的分類,之間大腦結(jié)構(gòu)差異小,不易區(qū)別,實驗結(jié)果準(zhǔn)確率分別 為89.50% 和88.43%,F(xiàn)1 值分別 為90.10% 和91.65%。EMCI 和LMCI 同屬于MCI 階段,醫(yī)療人員很難區(qū)分這一階段患者,本文在EMCI 與LMCI 分類實驗中也取得了良好的分類結(jié)果,F(xiàn)1 值為87.44%,AUC 為80.95%,準(zhǔn)確率為84.21%。實驗結(jié)果證明,改進(jìn)后的3DPCANet 模型更適用于AD 分類。
本文提出了一種基于深度學(xué)習(xí)的阿爾茨海默癥輔助診斷方法,使用預(yù)處理的fMRI 數(shù)據(jù),利用mALFF 獲得平均低頻波動幅度圖像,作為深度學(xué)習(xí)網(wǎng)絡(luò)的輸入。此外,對傳統(tǒng)3DPCANet卷積層后增加最大池化層和激活函數(shù)層進(jìn)行改進(jìn),使特征圖中的冗余信息減少,防止過擬合,增加網(wǎng)絡(luò)深度,最后使用線性SVM 分類器進(jìn)行分類。在不同階段AD vs.NC 對照組數(shù)據(jù)集中的實驗結(jié)果顯示,與傳統(tǒng)的3DPCANet 模型相比,分類結(jié)果均有所提升,其中SMD vs.LMCI 準(zhǔn)確率最高,達(dá)到91.80%,LMCI vs.AD 分類結(jié)果達(dá)到89.33%。可見,本文提出的方法能夠有效分類阿爾茨海默癥不同階段患者,為阿爾茨海默癥的輔助診斷與治療提供理論依據(jù)和指導(dǎo)性建議。3DPCANet 模型特征提取任務(wù)與分類任務(wù)獨立,無法聯(lián)合優(yōu)化,在未來的工作中,會對3DPCANet 模型進(jìn)一步探索,將特征任務(wù)和分類任務(wù)融合在同一個模型中。