基于AlexNet模型的AD分類

2020-01-14 07:48:48張柏雯吳水才

北京工業(yè)大學(xué)學(xué)報 2020年1期

張柏雯，林嵐，吳水才

(北京工業(yè)大學(xué)生命科學(xué)與生物工程學(xué)院，北京 100124)

阿爾茲海默癥(Alzheimer’s disease，AD)是最為常見的神經(jīng)退行性疾病. 隨老齡化趨勢，預(yù)計到2050年，全球AD患者將達(dá)到1.6億[1]. 目前AD的發(fā)病機(jī)制尚不明確，一經(jīng)發(fā)現(xiàn)難以逆轉(zhuǎn). 但AD一般具有較長的臨床前期，若能在AD早期發(fā)現(xiàn)并及時做出正向的治療干預(yù)，將有可能延緩AD的發(fā)病時間[2]. 輕度認(rèn)知障礙(mild cognitive impairment，MCI)是介于AD與正常老化(normal control，NC)的一種中間狀態(tài)，MCI患者被認(rèn)為是AD患病的高危人群[3]. 但老年人的認(rèn)知退化程度與臨床表現(xiàn)常存在特異性[4]，單憑認(rèn)知量表測量難以準(zhǔn)確區(qū)分. 結(jié)構(gòu)磁共振圖像(structural magnetic resonance imaging，sMRI)因其對腦部組織解剖結(jié)構(gòu)顯像的高分辨率，且具有無創(chuàng)、圖像易獲取等優(yōu)勢，被廣泛用于AD的早期診斷中.

深度卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks，CNN)近年來在圖像識別領(lǐng)域表現(xiàn)突出，逐漸被運(yùn)用于醫(yī)學(xué)圖像領(lǐng)域的研究中[5]. 相比于傳統(tǒng)機(jī)器學(xué)習(xí)算法需要手工特征提取，深度學(xué)習(xí)的方法不但能夠發(fā)現(xiàn)一些潛在的疾病特征，同時減少了手工提取感興趣區(qū)的人為因素，避免或減少了模型構(gòu)建前的預(yù)處理步驟，提高了工作效率[6]. 由于sMRI是三維的影像模態(tài)，最合適的研究方法是直接建立三維的CNN模型. 但總體來說，三維的CNN模型目前還不是特別成熟. 在深度學(xué)習(xí)時代，數(shù)據(jù)至少與算法一樣重要，CNN需要大量的數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練. 神經(jīng)影像的樣本數(shù)目遠(yuǎn)小于自然圖像的數(shù)目. 三維的CNN模型必須在模型復(fù)雜度和訓(xùn)練收斂性之間做一個權(quán)衡，難以充分發(fā)揮三維模型的優(yōu)勢. Hosseini-Asl等[7]運(yùn)用自編碼器與三維CNN結(jié)合的方法進(jìn)行AD分類預(yù)測，在AD與NC中取得了97.6%的分類準(zhǔn)確率. 盡管該模型取得了優(yōu)異的性能，但它需要將三維體素塊輸入自編碼器進(jìn)行大量訓(xùn)練，得到預(yù)訓(xùn)練好的卷積核后再輸入三維的CNN模型中. 這種網(wǎng)絡(luò)訓(xùn)練的方式，存在訓(xùn)練復(fù)雜度高、模型深度較淺的問題. 另一種可行的方法是借鑒在ImageNet舉辦的大規(guī)模視覺識別挑戰(zhàn)賽(ImageNet Large Scale Visual Recognition Challenge，ILSVRC)中脫穎而出的經(jīng)典網(wǎng)絡(luò)，如AlexNet[8]、GoogleNet[9]等，來進(jìn)行AD、MCI與NC的分類研究[10]. Sarraf等[11]將功能磁共振成像(function MRI，fMRI)和sMRI轉(zhuǎn)換為二維的圖像切片后分別輸入LeNet-5[12]和GoogleNet中，通過對經(jīng)典網(wǎng)絡(luò)模型的遷移訓(xùn)練實(shí)現(xiàn)對AD與NC分類. 該方法在fMRI中獲得了94.32%的準(zhǔn)確率，在sMRI分類準(zhǔn)確率中最高一組達(dá)到98.7%. 但該方法的一個嚴(yán)重缺陷是沒有考慮到同一受試者的二維sMRI切片間存在很高的空間相關(guān)性，同時fMRI二維切片也存在時間和空間相關(guān)性. 這樣，預(yù)測集和驗(yàn)證集圖像間有很高的相關(guān)性，實(shí)際的分類模型并不能很好地解釋AD的分類結(jié)果. 呂鴻蒙等[13]運(yùn)用AlexNet及增強(qiáng)AlexNet網(wǎng)絡(luò)模型，在AD與NC、AD與MCI、MCI與NC的分類中分別取得了94.70%、97.10%、80.62%的準(zhǔn)確率. 但該研究同樣也存在沒有考慮sMRI空間相關(guān)性的問題.

在ILSVRC出現(xiàn)的經(jīng)典模型中學(xué)習(xí)的權(quán)重可用于初始化其他數(shù)據(jù)集的模型，并顯著提高性能. 本文基于NC、MCI和AD的sMRI和CNN中的經(jīng)典模型AlexNet，運(yùn)用遷移學(xué)習(xí)的方法提取圖像特征，再進(jìn)行三維特征重組，之后結(jié)合機(jī)器學(xué)習(xí)的方法建立分類模型，實(shí)現(xiàn)AD、MCI及NC的分類.

1 材料與方法

1.1 研究對象及數(shù)據(jù)獲取

本研究受試對象為422名年齡在55～90歲的老年人，數(shù)據(jù)均來自于阿爾茲海默癥神經(jīng)影像學(xué)計劃(Alzheimer’s Disease Neuroimaging Initiative，ADNI)數(shù)據(jù)庫(http:∥adni.loni.usc.edu/). 采用的是ADNI-1階段的延續(xù)“ADNI重大計劃項(xiàng)目”(ADNI Grand Opportunities，ADNI-GO)與ADNI-2階段的AD、晚期MCI(late MCI，LMCI)與NC受試者的基線(baseline，即第0個月)sMRI數(shù)據(jù)[14]. 受試者均無抑郁等精神疾病，并根據(jù)ADNI的要求接受跟蹤隨訪的數(shù)據(jù)采集，每次受試均接受簡易精神量表(mini-mental state examination，MMSE)及臨床癡呆評測表(clinical dementia rating，CDR)評測. 實(shí)驗(yàn)對象具體特征如表1所示.

表1 實(shí)驗(yàn)對象特征

數(shù)據(jù)集采集設(shè)備均為Philips 3.0T MRI掃描設(shè)備，研究所需圖像為三維磁化快速梯度回波成像MPRAGE，TR=6.8 mm，TE=3.1 mm，F(xiàn)OV：RL=204 mm；AP=240 mm；FH=256 mm，掃描層厚為1.2 mm，層數(shù)為170，體素為1 mm×1 mm×1.2 mm.

1.2 AlexNet網(wǎng)絡(luò)結(jié)構(gòu)

本研究中特征遷移學(xué)習(xí)使用的基礎(chǔ)網(wǎng)絡(luò)模型為AlexNet，結(jié)構(gòu)如圖1所示. AlexNet為8層網(wǎng)絡(luò)結(jié)構(gòu)，前5層為卷積層，后3層為全連接層，其中前2層卷積和第5層卷積后均跟隨池化層，每一個卷積層均采用ReLU激活函數(shù)[8]. 大小為227×227的RGB三通道圖像輸入AlexNet，分別經(jīng)過了卷積、ReLU、池化、歸一化過程. 其中第1層卷積過程的卷積核大小為11×11，步長為4；池化采用為重疊池化，設(shè)置步幅為2、池寬為3的滑動窗口. 第2層卷積過程的卷積核為5×5，步長為1，池化方式與第1層一致. 經(jīng)過上述過程，在第2層的輸出大小變?yōu)榱?3×13×256. 之后的3個卷積層均采用卷積核大小為3×3，步長為1. 在第5層卷積后跟隨1次池化，池化方式與前2層相同. 經(jīng)過5次卷積計算，可將圖像的特征進(jìn)行抽象，往往能表達(dá)出具有分類特征的信息. 各層具體的網(wǎng)絡(luò)參數(shù)如表2所示.

表2 AlexNet網(wǎng)絡(luò)參數(shù)

1.3 圖像預(yù)處理

前人研究顯示灰質(zhì)萎縮是早期AD與NC區(qū)分的重要依據(jù)[15]，本研究中應(yīng)用體素形態(tài)學(xué)(voxel-base morphometry，VBM)的方法，基于受試者全腦的灰質(zhì)密度圖而進(jìn)行分析[16]. 全腦的灰質(zhì)密度圖在Matlab2015b(the mathworks，Sherborn，US)中運(yùn)行通用工具包SPM-12(statistical parametric mapping，London，UK)完成[17]. 主要步驟有：DICOM至img+hdr的格式轉(zhuǎn)化；將所有受試者的圖像空間標(biāo)準(zhǔn)化到統(tǒng)一模板；再將腦組織進(jìn)行分割，提取灰質(zhì)信息；運(yùn)用Dartel工具箱[18]將每位受試者圖像依次迭代，與前一次生成的灰質(zhì)模板進(jìn)行配準(zhǔn)，之后將所有配準(zhǔn)后的圖像平均得到新的模板，直到得到最優(yōu)模板. 再將所有灰質(zhì)圖像標(biāo)準(zhǔn)化到最優(yōu)模板，灰質(zhì)平滑設(shè)置半高寬為8 mm的高斯平滑核. 經(jīng)過調(diào)制后的灰質(zhì)密度圖，體素值就反映了相應(yīng)的灰質(zhì)密度信息.

AlexNet的輸入圖像尺寸為227×227的RGB三通道. 經(jīng)過上述灰質(zhì)密度圖的生成步驟后，對每位受試者圖像均進(jìn)行插值、剪切與填充等步驟，以符合AlexNet的網(wǎng)絡(luò)輸入需求. 本文采用的是橫斷位圖像輸入網(wǎng)絡(luò)模型的方式，考慮到AD與LMCI多發(fā)生于海馬、內(nèi)嗅皮質(zhì)區(qū)、顳中回等區(qū)域，由于SPM-12生成灰質(zhì)密度圖的過程中，預(yù)處理過的圖像在z軸橫斷面上、下均存在著空白區(qū)域，靠近z軸上端保留著少部分腦皮層區(qū)域、下端保留著小腦邱體，這些區(qū)域?qū)D與LMCI分類并不敏感. 為了降低后續(xù)分類中特征維度遠(yuǎn)遠(yuǎn)大于特征數(shù)對分類模型精度帶來的影響，將這些空白區(qū)域與不敏感區(qū)域舍去，最終保留每位受試者在橫斷面的65層圖像信息，再將所有圖像分別轉(zhuǎn)換為RGB三通道的偽彩圖.

1.4 基于AlexNet的遷移學(xué)習(xí)特征提取

特征提取運(yùn)行環(huán)境為：Ubuntu14.04，CAFFE深度學(xué)習(xí)平臺，配置CUDA 8.0環(huán)境，GPU為Tesla k20c，內(nèi)存為64 GB. 將圖像輸入預(yù)先訓(xùn)練好AlexNet模型，設(shè)置相對應(yīng)的參數(shù)，進(jìn)行逐層特征提取. 如圖2為一幅灰質(zhì)圖像輸入AlexNet模型后提取特征可視化后的示意圖. 根據(jù)特征遷移學(xué)習(xí)的原理[19]，靠近輸入層的前端卷積層一般反映出的是圖像的邊緣、紋理等信息，如圖2(a)；靠近全連接層的后端卷積層一般反映的是圖像細(xì)節(jié)信息，這些信息中能抽象出具有代表性的分類特征. 在AlexNet中一般認(rèn)為conv3、conv4、conv5三個卷積層能用作之后的分類提取[18]，如圖2(b)～(d). 將每位受試者的圖像按照z軸從上到下的順序依次輸入AlexNet提取特征，根據(jù)AlexNet模型的參數(shù)，如表2所示，即每一層圖像在conv3、conv4的特征維度為13×13×384，conv5特征維度為13×13×256，將每位受試者的特征變量按照原65層排列順序重新組成一組三維特征.

經(jīng)過重組后的特征，每位受試者在conv3和conv4的特征維度都達(dá)到140萬維以上(65幅13×13×384)，而在后續(xù)分類中，每組的樣本總量不足400例，這樣的特征維度不但遠(yuǎn)遠(yuǎn)大于樣本總量，而且存在過多的冗余信息，無疑會對后續(xù)分類造成維度災(zāi)難[20]. 因此對特征選用與AlexNet中一樣尺寸的池化方法.

1.5 特征降維與選擇

需要對AD與NC、AD與LMCI、LMCI與NC三組分別進(jìn)行二分類. conv3、conv4和conv5雖然都能反映出輸入圖像的細(xì)節(jié)信息，但是具體在哪一層有更好的表現(xiàn)，在不同研究中并無定論，所以本研究將conv3、conv4和conv5的特征均作為下一步的分類特征. 在上述重疊池化降維后，雖然維度相較提取時的已有大幅降低，但相對于每個分類組的個數(shù)仍處于特征數(shù)遠(yuǎn)遠(yuǎn)大于分類樣本數(shù)量，因此本研究分類模型構(gòu)建首先進(jìn)行了特征降維，再經(jīng)過特征選擇，最后構(gòu)建分類器分類.

具體方法步驟如下.

步驟1運(yùn)用主成分分析(principal component analysis，PCA)對各個分類組的原始特征進(jìn)行降維. PCA能通過線性或非線性組合的方法構(gòu)造相關(guān)特征，使原始的高維特征映射到低維，保留最重要的特征信息，可以從多元事物中更好地解析出主要的影響因素[21]. PCA主要計算過程有：讀取各分類集數(shù)據(jù)；去均值、計算協(xié)方差矩陣；計算特征向量及特征值，并按照特征值大小排序；再根據(jù)各個主成分累計的貢獻(xiàn)率大小選取主成分，從而得到降維后的矩陣.

步驟2運(yùn)用序列前向搜索(sequential forward search，SFS)特征選擇. 雖然經(jīng)上一步驟所保留的特征已按照貢獻(xiàn)率大小排名，但并不能說明貢獻(xiàn)率高的特征對于接下來的分類器訓(xùn)練最佳. 因此接下來選用SFS的方法在每個PCA后的分類組的訓(xùn)練集中分別進(jìn)行特征選擇. SFS通過自上而下的搜索找到最佳特征，是一種“只出不進(jìn)”的貪心算法[22]. 根據(jù)各組別受試者的實(shí)際個數(shù)，選擇每組別隨機(jī)化后合適數(shù)量的受試者作為SFS特征選擇及之后分類器的訓(xùn)練集. SFS主要計算過程有：首先從空集開始；當(dāng)遇到最佳分類特征時更新特征子集；重復(fù)上述過程，直到目標(biāo)子集數(shù)量達(dá)到設(shè)定的個數(shù)為止；在實(shí)際選擇特征時，能通過最終的特征目標(biāo)子集的誤分比率的最低值來確定哪些特征及多少個特征個數(shù)作為后續(xù)特征分類的訓(xùn)練集最佳.

步驟3運(yùn)用支持向量機(jī)(support vector machines，SVM)構(gòu)建特征分類器. 使用LIBSVM工具包[23]，設(shè)置線性核函數(shù)對各分類組分別進(jìn)行分類. 每組選用與上述SFS算法一致的子集作為訓(xùn)練集，其余受試者均為測試集. 最后，統(tǒng)計SVM的分類結(jié)果，對整體模型設(shè)計進(jìn)行評估.

2 結(jié)果

首先，將conv3、conv4和conv5的各分類組進(jìn)行PCA降維，保留貢獻(xiàn)度在前95%的特征. 經(jīng)過PCA后，所有分類組的特征個數(shù)均小于受試者的個數(shù). 但是貢獻(xiàn)度的排名并不能等同于分類信息的排名，如圖3所示，在conv3中AD與LMCI分類組，圖3(a)顯示第一主成分的貢獻(xiàn)率也只占到13%，排名的前50個主成分占到的主成分貢獻(xiàn)率也不足50%. 由圖3(b)可以看出，AD與LMCI并無明顯的分界，說明即便第一主成分與第二主成分也不具有較強(qiáng)的分類敏感性. 所以需要在訓(xùn)練集進(jìn)行SFS的特征選擇，AD、LMCI與NC每組分別選擇隨機(jī)化后的75例受試者作為訓(xùn)練集，其余均作為測試集，各組分類集與測試集的個數(shù)如表3所示. 根據(jù)各分類組的SFS錯誤分類比率，大約在第20個特征時，錯誤分類率達(dá)到最低，且誤分比率相對穩(wěn)定. conv3中AD與LMCI分類組中SFS錯誤分類比率的統(tǒng)計圖如圖4所示. 所以對3個分類組SFS均選取20個特征作為下一步分類器構(gòu)建.

表3 訓(xùn)練集與測試集

將SFS選擇出的各分類組的特征作為SVM分類器的輸入，得到conv3、conv4和conv5的各個分類組的分類結(jié)果，如表4所示. 實(shí)驗(yàn)結(jié)果評價采用準(zhǔn)確率(Accuracy)、靈敏度(Sensitivity)與特異性(Specificity)3項(xiàng)作為模型評價指標(biāo). 其定義為

(1)

(2)

(3)

式中：nTP為真陽性(true positive)在AD與NC、AD與LMCI的分類中，為被準(zhǔn)確識別出的AD樣本個數(shù)；在LMCI與NC的分類中，表示準(zhǔn)確識別的LMCI樣本個數(shù).

表4 各組二分類結(jié)果

nFP為假陽性(false positive)在AD與NC、AD與LMCI的分類中，為AD受試者被劃分為了NC或LMCI組的樣本個數(shù)；在LMCI與NC的分類中，為LMCI劃分到了NC組的樣本個數(shù).

nFN為假陰性(false negative)在AD與NC、AD與LMCI的分類中，為NC或LMCI受試者被劃分為了AD組的樣本個數(shù)；在LMCI與NC的分類中，為NC劃分到了LMCI組的樣本個數(shù).

nTN為真陰性(true negative)在AD與NC、LMCI與NC的分類中，為被準(zhǔn)確識別出的NC樣本個數(shù)，在AD與LMCI的分類中為準(zhǔn)確識別出的LMCI樣本個數(shù).

3 結(jié)論

1) 由表4的二分類結(jié)果表明，通過遷移學(xué)習(xí)提取圖像特征再進(jìn)行三維重組的方式，對于AD、LMCI與NC之間的分類是一種可行的方法. 對conv3、conv4與conv5三個卷積層分別進(jìn)行了分類，經(jīng)方差分析，得到p=0.97(p>0.05)，說明conv3、conv4與conv5三層在分類結(jié)果的差異不具有統(tǒng)計學(xué)意義.

2) sMRI本身是三維圖像，任何一個掃描層都可能與其上下層的掃描信息存在著重要的關(guān)聯(lián). 將三維圖像轉(zhuǎn)成二維，再使用深度學(xué)習(xí)網(wǎng)絡(luò)訓(xùn)練的方法，并不會將每位受試者的信息作為一個整體. 這樣訓(xùn)練集和測試集間存在高度相關(guān)，結(jié)果并不具有實(shí)際意義. 三維卷積網(wǎng)絡(luò)由于神經(jīng)影像數(shù)量的限制，并不能充分發(fā)揮三維卷積網(wǎng)絡(luò)的特性，而且訓(xùn)練比較復(fù)雜. 本研究中，基于經(jīng)典的二維卷積網(wǎng)絡(luò)模型，通過三維特征組合的方式，將每位受試者看作一個整體而構(gòu)建分類模型，取得了較好的分類結(jié)果.

3) 研究中也還存在一些缺陷. 更深、更廣的深度模型是近期CNN領(lǐng)域研究的方向. 與AlexNet相比，VGG-16、ResNet、GoogleNet等網(wǎng)絡(luò)模型在網(wǎng)絡(luò)寬度更寬、在網(wǎng)絡(luò)深度上更深、模型結(jié)構(gòu)更加復(fù)雜[24]，它們非?？赡軙锳D分類提供更好的結(jié)果. 與前人用深度學(xué)習(xí)方法在AD、MCI與NC分類研究中的結(jié)果對比，本研究的方法并未在實(shí)驗(yàn)結(jié)果中有明顯的改進(jìn). 一個可能的原因可能是采用了遷移學(xué)習(xí)的算法來提取圖像的通用特征，特征并沒有為神經(jīng)影像進(jìn)行優(yōu)化，后續(xù)的研究中將通過對經(jīng)典網(wǎng)絡(luò)進(jìn)行微調(diào)訓(xùn)練來進(jìn)一步提高模型性能.

99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看