• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于AlexNet模型的AD分類

      2020-01-14 07:48:48張柏雯吳水才
      關(guān)鍵詞:灰質(zhì)個數(shù)受試者

      張柏雯, 林 嵐, 吳水才

      (北京工業(yè)大學(xué)生命科學(xué)與生物工程學(xué)院, 北京 100124)

      阿爾茲海默癥(Alzheimer’s disease,AD)是最為常見的神經(jīng)退行性疾病. 隨老齡化趨勢,預(yù)計到2050年,全球AD患者將達(dá)到1.6億[1]. 目前AD的發(fā)病機(jī)制尚不明確,一經(jīng)發(fā)現(xiàn)難以逆轉(zhuǎn). 但AD一般具有較長的臨床前期,若能在AD早期發(fā)現(xiàn)并及時做出正向的治療干預(yù),將有可能延緩AD的發(fā)病時間[2]. 輕度認(rèn)知障礙(mild cognitive impairment,MCI)是介于AD與正常老化(normal control,NC)的一種中間狀態(tài),MCI患者被認(rèn)為是AD患病的高危人群[3]. 但老年人的認(rèn)知退化程度與臨床表現(xiàn)常存在特異性[4],單憑認(rèn)知量表測量難以準(zhǔn)確區(qū)分. 結(jié)構(gòu)磁共振圖像(structural magnetic resonance imaging,sMRI)因其對腦部組織解剖結(jié)構(gòu)顯像的高分辨率,且具有無創(chuàng)、圖像易獲取等優(yōu)勢,被廣泛用于AD的早期診斷中.

      深度卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks,CNN)近年來在圖像識別領(lǐng)域表現(xiàn)突出,逐漸被運(yùn)用于醫(yī)學(xué)圖像領(lǐng)域的研究中[5]. 相比于傳統(tǒng)機(jī)器學(xué)習(xí)算法需要手工特征提取,深度學(xué)習(xí)的方法不但能夠發(fā)現(xiàn)一些潛在的疾病特征,同時減少了手工提取感興趣區(qū)的人為因素,避免或減少了模型構(gòu)建前的預(yù)處理步驟,提高了工作效率[6]. 由于sMRI是三維的影像模態(tài),最合適的研究方法是直接建立三維的CNN模型. 但總體來說,三維的CNN模型目前還不是特別成熟. 在深度學(xué)習(xí)時代,數(shù)據(jù)至少與算法一樣重要,CNN需要大量的數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練. 神經(jīng)影像的樣本數(shù)目遠(yuǎn)小于自然圖像的數(shù)目. 三維的CNN模型必須在模型復(fù)雜度和訓(xùn)練收斂性之間做一個權(quán)衡,難以充分發(fā)揮三維模型的優(yōu)勢. Hosseini-Asl等[7]運(yùn)用自編碼器與三維CNN結(jié)合的方法進(jìn)行AD分類預(yù)測,在AD與NC中取得了97.6%的分類準(zhǔn)確率. 盡管該模型取得了優(yōu)異的性能,但它需要將三維體素塊輸入自編碼器進(jìn)行大量訓(xùn)練,得到預(yù)訓(xùn)練好的卷積核后再輸入三維的CNN模型中. 這種網(wǎng)絡(luò)訓(xùn)練的方式,存在訓(xùn)練復(fù)雜度高、模型深度較淺的問題. 另一種可行的方法是借鑒在ImageNet舉辦的大規(guī)模視覺識別挑戰(zhàn)賽(ImageNet Large Scale Visual Recognition Challenge,ILSVRC)中脫穎而出的經(jīng)典網(wǎng)絡(luò),如AlexNet[8]、GoogleNet[9]等,來進(jìn)行AD、MCI與NC的分類研究[10]. Sarraf等[11]將功能磁共振成像(function MRI,fMRI)和sMRI轉(zhuǎn)換為二維的圖像切片后分別輸入LeNet-5[12]和GoogleNet中,通過對經(jīng)典網(wǎng)絡(luò)模型的遷移訓(xùn)練實(shí)現(xiàn)對AD與NC分類. 該方法在fMRI中獲得了94.32%的準(zhǔn)確率,在sMRI分類準(zhǔn)確率中最高一組達(dá)到98.7%. 但該方法的一個嚴(yán)重缺陷是沒有考慮到同一受試者的二維sMRI切片間存在很高的空間相關(guān)性,同時fMRI二維切片也存在時間和空間相關(guān)性. 這樣,預(yù)測集和驗(yàn)證集圖像間有很高的相關(guān)性,實(shí)際的分類模型并不能很好地解釋AD的分類結(jié)果. 呂鴻蒙等[13]運(yùn)用AlexNet及增強(qiáng)AlexNet網(wǎng)絡(luò)模型,在AD與NC、AD與MCI、MCI與NC的分類中分別取得了94.70%、97.10%、80.62%的準(zhǔn)確率. 但該研究同樣也存在沒有考慮sMRI空間相關(guān)性的問題.

      在ILSVRC出現(xiàn)的經(jīng)典模型中學(xué)習(xí)的權(quán)重可用于初始化其他數(shù)據(jù)集的模型,并顯著提高性能. 本文基于NC、MCI和AD的sMRI和CNN中的經(jīng)典模型AlexNet,運(yùn)用遷移學(xué)習(xí)的方法提取圖像特征,再進(jìn)行三維特征重組,之后結(jié)合機(jī)器學(xué)習(xí)的方法建立分類模型,實(shí)現(xiàn)AD、MCI及NC的分類.

      1 材料與方法

      1.1 研究對象及數(shù)據(jù)獲取

      本研究受試對象為422名年齡在55~90歲的老年人,數(shù)據(jù)均來自于阿爾茲海默癥神經(jīng)影像學(xué)計劃(Alzheimer’s Disease Neuroimaging Initiative,ADNI)數(shù)據(jù)庫(http:∥adni.loni.usc.edu/). 采用的是ADNI-1階段的延續(xù)“ADNI重大計劃項(xiàng)目”(ADNI Grand Opportunities,ADNI-GO)與ADNI-2階段的AD、晚期MCI(late MCI,LMCI)與NC受試者的基線(baseline,即第0個月)sMRI數(shù)據(jù)[14]. 受試者均無抑郁等精神疾病,并根據(jù)ADNI的要求接受跟蹤隨訪的數(shù)據(jù)采集,每次受試均接受簡易精神量表(mini-mental state examination,MMSE)及臨床癡呆評測表(clinical dementia rating,CDR)評測. 實(shí)驗(yàn)對象具體特征如表1所示.

      表1 實(shí)驗(yàn)對象特征

      數(shù)據(jù)集采集設(shè)備均為Philips 3.0T MRI掃描設(shè)備,研究所需圖像為三維磁化快速梯度回波成像MPRAGE,TR=6.8 mm,TE=3.1 mm,F(xiàn)OV:RL=204 mm;AP=240 mm;FH=256 mm,掃描層厚為1.2 mm,層數(shù)為170,體素為1 mm×1 mm×1.2 mm.

      1.2 AlexNet網(wǎng)絡(luò)結(jié)構(gòu)

      本研究中特征遷移學(xué)習(xí)使用的基礎(chǔ)網(wǎng)絡(luò)模型為AlexNet,結(jié)構(gòu)如圖1所示. AlexNet為8層網(wǎng)絡(luò)結(jié)構(gòu),前5層為卷積層,后3層為全連接層,其中前2層卷積和第5層卷積后均跟隨池化層,每一個卷積層均采用ReLU激活函數(shù)[8]. 大小為227×227的RGB三通道圖像輸入AlexNet,分別經(jīng)過了卷積、ReLU、池化、歸一化過程. 其中第1層卷積過程的卷積核大小為11×11,步長為4;池化采用為重疊池化,設(shè)置步幅為2、池寬為3的滑動窗口. 第2層卷積過程的卷積核為5×5,步長為1,池化方式與第1層一致. 經(jīng)過上述過程,在第2層的輸出大小變?yōu)榱?3×13×256. 之后的3個卷積層均采用卷積核大小為3×3,步長為1. 在第5層卷積后跟隨1次池化,池化方式與前2層相同. 經(jīng)過5次卷積計算,可將圖像的特征進(jìn)行抽象,往往能表達(dá)出具有分類特征的信息. 各層具體的網(wǎng)絡(luò)參數(shù)如表2所示.

      表2 AlexNet網(wǎng)絡(luò)參數(shù)

      1.3 圖像預(yù)處理

      前人研究顯示灰質(zhì)萎縮是早期AD與NC區(qū)分的重要依據(jù)[15],本研究中應(yīng)用體素形態(tài)學(xué)(voxel-base morphometry,VBM)的方法,基于受試者全腦的灰質(zhì)密度圖而進(jìn)行分析[16]. 全腦的灰質(zhì)密度圖在Matlab2015b(the mathworks,Sherborn,US)中運(yùn)行通用工具包SPM-12(statistical parametric mapping,London,UK)完成[17]. 主要步驟有:DICOM至img+hdr的格式轉(zhuǎn)化;將所有受試者的圖像空間標(biāo)準(zhǔn)化到統(tǒng)一模板;再將腦組織進(jìn)行分割,提取灰質(zhì)信息;運(yùn)用Dartel工具箱[18]將每位受試者圖像依次迭代,與前一次生成的灰質(zhì)模板進(jìn)行配準(zhǔn),之后將所有配準(zhǔn)后的圖像平均得到新的模板,直到得到最優(yōu)模板. 再將所有灰質(zhì)圖像標(biāo)準(zhǔn)化到最優(yōu)模板,灰質(zhì)平滑設(shè)置半高寬為8 mm的高斯平滑核. 經(jīng)過調(diào)制后的灰質(zhì)密度圖,體素值就反映了相應(yīng)的灰質(zhì)密度信息.

      AlexNet的輸入圖像尺寸為227×227的RGB三通道. 經(jīng)過上述灰質(zhì)密度圖的生成步驟后,對每位受試者圖像均進(jìn)行插值、剪切與填充等步驟,以符合AlexNet的網(wǎng)絡(luò)輸入需求. 本文采用的是橫斷位圖像輸入網(wǎng)絡(luò)模型的方式,考慮到AD與LMCI多發(fā)生于海馬、內(nèi)嗅皮質(zhì)區(qū)、顳中回等區(qū)域,由于SPM-12生成灰質(zhì)密度圖的過程中,預(yù)處理過的圖像在z軸橫斷面上、下均存在著空白區(qū)域,靠近z軸上端保留著少部分腦皮層區(qū)域、下端保留著小腦邱體,這些區(qū)域?qū)D與LMCI分類并不敏感. 為了降低后續(xù)分類中特征維度遠(yuǎn)遠(yuǎn)大于特征數(shù)對分類模型精度帶來的影響,將這些空白區(qū)域與不敏感區(qū)域舍去,最終保留每位受試者在橫斷面的65層圖像信息,再將所有圖像分別轉(zhuǎn)換為RGB三通道的偽彩圖.

      1.4 基于AlexNet的遷移學(xué)習(xí)特征提取

      特征提取運(yùn)行環(huán)境為:Ubuntu14.04,CAFFE深度學(xué)習(xí)平臺,配置CUDA 8.0環(huán)境,GPU為Tesla k20c,內(nèi)存為64 GB. 將圖像輸入預(yù)先訓(xùn)練好AlexNet模型,設(shè)置相對應(yīng)的參數(shù),進(jìn)行逐層特征提取. 如圖2為一幅灰質(zhì)圖像輸入AlexNet模型后提取特征可視化后的示意圖. 根據(jù)特征遷移學(xué)習(xí)的原理[19],靠近輸入層的前端卷積層一般反映出的是圖像的邊緣、紋理等信息,如圖2(a);靠近全連接層的后端卷積層一般反映的是圖像細(xì)節(jié)信息,這些信息中能抽象出具有代表性的分類特征. 在AlexNet中一般認(rèn)為conv3、conv4、conv5三個卷積層能用作之后的分類提取[18],如圖2(b)~(d). 將每位受試者的圖像按照z軸從上到下的順序依次輸入AlexNet提取特征,根據(jù)AlexNet模型的參數(shù),如表2所示,即每一層圖像在conv3、conv4的特征維度為13×13×384,conv5特征維度為13×13×256,將每位受試者的特征變量按照原65層排列順序重新組成一組三維特征.

      經(jīng)過重組后的特征,每位受試者在conv3和conv4的特征維度都達(dá)到140萬維以上(65幅13×13×384),而在后續(xù)分類中,每組的樣本總量不足400例,這樣的特征維度不但遠(yuǎn)遠(yuǎn)大于樣本總量,而且存在過多的冗余信息,無疑會對后續(xù)分類造成維度災(zāi)難[20]. 因此對特征選用與AlexNet中一樣尺寸的池化方法.

      1.5 特征降維與選擇

      需要對AD與NC、AD與LMCI、LMCI與NC三組分別進(jìn)行二分類. conv3、conv4和conv5雖然都能反映出輸入圖像的細(xì)節(jié)信息,但是具體在哪一層有更好的表現(xiàn),在不同研究中并無定論,所以本研究將conv3、conv4和conv5的特征均作為下一步的分類特征. 在上述重疊池化降維后,雖然維度相較提取時的已有大幅降低,但相對于每個分類組的個數(shù)仍處于特征數(shù)遠(yuǎn)遠(yuǎn)大于分類樣本數(shù)量,因此本研究分類模型構(gòu)建首先進(jìn)行了特征降維,再經(jīng)過特征選擇,最后構(gòu)建分類器分類.

      具體方法步驟如下.

      步驟1運(yùn)用主成分分析(principal component analysis,PCA)對各個分類組的原始特征進(jìn)行降維. PCA能通過線性或非線性組合的方法構(gòu)造相關(guān)特征,使原始的高維特征映射到低維,保留最重要的特征信息,可以從多元事物中更好地解析出主要的影響因素[21]. PCA主要計算過程有:讀取各分類集數(shù)據(jù);去均值、計算協(xié)方差矩陣;計算特征向量及特征值,并按照特征值大小排序;再根據(jù)各個主成分累計的貢獻(xiàn)率大小選取主成分,從而得到降維后的矩陣.

      步驟2運(yùn)用序列前向搜索(sequential forward search,SFS)特征選擇. 雖然經(jīng)上一步驟所保留的特征已按照貢獻(xiàn)率大小排名,但并不能說明貢獻(xiàn)率高的特征對于接下來的分類器訓(xùn)練最佳. 因此接下來選用SFS的方法在每個PCA后的分類組的訓(xùn)練集中分別進(jìn)行特征選擇. SFS通過自上而下的搜索找到最佳特征,是一種“只出不進(jìn)”的貪心算法[22]. 根據(jù)各組別受試者的實(shí)際個數(shù),選擇每組別隨機(jī)化后合適數(shù)量的受試者作為SFS特征選擇及之后分類器的訓(xùn)練集. SFS主要計算過程有:首先從空集開始;當(dāng)遇到最佳分類特征時更新特征子集;重復(fù)上述過程,直到目標(biāo)子集數(shù)量達(dá)到設(shè)定的個數(shù)為止;在實(shí)際選擇特征時,能通過最終的特征目標(biāo)子集的誤分比率的最低值來確定哪些特征及多少個特征個數(shù)作為后續(xù)特征分類的訓(xùn)練集最佳.

      步驟3運(yùn)用支持向量機(jī)(support vector machines,SVM)構(gòu)建特征分類器. 使用LIBSVM工具包[23],設(shè)置線性核函數(shù)對各分類組分別進(jìn)行分類. 每組選用與上述SFS算法一致的子集作為訓(xùn)練集,其余受試者均為測試集. 最后,統(tǒng)計SVM的分類結(jié)果,對整體模型設(shè)計進(jìn)行評估.

      2 結(jié)果

      首先,將conv3、conv4和conv5的各分類組進(jìn)行PCA降維,保留貢獻(xiàn)度在前95%的特征. 經(jīng)過PCA后,所有分類組的特征個數(shù)均小于受試者的個數(shù). 但是貢獻(xiàn)度的排名并不能等同于分類信息的排名,如圖3所示,在conv3中AD與LMCI分類組,圖3(a)顯示第一主成分的貢獻(xiàn)率也只占到13%,排名的前50個主成分占到的主成分貢獻(xiàn)率也不足50%. 由圖3(b)可以看出,AD與LMCI并無明顯的分界,說明即便第一主成分與第二主成分也不具有較強(qiáng)的分類敏感性. 所以需要在訓(xùn)練集進(jìn)行SFS的特征選擇,AD、LMCI與NC每組分別選擇隨機(jī)化后的75例受試者作為訓(xùn)練集,其余均作為測試集,各組分類集與測試集的個數(shù)如表3所示. 根據(jù)各分類組的SFS錯誤分類比率,大約在第20個特征時,錯誤分類率達(dá)到最低,且誤分比率相對穩(wěn)定. conv3中AD與LMCI分類組中SFS錯誤分類比率的統(tǒng)計圖如圖4所示. 所以對3個分類組SFS均選取20個特征作為下一步分類器構(gòu)建.

      表3 訓(xùn)練集與測試集

      將SFS選擇出的各分類組的特征作為SVM分類器的輸入,得到conv3、conv4和conv5的各個分類組的分類結(jié)果,如表4所示. 實(shí)驗(yàn)結(jié)果評價采用準(zhǔn)確率(Accuracy)、靈敏度(Sensitivity)與特異性(Specificity)3項(xiàng)作為模型評價指標(biāo). 其定義為

      (1)

      (2)

      (3)

      式中:nTP為真陽性(true positive)在AD與NC、AD與LMCI的分類中,為被準(zhǔn)確識別出的AD樣本個數(shù);在LMCI與NC的分類中,表示準(zhǔn)確識別的LMCI樣本個數(shù).

      表4 各組二分類結(jié)果

      nFP為假陽性(false positive)在AD與NC、AD與LMCI的分類中,為AD受試者被劃分為了NC或LMCI組的樣本個數(shù);在LMCI與NC的分類中,為LMCI劃分到了NC組的樣本個數(shù).

      nFN為假陰性(false negative)在AD與NC、AD與LMCI的分類中,為NC或LMCI受試者被劃分為了AD組的樣本個數(shù);在LMCI與NC的分類中,為NC劃分到了LMCI組的樣本個數(shù).

      nTN為真陰性(true negative)在AD與NC、LMCI與NC的分類中,為被準(zhǔn)確識別出的NC樣本個數(shù),在AD與LMCI的分類中為準(zhǔn)確識別出的LMCI樣本個數(shù).

      3 結(jié)論

      1) 由表4的二分類結(jié)果表明,通過遷移學(xué)習(xí)提取圖像特征再進(jìn)行三維重組的方式,對于AD、LMCI與NC之間的分類是一種可行的方法. 對conv3、conv4與conv5三個卷積層分別進(jìn)行了分類,經(jīng)方差分析,得到p=0.97(p>0.05),說明conv3、conv4與conv5三層在分類結(jié)果的差異不具有統(tǒng)計學(xué)意義.

      2) sMRI本身是三維圖像,任何一個掃描層都可能與其上下層的掃描信息存在著重要的關(guān)聯(lián). 將三維圖像轉(zhuǎn)成二維,再使用深度學(xué)習(xí)網(wǎng)絡(luò)訓(xùn)練的方法,并不會將每位受試者的信息作為一個整體. 這樣訓(xùn)練集和測試集間存在高度相關(guān),結(jié)果并不具有實(shí)際意義. 三維卷積網(wǎng)絡(luò)由于神經(jīng)影像數(shù)量的限制,并不能充分發(fā)揮三維卷積網(wǎng)絡(luò)的特性,而且訓(xùn)練比較復(fù)雜. 本研究中,基于經(jīng)典的二維卷積網(wǎng)絡(luò)模型,通過三維特征組合的方式,將每位受試者看作一個整體而構(gòu)建分類模型,取得了較好的分類結(jié)果.

      3) 研究中也還存在一些缺陷. 更深、更廣的深度模型是近期CNN領(lǐng)域研究的方向. 與AlexNet相比,VGG-16、ResNet、GoogleNet等網(wǎng)絡(luò)模型在網(wǎng)絡(luò)寬度更寬、在網(wǎng)絡(luò)深度上更深、模型結(jié)構(gòu)更加復(fù)雜[24],它們非??赡軙锳D分類提供更好的結(jié)果. 與前人用深度學(xué)習(xí)方法在AD、MCI與NC分類研究中的結(jié)果對比,本研究的方法并未在實(shí)驗(yàn)結(jié)果中有明顯的改進(jìn). 一個可能的原因可能是采用了遷移學(xué)習(xí)的算法來提取圖像的通用特征,特征并沒有為神經(jīng)影像進(jìn)行優(yōu)化,后續(xù)的研究中將通過對經(jīng)典網(wǎng)絡(luò)進(jìn)行微調(diào)訓(xùn)練來進(jìn)一步提高模型性能.

      猜你喜歡
      灰質(zhì)個數(shù)受試者
      涉及人的生物醫(yī)學(xué)研究應(yīng)遵循的倫理原則
      涉及人的生物醫(yī)學(xué)研究應(yīng)遵循的倫理原則
      怎樣數(shù)出小正方體的個數(shù)
      涉及人的生物醫(yī)學(xué)研究應(yīng)遵循的倫理原則
      等腰三角形個數(shù)探索
      怎樣數(shù)出小木塊的個數(shù)
      COPD患者認(rèn)知功能障礙和大腦灰質(zhì)密度異常的磁共振研究
      2型糖尿病對阿爾茨海默病腦灰質(zhì)的影響:DKI初步研究
      涉及人的生物醫(yī)學(xué)研究應(yīng)遵循的倫理原則
      怎樣數(shù)出小正方體的個數(shù)
      涟源市| 剑川县| 衡山县| 抚州市| 武乡县| 中卫市| 定陶县| 攀枝花市| 德令哈市| 新津县| 白山市| 惠来县| 宝丰县| 伊宁县| 齐河县| 江津市| 梧州市| 溧阳市| 平潭县| 桂平市| 康保县| 芜湖县| 会东县| 磴口县| 兰州市| 垫江县| 汤原县| 宁河县| 天峨县| 宣恩县| 建阳市| 康定县| 仁怀市| 都江堰市| 泰和县| 平顺县| 本溪| 磐安县| 乌审旗| 静安区| 柏乡县|