丘致榕
(福建師范大學(xué),福建 福州 350001)
本文的基準(zhǔn)網(wǎng)絡(luò)為ResNet-34,卷積層基本都采用了3x3x3的過濾器并遵循了兩個(gè)設(shè)計(jì)原則:(1)如果輸出的特征圖大小相同,那么每層的過濾器數(shù)目也相同。(2)如果特征圖的大小減半,那么過濾器的數(shù)量翻倍,保持每層的時(shí)間復(fù)雜度不變。在網(wǎng)絡(luò)的最后,經(jīng)過全局池化層和全連接的softmax層。在基準(zhǔn)網(wǎng)絡(luò)的基礎(chǔ)上,我們加入快捷連接就得到了對應(yīng)的殘差版本??旖葸B接仍然采用恒等映射,對于維度增加的用零補(bǔ)齊。這種方法不會增加額外的參數(shù),并采用1x1卷積來匹配尺寸。
ResNet-34是由若干殘差塊組成的網(wǎng)絡(luò),每個(gè)殘差塊的輸入先經(jīng)過卷積層,再通過與之匹配的歸一化層,隨后經(jīng)過一個(gè)激活層,再經(jīng)過一個(gè)同樣的結(jié)構(gòu)[1]。
本文獲取了pMCI 159例和sMCI 121例樣本的核磁共振成像,每一例樣本經(jīng)過前聯(lián)合—后聯(lián)合校正(AC-PC)、強(qiáng)度非均勻校正(N3)、去頭骨、配準(zhǔn)到標(biāo)準(zhǔn)模板和重采樣的預(yù)處理后得到去頭骨圖像、灰質(zhì)圖像、白質(zhì)圖像三個(gè)模態(tài)的圖像數(shù)據(jù)。隨機(jī)選取179例作為訓(xùn)練集樣本,45例作為驗(yàn)證集樣本,56例作為測試集樣本[2]。對模型采取五折交叉驗(yàn)證的方式選取分類器的最優(yōu)參數(shù)。以0.01步長作為閾值繪制模型的ROC曲線以評價(jià)模型效果,并分析模型的ACC(準(zhǔn)確率),SEN(敏感度),SPE(特異性),AUC(ROC曲線下方面積)四個(gè)指標(biāo)。
針對模型的過擬合問題,我們加入了L2正則化,優(yōu)化前后模型的Loss變化趨勢如圖1所示。
圖1 L2正則化加入前后的損失變化趨勢
其中實(shí)線為加入L2正則化手段前的Loss趨勢,而虛線為加入L2正則化手段后的Loss趨勢,可以發(fā)現(xiàn)加入L2正則化后模型的Loss下降趨緩,可以迫使模型盡可能少地學(xué)習(xí)到與問題無關(guān)的特征信息,一定程度上緩解模型過擬合的問題。
基于不同的FNr閾值,我們針對單模態(tài)和多模態(tài)的數(shù)據(jù)集描繪了模型的ROC曲線(圖2),實(shí)驗(yàn)結(jié)果發(fā)現(xiàn),對于單模態(tài)的模型而言,雖然真陽率較低的時(shí)候模型的假陽率較多模態(tài)模型有一定的優(yōu)勢,但是在真陽率高于0.1時(shí),多模態(tài)的模型假陽率明顯低于單模態(tài)模型的假陽率[3]。多模態(tài)模型ROC曲線整體趨勢更偏左上方,表明多模態(tài)的數(shù)據(jù)集對于降低模型誤判起到了非常明顯的作用。
在激活函數(shù)方面,我們分析了Sigmoid、Tanh、ReLU、LeakyReLU、ELU、GELU幾個(gè)激活函數(shù),并比較了其在本文模型上的實(shí)驗(yàn)結(jié)果(圖3)。除Sigmoid激活函數(shù)發(fā)生梯度消失現(xiàn)象無法訓(xùn)練外,其余激活函數(shù)均取得了一定的效果。其中LeakyReLU激活函數(shù)可以取得最高的準(zhǔn)確度(0.732)、最高的特異性(0.844)和最高的AUC值(0.717)。
LeakyReLU與原始的ReLU激活函數(shù)相比,雖然模型的敏感度略有下降(3個(gè)百分點(diǎn)),但模型的ACC、SPE、AUC指標(biāo)繼續(xù)上升,其中模型準(zhǔn)確度上升了4個(gè)百分點(diǎn)左右,特異性上升了10個(gè)百分點(diǎn),AUC指數(shù)上升了3個(gè)百分點(diǎn)。說明LeakyReLU激活函數(shù)在保留額外信息的同時(shí),一定程度上帶來了噪聲因素,導(dǎo)致模型區(qū)分正常類別的能力略有下降,但是這些額外信息中更大程度上包含的是有利于模型區(qū)分異常樣本的部分,并且較為明顯地提高了模型區(qū)分異常樣本的檢測能力,相較而言是利大于弊的。
圖2 單模態(tài)與多模態(tài)比較
圖3 不同激活函數(shù)的比較
我們還比較了其他同類問題研究算法模型的效果。ROI方法將全腦sMRI數(shù)據(jù)劃分為多個(gè)區(qū)域,提取區(qū)域尺度特征,使用SVM進(jìn)行分類。VBM方法將所有sMRI數(shù)據(jù)空間歸一化到Colin27模板,以體素方式提取局部灰質(zhì)密度。然后,基于t檢驗(yàn)進(jìn)行統(tǒng)計(jì)學(xué)組比較,對高維體素級特征表示進(jìn)行降維。最后,構(gòu)造線性SVM分類器進(jìn)行疾病診斷。在LBM方法中,首先從以每個(gè)預(yù)定義解剖標(biāo)志為中心的局部圖像斑塊中提取形態(tài)學(xué)特征。這些斑塊級特征表示進(jìn)一步通過z-score歸一化處理進(jìn)行連接和處理,實(shí)現(xiàn)基于SVM的線性分類[4]。以上三種方法皆是對三維圖像做了大量處理后再加以識別,而本文僅進(jìn)行了簡單的優(yōu)化,可以發(fā)現(xiàn)本文的模型在ACC(準(zhǔn)確率)、SEN(敏感度)、SPE(特異性)、AUC(ROC曲線下方面積)四個(gè)評價(jià)維度上均取得了最佳效果。
表1 同類型問題的模型比較
本文采用三維ResNet作為主干網(wǎng)絡(luò),并對其原有結(jié)構(gòu)做了修改與優(yōu)化。模型準(zhǔn)確度為0.905,驗(yàn)證集準(zhǔn)確度為0.711,測試集準(zhǔn)確度為0.732。實(shí)驗(yàn)結(jié)果表明:多模態(tài)的核磁共振圖像對于阿爾茨海默病pMCI與sMCI分類任務(wù)較單模態(tài)數(shù)據(jù)有較大提升;同時(shí),LeakyReLU的特殊函數(shù)設(shè)計(jì)以固定衰減率保留了負(fù)值區(qū)間的部分信息,較ReLU等其余激活函數(shù)更適合阿爾茨海默病核磁共振圖像的分類任務(wù);此外,L2正則懲罰項(xiàng)的引入對于模型訓(xùn)練起到了緩解過擬合的作用。最終訓(xùn)練模型準(zhǔn)確度為0.732,基本滿足醫(yī)學(xué)輔助診斷任務(wù)需求。