滕升華,商勝楠△,王芳,趙增順,2
(1.山東科技大學(xué)電子通信與物理學(xué)院,青島 266590;2.山東大學(xué)控制科學(xué)與工程學(xué)院,濟(jì)南 250061)
對阿爾茨海默病(Alzheimer′s disease,AD)及其前期階段——輕度認(rèn)知障礙(mild cognitive impairment,MCI)的計算機(jī)輔助診斷一直是神經(jīng)影像分析領(lǐng)域的研究熱點,目的是利用計算機(jī)分析方法處理腦影像數(shù)據(jù)實現(xiàn)對患者的精確診斷。迄今為止,許多模式識別和機(jī)器學(xué)習(xí)方法被開發(fā)并應(yīng)用于辨別AD、MCI和正常群體(normal control,NC)[1-3]。
在此類神經(jīng)組織退化疾病的診斷中,常用到結(jié)構(gòu)性腦影像數(shù)據(jù)如磁共振圖像[4]。由于腦影像數(shù)據(jù)通常維數(shù)非常高,因此,不宜直接在原始圖像域進(jìn)行類別分析,而是通過特征提取和特征選擇,最終在低維空間實現(xiàn)分類。在眾多分類方法中,支持向量機(jī)因分類精度高且應(yīng)用簡便而被廣為采用[5-6]。然而對于腦影像等高維、含噪數(shù)據(jù)支持向量機(jī)的分類性能則會顯著下降[7]。
近年來,基于稀疏表示的分類方法逐漸受到重視[8-10]:將各類別的訓(xùn)練樣本混合起來組成字典,根據(jù)字典以稀疏表示的形式重建待識別樣本;在對待識別樣本的稀疏表示中,各類別的訓(xùn)練樣本貢獻(xiàn)不同,識別結(jié)果判定為在稀疏表示中貢獻(xiàn)最大的類別。
基于稀疏表示的分類機(jī)理是尋找能夠最好地表示待識別樣本的類別,默認(rèn)前提是樣本能且僅能被同類樣本精確地表示。但是如果訓(xùn)練樣本構(gòu)建的字典是非完備的,某些待識別樣本不能被訓(xùn)練字典精確地表示,相應(yīng)地可能會得到錯誤的分類結(jié)果。因此,稀疏表示分類器的識別能力受限于字典表示未知樣本的能力,對于特征維數(shù)高而訓(xùn)練樣本數(shù)量相對較少的情形更是如此。
增強(qiáng)字典的表示能力是優(yōu)化稀疏表示分類器的有效方法,由此產(chǎn)生了一些改進(jìn)的稀疏表示分類器。有研究者提出引入類內(nèi)差異構(gòu)造增強(qiáng)型的字典[11],或者采用字典學(xué)習(xí)得到可分性更強(qiáng)的字典[12-13]。這些改進(jìn)方法是計算機(jī)視覺領(lǐng)域中專為人臉識別而設(shè)計的,并不適用于數(shù)據(jù)維數(shù)相對更高而訓(xùn)練樣本數(shù)量更少的AD診斷。
構(gòu)造增強(qiáng)字典用到的類內(nèi)差異[11]是指同類樣本之間的差別,被認(rèn)為包含了一定成分的樣本細(xì)節(jié)信息。本研究首先對各類樣本進(jìn)行聚類,得到若干子類中心,以這些子類中心而非原始樣本構(gòu)建第一層字典;計算每個樣本與最近子類中心的差作為類內(nèi)差異,構(gòu)建補(bǔ)充性的第二層字典。兩層字典聯(lián)合起來對待識別樣本進(jìn)行稀疏表示,實現(xiàn)一種基于復(fù)合稀疏表示的分類器,并通過實驗驗證該分類器用于診斷阿爾茨海默病的有效性。
常規(guī)的稀疏表示分類器首先將待識別樣本表示成包含所有類別訓(xùn)練樣本的線性組合,通過計算在此聯(lián)合表示中每類訓(xùn)練樣本對待識別樣本的表示結(jié)果,最終將待識別樣本判定為表示誤差最小的類別。改變字典結(jié)構(gòu)或者利用不同的稀疏表示形式會產(chǎn)生不同的稀疏表示分類器。
類似于圖像分解,將圖像表示成主體結(jié)構(gòu)和紋理信息之和,本研究利用混合稀疏表示將待識別樣本分解為兩層內(nèi)容:與類別相關(guān)的主體結(jié)構(gòu)和與類別無關(guān)的通用細(xì)節(jié),根據(jù)各類別主體結(jié)構(gòu)在聯(lián)合稀疏表示中的貢獻(xiàn)量實現(xiàn)分類。
(1)
依據(jù)上式的表示系數(shù),分別計算獨立利用每類樣本表示待識別樣本y的誤差。
(2)
將y判定為表示誤差最小的類別。
Label(y)=arg miniri(y)
(3)
常規(guī)的稀疏表示分類器利用原始形式的訓(xùn)練樣本構(gòu)造字典,該方法在人臉識別中的應(yīng)用表明:精心選擇訓(xùn)練樣本而且每類的樣本數(shù)量都足夠多,稀疏表示分類器能夠?qū)崿F(xiàn)較好的識別效果。然而對于實際的AD分類問題,相對于腦影像數(shù)據(jù)的高維度,訓(xùn)練樣本數(shù)量明顯不足。因此,在常規(guī)的稀疏表示框架下,現(xiàn)有的訓(xùn)練數(shù)據(jù)不足以精確地表示待識別樣本。
也正如人臉識別中同一個人的不同圖像之間可能存在明顯的表情、光照、妝扮等差異,而這些細(xì)節(jié)因素并非決定類別的關(guān)鍵,直接堆砌訓(xùn)練樣本會降低稀疏表示的分類精度。在AD分類中即使同類的腦影像數(shù)據(jù)之間通常也會表現(xiàn)出顯著的個體差異,為對樣本進(jìn)行篩選,本研究利用聚類方法得到各類的若干子類,進(jìn)而挑選出每類的若干典型樣本構(gòu)成基礎(chǔ)字典。
另一方面,挑選樣本會減小字典規(guī)模,進(jìn)一步降低字典對未知樣本的表示能力。為此,利用樣本間的差異構(gòu)成補(bǔ)充性字典,對基礎(chǔ)字典在表示待識別樣本時的誤差進(jìn)行編碼,最終實現(xiàn)對待識別樣本的精確表示。文中采用基礎(chǔ)字典加補(bǔ)充性字典的雙層字典模式。
利用雙層字典D+V,待識別樣本y可以表示為
y=Dα+Vβ+e
(4)
其中α和β是系數(shù)向量,e是表示誤差。利用L1范數(shù)最小化計算稀疏表示系數(shù)(λ1、λ2是調(diào)節(jié)稀疏程度的參數(shù)):
(5)
采用增廣拉格朗日乘子法(Augmented Lagrange multiplier,簡稱ALM)[15]進(jìn)行求解,得:
(6)
求解公式 (6)的ALM算法:輸入:D、V、y、λ1、λ2初始化:α=0,β=0,?=0, ξ=1,ξmax=104,ρ=1.5,ε=10(-4)While ‖y-Dα-Vβ‖22>εdo1.固定其他參數(shù)更新αα=arg minαξ2‖(y-Vβ+1ξ?)-Dα‖22+λ1‖α‖12.固定其他參數(shù)更新ββ=arg minβξ2‖(y-Dα+1ξ?)-Vβ‖22+λ2‖β‖13.更新拉格朗日乘子?=?+ξ(y-Dα-Vβ)4.更新參數(shù) ξ=min(ξmax,ρξ)end輸出:α,β
在基于雙層字典的復(fù)合稀疏表示中,第一層字典存儲區(qū)分類別的主體結(jié)構(gòu)信息,第二層字典提供補(bǔ)充性細(xì)節(jié),以彌補(bǔ)僅用第一層字典表示待識別樣本的信息缺失。稀疏表示分類器根據(jù)各類別的表示誤差決定類別歸屬,因此計算表示誤差除利用對應(yīng)類別的第一層字典元素之外、還可共用所有類別提供的類內(nèi)差異。
表示誤差定義為:
(7)
同樣依據(jù)公式(3),類別標(biāo)簽取最小的ri(y)對應(yīng)的類別。
利用本研究提出的復(fù)合稀疏表示分類器(hybrid sparse representation based classifier,HSRC)針對取自ADNI(Alzheimer’s Disease Neuroimaging Initiative,ADNI)數(shù)據(jù)庫的磁共振影像進(jìn)行分類實驗,并與支持向量機(jī)[5](support vector machine,SVM)、稀疏表示分類器[9](sparse representation based classifier,SRC)及基于多分類器集成的稀疏表示分類器[7](ensemble sparse representation based classifier,ESRC)進(jìn)行比較。采用文獻(xiàn)中常用兩類別分類實驗,具體包括AD-NC分類、MCI-NC分類。
實驗中共采用了652個樣本,包括198個AD、225個MCI和229個NC。在大腦的磁共振影像中,相對于白質(zhì)和腦脊液,灰質(zhì)部分與AD的診斷相關(guān)性更強(qiáng)[7],因此,以驗證算法的有效性為目的,本研究僅使用灰質(zhì)密度作為樣本特征。
灰質(zhì)密度圖的維數(shù)是256×256×256,為減少數(shù)據(jù)量將其下采樣變?yōu)?4×64×64。利用t-檢驗對全腦體素進(jìn)行篩選以去除與分類任務(wù)相關(guān)性弱的體素,取P值大于0.005的體素構(gòu)成最終的特征向量。公式(6)中調(diào)節(jié)兩層字典稀疏度的參數(shù)分別取λ1=0.1,λ2=0.001。這兩個參數(shù)的選擇借鑒了文獻(xiàn)[13]的處理思路,本研究中采用稀疏與稠密相結(jié)合的表示方式;本研究中λ1取值較大強(qiáng)化與類別相關(guān)的第一次字典在聯(lián)合表示中的稀疏性以利于分類,同時認(rèn)為第二層字典不包含類別信息而使λ2取較小值以更精確地表示待識別樣本。實驗中發(fā)現(xiàn)只需遵循λ1取值相對較大、λ2取值小的設(shè)置,實驗結(jié)果對二者數(shù)值的變化并不敏感(比如λ2取0.001還是0.002幾乎不影響識別結(jié)果,這也體現(xiàn)了算法對參數(shù)選擇的魯棒性)。
實驗數(shù)據(jù)是198個AD樣本和229個NC樣本,利用10交叉驗證評估最終的識別結(jié)果。復(fù)合稀疏表示分類器HSRC與SVM、SRC、ESRC的識別結(jié)果見表1。與其他三種方法相比,HSRC表現(xiàn)出了更好的分類性能,準(zhǔn)確率、靈敏度、ROC曲線下面積等指標(biāo)數(shù)值最高;為了達(dá)到最佳的綜合性能,特異度指標(biāo)稍低。圖1為幾種方法ROC曲線的對比,可以看出HSRC綜合性能最優(yōu)。
表1 AD/NC分類的性能比較
圖1 AD/NC分類中四種方法的ROC曲線
該實驗比較不同方法對225個MCI樣本和229個NC樣本的分類性能,結(jié)果見表2。同AD-NC分類結(jié)果一致,本研究提出的方法對應(yīng)的準(zhǔn)確率、靈敏度、ROC曲線下面積等三個指標(biāo)數(shù)值最高,綜合性能最優(yōu),ROC曲線見圖2。
表2 MCI/NC分類的性能比較
對于高維小樣本的識別問題,原始形式的訓(xùn)練樣本不足以精確地表示待識樣本,從而造成常規(guī)稀疏表示分類器性能下降。將稀疏表示中的字典分解為功能不同的兩個層次:第一層由各類經(jīng)聚類篩選出的典型樣本組成,以期在字典中排除離群樣本又保留類別間的可分性特征;第二層字典的元素是各類中普通樣本與典型樣本的差,這種類內(nèi)差異體現(xiàn)了同類樣本內(nèi)部的個體多樣性、而不攜帶顯著的類別區(qū)分性信息。
圖2 MCI/NC分類中四種方法的ROC曲線
基于兩層字典的協(xié)同工作,設(shè)計了一種復(fù)合稀疏表達(dá)形式,并構(gòu)建分類器用于阿爾茨海默病的計算機(jī)輔助診斷。在ADNI數(shù)據(jù)庫上的分類實驗結(jié)果表明,與常規(guī)稀疏表示分類器及支持向量機(jī)相比,這種復(fù)合稀疏表示分類器的識別能力更強(qiáng)。
最后需要特別指出,本研究的主要貢獻(xiàn)是設(shè)計了適用于阿爾茨海默病診斷的復(fù)合稀疏表示分類器,為與其他分類器進(jìn)行比較僅利用灰質(zhì)密度作為樣本特征。后續(xù)工作中將該分類器推廣到多模態(tài)及縱向腦影像數(shù)據(jù),并融合特征選擇、多分類器集成等策略能進(jìn)一步提高相關(guān)疾病計算機(jī)輔助診斷的準(zhǔn)確率和可靠性。