肖君超, 曾衛(wèi)明, 楊嘉君, 石玉虎, 徐艷紅, 焦 磊
1(上海海事大學 信息工程學院,上海 201306)
2(上海交通大學附屬第六人民醫(yī)院 神經(jīng)內(nèi)科,上海 201306)3(上海交通大學附屬第六人民醫(yī)院 放射科,上海 201306)
最近幾年,由于電子計算機和通信技術(shù)的發(fā)展,電子醫(yī)療成為一個新型的領(lǐng)域,得到快速發(fā)展,許多醫(yī)療形式逐步出現(xiàn)[1-3],預測和診斷疾病是一個重要方面.從醫(yī)療檢測和可穿戴設(shè)備上,獲得健康狀態(tài)信息,醫(yī)師能為病人做出診斷,或預測病人病情未來發(fā)展情況,幫助病人延緩病情.
偏頭痛是一種比較常見的疾病,會出現(xiàn)經(jīng)常性的頭痛,同時伴隨有畏光、嘔吐、惡心等生理反應的慢性神經(jīng)綜合征[4]. 偏頭痛發(fā)病率較高,在醫(yī)學界多年研究中,也沒有找到偏頭痛致病機制的有效依據(jù),對于偏頭痛的診斷還缺乏足夠的生物學標志[4,5].
靜息態(tài)功能核磁共振成像技術(shù),是一種非侵入式探測神經(jīng)元活動的測量方法,受到很多學者關(guān)注. 靜息態(tài)功能核磁共振成像,在分析大腦網(wǎng)絡(luò)中起著重要的作用[6-8],已經(jīng)應用在分析各種精神疾病上[9],比如:老年癡呆[10]、帕金森[11]和精神分裂癥[12].
近年來,由于深度學習在語音識別和圖像處理中,取得突破性的進展,被廣泛應用在各種工程領(lǐng)域. 最近,國內(nèi)外很多學者將深度學習用于功能核磁共振成像數(shù)據(jù)分析,診斷阿爾茨海默癥,得到相對理想的預測效果.在用深度學習診斷阿爾茨海默癥中,更多論文采用softmax分類器與深度模型一起訓練. 此類算法根據(jù)softmax分類器分類正確率為依據(jù),調(diào)整深度模型各個隱藏層神經(jīng)單元的權(quán)重,使得分類正確率達到一個理想的結(jié)果之后停止迭代. 此類算法與傳統(tǒng)的淺層分類器相比,分類正確率更高[13,14]. 由于此類算法在提取數(shù)據(jù)特征時,用到大量的先驗信息,即已經(jīng)擁有大量的確診病例,可以在實驗樣本數(shù)相對豐富的條件下,訓練網(wǎng)絡(luò)達到理想效果. 由于阿爾茨海默癥臨床癥狀表現(xiàn)明顯,在確診上相對容易,獲得較多的實驗樣本并不困難.而偏頭痛在臨床診斷上相對復雜,病例確診相對困難,較難獲取大量實驗樣本數(shù)據(jù). 采用softmax分類器與深度模型一起訓練的算法,因為實驗樣本較少效果并不理想. 本文采用深度學習的深度自編碼器算法,該算法根據(jù)輸入樣本數(shù)據(jù)和輸出樣本數(shù)據(jù)的差異,更新各隱藏層神經(jīng)元權(quán)重,因此在提取實驗樣本數(shù)據(jù)特征時,不需要知道實驗樣本數(shù)據(jù)是健康被試或偏頭痛患者. 該算法不需要過多確診病例樣本來訓練神經(jīng)網(wǎng)絡(luò),提取有效特征. 這符合人們在對偏頭痛的致病機理尚不明確的前提下,有效檢測偏頭痛. 本文最后實驗結(jié)果說明,深度自編碼器獲取的數(shù)據(jù)特征,應用到各種分類算法中都能提高分類正確率.
本文偏頭痛數(shù)據(jù)為上海交通大學附屬第六人民醫(yī)院(東院)經(jīng)過臨床確診的24例數(shù)據(jù),去除不合格的數(shù)據(jù)后還剩17例,平均年齡為45.6歲. 同期選取了100個正常人作為健康對照組,平均年齡43.5歲. 該fMRI數(shù)據(jù)采用Siemens MRI儀(3T)數(shù)據(jù)獲取時,要求被試者保持大腦清醒,并平躺于MRI儀器內(nèi),不做任何思考. 掃描參數(shù):采用單次激發(fā)敏感梯度回波平面成像,切片數(shù)為38,覆蓋整個腦區(qū),TR 3.0 s,掃描分辨率為64×64,片內(nèi)分辨率為4 mm×4 mm,片厚度4 mm.
采用SPM8[15]對靜息態(tài)功能磁共振數(shù)據(jù)進行預處理,主要進行時間層矯正、頭動矯正、圖像標準化等步驟. 在頭動矯正過程中,配準時在任何方向上位移>1.5 mm或頭部轉(zhuǎn)動>1.5°的數(shù)據(jù)均被丟棄; 帶通濾波器參數(shù)為0.01 Hz 自動解剖標簽模板[16]將小腦去除在外,大腦被分為90個腦區(qū). 通過計算每個腦區(qū)之間的皮爾森相關(guān)系數(shù),可以獲得一個90×90的對稱矩陣. 然后獲取該對稱矩陣的上三角部分,并且將其所有元素放在一行,作為一個被試樣本的特征數(shù)據(jù). 自動編碼器可以自動獲取待分析數(shù)據(jù)的特征,而不需要專家通過先驗知識提取特征. 經(jīng)典自動編碼器有一個輸入層、一個隱藏層和一個輸出層. 輸入層和輸出層的神經(jīng)元個數(shù)相等. 自動編碼器是無監(jiān)督學習方法,復雜的高維數(shù)據(jù)被自動編碼為低維數(shù)據(jù). 自動編碼器嘗試逼近一個恒等函數(shù),從而使得輸出值接近于輸入值x. 自動編碼器由兩個函數(shù)組成,第一個是編碼函數(shù),映射高維數(shù)據(jù)到隱藏特征h,分別表示權(quán)重和偏置. 第二個是解碼函數(shù),映射隱藏特征h到,是輸入數(shù)據(jù)x的一個近似值與第一個函數(shù)參數(shù)意義相同.代表數(shù)據(jù)維數(shù)的映射規(guī)則,N表示輸入數(shù)據(jù)的維數(shù),K表示隱藏層神經(jīng)元的個數(shù). ?1(·)表示激活函數(shù),w1是一個N×K的矩陣,b1表示偏置向量. 解碼函數(shù)映射隱藏特征h到x的重構(gòu)數(shù)據(jù)?公式表示為: ?2、w2和b2表示的意義與公式(1)相同. 自動編碼器的參數(shù) θ ={θ1,θ2}通過減小損失函數(shù)值來確定,損失函數(shù)能最小化重構(gòu)誤差使得公式如下: 這是一個最基本的自動編碼器的構(gòu)成,下面將介紹如何將它們組合在一起構(gòu)造出深度模型. 如圖1所示構(gòu)造具有3個隱藏層的自動編碼器.可以看出,第一個隱藏層神經(jīng)元個數(shù)少于輸出層神經(jīng)元個數(shù). 第二個隱藏層神經(jīng)元個數(shù)少于第一個隱藏層神經(jīng)元個數(shù),以此類推,每一個隱藏層神經(jīng)元個數(shù)都少于前面隱藏層神經(jīng)元個數(shù),最后輸出層神經(jīng)元個數(shù)擴大到與輸入層神經(jīng)元個數(shù)相同. 加入輸出層是為了損失函數(shù)可以估算,最后輸出數(shù)據(jù)與輸入數(shù)據(jù)的區(qū)別,從而可以根據(jù)區(qū)別程度,更新自動編碼器的權(quán)重. 自動編碼器自動提取的突顯特征在最后一個隱藏層,用第三個隱藏層輸出的數(shù)據(jù),作為自動編碼器自動獲得的特征. 通過逐漸減少隱藏層神經(jīng)元個數(shù),迫使自動編碼器學習輸入數(shù)據(jù)低維表示. 這種結(jié)構(gòu)能捕獲到輸入數(shù)據(jù)特征在特定空間上的分布,并且將高維的復雜數(shù)據(jù)降低到低維數(shù)據(jù). 用Adadelta優(yōu)化算法訓練整個網(wǎng)絡(luò),它能根據(jù)學習環(huán)境自動調(diào)節(jié)學習參數(shù). 激活函數(shù)采用非線性函數(shù)Relu,通過采用非線性激活函數(shù),自動編碼器能學習到,不同于采用主成分分析得到的數(shù)據(jù)特征. 自動編碼器獲得的特征,可以用帶有少量參數(shù)的非線性函數(shù)表示更復雜的函數(shù). 因此,深度模型完全不同于淺層模型[17] 圖1 構(gòu)造擁有三個隱藏層的深度自動編碼器 深度自動編碼器中,輸入層、輸出層、各個隱藏層神經(jīng)元個數(shù)和激活函數(shù)如表1所示,此模型迭代訓練7000次之后,作為訓練完成的深度自動編碼器. 本文用兩種方法訓練分類器,其一,如圖2(a)所示,用自動解剖標簽模板獲得fMRI樣本特征,訓練傳統(tǒng)分類器,測試分類正確率. 其二,如圖2(b)所示,用模板獲得的特征訓練自動編碼器,已訓練的自動編碼器提取精細特征之后,訓練傳統(tǒng)分類器. 表1 深度自動編碼器各層神經(jīng)元個數(shù)和激活函數(shù) 圖2 分類器訓練方法 根據(jù)自動解剖模板獲取的特征,作為原始特征,自動編碼器自動獲得的特征,作為精細特征,分別用這兩種特征,比較各種分類算法達到的正確率. 分別用線性支持向量機(線性-SVM)、k近鄰、徑向基核函數(shù)支持向量機(RBF-SVM)和決策樹進行分類. 分類算法各參數(shù)配置為scikit-learn軟件包中,各種算法的默認配置.首先,選10個偏頭痛原始特征和10個健康人原始特征,作為訓練數(shù)據(jù),訓練以上4種分類器和深度自動編碼器. 將剩下的7個偏頭痛數(shù)據(jù),加上另外隨機選取的7個健康對照組數(shù)據(jù),作為測試數(shù)據(jù),驗證各種分類器分類正確率. 發(fā)現(xiàn)7個偏頭痛數(shù)據(jù),不管是在原始特征作為分類器的輸入數(shù)據(jù)下,還是在精細特征作為分類器的輸入數(shù)據(jù)下,7個偏頭痛數(shù)據(jù)都能進行正確分類.而7個健康人數(shù)據(jù),在原始特征作為分類器的輸入數(shù)據(jù)下,出現(xiàn)個別錯誤. 由于偏頭痛數(shù)據(jù)采集困難,數(shù)據(jù)樣本不多,而僅有的7個測試數(shù)據(jù)都被各個分類器正確分類,無法在大樣本下,檢驗各個分類器將偏頭痛分進健康對照組的錯誤率. 健康對照組樣本數(shù)量相對較多,可以在健康對照組中,檢驗各個分類器將健康人分進偏頭痛的錯誤率. 將其余83個健康人數(shù)據(jù),作為測試數(shù)據(jù),檢驗各個分類器的分類性能. 實驗結(jié)果如表2、表3和圖3所示,具體討論在第4節(jié)中. 表2 原始特征訓練的分類器分類正確率和分類錯誤個數(shù) 表3 精細特征訓練的分類器分類正確率和分類錯誤個數(shù) 圖3 各種分類器,分類健康對照組的正確率 如表2所示,用83個健康人數(shù)據(jù),在原始特征下訓練的分類器,分類健康人的實驗結(jié)果. RBF-SVM在原始特征作為訓練數(shù)據(jù)下,分類效果最差,決策樹效果次之. 線性-SVM分類效果好于RBF-SVM,可能由于原始特征在原始維度空間中,數(shù)據(jù)分布已經(jīng)較好的達到線性可分程度. 用RBF-SVM將數(shù)據(jù)映射到更高維的空間中,尋找分類超平面,分類效果反而沒有線性-SVM分類效果好,說明在原始空間中的數(shù)據(jù)映射到高維空間中,支持向量機沒有找到很好的分類超平面分類數(shù)據(jù). 如表3所示,經(jīng)過深度學習提取特征之后,RBFSVM分類效果和線性-SVM分類效果都有所提高,并且高于其他分類器分類效果. RBF-SVM將精細特征映射到高維空間后,能找到更好的分類超平面分類數(shù)據(jù).說明,深度學習提取的特征分布,更適合映射到高維空間,尋找到更好的分類超平面. 如圖3所示,分別用精細特征和原始特征訓練各個分類器,得到的分類正確率. 從圖中可以看出,經(jīng)過深度學習提取的精細特征,在分類正確率上,明顯高于用原始特征訓練的各個分類器. 可以說明,深度學習提取的特征,可以提高一些分類器分類效果,在預測偏頭痛上,擁有更高預測效果. 自動解剖標簽模板提取的原始特征,訓練分類器,各個分類器的平均分類正確率,能達到88.86%. 說明,偏頭痛病人存在特殊的腦功能網(wǎng)絡(luò),這個腦功能網(wǎng)絡(luò)與正常人的腦功能網(wǎng)絡(luò),存在一定差異,使得用傳統(tǒng)分類器也能達到較高的分類正確率. 但是,因為擁有多層結(jié)構(gòu)來提取特征,深度學習擁有更完美的方式表達特征. 在我們構(gòu)建的自動編碼器中,輸入的大腦區(qū)域相關(guān)性,被表達為更高層次的描述. 各個分類器的平均分類正確率,達到93.07%就是最好的證明. 在深度學習中,輸入數(shù)據(jù)經(jīng)過已經(jīng)訓練好的自動編碼器,提取出擁有更好分類界限的特征,為傳統(tǒng)分類器提高分類效果. 在自動編碼器每個隱藏層中,每個神經(jīng)元的權(quán)重,能表達新的物理學和生理學意義. 通過分類挑選和校驗大量的權(quán)重,能找到某2個腦區(qū)的相關(guān)系數(shù),對于預測偏頭痛起到更重要的作用. 偏頭痛在臨床診斷中沒有影像學診斷標準,通過我們對偏頭痛患者靜息態(tài)功能磁共振的研究,提出一種深度學習的特征提取方法,在不需要較多先驗知識的前提下,提取出精細特征,提高各種分類器分類效果.經(jīng)過深度學習提取的特征,在各種分類器分類結(jié)果中,都能有效提高分類正確率. 進一步研究,可以獲得更多的偏頭痛數(shù)據(jù),用更多的樣本數(shù)據(jù)訓練分類器,從而提高分類器分類效果,為臨床診斷偏頭痛提供重要的影像參考. 1 Sloot PMA,Tirado-Ramos A,Altintas I,et al. From molecule to man:Decision support in individualized e-health.Computer,2006,39(11):40-46. [doi:10.1109/MC.2006.380] 2Ronga LS,Jayousi S,Del Re E,et al. TESHEALTH:An integrated satellite/terrestrial system for e-health services.Proceedings of 2012 IEEE International Conference on Communications (ICC). Ottawa,ON,Canada. 2012.3286-2890. 3 Liang J,Sahama T. Online multiple profile manager for eHealth information sharing. Proceedings of 2012 IEEE International Conference on Communications (ICC). Ottawa,ON,Canada. 2012. 3461-3465. 4 Kim JH,Suh SL,Seol HY,et al. Regional grey matter changes in patients with migraine:A voxel-based morphometry study. Cephalalgia An International Journal of Headache,2008,28(6):598-604. [doi:10.1111/j.1468-2982.2008.01550.x] 5 Cutrer FM,Black DF. Imaging findings of migraine.Headache:The Journal of Head and Face Pain,2006,46(7):1095-1107. [doi:10.1111/hed.2006.46.issue-7] 6 Schwedt TJ,Dodick DW. Advanced neuroimaging of migraine. The Lancet Neurology,2009,8(6):560-568. [doi:10.1016/S1474-4422(09)70107-3] 7 Shi YH,Zeng WM,Wang NZ,et al. A novel fMRI group data analysis method based on data-driven reference extracting from group subjects. Computer Methods and Programs in Biomedicine,2015,122(3):362-371. [doi:10.1016/j.cmpb.2015.09.002] 8 Shi YH,Zeng WM,Wang NZ. SCGICAR:Spatial concatenation based group ICA with reference for fMRI data analysis. Computer Methods and Programs in Biomedicine,2017,148:137-151. [doi:10.1016/j.cmpb.2017.07.001] 9 Shi YH,Zeng WM,Wang NZ,et al. A new method for independent component analysis with priori information based on multi-objective optimization. Journal of Neuroscience Methods,2017,283:72-82. [doi:10.1016/j.jneumeth.2017.03.018] 10 Ferri R,Rundo F,Bruni O,et al. Small-world network organization of functional connectivity of EEG slow-wave activity during sleep. Clinical Neurophysiology,2007,118(2):449-456. [doi:10.1016/j.clinph.2006.10.021] 11 Guo ZW,Liu XZ,Jia XZ,et al. Regional coherence changes in alzheimer’s disease patients with depressive symptoms:A resting-state functional MRI study. Journal of Alzheimer’s Disease,2015,48(3):603-611. [doi:10.3233/JAD-150460] 12 Wu T,Long XY,Zang YF,et al. Regional homogeneity changes in patients with Parkinson’s disease. Human Brain Mapping,2009,30(5):1502-1510. [doi:10.1002/hbm.v30:5] 13 Liu SQ,Liu SD,Cai WD,et al. Early diagnosis of Alzheimer’s disease with deep learning. Proceedings of the 11th International Symposium on Biomedical Imaging(ISBI). Beijing,China. 2014. 1015-1018. 14 Suk HI,Shen D. Deep learning-based feature representation for AD/MCI classification. In:Mori K,Sakuma I,Sato Y,et al. eds. Medical Image Computing and Computer-Assisted Intervention-MICCAI 2013. Berlin,Heidelberg:Springer,2013. 583-590. 15 SPM. http://www.fil.ion.ucl.ac.uk/spm. [2018-01-03]. 16 Tzourio-Mazoyer N,Landeau B,Papathanassiou D,et al.Automated anatomical labeling of activations in SPM using a macroscopic anatomical parcellation of the MNI MRI singlesubject brain. Neuroimage,2002,15(1):273-289. [doi:10.1006/nimg.2001.0978] 17 Bengio Y,Lecun Y. Scaling learning algorithms towards AI.In:Bottou L,Chapelle O,DeCoste D,et al. eds. Large-Scale Kernel Machines. Cambridge,MA. MIT Press,2007.321-359.2 深度學習模型
2.1 自動編碼器
2.2 構(gòu)造深度自動編碼器
3 實驗步驟與結(jié)果
3.1 實驗過程與步驟
3.2 實驗結(jié)果
4 討論
5 結(jié)論與展望