張元元,杜科均,屈直闖,樹海峰,余思遜
1.西南交通大學 醫(yī)學院,四川 成都 610031;2.西部戰(zhàn)區(qū)總醫(yī)院 神經外科,四川 成都 610083
神經退行性疾病的顯著特征是大量神經元丟失且不可逆轉,如帕金森病、癲癇、阿爾茨海默病等。隨著全球人口老齡化問題的加重,這類疾病越來越普遍,為全球醫(yī)療、公共衛(wèi)生和社會帶來諸多問題[1]。
神經退行性疾病的傳統(tǒng)診斷方式是由醫(yī)生對病灶的影像表現(xiàn)綜合分析后得出結論,其流程復雜、耗時、主觀性強,且發(fā)生機制的復雜性和患者群體的異質性為診斷和治療帶來嚴峻挑戰(zhàn)[2]。近年來,神經影像技術的發(fā)展和人工智能技術的日趨成熟,各種計算機輔助診斷模型大量應用到神經影像數(shù)據(jù)的定量分析中,加上磁共振成像(Magnetic Resonance Images,MRI)的無創(chuàng)性、低成本、空間分辨率高等特點,可以準確識別大腦組織結構和功能代謝異常等信息的改變[3]。因此,基于影像組學的機器學習和深度學習在神經退行性疾病的篩查、診斷、預后評估中扮演越來越重要的角色,其能量化、精細、客觀地分析大腦內部組織結構的異常,在解決傳統(tǒng)MRI掃描過程中所面臨的不易觀察病灶及檢測病灶特征性變化等諸多方面展現(xiàn)出了明顯的優(yōu)勢[4-5]。本文主要基于MRI影像組學的機器學習在輔助檢測神經退行性疾病中的研究進展進行綜述,并展望進一步改善機器學習的其他可能性相關方法,以便為后續(xù)神經退行性疾病的相關治療研究提供依據(jù)。
“組學”一詞最早從分子生物學領域興起,包括基因組學、蛋白組學、免疫組學、超聲組學、影像組學等。其中,影像組學是一種大數(shù)據(jù)分析方法,即把傳統(tǒng)醫(yī)學影像中的一些肉眼無法識別的圖像特征轉換為高維的可識別的特征空間,然后利用機器學習和深度學習的方法進行統(tǒng)計學分析,最終建立具有診斷價值、預測價值的模型,輔助醫(yī)生決策[6]。2012年由Lambin等[7]首次提出影像組學概念,在腫瘤領域率先發(fā)展,2020年全年影像組學相關的論文多達千余篇,可見影像組學在整個醫(yī)療領域的迅猛發(fā)展趨勢。
傳統(tǒng)影像組學主要強調通過從不同模態(tài)影像中高通量地提取特征并進行數(shù)據(jù)挖掘,如基因與分子標記、病理分型、臨床決策和療效監(jiān)測等,增加機器學習的主要目的是建立模型,以使準確率提高且得到的結果也相對更加直觀?;谟跋窠M學的機器學習的優(yōu)勢在于可根據(jù)患者病史、分子特征和成像信息,識別更具體的生物標志物進行診斷,同時還可減少執(zhí)行臨床試驗所涉及的時間和成本[2]。具體步驟如圖1所示:① 采集圖像:識別和整理大量具有相似臨床參數(shù)的圖像數(shù)據(jù)示例;② 圖像分割:手動或自動在圖像中分割出感興趣區(qū)域(Region of Interest,ROI);③ 特征提?。禾崛∫浑A特征、二階特征和高階特征[8-9];④ 數(shù)據(jù)庫的預處理:選擇具有代表性的特征數(shù)據(jù)后,進行機器學習建立模型;⑤ 訓練分類器:通過訓練分類器分析和預測這些高維信息,從而達到較高準確率。機器學習分兩類,即監(jiān)督機器學習和無監(jiān)督機器學習,區(qū)分方法為是否含有預測標簽。無監(jiān)督機器學習常用方法有分層聚類;監(jiān)督機器學習常用方法有線性回歸、神經網(wǎng)絡、深度學習、隨機森林、支持向量機等。
圖1 基于影像組學的機器學習的具體步驟
以鑒別腫瘤類型和良惡性為例,Yin等[10]對脊索瘤、骨巨細胞瘤和骨轉移瘤進行特征分析,通過回歸算法篩選特征構建分類模型,聯(lián)合T2加權序列和增強T1加權序列構建三分類模型,準確率為0.711。在神經成像中具有代表性的是基于支持向量機分類帕金森病患者的特征子集和預測疾病進展來創(chuàng)建放射組學特征,曲線下的面積達到0.836[11]。由此可見,影像組學的數(shù)據(jù)分析離不開機器學習的發(fā)展,更需要“醫(yī)”“工”二者同時深入融合和發(fā)展,發(fā)揮結合優(yōu)勢以取得成功。
下文針對癲癇和帕金森病兩種代表性疾病,總結了機器學習在診斷與鑒別、預測和量化等方面的應用。
局灶性皮質發(fā)育不良(Focal Cortical Dysplasia,F(xiàn)CD)是一種不易觀察特征的皮質發(fā)育畸形,其由大量神經元、膠質細胞的異常增生和遷移導致。2011年國際抗癲癇聯(lián)盟將FCD分為FCDⅠ、FCDⅡ、FCD Ⅲ三種類型,主要臨床表現(xiàn)為藥物難治性癲癇,手術切除是治療的主要方法[12]。但FCD的常見特征不會全部在MRI中表現(xiàn)出來,如皮質厚度異常、腦溝形態(tài)異常,以及灰、白質交界處模糊等,因此不易觀察病灶的具體位置和表現(xiàn)。為解決這一難題,可引入機器學習對成年患者進行FCD檢測,通過兩步貝葉斯分類器從MRI中提取出不同特征進行分類訓練[13]。但兒童的大腦尚未完全發(fā)育,存在與成人大腦結構不完全一致的情況。根據(jù)獨立性假設的條件——變量對類標簽的貢獻是獨立的,因此引入一種成本低、準確性高的改進版本。該系統(tǒng)結合形態(tài)測量特征和MRI序列上的灰度共生矩陣進行紋理分析(表1):應用3個MRI序列組合能提高算法性能,在正確區(qū)分出所有健康受試者的同時,其對MRI陽性病例的主觀敏感度達到97%,MRI陰性病例達到70%[4]。除了手動進行病變檢測外,Jin等[14]的研究利用基于表面的MRI形態(tài)測量和機器學習在Ⅱ型FCD患者的混合隊列中進行自動病變檢測,用組織學證實的海馬硬化癥來評估方法的特異性,計算相應特征并將其融入非線性神經網(wǎng)絡分類器中,對分類器進行訓練以識別病變聚類。這種方法的優(yōu)勢在于通過對接收機工作特性的分析,優(yōu)化了分類器輸出概率圖的閾值,最終靈敏度為73.7%。上述研究說明機器學習輔助基于表面的MRI形態(tài)測量具有優(yōu)越性能,是在耐藥癲癇患者術前評估中提高FCD檢測效率的一種有價值的工具。
表1 機器學習在神經退行性疾病診斷中的應用
近年來,癲癇患者患精神共病的風險增加[19],有研究對所研究癲癇患者進行神經精神訪談時,用N-grams和語言查詢及字數(shù)詞類構建機器學習分類模型并以此檢測患者自殺傾向,使用接收機工作特性曲線下的區(qū)域來測量性能,最終結果達到57%~78%。該結果提示當傳統(tǒng)方法不適用時,可以考慮口語的機器學習分析[15]。
帕金森?。≒arkinson’s Disease,PD)的發(fā)生機制主要是多巴胺能神經元進行性喪失,研究表明約60%多巴胺能神經元顯著減少時,患者才會出現(xiàn)運動遲緩和姿勢不穩(wěn)等臨床特征[20-21]。因此對PD的早期篩查干預和神經保護尤為重要。有研究處理11個不同的訓練和測試數(shù)據(jù)并將從中獲得的數(shù)據(jù)與統(tǒng)計數(shù)據(jù)進行比較,發(fā)現(xiàn)使用隨機森林分類器的測試結果準確率可達到85.81%,說明隨機森林算法是PD的良好分類器[22]。
早期預測研究根據(jù)霍恩-亞赫爾量表的測量結果,納入基于全腦白質和臨床特征的影像組學模型,根據(jù)患者序列號將整個數(shù)據(jù)分為訓練集和測試集,再結合影像組學特征和臨床進展評分構建聯(lián)合模型。該模型對1期PD的預測準確率為82.7%,對2期PD的預測準確性為85.4%[16]。近年來,隨著智能手機的快速發(fā)展,許多PD患者的運動癥狀非常適合用智能手機進行客觀測量[23],該方法規(guī)避了傳統(tǒng)式主觀并依賴評分者測量的缺點;后續(xù)研究建立了PD嚴重程度的客觀測量方法,評估了參與者在智能手機應用程序中完成5項任務(語音、手指敲擊、步態(tài)、平衡和反應時間)的數(shù)據(jù),得到步態(tài)特征貢獻最大(33.4%)的結論。該研究利用新的機器學習方法,創(chuàng)建并驗證了采用智能手機客觀評估PD嚴重程度的方法及其有效性,這些評估有助于改善臨床護理和新療法的開發(fā)[17]。
除了早期預測和程度量化外,還可以采用多學科方法,利用來自不同機構的臨床、人口統(tǒng)計學和神經影像學數(shù)據(jù)調查PD患者的跌倒情況,然后用機器學習的方法構建預測模型,預測的可靠性通過5折交叉驗證和外部驗證進行評估,最終準確率達70%~80%[18]。
深度學習是一種模仿大腦神經元傳遞過程來分析數(shù)據(jù)(即人工神經網(wǎng)絡研究)的特殊機器學習方法,在醫(yī)學成像如口腔腫瘤組織病理預后的提高和心血管醫(yī)學的電生理指標中,應用卷積神經網(wǎng)絡、深度信任網(wǎng)絡等模型訓練每層神經元,最后使用算法進行調優(yōu)[24-25]。其最大特點是可以自主從圖像中提取復雜的層次特征,進而對大量數(shù)據(jù)進行訓練得到滿意的結果,這種訓練分類器的優(yōu)勢在于避免了經典機器學習算法的局限性,性能也大大提升[26]。
通過評估6種機器學習算法和深度學習算法在同一樣本中使用相同功能性磁共振成像的特征,預測神經性疾病的臨床改善狀態(tài),得出使用深度學習方法比淺層機器學習方法更能預測癥狀的改善,并且深度學習的準確率高達70%[27]。將深度學習和標準機器學習用于腦成像數(shù)據(jù)分析,結合結構MRI圖像進行大規(guī)模的系統(tǒng)比較,結果表明按照傳統(tǒng)的深度學習實踐進行訓練時,深度學習具有更好的伸縮性和顯著的改進,在相對計算時間上也呈現(xiàn)出更低的漸近復雜性,進一步說明深度學習可以利用這些數(shù)據(jù)來生成卓越的任務區(qū)分以表征人腦[28]。此外,在量化組織萎縮的研究中,需要對腦組織進行分割和相應的測量[29],其中顱骨剝離是關鍵預處理步驟,對基于機器學習和深度學習的顱骨剝離技術進行對比發(fā)現(xiàn),深度學習的顱骨剝離算法比傳統(tǒng)的顱骨剝離算法準確率顯著提高[30]。
阿爾茨海默病嚴重影響老年人的生活質量,也是最常見的神經退行性疾病。如表2所示,Liang等[5]研究提出了一種基于弱監(jiān)督機器學習的深度學習框架,該框架由一個具有注意力機制的骨干網(wǎng)絡和一個可同時進行圖像分類與圖像重建任務的網(wǎng)絡組成,利用有限的注釋對阿爾茨海默病進行識別和分類。在兩個腦MRI數(shù)據(jù)集(2D MRI和3D MRI數(shù)據(jù))上使用僅20%的標簽進行微調,最終準確率達到99.69%。早期預測癲癇發(fā)作可以更好地改善患者的生存質量和治療效果。有研究提出了4種深度學習模型來提取最具區(qū)分性的特征,利用卷積神經網(wǎng)絡從不同的頭皮位置提取顯著的空間特征,并利用遞歸神經網(wǎng)絡比現(xiàn)有方法更早地預測癲癇發(fā)作的發(fā)生率,提高了分類精度并縮減了預測時間,最終準確率達到99.60%[27]。
表2 深度學習在神經退行性疾病診斷中的應用
綜上所述,傳統(tǒng)診斷模式在很大程度上依賴神經外科醫(yī)師的主觀判斷,而機器學習從輸入的數(shù)據(jù)中學習特定的規(guī)則和見解,用計算機模擬和實現(xiàn)人類學習行為,利用經驗改善系統(tǒng)自身性能后,對未知數(shù)據(jù)進行篩查和鑒別,并利用以深度學習為代表的卷積神經網(wǎng)絡自適應、自學習的強大信息處理能力,決定了其在圖像識別和輔助診斷中能夠得到較高準確率。
雖然使用計算機輔助診斷技術大大改善了傳統(tǒng)神經外科醫(yī)生的診斷模式,但目前研究還有一些局限性:① 在常規(guī)采集的圖像中,不同成像設備、成像參數(shù)、運動偽影等會使特征結果的可重復性降低,未來的研究應著重如何指定標準化指南來規(guī)范操作;② 手動劃分ROI難以實現(xiàn)自動化大數(shù)據(jù)集分析;③ 可供研究的病例數(shù)目較少,深度學習的訓練數(shù)據(jù)集也相對較小,算法結構基于監(jiān)督學習,需要人工大規(guī)模數(shù)據(jù)處理信息標簽,分類器的使用也相對單一,未來研究可擴大樣本量、嘗試使用多種分類器并提高結果可信度;④ 兒童屬于特殊群體,配合度差,采集高質量的影像數(shù)據(jù)難度較大,給影像組學的進一步開展帶來了困難?,F(xiàn)在專門針對兒童的神經退行性疾病的影像組學相關文章較少。相信隨著人工智能和機器學習方法的不斷進步,其在神經退行性疾病研究領域可以發(fā)揮更大的作用。