馬夢航,魏 煒, ,劉振宇,田 捷,
1. 西安工程大學(xué)電子信息學(xué)院,陜西 西安 710048;
2. 中國科學(xué)院自動化研究所,中國科學(xué)院分子影像重點實驗室,北京 100190;
3. 北京航空航天大學(xué),北京市大數(shù)據(jù)精準(zhǔn)醫(yī)療高精尖創(chuàng)新中心,北京 100191
英國倫敦大學(xué)癌癥研究中心在2012年的The New England Journal of Medicine上發(fā)表相關(guān)研究[1]指出,目前癌癥的5年生存率一直沒有得到提高的一個重要原因是我們?nèi)狈δ[瘤異質(zhì)性進(jìn)行全面評估的方法,急需尋找新技術(shù)定量評估異質(zhì)性。為了評價腫瘤基因異質(zhì)性,圖像定量化分析技術(shù)在臨床中逐漸得到應(yīng)用和發(fā)展,依靠人工智能技術(shù)從影像中挖掘出深層特征,結(jié)合臨床大數(shù)據(jù)分析腫瘤信息[2-3],使微觀的基因或蛋白質(zhì)模式改變在宏觀影像中有所呈現(xiàn),可以反映人體組織、細(xì)胞和基因水平的變化[4]。這一方法可定量分析腫瘤異質(zhì)性,對癌癥早期診斷和預(yù)后預(yù)測具有臨床輔助作用,可以促進(jìn)患者的后續(xù)臨床管理[2]。人工智能提供了影像生物標(biāo)志的構(gòu)建方法,有助于組織分割、細(xì)胞結(jié)構(gòu)檢測、腫瘤檢測、診斷、預(yù)后評估、治療反應(yīng)預(yù)測以及疾病狀態(tài)監(jiān)測等[3]。人工智能已經(jīng)在腫瘤術(shù)前、術(shù)中、術(shù)后的各個診療環(huán)節(jié)對臨床決策產(chǎn)生積極的影響,包括腫瘤的分子分型[5]、淋巴結(jié)轉(zhuǎn)移[6]、遠(yuǎn)處轉(zhuǎn)移[7]、療效評估[8]、預(yù)后預(yù)測[9]、免疫治療評估[10]等,為患者的個體化治療提供強(qiáng)大而有效的工具。
結(jié)直腸癌是世界上四大致命癌癥之一,2020年全球新發(fā)患者數(shù)超過190萬,死亡患者數(shù)為94萬人,發(fā)病率排名第三,死亡率排名第二[11]。隨著發(fā)展中國家結(jié)直腸癌患者數(shù)不斷上升,預(yù)計2035年全球結(jié)直腸癌的新發(fā)患者將增加到250萬[12-13]。在中國,結(jié)直腸癌新發(fā)患者為55萬人,死亡患者28萬[14]。在美國癌癥死亡中,結(jié)直腸癌雖排第二,但總體的發(fā)病率和死亡率卻呈下降趨勢[12-15],這意味著,在中國開展結(jié)直腸癌診前、診中以及診后的研究至關(guān)重要。目前中國放射科普遍存在一些問題,例如,人工閱片模式無法應(yīng)對醫(yī)學(xué)影像數(shù)據(jù)的增長,不同醫(yī)師之間的經(jīng)驗差異導(dǎo)致漏診、誤診率高。人工智能技術(shù)的發(fā)展為解決這些問題提供了新的機(jī)遇和方法。本文現(xiàn)對人工智能在結(jié)直腸癌醫(yī)學(xué)影像中的臨床應(yīng)用作一述評。
目前,基于人工智能的影像分析方法主要為影像組學(xué),可分為人工定義特征和深度學(xué)習(xí)兩種。前者基于人工定義的公式挖掘特征值表征腫瘤,后者則通過深度神經(jīng)網(wǎng)絡(luò)來理解病灶。
2012年,影像組學(xué)這一概念正式提出后,便迅速應(yīng)用于腫瘤學(xué)的各種成像模式,例如磁共振成像(magnetic resonance imaging,MRI)、計算機(jī)體層成像(computed tomography,CT)、正電子發(fā)射體層成像(positron emission tomography,PET)和超聲(ultrasound,US)等。在2014年,Aerts等[16]的實驗流程對影像組學(xué)研究的標(biāo)準(zhǔn)化奠定了基礎(chǔ),其流程包括數(shù)據(jù)收集、勾畫感興趣區(qū)(region of interest,ROI)、特征工程、建模分析。
在人工定義特征的影像組學(xué)方法中,特征工程共3個階段,分別是特征提取、特征分析和特征選擇。提取ROI與腫瘤類型及微環(huán)境相關(guān)的影像學(xué)信息,將這些信息轉(zhuǎn)化為具有高分辨率的空間信息并進(jìn)行分析,排除對算法沒有任何幫助的無關(guān)特征和表達(dá)意義相同的冗余特征,選出與期望預(yù)測任務(wù)相關(guān)性大的特征構(gòu)建機(jī)器學(xué)習(xí)算法,完成臨床預(yù)測及決策。特征決定了模型泛化能力的上限,特征分析和特征選擇是影像組學(xué)分析中極其重要的一步,常用的算法有相關(guān)系數(shù)法、最小絕對收縮與選擇算子(least absolute shrinkage and selection operator,LASSO)回歸、主成分分析(principal component analysis,PCA)等。
深度學(xué)習(xí)是利用深度神經(jīng)網(wǎng)絡(luò)更深層次表達(dá)特征,是深度神經(jīng)網(wǎng)絡(luò)的總稱[17]。與提取人工定義特征的影像組學(xué)不同,深度學(xué)習(xí)是自動從醫(yī)學(xué)影像中獲得高通量信息。通過調(diào)節(jié)網(wǎng)絡(luò)的結(jié)構(gòu)使提取的特征更具有針對性,避免了特征計算所造成的額外誤差,從而使提取的影像學(xué)信息更具有全局表達(dá)性。
卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)[17]自深度學(xué)習(xí)這個概念正式提出后就成為了醫(yī)學(xué)影像中常用的模型算法之一。CNN受生物學(xué)視覺組織的啟發(fā)而來,根據(jù)分析任務(wù)確定不同的網(wǎng)絡(luò)層,層被連接在不同的塊中,而不是直接連接,這些塊之間的信息傳遞類似于視覺皮質(zhì),合理地利用了像素之間的位置信息,實現(xiàn)了參數(shù)共享權(quán)重。近幾年圖像識別領(lǐng)域的重要突破均由CNN取得,比如Google-Net[18]、Res-Net[19]、Dense-Net[20]。
基于上述兩種分析方法的眾多研究成果,本文從結(jié)直腸癌的分期、分子分型預(yù)測、新輔助治療效果評估、預(yù)后預(yù)測等方面展開討論。
TNM分期系統(tǒng)可以描述癌癥的發(fā)展程度,從而幫助醫(yī)師作出準(zhǔn)確的診斷,并為患者制訂有針對性的治療方案[21]。
目前,對于T分期的研究仍然是個挑戰(zhàn),根據(jù)一項meta分析顯示,直腸MRI評估T分期的差異較大[22],但人工智能技術(shù)的發(fā)展給醫(yī)學(xué)影像分析帶來了新的方法。在一項回顧性研究中,Sun等[23]入組了97例直腸癌患者,并從每例患者的T2加權(quán)成像(T2-weighted imaging,T2WI)中提取了256個影像組學(xué)特征,通過聚類算法和LASSO回歸預(yù)測患者T分期;最終預(yù)測模型AUC為0.852,靈敏度和特異度分別為0.79和0.82;這項研究使用了監(jiān)督學(xué)習(xí)和非監(jiān)督學(xué)習(xí),結(jié)果表明從MRI中提取的影像組學(xué)特征識別T分期是有價值的。
N分期表示結(jié)直腸附近淋巴結(jié)的轉(zhuǎn)移數(shù)量,準(zhǔn)確識別淋巴結(jié)狀態(tài)對結(jié)直腸癌患者治療和預(yù)后至關(guān)重要[24]。由于不同患者之間淋巴結(jié)的位置和大小存在個體差異,人工識別掃描區(qū)域中的淋巴結(jié)效率低下。因此,Zhao等[25]開發(fā)和驗證了多參數(shù)MRI深度學(xué)習(xí)模型,旨在全自動檢測和分割淋巴結(jié)。他們的訓(xùn)練集入組了293例直腸癌患者共5 789個淋巴結(jié),內(nèi)部驗證集31例患者包含935個淋巴結(jié),外部驗證集50例患者包含1 198個淋巴結(jié),每例患者都接受過T2WI和彌散加權(quán)成像(diffusion-weighted imaging,DWI)掃描,該算法最終在驗證集上取得了較好的性能。
在之前的研究[26]中,筆者實驗室聯(lián)合廣東省人民醫(yī)院劉再毅教授團(tuán)隊,利用影像組學(xué)方法預(yù)測術(shù)前淋巴結(jié)轉(zhuǎn)移;該項研究訓(xùn)練集和測試集分別包含326例和200例結(jié)直腸癌患者,使用LASSO回歸選中了24個與淋巴結(jié)狀態(tài)相關(guān)的影像組學(xué)特征,最終使用影像組學(xué)和臨床融合特征建立了多元logistic回歸模型,該模型在驗證集的一致性指數(shù)(concordance index,C-index)為0.778。Liu等[27]收集了68例直腸癌患者預(yù)測T分期和N分期,從表觀彌散系數(shù)(apparent diffusion coefficient,ADC)圖中提取特征,最終也取得了令人滿意的結(jié)果。
上述研究可以說明人工智能技術(shù)與醫(yī)學(xué)影像結(jié)合在預(yù)測結(jié)直腸癌分期方面具有很大的潛力。從淋巴結(jié)的分割到淋巴結(jié)轉(zhuǎn)移預(yù)測,再到分期預(yù)測均有令人滿意的效果,這在一定程度上可減輕放射科醫(yī)師的壓力。
結(jié)直腸癌是一種異質(zhì)性疾病,不同癌變通路的結(jié)直腸癌具有不同的基因表達(dá),分子分型可加深對其異質(zhì)性的理解。因此,準(zhǔn)確預(yù)測分子分型有助于為結(jié)直腸癌患者制訂更精確的治療策略。Gao等[28]分析了14個獨立的結(jié)直腸癌數(shù)據(jù)集,共3 578個樣本,構(gòu)建深度學(xué)習(xí)模型預(yù)測結(jié)直腸癌共識分子亞型;該深度學(xué)習(xí)模型輸入的為高通量基因表達(dá)數(shù)據(jù),利用前饋人工神經(jīng)網(wǎng)絡(luò)進(jìn)行特征學(xué)習(xí),構(gòu)建分類器進(jìn)行癌癥分類;該研究證實深度學(xué)習(xí)特征可代表不同癌癥亞型的特征性生物學(xué)過程,可剖析分子異質(zhì)性;該項研究是一個標(biāo)準(zhǔn)的多中心研究,可以規(guī)避不同中心的機(jī)器參數(shù)、掃描習(xí)慣等因素對模型泛化能力的影響。
在為患者提供治療決策時,KRAS、NRAS、BRAF突變可能會導(dǎo)致西妥昔單抗和帕尼單抗療效不理想[29-31],因此,確定這些突變狀態(tài)有利于患者的個性化診療。針對此問題,Yang等[32]采用影像組學(xué)方法收集了117張術(shù)前CT影像,61張作為訓(xùn)練集,其余作為驗證集。每張CT影像提取346個影像組學(xué)特征,采用ReliefF和支持向量機(jī)篩選關(guān)鍵特征,結(jié)果表明影像組學(xué)特征與KRAS、NRAS、BRAF突變顯著相關(guān),最終在驗證集上AUC、靈敏度和特異度分別為0.829、0.686和0.857。
除了使用CT影像外,Cui等[33]利用影像組學(xué)方法和MRI影像數(shù)據(jù)預(yù)測直腸癌患者KRAS突變狀態(tài)。該項研究在一個中心建模,在另一個中心檢測模型,從第一個中心連續(xù)性收集了304張T2WI影像,213張影像作為訓(xùn)練集,91張作為內(nèi)部驗證集,接著又從第二個中心收集了86張影像作為外部驗證集。從每張影像提取了960個影像組學(xué)特征,經(jīng)統(tǒng)計學(xué)分析后保留7個影像組學(xué)特征建立支持向量機(jī)模型,在此模型上訓(xùn)練集AUC為0.722,內(nèi)部測試集AUC為0.682,外部測試集AUC為0.714。
在影像組學(xué)這一概念提出后,大多數(shù)研究采用單中心樣本,而單中心模型由于不同中心機(jī)器參數(shù)、掃描習(xí)慣、診斷規(guī)則的不同,在推廣時具有局限性,因數(shù)據(jù)的保密性和差異性限制了研究的可重復(fù)性以及模型的泛化能力。多中心建??梢詸z測模型的魯棒性和準(zhǔn)確性,便于模型的推廣,開展多中心研究是加快人工智能應(yīng)用于臨床的關(guān)鍵。
(二)為英語的學(xué)習(xí)奠定堅實的基礎(chǔ)。與小學(xué)比起來,初中的英語所涉及的內(nèi)容較多,所以其學(xué)習(xí)難度也較大。從很多學(xué)生的表現(xiàn)中就能夠看出,有的學(xué)生在小學(xué)階段其英語學(xué)習(xí)較好,但是到了初中以后就發(fā)現(xiàn)自己跟不上班級的隊伍,英語的學(xué)習(xí)成績欠佳。這是因為小學(xué)英語中所涉及的教學(xué)內(nèi)容較少,并且十分有限,但是初中卻不一樣,初中英語知識內(nèi)容多而雜,學(xué)生無法快速適應(yīng)這種轉(zhuǎn)變,那么隨之而來的就是成績的下降。想要解決這一問題最好的方法就是將英語學(xué)習(xí)的基礎(chǔ)做好,不斷積累英語學(xué)習(xí)過程中的詞匯。只有英語詞匯能夠達(dá)到一定的量以后才能在實踐應(yīng)用的過程中做到信手拈來。
NCCN指南建議先通過新輔助治療來控制局部進(jìn)展期結(jié)直腸癌,再進(jìn)行手術(shù)治療[34-35]。采用新輔助治療后,約20%的患者出現(xiàn)病理學(xué)完全緩解(pathologic complete response,pCR)[36-37],先前的一些研究[38-39]證明,這類患者不接受手術(shù)而采用“等待觀察”的治療策略是一種有效的選擇。然而,接受新輔助治療后的患者術(shù)前是否達(dá)到pCR只有通過手術(shù)切除標(biāo)本的組織病理學(xué)檢查來確認(rèn)[40],治療反應(yīng)的評價主要基于術(shù)后病理學(xué)檢查結(jié)果,基于術(shù)前影像學(xué)檢查預(yù)測治療反應(yīng)尚不能滿足個體化治療的需要。
為了使新輔助治療后達(dá)到pCR的患者減少額外的手術(shù)痛苦和醫(yī)療資源的浪費,斯坦福大學(xué)李瑞江教授團(tuán)隊和中山大學(xué)附屬第六醫(yī)院吳小劍教授團(tuán)隊在知名期刊Nature Communications上發(fā)表研究論文[41],試圖利用深度學(xué)習(xí)方法預(yù)測新輔助治療后的pCR;該項研究共收集了622例患者,所有患者均進(jìn)行了基于治療前和治療后的MRI掃描,掃描序列包括T1加權(quán)成像(T1-weighted imaging,T1WI)、T1增強(qiáng)掃描、T2WI和DWI;其中訓(xùn)練集入組了321例直腸癌患者,在同一家醫(yī)院前瞻性收集了160例患者作為內(nèi)部驗證集,并從第二個中心收集了141例患者作為外部驗證集,他們設(shè)計了兩個多層連接的孿生(Siamese)子網(wǎng)絡(luò),治療前和治療后圖像在網(wǎng)絡(luò)層中深度卷積,用于多尺度特征集成和pCR預(yù)測;最終模型內(nèi)部驗證集和外部驗證集AUC分別達(dá)到了0.95(95% CI 0.91~0.98)和0.92(95% CI 0.87~0.96)。這項研究雖然集中在多參數(shù)MRI的分析上,但為多模態(tài)影像預(yù)測pCR和許多其他臨床應(yīng)用提供了新穎的思路。同樣,Zhang等[42]基于彌散峰度成像(diffusion kurtosis imaging,DKI)技術(shù)的DWI序列和T2WI序列影像開發(fā)和驗證了深度學(xué)習(xí)模型,他們?nèi)虢M了383例患者建立CNN,訓(xùn)練集和測試集分別為290例和93例。最終模型測試集的AUC為0.99(95% CI 0.94~1.00),準(zhǔn)確度為0.978(95% CI 0.954~1.000)。
除了使用深度學(xué)習(xí)技術(shù)外,利用影像組學(xué)技術(shù)預(yù)測局部進(jìn)展期直腸癌患者pCR也已有多項研究。Liu等[40]入組了222例接受新輔助放化療的局部進(jìn)展期直腸癌患者,訓(xùn)練集和測試集分別含152例和70例患者,入組患者均包含T2WI和DWI多參數(shù)MRI影像。每例患者的多參數(shù)MRI影像均提取了2 252個影像組學(xué)特征,特征工程采用雙樣本t檢驗和LASSO回歸,多元logistic回歸模型包含30個影像組學(xué)特征和1個臨床病理學(xué)特征;在驗證集上,模型的AUC高達(dá)0.975 6。Zhou等[43]回顧性地招募了425例術(shù)前接受新輔助治療的局部進(jìn)展期直腸癌患者,訓(xùn)練集和驗證集劃分比例為3∶1;所有患者在接受新輔助治療前均接受T1WI、T2WI、對比度增強(qiáng)T1加權(quán)成像(contrast-enhanced T1-weighted,CE-T1WI)和DWI掃描,從每例患者新輔助治療前影像中提取了2 424個影像組學(xué)特征,特征選擇采用威爾科克森秩和檢驗(Wilcoxon rank-sum test)、皮爾遜相關(guān)系數(shù)和LASSO回歸;最終選取16個特征建立多元logistic回歸,基于多參數(shù)MRI聯(lián)合模型的AUC為0.822(95% CI 0.752~0.891)。
MRI多序列融合建模是目前研究的熱點。在大數(shù)據(jù)的驅(qū)動下,多序列融合也逐漸走向多模態(tài)融合發(fā)展方向。多模態(tài)圖像有助于從不同視圖中提取特征并帶來互補(bǔ)信息。但是,多模態(tài)融合技術(shù)構(gòu)建端對端的模型仍處于理論方法研究階段,距離實際臨床應(yīng)用尚待時日。
隨著研究的不斷深入,結(jié)直腸癌患者的生存率由于新的治療技術(shù)和方法已見提升,但局部進(jìn)展期結(jié)直腸癌患者的無病生存期(disease-free survival,DFS)并未得到延長[44-46]。另外,關(guān)于Ⅲ期結(jié)腸癌患者的最佳化療時間仍存在爭議[47-48],同時尚不清楚一些高危Ⅱ期結(jié)腸癌患者是否應(yīng)該接受化療,因此有效的疾病分期和風(fēng)險分層是非常重要的[49]。
Meng等[51]對108例患者的術(shù)前MRI影像手工分割ROI后提取485個影像組學(xué)特征預(yù)測局部進(jìn)展期直腸癌患者的無病生存期,他們先排除了組內(nèi)相關(guān)系數(shù)(intraclass correlation coefficient,ICC)小于0.8的268個特征,接著將LASSO選中的影像組學(xué)特征和臨床特征相結(jié)合構(gòu)建Cox比例風(fēng)險回歸模型,最后模型預(yù)測患者無病生存能力的C-index為0.788(95% CI 0.72~0.86)。
準(zhǔn)確預(yù)測直腸癌患者是否遠(yuǎn)處轉(zhuǎn)移有助于治療方案的選擇和危險分層,Liu等[52]回顧性收集來自3家醫(yī)院共235例接受新輔助放化療的局部進(jìn)展期直腸癌患者,兩家醫(yī)院共170例患者作為訓(xùn)練集,另一家醫(yī)院的65例患者作為驗證集,所有患者均接受T2WI和DWI掃描,ADC由b0序列和b1000序列產(chǎn)生;通過遷移ResNet-18構(gòu)建了一種基于多參數(shù)MRI的深度學(xué)習(xí)模型,之后又將這些特征結(jié)合深部MRI信息和臨床病理因素建立諾謨圖;在驗證集上,深度學(xué)習(xí)模型預(yù)測遠(yuǎn)處轉(zhuǎn)移C-index為0.747(95% CI 0.665~0.830),諾謨圖則為0.775(95% CI 0.695~0.856)。
在對癌癥的分期、分子分型預(yù)測和新輔助治療效果評估的研究中都有一個共性問題,均是利用人工智能技術(shù)預(yù)測已有的臨床因素。而上述的研究證明人工智能技術(shù)能夠更好地幫助醫(yī)師預(yù)測患者的預(yù)后信息,為患者提供更加精準(zhǔn)的醫(yī)療服務(wù)。
綜上所述,人工智能技術(shù)正越來越多地應(yīng)用于醫(yī)療領(lǐng)域,在醫(yī)學(xué)上已產(chǎn)生眾多具有臨床意義的成果,形成了一套較為完整的理論體系和技術(shù)架構(gòu)。從影像中挖掘高位信息全面表征腫瘤的異質(zhì)性,到根據(jù)臨床問題選擇特征以及算法,這套體系已逐漸成熟。本文以發(fā)病率和死亡率較高的結(jié)直腸癌為例,分析了人工智能技術(shù)與醫(yī)學(xué)影像結(jié)合的重要性,列舉了人工智能在結(jié)直腸癌分期、分子分型、療效評估和患者預(yù)后預(yù)測方面的研究成果,表明人工智能是一種有效的輔助臨床決策工具。
目前人工智能在結(jié)直腸癌中的研究仍有局限性,首先是數(shù)據(jù)樣本量有限,特別是對于深度學(xué)習(xí)方法來說,需要更多的數(shù)據(jù)訓(xùn)練和驗證模型,更多的患者數(shù)量和臨床因素結(jié)合有望發(fā)現(xiàn)更多有價值的信息。其次,數(shù)據(jù)樣本不平衡會導(dǎo)致模型在實際預(yù)測中會對類別有側(cè)重,導(dǎo)致樣本多的類別訓(xùn)練結(jié)果好,樣本少的類別結(jié)果差。目前前瞻性的研究較少,而前瞻性研究可以驗證模型的魯棒性。最后,目前的研究缺乏公開代碼或者公開模型,在一定基礎(chǔ)上限制了模型在其他中心數(shù)據(jù)的可重復(fù)性及其性能表現(xiàn)。
人工智能引入腫瘤學(xué)仍然是一個新提出并迅速發(fā)展的領(lǐng)域。它整合了放射學(xué)、腫瘤學(xué)和機(jī)器學(xué)習(xí)[46]。但大多數(shù)的研究基于私人數(shù)據(jù)集,并且沒有使用共同的實驗設(shè)置和評價標(biāo)準(zhǔn)。為了更好地理解人工智能機(jī)器學(xué)習(xí)方法在結(jié)直腸癌分析中的成功標(biāo)準(zhǔn),并為新的研究人員提供更好的方法,需要確定通用的數(shù)據(jù)標(biāo)準(zhǔn)化和評估標(biāo)準(zhǔn)。隨著人工智能技術(shù)不斷的提高,對數(shù)據(jù)量的要求也在提高,因此應(yīng)建立適當(dāng)?shù)拇髷?shù)據(jù)庫和數(shù)據(jù)共享的方案。人工智能技術(shù)的發(fā)展有可能從根本上改變醫(yī)學(xué)實踐的方式,將會在很大程度上推動個性化醫(yī)療和精準(zhǔn)醫(yī)療的發(fā)展[56-57]。