李冰冰,武志芳,楊 帥,崔曹哲,李肖萌,呂豆豆,胡凌志
1.山西醫(yī)科大學(xué)第一醫(yī)院核醫(yī)學(xué)科,山西 太原 030001;
2.分子影像山西省重點實驗室,山西 太原 030001;
3.分子影像精準(zhǔn)診療省部共建協(xié)同創(chuàng)新中心,太原 030001
肺癌是常見的惡性腫瘤,全球發(fā)病率及死亡率位居高位,也是中國癌癥相關(guān)死亡的首要原因[1]。肺癌是具有高度異質(zhì)性的惡性腫瘤,其中非小細胞肺癌(non-small cell lung cancer,NSCLC)約占85%。目前,18F-FDG正電子發(fā)射體層成像(positron emission tomography,PET)/計算機體層成像(computed tomography,CT)技術(shù)實現(xiàn)分子影像與解剖影像的有機融合,已成為肺癌診斷、分期與再分期、療效和預(yù)后評估的最佳方法[2]。近年來,隨著大數(shù)據(jù)分析和人工智能(artificial intelligence,AI)等前沿技術(shù)在醫(yī)療領(lǐng)域的應(yīng)用,興起的深度學(xué)習(xí)(deep learning,DL)技術(shù)憑借高效自學(xué)習(xí)的特性解決了臨床工作中的諸多難題,在肺癌患者PET/CT診療過程中,利用卷積運算架構(gòu)提高圖像質(zhì)量和重建速度,實現(xiàn)病灶精確分割,在早期預(yù)測治療靈敏度及預(yù)后評估等方面發(fā)揮獨特優(yōu)勢,有望成為診療監(jiān)測的輔助工具。
AI是一個廣泛的研究領(lǐng)域,旨在模擬人類智能的計算機系統(tǒng)[3]。其中機器學(xué)習(xí)(maching learning,ML)是AI的一個重要分支,通過分析原始數(shù)據(jù),開發(fā)能夠檢測行為模式的算法,從而建立預(yù)測模型。近年來,DL已成為ML領(lǐng)域的一個熱點,它是傳統(tǒng)人工神經(jīng)網(wǎng)絡(luò)(artificial neural network,ANN)技術(shù)上的擴展。DL通過多層非線性神經(jīng)網(wǎng)絡(luò)將低層次特征組合形成抽象的高層次特征,自動學(xué)習(xí)更復(fù)雜、更高維度的特征信息,提取相關(guān)特征,最終實現(xiàn)圖像自動分析[4]。DL的基本框架是神經(jīng)網(wǎng)絡(luò),早在1998年Lecun等[5]提出神經(jīng)網(wǎng)絡(luò)雛形LeNet,使用反向傳播算法訓(xùn)練多層神經(jīng)網(wǎng)絡(luò)為DL奠定了基礎(chǔ)。隨著任務(wù)的復(fù)雜化,計算機處理能力不斷提升,逐漸涌現(xiàn)出更多優(yōu)秀的DL算法。
卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)[6]由卷積層、池化層和全連接層組成,通過反向傳播算法和梯度下降設(shè)計用于自動和自適應(yīng)學(xué)習(xí)特征的空間層次結(jié)構(gòu)。自2012年CNN在ImageNet圖像分類競賽中取得冠軍以來[7],一直在計算機分類任務(wù)中占據(jù)主導(dǎo)地位,是醫(yī)學(xué)圖像領(lǐng)域應(yīng)用最廣泛的算法。在CNN的基礎(chǔ)上,為避免網(wǎng)絡(luò)層數(shù)加深造成梯度爆炸等問題,進一步引入殘差神經(jīng)網(wǎng)絡(luò)(residual network,ResNet),增加直連通道簡化學(xué)習(xí)任務(wù),用于圖像分類[8]。對抗生成神經(jīng)網(wǎng)絡(luò)(generative adversarial network,GAN)主要用于圖像重建。U-Net是醫(yī)學(xué)圖像分割最常用的架構(gòu)[9]。而Transformer[10]和圖神經(jīng)網(wǎng)絡(luò)(graph neural network,GNN)[11],前者分割針對紋理和結(jié)構(gòu)差異較大的目標(biāo),后者適合圖結(jié)構(gòu)數(shù)據(jù)的分類。
PET/CT利用示蹤劑在體內(nèi)的分布間接反映代謝信息,注入低劑量示蹤劑可以降低受檢者輻射劑量,但也會導(dǎo)致低信噪比的圖像生成。近年來,PET/CT的低劑量采集與重建倍受關(guān)注,DL在改善圖像質(zhì)量上的應(yīng)用也愈加廣泛。Xu等[12]使用ResNet將1/200劑量的PET圖像重建為全劑量PET圖像,保持分辨率的同時顯著去噪。Zhou等[13]提出基于CycleGAN結(jié)構(gòu)的循環(huán)Wasserstein回歸對抗訓(xùn)練框架,保留最大標(biāo)準(zhǔn)攝取值(SUVmax)和平均標(biāo)準(zhǔn)攝取值(SUVmean),提高低劑量PET圖像質(zhì)量。H?ggstr?m等[14]利用DeepPET技術(shù)輸入PET正弦圖數(shù)據(jù)直接生成PET重建圖像,重建速度比有序子集最大期望值法(ordered subsets expectation maximization,OSEM)和濾波反投影(filtered back projection,F(xiàn)BP)等標(biāo)準(zhǔn)迭代方法快100倍和3倍。總的來說,基于DL的圖像重建算法在改進圖像質(zhì)量方面取得了較好的效果。
病灶檢測和分割是計算機輔助診斷肺癌的重要步驟,臨床上以高年資醫(yī)師手動分割結(jié)果為基準(zhǔn),成本高、耗時長,加之肺癌異質(zhì)性的影響,容易引起觀察者之間和觀察者內(nèi)部的分歧。近年來,DL憑借卷積運算為醫(yī)師提供了更快捷、可重復(fù)性更高的結(jié)果,被認為是檢測與分割任務(wù)中的魯棒工具。Teramoto等[15]和Zhang等[16]利用基于主動輪廓過濾器和多尺度掩模的CNN,自動檢測18F-FDG PET/CT圖像中的肺結(jié)節(jié),假陽性率從72.8%降至4.9%,準(zhǔn)確度達90.0%,可以有效且準(zhǔn)確地檢測肺結(jié)節(jié)。Leung等[17]證明了U-Net分割小腫瘤的能力(最小橫截面為1.83 cm2),骰子相似系數(shù)達0.74。Li等[18]提出了基于DL的變分方法,設(shè)計具有V-Net的3D全卷積網(wǎng)絡(luò)(fully convolutional network,F(xiàn)CN),使用分裂Bregman算法的最小化變分模型,實現(xiàn)精確的多模態(tài)腫瘤分割。Fu等[19]介紹了基于DL具有多模態(tài)空間注意力模塊的PET/CT分割框架,骰子相似系數(shù)優(yōu)于現(xiàn)有PET/CT肺癌分割方法約7.6%。基于DL的PET/CT圖像腫瘤檢測和分割任務(wù)取得顯著成效。
肺癌的準(zhǔn)確分期及組織學(xué)分型對確定治療方案具有重要意義,但其依賴于組織活檢,侵入性檢查存在出血、氣胸等風(fēng)險[20]。近年來,DL作為低風(fēng)險和非侵入性的方法,憑借其出色的圖像分析能力逐漸應(yīng)用于PET/CT肺癌分期及分型中。Kasinathan等[21]提出了基于多層CNN(M-CNN)的肺癌PET/CT分期分類器,準(zhǔn)確度達97.0%~99.1%。Kirienko等[22]開發(fā)了基于CNN的算法,用于PET/CT圖像上T1-T2或T3-T4的肺癌分期,訓(xùn)練、驗證的準(zhǔn)確度分別達87%和86%。這表明CNN在評估肺癌T分期方面具有良好性能。Wang等[23]的研究證明,基于PET/CT的CNN在預(yù)測NSCLC的縱隔淋巴結(jié)受累方面也頗有價值,并與經(jīng)典ML方法及醫(yī)師主觀性判斷進行比較,結(jié)果顯示CNN的診斷特異度達0.88,曲線下面積(area under curve,AUC)達0.91,經(jīng)典ML診斷AUC為0.87~0.92,CNN和經(jīng)典ML方法性能差異無統(tǒng)計學(xué)意義。但與醫(yī)師相比,基于AI算法具有更高的靈敏度,但特異度低。Han等[24]收集867例腺癌和552例鱗癌患者的PET/CT圖像,以8∶2分成訓(xùn)練集和測試集,共提取688個特征,分別構(gòu)建多種ML模型和VGG16 DL模型用于NSCLC組織學(xué)亞型分類,結(jié)果表明VGG16 DL模型(AUC=0.90,準(zhǔn)確度=0.84)性能優(yōu)于現(xiàn)有的支持向量機(support vector machine,SVM)模型(AUC=0.86,準(zhǔn)確度=0.79)。此外,盡管有大量用于鑒別肺癌組織學(xué)亞型的算法研究,但多為影像組學(xué)與ML,基于DL算法在肺癌亞型分類及遠處轉(zhuǎn)移上的應(yīng)用仍有待開發(fā)。
表皮生長因子受體(epidermal growth factor receptor,EGFR)、Kirsten大鼠肉瘤(Kirsten rat sarcoma,KRAS)、間變性淋巴瘤激酶(anaplastic lymphoma kinase,ALK)以及程序性死亡受體配體1(programmed death-ligand 1,PD-L1)表達狀態(tài)與NSCLC患者的預(yù)后密切相關(guān)[25-26],自新型靶向藥物獲得美國食品藥品監(jiān)督管理局(Food and Drug Administration,F(xiàn)DA)批準(zhǔn),靶向藥物治療大大改善了肺癌患者的預(yù)后。然而傳統(tǒng)靶點的檢測依賴于有創(chuàng)的活組織病理學(xué)檢查。近年來,基于單克隆抗體(monoclonal antibodies,mAb)和酪氨酸激酶抑制劑(tyrosine kinase inhibitor,TKI)的靶向PET可以通過非侵入性的方法輔助檢測陽性靶點[27],盡管目前沒有研究證明18F-FDG PET/CT能進行靶點成像,但有研究[25,28]使用18F-FDG PET/CT圖像訓(xùn)練DL模型進一步預(yù)測靶點表達狀態(tài)。
Chen等[25]使用ResNet 20、32和50架構(gòu)分別構(gòu)建PET ResNet模型,CT圖像構(gòu)建ResNet 32模型,用堆疊泛化方法構(gòu)建SVM模型(Stack PET/CT&Clinical模型),分別預(yù)測肺癌患者EGFR突變狀態(tài)并評估性能,結(jié)果顯示Stack PET/CT&Clinical模型表現(xiàn)最佳(AUC=0.85±0.09),靈敏度、特異度分別為0.76、0.85。盡管該研究在模型性能比較中表現(xiàn)最佳的是ML模型,這其中不乏有多模態(tài)數(shù)據(jù)的貢獻。Mu等[28]開發(fā)的基于18F-FDG PET/CT的DL模型,通過DL評分(DLS)對EGFR突變狀態(tài)分類并驗證,結(jié)果表明DLS在訓(xùn)練集、驗證集和外部測試集中的AUC分別為0.86、0.83和0.81,準(zhǔn)確度分別為81.1%、82.8%和78.5%。總而言之,基于DL的模型將有助于醫(yī)師非侵入性預(yù)測患者基因突變狀態(tài),識別可能受益于靶向治療或免疫治療的肺癌患者,從而實現(xiàn)更高效、更方便的精準(zhǔn)醫(yī)學(xué)。但目前多數(shù)研究[28]集中于預(yù)測EGFR及PD-L1的表達,預(yù)測其他種類突變的研究仍待進一步開展。
由于肺癌具有異質(zhì)性,個體之間的治療效果呈現(xiàn)多樣化,因此,如果可以早期預(yù)測個體對治療的靈敏度,對制訂治療方案將有很大的幫助。一些研究已證明DL可以預(yù)測治療反應(yīng),如免疫療法、化療和放療。Mu等[29]采用小ResCNN對NSCLC患者的18F-FDG PET/CT圖像和臨床資料進行分析,通過DLS預(yù)測PD-L1表達狀態(tài),進一步用于預(yù)測患者從免疫治療中獲得的持續(xù)臨床益處(durable clinical benefit,DCB)和生存率,結(jié)果表明DLS與臨床特征相結(jié)合能夠準(zhǔn)確地預(yù)測DCB、無進展生存期和總生存期(C指數(shù)為0.70~0.87)。Baek等[30]發(fā)現(xiàn)相較傳統(tǒng)的基于PET的代謝參數(shù),如代謝腫瘤體積(metabolic tumor volume,MTV)、糖酵解總量(total lesion glycolysis,TLG),或影像組學(xué)方法,PET/CT上U-Net分割算法模型具有更高的生存預(yù)測能力。簡而言之,基于DL算法的模型可以在早期識別高進展和高死亡風(fēng)險的肺部腫瘤。
總之,DL算法應(yīng)用于肺癌18F-FDG PET/CT,無論是在診斷還是治療,或是預(yù)后預(yù)測等方面,均展現(xiàn)出其獨有的優(yōu)勢,但M分期、組織學(xué)亞型及治療靈敏度預(yù)測等仍有待完善。且臨床實施之前仍需面對和解決某些限制與障礙。首先,數(shù)據(jù)是DL最關(guān)鍵和最核心的部分,DL通常需要大量數(shù)據(jù)去避免過擬合,并由專業(yè)人員進行標(biāo)注,以確保可信度,此過程昂貴且耗時。其次,DL技術(shù)的算法過程缺乏透明度,“黑匣子”性質(zhì)難以提供理論支持和影像學(xué)依據(jù),并且診斷結(jié)果的可解釋性較差。此外,許多研究的回顧性方式以及主觀性帶來的偏差,都會影響其準(zhǔn)確度。因此,未來仍需通過完善數(shù)據(jù)采集標(biāo)準(zhǔn)、擴充數(shù)據(jù)量、設(shè)計多中心研究等方法避免可能的偏差,進一步拓展其應(yīng)用。
隨著AI等前沿技術(shù)和醫(yī)療大數(shù)據(jù)分析的不斷進步,DL現(xiàn)如今雖然處于起步階段,但在目前的研究中已展現(xiàn)出其巨大的潛力,將來有望為精準(zhǔn)醫(yī)療提供更多的便利。