辛仲宏,雷軍強,郭 城,張亞萍,陳梓嫻
(蘭州大學第一醫(yī)院放射科 甘肅省智能影像醫(yī)學工程研究中心 精準影像協(xié)同創(chuàng)新 甘肅省國際科技合作基地,甘肅 蘭州 730000)
宮頸癌(cervical cancer, CC)居于女性惡性腫瘤第二位,嚴重危害女性健康和生命[1-2];其病因及發(fā)病機制尚未完全明了,但87.96%的CC患者伴人乳頭瘤病毒(human papilloma virus, HPV)感染,且與其16/18型高度相關(guān)[3]。目前對國際婦產(chǎn)科聯(lián)盟(International Federation of Gynecology and Obstetrics, FIGO)Ⅰ期與ⅡA期CC多以手術(shù)治療為主,術(shù)前輔助放射治療(簡稱放療)或新輔助化療(neoadjuvant chemotherapy, NACT)可提高手術(shù)切除率并改善預后;對FIGO分期ⅡB期及以上晚期CC以根治性放療及化學治療(簡稱化療)為首選。因此,早期診斷CC并進行分期至關(guān)重要。人工智能(artificial intelligence, AI)基于數(shù)學、計算機及神經(jīng)科學等發(fā)展而來,可通過計算機程序模擬、延伸和拓展人的智能行為,以提供客觀的檢測、定量、分類及預測方法用于臨床輔助診斷[4-5]。深度學習(deep learning, DL)為AI新領(lǐng)域,能大批量處理、挖掘、整合高維數(shù)據(jù),自動識別、運算圖像信息,在圖像分析領(lǐng)域展示出巨大潛力,用于診斷腫瘤、鑒別診斷、指導治療及預測預后等具有獨特特有優(yōu)勢。本文針對DL用于篩查和診斷CC、指導治療及判斷預后的現(xiàn)狀、問題及前景進行綜述。
機器學習(machine learning, ML)通過計算機模擬人類學習行為,在無明確指令的情況下執(zhí)行任務并進行數(shù)據(jù)分析;其常用方法包括logistic回歸、線性回歸、決策樹、隨機森林、貝葉斯和K-means聚類分析、多層感知機及支持向量機等。DL是ML的主要研究方向,以計算機模擬人腦機制分析數(shù)據(jù),使用分層人工神經(jīng)網(wǎng)絡開發(fā)復雜學習模型,包括卷積神經(jīng)網(wǎng)絡(convolution neural networks, CNN)、深度置信網(wǎng)絡和遞歸神經(jīng)網(wǎng)絡等;其中的CNN可自動學習傳統(tǒng)圖像分析方法無法識別的高維度特征信息,適用于建立醫(yī)學影像及其解析間的復雜關(guān)系模型[6],已在多項相關(guān)研究中取得重大進展[6-10]。醫(yī)療數(shù)據(jù)中,影像學數(shù)據(jù)占比較高,且格式標準、易于獲取,是篩查和診斷腫瘤、預測療效和評價預后的主要依據(jù)之一。
2.1 篩查與診斷 DL具有快速、高效及客觀等特點,在篩查、診斷及分期CC中發(fā)揮著越來越重要的作用。陰道鏡引導下活檢穿刺對診斷宮頸上皮內(nèi)瘤變(cervical intraepithelial neoplasia, CIN)至關(guān)重要。目前AI電子陰道鏡輔助診斷系統(tǒng)已取得一定進展。DL協(xié)同數(shù)字陰道鏡可自動診斷、提高陰道鏡診斷和宮頸活檢的準確性。HU等[11]經(jīng)7年隨訪篩查CC,共納入9 406名受試者,以其中的99 843幅宮頸圖像為訓練集,以病理診斷為金標準,所構(gòu)建的DL模型識別正常、CIN2和CIN3的受試者工作特征(receiver operating characteristic, ROC)曲線下面積(area under the curve, AUC)分別為0.80、0.70及0.69;以342例CC患者進行測試,結(jié)果顯示該模型識別CIN2及CIN3的AUC為0.91,效能顯著高于傳統(tǒng)宮頸照相技術(shù)、傳統(tǒng)細胞學及HPV檢測。
PATHANIA等[12]開發(fā)了以DNA為中心、運用DL的數(shù)字化篩查HPV平臺,用于檢測HPV16/18型的DNA具有極高的敏感度和特異度,甚至可識別單個細胞,且檢測用時低于2 min。WENTZENSEN等[13]構(gòu)建了基于活檢金標準訓練的p16/Ki-67雙重染色(double staining, DS)載玻片DL平臺,在敏感度相同的前提下,其診斷陽性率低于、但特異度高于細胞學和手動DS檢測;相比巴氏法,基于DL的DS使轉(zhuǎn)診至陰道鏡的比例降低了約1/3(41.9%vs.60.1%),提示基于該平臺可實現(xiàn)自動化檢測,且特異度較高,有助于避免不必要的陰道鏡檢查。
URUSHIBARA等[14]基于117例CC患者488幅和181例非癌癥患者509幅腹部T2WI構(gòu)建DL模型,并以60例CC患者和60例非癌癥患者的120幅圖像進行測試,結(jié)果顯示DL模型和3名影像科醫(yī)生診斷CC的敏感度分別為0.883和0.783~0.867,特異度分別為0.933和0.917~0.950,準確率分別為0.908和0.867~0.892,即DL模型的診斷效能與影像科醫(yī)生相當甚至更優(yōu)。楊易等[15]提取159例經(jīng)病理證實CC患者的396個T2WI影像組學特征,根據(jù)最終篩選出的11個特征建立了預測早、晚期CC的模型,其在訓練集和驗證集中的擬合優(yōu)度均較高(χ2=2.68、8.87,P均>0.05),AUC達0.80,提示基于T2WI的影像組學模型預測CC臨床分期具有較高價值。早期診斷并擬定治療決策對改善預后及生存質(zhì)量至關(guān)重要。DL模型的診斷準確率取決于訓練集數(shù)據(jù)質(zhì)量及算法精度。開展大樣本、多中心研究,進行規(guī)范化診斷及結(jié)合多種臨床數(shù)據(jù)是DL發(fā)展的方向。
2.2 預測淋巴脈管間隙浸潤及淋巴結(jié)轉(zhuǎn)移 淋巴脈管間隙浸潤(lymph-vascular space invasion, LVSI)包括血管或微血管浸潤及淋巴管浸潤。早期判斷有無LVSI和淋巴結(jié)轉(zhuǎn)移對制定治療方案和預測預后至關(guān)重要。WU等[16]基于894例接受根治性子宮切除術(shù)和盆腔淋巴結(jié)清掃術(shù)的ⅠB期至ⅡB期CC患者的術(shù)前MRI構(gòu)建的DL模型用于預測CC淋巴結(jié)轉(zhuǎn)移顯示出良好效能,其AUC為0.844[95%CI(0.780,0.907)]。DONG等[17]基于CC患者術(shù)前CT、組織學和臨床分期構(gòu)建了術(shù)前預測CC淋巴結(jié)轉(zhuǎn)移的DL模型,共提取1 045個影像組學特征,其中28個與淋巴結(jié)轉(zhuǎn)移顯著相關(guān)(P均<0.05),模型預測淋巴結(jié)轉(zhuǎn)移的AUC為0.99,內(nèi)部驗證準確率為97.16%,外部驗證的AUC為0.90,準確率為92.00%。
DL模型預測LVSI和淋巴結(jié)轉(zhuǎn)移的準確性來源于大樣本術(shù)前影像學資料與術(shù)后病理對照研究結(jié)果。影像學無法明確提示LVSI和淋巴結(jié)轉(zhuǎn)移時,DL能夠識別傳統(tǒng)圖像分析方法無法識別的高維度特征信息。JIANG等[18]納入167例CC患者的2 056幅MRI,包括1 070幅T1WI和986幅T2WI,其中862幅可見LVSI、1 194幅無LVSI,所構(gòu)建的T1WI DL模型的判斷力高于T2WI模型,二者聯(lián)合預測早期CC LVSI的AUC為0.911,敏感度為0.881,特異度為0.752。
2.3 指導放療 基于AI的放療主要包括依據(jù)CC的組織學特征智能制定放療方案,以及結(jié)合影像學特征自動區(qū)分腫瘤組織與正常組織,實現(xiàn)精準勾畫靶區(qū),避免損傷正常組織。CHEN等[19]納入140例CC患者,將其中100例用于訓練、20例用于驗證、20例用于測試,以構(gòu)建的基于CNN的預測模型和自動優(yōu)化策略確定自動調(diào)強放療(intensity modulated radiation therapy, IMRT)的靶區(qū),其靶標覆蓋率和計算劑量與初級或高級技師手動制定方案相比差異無統(tǒng)計學意義,而劑量均一性略有降低,但多數(shù)危險器官的平均劑量明顯降低,并使膀胱及直腸的臨床靶區(qū)體積分別降低6.3%及12.3%,直腸及骨髓的平均劑量分別降低1.1 Gy和1.8 Gy,提示自動IMRT程序可在不犧牲目標劑量的情況下降低劑量、減少正常組織損傷。
RHEE等[20]納入2 254例CC患者的CT圖像構(gòu)建放療靶區(qū)自動勾畫模型,實現(xiàn)了自動勾畫病變組織及11個正常結(jié)構(gòu)(7個危險器官和4個骨性結(jié)構(gòu)),其中原發(fā)病變、盆腔淋巴結(jié)、主動脈旁淋巴結(jié)的臨床靶區(qū)的戴斯相似性系數(shù)(Dice similarity coefficient, DSC)分別為0.86、0.81及0.76,平均表面距離分別為0.19、0.21及0.27 cm,豪斯多夫距離(Hausdorff distance, HD)分別為2.02、2.09及2.00 cm;在外部測試集中,該模型勾畫的80%臨床靶區(qū)、97%危險器官和98%骨性結(jié)構(gòu)均可接受。秦楠楠等[21]將自動勾畫模型用于100例接受IMRT治療的CC患者CT圖像,其勾畫臨床靶區(qū)的DSC為0.860,HD為13.9 mm,勾畫危險器官(膀胱、直腸和左、右股骨頭)的平均DSC為0.898,平均HD為5.3 mm,且在內(nèi)部和外部數(shù)據(jù)集中均表現(xiàn)良好,臨床適用性較高。隨著算法的進一步精準化,DL將成為指導放療的主要方法之一。
2.4 預測預后 SHEN等[22]基于142例CC患者的18F-FDG PET/CT構(gòu)建DL模型,其預測放化療后局部復發(fā)和遠處轉(zhuǎn)移的敏感度分別為71%及77%,特異度分別為93%及90%,陽性預測值分別為63%及63%,陰性預測值分別為95%及95%,準確率分別為89%及87%,能夠較好地預測臨床療效。于治療前影像學資料中獲取預測療效信息并制定個體化治療方案是DL的研究方向,雖然目前基于影像學數(shù)據(jù)構(gòu)建DL模型用于預測CC患者生存期的文獻較少,基于臨床相關(guān)數(shù)據(jù)構(gòu)建的DL模型已在預測CC患者預后方面表現(xiàn)出一定優(yōu)勢[23-24]。聯(lián)合臨床及影像學信息共同構(gòu)建預測模型將是未來發(fā)展方向。
DL用于CC診療已取得一定成果,但目前仍屬臨床輔助工具,且面臨以下問題:①模型的準確性、泛化性和魯棒性,模型基于數(shù)據(jù)驅(qū)動算法,需要大樣本、高質(zhì)量訓練數(shù)據(jù)支撐,但目前缺乏多中心、高質(zhì)量、大樣本訓練數(shù)據(jù)集,且圖像質(zhì)量和規(guī)范未能實現(xiàn)同質(zhì)化;②模型的可解釋性,模型可解釋性越高,輸出結(jié)果越易被用戶理解,隨著模型性能的提高,其結(jié)構(gòu)越來越復雜,隨之而來的可解釋性成為DL發(fā)展的難題之一;③圖像標注需要影像科、婦科、病理科、流行病學專家及AI工程師進行跨學科協(xié)作,存在質(zhì)量一致性與規(guī)范性問題;④數(shù)據(jù)安全及個人隱私,DL數(shù)據(jù)收集涉及醫(yī)學倫理和法律法規(guī)等多個領(lǐng)域,如何絕對保證數(shù)據(jù)安全和嚴格保護個人信息是必須面對的問題。
隨著DL技術(shù)的快速發(fā)展,其在篩查和診斷CC、指導治療、評估療效及預測預后中必將發(fā)揮重要作用?;贒L技術(shù)和多模態(tài)影像學構(gòu)建的CC診療模型可為定量評估CC提供客觀依據(jù)。如何在提高診療效率及醫(yī)療服務質(zhì)量的同時減輕醫(yī)生工作負擔將成為DL在CC的主要研究方向。