龔 航, 黃 忠, 劉先麗
1 自貢市第一人民醫(yī)院 消化內(nèi)科, 四川 自貢 643000; 2 自貢市中醫(yī)醫(yī)院 超聲科, 四川 自貢 643000
自2010年以來(lái),人工智能(artificial intelligence, AI)已經(jīng)在醫(yī)學(xué)領(lǐng)域取得了實(shí)質(zhì)性的進(jìn)展。AI也越來(lái)越多的應(yīng)用于肝、胰疾病和食管靜脈曲張的診斷研究。相較于影像學(xué)及臨床醫(yī)生,影像組學(xué)、臨床血液檢驗(yàn)借助計(jì)算機(jī)的幫助,可以挖掘出大量人眼所難以識(shí)別的特征,以提高疾病診斷準(zhǔn)確率。本文就AI在肝、胰疾病及食管靜脈曲張的血液學(xué)數(shù)據(jù)及影像組學(xué)診斷中的研究進(jìn)展作一綜述。
AI通常是指模仿人類認(rèn)知功能(如學(xué)習(xí)和解決問(wèn)題)的計(jì)算機(jī)程序。AI的概念范疇包括機(jī)器學(xué)習(xí)(machine learning, ML)和深度學(xué)習(xí)(deep learning, DL)[1]。ML涉及計(jì)算機(jī)科學(xué)和統(tǒng)計(jì)學(xué)領(lǐng)域,主要指電腦機(jī)器執(zhí)行模型的重復(fù)迭代,以逐步提高完成特定任務(wù)的效率。ML方法大致分為有監(jiān)督學(xué)習(xí)和無(wú)監(jiān)督學(xué)習(xí)。當(dāng)機(jī)器對(duì)組的數(shù)量及其重要性沒(méi)有先驗(yàn)知識(shí)時(shí),就會(huì)出現(xiàn)根據(jù)共性來(lái)識(shí)別組中數(shù)據(jù)的無(wú)監(jiān)督學(xué)習(xí),而事先給定包含成對(duì)輸入-輸出的訓(xùn)練數(shù)據(jù)時(shí),就會(huì)產(chǎn)生對(duì)未知數(shù)據(jù)有分類能力的監(jiān)督學(xué)習(xí)[1]。DL是ML中的一個(gè)新領(lǐng)域,通過(guò)建立以及模擬人腦分析學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò),從而模仿人腦的機(jī)制來(lái)解釋數(shù)據(jù)(如圖象、聲音、文本)。DL是一類模式分析方法的統(tǒng)稱,主要包括卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network, CNN)、深度置信網(wǎng)絡(luò)、循環(huán)神經(jīng)網(wǎng)絡(luò)等在內(nèi)的多種深度神經(jīng)網(wǎng)絡(luò),部分網(wǎng)絡(luò)已經(jīng)應(yīng)用到肝、胰疾病及食管靜脈曲張的多模態(tài)影像智能診斷領(lǐng)域中,并取得了突破性進(jìn)展[2]。
臨床上,考慮腫瘤改變的胰腺局灶性病變患者中近四分之一需要行超聲內(nèi)鏡(EUS)檢查,但胰腺腫瘤和炎癥通常有相似的EUS圖像,即使是有經(jīng)驗(yàn)的內(nèi)窺鏡醫(yī)師也會(huì)出現(xiàn)誤診或漏診[3]。EUS引導(dǎo)下細(xì)針穿刺吸取活檢術(shù)(endoscopic ultrasonography-guided fine needle aspiration, EUS-FNA)的檢測(cè)和診斷主要基于EUS圖像的感興趣區(qū)域,從而導(dǎo)致其穿刺病理結(jié)果有非常高的假陰性率。EUS是由像素組成的二維數(shù)字圖像,而像素是數(shù)字圖像的基本有限元元素,像素的排列反映了EUS圖像的組織結(jié)構(gòu)。眾所周知,病理狀態(tài)(如炎癥和腫瘤)常改變病灶組織結(jié)構(gòu),而數(shù)字圖像分析作為計(jì)算機(jī)輔助診斷技術(shù)的一種,可根據(jù)EUS圖像中像素的排列情況計(jì)算相關(guān)的數(shù)學(xué)和統(tǒng)計(jì)參數(shù),達(dá)到有效鑒別胰腺炎癥和腫瘤的作用[4]。
Das等[5]根據(jù)不同胰腺病理類型將EUS圖像分為正常胰腺組、慢性胰腺炎組、胰腺癌組,利用數(shù)字圖像分析建立人工神經(jīng)網(wǎng)絡(luò)(artificial neural network, ANN)模型,其識(shí)別胰腺癌的靈敏度/特異度/受試者工作特征曲線下面積(AUC)分別達(dá)到93.0%/92.0%/0.93,同時(shí)該模型對(duì)正常胰腺和慢性胰腺炎的辨識(shí)度也極高(靈敏度、特異度及準(zhǔn)確度均高達(dá)100%)。Zhu等[6]分別對(duì)262例胰腺癌和126例慢性胰腺炎患者的EUS圖像進(jìn)行分析,從105個(gè)候選特征中選出16個(gè),利用支持向量機(jī)(support vector machine, SVM)模型發(fā)現(xiàn)其識(shí)別胰腺癌的敏感度/特異度/準(zhǔn)確度分別達(dá)到91.6%/95.0%/94.2%,結(jié)果表明SVM模型在胰腺癌診斷中表現(xiàn)出較高的效能。Ozkan等[7]應(yīng)用基于年齡分類的多層感知器(multilayered perceptron, MLP)模型,對(duì)332張EUS圖像(202例胰腺癌患者、130例非胰腺癌患者)進(jìn)行分析,該模型診斷胰腺癌的靈敏度/特異度/準(zhǔn)確度分別達(dá)到83.3%/93.3%/87.5%,結(jié)果表明基于年齡分類的MLP模型對(duì)胰腺癌的診斷價(jià)值優(yōu)于無(wú)年齡分類。Sǎftoiu等[8]利用MLP模型將實(shí)時(shí)EUS彈性成像中色調(diào)直方圖數(shù)據(jù)計(jì)算為彈性成像幀數(shù),以達(dá)到區(qū)分良惡性的效果,其將慢性胰腺炎和胰腺癌患者區(qū)分的靈敏度/特異度/準(zhǔn)確度分別達(dá)到87.6%/82.9%/84.3%,提示MLP模型基于EUS或?qū)崟r(shí)EUS彈性成像均在胰腺癌的診斷中有一定效能。另有學(xué)者[9]對(duì)167例經(jīng)病理診斷為慢性胰腺炎或胰腺癌的患者展開(kāi)研究,發(fā)現(xiàn)在諧波造影增強(qiáng)EUS基礎(chǔ)上建立的ANN模型鑒別胰腺癌的靈敏度/特異度/準(zhǔn)確度高達(dá)94.64%/94.44%/94.6%,分別比單一諧波造影增強(qiáng)EUS的靈敏度、特異度提高了7.14%、1.72%。另有研究[10]基于血清腫瘤標(biāo)志物(CA19-9、CA125、CEA)建立ANN模型,其診斷胰腺癌的AUC高達(dá)0.91,提示ANN模型結(jié)合血清腫瘤標(biāo)志物在預(yù)測(cè)胰腺癌方面有較好的臨床價(jià)值。
此外,也有基于CT、MRI方面的AI研究。Liu等[11]探討了基于CNN深度學(xué)習(xí)的增強(qiáng)CT圖像模型對(duì)胰腺癌鑒別診斷的價(jià)值,AI模型自動(dòng)處理一張CT圖像僅需0.2 s,鑒別胰腺癌AUC高達(dá)0.96,提示基于CNN的AI模型是一種有效、客觀、高精度的胰腺癌診斷方法。Li等[12]建立的基于PET/CT圖像的胰腺癌計(jì)算機(jī)輔助診斷技術(shù),SVM-隨機(jī)森林(random forest, RF)聯(lián)合傳統(tǒng)模型雙閾值-主成分分析(dual threshold principal component analysis, DT-PCA)鑒別胰腺癌的靈敏度/特異度/準(zhǔn)確度高達(dá)95.2%/97.5%/96.5%,結(jié)果提示SVM-RF模型成功地融合了SVM和RF的優(yōu)勢(shì),并能聯(lián)合DT-PCA、Relief、Lasso等傳統(tǒng)模型達(dá)到不俗的預(yù)測(cè)效果,其中SVM-RF聯(lián)合DT-PCA模型在各項(xiàng)評(píng)估中表現(xiàn)最佳。Gao等[13]基于T1加權(quán)對(duì)比增強(qiáng)MRI結(jié)合CNN深度學(xué)習(xí)模型預(yù)測(cè)外部驗(yàn)證組中胰腺癌的AUC達(dá)0.90,表明基于CNN深度學(xué)習(xí)的MRI增強(qiáng)圖像對(duì)胰腺癌的預(yù)測(cè)價(jià)值有一定的應(yīng)用前景(表1)。
3.1 肝纖維化 肝纖維化是許多肝臟疾病尤其是慢性肝病的一個(gè)共同病理基礎(chǔ)。慢性肝纖維化程度的評(píng)估是判斷病情、早期干預(yù)治療和隨訪療效的關(guān)鍵環(huán)節(jié)。目前肝活檢一直作為肝纖維化診斷的金標(biāo)準(zhǔn)[14]。然而,肝活檢本身存在著給患者帶來(lái)風(fēng)險(xiǎn)傷害、取樣誤差、醫(yī)療資源的浪費(fèi)以及缺乏動(dòng)態(tài)監(jiān)測(cè)等問(wèn)題,限制了其在臨床上的應(yīng)用。近年來(lái),肝纖維化的影像學(xué)診斷技術(shù)(如瞬時(shí)彈性成像、磁共振彈性成像)成為研究熱點(diǎn),相較于血清標(biāo)志物具有準(zhǔn)確度高、無(wú)創(chuàng)性、無(wú)輻射等優(yōu)點(diǎn),但仍然不能替代肝活檢。隨著信息化時(shí)代的到來(lái),AI也越來(lái)越多的應(yīng)用于肝纖維化的診斷研究,AI結(jié)合影像學(xué)和血液學(xué)檢查有望作為診斷肝纖維化的非侵入性技術(shù)。
對(duì)于肝纖維化的診斷,其中不乏臨床血液學(xué)方面的AI研究。Piscaglia等[15]使用ANN模型結(jié)合臨床血液學(xué)數(shù)據(jù)對(duì)肝活檢證實(shí)的慢性丙型肝炎(CHC)肝移植受者(訓(xùn)練組:414例,驗(yàn)證組:96例)展開(kāi)研究,其診斷進(jìn)展期肝纖維化(≥F3)的靈敏度/特異度/AUC分別達(dá)到100%/79.5%/0.93,較單一的臨床數(shù)據(jù)logit模型靈敏度、AUC分別提高了13%、0.09(P<0.05)。Hashem等[16]分別運(yùn)用粒子群分類器(particle swarm optimization, PSO)、交替決策樹(shù)(alternating decision tree, ADT)、多元線性回歸(multi-linear regression, MReg)、遺傳分類器(genetic algorithm, GA)結(jié)合血液學(xué)指標(biāo)(年齡、AST、Alb及ALT)對(duì)39 567例經(jīng)肝臟病理證實(shí)的CHC肝纖維化患者展開(kāi)研究,結(jié)果證實(shí)4種AI分類器診斷進(jìn)展期肝纖維化的靈敏度/特異度/準(zhǔn)確度分別達(dá)到70.4%/65.6%/66.4%、7.0%/99.0%/84.4%、69.0%/69.1%/69.1%、68.9%/69.7%/69.6%,表明AI分類器可以作為預(yù)測(cè)HCV進(jìn)展期肝纖維化的替代方法。Wang等[17]運(yùn)用ANN模型結(jié)合血液標(biāo)志物對(duì)經(jīng)肝臟病理證實(shí)的慢性乙型肝炎(CHB)肝纖維化患者(訓(xùn)練組:226例,測(cè)試組:116例)進(jìn)行分析,模型診斷顯著肝纖維化(≥F2)的靈敏度/特異度/AUC分別達(dá)到83.3%/85.0%/0.92,使需要肝活檢的患者減少47.4%。Wei等[18]運(yùn)用梯度提升(gradient boosting, GB)模型結(jié)合臨床數(shù)據(jù)對(duì)CHB肝纖維化患者進(jìn)行分析,發(fā)現(xiàn)GB模型診斷進(jìn)展期肝纖維化、肝硬化的靈敏度/特異度/AUC分別達(dá)到84.0%/85.0%/0.92、78.0%/85.0%/0.87,GB模型對(duì)CHB肝纖維化的診斷效能顯著優(yōu)于FIB-4。Raoufy等[19]發(fā)現(xiàn)ANN模型結(jié)合臨床數(shù)據(jù)診斷CHB肝硬化的靈敏度/特異度/準(zhǔn)確度分別達(dá)到87.5%/92.0%/91.4%,表明僅基于常規(guī)的臨床實(shí)驗(yàn)室數(shù)據(jù),ANN模型診斷CHB肝硬化的效能可能優(yōu)于GB模型。
表1 AI在胰腺癌診斷中的應(yīng)用
此外,也有基于影像組學(xué)方面的AI研究。Chen等[20]分別運(yùn)用SVM、樸素貝葉斯(Na?ve Bayes, NB)、RF及k最近鄰分類器(k-nearest neighbor, KNN)結(jié)合實(shí)時(shí)組織彈性成像對(duì)513例CHB肝纖維化患者(經(jīng)肝臟病理證實(shí))的研究表明,4種AI分類器診斷輕度肝纖維化(≥F1)的靈敏度/特異度/準(zhǔn)確度分別達(dá)到93.0%/46.3%/81.5%、79.7%/82.5%/80.4%、89.4%/65.0%/82.9%、89.3%/61.2%/82.1%,結(jié)果證實(shí)4種AI分類器明顯優(yōu)于傳統(tǒng)的肝纖維化指數(shù)方法,其中RF分類器診斷準(zhǔn)確度最高,提示復(fù)雜的AI方法可以成為評(píng)估肝纖維化分級(jí)的有力工具,并顯示出較好的臨床應(yīng)用前景。Wang等[21]在剪切波彈性成像(Shear wave elastography, SWE)的基礎(chǔ)上建立CNN模型,采用了新的命名為深度學(xué)習(xí)的放射組學(xué)彈性成像(deep learning radiomics of elastography, DLRE),其診斷CHB顯著肝纖維化、進(jìn)展期肝纖維化、肝硬化的靈敏度/特異度/AUC分別達(dá)到69.1%/90.9%/0.85、90.4%/98.3%/0.98、96.9%/88.0%/0.97,DLRE診斷準(zhǔn)確性顯著優(yōu)于SWE、APRI及FIB-4。Yasaka等[22]采用釓塞酸二鈉增強(qiáng)MRI檢查結(jié)合CNN深度學(xué)習(xí)模型對(duì)肝纖維化患者開(kāi)展研究,其預(yù)測(cè)顯著肝纖維化、進(jìn)展期肝纖維化、肝硬化的靈敏度/特異度/AUC分別達(dá)到84.0%/65.0%/0.85、78.0%/74.0%/0.84、76.0%/76.0%/0.84,提示CNN模型在肝纖維化分期中表現(xiàn)出較高的診斷效能。Yasaka等[23]也探討了基于CNN深度學(xué)習(xí)的增強(qiáng)CT圖像模型評(píng)估肝纖維化分期的價(jià)值,其預(yù)測(cè)顯著肝纖維化、進(jìn)展期肝纖維化、肝硬化的靈敏度/特異度/AUC分別達(dá)到76.0%/68.0%/0.73、75.0%/65.0%/0.76、75.0%/57.0%/0.74,表明基于CT圖像的CNN深度學(xué)習(xí)模型對(duì)肝纖維化分期的價(jià)值尚不能令人滿意。同樣,基于FibroScan和TNFα的基礎(chǔ)上建立決策樹(shù)(decision trees, DT)模型對(duì)酒精性肝病(alcoholic liver disease, ALD)肝硬化也有一定的診斷效能[24]。
非酒精性脂肪性肝病(NAFLD)現(xiàn)已取代慢性乙型肝炎,成為我國(guó)第一大慢性肝病。日前,國(guó)際專家組已在頂級(jí)期刊Gastroenterology和JournalofHepatology發(fā)表聲明,提出以“代謝相關(guān)脂肪性肝病(metabolic associated fatty liver disease, MAFLD)”取代現(xiàn)有命名(NAFLD)[25-26]。大量證據(jù)顯示,MAFLD的診斷應(yīng)該基于代謝功能障礙的存在,而不是以“排除性”的方式,并且MAFLD可以與其他肝病共存(如病毒性肝炎、酒精性肝病等)。其次,關(guān)于酒精攝入量的安全閾值仍然存在爭(zhēng)議,原命名中“非酒精性”混淆術(shù)語(yǔ)應(yīng)該被替換。另外,代謝相關(guān)脂肪性肝病應(yīng)被認(rèn)為與其他慢性肝病相似,而不應(yīng)簡(jiǎn)單分為NASH和非NASH兩類,纖維化才是不良結(jié)局的主要決定因素?;谶@些原因,更新疾病命名有助于進(jìn)一步描述和細(xì)化疾病分型,從而優(yōu)化臨床實(shí)踐,提高臨床診治效率[27]。研究表明,將AI技術(shù)應(yīng)用于MAFLD的研究將有助于疾病的精確分類和預(yù)后判斷,為臨床決策提供參考。Sowa等[28]運(yùn)用RF、KNN模型結(jié)合臨床血液學(xué)參數(shù)診斷NAFLD顯著肝纖維化的靈敏度/特異度/準(zhǔn)確度分別達(dá)到60.0%/77.0%/79.0%、30.8%/91.3%/79.0%,但SVM、DT模型在血液學(xué)參數(shù)的基礎(chǔ)上無(wú)法準(zhǔn)確預(yù)測(cè)MAFLD肝纖維化(表2)。此外,AI還可應(yīng)用于MAFLD和ALD之間、MAFLD和健康對(duì)照組之間、MAFLD和MASH之間的鑒別診斷[28-30]。
3.2 食管靜脈曲張(esophageal varices, EV) EV是肝硬化的一種潛在致死性臨床表現(xiàn)。肝硬化患者發(fā)生EV的終生患病率為60%~80%,而急性EV出血導(dǎo)致的病死率為15%~55%[31]。目前所有肝硬化患者均推薦胃鏡篩查,然而接受篩查的患者中代償性肝硬化(無(wú)EV或輕度EV)占較大比例,這類患者無(wú)需靜脈曲張治療,卻有暴露于鎮(zhèn)靜藥物、操作相關(guān)并發(fā)癥的風(fēng)險(xiǎn)(藥物清除率下降、凝血障礙等原因)。近年來(lái)血小板計(jì)數(shù)與脾臟直徑比值、Baveno VI標(biāo)準(zhǔn)(涉及肝臟瞬時(shí)彈性成像)對(duì)EV的預(yù)測(cè)有一定的臨床價(jià)值,由于部分醫(yī)療機(jī)構(gòu)影像報(bào)告中不包含脾臟直徑,以及肝臟瞬時(shí)彈性成像尚未廣泛普及,因此限制了在臨床上的應(yīng)用。
目前AI在預(yù)測(cè)EV方面具有重要價(jià)值,Hong等[32]運(yùn)用MLP模型結(jié)合臨床數(shù)據(jù)(PLT、脾臟寬度和門靜脈直徑)對(duì)197例CHB肝硬化展開(kāi)研究,其預(yù)測(cè)EV的靈敏度/特異度/準(zhǔn)確度分別達(dá)到93.8%/71.7%/87.8%,表明MLP模型可用于預(yù)測(cè)CHB肝硬化患者EV的發(fā)生。Dong等[33]運(yùn)用RF模型對(duì)238例接受胃鏡篩查的肝硬化患者,通過(guò)分析與EV相關(guān)的臨床數(shù)據(jù),并采用了新的命名為EVendo的評(píng)分法,其識(shí)別EV、需治療的靜脈曲張(varices needing treatment, VNT)的靈敏度/特異度/AUC分別達(dá)到92.3%/65.9%/0.82、100.0%/49.3%/0.75,可使30.5%的患者免于胃鏡檢查(僅2.8%的VNT患者有錯(cuò)誤分類風(fēng)險(xiǎn)),因此根據(jù)該新評(píng)分系統(tǒng)可以幫助低風(fēng)險(xiǎn)的VNT患者避免不必要的胃鏡檢查。目前關(guān)于人工智能在食管靜脈曲張?jiān)\斷的研究較少,未來(lái)還需要進(jìn)一步深入研究。
綜上所述,在肝臟疾病方面,AI可以預(yù)測(cè)患者肝纖維化風(fēng)險(xiǎn),使部分低風(fēng)險(xiǎn)患者避免肝活檢;可以幫助低風(fēng)險(xiǎn)的VNT患者避免不必要的胃鏡檢查。在胰腺疾病方面,AI相較于傳統(tǒng)的EUS、EUS-FNA可提高對(duì)胰腺癌的診斷準(zhǔn)確性。此外,AI對(duì)于疾病嚴(yán)重程度的回歸分析及患者預(yù)后情況評(píng)估的生存分析等方面均有涉及。但AI技術(shù)仍有需要改進(jìn)的地方,目前缺乏用于醫(yī)學(xué)影像數(shù)據(jù)分析的ML高質(zhì)量數(shù)據(jù)集,大多數(shù)用于開(kāi)發(fā)ML算法的依據(jù)來(lái)源于臨床前研究,尚未廣泛用于臨床實(shí)踐,并且各研究所采用的算法層出不窮,尚無(wú)研究證明何種算法最適合于此類研究。盡管AI技術(shù)可以做出準(zhǔn)確預(yù)測(cè),但AI不可能完全取代醫(yī)務(wù)工作者,醫(yī)務(wù)工作者最終將結(jié)合AI和患者主觀意愿、實(shí)際情況、倫理等做出合適決策。
作者貢獻(xiàn)聲明:龔航負(fù)責(zé)課題設(shè)計(jì),資料分析,撰寫(xiě)論文;黃忠參與臨床資料收集,修改論文;劉先麗負(fù)責(zé)擬定寫(xiě)作思路,指導(dǎo)撰寫(xiě)文章并最后定稿。
表2 AI在肝纖維化診斷中的應(yīng)用