曹海燕 何 松
重慶醫(yī)科大學(xué)附屬第二醫(yī)院消化內(nèi)科(400010)
21世紀(jì)初以色列Given Imaging公司生產(chǎn)出世界上第一臺(tái)無(wú)線膠囊內(nèi)鏡(capsule endoscope, CE),即M2A CE,自此開創(chuàng)了小腸可視化檢查的新時(shí)代。2004年我國(guó)自主研發(fā)的CE獲得國(guó)家藥品監(jiān)督管理局批準(zhǔn)。CE具有無(wú)創(chuàng)性、無(wú)需麻醉、無(wú)交叉感染、患者耐受性好等優(yōu)點(diǎn),現(xiàn)已廣泛應(yīng)用于臨床。近年來(lái),CE在各領(lǐng)域都取得了突破性進(jìn)展,膠囊食管鏡、磁控膠囊胃鏡以及膠囊結(jié)腸鏡的誕生,使消化道內(nèi)鏡檢查更為便利。同時(shí),利用CE進(jìn)行活檢、給藥、感知消化道內(nèi)部壓力和pH值等指標(biāo)、智能導(dǎo)航等新技術(shù)不斷開發(fā),更有利于腸道疾病的早發(fā)現(xiàn)和早診斷。CE對(duì)小腸疾病,如克羅恩病、不明原因消化道出血(obscure gastrointestinal bleeding, OGIB)、小腸息肉和腫瘤、乳糜瀉、遺傳性息肉病綜合征等具有較高的診斷價(jià)值[1-2]。然而一次CE檢查產(chǎn)生約6萬(wàn)張圖像[3],篩選病變圖像耗時(shí)、枯燥,且受醫(yī)師經(jīng)驗(yàn)和專業(yè)技術(shù)水平影響,易造成漏診。因此,亟待研發(fā)能自動(dòng)檢測(cè)腸道病變的系統(tǒng)以解決上述問(wèn)題,提高病變檢出率和醫(yī)務(wù)工作者的效率。近年來(lái),人工智能(artificial intelligence, AI)逐漸深入醫(yī)學(xué)領(lǐng)域,以大數(shù)據(jù)和云計(jì)算為基礎(chǔ)的計(jì)算機(jī)輔助診斷技術(shù)成為臨床研究熱點(diǎn)。本文就AI技術(shù)在CE圖像識(shí)別中的應(yīng)用進(jìn)展進(jìn)行綜述,以期提高臨床和內(nèi)鏡醫(yī)師對(duì)相關(guān)知識(shí)的認(rèn)知,從而為AI技術(shù)在消化道疾病內(nèi)鏡診治中的推廣應(yīng)用奠定基礎(chǔ)。
AI的概念最早于1956年由美國(guó)科學(xué)家McCarthy等[4]在Dartmouth會(huì)議上提出。AI是指使用計(jì)算機(jī)模擬、拓展和延伸人的某些思維過(guò)程和智能行為的學(xué)科,其主要研究領(lǐng)域包括機(jī)器人、語(yǔ)言識(shí)別、圖像識(shí)別、自然語(yǔ)言處理、專家系統(tǒng)等。DL通過(guò)自動(dòng)提取文本信息、聲音信號(hào)、圖像、視頻等數(shù)據(jù)特征,并在歷史數(shù)據(jù)的基礎(chǔ)上發(fā)展成一套獨(dú)特的算法,是AI的一個(gè)新研究領(lǐng)域,其在醫(yī)學(xué)領(lǐng)域中的應(yīng)用為更詳細(xì)的醫(yī)學(xué)圖像分析開辟了新途徑[5]。不同于傳統(tǒng)機(jī)器學(xué)習(xí)通過(guò)手工提取圖像的邊界、紋理、強(qiáng)度、顏色、時(shí)空特征等信息進(jìn)行特征訓(xùn)練,DL需保證圖像的完整性和準(zhǔn)確性才能避免遺漏病變[6]。DL系以模仿動(dòng)物神經(jīng)系統(tǒng)來(lái)創(chuàng)建自身神經(jīng)網(wǎng)絡(luò),其中卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network, CNN)是一種需最少預(yù)處理的DL模型,由一系列卷積層、池化層和連接層構(gòu)成,在提取圖像時(shí)具有更高的效率。據(jù)相關(guān)研究報(bào)道,目前在CNN單模型中,LeNet5、AlexNet、VGG-Net和GoogLeNet已能獲得較準(zhǔn)確的圖像識(shí)別結(jié)果[7-10]。
近年來(lái),AI的圖像識(shí)別功能已應(yīng)用于病理學(xué)[11]、放射學(xué)[12]、皮膚病學(xué)[13]等學(xué)科。Shen等[14]通過(guò)系統(tǒng)性回顧比較AI與臨床醫(yī)師對(duì)疾病的診斷效力,涉及的學(xué)科領(lǐng)域包括眼科學(xué)、皮膚病學(xué)、放射學(xué),結(jié)果表明AI優(yōu)于經(jīng)驗(yàn)不足的臨床醫(yī)師。在消化病學(xué)領(lǐng)域,大多數(shù)AI研究集中于胃腸道炎癥、腫瘤和息肉、出血、肝纖維化評(píng)估以及胰腺炎與胰腺癌的鑒別診斷等[15]。在消化內(nèi)鏡方面,我國(guó)較早利用CNN模型的是Wang等[16]將之用于識(shí)別結(jié)腸息肉,該團(tuán)隊(duì)利用1 290例患者的結(jié)腸鏡檢查圖像進(jìn)行訓(xùn)練學(xué)習(xí),再利用新納入的1 138例患者的27 113張圖像進(jìn)行驗(yàn)證,結(jié)果顯示其敏感性、特異性和受試者工作特征(ROC)曲線下面積(AUC)分別為94.38%、95.92%和0.984,提示CNN模型有助于提高結(jié)腸息肉和腺瘤的檢出率。因此,未來(lái)基于DL的計(jì)算機(jī)輔助診斷將逐漸顯露優(yōu)勢(shì)。
1. CE的定位識(shí)別功能:CE作為一種非侵入性成像手段,類似于一臺(tái)“微型相機(jī)”在整個(gè)消化道內(nèi)連續(xù)拍攝,因此可捕捉全消化道管腔內(nèi)圖像。如要特異性地檢測(cè)小腸病變,必須先識(shí)別小腸的起止點(diǎn)。Zou等[17]開發(fā)了基于深度CNN的CE分類系統(tǒng)(deep CNN-based CE classification system, DCNN-CE-CS)用于區(qū)分消化道器官,其利用25例患者約100萬(wàn)張CE圖像進(jìn)行訓(xùn)練,通過(guò)測(cè)試準(zhǔn)確性可達(dá)到95%,且該系統(tǒng)對(duì)CE圖像受個(gè)體和復(fù)雜的消化道環(huán)境影響(包括旋轉(zhuǎn)、圖像亮度變化等)具有很強(qiáng)的魯棒性(即控制系統(tǒng)在一定的參數(shù)攝動(dòng)下維持其他某些性能的特性)。徐蘭猛[18]利用DL中的Caffe框架對(duì)不同消化道器官部位的圖像數(shù)據(jù)進(jìn)行訓(xùn)練測(cè)試,構(gòu)建小腸定位識(shí)別模型,通過(guò)驗(yàn)證,該定位模型對(duì)小腸的識(shí)別率均值達(dá)到96.39%,對(duì)臨床疾病診斷具有一定的輔助意義。
CE經(jīng)口吞入后,借助人體運(yùn)動(dòng)、重力以及腸道蠕動(dòng)通過(guò)消化道,最后隨腸液、食糜以及糞便排出體外。小腸全長(zhǎng)約5~7米,受人體復(fù)雜內(nèi)環(huán)境的影響,CE運(yùn)行時(shí)間長(zhǎng),臨床難以做到實(shí)時(shí)監(jiān)控,因此對(duì)小腸CE位置的判斷尤為重要。2017年Dimas等[19]發(fā)表的基于神經(jīng)網(wǎng)絡(luò)的研究利用視覺里程表通過(guò)識(shí)別連續(xù)的CE視頻幀來(lái)估算CE在胃腸道中的實(shí)際行程。視覺里程表完成機(jī)器人導(dǎo)航任務(wù)是通過(guò)一個(gè)(單目里程表)或2個(gè)(立體里程表)攝像頭收集的視覺信息使機(jī)器人了解其位置和方位,從而在已知或未知環(huán)境中導(dǎo)航。該項(xiàng)研究最低的平均定位誤差為(2.70±1.62) cm,為精準(zhǔn)識(shí)別病變以及后續(xù)開展體內(nèi)、外治療提供了新途徑。
2. 提高腸道可視性:腸道清潔質(zhì)量對(duì)CE的可視性尤為重要,既往研究表明,不充足的腸道準(zhǔn)備可能會(huì)導(dǎo)致35%~42%的結(jié)腸腺瘤漏檢率[20-21]。武漢大學(xué)人民醫(yī)院開發(fā)了一款用于結(jié)直腸腸道清潔度評(píng)分的AI系統(tǒng)EndoAngel?,在對(duì)120張結(jié)腸圖像的人機(jī)測(cè)試中,準(zhǔn)確性可達(dá)93.33%,明顯高于內(nèi)鏡醫(yī)師評(píng)估;但在對(duì)100張有氣泡干擾的圖像進(jìn)行評(píng)估時(shí),其準(zhǔn)確性僅有80%[22]。該研究結(jié)果提示,腸道準(zhǔn)備的充分性可直接影響AI篩查病變的準(zhǔn)確性。同理,對(duì)于CE視頻成像,膽汁、食物殘?jiān)?、氣泡以及液體量等非信息幀均會(huì)直接影響內(nèi)鏡醫(yī)師的視野。此外,CE不規(guī)則運(yùn)動(dòng)產(chǎn)生的冗雜信息幀也會(huì)影響整個(gè)視野的清晰度[23]。
Seguí等[24]介紹了一種利用小腸運(yùn)動(dòng)特點(diǎn)的分類方法解決腸腔內(nèi)成像問(wèn)題,研究采用隨機(jī)分層方法從數(shù)據(jù)庫(kù)中分別抽取CE圖像作為訓(xùn)練集和測(cè)試集,通過(guò)對(duì)食糜、氣泡、清晰的斑點(diǎn)、褶皺以及腸壁等的識(shí)別對(duì)視野進(jìn)行清晰定位,準(zhǔn)確性達(dá)到96%。Yuan等[25]利用DL模型對(duì)氣泡、渾濁以及清晰圖像等的識(shí)別亦獲得了較高的準(zhǔn)確性。因此,內(nèi)鏡醫(yī)師在回顧閱片時(shí),將冗雜信息剔除后,可做到更快速、準(zhǔn)確地定位病變。
3. 對(duì)小腸常見病灶的識(shí)別功能:因小腸疾病的病灶大小、表面紋理、邊界、密度、顏色等呈個(gè)體化差異表現(xiàn),加之腸道準(zhǔn)備質(zhì)量、CE亮度、拍攝視角等諸多因素的影響,CE對(duì)小腸病變的甄別有一定難度。在DL模型應(yīng)用之前,計(jì)算機(jī)對(duì)病變的識(shí)別大多采用人工提取特征的方式,如顏色直方圖、尺度不變特征轉(zhuǎn)換、離散小波變換、輪廓轉(zhuǎn)換以及支持向量機(jī)等,采用上述方法的研究多基于較小型的數(shù)據(jù)庫(kù),不能確保每次均能完整提取信息,存在需反復(fù)提取信息、耗時(shí)長(zhǎng)、費(fèi)用高、普適性差等缺點(diǎn)[26]。較之傳統(tǒng)的機(jī)器學(xué)習(xí),DL模型更智能化,能自動(dòng)提取更多像素級(jí)別的病變細(xì)節(jié)和特征,從而更好地適應(yīng)復(fù)雜的人體和臨床環(huán)境。
CE圖像通??煞诸悶檎?、炎癥、潰瘍、出血、血管疾病、突出病變、淋巴管擴(kuò)張、淋巴濾泡增生、憩室、寄生蟲等[27]。近期發(fā)表的一項(xiàng)涉及中國(guó)77個(gè)醫(yī)療中心的回顧性研究[28]利用ImageNet獲取預(yù)處理模型,將在此模型基礎(chǔ)上發(fā)展而來(lái)的ResNet模型用于訓(xùn)練1 970例患者的158 235張CE圖像,分別由20名消化科醫(yī)師和CNN模型對(duì)5 000例患者的1億余張圖像進(jìn)行驗(yàn)證,分析顯示消化科醫(yī)師對(duì)小腸疾病的敏感性僅為76.89%,CNN模型的敏感性則高達(dá)99.90%,差異有統(tǒng)計(jì)學(xué)意義,而且后者將平均閱片時(shí)間從96.6 min縮短至5.9 min,工作效率明顯提高。但CNN模型對(duì)圖像的解釋標(biāo)準(zhǔn)尚不確定,其機(jī)械術(shù)語(yǔ)難以形成客觀的醫(yī)學(xué)語(yǔ)言,內(nèi)部算法亦不明確,呈“黑箱”操作模式,如應(yīng)用于臨床,診斷誤差難以解釋。未來(lái)需大量前瞻性數(shù)據(jù)對(duì)CNN用于病種分類、疾病鑒別診斷等的效能作進(jìn)一步驗(yàn)證。
①出血:小腸出血是近年來(lái)的研究熱點(diǎn),因腸道出血的紅色色調(diào)較正常黏膜區(qū)域明顯,故早期研究主要局限于使用顏色矩或顏色直方圖,亦有文獻(xiàn)報(bào)道利用可疑血液指示器(suspected blood indicator, SBI)對(duì)活動(dòng)性出血進(jìn)行快速識(shí)別,敏感性超過(guò)96%,但特異性較低(17%~65%)[29-30]。日本學(xué)者利用腸腔內(nèi)活動(dòng)性出血或血凝塊血液含量的差異研發(fā)出了ResNet50深度網(wǎng)絡(luò)結(jié)構(gòu)的CNN算法來(lái)識(shí)別血液含量,該方法檢測(cè)腸腔內(nèi)血液含量的AUC達(dá)到0.999 8,以概率0.5為臨界值,敏感性、特異性和準(zhǔn)確性分別為96.63%、99.96%和99.89%,均高于SBI檢測(cè)的相應(yīng)數(shù)據(jù)(76.92%、99.82%和99.35%),具有明顯優(yōu)勢(shì)[31]。Li等[32]對(duì)比了4種DL模型(LeNet、AlexNet、GoogLeNet、VGG-Net)識(shí)別腸道出血的效率,四者的體系結(jié)構(gòu)在輸入格式、深度和模塊方面有所不同,對(duì)12 090張?jiān)紙D像測(cè)試的準(zhǔn)確性分別為97.44%、 98.72%、100.00%和98.72%;將原始數(shù)據(jù)庫(kù)擴(kuò)大17倍后,測(cè)試準(zhǔn)確性分別為79.81%、 98.06%、 96.33%和98.65%;在訓(xùn)練階段,4種模型運(yùn)算耗時(shí)分別為3 min、2 h、5 h和36 h。上述結(jié)果表明,隨著數(shù)據(jù)庫(kù)的擴(kuò)大,運(yùn)算準(zhǔn)確性有所降低,但加深網(wǎng)絡(luò)結(jié)構(gòu)后,運(yùn)算準(zhǔn)確性和效率明顯提高。然而,神經(jīng)網(wǎng)絡(luò)存在網(wǎng)絡(luò)結(jié)構(gòu)越深、計(jì)算量越大、耗時(shí)越長(zhǎng)的缺點(diǎn),因此需要更高質(zhì)量、更大的數(shù)據(jù)庫(kù)才能保證其運(yùn)算,這往往會(huì)導(dǎo)致數(shù)據(jù)集的過(guò)度擬合,也會(huì)影響結(jié)果的準(zhǔn)確性。
胃腸道血管擴(kuò)張(gastrointestinal angiectasia, GIA)是指正常黏膜和黏膜下畸形靜脈和毛細(xì)血管發(fā)生的擴(kuò)張性病變,內(nèi)鏡下表現(xiàn)為平坦、鮮紅色病變,為OGIB的病因之一。有學(xué)者利用CNN的語(yǔ)義分割圖像算法對(duì)GIA和正常胃腸道圖像各600張進(jìn)行測(cè)試,結(jié)果顯示其敏感性和特異性分別為100%和96%[33]。但該研究是從連續(xù)的CE全長(zhǎng)視頻畫面中提取靜止幀,對(duì)所提取圖像的清晰度有要求,在臨床實(shí)踐中做到此點(diǎn)有相當(dāng)大的難度。
②潰瘍和糜爛:潰瘍和糜爛是消化道最常見的病變,多與濫用非甾體抗炎藥、克羅恩病、小腸惡性腫瘤等有關(guān),早期黏膜表現(xiàn)不明顯,病變擴(kuò)大并侵及黏膜下層、肌層、血管后,可引起出血、穿孔甚至因瘢痕形成導(dǎo)致小腸狹窄等并發(fā)癥,嚴(yán)重威脅人類健康。
Alaskar等[34]沿用已訓(xùn)練好的GoogLeNet、AlexNet模型對(duì)潰瘍和非潰瘍圖像進(jìn)行訓(xùn)練,結(jié)果顯示前者訓(xùn)練時(shí)間明顯短于后者,在學(xué)習(xí)率為0.000 1時(shí),兩者的準(zhǔn)確性均可達(dá)到100%。Wang等[35]研發(fā)了一款以ResNet-34為基礎(chǔ)、將淺層超特征與更深層特征融合的HAnet體系結(jié)構(gòu),為潰瘍?cè)\斷提供最終決策。研究利用1 416例患者的CE視頻圖像集進(jìn)行分析,最終通過(guò)HAnet驗(yàn)證,準(zhǔn)確性、敏感性和特異性均在91%以上,優(yōu)于VGG、DenseNet、Inception-ResNet-v2等DL模型以及傳統(tǒng)的機(jī)器學(xué)習(xí)方法。Klang等[36]利用CNN模型診斷克羅恩病的潰瘍病變,結(jié)果顯示準(zhǔn)確性為95.4%~96.7%,AUC達(dá)到0.99,表明CNN模型有助于解決近端回腸克羅恩病診斷困難的問(wèn)題,為L(zhǎng)ewis評(píng)分和CE克羅恩病活動(dòng)指數(shù)(CECDAI)評(píng)分提供可靠的數(shù)據(jù)支持。
③小腸息肉和腫瘤:Yuan等[25]提出了一種新的基于圖像流形約束的堆疊稀疏自動(dòng)編碼器(stacked sparse auto-encoder with image manifold constraint, SSAEIM)深度特征學(xué)習(xí)方法,采用該方法對(duì)35例患者的4 000張CE圖像進(jìn)行分析以識(shí)別結(jié)直腸息肉,總體識(shí)別準(zhǔn)確性可達(dá)98%。Li等[37]采用機(jī)器學(xué)習(xí)的方法,基于彩色紋理特征,提出了一種將均勻局部二進(jìn)制模式與小波相結(jié)合的方法描述CE圖像特征,對(duì)小腸腫瘤的識(shí)別準(zhǔn)確性達(dá)到92.4%。較之其他消化道病變,目前CNN模型用于識(shí)別小腸息肉和腫瘤的研究尚少,可能與可供訓(xùn)練的CE圖像數(shù)據(jù)集不足、小腸腫瘤較罕見等原因有關(guān)。
④乳糜瀉:乳糜瀉是一種累及小腸的自身免疫性疾病,臨床表現(xiàn)為腹瀉、腹痛、體質(zhì)量減輕、水腫等,與其他消化道疾病表現(xiàn)類似,臨床診斷較為困難;內(nèi)鏡下特征性表現(xiàn)為小腸黏膜絨毛萎縮,需通過(guò)小腸黏膜活檢確診。Zhou等[38]利用GoogLeNet模型對(duì)6例乳糜瀉患者和5名對(duì)照者的小腸CE視頻圖像進(jìn)行訓(xùn)練,并以5例乳糜瀉患者和5名對(duì)照者進(jìn)行驗(yàn)證,敏感性和特異性均達(dá)到100%,具有統(tǒng)計(jì)學(xué)意義。但該試驗(yàn)為臨床前研究,樣本量較小,其結(jié)果需前瞻性大數(shù)據(jù)庫(kù)研究證實(shí)。Wang等[39]利用局部通道特征圖的顯著特征研發(fā)出一款新型重新校準(zhǔn)模塊,并將其嵌入ResNet50、Inception-v3 DL模型中,結(jié)果表明其診斷乳糜瀉的準(zhǔn)確性、敏感性、特異性分別為95.94%、97.20%和95.63%。
⑤寄生蟲:腸道常見的寄生蟲為鉤蟲,多見于熱帶和亞熱帶地區(qū),據(jù)統(tǒng)計(jì)全球每年約有6億人感染,嚴(yán)重威脅人類健康[40]。鉤蟲的形狀、寬度以及彎曲程度給自動(dòng)檢測(cè)帶來(lái)了巨大的挑戰(zhàn)。He等[41]提出了深層鉤蟲檢測(cè)框架(deep hookworm detection framework, DHDF),利用邊緣提取網(wǎng)絡(luò)和鉤蟲分類網(wǎng)絡(luò)兩種CNN模型診斷鉤蟲感染,最終診斷準(zhǔn)確性和敏感性分別為88.5%和84.6%。
綜上所述,CE是檢測(cè)小腸病變的主要手段。隨著計(jì)算機(jī)算法的日益豐富和智能化,DL模型在疾病診斷中的應(yīng)用逐漸增多,以CNN為代表的DL模型對(duì)病灶具有快速識(shí)別能力,可有效降低漏診率,用于CE的診斷取得了較大突破。目前,諸多研究對(duì)AI在CE圖像識(shí)別中的應(yīng)用進(jìn)行探索,對(duì)比分析AI與傳統(tǒng)機(jī)器學(xué)習(xí)以及不同DL模型之間的差異,通過(guò)訓(xùn)練、驗(yàn)證、測(cè)試,大多數(shù)模型可獲得較高的診斷敏感性、特異性和準(zhǔn)確性,為后續(xù)臨床應(yīng)用提供了豐富的素材和參考信息。隨著AI技術(shù)的不斷成熟和DL算法的不斷更新,AI將會(huì)更高效地輔助臨床醫(yī)師工作,進(jìn)而提高消化道疾病的臨床內(nèi)鏡診治水平。