孫惠昕 綜述 賈海晗,王婉瑩, 宋冰冰 審校
150081 哈爾濱,哈爾濱醫(yī)科大學(xué)腫瘤防治研究所(孫惠昕、 宋冰冰);150081 哈爾濱,黑龍江省醫(yī)學(xué)科學(xué)院(孫惠昕、 宋冰冰);150081 哈爾濱,黑龍江省癌癥中心(孫惠昕、賈海晗、王婉瑩、宋冰冰)
最新數(shù)據(jù)顯示[1],2018年全球新增1 810萬癌癥病例,新增970萬死亡病例。全球癌癥防控形勢仍十分嚴(yán)峻,從側(cè)面反映了全球人口老齡化、日益增長的人口數(shù)量以及癌癥的流行變化及主要風(fēng)險因素的分布。《健康中國行動(2019~2030)》指出,根據(jù)篩查手段和技術(shù)方案比較成熟的重點高發(fā)癌癥,要制定癌癥篩查與早診早治指南,各地根據(jù)本地區(qū)癌癥流行狀況,創(chuàng)造條件普遍開展癌癥機(jī)會性篩查。目前,癌癥的早診早治工作被認(rèn)為可以降低癌癥死亡率和延長癌癥患者生存時間。人工智能(artificial intelligence, AI)亦稱智械、機(jī)器智能,指由人制造出來的機(jī)器所表現(xiàn)出來的智能。通常AI是指通過普通計算機(jī)程序來呈現(xiàn)人類智能的技術(shù)。AI在醫(yī)學(xué)領(lǐng)域的應(yīng)用范圍很廣,包括醫(yī)藥研究、病理診斷、放療技術(shù)、癌癥篩查等[2]。本文將圍繞癌癥篩查的相關(guān)內(nèi)容,就AI在不同癌癥篩查中的研究現(xiàn)狀進(jìn)行介紹和分析。
肺癌是目前發(fā)病率和死亡率最高的癌癥,目前肺癌的早期篩查是通過評估出高危人群后進(jìn)行低劑量螺旋CT檢查。目前大多數(shù)醫(yī)院是采用傳統(tǒng)人工閱片的方式進(jìn)行臨床診斷,每位篩查患者的CT圖像很多,再加上每天大量的臨床篩查患者,臨床醫(yī)生工作量會很大,人工閱片的方法顯然不適合當(dāng)今的AI時代。劉曉鵬等[3]研究結(jié)果顯示,AI和人工讀片分別讀取5 mm層厚的相同CT片,AI對肺癌結(jié)節(jié)的檢出率優(yōu)于人工讀片。說明通過AI自動學(xué)習(xí)早期肺癌胸部CT圖像,可以達(dá)到早期肺癌的識別,并且輔助醫(yī)生進(jìn)行臨床診斷。李欣菱等[4]基于深度學(xué)習(xí)的AI胸部CT肺結(jié)節(jié)檢測結(jié)果的研究顯示,AI能夠?qū)崿F(xiàn)惡性肺結(jié)節(jié)的診斷,與人工閱片相比,具有更高的結(jié)節(jié)檢出靈敏度,在排除微小結(jié)節(jié)后可以降低假陽性率。Hart等[5]利用基于個人健康信息的多參數(shù)人工神經(jīng)網(wǎng)絡(luò)來預(yù)測肺癌風(fēng)險,發(fā)現(xiàn)其具有較高的特異性和適度的敏感性,為臨床提供了一種經(jīng)濟(jì)有效、無創(chuàng)的診斷工具。同樣Duan等[6]比較了人工神經(jīng)網(wǎng)絡(luò)模型與4種腫瘤生物標(biāo)志物在肺癌篩查中的作用,腫瘤標(biāo)志物的判別分析和人工神經(jīng)網(wǎng)絡(luò)模型預(yù)測的ROC曲線分別為0.67(95%CI:0.569~0.761)和0.76(95%CI:0.664~0.840)。人工神經(jīng)網(wǎng)絡(luò)模型對肺癌的預(yù)測優(yōu)于腫瘤標(biāo)志物的判別分析,為肺癌的診斷提供了一種優(yōu)秀的智能化診斷工具。相關(guān)研究發(fā)現(xiàn)[7],根據(jù)相關(guān)函數(shù)和指標(biāo)建立預(yù)測肺癌模型,利用圖像數(shù)據(jù)庫聯(lián)盟和圖像數(shù)據(jù)庫資源計劃提供的圖像診斷肺結(jié)節(jié)的方法, 準(zhǔn)確率為93.19%,敏感性為92.75%,特異性為93.33%。該研究團(tuán)隊認(rèn)為該方法具有良好的檢測效果,由于早期發(fā)現(xiàn)病變可使治療干預(yù)更快,從而對患者預(yù)后更有利。AI技術(shù)在肺癌早期篩查、病理診斷和分類方面都取得了一定的研究進(jìn)展,證實了AI技術(shù)在肺癌早期診斷中的可行性,但需要科研工作者建立自己的數(shù)據(jù)庫和行業(yè)標(biāo)準(zhǔn),使AI在肺癌篩查中的應(yīng)用發(fā)展走得更遠(yuǎn)。
乳腺癌是女性最常見的癌癥,嚴(yán)重威脅著女性健康,乳腺癌的早期篩查與患者的預(yù)后密切相關(guān)[8]。因此,將AI應(yīng)用于乳腺癌的篩查和檢測具有重要的意義,不僅可以為超聲科醫(yī)生節(jié)省時間,也可以彌補(bǔ)一些初學(xué)者的經(jīng)驗和技能不足[9]。相關(guān)研究顯示[10],在計算機(jī)輔助下從超聲彈性成像和B超提取雙模態(tài)特征,包括B超提取5個形態(tài)學(xué)特征和超聲彈性成像提取3個彈性特征,結(jié)果顯示通過計算機(jī)輔助方法鑒別乳腺良惡性腫瘤和是否出現(xiàn)淋巴結(jié)轉(zhuǎn)移有一定的參考價值。根據(jù)算法功能和形式的相似性,AI學(xué)習(xí)一般包括支持向量機(jī)、模糊邏輯、人工神經(jīng)網(wǎng)絡(luò)等。AI學(xué)習(xí)中提取和訓(xùn)練的特征越多,識別效率越高,Silva 等[11]對乳腺腫瘤的初篩結(jié)果表明,研究中所有22個特征所獲得的結(jié)果判斷優(yōu)于減少特征集的學(xué)習(xí)。在不久的將來,我們相信AI在乳腺超聲中不僅可以區(qū)分乳腺腫塊的良惡性,還可以進(jìn)一步對乳腺腫塊的炎癥性、纖維增生等特異性良性疾病進(jìn)行分類。此外,AI在超聲中還可以預(yù)測乳腺癌患者腫瘤淋巴結(jié)轉(zhuǎn)移的分級、預(yù)后及治療反應(yīng)。AI在超聲中區(qū)分乳腺良惡性病變的準(zhǔn)確性可能不僅基于B超圖像,還可以結(jié)合其他先進(jìn)技術(shù)的圖像,如A彈性成像、超聲造影等[12]。AI獲得較好的應(yīng)用是醫(yī)學(xué)影像學(xué)領(lǐng)域,醫(yī)學(xué)影像學(xué)正是診斷乳腺癌的重要工具,相信不久的將來越來越多的醫(yī)生和乳腺癌患者能夠從AI的進(jìn)步中獲益[13]。
手術(shù)切除被認(rèn)為是早期胃癌的根治性治療手段,術(shù)后早期胃癌的5年生存率可達(dá)到90%,因此加強(qiáng)早期胃癌的診斷和篩查對患者具有重要意義[14]。相關(guān)研究顯示[15],通過建立最優(yōu)的數(shù)據(jù)挖掘模型對篩查人群進(jìn)行初步篩選,對篩選的胃癌高?;颊哌M(jìn)行進(jìn)一步的內(nèi)鏡檢查加病理活檢確診,這種早期胃癌分級篩查策略具有良好的依從性和較低的成本,很容易在臨床實踐中增加早期胃癌的篩查覆蓋率。Miyaki等[16]開發(fā)的軟件可以自動區(qū)分癌變區(qū)和非癌區(qū)。作者使用了一個特征袋框架和密集采樣尺度不變特征變換描述符來放大智能電子分光(flexible spectral imaging color enhancement,FICE)圖像,并用46例粘膜內(nèi)胃癌對模型進(jìn)行了驗證,計算機(jī)輔助診斷系統(tǒng)診斷癌癥的準(zhǔn)確率為86%,靈敏度為85%,特異性為87%。2018年,Hirasawa等[17]基于單次發(fā)射多盒探測器結(jié)構(gòu)構(gòu)建了網(wǎng)絡(luò)學(xué)習(xí)模型。作者使用13 584張內(nèi)鏡圖像訓(xùn)練該網(wǎng)絡(luò)學(xué)習(xí)模型,并使用從69例77個胃癌病變的患者中收集的2 296張胃癌圖像測試集評估其性能。該模型分析2 296張檢測圖像耗時47 s,正確診斷了71/77個胃癌病變,總靈敏度為92%。這個構(gòu)建用于早期胃癌檢測的網(wǎng)絡(luò)學(xué)習(xí)模型在很短的時間內(nèi)處理了大量存儲的具有臨床相關(guān)診斷能力的內(nèi)鏡圖像,有可能在實時胃鏡檢查中發(fā)揮作用。Kubota等[18]針對344例胃癌患者的內(nèi)鏡圖像,利用反向傳播神經(jīng)網(wǎng)絡(luò)算法對其進(jìn)行了胃壁浸潤深度分析,開發(fā)了計算機(jī)輔助設(shè)計(computer aided design,CAD)系統(tǒng)。他們的交叉驗證評估顯示,該系統(tǒng)對T1、T2、T3和T4期胃癌的診斷準(zhǔn)確率分別為77%、49%、51%和55%。其中粘膜內(nèi)癌(T1a)和粘膜下浸潤癌(T1b)的準(zhǔn)確率為69%,該研究可能在不久的將來用到早期胃癌的篩查。
皮膚是人體最大的器官,和身體其他部位一樣,皮膚細(xì)胞也會異常生長,導(dǎo)致皮膚癌變。 由于黑色素瘤的高發(fā)病率和死亡率,黑色素瘤的早期診斷已經(jīng)成為一個極其重要的問題[19]。相關(guān)研究[20]提出的自動算法包括以下步驟:圖像增強(qiáng)、病灶分割、特征提取、選擇以及分類。該算法已經(jīng)在300張皮膚鏡圖像上進(jìn)行了測試,準(zhǔn)確率達(dá)到92%,表明該方法能夠正確地對大部分黑色素細(xì)胞病變進(jìn)行分類。該算法不僅有助于準(zhǔn)確診斷皮膚痣的類型,而且可以減少活檢的次數(shù),降低與皮膚病變切除相關(guān)疾病的發(fā)病率。Rofman等[21]基于個人健康管理數(shù)據(jù)提出了一個多參數(shù)的人工神經(jīng)網(wǎng)絡(luò)系統(tǒng),可以用來預(yù)測和分析非黑素瘤皮膚癌的風(fēng)險。他們的研究結(jié)果具有臨床說服力,原因如下:首先,多參數(shù)的人工神經(jīng)網(wǎng)絡(luò)系統(tǒng)在大數(shù)據(jù)庫中對463 080名受訪者進(jìn)行了訓(xùn)練和驗證,并在另一個數(shù)據(jù)庫對28 058名受訪者進(jìn)行了進(jìn)一步的測試;其次,所開發(fā)的多參數(shù)人工神經(jīng)網(wǎng)絡(luò)能夠在具有良好的特異性的同時,以較高的靈敏度評估非黑素瘤皮膚癌的風(fēng)險。該研究根據(jù)癌癥風(fēng)險將患者分為3類:高、中、低,提供臨床決策支持和個性化的癌癥風(fēng)險管理。因此,該研究的模型是一個預(yù)測模型,臨床醫(yī)生可以獲得信息和患者的風(fēng)險狀態(tài),從而早期發(fā)現(xiàn)和預(yù)防非黑素瘤皮膚癌。AI在通過圖像診斷黑色素瘤方面優(yōu)于皮膚科醫(yī)生。由于黑色素瘤中致癌突變的累積性,更早期形態(tài)的演變很可能被AI算法檢測到。相關(guān)研究通過黑色素瘤的演變進(jìn)一步探討了黑色素瘤的早期預(yù)測。作者發(fā)現(xiàn)在黑色素瘤發(fā)生前可以預(yù)測黑色素瘤,以前瞻性圖像數(shù)據(jù)為訓(xùn)練對象的AI可能會診斷出更多的黑色素瘤早期病變[22-23]。
在美國,前列腺癌是最常見的癌癥之一,在男性中前列腺癌死亡率僅次于肺癌。根據(jù)2016年統(tǒng)計數(shù)據(jù)顯示,約有180 890名新發(fā)病例,約有26 120名患者死于前列腺癌[24]。前列腺癌的診斷金標(biāo)準(zhǔn)是穿刺活檢,但是穿刺活檢是一種有創(chuàng)檢查,所以近年來計算機(jī)輔助診斷技術(shù)在前列腺癌的早期診斷中的相關(guān)研究逐漸增多[25-26]。Reda等[27]基于計算機(jī)輔助診斷技術(shù)將磁共振彌散加權(quán)成像(diffusion-weighted magnetic resonance imaging,DW-MRI)和前列腺特異抗原(prostate specific antigen,PSA)檢查結(jié)果輸入到自動編碼器中,通過2級分類網(wǎng)絡(luò)確定前列腺的最終診斷為良性或惡性。最終總的分類準(zhǔn)確率、敏感性和特異性分別為94.4%、88.9%和100%。該系統(tǒng)可作為前列腺癌早期診斷的有力工具。該工具作為臨床決策支持系統(tǒng)具有很大的潛力。利用該系統(tǒng)可以避免不必要的前列腺活檢,降低診斷成本和診斷方法的并發(fā)癥。還有研究顯示表面增強(qiáng)拉曼光譜(surface-enhanced raman spectroscopy,SERS)與支持向量機(jī)聯(lián)合檢測外周血能成功地應(yīng)用于早期列腺癌的篩查。首先建立3種支持向量機(jī)分類器模型,包括線性、多項式和核函數(shù),并利用實測的血清SERS進(jìn)行評價,結(jié)果顯示外周血SERS將為前列腺癌的早期無創(chuàng)篩查開辟一條新的途徑[28]。未來工作的重點將增加學(xué)習(xí)和評價CAD系統(tǒng)的參與人數(shù),以增強(qiáng)和確認(rèn)研究結(jié)果的穩(wěn)定性。未來的另一項工作是獲取更高擴(kuò)散梯度因子(b值)的DWI-MRI數(shù)據(jù)集,以檢查它們對系統(tǒng)準(zhǔn)確性的影響[29]。
最新全球癌癥統(tǒng)計報告顯示[30],結(jié)直腸癌發(fā)病率在人群中排名第3,死亡率排名第2。5年相對生存率I期患者可達(dá)90.3%,因此結(jié)直腸癌的早期診斷和治療顯得尤為重要。結(jié)腸鏡檢查和切除腺瘤性息肉可降低結(jié)直腸癌的死亡率,這已在許多后續(xù)研究中得到證實[31]。因此,許多相關(guān)指南推薦結(jié)腸鏡檢查作為首選的結(jié)直腸癌篩查策略[32]。隨著深層神經(jīng)網(wǎng)絡(luò)和機(jī)器學(xué)習(xí)算法的發(fā)展,使AI在圖像和視頻分析中具有很高的效率。用于結(jié)腸鏡檢查的計算機(jī)輔助系統(tǒng)-神經(jīng)網(wǎng)絡(luò)模型可以幫助內(nèi)鏡檢查息肉和進(jìn)行光學(xué)診斷。這些基于AI的模型在提高腺瘤檢出率和降低增生性息肉切除成本方面具有巨大潛力。AI學(xué)習(xí)通過使用數(shù)千張結(jié)腸鏡圖像進(jìn)行訓(xùn)練,以識別和區(qū)分增生性息肉和腺瘤性息肉[33]。據(jù)估計,如果能夠在早期檢測出更多的腺瘤,就會降低結(jié)直腸癌發(fā)生的風(fēng)險[34]。Urban等[35]使用深度學(xué)習(xí)模型,利用深度卷積神經(jīng)網(wǎng)絡(luò)測試計算機(jī)輔助圖像的分析能力,結(jié)果顯示其檢測結(jié)直腸息肉的準(zhǔn)確率為96.4%,ROC曲線為0.991,說明該模型可以很好地提高腺瘤檢出率并降低腺瘤的漏診率。計算機(jī)輔助系統(tǒng)和AI技術(shù)如深度學(xué)習(xí)可以加快對大量圖像數(shù)據(jù)的處理,并有可能幫助臨床醫(yī)生進(jìn)行決策,如結(jié)直腸息肉的檢測和分類[36-37]。利用AI的應(yīng)用程序數(shù)量將在未來幾年內(nèi)隨著計算能力的提高和復(fù)雜的決策算法而不斷增加。避免訓(xùn)練數(shù)據(jù)中的各種偏差是建立精確計算機(jī)輔助系統(tǒng)模型的關(guān)鍵[38]。
Tamashiro等[39]收集了5 403張來自日本東京癌癥研究所醫(yī)院的咽部202例淺表性癌和45例晚期癌的訓(xùn)練圖像。利用這些圖像,作者開發(fā)了一個基于卷積神經(jīng)網(wǎng)絡(luò)的AI診斷系統(tǒng)。并且準(zhǔn)備了來自40位口咽癌患者和40位非口咽癌患者的1 912張驗證圖像來評估系統(tǒng)?;贏I的診斷系統(tǒng)正確地檢測到了癌癥患者的所有咽部癌病變(40/40),包括3個小于10 mm的小病變。對于每張圖像,基于AI的診斷系統(tǒng)通過窄帶成像內(nèi)鏡(narrow band imaging,NBI)獲得的圖像正確地檢測到咽癌,靈敏度為85.6%,明顯高于通過白光成像獲得的圖像(70.1%)。新的診斷系統(tǒng)僅用28 s就分析了1 912幅驗證圖像。急性淋巴細(xì)胞白血病是一種起源于B系或T系淋巴祖細(xì)胞的腫瘤性疾病,它可以迅速擴(kuò)散到身體的不同部位。ALL分為L1、L2和L3三種類型,是通過病理學(xué)家對血液和骨髓涂片的篩查發(fā)現(xiàn)的。但人工檢測血樣既費時又枯燥,而且受人為失誤風(fēng)險的限制。相關(guān)研究提出了一種自動檢測方法,利用模糊c均值聚類算法對細(xì)胞核進(jìn)行分割。然后從核中得到一組豐富的特征,包括幾何特征、一階和二階統(tǒng)計特征。采用主成分分析法降低特征矩陣維數(shù),最后將不同內(nèi)核函數(shù)和參數(shù)的支持向量機(jī)分類器應(yīng)用于細(xì)胞分類,將細(xì)胞分為4組,即非癌細(xì)胞、L1、L2和L3。結(jié)果表明,該方法可作為實驗室輔助診斷工具[40]。Forghani等[41]利用雙能CT紋理分析和AI機(jī)器學(xué)習(xí)模型預(yù)測頸部淋巴結(jié)病變,該研究對87例頭頸部鱗狀細(xì)胞癌患者進(jìn)行了評估。在65 kev或40~140 kev的多能量虛擬單色圖像下,對虛擬單色圖像進(jìn)行紋理特征提取,除了單獨的隨機(jī)選擇訓(xùn)練和測試外,還構(gòu)建了隨機(jī)森林模型,用于內(nèi)部交叉驗證的結(jié)果預(yù)測。使用該模型對頭頸部鱗狀細(xì)胞癌患者的診斷可分別獲得88%、100%、67%和83%的準(zhǔn)確性、敏感性、特異性。該研究指出通過AI學(xué)習(xí)可用于預(yù)測頸淋巴結(jié)轉(zhuǎn)移,具有較高的準(zhǔn)確性。
隨著近年來云計算、大數(shù)據(jù)、互聯(lián)網(wǎng)等信息技術(shù)的快速發(fā)展,AI通過人機(jī)協(xié)同、深度學(xué)習(xí)、自主操控等技術(shù)在醫(yī)學(xué)領(lǐng)域快速發(fā)展,在癌癥篩查中的作用尤其突出。未來“AI+”癌癥篩查將成為醫(yī)療服務(wù)的重要手段,可能代替醫(yī)生做出更精準(zhǔn)、更有效的診斷,從而提高醫(yī)療服務(wù)質(zhì)量,緩解醫(yī)療壓力,促進(jìn)癌癥篩查的不斷發(fā)展與進(jìn)步。
作者聲明:本文全部作者對于研究和撰寫的論文出現(xiàn)的不端行為承擔(dān)相應(yīng)責(zé)任;并承諾論文中涉及的原始圖片、數(shù)據(jù)資料等已按照有關(guān)規(guī)定保存,可接受核查。
學(xué)術(shù)不端:本文在初審、返修及出版前均通過中國知網(wǎng)(CNKI)科技期刊學(xué)術(shù)不端文獻(xiàn)檢測系統(tǒng)的學(xué)術(shù)不端檢測。
同行評議:經(jīng)同行專家雙盲外審,達(dá)到刊發(fā)要求。
利益沖突:所有作者均聲明不存在利益沖突。
文章版權(quán):本文出版前已與全體作者簽署了論文授權(quán)書等協(xié)議。