高萌 楊仙鴻 姜祎群
中國醫(yī)學(xué)科學(xué)院北京協(xié)和醫(yī)學(xué)院皮膚病醫(yī)院病理科,南京210042
隨著技術(shù)發(fā)展,醫(yī)療行業(yè)正進入“大數(shù)據(jù)”的新紀元[1]。作為一門集合了計算機科學(xué)、信息學(xué)、神經(jīng)生理學(xué)等多學(xué)科智慧的新興交叉學(xué)科,人工智能(artificial intelligence,AI)在醫(yī)學(xué)領(lǐng)域可以輔助診療,減輕醫(yī)生的數(shù)據(jù)分析壓力。本文主要探討醫(yī)學(xué)領(lǐng)域AI的研究進展,同時為AI在皮膚科的研究拓寬思路,提供參考。
AI 的研究可以理解為通過智能的機器,增強人類在各項工作中的能力和效率[2]。其發(fā)展分為兩個階段。第一階段以數(shù)理邏輯和符號推理為主。第二階段從1990年代至今,以概率統(tǒng)計為主。在此階段,機器學(xué)習(xí)(machine learning)為最重要的方法領(lǐng)域,是一系列通過任務(wù)處理累積經(jīng)驗,從而自動調(diào)整參數(shù)、提高效能的算法。機器學(xué)習(xí)分為監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí)。在監(jiān)督學(xué)習(xí)中,輸入的訓(xùn)練數(shù)據(jù)由特征和標簽兩部分組成,機器分析得到兩者之間的關(guān)系,當(dāng)有特征無標簽的數(shù)據(jù)輸入后,即可得到數(shù)據(jù)標簽。監(jiān)督學(xué)習(xí)常用于圖像的自動識別和風(fēng)險評估。在無監(jiān)督學(xué)習(xí)中,樣本沒有標簽,機器發(fā)掘數(shù)據(jù)的隱藏特征并進行聚類分析,從而揭示人不易察覺的新機制,可用于探究疾病的潛在發(fā)病因素[3]。
近幾年,機器學(xué)習(xí)的分支——人工神經(jīng)網(wǎng)絡(luò)(artificial neural networks,ANN)與深度學(xué)習(xí)(deep learning)得到廣泛關(guān)注。受人類神經(jīng)系統(tǒng)的啟發(fā),ANN 仿照神經(jīng)元的連接方式建立了多層“神經(jīng)元”結(jié)構(gòu),每層“神經(jīng)元”從上層接收數(shù)據(jù)并進行計算,再將輸出值傳遞給下層。深度學(xué)習(xí)在ANN的基礎(chǔ)上進一步優(yōu)化,與ANN 相比,深度學(xué)習(xí)有更多的隱藏層,可以以分層方式,發(fā)現(xiàn)更高級別的數(shù)據(jù)特征,目前,ANN和深度學(xué)習(xí)被廣泛應(yīng)用于診斷系統(tǒng)、疾病預(yù)后評估、圖像識別等多個方面[4]。
1.圖像識別:作為重要的輔助檢查手段,醫(yī)學(xué)圖像包括X線圖像、CT圖像、病理圖像、眼底鏡圖像等,在疾病診療中起著非常重要的作用。近幾年,計算機輔助檢測(computeraided detection,CAD)在醫(yī)學(xué)圖像識別領(lǐng)域迅速發(fā)展[5]。CAD能夠發(fā)現(xiàn)圖像中的異常區(qū)域,向臨床醫(yī)生提供參考,提高病變檢出率,降低假陰性率,主要應(yīng)用于良惡性病變的鑒別以及疾病的識別。
許多團隊已成功應(yīng)用AI 進行了多種醫(yī)學(xué)圖像的檢測。如,Google Brain 團隊研發(fā)了一項自動檢測眼底照片中糖尿病性視網(wǎng)膜病變的算法,經(jīng)過9 963 張眼底圖像的驗證,其靈敏度為97.5%,特異度為93.4%,診斷能力堪比專業(yè)醫(yī)師[6]。Kooi 等[7]設(shè)計了一個獨立閱讀乳腺鉬靶X 線照片神經(jīng)網(wǎng)絡(luò)模型,經(jīng)過約45 000 幅圖像的訓(xùn)練后,該模型的AUC為0.852,檢測效能接近人類專家水平。Herweh等[8]開發(fā)了一個可通過斷層掃描圖像自動診斷急性卒中的機器學(xué)習(xí)模型,其敏感度為46.46%,特異度為94.15%,與人類專家無顯著差異。
2.遺傳學(xué)和基因組學(xué)分析:遺傳學(xué)和基因組學(xué)的變異是許多疾病的始動因素,對治療方面也有很大影響。由于基因組數(shù)據(jù)量極大,單純依靠人力很難完成分析任務(wù)。AI已被應(yīng)用于遺傳學(xué)和基因組學(xué)分析的很多方面,包括大型基因組數(shù)據(jù)集的分析,基因組序列元件注釋等[9]。
例如,IBM 公司的Watson 模型可進行與肌萎縮側(cè)索硬化(amyotrophic lateral sclerosis,ALS)相關(guān)的RNA 結(jié)合蛋白(RNA binding protein,RBP)的篩選。首先,該模型分析了所有已知的ALS 相關(guān)RBP,隨后,對基因組中1 542 個RBP 片段按照與已知RBP 的相似性進行排序,篩選出與ALS 相關(guān)的新RBP。研究人員對前10位RBP進行了驗證,發(fā)現(xiàn)有5個RBP與ALS明顯相關(guān)[10]。Kim等[11]開發(fā)了一項可自動檢測間質(zhì)性肺炎相關(guān)RNA 的機器學(xué)習(xí)模型,研究者收集了125 個肺活檢標本,并對所有標本的微陣列中33 297 個轉(zhuǎn)錄物的RNA水平進行檢測,用一部分數(shù)據(jù)訓(xùn)練模型,找出在間質(zhì)性肺炎中異常表達的RNA,并在另一部分數(shù)據(jù)中進行測試,該模型的特異度為92%,靈敏度為82%。Dorman等[12]利用機器學(xué)習(xí)算法對已知乳腺癌化療抵抗基因的表達和拷貝數(shù)進行組合分析,查找到與化療抵抗相關(guān)的基因組。
3.智能診療:隨著患者臨床信息的迅速增長,疾病的診斷及醫(yī)療決策的制定變得更加復(fù)雜,AI 可以提高醫(yī)生的診療效率和準確性。Chamberlain等[13]開發(fā)了一款可以自動篩查哮喘和慢性阻塞性肺疾病的智能手機軟件。該應(yīng)用程序主要由電子聽診器和患者問卷調(diào)查組成,通過機器學(xué)習(xí)算法分析、整合數(shù)據(jù),對哮喘和慢性阻塞性肺疾病患者進行診斷。經(jīng)測試,該程序在普通人群中篩查哮喘或慢性阻塞性肺疾病患者的AUC 為0.95,鑒別哮喘患者和慢性阻塞性肺疾病患者的AUC為0.97。
在國內(nèi),廣州醫(yī)科大學(xué)、四川大學(xué)等單位與加州大學(xué)合作開發(fā)了一種使用遷移學(xué)習(xí)技術(shù)的深度學(xué)習(xí)系統(tǒng),利用類似領(lǐng)域的數(shù)據(jù)解決給定領(lǐng)域的數(shù)據(jù)缺乏問題,能夠精確診斷眼病和肺炎兩大類疾病。該系統(tǒng)可以有效地區(qū)分黃斑變性和糖尿病性視網(wǎng)膜病變,并在30 s 內(nèi)確定患者是否應(yīng)該接受治療,準確度達到95%以上;在區(qū)分病毒性肺炎和細菌性肺炎上,準確率也超過90%[14]。第三軍醫(yī)大學(xué)的研究人員利用機器學(xué)習(xí)技術(shù),可在30 s 內(nèi)檢測到ABO 抗原和5 種主要恒河猴抗原,準確率超過99.9%。這對于急需輸血搶救的病人意義重大,可以增加病人的生還概率,可用于搶險救災(zāi)、戰(zhàn)場急救等急需驗血的情景[15]。
4.預(yù)測預(yù)后:AI 可以通過患者的臨床特征、影像學(xué)表現(xiàn)、基因組學(xué)特征等相關(guān)因素對疾病的發(fā)生、發(fā)展,可能的治療反應(yīng)等進行預(yù)測,為疾病的診療提供重要參考。
如,Weng 等[16]比較了美國心臟病學(xué)會指南與4 種機器學(xué)習(xí)算法在預(yù)測首次心血管事件的數(shù)據(jù)分析效率。研究者用英國378 256 名患者的電子病歷對機器學(xué)習(xí)算法進行訓(xùn)練和測試,該模型在與心血管疾病發(fā)作有關(guān)的記錄中找到共同特征,然后對剩余的病歷記錄進行測試。結(jié)果顯示,機器學(xué)習(xí)的表現(xiàn)明顯優(yōu)于美國心臟病學(xué)會指南,其中表現(xiàn)最好的神經(jīng)網(wǎng)絡(luò)算法比指南的正確預(yù)測率高7.6%,考慮的變量比指南多出22 個。Menden 等[17]設(shè)計了一個機器學(xué)習(xí)模型來預(yù)測癌細胞系對藥物的治療反應(yīng)。該模型通過基于細胞系的基因組學(xué)特征和藥物的半抑制濃度(IC50)來量化治療反應(yīng)。結(jié)果表明,該模型能夠以較高的準確性(決定系數(shù)R2為0.61)來預(yù)測細胞系的IC50,不僅可用來優(yōu)化藥物篩選方案,還可將患者的基因組特征與藥物敏感性相聯(lián)系,實現(xiàn)個體化醫(yī)療。韓國高科技科學(xué)院的研究人員開發(fā)了一個深度卷積神經(jīng)網(wǎng)絡(luò)模型,可以通過分析PET圖像,預(yù)測輕度認知障礙患者未來發(fā)展為阿爾茲海默病的可能。研究人員輸入139 例阿爾茲海默病患者和182 例健康者的PET 圖像對該模型進行訓(xùn)練,隨后對171 例輕度認知障礙患者的PET圖像進行檢測,判斷其未來3年發(fā)展為阿爾茲海默病的可能,結(jié)果表明,該算法預(yù)測的準確度高達84.2%[18]。Hazlett等[19]用深度學(xué)習(xí)算法根據(jù)腦磁共振成像的表面積信息,預(yù)測有高遺傳風(fēng)險的6 ~12月齡兒童在2 歲診斷自閉癥的風(fēng)險,預(yù)測值為81%,靈敏度為88%。
AI 在皮膚科的主要應(yīng)用為圖像識別。AI 模型從經(jīng)處理的臨床圖像、皮膚鏡圖像、數(shù)字病理圖像中提取特征,進行分類診斷,在皮膚癌特別是黑素瘤的識別中有大量研究[20-21]。其中影響力較大的是斯坦福大學(xué)團隊研發(fā)的卷積神經(jīng)網(wǎng)絡(luò)模型,研究者輸入近13萬張皮膚圖像和疾病標簽對該模型進行訓(xùn)練,圖像包含皮膚鏡圖像、手機照片以及標準化照片。隨后對比該模型與至少21 位皮膚科醫(yī)生在角質(zhì)形成細胞癌、良性脂溢性角化病、惡性黑色素瘤與良性痣鑒別中的表現(xiàn)。該模型的AUC 在0.91以上,達到人類專家水平[22]。近年來,智能手機發(fā)展迅速,數(shù)款可自動識別皮膚病的手機軟件被開發(fā),其中SkinVision是第一個采用分形幾何算法實現(xiàn)實時診斷皮膚癌的手機軟件,其檢測黑色素瘤的準確度為81%[23]。在數(shù)字病理圖像方面,Arevalo 等[24]報道了一個自動識別基底細胞癌的非監(jiān)督學(xué)習(xí)模型,經(jīng)過1 417張數(shù)字病理切片訓(xùn)練和另外671張切片測試,其AUC為0.98,值得注意的是,該模型有一個視覺解釋層,可以顯示出發(fā)現(xiàn)的與癌組織相關(guān)的區(qū)域。國內(nèi)的中山大學(xué)團隊采用多實例多標簽機器學(xué)習(xí)算法對皮膚活檢圖像進行注釋,選擇了在診斷中重要的15種注釋術(shù)語,將12 700張皮膚活檢圖像按3∶7 的比例分別對模型進行訓(xùn)練和測試,注釋的準確度最高達85%[25]。
目前,AI 在皮膚圖像識別的應(yīng)用主要集中于皮膚癌的診斷,對其他疾病也有一定研究,但總體較少。Shrivastava等[26]開發(fā)了一種機器學(xué)習(xí)模型,可自動從銀屑病患者的臨床照片中獲取皮損的顏色、質(zhì)地等特征,進行風(fēng)險分級。Han等[27]使用基于區(qū)域的卷積神經(jīng)網(wǎng)絡(luò)生產(chǎn)了包含49 567張標準化指甲圖像的數(shù)據(jù)集,然后對AI 模型進行訓(xùn)練,另外選取1 164張指甲圖像對該模型進行測試,其診斷甲癬的準確度高達96%,優(yōu)于大多數(shù)參加該研究的臨床醫(yī)生。浙江大學(xué)團隊開發(fā)了一個面部痤瘡自動診斷模型,基于卷積神經(jīng)網(wǎng)絡(luò)在臨床照片中提取特征,隨后通過分類器對特征進行分類,自動檢測痤瘡的類型[28]。
此外,AI 在預(yù)測分析、基因組學(xué)等方面也有一定研究。耶魯大學(xué)團隊建立了一個多參數(shù)ANN 模型來早期檢測非黑色素瘤皮膚癌。研究者用2 056 個非黑色素瘤皮膚癌和460 574個非癌癥病例的個人健康信息對模型進行訓(xùn)練、測試。該模型提取了性別、年齡、糖尿病狀態(tài)、吸煙狀況、哮喘、種族等共13 個潛在預(yù)測指標,經(jīng)驗證,其靈敏度為86.2%,特異性為62.7%,AUC 為0.81[29]。皮膚致敏物質(zhì)預(yù)測模型可有效預(yù)測潛在的人類皮膚致敏劑[30-31]。皮膚滲透性預(yù)測模型可以對多種化學(xué)分子的皮膚滲透性進行預(yù)測分析,從而為皮膚外用制劑和護膚品的配制篩選合適的成分[32-33]。利用已知皮膚癌基因的生物學(xué)特征,通過機器學(xué)習(xí)模型尋找潛在的皮膚癌基因[34]。
AI在皮膚圖像識別領(lǐng)域的應(yīng)用可以參考其他學(xué)科在圖像預(yù)處理、特征選擇、分類過程中較好的設(shè)計方法,如遷移學(xué)習(xí)。在非圖像識別領(lǐng)域,其他學(xué)科的研究思路值得皮膚科借鑒,如綜合患者的臨床特征、輔助檢查結(jié)果等對皮膚病進行智能診斷,并篩選最佳治療方案;對常見皮膚病的預(yù)后進行預(yù)測;通過基因分析藥物的治療敏感性等等。
總之,AI作為一門新興交叉學(xué)科,在醫(yī)學(xué)領(lǐng)域的研究主要涉及圖像識別、遺傳學(xué)和基因組學(xué)分析、智能診療、預(yù)測預(yù)后等多個方面。其中,AI在圖像識別方面的研究最多,包括皮膚圖像識別。在非圖像識別領(lǐng)域,AI 在皮膚科的研究較少,可以借鑒其他學(xué)科的研究方法,拓寬思路。AI在醫(yī)學(xué)領(lǐng)域的應(yīng)用眾多,本文僅列舉了部分研究進展,仍存在很多不足之處。隨著研究的深入,AI 在醫(yī)學(xué)中將有著更廣泛的應(yīng)用,從而提高診療效率,降低醫(yī)療成本,使醫(yī)患雙方共同獲益。