梁長虹
醫(yī)學(xué)影像檢查作為臨床疾病診斷的重要方法,在疾病的病灶檢出、定性、療效評價和預(yù)后預(yù)測等方面起著舉足輕重的作用,是臨床實踐中不可或缺的輔助手段。近年來,隨著醫(yī)學(xué)影像數(shù)據(jù)激增以及計算機硬件性能的提升,機器學(xué)習(xí)在醫(yī)學(xué)影像領(lǐng)域大顯身手,并迅速成為目前智能醫(yī)療研究的熱點。
傳統(tǒng)的醫(yī)學(xué)影像分析高度依賴臨床醫(yī)生的經(jīng)驗,主要以主觀的判斷為主,通?;诓≡钚螒B(tài)、大小、部位、密度/信號、強化模式等做出診斷。而傳統(tǒng)的計算機醫(yī)學(xué)圖像分析十分繁瑣,主要是根據(jù)一些人工預(yù)先定義好的特征,通過計算來得到其特征值,但這些特征對于準確描述醫(yī)學(xué)影像包含的信息是不全面且不恰當?shù)摹_@種基于醫(yī)師主觀經(jīng)驗判讀的方法,存在主觀性強、依賴臨床經(jīng)驗、耗時等缺點,已不能滿足現(xiàn)代醫(yī)療模式轉(zhuǎn)向智能醫(yī)療的要求。而機器學(xué)習(xí)在醫(yī)學(xué)影像領(lǐng)域的興起,以快速、客觀等優(yōu)勢,有望為臨床實踐帶來變革。機器學(xué)習(xí)作為人工智能的一個核心分支,旨在對計算機進行大量數(shù)據(jù)訓(xùn)練,挖掘深層信息,使計算機獲得自主學(xué)習(xí)能力,實現(xiàn)智能分析。
近年來,機器學(xué)習(xí)在計算機視覺、自然語言處理、生物信息學(xué)等領(lǐng)域取得了突破性進展[1]。尤其在醫(yī)學(xué)領(lǐng)域,機器學(xué)習(xí)在疾病的檢出、診斷、評估、圖像分割、配準與量化等方面取得了長足的進步[2-4]。令人振奮的是美國FDA批準了首個基于人工智能對糖尿病視網(wǎng)膜病變病人及其視力受損程度進行早期檢測的醫(yī)療設(shè)備[5],在減輕醫(yī)生工作負擔的同時,提高了疾病篩查和診斷的準確性,這代表著以機器學(xué)習(xí)為載體的醫(yī)療產(chǎn)品向臨床轉(zhuǎn)化邁出了重要一步。本期“機器學(xué)習(xí)與醫(yī)學(xué)影像”專題中刊出的《機器學(xué)習(xí)及其在肝臟疾病影像診斷中的研究進展》[6]、《機器學(xué)習(xí)在鼻咽癌影像分析中的研究進展》[7]文章中,分別報道了機器學(xué)習(xí)在肝臟、鼻咽癌領(lǐng)域篩查、診斷的研究進展。
以深度學(xué)習(xí)為代表的機器學(xué)習(xí)技術(shù),在腫瘤影像分析層面取得了令人印象深刻的效果。Kooi等[8]將深度學(xué)習(xí)技術(shù)用于檢測乳腺腫塊和鈣化,準確度高達90%?!禞AMA》和《Nature》最近發(fā)表的基于深度神經(jīng)網(wǎng)絡(luò)的糖尿病視網(wǎng)膜病變和皮膚癌診斷研究[9-10]結(jié)果顯示,其診斷水平甚至可與專業(yè)醫(yī)師相當。本期專題中刊出的《基于深度學(xué)習(xí)的癌癥計算機輔助分類診斷研究進展》、《基于深度學(xué)習(xí)的人工智能技術(shù)在乳腺癌篩查及影像診斷中的應(yīng)用進展》等3篇文章[11-13],分別闡述了深度學(xué)習(xí)技術(shù)在肺癌、乳腺癌等領(lǐng)域的最新研究進展。國內(nèi)外的這些研究充分體現(xiàn)了深度學(xué)習(xí)的發(fā)展,對醫(yī)學(xué)影像的分析正產(chǎn)生著深刻的影響。
盡管機器學(xué)習(xí)在醫(yī)學(xué)影像上能輔助臨床醫(yī)師快速進行疾病的篩查、診斷,但目前在醫(yī)療方面的應(yīng)用仍處于起步階段,由理論到產(chǎn)品再到臨床轉(zhuǎn)化,還存在諸多挑戰(zhàn),主要體現(xiàn)在以下幾個方面:①優(yōu)質(zhì)數(shù)據(jù)的獲取。機器學(xué)習(xí)往往需要大量數(shù)據(jù)對其進行訓(xùn)練,尤其是監(jiān)督學(xué)習(xí),帶標簽的數(shù)據(jù)大小及其規(guī)范性直接決定了模型的優(yōu)良。目前的研究主要集中在相對較小的數(shù)據(jù)集上,主要原因可能是某些疾病本身就罕見,或者數(shù)據(jù)納入標準嚴格,亦或數(shù)據(jù)采集不規(guī)范等。因此,如何克服或避免這些缺陷,實現(xiàn)數(shù)據(jù)共通、共享是機器學(xué)習(xí)未來發(fā)展的趨勢。②模型泛化能力的提升。機器學(xué)習(xí)是基于大樣本不斷學(xué)習(xí)的過程,如何在學(xué)習(xí)中找到重要特征,構(gòu)建穩(wěn)定性強的模型至關(guān)重要?!禢ature》報道的針對1 576名研究人員調(diào)查顯示,約七成的科研成員無法重復(fù)別人的實驗結(jié)果,并且超過半數(shù)無法重復(fù)自己的實驗結(jié)果。因此,如何提升模型的魯棒性,迫在眉睫。③醫(yī)工交叉團隊。在醫(yī)學(xué)圖像數(shù)據(jù)不足、算法開發(fā)周期較長的條件下,開展有效的高級機器學(xué)習(xí)技術(shù)研究,并建立醫(yī)工結(jié)合交叉型高精尖人工智能團隊實現(xiàn)其臨床轉(zhuǎn)化,是未來醫(yī)學(xué)影像的重要發(fā)展方向。
盡管國內(nèi)外涌現(xiàn)出了一大批機器學(xué)習(xí)研究者,但受限于數(shù)據(jù),尤其是帶標簽的數(shù)據(jù),仍局限于一些規(guī)模較大的醫(yī)學(xué)中心。加上機器學(xué)習(xí)技術(shù)性較強,導(dǎo)致很多臨床一線的醫(yī)師(包括影像診斷醫(yī)師)對其了解不夠。因此,有必要將機器學(xué)習(xí)的基本知識、臨床價值介紹給臨床醫(yī)生,共同推進機器學(xué)習(xí)技術(shù)的臨床轉(zhuǎn)化,早日實現(xiàn)輔助臨床決策的目標。