吳鍵 侯代倫
肺結(jié)核是一種嚴(yán)重的傳染性疾病,影像學(xué)檢查是肺結(jié)核篩查及治療后療效評估的主要手段之一。由于肺結(jié)核影像學(xué)形態(tài)的多樣性,有時與肺部其他相關(guān)病變的影像特點相似而難以鑒別,因此,肺結(jié)核的影像診斷往往成為臨床工作中的重點與難點[1]。而深度學(xué)習(xí)擅長識別大量成像數(shù)據(jù)中的復(fù)雜模式,并能夠以自動化方式提供定量評估,因此,深度學(xué)習(xí)可以被整合到臨床工作流程中,作為影像學(xué)的評估。醫(yī)療數(shù)據(jù)中超過90%的數(shù)據(jù)來自于醫(yī)學(xué)影像[2],影像醫(yī)師需要分析海量的圖像信息,不可避免地會產(chǎn)生視力疲勞,容易漏診。多學(xué)科相互滲透交叉是當(dāng)前的臨床醫(yī)學(xué)發(fā)展的趨勢,而深度學(xué)習(xí)與常規(guī)影像診斷的融合恰好可在學(xué)科發(fā)展方面查缺補漏。深度學(xué)習(xí)在肺結(jié)核影像上的應(yīng)用不僅可以極大緩解放射科醫(yī)生的工作壓力[3],改善影像報告的質(zhì)量控制和保證,還能提高影像醫(yī)生的診斷效率和準(zhǔn)確性[4]。筆者將對深度學(xué)習(xí)在影像診斷及肺結(jié)核影像診斷中的應(yīng)用、不足及展望進行綜述。
深度學(xué)習(xí)是一種涉及高階思維能力的學(xué)習(xí)狀態(tài),具有自發(fā)性、高投入性、理解性、遷移性等特點[5]。1998年Lecun等[6]首次提出使用反傳播算法訓(xùn)練多層神經(jīng)網(wǎng)絡(luò),為深度學(xué)習(xí)的進一步發(fā)展奠定了堅實基礎(chǔ)。隨著深度學(xué)習(xí)技術(shù)在圖像處理和計算機視覺領(lǐng)域的廣泛應(yīng)用,利用深度學(xué)習(xí)技術(shù)輔助臨床診斷目前已成為醫(yī)學(xué)圖像分析領(lǐng)域的研究熱點。深度學(xué)習(xí)的一些算法如 AlexNet、GoogleNet、 ResNet等在醫(yī)學(xué)影像分類、定位、分割和重建等方面均取得了較好的效果[7-9]。此外,其他諸多深度學(xué)習(xí)網(wǎng)絡(luò)模型如卷積神經(jīng)網(wǎng)絡(luò)[10]、循環(huán)神經(jīng)網(wǎng)絡(luò)[11]、全卷積神經(jīng)網(wǎng)絡(luò)[12]和U-net[13]等,均在針對不同領(lǐng)域的影像實際問題中展示了良好的潛力,有巨大的應(yīng)用空間。因此,將諸多的深度學(xué)習(xí)方法與實際圖像特點相結(jié)合,繼而提高識別醫(yī)學(xué)圖像特征的準(zhǔn)確率,必然是醫(yī)學(xué)輔助診斷發(fā)展的重要趨勢[14]。
近年來,深度學(xué)習(xí)在輔助X線影像診斷方面取得了快速發(fā)展。劉凱等[15]利用胸部X線攝片(簡稱“胸片”)深度學(xué)習(xí)模型就胸片對肺亞實性結(jié)節(jié)的檢出效率與高年資醫(yī)師做了對比,結(jié)果發(fā)現(xiàn),深度學(xué)習(xí)模型的檢出率高于醫(yī)師組,但假陽性率偏高。此外,基于深度學(xué)習(xí)建立X線診斷乳腺癌[16]、肺炎[17]等模型,均取得了很好的預(yù)測及輔助診斷的效果。同時,深度學(xué)習(xí)在輔助CT影像診斷方面也逐漸得到認(rèn)可。Ciompi等[18]檢測肺結(jié)節(jié)利用深度學(xué)習(xí)技術(shù)使用計算機斷層掃描中的二維視圖,建立與三維視覺效果相似直觀檢測模型,最終測試模型檢測肺結(jié)節(jié)的平均曲線下面積(area under curve,AUC)為0.868。Coudray 等[19]也研發(fā)了一種自動分析病理圖像的深度學(xué)習(xí)模型,它可以區(qū)分正常組織和腫瘤組織,而且鑒別病灶性質(zhì)與病理檢查結(jié)果的一致性極高。如今,深度學(xué)習(xí)在輔助CT影像診斷中的應(yīng)用也越來越廣泛,可以對肺癌[20]、皮膚病變[21]、病理顯微圖像[22]、視網(wǎng)膜照片[23],以及放射資料[24]等各種醫(yī)學(xué)影像進行診斷分析,明顯提高了診斷準(zhǔn)確性、穩(wěn)定性和工作效率。
Maduskar等[25]使用自動讀圖軟件(CAD4TB)對胸片上結(jié)核病病灶的診斷符合率與醫(yī)師診斷結(jié)果進行對比,CAD4TB的準(zhǔn)確率為73%,雖然CAD4TB軟件可以針對胸片中的病灶區(qū)域進行輔助診斷肺結(jié)核,但診斷的準(zhǔn)確率還有待提升。此后,Murphy等[26]對CAD4TB進行改進,使用了更加敏感的深度學(xué)習(xí)模型CAD4TB v6,同時訓(xùn)練分類和定位網(wǎng)絡(luò)。這可在沒有任何預(yù)先訓(xùn)練模型的情況下,僅采用圖像層面的標(biāo)記數(shù)據(jù)集就可給感興趣區(qū)域進行精確定位,經(jīng)過測試,新模型在90%的敏感度下取得了98%的特異度,相比CAD4TB有了明顯提升[27]。Lakhani和Sundaram[28]提出在深度學(xué)習(xí)框架下以AlexNet和GoogLeNet網(wǎng)絡(luò)模型相融合對X線影像進行檢測,診斷準(zhǔn)確率可提高至99%。這進一步表明,深度學(xué)習(xí)在胸部X線上準(zhǔn)確診斷肺結(jié)核具有可行性及較高的診斷符合率。近年來,Hwang等[29]建立了一種基于深度學(xué)習(xí)的自動檢測 (deep learning-based automatic detection,DLAD)算法,對這種算法的圖像分類和病變定位性能與15名有經(jīng)驗的影像科醫(yī)師進行對比,DLAD在兩個分類性能的準(zhǔn)確率均高于診斷醫(yī)師。曹盼等[30]嘗試在胸片上先進行人工標(biāo)記結(jié)核病病灶,建立基于特征金字塔網(wǎng)絡(luò)的診斷肺結(jié)核模型,通過測試集的100張肺結(jié)核患者胸片和100張健康人胸片來評價最終訓(xùn)練好的深度學(xué)習(xí)診斷模型,結(jié)果顯示,此模型在分類效能、病灶檢測、定位效能上均表現(xiàn)良好。
深度學(xué)習(xí)在肺結(jié)核CT影像輔助診斷中也具有重要價值,可以為人工智能在臨床應(yīng)用中診斷活動性肺結(jié)核打下堅實基礎(chǔ)[31]。Huang等[32]研究了一種基于深度轉(zhuǎn)移卷積神經(jīng)網(wǎng)絡(luò)和極端學(xué)習(xí)機的肺結(jié)核新型診斷方法,將兩種算法的協(xié)同作用融合在一起,新型模型的準(zhǔn)確度為94.57%,敏感度為93.69%,特異度為95.15%。Ma等[33]收集了846例患者的CT圖像,使用U-Net深度學(xué)習(xí)算法以自動檢測活動性肺結(jié)核病變,將病灶在二維圖像上的表現(xiàn)通過組合的方式呈現(xiàn)在三維圖像,測試結(jié)果顯示深度學(xué)習(xí)工具的AUC為0.98,準(zhǔn)確度、敏感度、特異度、陽性預(yù)測值和陰性預(yù)測值分別為 96.8%、96.4%、97.1%、97.1% 和 96.4%,與之前的方法相比,具有更可靠的效果。吳樹才等[34]通過收集1764例結(jié)核分枝桿菌陽性并接受胸部高分辨率CT平掃檢查患者的資料,并由4名影像科醫(yī)師對含病變的20 139幅CT圖像進行分類標(biāo)注,建立基于CT圖像的CNN診斷肺結(jié)核模型,CNN模型總體敏感度和準(zhǔn)確度分別為 95.47%和 90.40%。但是,對CT圖像進行分類標(biāo)注不僅需要耗費大量時間,而且還需標(biāo)注者對病灶的識別有著深刻的理解,Wang等[35]建立了一種無需標(biāo)注的深度學(xué)習(xí)模型3D-ResNet,用來區(qū)分非結(jié)核分枝桿菌病和結(jié)核病,此模型在訓(xùn)練集、驗證集、測試集上的準(zhǔn)確率分別為90%、88%、86%,同時也驗證了此模型在自動識別CT影像異常病灶的效率明顯高于醫(yī)師診斷。所以,基于深度學(xué)習(xí)技術(shù)的肺結(jié)核CT輔助診斷已具有較高的準(zhǔn)確度和敏感度。
目前,深度學(xué)習(xí)已在計算機視覺任務(wù)處理中獲得了卓越性能,在部分醫(yī)學(xué)圖像處理領(lǐng)域也取得了堪比臨床專家的診斷效果。但是,總體來說,深度學(xué)習(xí)在醫(yī)學(xué)圖像處理領(lǐng)域仍存在很多挑戰(zhàn)和限制[36]。第一,缺乏高質(zhì)量的標(biāo)注訓(xùn)練樣本。在醫(yī)學(xué)領(lǐng)域中,缺少高質(zhì)量標(biāo)注的影像數(shù)據(jù)會導(dǎo)致訓(xùn)練數(shù)據(jù)的類別不平衡,進而導(dǎo)致預(yù)測結(jié)果會偏向樣本量多的類別,出現(xiàn)過擬合現(xiàn)象[37]。第二,深度學(xué)習(xí)技術(shù)的本質(zhì)是一個類似“黑盒子”的模型,很難或幾乎不可能解釋其系統(tǒng)的技術(shù)和邏輯基礎(chǔ)。因此,在醫(yī)療行業(yè)中是否能被認(rèn)可也是一個問題。第三,使用深度學(xué)習(xí)輔助影像診斷也可能會使年輕醫(yī)師產(chǎn)生一定的依賴性,導(dǎo)致診斷水平停滯不前。第四,使用臨床醫(yī)學(xué)圖像數(shù)據(jù)促進基于深度學(xué)習(xí)系統(tǒng)的商業(yè)開發(fā)可能存在法律和倫理問題,因為該系統(tǒng)的性能高度依賴于訓(xùn)練數(shù)據(jù)的數(shù)量和質(zhì)量。
深度學(xué)習(xí)在肺結(jié)核影像診斷中的應(yīng)用研究還不盡完善,仍有值得改進的空間。筆者認(rèn)為,未來可能的研究重點與方向包括:(1)建立全國多中心標(biāo)注團隊,如此,則既可以避免單一醫(yī)療機構(gòu)收集訓(xùn)練樣本造成的局限性,又能夠在短時間內(nèi)收集大量樣本;(2)目前的深度學(xué)習(xí)技術(shù)還是以已標(biāo)注圖像的感興趣區(qū)域進行學(xué)習(xí)為主,但在日常工作中,有大量的未標(biāo)注的圖像需要分析,所以日后需要越來越重視對無標(biāo)注數(shù)據(jù)的學(xué)習(xí),以及無標(biāo)注數(shù)據(jù)自動添加標(biāo)注信息的研究;(3)加強深度學(xué)習(xí)模型的理論研究,結(jié)合互補的多模態(tài)醫(yī)學(xué)圖像數(shù)據(jù)集和圖像結(jié)構(gòu),改善深度學(xué)習(xí)模型提取特征的功能,進而提高提取特征分類和分割準(zhǔn)確性;(4)目前,深度學(xué)習(xí)的算法及模型的驗證是建立在大量樣本的基礎(chǔ)上,使用有效技術(shù)識別小樣本數(shù)據(jù)的方法作為識別數(shù)據(jù)集,也是未來的研究方向。