陳世恩 連旭燦
[中圖分類號]R563.1 [文獻(xiàn)標(biāo)識碼]A
電子計(jì)算機(jī)斷層掃描(computed tomography,CT)圖片的采集速度快、可以被廣泛應(yīng)用各類病毒性肺炎的篩查和診斷。但是CT圖像中切片數(shù)量多,需要花費(fèi)醫(yī)生較長的時(shí)間來分析診斷。利用人工智能(artificial intelligence,AI)技術(shù),被證實(shí)可以高效地輔助醫(yī)生進(jìn)行快速地篩查和診斷。圖像增強(qiáng)技術(shù)作為一種樣本數(shù)據(jù)增強(qiáng)技術(shù),也常被用于深度學(xué)習(xí)中。由于醫(yī)學(xué)圖像的特異性,一些常見的數(shù)據(jù)增強(qiáng)技術(shù)并不適用于CT圖像。本文擬采用的CT圖像增強(qiáng)技術(shù)包括了:中值濾波、直方圖均衡和小波變換。
采用胸部cT圖像在對新冠肺炎(corona virus disease 2019,COVID-19)提供準(zhǔn)確、快速、廉價(jià)的篩查和檢測方面很有前景。在本文中,研究采用了一個(gè)開源的COVID-CT數(shù)據(jù)集,其中包含275個(gè)COVID-19檢測呈陽性的CT圖像,有助于使用深度學(xué)習(xí)方法分析病人的CT圖像并預(yù)測其是否患有新冠的相關(guān)研究和發(fā)展。研究采用的相關(guān)數(shù)據(jù)和代碼:https:∥github.com/UCSD-A14H/COVID-CT。首先對數(shù)據(jù)集進(jìn)行分配,訓(xùn)練集與測試集按8:2比例隨機(jī)分配CT圖片。由于本次研究的數(shù)據(jù)集較小,在學(xué)習(xí)過程中很容易出現(xiàn)過擬合現(xiàn)象。為了防止此類現(xiàn)象的發(fā)生,我們采用了殘差網(wǎng)絡(luò)(residual network,ResNet-34)進(jìn)行學(xué)習(xí),并對其進(jìn)行參數(shù)優(yōu)化。研究除了采用CT圖像增強(qiáng)技術(shù)外,還進(jìn)行了參數(shù)的優(yōu)化研究。研究采用的優(yōu)化器是二分類問題中常用的Adam算法(adaptive moment estimation,Adam)和隨機(jī)梯度下降法(stochasticgradient descent,SGD)兩種優(yōu)化器。模型的學(xué)習(xí)率經(jīng)過實(shí)驗(yàn)得出:當(dāng)學(xué)習(xí)率為0.0006時(shí)可以獲得最佳的準(zhǔn)確率。模型采用的批處理參數(shù)(batch-size)為64,完成一次整個(gè)數(shù)據(jù)集的訓(xùn)練為1個(gè)epoch,我們將epoch設(shè)定為50。
3.1 SGD不同圖像增強(qiáng)方法結(jié)果對比圖
研究將原圖按照三種圖像增強(qiáng)方法分別增強(qiáng)后,并將原圖和增強(qiáng)后的數(shù)據(jù)進(jìn)行混合學(xué)習(xí)。在使用SGD優(yōu)化器得出的學(xué)習(xí)結(jié)果如下圖1所示。
圖1 SGD不同圖像增強(qiáng)方法結(jié)果對比圖注:SGD為隨機(jī)梯度下降法
從圖1可以直觀地觀察到,采用不同的圖像增強(qiáng)方法對于提高識別準(zhǔn)確率的作用較小,識別的準(zhǔn)確率一直保持在0.8附近。最佳的準(zhǔn)確率為0.82。
3.2 Adam不同圖像增強(qiáng)方法結(jié)果對比圖
將SGD優(yōu)化器更換為Adam優(yōu)化器后,得出的結(jié)果如下圖2所示。
圖2 Adam不同圖像增強(qiáng)方法結(jié)果對比圖
注:Adam為Adam算法
從圖2可以看出,準(zhǔn)確率仍然是在0.8附近。最佳的準(zhǔn)確率為0.84。
3.3運(yùn)行50epoch的時(shí)間對比圖
對比采用Adam和SGD優(yōu)化器后發(fā)現(xiàn)兩者學(xué)習(xí)時(shí)間有較大的差異,見圖3。
圖3 運(yùn)行50epoch的時(shí)間對比圖
從圖3中可以采用Adam優(yōu)化器在8個(gè)epoch后可以顯著降低學(xué)習(xí)時(shí)間。
本文采用不同優(yōu)化器Adam和SGD,并對比研究了采用不同圖像增強(qiáng)方法時(shí)CT肺炎圖片識別準(zhǔn)確率不同。研究得出CT圖像增強(qiáng)方法不能有效地提高識別準(zhǔn)確率,采用優(yōu)化器Adam可有效地降低學(xué)習(xí)時(shí)間。下一步擬增加普通肺炎CT圖片數(shù)據(jù)并對網(wǎng)絡(luò)進(jìn)行進(jìn)一步地優(yōu)化,以獲得更高的識別準(zhǔn)確率。