魏鵬磊,雷菊陽
(201620 上海市 上海工程技術(shù)大學 機械與汽車工程學院)
新冠病毒疫情之下,醫(yī)生需要尋求更加快捷的診斷方式來確定疑似病例。除核酸檢測外,胸部X 射線影像識別成為篩查病人的主要手段。在國家衛(wèi)健委發(fā)布的《新型冠狀病毒感染肺炎診療手段(試行第八版)》里,具有新冠肺炎影像學特征的臨床表現(xiàn)已被明確納入確定疑似病例的診斷標準中[1]。新冠肺炎很多患者是干咳,采集痰液困難,而咽拭子核酸檢測的總陽性準確率為30%~60%,敏感性欠佳,可能會漏診。胸部影像診斷敏感性好,準確率高達97%。故疑似病例較多的情況下,單憑核酸檢測容易漏診,胸透篩查更有優(yōu)勢,可早發(fā)現(xiàn)、早隔離、早治療。而在實際臨床中,疑似病患、密切接觸者篩查會產(chǎn)生大量胸透影像,醫(yī)生肉眼辨別胸透影像效率較低[2-4]。
鑒于此,本文使用加州大學圣地亞哥分校的開源數(shù)據(jù)集,通過構(gòu)建卷積神經(jīng)網(wǎng)絡(luò)模型對影像進行識別,并進行數(shù)據(jù)可視化。實驗結(jié)果表明,本文的模型和方法有較好的效果和很強的可行性。
卷積神經(jīng)網(wǎng)絡(luò)(CNN)非常適合做圖片分類任務(wù)。通過制定卷積大小、窗口移動大小,一步一步地學習數(shù)據(jù)特征。每次學習計算卷積層后,計算一次最大池化層,就是對輸入圖像進行下采樣。之后,通過dropout 對結(jié)果進行正則化,這樣可以防止過擬合,降低維度,經(jīng)過反向傳播訓練,直到最優(yōu)。隨著卷積網(wǎng)絡(luò)的不斷發(fā)展,圖像變得越來越小,但由于卷積層的存在,圖像也越來越深(即具有更多的特征圖),如圖1 所示。在堆棧頂部添加一個常規(guī)的前饋神經(jīng)網(wǎng)絡(luò),該網(wǎng)絡(luò)由幾個全連接層組成,最后一層輸出預(yù)測。
圖1 典型的CNN 架構(gòu)Fig.1 Typical CNN architecture
本文所采用的CNN 為一種深度神經(jīng)網(wǎng)絡(luò),其基本模型如圖2 所示。
圖2 深度神經(jīng)網(wǎng)絡(luò)基本模型Fig.2 Basic model of deep neural network
本文所用數(shù)據(jù)集為加州大學圣地亞哥分校的開源數(shù)據(jù)集,該數(shù)據(jù)集共包括542 張附有標簽的胸部X 射線影像,其中確診患者胸部影像數(shù)據(jù)共289例,未確診患者胸部影像數(shù)據(jù)共253 例。本實驗選取的訓練集、驗證集和測試集數(shù)據(jù)如表1 所示。
表1 新冠肺炎胸部影像數(shù)據(jù)集Tab.1 New coronary pneumonia chest imaging dataset
本實驗中,使用Keras 的ImageDataGenerator加載所需數(shù)據(jù),并且做數(shù)據(jù)增強與處理。對于訓練數(shù)據(jù),分別做以下處理:將像素值歸一化;剪切強度(逆時針方向的剪切變換角度)為0.2;隨機縮放的幅度為0.2 以及水平翻轉(zhuǎn)。對測試數(shù)據(jù)只做歸一化處理,即將RGB 對應(yīng)的具體數(shù)值轉(zhuǎn)換成0~1之間的值,便于神經(jīng)網(wǎng)絡(luò)計算。本實驗采用最大最小標準化,計算公式為
隨機查看9 張病理圖片,圖片以3 行3 列的方式顯示,每張圖片下面都顯示出對應(yīng)的病理類別,其中covid_with_PNEUMONIA 表示陽性,covid_without_PNEUMONIA 表示陰性??梢暬敵鰣D如圖3 所示[5]。
圖3 病理圖Fig.3 Pathological image
本文創(chuàng)建的CNN 模型主要由卷積層、最大池化層和Dropout 層組成,最后有一個全連接層作為輸出層。首先輸入預(yù)處理后得到的224×224×3 大小的圖片,經(jīng)過64 個卷積核的2 次卷積后,采用一次最大池化;再經(jīng)過2 次128 的卷積核卷積之后,采用一次最大池化;再經(jīng)過3 次256 的卷積核卷積之后,采用最大池化;繼續(xù)重復(fù)兩次3 個512 的卷積核卷積,之后再最大池化;最后經(jīng)過3 次全連接層后輸出。其中,該模型每個卷積層的卷積核大小均為3×3×3,步長為1,邊緣填充也是1,最大池化層大小采用2×2,Dropout 層丟棄的比例為0.5。構(gòu)建的神經(jīng)網(wǎng)絡(luò)具體參數(shù)如圖4 所示。
圖4 網(wǎng)絡(luò)模型概況Fig.4 Network model overview
本文使用的優(yōu)化算法為Adam 算法,因為它實現(xiàn)簡單,計算高效,適用于大規(guī)模數(shù)據(jù)和參數(shù)的場景,設(shè)置學習率為0.000 1,batch_size 為16,迭代次數(shù)為10 次,并對驗證集的精確度添加提前終止監(jiān)控,patience 設(shè)置為3。
首先用498 張病理圖片訓練樣本進行模型訓練,其訓練結(jié)果的準確率以及損失函數(shù)分別如圖5、圖6 所示。
圖5 準確率Fig.5 Accuracy
圖6 損失函數(shù)Fig.6 Loss function
再用54 張病理圖片測試樣本進行評估。測試結(jié)果如圖7 所示。
圖7 測試集準確率Fig.7 Test set accuracy
由圖7 的測試結(jié)果可知,在現(xiàn)有樣本下基于深度學習的新冠肺炎影像學診斷方法準確率可達96.23%。為更好地說明本模型的可行性以及實際效果,對未知標簽的新冠肺炎病理圖片進行預(yù)測,結(jié)果如圖8 所示。即有97.61%的概率表明該病理影像為陽性,有2.38%的概率表明該病理影像為陰性。由此可知,該模型有較好的效果[6]。
圖8 預(yù)測結(jié)果Fig.8 Forecast result
本文基于深度學習對新冠肺炎影像學診斷進行了分析和網(wǎng)絡(luò)模型構(gòu)建。實驗結(jié)果表明,所構(gòu)建的基于深度學習的新冠肺炎影像學診斷方法具有較高的準確率,具有一定的實用性[7]。由于目前新冠病毒毒株仍在不斷變異,該模型存在缺少最新的新冠肺炎影像學樣本,故還需更多的實驗和樣本對該模型進行完善。