侯智超,楊 楊,李曉琴
(北京工業(yè)大學(xué) 環(huán)境與生命學(xué)部,北京 100124)
肺癌是一種常見(jiàn)的癌癥,其早期表現(xiàn)是肺部CT圖像中出現(xiàn)的結(jié)節(jié)。如果能盡早的發(fā)現(xiàn)結(jié)節(jié)并進(jìn)行及時(shí)治療則可以有效降低發(fā)展為肺癌的幾率。目前主要是通過(guò)臨床醫(yī)生觀察CT圖像來(lái)檢測(cè)肺結(jié)節(jié),隨著肺癌篩查普及,產(chǎn)生了大量的CT掃描,該方法不僅給醫(yī)生帶來(lái)了巨大的工作量而且其主要依賴于醫(yī)生的臨床經(jīng)驗(yàn),容易導(dǎo)致醫(yī)生疲勞,從而導(dǎo)致誤診和漏診的發(fā)生。因此,有研究者提出將計(jì)算機(jī)輔助診斷算法應(yīng)用于肺結(jié)節(jié)的檢測(cè)中。
傳統(tǒng)肺部計(jì)算機(jī)輔助診斷檢測(cè)結(jié)節(jié)主要是通過(guò)圖像增強(qiáng)技術(shù)將結(jié)節(jié)分割后再進(jìn)行識(shí)別,此類增強(qiáng)方法有可能改變?cè)械腃T數(shù)據(jù),進(jìn)而干擾后續(xù)特征提取及檢測(cè)環(huán)節(jié)[1]。如Teramoto[2]、Aresta[3]等人均關(guān)注結(jié)節(jié)的輪廓,并對(duì)其進(jìn)行增強(qiáng)來(lái)進(jìn)行肺結(jié)節(jié)的分割;John[4]、Leemput[5]等人則關(guān)注于找到合適的閾值來(lái)提取結(jié)節(jié);Ogul[6]等人則使用了多尺度的方法來(lái)檢測(cè)結(jié)節(jié);齊守良[7]等人利用人工確定種子點(diǎn),采用多閾值結(jié)合距離變換的方法提取結(jié)節(jié)。雖然傳統(tǒng)的方法可以實(shí)現(xiàn)肺結(jié)節(jié)的檢測(cè),但是需要對(duì)圖像進(jìn)行復(fù)雜的預(yù)處理來(lái)人工提取特征,然后再對(duì)其進(jìn)行識(shí)別和分類。該方法條件苛刻,若檢測(cè)數(shù)量增加,則需要投入龐大的計(jì)算資源。
自2006年深度學(xué)習(xí)的概念被正式提出[8],研究者不斷地探索和實(shí)驗(yàn)驗(yàn)證,證實(shí)了其在圖像識(shí)別和分類方面應(yīng)用的優(yōu)勢(shì)[9-10]。其中,卷積神經(jīng)網(wǎng)絡(luò)技術(shù)可以直接從輸入的圖像數(shù)據(jù)中提取特征并進(jìn)行后續(xù)分類,相比于傳統(tǒng)方法避免了復(fù)雜的預(yù)處理過(guò)程,在圖像方面的分類和識(shí)別研究方面被廣泛應(yīng)用[11-14]。Setio等人[15]將二維卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用于三維立體圖像的研究,針對(duì)不用形態(tài)的結(jié)節(jié),借鑒已有的技術(shù),設(shè)計(jì)了三種探測(cè)器,并針對(duì)每個(gè)候選結(jié)節(jié)對(duì)象,提取了多個(gè)二維視圖,通過(guò)融合三個(gè)探測(cè)系統(tǒng)的結(jié)果,達(dá)到了較好的效果。其雖然考慮了結(jié)節(jié)的空間信息,結(jié)合了多個(gè)角度進(jìn)行決策,但其模型仍是基于二維卷積神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)的,(二維的缺陷)。Kim等人[16]將以結(jié)節(jié)為中心的多尺寸區(qū)域放縮到相同的尺寸,并以不同的順序進(jìn)行組合,其將各個(gè)分支的輸出結(jié)合,網(wǎng)絡(luò)結(jié)構(gòu)十分復(fù)雜。Ding等人[17]將肺部CT切片軸向上連續(xù)的三層作為輸入,訓(xùn)練了三維卷積神經(jīng)網(wǎng)絡(luò)模型用于降低假陽(yáng)性,考慮了空間信息但僅使用了三層切片。以上研究均為對(duì)肺結(jié)節(jié)初篩后再降低結(jié)果中假陽(yáng)性,耗時(shí)較長(zhǎng)并且準(zhǔn)確度不高。
綜上,本文旨在提出一種基于三維卷積神經(jīng)網(wǎng)絡(luò)的肺結(jié)節(jié)探測(cè)方法,能夠直接在CT數(shù)據(jù)中探測(cè)結(jié)節(jié),并將結(jié)節(jié)進(jìn)行標(biāo)記。此外,設(shè)計(jì)一套完整的測(cè)試流程,為在CT圖像中對(duì)肺結(jié)節(jié)進(jìn)行識(shí)別和定位提供參考。
本研究選用美國(guó)2016年肺結(jié)節(jié)分析(Lung Nodule Analysis 2016, LUNA16)挑戰(zhàn)賽開(kāi)源數(shù)據(jù)集(https://luna16.grand-challenge.org)作為源數(shù)據(jù)。LUNA16挑戰(zhàn)是一個(gè)完全開(kāi)放的挑戰(zhàn),數(shù)據(jù)來(lái)自現(xiàn)有的最大的公共肺結(jié)節(jié)參考數(shù)據(jù)庫(kù)LIDC/IDRI數(shù)據(jù)集。LIDC/IDRI數(shù)據(jù)集包括1 018份CT圖像和附帶相關(guān)的XML文件,并且由4名經(jīng)驗(yàn)豐富的放射科醫(yī)生對(duì)結(jié)節(jié)進(jìn)行注釋。LUNA16丟棄了切片厚度大于3 mm的掃描,還排除了有缺失或不一致切片的CT,最終得到888個(gè)CT掃描。其參考標(biāo)準(zhǔn)為由4名放射科醫(yī)生中至少3名認(rèn)為是大于等于3 mm的結(jié)節(jié),這樣的結(jié)節(jié)共有1 186個(gè)。未包含在參考標(biāo)準(zhǔn)中的注釋(非結(jié)節(jié)、小于3 mm的結(jié)節(jié)和僅由1或2名放射科醫(yī)生注釋的結(jié)節(jié))被稱為不相關(guān)的發(fā)現(xiàn),在官方附件中提供了不相關(guān)的注釋文件。此外本研究還使用了官方給出的用于假陽(yáng)性減少比賽的包含約55萬(wàn)個(gè)初篩的注釋。
卷積神經(jīng)網(wǎng)絡(luò)是一種包含特征提取器的多層神經(jīng)網(wǎng)絡(luò),由LeCun等人[18]在1998年首次正式提出,主要由卷積層、池化層,全連接層組成,網(wǎng)絡(luò)多個(gè)層之間的組合能夠?qū)D像進(jìn)行不同層次的抽象處理和特征提取[19],隨著卷積神經(jīng)網(wǎng)絡(luò)被廣泛地應(yīng)用,后來(lái)陸續(xù)有新的網(wǎng)絡(luò)層被開(kāi)發(fā)出來(lái)對(duì)其不斷地進(jìn)行補(bǔ)充和優(yōu)化,如為防止梯度消失的批歸一化層,防止過(guò)擬合的隨機(jī)丟棄層等等。
2.1.1 卷積層
卷積層的功能主要是提取特征,層輸出由卷積核實(shí)現(xiàn),卷積核的數(shù)量與輸出特征圖的數(shù)量相同,卷積核的大小和移動(dòng)步長(zhǎng)決定了特征圖的特征分布和精度,卷積過(guò)程中卷積核共享參數(shù),但不同卷積核的參數(shù)不一定相同。深度學(xué)習(xí)中卷積操作指卷積核的每個(gè)值與卷積區(qū)域的對(duì)應(yīng)位置的值相乘再求和,以一定的移動(dòng)幅度遍歷整個(gè)圖像的過(guò)程,二維卷積過(guò)程(見(jiàn)圖1)。
圖1 二維卷積過(guò)程示意圖Fig.1 Schematic diagram of a 2D convolution process
圖中卷積前圖像大小為5×5,經(jīng)3×3的卷積核進(jìn)行步長(zhǎng)為1的卷積處理后圖像大小變?yōu)?×3。卷積前在圖像周?chē)a(bǔ)“0”,可防止丟失圖像邊緣像素信息,還可使卷積前后圖像大小保持一致。三維卷積原理與二維卷積類似,不同的是其卷積核是三維卷積核,卷積運(yùn)算在三個(gè)維度中進(jìn)行,因此輸出的特征圖也為三維形式。
2.1.2 池化層
池化層在于對(duì)特征圖進(jìn)行降維壓縮,以減少參數(shù)數(shù)量,防止過(guò)擬合,并保持圖像的平移不變性。目前常用的方法為最大池化和平均池化,根據(jù)圖像特點(diǎn)和需求,本研究選用最大池化方法,即每次選取池化核鄰域內(nèi)最大的像素,如圖2中陰影部分所示。此外,池化運(yùn)算的步長(zhǎng)一般與池化窗口寬度相同,即移動(dòng)時(shí)不與上一步重疊,以達(dá)到壓縮特征圖的目的。二維池化過(guò)程(見(jiàn)圖2)。
圖2 二維池化過(guò)程示意圖Fig.2 Schematic diagram of a 2D max-pooling process
圖中池化窗口尺寸為2×2,移動(dòng)步長(zhǎng)為2,因此輸出特征圖尺寸由輸入時(shí)的4×4減小為2×2。三維池化原理與二維相同,不同的是池化核在三維鄰域進(jìn)行取值操作。該方法可以有效降低特征圖的大小,降低計(jì)算壓力,一般與卷積層成對(duì)設(shè)置。
2.1.3 全連接層
全連接層將經(jīng)過(guò)多個(gè)卷積層和池化層提取的特征進(jìn)行整合后經(jīng)Softmax分類函數(shù)進(jìn)行分類,得到基于輸入的概率分布[20]。前層輸出的特征圖在經(jīng)過(guò)一維化后輸入全連接層,經(jīng)過(guò)加權(quán)后將分布式的特征映射到樣本標(biāo)記空間。
2.2.1 像素歸一化與坐標(biāo)轉(zhuǎn)換
LUNA16數(shù)據(jù)集中的CT圖像由不同儀器掃描產(chǎn)生,成像因素造成灰度的差異。為了防止灰度值分布增加特征量而對(duì)后續(xù)研究產(chǎn)生影響[21],需要對(duì)圖像進(jìn)行像素歸一化處理。根據(jù)人體肺部附近組織及空氣CT值的分布范圍,本研究使用線性變換將CT切片(-1 000,400)的亨氏值歸一化到(0,1)。LUNA16數(shù)據(jù)集給出的坐標(biāo)值是世界坐標(biāo),單位長(zhǎng)度為mm,其數(shù)據(jù)存儲(chǔ)均規(guī)范到512×512的大小,每個(gè)掃描在其頭文件中給出了空間分辨率,因此需要將其轉(zhuǎn)換為體素坐標(biāo)。轉(zhuǎn)換如公式(1)所示。
(1)
公式中(coordx, coordy, coordz)為待檢測(cè)目標(biāo)的世界坐標(biāo),(origin_x, origin_y, origin_z)為掃描機(jī)器對(duì)應(yīng)的世界坐標(biāo)原點(diǎn),(spacing_x, spacing_y, spacing_z)為存儲(chǔ)時(shí)的空間分辨率,(coordX, coordY, coordZ)為轉(zhuǎn)換后的像素坐標(biāo)。
2.2.2 數(shù)據(jù)劃分
在深度學(xué)習(xí)中需要將數(shù)據(jù)按一定比例隨機(jī)劃分為訓(xùn)練集、驗(yàn)證集和測(cè)試集,訓(xùn)練集用于訓(xùn)練模型,驗(yàn)證集用于在訓(xùn)練過(guò)程中對(duì)模型進(jìn)行調(diào)優(yōu),測(cè)試集不參與網(wǎng)絡(luò)的訓(xùn)練,用于評(píng)估模型。本研究在包含888套掃描的十個(gè)無(wú)序文件夾中,取前九個(gè)作為訓(xùn)練源數(shù)據(jù),共包含1 081個(gè)結(jié)節(jié),最后一個(gè)文件夾中的圖像作為獨(dú)立的測(cè)試數(shù)據(jù),包含105個(gè)結(jié)節(jié)。LUNA16比賽數(shù)據(jù)給出的1 186個(gè)肺結(jié)節(jié)直徑均小于40 mm且其中90%小于15 mm,將所有圖像進(jìn)行像素歸一化和坐標(biāo)轉(zhuǎn)換處理后,將結(jié)節(jié)位置和軸向同位置的鄰近切片以五張40×40的連續(xù)切片存放到h5py格式的文件中,生成用于訓(xùn)練網(wǎng)絡(luò)的3D數(shù)據(jù)集。
2.2.3 數(shù)據(jù)擴(kuò)充與采樣
對(duì)于單次掃描而言,結(jié)節(jié)數(shù)量是遠(yuǎn)遠(yuǎn)小于正常樣本數(shù)量的。模型具有高準(zhǔn)確率的前提是對(duì)正負(fù)樣本都能準(zhǔn)確識(shí)別,這取決于模型是否全面地學(xué)習(xí)到了正負(fù)樣本的特征信息。在LUNA16數(shù)據(jù)集中,正樣本的注釋相對(duì)于負(fù)樣本是非常少的,因此需要擴(kuò)充正樣本,使訓(xùn)練數(shù)據(jù)集中有足夠數(shù)量的正樣本;而負(fù)樣本數(shù)目龐大,因此需要進(jìn)行下采樣來(lái)減少數(shù)量,盡可能使有限數(shù)量的集合全面包含負(fù)樣本特征信息。
本研究分別使用三種不同的正負(fù)樣本選擇與擴(kuò)充方式得到了三個(gè)訓(xùn)練集。其中,訓(xùn)練集1和訓(xùn)練集2使用相同的方法擴(kuò)充正樣本,規(guī)則如下:正樣本的樣本中心在40×40的范圍內(nèi)隨機(jī)平移,平移范圍由結(jié)節(jié)直徑大小約束,再經(jīng)過(guò)90°、180°旋轉(zhuǎn)以及水平翻轉(zhuǎn)擴(kuò)充數(shù)據(jù)。在訓(xùn)練集1中,假設(shè)被標(biāo)記為正樣本之外的區(qū)域都為負(fù)樣本,對(duì)正樣本關(guān)于水平中線、豎直中線和反斜對(duì)角線對(duì)稱的位置進(jìn)行采樣,然后利用旋轉(zhuǎn)、翻轉(zhuǎn)擴(kuò)增負(fù)樣本。訓(xùn)練集2的負(fù)樣本是我們排除官方提供的不相關(guān)注釋列表中的點(diǎn)位,從剩余非結(jié)節(jié)點(diǎn)位中隨機(jī)選取一部分獲得的,數(shù)量與正樣本數(shù)量相當(dāng)。
為降低隨機(jī)移動(dòng)的偶然性,訓(xùn)練集3將隨機(jī)平移的范圍約束在40×40大小的四個(gè)10×10的矩形內(nèi),進(jìn)行多次擴(kuò)增,這些正樣本相對(duì)均勻地在各方向上均得到了擴(kuò)充。訓(xùn)練集3結(jié)合訓(xùn)練集1和訓(xùn)練集2的負(fù)樣本采樣方式,將采樣到的負(fù)樣本隨機(jī)混合,并控制其數(shù)量與正樣本數(shù)量相當(dāng)。得到的三個(gè)訓(xùn)練集的樣本數(shù)量分布(見(jiàn)表1)。
表1 訓(xùn)練集樣本數(shù)量表Table 1 The number of samples
本研究基于Windows10操作系統(tǒng),利用python編程語(yǔ)言,軟件版本使用Tensorflow-gpu V1.7.0和KerasV2.1.6,搭配CUDAV9.0.176和cudnn V7.4并使用NVIDIAQuadro K2200 GPU搭建了基于3D-CNN的肺結(jié)節(jié)檢測(cè)網(wǎng)絡(luò)并進(jìn)行訓(xùn)練。訓(xùn)練過(guò)程中根據(jù)驗(yàn)證集準(zhǔn)確率和損失值的變化調(diào)整網(wǎng)絡(luò)的結(jié)構(gòu)和參數(shù)。經(jīng)過(guò)大量實(shí)驗(yàn)得到3D-CNN結(jié)構(gòu)框圖(見(jiàn)圖 3)。平均模型訓(xùn)練時(shí)間約0.5 h。
圖3 3D-CNN結(jié)構(gòu)示意圖Fig.3 Structure diagram of 3D-CNN
如圖3所示,本文搭建的3D-CNN 包含4個(gè)卷積層、3個(gè)池化層、1個(gè)全連接層、1個(gè)輸入層和1個(gè)輸出層。其中,卷積層中卷積核的尺寸均為3×3×3,步長(zhǎng)為1,填充方式為“same”,即卷積前在圖像之外填充0以保證卷積前后圖像大小不變,激活函數(shù)為ReLU激活函數(shù)。前3個(gè)卷積層后分別設(shè)置了步長(zhǎng)為2的池化層以減少參數(shù)個(gè)數(shù),降低網(wǎng)絡(luò)計(jì)算壓力。全連接層設(shè)置16個(gè)神經(jīng)元,用于整合前層的特征,激活函數(shù)為ReLU激活函數(shù),最后由softmax分類輸出層輸出結(jié)果。
訓(xùn)練過(guò)程中通過(guò)可視化工具Tensorboard觀察模型在訓(xùn)練集和驗(yàn)證集上的準(zhǔn)確率變化情況,據(jù)此來(lái)調(diào)整模型的結(jié)構(gòu)和參數(shù)。在此展示模型1-3在訓(xùn)練集和驗(yàn)證集上的準(zhǔn)確率和損失值的變化情況(見(jiàn)圖4、圖5)。其中,圖4為模型1-3在訓(xùn)練集上準(zhǔn)確率和損失值的變化,圖5為模型1-3在驗(yàn)證集上準(zhǔn)確率和損失值的變化。
圖4 訓(xùn)練集上準(zhǔn)確率和損失值曲線圖Fig.4 Gurves of accuracy and loss on training set
圖5 驗(yàn)證集上準(zhǔn)確率和損失值曲線圖Fig.5 Gurves of accuracy and loss on validation set
由圖4和圖5可以看出在網(wǎng)絡(luò)進(jìn)行訓(xùn)練20輪次左右時(shí)模型1和模型2收斂,準(zhǔn)確率和損失值基本保持穩(wěn)定。模型3的則需要更多的訓(xùn)練輪次才達(dá)到穩(wěn)定,這是因?yàn)樵跀?shù)據(jù)擴(kuò)充與采樣時(shí),訓(xùn)練集3相較于訓(xùn)練集1和訓(xùn)練集2數(shù)據(jù)更為多樣化,網(wǎng)絡(luò)學(xué)習(xí)特征的難度更大,從而訓(xùn)練模型到收斂的過(guò)程更長(zhǎng)。為使結(jié)果更加可靠,我們對(duì)每個(gè)訓(xùn)練集分別進(jìn)行了多次訓(xùn)練。
本研究中模型的性能主要通過(guò)敏感性、特異性來(lái)衡量。敏感性與特異性的計(jì)算方式如公式(2)、(3)所示。
(2)
(3)
式中真陽(yáng)性比例(true positive rate, TPR)表示敏感性,真陰性比例(true negative rate, TNR)表示特異性。
測(cè)試集中包含88套CT掃描,在官方初篩注釋中篩除掉不相關(guān)點(diǎn)位后對(duì)應(yīng)32 620個(gè)點(diǎn)位,其中由于105個(gè)醫(yī)生標(biāo)注的結(jié)節(jié)中有些被多次檢出,因此32 620個(gè)點(diǎn)位包括125個(gè)候選結(jié)節(jié)點(diǎn)位和32 495個(gè)非結(jié)節(jié)點(diǎn)位,我們以此為評(píng)估標(biāo)準(zhǔn)對(duì)模型進(jìn)行測(cè)試。
設(shè)計(jì)了系統(tǒng)檢測(cè)流程(見(jiàn)圖6),為增加位置精確度,要以較小的步長(zhǎng)遍歷整套CT,在每一層掃描所有的位置,因此時(shí)間的花費(fèi)主要集中在數(shù)據(jù)處理和存儲(chǔ),以及結(jié)果預(yù)測(cè)。
圖6 自動(dòng)檢測(cè)流程圖Fig.6 Flow chart of automatic detection
為降低CNN訓(xùn)練過(guò)程中的隨機(jī)因素對(duì)結(jié)果的影響,對(duì)每個(gè)訓(xùn)練集分別進(jìn)行了三次訓(xùn)練,將對(duì)應(yīng)的模型在測(cè)試集上的評(píng)價(jià)指標(biāo)取均值作為最終的評(píng)估結(jié)果。評(píng)估結(jié)果(見(jiàn)表2)。其中,第1、2和3組實(shí)驗(yàn)分別計(jì)算了由訓(xùn)練集1、訓(xùn)練集2和訓(xùn)練集3訓(xùn)練得到表2的模型性能。
表2 評(píng)估結(jié)果Table 2 Results of evaluation %
由表2可以看出,第1組具有較高的敏感性,但特異度非常低,這是因?yàn)橛?xùn)練集1的負(fù)樣本選取方式不確定性較強(qiáng),網(wǎng)絡(luò)不能較為全面地學(xué)習(xí)到負(fù)樣本的特征,對(duì)于肺結(jié)節(jié)檢測(cè),負(fù)樣本顯然數(shù)量遠(yuǎn)遠(yuǎn)大于正樣本,假陽(yáng)性率高使得結(jié)果易混淆,較低的特異性使結(jié)果參考意義大打折扣;第2組明顯提高了特異度,但敏感性下降較多,說(shuō)明在訓(xùn)練集2上網(wǎng)絡(luò)對(duì)負(fù)樣本特征過(guò)度擬合,對(duì)肺結(jié)節(jié)檢測(cè)而言敏感性低意味著漏檢率高,在肺癌篩查中是應(yīng)當(dāng)盡力避免的;與前兩組相比第3組的結(jié)果同時(shí)具有較高的敏感性和特異性,說(shuō)明后期對(duì)負(fù)樣本的擴(kuò)增方法是非常有效的,訓(xùn)練集3對(duì)樣本進(jìn)行了混合與均衡,網(wǎng)絡(luò)得以充分學(xué)習(xí)到多樣化的樣本空間信息,因此可以在略微犧牲敏感性的基礎(chǔ)上保證較高的特異度。并以多視圖的方式展示了本文模型對(duì)部分樣本預(yù)測(cè)的結(jié)果(見(jiàn)圖7),圖中每一行圖下方的數(shù)值表示模型預(yù)測(cè)該樣本為結(jié)節(jié)的概率值。
圖7 部分樣本預(yù)測(cè)結(jié)果Fig.7 Part of prediction results of samples
由圖7可以看出,本文模型對(duì)正負(fù)樣本有較強(qiáng)的區(qū)分能力,在LUNA16提供的包含1 186個(gè)結(jié)節(jié)的候選點(diǎn)位上測(cè)試第3組實(shí)驗(yàn)?zāi)P?,同樣采用三個(gè)模型分別進(jìn)行預(yù)測(cè)然后取平均值作為最終的預(yù)測(cè)結(jié)果(見(jiàn)表3),與汪洋等人[22]將殘差網(wǎng)絡(luò)與傳統(tǒng)SSD結(jié)合的檢測(cè)算法相比,使用同樣的測(cè)試數(shù)據(jù),本文的結(jié)果明顯更具優(yōu)勢(shì)。
表3 與其他檢測(cè)算法的對(duì)比Table 3 Comparison with other detection algorithm %
本研究在模擬實(shí)際篩查任務(wù)中進(jìn)行了測(cè)試,檢測(cè)過(guò)程中每個(gè)樣本選取包含待檢測(cè)目標(biāo)的40~50張CT切片,按照2.5的檢測(cè)流程進(jìn)行全局掃描檢測(cè),對(duì)檢測(cè)為結(jié)節(jié)的區(qū)域中心標(biāo)記一個(gè)點(diǎn)。因此針對(duì)單層切片的單個(gè)結(jié)節(jié)周?chē)鷷?huì)出現(xiàn)多個(gè)標(biāo)記,以及此結(jié)節(jié)涉及到的所有切片的區(qū)域會(huì)有多層標(biāo)記。以像素為單位對(duì)帶有標(biāo)記點(diǎn)的掩膜進(jìn)行疊加融合,連續(xù)雙層的標(biāo)記點(diǎn)顏色加深,連續(xù)三層的標(biāo)記點(diǎn)置為紅色。使用該方法在測(cè)試集中隨機(jī)選取的CT樣本中進(jìn)行了檢測(cè)實(shí)驗(yàn),并以多視圖的方式展示三維空間的可視化結(jié)果(見(jiàn)圖8),標(biāo)注了檢測(cè)目標(biāo)的原始圖像和本研究的檢測(cè)方法檢測(cè)出的標(biāo)記示意。
圖8 標(biāo)記結(jié)果示意圖Fig.8 Schematic diagram of marking results
對(duì)目標(biāo)區(qū)域進(jìn)行了放大顯示,如圖8所示,紅點(diǎn)密集的地方為檢出區(qū)域。我們的模型在結(jié)節(jié)所在切片及鄰近的切片均檢測(cè)出了異常,在遍歷整個(gè)CT數(shù)據(jù)塊時(shí)能較為準(zhǔn)確地識(shí)別結(jié)節(jié)所在區(qū)域,結(jié)果表明本研究的方法是切實(shí)可行的。在本文的硬件環(huán)境下,我們的模型對(duì)每個(gè)樣本點(diǎn)位的預(yù)測(cè)時(shí)間約為1.5×10-3s,則檢測(cè)一套300張512×512的CT所需時(shí)間約為20~30 min。
本研究提出了基于三維卷積神經(jīng)網(wǎng)絡(luò)的肺結(jié)節(jié)探測(cè)方法,并通過(guò)實(shí)驗(yàn)取得了較好的檢測(cè)模型和結(jié)果。為了提高肺結(jié)節(jié)初步篩查的準(zhǔn)確率,采用不同的方法對(duì)正樣本進(jìn)行擴(kuò)充、對(duì)負(fù)樣本進(jìn)行降維采樣,構(gòu)建了三個(gè)樣本數(shù)據(jù)集。搭建了3D-CNN并分別使用三個(gè)數(shù)據(jù)集訓(xùn)練網(wǎng)絡(luò)得到對(duì)應(yīng)的分類模型,對(duì)比了三組數(shù)據(jù)訓(xùn)練的模型的效果,發(fā)現(xiàn)負(fù)樣本的多樣性在很大程度決定著模型的性能,多樣化程度越高,模型的泛化能力越強(qiáng),魯棒性越高。最后從得到的肺結(jié)節(jié)檢測(cè)模型中進(jìn)行多次測(cè)試并將結(jié)果進(jìn)行平均以降低偶然性誤差對(duì)模型性能的影響,模型的敏感性為93.03%,特異性為97.39%。結(jié)果表明,本研究的肺結(jié)節(jié)檢測(cè)方法可以有效的檢測(cè)肺結(jié)節(jié)。此外,還設(shè)計(jì)了完整的結(jié)節(jié)自動(dòng)化檢測(cè)流程,充分利用了數(shù)據(jù)的空間特征,有效地提高了檢測(cè)的精準(zhǔn)度,大大降低了肺結(jié)節(jié)初篩的假陽(yáng)性率。后續(xù)研究或?qū)⒃龃筘?fù)樣本采集數(shù)量和正樣本擴(kuò)充數(shù)量,進(jìn)一步提升模型對(duì)肺結(jié)節(jié)的檢出率。