韓興隆,上官宏,張雄,韓澤芳,崔學英,王安紅
(太原科技大學電子信息工程學院,太原 030024)
隨著X 射線計算機斷層成像(computed tomography,CT)技術(shù)不斷發(fā)展,CT 圖像在醫(yī)學診療領(lǐng)域中的應用范圍不斷擴大。然而,重復進行X 射線掃描可能會導致病人遭受過量輻射傷害[1]。因此,臨床上倡導在保證CT 圖像診斷準確度的同時,將X 射線對人體的輻射傷害降至最低[2]。降低輻射劑量又會導致圖像被斑點噪聲或非平穩(wěn)條紋偽影污染,圖像質(zhì)量退化[3]。針對如何在盡可能低的掃描劑量條件下獲取與常規(guī)劑量CT(normal-dose CT,NDCT)質(zhì)量相近的CT 圖像,即低劑量CT(low-dose CT,LDCT)成像技術(shù),國內(nèi)外學者進行了大量研究,主流方法包括投影域方法、重建算法和后處理方法。后處理方法具有不依賴原始投影數(shù)據(jù)、不需要實時成像和可移植性強等特點,得到了廣泛的應用。后處理方法主要分為傳統(tǒng)方法和深度學習方法2 類。
在傳統(tǒng)后處理方法中,基于字典學習[4]和稀疏表示[5]的處理方法結(jié)構(gòu)特征表征能力較強,對結(jié)構(gòu)相對復雜的CT 圖像處理效果明顯。考慮大尺度窗口內(nèi)像素結(jié)構(gòu)相似性的非局部均值(nonlocalmeans,NLM)[6]或其改進方法[7]的相關(guān)研究也是近年的主流研究方向。三維塊匹配(block-matching an d 3D,BM 3D)濾波算法[8]結(jié)合了空間域中NLM 降噪和變換域小波閾值收縮的優(yōu)點,采用硬閾值線性變換減小相似性判斷的復雜度,同時利用相似塊域轉(zhuǎn)換操作來降低相似塊自身所含的噪聲。這些傳統(tǒng)后處理方法雖然可以實現(xiàn)簡單的圖像降噪任務(wù),然而在偽影與結(jié)構(gòu)高度相似的低密度區(qū)降噪效果不夠理想,方法魯棒性和泛化能力仍有待提高。
基于深度學習的LDCT 圖像降噪方法采用了數(shù)據(jù)表征能力強大的深度卷積神經(jīng)網(wǎng)絡(luò)(convolutional neuralnetworks,CNN)作為模型結(jié)構(gòu),表現(xiàn)出巨大的性能優(yōu)勢,已成為該領(lǐng)域近年來的研究熱點。典型的方法包括2D CNN[9]、3D CNN[10]和級聯(lián)CNN[11]等。Kang 等[12]將傳統(tǒng)小波變換與深度學習相結(jié)合,在原圖的小波域系數(shù)中抑制噪聲的小波域成分,并應用重構(gòu)算法得出抑制偽影噪聲后的圖像。Chen 等[13]提出RED-CNN 網(wǎng)絡(luò),采用基于恒等映射思想的殘差結(jié)構(gòu)進一步提高了特征表達能力。雖然上述算法在處理LDCT 圖像降噪問題時取得了一定效果,但仍存過擬合問題。為解決過擬合及網(wǎng)絡(luò)特征提取能力不強等問題,研究者們在網(wǎng)絡(luò)結(jié)構(gòu)改進方面做了許多嘗試。Ronneberger 等[14]提出了一種基于編解碼結(jié)構(gòu)的U-Net 網(wǎng)絡(luò),通過多個下采樣和上采樣操作對特征進行提取和重構(gòu),這種結(jié)構(gòu)能夠減小網(wǎng)絡(luò)的運算復雜度,同時通過不同尺度特征的跨層連接實現(xiàn)特征的有效利用;Heinrich 等[15]在U-Net網(wǎng)絡(luò)的基礎(chǔ)上增加了殘差思想,通過增加殘差圖補充特征來改善網(wǎng)絡(luò)的特征提取效果;Abdulkadir等[16]提出了一種3D U-Net 網(wǎng)絡(luò),通過結(jié)構(gòu)優(yōu)化和數(shù)據(jù)增強,僅使用少量的標注數(shù)據(jù)就能獲得較好的網(wǎng)絡(luò)學習能力。傳統(tǒng)U-Net 網(wǎng)絡(luò)及其改進算法僅考慮在編碼端與解碼端同尺度的非相鄰層獲取的特征圖之間的關(guān)系,并沒有充分利用不同尺度非相鄰層特征圖之間的互補性,使得所提取的圖像特征不夠充分。也有一些研究者致力于通過引入注意力網(wǎng)絡(luò)來生成補充特征(如方向特征[17-18]、密度特征[19]、深度特征[20]與梯度特征[21]等),從而加強網(wǎng)絡(luò)對不同語義信息的描述能力。其中,Zhang 等[22]提出的CBDnet 網(wǎng)絡(luò)中包括一個噪聲估計注意力子網(wǎng)絡(luò),通過計算像素之間的相關(guān)性來對圖像中所含噪聲的強度進行預測,增強了網(wǎng)絡(luò)對不同語義信息的描述能力;Wang 等[23]提出的位置注意力子網(wǎng),能夠通過預估雨影或噪聲的位置特征來提升網(wǎng)絡(luò)的性能;張雄等[24]引入了估計噪聲偽影強度的功能子網(wǎng)絡(luò),在一定程度上提高了算法魯棒性;考慮到LDCT 圖像中偽影噪聲的不確定性,Du 等[25]將視覺注意力機制分別與生成器和判別器相結(jié)合,使得網(wǎng)絡(luò)對偽影及其周圍的結(jié)構(gòu)信息更加敏感;Li 等[26]提出了自注意力卷積神經(jīng)網(wǎng)絡(luò)(SACNN);利用切片內(nèi)外間的相關(guān)性,提升算法性能。盡管改進網(wǎng)絡(luò)結(jié)構(gòu)能夠一定程度上提高網(wǎng)絡(luò)對特征提取的充分性和有效性,但由于僅采用單一的目標函數(shù)來約束網(wǎng)絡(luò)的最終輸出結(jié)果,多數(shù)網(wǎng)絡(luò)的降噪圖像易出現(xiàn)細節(jié)丟失和過度平滑問題。例如,Liu 等[27]僅采用均方誤差來對降噪圖像進行約束,但由于其目標函數(shù)的單一性,易導致圖像出現(xiàn)邊緣丟失及過平滑現(xiàn)象;You 等[28]通過結(jié)構(gòu)敏感損失對網(wǎng)絡(luò)結(jié)構(gòu)進行約束,并采用L2 范數(shù)來進一步抑制圖像中的噪聲;Wolterink 等[29]提出一種對抗損失,利用相互博弈的思想來約束網(wǎng)絡(luò),有效緩解了圖像邊緣丟失現(xiàn)象。這類方法在一定程度上提高了網(wǎng)絡(luò)訓練的穩(wěn)定性,但網(wǎng)絡(luò)計算復雜度較大,網(wǎng)絡(luò)對噪聲的描述能力較差,網(wǎng)絡(luò)訓練穩(wěn)定性仍有待提升。
針對將U-Net 應用于LDCT 降噪任務(wù)出現(xiàn)的特征提取不充分、網(wǎng)絡(luò)對噪聲偽影方向特性敏感度不足及降噪結(jié)果過度平滑等問題,本文設(shè)計了一種基于偽影估計的LDCT 降噪網(wǎng)絡(luò),包括主特征提取網(wǎng)絡(luò)和方向敏感注意力子網(wǎng)絡(luò)2 部分。主特征提取網(wǎng)絡(luò)稠密特征增強模塊能夠有效捕獲跨尺度特征之間的相互關(guān)系,并對不同尺度特征之間的差異性進行充分利用,提高對特征提取的有效性;方向敏感注意力子網(wǎng)絡(luò)能夠輸出偽影特征方向位置的掩碼圖,來進一步提高網(wǎng)絡(luò)對偽影的敏感度。
Y∈Rw×h為 給定的一幅大小為w×h的被偽影噪聲 污 染 的LDCT 圖 像,X∈Rw×h表 示 與 之 對 應 的NDCT 圖像。一般地,認為LDCT 圖像由NDCT圖像經(jīng)一個復雜的降質(zhì)過程退化而來,可以將這個復雜的降質(zhì)過程建模為一種非線性映射關(guān)系T:X∈Rw×h→Rw×h。
LDCT 圖像降噪可以被看作是學習Y→X映射關(guān)系的過程。
LDCT 圖像降噪的主要任務(wù)是在有效抑制偽影噪聲的同時盡可能保留CT 圖像中所包含的豐富組織結(jié)構(gòu)及病理信息,然而,由于LDCT 中的偽影和噪聲分布極其不規(guī)律,且與人體正常組織位置息息相關(guān),很難建立一個通用統(tǒng)計模型將偽影和噪聲從LDCT 中準確分離出來且不產(chǎn)生新的偽影或噪聲。解決這個問題的關(guān)鍵在于提高降噪網(wǎng)絡(luò)對LDCT中“正常組織和病變”與“偽影和噪聲”的敏感程度和特征提取的有效性??紤]到U-Net是一種由編碼器和解碼器2 部分組成的呈對稱結(jié)構(gòu)的多尺度網(wǎng)絡(luò),除了能實現(xiàn)常規(guī)的特征提取與重構(gòu)外,還能進行特征圖的多尺度利用,而且其結(jié)構(gòu)中還包含能將編碼端所提取的特征補充到解碼端的跳躍連接操作。因此,采用基于U-Net 結(jié)構(gòu)的網(wǎng)絡(luò)來實現(xiàn)LDCT圖像降噪可望獲得更好的性能。但將其直接應用于LDCT 圖像降噪中還存在以下問題:①在特征重構(gòu)過程中,來自不同尺度的特征圖可能發(fā)揮著不盡相同的作用,相鄰或非相鄰層所提取出的特征圖之間具備一定的相關(guān)性,而傳統(tǒng)U-Net 的解碼器僅考慮了編碼端與解碼端同尺度的非相鄰層獲取的特征圖之間的關(guān)系,并未充分利用不同尺度非相鄰層獲取特征圖之間的互補性;②LDCT 常被一些分布不均勻且方向隨機的偽影污染,傳統(tǒng)U-Net 并未對圖像的方向特征提取做針對性的結(jié)構(gòu)設(shè)計;③傳統(tǒng)U-Net 在訓練過程中僅采用單一的像素級L1 損失進行約束,易導致降噪圖像出現(xiàn)過平滑和部分細節(jié)特征丟失的現(xiàn)象。
針對LDCT 圖像的偽影噪聲抑制問題,本文設(shè)計了一個由主特征提取網(wǎng)絡(luò)和方向敏感注意力子網(wǎng)絡(luò)(direction-sensitive attention network,DA)2 部分組成的偽影噪聲估計網(wǎng)絡(luò):①為能夠在有效提取特征的同時,捕獲跨尺度特征之間的相互關(guān)系,并對不同尺度特征之間的差異性進行充分利用,將主特征提取網(wǎng)絡(luò)設(shè)計為能夠同時提取不同尺度特征的編解碼U-Net 結(jié)構(gòu),特別地,在解碼端設(shè)計了一個稠密特征增強模塊(dense feature fusion-enhancement network,DFF);②為提高降噪網(wǎng)絡(luò)對分布不均勻且方向隨機的偽影特征的敏感度,設(shè)計了一個方向敏感注意力子網(wǎng)絡(luò),該網(wǎng)絡(luò)的輸出為一個能夠反映偽影方向特征的掩碼圖,將此掩碼圖看作權(quán)重系數(shù),與主特征提取網(wǎng)絡(luò)所提取的特征圖相乘,來獲取偽影噪聲估計圖。此外,本文通過多損失函數(shù)(即像素級L1 損失、偽影一致性損失及偽影掩碼損失)共同作用來保障降噪網(wǎng)絡(luò)的性能。
1.2.1 主特征提取網(wǎng)絡(luò)
本文設(shè)計的主特征提取網(wǎng)絡(luò)為編解碼結(jié)構(gòu)。其編碼端包括8 個卷積層:前4 層主要用于提取LDCT圖像的邊緣、輪廓等淺層特征,其中,卷積層1 采用的卷積核大小為5×5、步長為1,卷積層2~4 采用的卷積核大小均為4×4、步長均為2;后4 層主要用于提取LDCT 圖像的深層語義特征,卷積層5~8 采用的卷積核大小均為5×5、步長均為1。其解碼端包括8 個反卷積層:反卷積層1~4 采用的卷積核大小均為5×5、步長均為1;反卷積層5~7 采用的卷積核大小均為4×4、步長均為2;反卷積層8 采用的卷積核大小為5×5、步長為1。為考慮不同尺度非相鄰層獲取的特征圖之間的特征互補性,本文還在解碼端設(shè)計了稠密特征增強模塊(見圖1),對反卷積層4~8 得到的特征圖進行充分利用。首先,分別對反卷積層5~7(卷積核大小為4×4、步長為2)和反卷積層8(除藍色箭頭外其余卷積核大小均為4×4、步長為2)得到的特征圖進行下采樣操作,將不同尺度反卷積層上獲取的特征圖映射為與尺度較小的(其前面的)反卷積層獲取的特征圖大小一樣的特征圖;其次,分別將上一步下采樣所得的特征圖與尺度較小的(其前面的)反卷積層得到的特征圖相減,獲取不同尺度下的殘差特征圖;然后,分別對不同尺度上的殘差特征圖進行上采樣操作(卷積核大小為4×4、步長為2),獲取與不同尺度反卷積層輸出的特征圖大小相同的特征圖;最后,分別將上一步上采樣所得特征圖與不同尺度反卷積層得到的特征圖相加,獲得不同尺度反卷積層輸出的最終特征圖。
1.2.2 方向敏感注意力子網(wǎng)絡(luò)
對LDCT 圖像進行卷積操作(卷積核大小為3×3、步長為1),將所獲取的特征圖分2 路送入方向敏感注意力子網(wǎng)絡(luò),如圖1 所示。其中,在上支路,特征圖會經(jīng)過3 個卷積層,前2 個卷積層為特征提取層,卷積核大小均為3×3、步長均為1,第3 個卷積層為數(shù)據(jù)降維層,卷積核大小為1×1、步長為1,此后,特征圖通過Sigmoid 函數(shù)作用,可獲取4 個用來約束不同方向特征圖的權(quán)重參數(shù);在下支路,采用方向敏感注意力子網(wǎng)絡(luò)對特征圖進行2 次特征提取。方向敏感注意力子網(wǎng)絡(luò)采用變型的循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neuralnetwork,RNN)實現(xiàn)。當特征圖從左向右(或從右向左,從上到下,從下到上)進行移動時,每向右移動一個像素,網(wǎng)絡(luò)將更新一個隱藏單元(上一個特征乘以權(quán)重,再經(jīng)Relu 激活函數(shù)進行激活),產(chǎn)生一個含有向右(或向上、向下、向左)方向信息的特征圖;分別將不同方向的特征圖與上支路輸出的4 個權(quán)重參數(shù)相乘,進而將所獲取的4 個特征圖級聯(lián),經(jīng)Sigmoid 激活函數(shù)處理,輸出能夠反映偽影方向特征的掩碼圖。
圖1 本文降噪整體框架Fig.1 Overall architecture of our proposed denoising network
1.2.3 損失函數(shù)
在訓練過程中,為保障本文提出網(wǎng)絡(luò)的整體降噪性能,采用多個損失函數(shù),對網(wǎng)絡(luò)的不同模塊進行具有針對性的約束。采用偽影掩碼損失來控制方向敏感注意力子網(wǎng)絡(luò)的輸出,使該子網(wǎng)絡(luò)的輸出盡可能接近理想偽影掩碼圖,其定義為
式中:E表示求數(shù)學期望,Y為輸入的待降噪LDCT,X為理想NDCT;為方向敏感注意力子網(wǎng)絡(luò)輸出的偽影掩碼圖;M為理想偽影掩碼圖。L M越小,表明所生成的掩碼圖與理想掩碼圖越接近。
采用偽影一致性損失來控制偽影噪聲估計網(wǎng)絡(luò)的輸出,使網(wǎng)絡(luò)輸出盡可能接近理想偽影圖,其定義為
式中:A為 理想偽影圖;為偽影噪聲估計網(wǎng)絡(luò)輸出的偽影圖。
采用全局像素級L1 損失來進一步保障整個網(wǎng)絡(luò)所輸出降噪圖像的質(zhì)量,其表達式為
本文的總損失為
本文所有實驗在包含10 名匿名患者的成對CT圖像(即每一幅LDCT 均有與之相對應的NDCT)的MAYO 數(shù)據(jù)集[30]和成對真實圖像的豬仔(Piglet)數(shù)據(jù)集[31]上進行。其中,隨機從MAYO 數(shù)據(jù)集中選取1811 對CT 圖像作為訓練集,567 幅LDCT 作為測試集;從Piglet 數(shù)據(jù)集中隨機選取2 260 幅CT 圖像作為訓練集,并將數(shù)據(jù)集中剩余的CT 圖像作為測試集。為了客觀評估本文方法的降噪性能,將其與目前比較流行的3 種降噪方法(即BM 3D[8]、REDCNN[13]和pix2pix[14])的實驗結(jié)果進行對比分析。采用峰值信噪比(peak-signal tonoise ratio,PSNR)[32]、結(jié)構(gòu)相似度(structure sim ilarity,SSIM)[33]、視覺信息保真度(visual information fidelity,VIF)[34]、信息保真度準則(information fidelity criterion,IFC)[35]及噪聲質(zhì)量評價指標(noise qualitymeasure index,NQM)[36]這5 種客觀評價指標來定量評估降噪圖像的質(zhì)量。其中,PSNR 是一種通過計算測試圖像與標準圖像之間對應像素點的灰度值差異來評價圖像質(zhì)量的指標,PSNR 值越高,表明測試圖像與NDCT 圖像之間的失真越小。SSIM 是用來衡量測試圖像與標準圖像結(jié)構(gòu)相似度的一種指標,SSIM 值越高,表明測試圖像與標準圖像的結(jié)構(gòu)越相似。VIF 和IFC 是用來計算測試圖像與標準圖像之間互信息量的評價指標,VIF(或IFC)值越高,說明圖像質(zhì)量越好。NQM 是一種從噪聲水平的角度衡量測試圖像失真程度的圖像質(zhì)量評價指標,NQM 值越高,表示降噪效果越好。
本文所有實驗均在Pytorch 平臺下使用Python語言進行,使用帶有NVIDIA GTX2 0 8 0 Ti GPU 的圖像處理設(shè)備對不同降噪網(wǎng)絡(luò)進行訓練和測試。在訓練過程中,采用基于動量的Adam[37]算法來對網(wǎng)絡(luò)進行優(yōu)化,并將參數(shù)設(shè)置為: β1=0.5 , β2=0.999,學習率為0.000 2。本文方法的迭代次數(shù)為100,圖2 為本文方法中不同損失函數(shù)值的變化曲線??芍?,隨著迭代次數(shù)增加,3 種損失函數(shù)值均呈現(xiàn)先下降后逐步穩(wěn)定的趨勢,迭代至100 次時網(wǎng)絡(luò)基本收斂。
圖2 隨迭代次數(shù)增加不同損失函數(shù)值的收斂曲線Fig.2 Network convergence curves of different loss function values as number of iterations increases
本節(jié)在MAYO 測試集中隨機選取幾種具有代表性的LDCT 進行降噪處理,并詳細分析了不同方法降噪后圖像的視覺效果。圖3 和圖4 分別從降噪圖像視覺效果與偽影噪聲抑制效果2 個角度展示了不同方法對受嚴重橫條狀偽影污染的胸部LDCT的降噪結(jié)果。仔細觀察圖3 可以發(fā)現(xiàn),LDCT 被大量呈橫條狀的條形偽影及噪聲污染,這些干擾會增加醫(yī)生對具有臨床診斷意義的病變或組織形態(tài)作出準確判斷的難度。從整體降噪效果來看,4 種方法均能在一定程度上抑制LDCT 中的偽影與噪聲。其中,BM 3D 的降噪圖像中仍然可以明顯看到大量偽影殘留,如圖3(b)中上方矩形框所示;REDCNN 的降噪圖像中存在過度平滑、紋理細節(jié)丟失等現(xiàn)象,如圖3(c)中上方矩形框所示;pix2pix 與本文方法的降噪效果良好,降噪圖像中的過平滑現(xiàn)象均得到了有效緩解,如圖3(d)中上方矩形框所示,比較而言,本文方法的降噪圖像分辨率更高,如圖3(g)中上方矩形框所示。此外,為了進一步驗證本文方法的優(yōu)越性,還通過分析不同方法降噪結(jié)果與NDCT的差值圖中偽影噪聲的殘留量或細節(jié)邊緣的保留程度來區(qū)分不同方法的降噪性能。其中,差值圖中偽影和噪聲越少,表明降噪結(jié)果與NDCT 越接近;反之,差值圖中偽影和噪聲越多,表明降噪結(jié)果與NDCT 相差越大;特別地,差值圖中細節(jié)邊緣殘留越少,表明降噪結(jié)果對細節(jié)和邊緣等保留效果越好。如圖4 所示,LDCT 與NDCT 相減所獲差值圖為理想偽影噪聲圖,其中包含大量偽影和噪聲,BM 3D、RED-CNN、pix2pix、本文方法降噪結(jié)果與NDCT 的差值圖包含偽影噪聲的程度呈以下次序:BM 3D>RED-CNN>pix2pix>本文方法。進一步觀察圖4 中ROI(a)和ROI(b)可以發(fā)現(xiàn),不同降噪結(jié)果與NDCT 的差值圖中細節(jié)邊緣的殘留量呈以下次序:BM 3D>RED-CNN>pix2pix>本文 方法。ROI 表示局部感興趣區(qū)域。由此可以看出,BM 3D 方法抑制噪聲和條狀偽影的能力有限;RED-CNN 方法能夠抑制更多的噪聲和條狀偽影,但其代價是平滑了很多邊緣細節(jié);pix2pix 方法的噪聲偽影抑制能力均優(yōu)于前2 種方法,然而其邊緣保留能力仍然不容樂觀。比較而言,本文方法降噪結(jié)果與NDCT 的差值圖中偽影噪聲最少,降噪結(jié)果與NDCT 質(zhì)量最接近,這也從側(cè)面反映了本文方法對偽影抑制能力更強,結(jié)構(gòu)保留更完整。
圖3 四種降噪方法對受橫條狀偽影污染的胸部LDCT的降噪結(jié)果Fig.3 Denoising results of 4 denoising methods on chest LDCT contaminated by horizontal stripe artifacts
圖4 圖3中不同降噪方法降噪結(jié)果與NDCT的差值圖Fig.4 Difference between denoising results of different denoising methods and NDCT shown in Fig.3
圖5 和圖6 分別展示了不同方法對含有低衰減病變或組織結(jié)構(gòu)比較豐富的腹部LDCT 的降噪結(jié)果??梢钥闯?,傳統(tǒng)BM 3D 方法的降噪效果并不理想,其降噪圖像中存在結(jié)構(gòu)失真和變形等問題;由于僅采用像素級L1 損失來約束網(wǎng)絡(luò)訓練過程,RED-CNN 的降噪圖像中模糊化現(xiàn)象比較嚴重,邊緣細節(jié)保留效果不佳;pix2pix 是一種具有較好特征提取能力的編解碼網(wǎng)絡(luò),該網(wǎng)絡(luò)除了采用像素級L1 損失外,還增加了對抗損失,這使得網(wǎng)絡(luò)能夠在一定程度上抑制過平滑現(xiàn)象。從圖5(e)和圖6(g)可以看出,本文方法在偽影噪聲抑制和細節(jié)邊緣保留2 方面的表現(xiàn)均優(yōu)于pix2pix,這主要得益于本文方法對其網(wǎng)絡(luò)結(jié)構(gòu)的改進:一方面,稠密特征增強網(wǎng)絡(luò)提高了網(wǎng)絡(luò)的特征提取能力;另一方面,方向敏感注意力子網(wǎng)絡(luò)能夠?qū)μ崛〈翟雸D像中偽影噪聲的特征起到積極作用;此外,多種損失函數(shù)的協(xié)同作用對整體網(wǎng)絡(luò)降噪性能的提高起到了保障作用。
圖5 四種降噪方法對含有低衰減病變的腹部LDCT圖像的降噪結(jié)果Fig.5 Denoising results of 4 denoising methods for abdominal LDCT image with lesions
圖6 四種降噪方法對組織結(jié)構(gòu)比較豐富的腹部LDCT圖像的降噪結(jié)果Fig.6 Denoising results of 4 denoising methods on abdomenal LDCT with rich tissue structure
為了驗證本文提出網(wǎng)絡(luò)的泛化能力,對包含LDCT 的Piglet 數(shù)據(jù)集進行了訓練與測試。圖7 展示了不同方法在Piglet 數(shù)據(jù)集上對LDCT 圖像的降噪結(jié)果。其中,LDCT 圖像(見圖7(a))質(zhì)量嚴重退化,很難準確辨認出圖像中的細微結(jié)構(gòu);觀察圖7(b)和圖7(c)中ROI 可以發(fā)現(xiàn),BM 3D 與RED-CNN 的降噪圖像中仍噪聲殘留,去噪圖像質(zhì)量較差;pix2pix方法對噪聲的抑制效果比較明顯,能夠在降噪的同時較好地保留圖像的重要結(jié)構(gòu)與邊緣;觀察圖7(g)可以發(fā)現(xiàn),與其他3 種方法相比,本文方法有效抑制了LDCT 圖像中的偽影噪聲,并更好地保留了圖像細節(jié),且降噪效果與NDCT 圖像最相近。這也說明本文降噪網(wǎng)絡(luò)具有較強的魯棒性,能夠有效抑制LDCT 圖像中的偽影噪聲。
圖7 不同降噪方法在Piglet數(shù)據(jù)集上對LDCT圖像的降噪結(jié)果Fig.7 Denoising results of different denoising methods on LDCT image on Piglet dataset
為了進一步評估本文方法降噪效果的有效性,增加了醫(yī)生的主觀評價。具體操作方法如下:從實驗數(shù)據(jù)集中隨機選取20 張樣本圖像,將這20 張LDCT 圖像,經(jīng)本文方法、BM 3D、RED-CNN、pix2pix方法分別處理后的80 張去噪圖像,以及20 張NDCT圖像,共計120 張圖像構(gòu)成用于主觀評價的圖像數(shù)據(jù)集。所有樣本圖像的質(zhì)量通過組織識別度、噪聲抑制度和整體圖像質(zhì)量3 個主觀評價特征進行評估,采用5 分主觀標準(1=不可接受,2=不合格,3=可接受,4=良好,5=優(yōu)秀)。3 位放射學專家(第1 位有8 年讀片經(jīng)驗,第2 位有24 年讀片經(jīng)驗,第3 位有15 年讀片經(jīng)驗)分別對樣本圖像進行獨立評價。對于每種方法對應的降噪圖像子集,3 個質(zhì)量分數(shù)以平均值表示。如表1 所示,LDCT 圖像得到的質(zhì)量評分遠低于NDCT 圖像,也低于各種方法處理后的圖像。與其他方法相比,本文方法處理后的圖像質(zhì)量在組織識別度、噪聲抑制度和整體圖像質(zhì)量上都最接近NDCT 圖像。進一步證明了本文方法對LDCT 圖像的去噪性能優(yōu)于其他對比方法。
表1 主觀評價得分Table 1 Subjective evaluation score
為進一步對比4 種算法的降噪性能,本節(jié)分析了不同降噪結(jié)果的量化表現(xiàn)。圖8 和圖9 分別展示了不同方法在整個MAYO 測試集和Piglet 測試集上獲取的所有降噪結(jié)果的平均PSNR 與SSIM 值表現(xiàn)情況。從圖8 中可以看出,4 種方法降噪結(jié)果平均量化指標值的表現(xiàn)呈以下次序:pix2pix <BM 3D<RED-CNN<本文方法。與其他3 種方法相比,本文降噪結(jié)果圖的量化指標值表現(xiàn)最佳。同時對不同降噪方法下PSNR 與SSIM 的平均值(MEAN)和標準差(SD)進行評估,如表2 所示??梢钥闯?,盡管本文方法降噪結(jié)果的PSNR 標準差較高,但是SSIM 值卻擁有較低的標準差,表明本文方法對不同的LDCT 圖像適應性能較好,降噪性能比較穩(wěn)定。從圖9 中可以看出,4 種方法的平均PSNR和SS I M 的量化指標分別呈以下次序:RED-CNN<BM 3D<p i x 2 p i x<本文方法,RED-CNN<p i x 2 p i x<BM 3D<本文方法,說明本文方法同樣在Piglet 數(shù)據(jù)集中的表現(xiàn)優(yōu)于其他方法。表3 展示了不同方法對2 幅具有代表性的LDCT 圖像的降噪結(jié)果的定量比較。觀察不同方法對胸部LDCT 的降噪結(jié)果可以發(fā)現(xiàn),BM 3D 降噪圖像的PSNR 和SSIM 值最低,RED-CNN 降噪圖像的VIF、IFC 與NQM 值最低。特別地,本文降噪圖像的NQM 值遠高于其他方法降噪圖像的NQM 值,表明本文方法降噪結(jié)果圖中失真程度遠遠小于其他方法,其信息保留也更加完整。觀察不同方法對腹部LDCT 的降噪結(jié)果可以發(fā)現(xiàn),在4 種方法的降噪結(jié)果中,pix2pix 降噪圖像的量化表現(xiàn)最差,BM 3D 與RED-CNN 降噪圖像的量化表現(xiàn)次之,本文方法降噪圖像的量化表現(xiàn)最好,其5 種量化指標均取得了最高值。此外,本文分析了不同方法降噪結(jié)果在局部感興趣區(qū)域的表現(xiàn)情況。如圖10 所示,分析不同方法在同一ROI 內(nèi)量化指標可以發(fā)現(xiàn),在ROI1 和ROI2 上,本文方法降噪結(jié)果的PSNR、SSIM 和VIF 值均是最高的,其次依次為RED-CNN、BM 3D 和pix2pix;分析同一方法降噪結(jié)果在不同ROI 內(nèi)的量化表現(xiàn)可以發(fā)現(xiàn),除了pix2pix 降噪圖像ROI1 的PSNR 值低于ROI2的PSNR 值,其余3 種方法降噪圖像ROI1 的PSNR、SSIM 和VIF 值均高于ROI2 的PSNR、SSIM 和VIF值。綜上,從量化角度分析本文方法的降噪效果均是最佳的。
圖8 四種降噪方法在MAYO測試集上平均PSNR與SSIM量化指標表現(xiàn)Fig.8 Average PSNR and SSIM performance of four denoising methods on MAYO test sets
圖9 四種降噪方法在Piglet測試集上平均PSNR與SSIM量化指標表現(xiàn)Fig.9 Average PSNR and SSIM performance of four denoising methods on Piglet test sets
表2 四種降噪方法在MAYO 測試集上平均PSNR 與SSIM(平均值±標準差)Table 2 Average PSNR and SSIM (MEAN±SD) of four denoising methods on MAYO test set
表3 四種降噪方法對2 幅具有代表性的LDCT 圖像的降噪結(jié)果Table 3 Denoising results of two representative LDCT images w ith four denoising methods
圖10 降噪圖 像局部ROI的PSNR、SSIM與VIF值Fig.10 PSNR, SSIM and VIF values of local ROI of denoised image
與基于CNN 的降噪網(wǎng)絡(luò)相比,本文降噪網(wǎng)絡(luò)在其基礎(chǔ)上分別增加了稠密特征增強模塊和方向敏感注意力子網(wǎng)絡(luò)。為了分析各個模塊在降噪網(wǎng)絡(luò)中所起的作用,本文做了一組消融實驗。表4 展示了不同消融網(wǎng)絡(luò)降噪結(jié)果的平均SSIM 和PSNR 值統(tǒng)計。分析數(shù)據(jù)可以發(fā)現(xiàn),雖然w/o DFF 降噪結(jié)果的量化指標值最低,w/o DA 降噪圖像的2 種量化指標值與w/o DFF 的降噪結(jié)果相比均表現(xiàn)更好,圖像質(zhì)量有所改善,但比較本文方法與w/o DA 的降噪結(jié)果可以發(fā)現(xiàn),本文方法的平均PSNR 與平均SSIM更高。進一步地,觀察消融網(wǎng)絡(luò)降噪圖像視覺效果(見圖3(e)~(g)和圖6(e)~(g)),可以發(fā)現(xiàn),w/o DFF的降噪圖像中仍然殘留部分噪聲與偽影(見圖3(e)),且降噪圖像中模糊化現(xiàn)象比較嚴重(見圖6(e))。與w/o DFF 相比,w/o DA的降噪圖像質(zhì)量有很大提升(見圖3(f)和圖6(f)),這也說明,與DA 模塊相比,DFF 模塊在整體降噪網(wǎng)絡(luò)中起到了更為關(guān)鍵的作用。進一步觀察圖3(g)與圖6(g),可以發(fā)現(xiàn),本文網(wǎng)絡(luò)降噪圖像分辨率更高,降噪效果更加顯著。綜上,本文所設(shè)計的2 個模塊均對網(wǎng)絡(luò)性能的改善起到了積極作用。此外,本文也做了一組損失函數(shù)消融實驗。如表5所示,當采用不同組合的損失函數(shù)約束網(wǎng)絡(luò),會得到不同的降噪結(jié)果。觀察數(shù)據(jù)可以發(fā)現(xiàn),當采用偽影一致性損失、偽影掩碼損失和像素級L1 損失3 個損失函數(shù)共同約束降噪網(wǎng)絡(luò)時,所獲取的降噪結(jié)果表現(xiàn)最佳。該降噪結(jié)果的量化表現(xiàn)優(yōu)于僅采用3 個損失中的1 個或2 個來約束網(wǎng)絡(luò)時所獲取的降噪結(jié)果的量化表現(xiàn)。
表4 網(wǎng)絡(luò)結(jié)構(gòu)消融對方法性能的影響Table 4 Influence of network structure ablation on method performance
表5 不同消融損失函數(shù)在測試集上降噪結(jié)果的平均PSNR 與SSIM 值Table 5 Average PSNR and SSIM values of denoising results of different ablation loss functions on test set
為了進一步分析本文方法的復雜度,分別對4 種方法在相同數(shù)據(jù)集下的訓練與測試時間進行了測試,如表6 所示。可以發(fā)現(xiàn),本文方法與RED-CNN、pix2pix 方法相比,訓練時間最長,主要原因是由于本文網(wǎng)絡(luò)結(jié)構(gòu)相對復雜,訓練時所花費的時間最久,但本文的測試時間最短。綜合視覺效果和量化指標表現(xiàn)來看,本文方法表現(xiàn)最佳。
表6 四種降噪方法的訓練與測試時間比較Table 6 Com parison of training and testing time under four denoising m ethods
1)本文方法能夠?qū)崿F(xiàn)較為優(yōu)異的降噪性能,其中,針對同一數(shù)據(jù)集內(nèi)不同類型的LDCT 圖像,能夠?qū)W習不同尺度間特征的差異性,強化網(wǎng)絡(luò)提取特征的能力,提高網(wǎng)絡(luò)的降噪性能。
2)本文方法能夠從各個角度來提取LDCT 圖像中偽影噪聲的特征,彌補了因降噪位置不準確而導致的邊緣細節(jié)丟失問題。
本文方法在一定程度上解決了LDCT 圖像降噪受不同程度噪聲影響的問題,但針對噪聲偽影難以有效分離的LDCT 圖像,如何設(shè)計出合理的網(wǎng)絡(luò)結(jié)構(gòu)來提升降噪網(wǎng)絡(luò)的性能仍然是很有研究價值的課題。