• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于隨機(jī)森林的宮頸鱗癌放化療療效預(yù)測(cè)*

      2021-02-25 12:16:32鄧成龍劉德豐劉蘭祥石清磊王浩然王永吉1
      軟件學(xué)報(bào) 2021年12期
      關(guān)鍵詞:放化療宮頸癌宮頸

      鄧成龍,關(guān) 貝,劉德豐,劉蘭祥,石清磊,王浩然,王永吉1,

      1(中國(guó)科學(xué)院 軟件研究所 協(xié)同創(chuàng)新中心,北京 100190)

      2(計(jì)算機(jī)科學(xué)國(guó)家重點(diǎn)實(shí)驗(yàn)室(中國(guó)科學(xué)院 軟件研究所),北京 100190)

      3(中國(guó)科學(xué)院大學(xué),北京 100049)

      4(秦皇島市第一醫(yī)院 核磁科,河北 秦皇島 066000)

      5(山東大學(xué) 軟件學(xué)院,山東 濟(jì)南 250101)

      宮頸癌在女性癌癥疾病中發(fā)病率較高,且致死率較高[1].引發(fā)女性患宮頸癌的主要因素是感染人乳頭瘤病毒(human papilloma virus,簡(jiǎn)稱HPV).此外,過早的性生活、免疫抑制以及吸煙都可能引發(fā)宮頸癌[2].

      宮頸癌多發(fā)于陰道和子宮之間的宮頸轉(zhuǎn)換區(qū),發(fā)展一般較為緩慢[3].國(guó)際婦產(chǎn)科聯(lián)合會(huì)FIGO(International Federation of Gynecology and Obstetrics)婦科腫瘤學(xué)委員會(huì)根據(jù)臨床上腫瘤大小、周圍組織結(jié)構(gòu)受累情況、遠(yuǎn)處轉(zhuǎn)移以及影像學(xué)和病理結(jié)果將宮頸癌病變分為I 期~IV 期.其中:I 期表現(xiàn)為癌灶局限在宮頸(包括累及宮體); II 期表現(xiàn)為癌灶已超出宮頸,但未到達(dá)盆壁,癌灶累及陰道,但未及陰道的下1/3;III 期表現(xiàn)為癌灶擴(kuò)散至盆壁,并且累及陰道下1/3,導(dǎo)致腎盂積水或無功能腎;IV 期表現(xiàn)為癌擴(kuò)散超出真骨盆或癌浸潤(rùn)膀胱黏膜或直腸粘膜,甚至遠(yuǎn)處轉(zhuǎn)移[4-6],詳見表1.

      Table 1 Criteria of FIGO in staging for cervical cancer and recommended treatment options表1 FIGO 宮頸癌分期標(biāo)準(zhǔn)及推薦療法

      不同分期的宮頸癌所對(duì)應(yīng)的治療方案不同.根據(jù)美國(guó)國(guó)家綜合癌癥網(wǎng)站NCCN(National Comprehensive Cancer Network)制定的宮頸癌治療方法,手術(shù)治療、放射治療以及化療是宮頸癌治療過程中具有根治效果的方法[7].其中,

      ? 早期宮頸癌(≤IIA 并且腫瘤到內(nèi)部宮頸口距離>5mm)主要選擇根治性宮頸切除術(shù)治療.該手術(shù)局部切除宮頸,可以保證子宮體的完整性,保存患者的生育能力[8];

      ? 中晚期宮頸癌(IIB~IV 并且腫瘤≥4cm)除腫瘤較大外,還可能出現(xiàn)宮外擴(kuò)散以及淋巴結(jié)受累.因此,進(jìn)展至這些時(shí)期的病變需要進(jìn)行腔內(nèi)放療和體外照射治療(早期宮頸癌以腔內(nèi)放療為主,體外照射為輔;出現(xiàn)宮旁浸潤(rùn)嚴(yán)重的情況以腔內(nèi)放療為輔,體外照射為主;中晚期宮頸癌需腔內(nèi)放療、體外照射并重);

      ? 對(duì)于晚期或復(fù)發(fā)轉(zhuǎn)移的患者,主要的治療手段為化療(目前多采用以順鉑為主的多藥聯(lián)合化療).

      對(duì)于IIB~IVA 期的宮頸癌患者來說,放化療是主要的治療手段.根據(jù)患者接受放化療后3 個(gè)月內(nèi)MR 圖像檢查,依據(jù)RECIST[9]標(biāo)準(zhǔn)及腫瘤臨床特征[10]對(duì)腫瘤的轉(zhuǎn)歸情況進(jìn)行判斷,將放化療結(jié)果分為完全緩解(放化療敏感)和不完全緩解(放化療不敏感)兩類,如圖1 所示(紅色區(qū)域?yàn)槟[瘤區(qū)域).如果患者接受放化療后,腫瘤出現(xiàn)不完全緩解情況,那么該患者不能繼續(xù)接受放化療,而需要探索個(gè)性化治療方案,如口服靶向藥治療等.但即使調(diào)整治療方案,該部分的患者在放化療后前兩年的無病生存率(disease free survival,簡(jiǎn)稱DFS)僅為14.3%,而腫瘤完全緩解的患者為85.7%[10].因此,在放化療療效欠佳的情況下,患者由于喪失了最佳治療時(shí)機(jī),同時(shí)化療對(duì)正常組織產(chǎn)生損傷,導(dǎo)致患者很難再進(jìn)行及時(shí)有效的治療,嚴(yán)重影響患者預(yù)后[11].因此,在宮頸癌患者治療初期預(yù)測(cè)該患者對(duì)放化療敏感性,進(jìn)而選擇合適的治療手段,提高患者的生存率具有重要意義.

      Fig.1 Complete and incomplete remission of the tumor area after radiotherapy and chemotherapy of SCC圖1 宮頸鱗癌放化療后腫瘤區(qū)域完全緩解與不完全緩解

      磁共振成像(magnetic resonance imaging,簡(jiǎn)稱MRI)不但具有良好的組織分辨率,能夠同時(shí)對(duì)宮頸及周圍組織,如盆腔內(nèi)部器官,進(jìn)行多方位、多序列地掃描[12],而且提供形態(tài)學(xué)、腫瘤功能及生物學(xué)特性方面信息[13],在宮頸癌分期及療效預(yù)測(cè)方面具有重要作用.T2WI(T2-weighted imaging)結(jié)合脂肪抑制技術(shù)可較好顯示宮頸管的形態(tài)結(jié)構(gòu)與信號(hào),為病變顯示、病變范圍及周圍組織受侵狀況評(píng)估提供良好參考[13].因此,本文旨在依據(jù)患者放化療前的宮頸MR T2WI 預(yù)測(cè)患者接受放化療后的治療療效,提出一種基于隨機(jī)森林[14]的計(jì)算機(jī)輔助預(yù)測(cè)模型.該模型首先利用小波變換及高斯拉普拉斯算子對(duì)宮頸癌MR 去噪并增強(qiáng)圖像,排除噪聲影響;其次,利用在小數(shù)據(jù)集下能準(zhǔn)確分割的U-net 模型分割腫瘤區(qū)域;在U-net 模型訓(xùn)練階段,為防止U-net 模型出現(xiàn)梯度下降甚至消失現(xiàn)象,在該模型中加入深度殘差學(xué)習(xí);然后,對(duì)分割出的腫瘤區(qū)域提取多種形狀及紋理特征,并且引入特征篩選機(jī)制對(duì)提取出的冗余及貢獻(xiàn)較小特征進(jìn)行淘汰;最后,優(yōu)化在小樣本下分類優(yōu)異的隨機(jī)森林算法對(duì)圖像進(jìn)行分類,并評(píng)估該模型在預(yù)測(cè)宮頸癌放化療療效中的價(jià)值.實(shí)驗(yàn)所用MR 都是放化療前圖像,這些圖像根據(jù)患者接受放化療后的遠(yuǎn)期治療效果分為完全緩解組與不完全緩解組.

      本文首先介紹宮頸癌相關(guān)背景.第1 節(jié)列出已存關(guān)于宮頸癌的相關(guān)工作.第2 節(jié)列出已存工作不足之處及本文研究重點(diǎn).第3 節(jié)介紹本文提出的預(yù)測(cè)模型并詳細(xì)闡述該模型下各步驟的實(shí)現(xiàn)細(xì)節(jié).第4 節(jié)列出對(duì)比實(shí)驗(yàn)結(jié)果并分析.第5 節(jié)總結(jié)全文.

      1 相關(guān)工作

      基于MRI 進(jìn)行宮頸癌放化療療效預(yù)測(cè)相關(guān)研究主要分3 個(gè)研究方向.

      第一,通過MRI 的定量參數(shù)對(duì)宮頸癌放化療療效進(jìn)行預(yù)測(cè).如:文獻(xiàn)[15]計(jì)算并比較動(dòng)態(tài)增強(qiáng)磁共振功能成像(dynamic contrast enhancement magnetic resonance imaging,簡(jiǎn)稱DCE-MRI)的定量參數(shù)Ktrans,kep,ve在腫瘤以及正常臀肌的值,論證DCE-MRI 的定量參數(shù)可以對(duì)早期放化療療效進(jìn)行評(píng)估;文獻(xiàn)[16]測(cè)量患者放化療前后DCE-MRI 的定量參數(shù)Ktrans,kep,ve的平均值,并與治療后腫瘤縮小率進(jìn)行Spearman 相關(guān)性分析,實(shí)現(xiàn)對(duì)宮頸癌患者放化療療效預(yù)測(cè);

      第二,基于MR 圖像提取宮頸癌的形態(tài)學(xué)及紋理等特征,并利用傳統(tǒng)機(jī)器學(xué)習(xí)算法預(yù)測(cè)放化療療效.如:文獻(xiàn)[17]首先通過影像醫(yī)師手動(dòng)勾畫宮頸癌病灶區(qū)域提取紋理特征,然后利用LASSO-Logistic 回歸分析,建立宮頸癌治療敏感性預(yù)測(cè)模型;

      第三,計(jì)算成像方式的參數(shù)值,預(yù)測(cè)宮頸癌放化療療效.如:文獻(xiàn)[18]基于國(guó)內(nèi)外的大數(shù)據(jù)庫,如MEDLINE,Science Citation Index database 以及中國(guó)生物醫(yī)學(xué)數(shù)據(jù)庫等已發(fā)表的研究,利用STATA 12.0 統(tǒng)計(jì)軟件進(jìn)行分析,發(fā)現(xiàn)擴(kuò)散加權(quán)磁共振成像(diffusion-weighted magnetic resonance imaging,簡(jiǎn)稱DWI)的表面彌散系數(shù)(apparent diffusion coefficient,簡(jiǎn)稱ADC)值可以預(yù)測(cè)宮頸癌放化療療效;文獻(xiàn)[19]除了研究ADC 值在預(yù)測(cè)宮頸癌患者接受放化療治療反應(yīng)外,還分析了不同b值對(duì)治療反應(yīng)的評(píng)估結(jié)果;文獻(xiàn)[20]證明DWI 預(yù)測(cè)及早期評(píng)估宮頸癌患者放化療效果有幫助,但對(duì)局部無病生存的判斷能力有限;文獻(xiàn)[21]研究了3.0T MRI 及DWI 在宮頸癌放化療治療過程中的監(jiān)測(cè)作用;文獻(xiàn)[22-25]在臨床上分別獲取宮頸癌患者接受放化療前及放化療后的DWI,計(jì)算DWI的ADC 值,驗(yàn)證ADC 值與宮頸癌放化療后腫瘤反應(yīng)的關(guān)系;文獻(xiàn)[26]利用ADC 值評(píng)估放射治療后宮頸癌細(xì)胞是否殘存;文獻(xiàn)[27]通過ADC 值預(yù)測(cè)局部晚期宮頸癌患者放化療后的生存期;文獻(xiàn)[28]通過獲取251 例宮頸癌IB2~ IVA 期宮頸癌患者在同步放化療前和療后6 周的18F-FDG PET/CT,計(jì)算該圖像的參數(shù)SUVmax 和SUVmean 值,驗(yàn)證18F-FDG PET/CT 可以預(yù)測(cè)放化療療效;文獻(xiàn)[29]研究了PET 能預(yù)測(cè)宮頸癌局部晚期患者接受標(biāo)準(zhǔn)放化療后腫瘤反映和患者存活率,方法是通過獲取療前PET 圖像和每周6 次的順鉑化療和大規(guī)模放療后PET 圖像,計(jì)算標(biāo)準(zhǔn)攝取值(SUV)和治療前后SUVmax 的比值;文獻(xiàn)[30]在宮頸癌患者M(jìn)R 圖像的冠狀面、矢狀面及水平面分別分割腫瘤區(qū)域,提取其形狀及紋理特征并輸入分類器,得到宮頸癌放化療療效預(yù)測(cè)結(jié)果.

      2 先前工作不足之處及本文研究重點(diǎn)

      MRI 技術(shù)在評(píng)估放化療后腫瘤大小方面敏感性較高,但大量文獻(xiàn)通過計(jì)算彌散加權(quán)MR 圖像(DWI)中腫瘤區(qū)域的ADC 來預(yù)測(cè)宮頸癌放化療療效.此外,還有利用DCE-MRI 的定量參數(shù)以及PET 圖像的SUV 值預(yù)測(cè)療效.這兩種方法除需大量人力,如計(jì)算腫瘤面積、腫瘤消退率等,還可能出現(xiàn)計(jì)算誤差,如計(jì)算ADC 值等.

      對(duì)于文獻(xiàn)[17]提出利用機(jī)器學(xué)習(xí)方法預(yù)測(cè)放化療療效,該方法可以有效地減少人力投入.但宮頸癌數(shù)據(jù)集相對(duì)其他數(shù)據(jù)集是極小的.而該方法只提取腫瘤紋理特征,并用較為傳統(tǒng)的方法進(jìn)行分析,可能造成預(yù)測(cè)準(zhǔn)確率低下.文獻(xiàn)[30]提取的腫瘤區(qū)域特征數(shù)量較少,精度不夠,并且提取特征后沒有對(duì)特征進(jìn)行篩選,可能最終影響分類性能.

      因此,本文根據(jù)上述問題提出基于隨機(jī)森林算法預(yù)測(cè)放化療療效.為得到準(zhǔn)確預(yù)測(cè)結(jié)果,本文利用U-net 模型準(zhǔn)確分割MR 圖像腫瘤區(qū)域,并提取腫瘤區(qū)域的形狀、大小及紋理等特征,采用小數(shù)據(jù)集下分類性能優(yōu)異的隨機(jī)森林算法預(yù)測(cè)放化療療效.

      3 實(shí)驗(yàn)方法

      依據(jù)RECIST[9]標(biāo)準(zhǔn)和腫瘤臨床特征[10],宮頸癌患者接受放化療后3 個(gè)月內(nèi)MR 圖像檢查,對(duì)腫瘤的轉(zhuǎn)歸情況進(jìn)行判斷,將放化療結(jié)果分為完全緩解(放化療敏感)和不完全緩解(放化療不敏感)兩類.現(xiàn)有文獻(xiàn)對(duì)放化療敏感性預(yù)測(cè)大多依靠局限性較大的方法或者依靠統(tǒng)計(jì)學(xué)方法,這些方法不僅耗時(shí)而且準(zhǔn)確率較低.本文根據(jù)MR圖像對(duì)腫瘤大小及放化療后腫瘤轉(zhuǎn)歸情況是最敏感的特性,提出利用宮頸MR 圖像進(jìn)行療效預(yù)測(cè).框架如圖2所示.

      Fig.2 Prediction model of radiotherapy and chemotherapy for SCC based on random forests圖2 基于隨機(jī)森林的宮頸鱗癌放化療療效預(yù)測(cè)模型

      3.1 圖像預(yù)處理

      在宮頸MRI 成像過程中,因成像對(duì)象與硬件電路兩方面的原因,導(dǎo)致MR 圖像存在生理學(xué)噪聲和熱噪聲[31].此外,由于成像機(jī)制的限制,MR 圖像的時(shí)間分辨率使得圖像的信噪比和空間分辨率降低[32],導(dǎo)致圖像組織邊界模糊.因此,為消除圖像中噪聲并增強(qiáng)圖像中組織邊緣細(xì)節(jié),使得圖像中腫瘤區(qū)域的特征更加容易提取,本文利用小波變換(wavelet transform)和高斯拉普拉斯算子(Laplacian of Gaussian,簡(jiǎn)稱LOG)對(duì)宮頸MR 圖像進(jìn)行預(yù)處理,其流程如圖3 所示(包括多尺度小波變換去噪和LOG 增強(qiáng)).

      Fig.3 Process of MR image preprocessing圖3 MR 圖像預(yù)處理流程

      3.1.1 小波變換

      MR 圖像中的噪聲屬于加性噪聲且對(duì)比度較高[33],可直接利用多尺度小波變換將MR 圖像分解為高頻部分和低頻部分.其中:噪聲主要對(duì)應(yīng)圖像分解后的高頻部分,該部分小波系數(shù)幅值較小、數(shù)目眾多;圖像中有效信息主要對(duì)應(yīng)圖像分解后的低頻部分,該部分小波系數(shù)幅值較大、數(shù)目較少[34].通過對(duì)圖像的高頻部分設(shè)置合理閾值,就可消除MR 圖像中的噪聲.

      本文分別采用7 種不同的小波基函數(shù)對(duì)MR 圖像進(jìn)行二維小波變換,分別為Haar 小波、Coiflet 小波、Daubechies 小波、Symlet 小波、Biorthogonal 小波、ReverseBior 小波及Dmeyer 小波.每一種小波基函數(shù)都經(jīng)過兩級(jí)小波變換,每次小波變換都產(chǎn)生4 組系數(shù)圖像,共產(chǎn)生56 組系數(shù)圖像用于特征提取.

      3.1.2 高斯拉普拉斯算子

      為強(qiáng)化MR 圖像中組織邊界細(xì)節(jié),增強(qiáng)MR 圖像的紋理信息,提高腫瘤區(qū)域特征提取的準(zhǔn)確度,本文利用LOG 算法對(duì)MR 圖像進(jìn)行增強(qiáng)操作.LOG 是高斯濾波和拉普拉斯算子結(jié)合生成(其中,高斯濾波對(duì)MR 圖像進(jìn)行平滑處理,拉普拉斯算子提取MR 圖像中邊緣,詳細(xì)如文獻(xiàn)[35]所述).根據(jù)LOG 公式定義,通過調(diào)整取值,可達(dá)到對(duì)MR 圖像的紋理特征強(qiáng)化目的.

      3.2 MR圖像分割

      宮頸鱗癌圖像數(shù)據(jù)相對(duì)于自然圖像數(shù)據(jù)較少,且預(yù)測(cè)宮頸鱗癌放化療療效需要精確提取MR 圖像中鱗癌區(qū)域的紋理及形狀等特征.因此,本文利用在小樣本下能準(zhǔn)確分割的U-net[36]模型(如圖4 所示:紅色虛線框內(nèi)所示跳躍連接操作,綠色虛線框內(nèi)所示殘差塊結(jié)構(gòu))來分割MR 圖像中腫瘤區(qū)域.同時(shí),為提取腫瘤區(qū)域更多特征信息,如空間信息,本文將宮頸鱗癌3D MR 圖像作為網(wǎng)絡(luò)輸入.

      Fig.4 MR image segmentation network model圖4 MR 圖像分割網(wǎng)絡(luò)模型

      圖4 所示網(wǎng)絡(luò)結(jié)構(gòu)中,卷積層(conv)都包含2 次卷積操作,卷積核大小為(n=1,2,3,4).網(wǎng)絡(luò)激活函數(shù)為修正線性單元(rectified linear unit,簡(jiǎn)稱ReLU).下采樣采用2×2×2 大小,步長(zhǎng)為2 的最大池化(max-pooling)操作.在下采樣后,將提取的特征通道數(shù)變?yōu)樵瓉? 倍.反卷積層中反卷積核大小為2×2×2,且反卷積后將特征通道數(shù)減半.跳躍連接操作是將編碼器結(jié)構(gòu)中的卷積操作獲取的特征與解碼器結(jié)構(gòu)相對(duì)應(yīng)的特征進(jìn)行連接(如圖4 中紅色虛線框所示).

      在網(wǎng)絡(luò)前向傳播過程中,隨著網(wǎng)絡(luò)層的遞增,隱藏層的輸入數(shù)據(jù)分布逐漸向激活函數(shù)取值區(qū)間的兩端產(chǎn)生偏移和變動(dòng),導(dǎo)致網(wǎng)絡(luò)收斂速度下降甚至梯度消失.因此,本文在U-net 中加入殘差學(xué)習(xí)[37](圖4 中綠色虛線框所示)來避免學(xué)習(xí)過程中產(chǎn)生此類問題.

      殘差學(xué)習(xí)通過在神經(jīng)網(wǎng)絡(luò)添加恒等映射方式構(gòu)建殘差塊結(jié)構(gòu),將網(wǎng)絡(luò)映射問題轉(zhuǎn)換為多個(gè)尺度的殘差問題,降低模型學(xué)習(xí)難度.同時(shí),恒等映射也能在網(wǎng)絡(luò)訓(xùn)練過程中將梯度通過反向傳播向淺層傳遞,提升模型訓(xùn)練效果.圖4 中的殘差單元首先通過1×1 的卷積操作對(duì)輸入數(shù)據(jù)進(jìn)行降維處理,在輸出之前,再通過1×1 的卷積進(jìn)行還原.這樣,在保證精度的前提下有效地降低網(wǎng)絡(luò)計(jì)算量.

      3.3 圖像特征提取

      分割得到圖像病灶區(qū)域后,本文對(duì)病灶區(qū)域提取6 種包括形狀及紋理特征,分別為一階統(tǒng)計(jì)量(first order features)、形狀(shape)、灰度共生矩陣(gray level co-occurrence matrix,簡(jiǎn)稱GLCM)、灰度區(qū)域大小矩陣(gray level size zone matrix,簡(jiǎn)稱GLSZM)、灰度游程矩陣(gray level run length matrix,簡(jiǎn)稱GLRLM)以及局部灰度差分矩陣(neighbouring gray tone difference matrix,簡(jiǎn)稱NGTDM),共97 個(gè)特征,詳見附錄A.

      First Order Features 通過獲取熵、灰度最小值以及灰度值方差等特征統(tǒng)計(jì)生成MR 圖像中腫瘤區(qū)域像素點(diǎn)的灰度值分布;Shape 描述MR 圖像中腫瘤區(qū)域的體積、面積以及最大直徑;GLCM,GLSZM,GLRLM 以及NGTDM 根據(jù)圖像灰度在空間上的特性及相互之間的關(guān)系,描述MR 圖像中腫瘤區(qū)域的紋理特征.

      3.4 特征篩選

      據(jù)第3.3 節(jié)描述提取的圖像特征中,存在貢獻(xiàn)較小及冗余特征,這些特征會(huì)加大模型訓(xùn)練及特征分析時(shí)間,增加模型的學(xué)習(xí)難度.因此,需對(duì)提取的腫瘤區(qū)域特征進(jìn)行篩選,以減少特征個(gè)數(shù),降低模型過擬合風(fēng)險(xiǎn),提高模型的精確度,并減少模型訓(xùn)練時(shí)間.

      特征篩選主要包括特征子集的搜索和評(píng)價(jià)過程.該方法的思想為:先產(chǎn)生一個(gè)特征子集,然后對(duì)其進(jìn)行評(píng)價(jià),根據(jù)評(píng)價(jià)結(jié)果選擇下一個(gè)特征子集并評(píng)價(jià).重復(fù)上述過程,直到無法找到下一個(gè)特征子集為止.詳細(xì)如下.

      (1) 特征子集搜索

      特征子集搜索分為前向(forward)搜索、后向(backward)搜索和雙向(bidirectional)搜索.本文采用雙向搜索方法選擇特征子集.該方法分別從完整特征集的開始和結(jié)尾處進(jìn)行遍歷,每一次迭代增加選定的相關(guān)特征,同時(shí)去掉無關(guān)特征,直到第N次迭代增加的特征構(gòu)成的特征子集評(píng)價(jià)不如第N-1 次迭代形成的特征子集評(píng)價(jià),或者每次迭代去掉一個(gè)無關(guān)特征形成的特征子集評(píng)價(jià)明顯下降為止.

      (2) 特征子集評(píng)價(jià)

      本文利用信息增益(information gain,簡(jiǎn)稱IG)作為評(píng)價(jià)特征子集的方法.信息增益公式如公式(1)所示:

      其中,假設(shè)根據(jù)特征子集A將特征集D分為V個(gè)子集{D1,D2,…,DV},H(·)表示信息熵函數(shù)(information entropy),公式如公式(2)所示:

      信息增益IG(A)越大,表示該特征子集包含的有用特征越多,訓(xùn)練隨機(jī)森林分類器效果越好.

      4 實(shí)驗(yàn)結(jié)果與分析

      4.1 實(shí)驗(yàn)設(shè)置

      ? 實(shí)驗(yàn)數(shù)據(jù)集

      根據(jù)宮頸癌細(xì)胞病理類型,可將宮頸癌分為宮頸鱗癌、宮頸腺癌、宮頸鱗腺癌、腺樣囊性癌、小細(xì)胞癌和淋巴癌[38].其中,宮頸鱗癌病例數(shù)約占宮頸癌病例數(shù)的85%[2].根據(jù)腫瘤的惡性程度,不同類型的宮頸癌又可以細(xì)分為高分化、中分化以及低分化[39].實(shí)驗(yàn)數(shù)據(jù)由85 位鱗癌IIB~IVA 期患者(其中,高分化3 例,中分化75 例,低分化7 例,共1 785 幅原始MR 圖像及對(duì)應(yīng)標(biāo)簽數(shù)據(jù))的三維T2 權(quán)重MR 圖像(詳見表2)組成.

      根據(jù)患者在臨床上接受放化療治療的遠(yuǎn)期效果,將85 例病例分為不完全緩解組和完全緩解組.其中,不完全緩解組40 例(共840 幅圖像,672 幅圖像用于訓(xùn)練,168 幅圖像用于測(cè)試),完全緩解組45 例(共945 幅圖像,756幅圖像用于訓(xùn)練,189 幅圖像用于測(cè)試).本文的所有實(shí)驗(yàn)(包括各對(duì)比算法)均在上述實(shí)驗(yàn)數(shù)據(jù)集中進(jìn)行.

      Table 2 Function of T2-weighted sequences表2 T2 權(quán)重圖像各序列作用

      所有病例的MR 圖像均為512×512×21,空間分辨率分別為0.50mm,0.50mm 以及5.2mm.MR 圖像中,宮頸鱗癌腫瘤區(qū)域由資深影像科醫(yī)生通過手動(dòng)勾畫方式對(duì)85 位患者的MR 圖像序列逐一識(shí)別并標(biāo)注(如圖5 所示:第1 行和第2 行分別是兩個(gè)患者的部分MR 圖像,紅色區(qū)域?yàn)獒t(yī)生手動(dòng)勾畫的宮頸鱗癌區(qū)域,每一行最右側(cè)圖像為宮頸癌區(qū)域分割后三維重建圖像).

      Fig.5 SCC MR images with manual labeling圖5 手動(dòng)標(biāo)記宮頸鱗癌MR 圖像示例

      ? 模型訓(xùn)練

      融合殘差結(jié)構(gòu)的U-Net 網(wǎng)絡(luò)訓(xùn)練時(shí)設(shè)定初始學(xué)習(xí)率、衰減率及動(dòng)量分別為1e-4、1e-4 和0.3,最大迭代次數(shù)為1 000.對(duì)隨機(jī)森林算法的超參數(shù)設(shè)置,如決策樹數(shù)量,是根據(jù)隨機(jī)森林在訓(xùn)練集上針對(duì)不同超參數(shù)進(jìn)行實(shí)驗(yàn)確定(詳見第4.4 節(jié)).

      在放化療療效對(duì)比實(shí)驗(yàn)中,Inception-ResNet-v2 及Inception-v4[40]網(wǎng)絡(luò)設(shè)置及訓(xùn)練策略如下.

      (1) 上述兩種網(wǎng)絡(luò)的層數(shù)及結(jié)構(gòu)等超參數(shù)設(shè)置均采用TF-slim(https://github.com/tensorflow/models/tree/ master/research/slim)代碼庫默認(rèn)值;

      (2) 由于宮頸鱗癌訓(xùn)練集數(shù)據(jù)有限,無法充分訓(xùn)練上述兩種網(wǎng)絡(luò),本文采用數(shù)據(jù)擴(kuò)增(Tensorflow 框架)策略,將完全緩解組與不完全緩解組訓(xùn)練數(shù)據(jù)中的每幅圖像分別進(jìn)行水平方向的翻轉(zhuǎn)與旋轉(zhuǎn)(角度為4,8,12,16,20 度);

      (3) 上述兩種網(wǎng)絡(luò)設(shè)定初始學(xué)習(xí)率1e-4,1 000 輪迭代后學(xué)習(xí)率設(shè)置為1e-5,共訓(xùn)練2 000 輪;衰減率及動(dòng)量分別設(shè)置為1e-4,0.3.

      ? 實(shí)驗(yàn)環(huán)境

      本文實(shí)驗(yàn)環(huán)境基于Ubuntu 18.04 操作系統(tǒng)中的Tensorflow 框架,配置NVIDIA 顯卡及深度學(xué)習(xí)庫,編程IDE為PyCharm,編程語言為Python 3.5;硬件配置:Intel(R) Core(TM) i7-8700K CPU@3.70GHz,NVIDIA GeForce GTX 1080 Ti,32GB 內(nèi)存.

      ? 分割算法評(píng)估

      為定量評(píng)估分割算法性能,本文采用3 種常見的評(píng)價(jià)標(biāo)準(zhǔn)來評(píng)估圖像分割算法準(zhǔn)確率,分別為Dice 相關(guān)系數(shù)、PPV(positive predicted value)以及敏感度(sensitivity).PPV 衡量預(yù)測(cè)的準(zhǔn)確率,Sensitivity 衡量預(yù)測(cè)的召回率,Dice 系數(shù)綜合PPV 和Sensitivity 的評(píng)價(jià)指標(biāo).計(jì)算公式如公式(3)~公式(5)所示:

      其中,P表示預(yù)測(cè)結(jié)果,T表示腫瘤區(qū)域標(biāo)記,|P∩T|表示腫瘤區(qū)域預(yù)測(cè)結(jié)果與標(biāo)記之間重疊部分.

      ? 療效預(yù)測(cè)算法評(píng)估

      本文將放化療療效問題歸結(jié)為二分類問題(完全緩解與不完全緩解),而 ROC(receiver operating characteristic)曲線在二分類問題上能有效地反映分類性能.對(duì)ROC 曲線下各部分面積求和得到AUC(area under curve),AUC 是判斷模型分類性能重要標(biāo)準(zhǔn),本文利用AUC 反映不同放化療療效預(yù)測(cè)算法準(zhǔn)確度.

      4.2 腫瘤區(qū)域分割算法對(duì)比

      4.2.1 不同損失函數(shù)對(duì)比

      本文基于U-net 分割宮頸MR 圖像中腫瘤區(qū)域.在網(wǎng)絡(luò)訓(xùn)練過程,分別使用交叉熵(cross entropy)損失函數(shù)、Dice 損失函數(shù)以及Softmax 損失函數(shù)作實(shí)驗(yàn)對(duì)比.表3 和圖6 分別列出基于不同的損失函數(shù)訓(xùn)練得到的U-net模型分割腫瘤區(qū)域的精度和結(jié)果圖.

      Table 3 Segmentation accuracy of U-net on test set with different loss functions表3 基于不同損失函數(shù)的U-net 模型在測(cè)試集上分割準(zhǔn)確率

      Fig.6 Segmentation results of U-net on test set based on different loss functions圖6 基于不同損失函數(shù)的U-net 模型在測(cè)試集上分割結(jié)果圖

      由表3 及圖6 可知,基于Softmax 損失函數(shù)的U-net 網(wǎng)絡(luò)分割腫瘤區(qū)域準(zhǔn)確率高于基于交叉熵和Dice 損失函數(shù)的分割模型.基于交叉熵?fù)p失函數(shù)的分割模型在模型訓(xùn)練階段對(duì)宮頸MR 圖像中所有像素同等考慮,但在三維宮頸MR 圖像中,腫瘤區(qū)域只占整幅MR 圖像很小部分,這使得交叉熵?fù)p失函數(shù)大量計(jì)算腫瘤區(qū)域以外的像素點(diǎn),無法對(duì)腫瘤區(qū)域的特征進(jìn)行有效地提取,導(dǎo)致分割腫瘤區(qū)域準(zhǔn)確率較低.Dice 損失函數(shù)本質(zhì)上是衡量?jī)蓚€(gè)樣本的重疊部分,在樣本極度不均勻的情況下效果較好.而本實(shí)驗(yàn)使用的數(shù)據(jù)都是同一類別,使用Dice 損失函數(shù)可能會(huì)使得U-net 網(wǎng)絡(luò)訓(xùn)練變得不穩(wěn)定,造成分割準(zhǔn)確率低.

      4.2.2 不同分割算法對(duì)比

      為驗(yàn)證加入深度殘差學(xué)習(xí)的U-net 模型能提升分割精度,本文通過與未加入深度殘差學(xué)習(xí)的U-net 模型、閾值分割、全卷積網(wǎng)絡(luò)(FCN)以及DeepMedic+CFR[41]模型進(jìn)行實(shí)驗(yàn)對(duì)比.各模型分割腫瘤區(qū)域的平均分割精度見表4,分割結(jié)果如圖7 所示.

      Table 4 Segmentation accuracy of different algorithms on test set表4 不同分割算法在測(cè)試集上分割準(zhǔn)確率

      Fig.7 Segmentation results obtained by different algorithms on test set圖7 不同算法在測(cè)試集上分割結(jié)果圖

      從表4 可知:深度殘差學(xué)習(xí)能降低U-net 網(wǎng)絡(luò)的擬合難度,使得U-net 模型在Dice 系數(shù)、PPV 及Sensitivity標(biāo)準(zhǔn)上比原始U-net 模型分割準(zhǔn)確率分別高0.061、0.057 及0.042 個(gè)百分點(diǎn).基于閾值分割模型首先需要確定腫瘤區(qū)域的大致位置,然后才能進(jìn)行分割.但腫瘤的形狀及位置復(fù)雜多變,確定某一例宮頸鱗癌腫瘤區(qū)域位置不能推廣到其他患者的腫瘤區(qū)域,所以分割精度較低.FCN 模型雖然在分割上提升了效率與準(zhǔn)確率,但沒有充分考慮像素與像素之間的關(guān)系;且在訓(xùn)練階段沒有進(jìn)行充分地訓(xùn)練,導(dǎo)致分割準(zhǔn)確率低于本文方法.DeepMedic+CRF模型在分割腦腫瘤上取得了不錯(cuò)的成績(jī),但在本實(shí)驗(yàn)中分割準(zhǔn)確率低于U-Net+Resblock.可能因?yàn)閷m頸鱗癌數(shù)據(jù)少,導(dǎo)致網(wǎng)絡(luò)模型在訓(xùn)練階段沒有使參數(shù)最優(yōu)化,使得分割的準(zhǔn)確率低.

      4.3 腫瘤區(qū)域特征篩選

      本文利用U-net 模型分割腫瘤區(qū)域后,對(duì)腫瘤區(qū)域提取6 種97 個(gè)特征,包括紋理及形狀等特征.宮頸鱗癌實(shí)驗(yàn)數(shù)據(jù)集包含1 785 幅圖像,共提取173 145 個(gè)特征.但提取的特征存在貢獻(xiàn)較小及冗余特征,因此,本文利用雙向特征搜索及信息增益對(duì)特征集進(jìn)行篩選,篩選結(jié)果見表5.

      Table 5 Types of tumor area features and number before and after screening表5 腫瘤區(qū)域特征種類及篩選前后數(shù)量

      4.4 放化療療效預(yù)測(cè)實(shí)驗(yàn)對(duì)比

      本文基于隨機(jī)森林算法預(yù)測(cè)放化療不敏感的宮頸鱗癌患者.實(shí)驗(yàn)將療效預(yù)測(cè)問題歸結(jié)為分類問題(完全緩解或不完全緩解兩類).因此,為了驗(yàn)證本文方法的有效性,加入Inception-ResNet-v2 算法以及Inception-v4[40]算法作為預(yù)測(cè)療效效果對(duì)比模型.通過多種實(shí)驗(yàn)驗(yàn)證算法的有效性,實(shí)驗(yàn)包括決策樹數(shù)量實(shí)驗(yàn)、決策樹剪枝策略實(shí)驗(yàn)以及不同預(yù)測(cè)算法對(duì)比實(shí)驗(yàn).實(shí)驗(yàn)所用AUC 取值范圍是0.5~1,0.5 對(duì)應(yīng)隨機(jī)猜想模型,1 對(duì)應(yīng)理想模型.

      4.4.1 決策樹數(shù)量實(shí)驗(yàn)

      隨機(jī)森林通過集成大量決策樹達(dá)到較好的泛化性能,但隨機(jī)森林中決策樹數(shù)量對(duì)模型有重要影響.為了使療效預(yù)測(cè)算法性能達(dá)到最優(yōu),本實(shí)驗(yàn)在保持最優(yōu)劃分屬性選擇標(biāo)準(zhǔn)與最大特征數(shù)等參數(shù)不變的前提下,對(duì)包含不同數(shù)量決策樹的隨機(jī)森林算法在訓(xùn)練集上預(yù)測(cè)放化療療效,實(shí)驗(yàn)結(jié)果如圖8 所示.

      Fig.8 Prediction results on training set based on the number of different decision trees圖8 訓(xùn)練集上基于不同決策樹數(shù)量預(yù)測(cè)結(jié)果

      實(shí)驗(yàn)結(jié)果表明:隨著決策樹數(shù)量的增加,隨機(jī)森林的預(yù)測(cè)性能也在提升.當(dāng)決策樹數(shù)量為55 時(shí),預(yù)測(cè)性能達(dá)到最優(yōu).之后,隨著決策樹數(shù)量的增加,預(yù)測(cè)性能出現(xiàn)下降趨勢(shì).可能因?yàn)殡S著決策樹數(shù)量增多,隨機(jī)森林模型的復(fù)雜度增大,模型的泛化能力下降,出現(xiàn)過擬合現(xiàn)象.因此,本文將隨機(jī)森林中決策樹數(shù)量設(shè)置為55 進(jìn)行以后的預(yù)測(cè)實(shí)驗(yàn).

      4.4.2 決策樹剪枝策略實(shí)驗(yàn)

      對(duì)隨機(jī)森林中的決策樹進(jìn)行剪枝可以最大限度地平衡模型復(fù)雜度與模型泛化性能.本實(shí)驗(yàn)在與剪枝參數(shù)有關(guān)的最大特征數(shù)量上對(duì)隨機(jī)森林預(yù)測(cè)放化療療效進(jìn)行實(shí)驗(yàn).

      最大特征數(shù)量不但能影響決策樹的復(fù)雜度,而且還影響隨機(jī)森林模型中不同決策樹之間的關(guān)聯(lián)程度.假設(shè) 共有N個(gè)特征用于決策樹的構(gòu)造,本實(shí)驗(yàn)分別設(shè)置N,log2N以及為決策樹生成過程中使用到的最大特征數(shù) 量.圖9 展示了在訓(xùn)練集上基于不同最大特征數(shù)下放化療療效預(yù)測(cè)結(jié)果.

      Fig.9 Prediction results on training set based on different maximum feature quantity圖9 訓(xùn)練集上基于不同最大特征數(shù)量預(yù)測(cè)結(jié)果

      根據(jù)圖9 可知:將最大特征數(shù)量設(shè)置為log2N時(shí),療效預(yù)測(cè)結(jié)果達(dá)到最優(yōu);而使用全部特征來生成決策樹的預(yù)測(cè)結(jié)果最低.

      4.4.3 不同預(yù)測(cè)算法對(duì)比

      由于目前宮頸癌療效預(yù)測(cè)方法較少,因此,為驗(yàn)證本文提出的放化療療效預(yù)測(cè)算法優(yōu)于其他算法,選取目前圖像分類準(zhǔn)確率較高的兩種算法(Inception-ResNet-v2 和Inception-v4)、文獻(xiàn)[17]方法與本文算法在訓(xùn)練數(shù)據(jù)集及測(cè)試數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn)對(duì)比.圖10、圖11 分別展示了4 種算法在訓(xùn)練集及測(cè)試集上預(yù)測(cè)放化療療效準(zhǔn)確率.

      Fig.10 Prediction results obtained by different classification algorithms on training set圖10 不同分類算法在訓(xùn)練集上預(yù)測(cè)結(jié)果

      Fig.11 Prediction results obtained by different classification algorithms on test set圖11 不同分類算法在測(cè)試集上預(yù)測(cè)結(jié)果

      根據(jù)圖11 可知:本文利用隨機(jī)森林算法預(yù)測(cè)宮頸鱗癌放化療療效的AUC 值達(dá)到0.921,分別高于其他兩種神經(jīng)網(wǎng)絡(luò)分類算法.Inception-ResNet-v2 和Inception-v4 模型雖然分類性能優(yōu)越,但在數(shù)據(jù)量較少的情況下分類效果欠佳.文獻(xiàn)[17]只提取了紋理特征,導(dǎo)致描述腫瘤的特征數(shù)量及種類不足,使得LASSO-Logistic 建立的宮頸癌治療敏感性模型預(yù)測(cè)療效結(jié)果的AUC 值僅為0.7867,遠(yuǎn)低于本文采用的預(yù)測(cè)模型.

      5 總 結(jié)

      本文針對(duì)部分宮頸鱗癌患者對(duì)放化療不敏感的問題,提出了基于隨機(jī)森林算法的療效預(yù)測(cè)模型.在該模型中,為提高M(jìn)R 圖像腫瘤區(qū)域的分割精度,采用了在小樣本下分割性能較好的U-net 模型.同時(shí),為防止U-net 模型訓(xùn)練階段出現(xiàn)梯度消失情況,在U-net 模型中加入了殘差學(xué)習(xí).此外,為訓(xùn)練泛化能力較強(qiáng)的隨機(jī)森林模型,實(shí)驗(yàn)對(duì)提取的圖像特征進(jìn)行篩選,并調(diào)整了隨機(jī)森林中決策樹的數(shù)量以及訓(xùn)練最大特征數(shù)量.實(shí)驗(yàn)結(jié)果表明:本文提出的預(yù)測(cè)模型在分割腫瘤區(qū)域敏感性達(dá)到0.801,預(yù)測(cè)放化療療效的準(zhǔn)確度達(dá)到0.921.

      本文未來工作包括:第一,開發(fā)基于不同權(quán)重類型圖像的預(yù)測(cè)模型,包括T1W1,DWI 等MR 圖像,綜合運(yùn)用多種權(quán)重類型的圖像可以得到更全面的診斷信息,進(jìn)一步提高宮頸鱗癌放化療療效預(yù)測(cè)性能;第二,未來將收集更多病例數(shù),尤其是部分少見病理類型,進(jìn)一步豐富實(shí)驗(yàn)數(shù)據(jù)集來訓(xùn)練預(yù)測(cè)模型,提升模型預(yù)測(cè)能力.

      致謝在此,我們向?qū)Ρ疚墓ぷ魈峁椭椭С值耐幸约皩?duì)本文提出寶貴意見的各位審稿專家表示衷心的感謝.

      附錄A.特征種類及數(shù)量

      Table A.1 Type and quantity of features表A.1 特征種類和數(shù)量

      Table A.1 Type and quantity of features (Continued 1)表A.1 特征種類和數(shù)量(續(xù)1)

      Table A.1 Type and quantity of features (Continued 2)表A.1 特征種類和數(shù)量(續(xù)2)

      猜你喜歡
      放化療宮頸癌宮頸
      中老年女性的宮頸癌預(yù)防
      懷孕后宮頸管短怎么辦
      這幾種“宮頸糜爛”需要治療
      HPV感染——“宮頸的感冒”
      直腸癌新輔助放化療后,“等等再看”能否成為主流?
      Hepsin及HMGB-1在宮頸癌組織中的表達(dá)與侵襲性相關(guān)性分析
      E-cadherin、Ezrin在宮頸癌組織中的表達(dá)及臨床意義
      食管疾病(2015年3期)2015-12-05 01:45:07
      高危宮頸癌術(shù)后同步放化療與單純放療的隨機(jī)對(duì)照研究
      肝內(nèi)膽管癌行全身放化療后緩解一例
      晚期NSCLC同步放化療和EGFR-TKI治療的臨床研究進(jìn)展
      邢台县| 广汉市| 探索| 建水县| 田东县| 阜平县| 松桃| 双柏县| 庆云县| 阿拉善左旗| 临猗县| 葵青区| 苏州市| 海安县| 房山区| 小金县| 白山市| 三门县| 阜康市| 砀山县| 玛曲县| 林甸县| 丹棱县| 游戏| 南平市| 策勒县| 康保县| 永定县| 兴城市| 慈利县| 梁河县| 新郑市| 靖边县| 天水市| 无为县| 闵行区| 安丘市| 中方县| 开平市| 特克斯县| 安多县|