鄧成龍,關(guān) 貝,劉德豐,劉蘭祥,石清磊,王浩然,王永吉1,
1(中國(guó)科學(xué)院 軟件研究所 協(xié)同創(chuàng)新中心,北京 100190)
2(計(jì)算機(jī)科學(xué)國(guó)家重點(diǎn)實(shí)驗(yàn)室(中國(guó)科學(xué)院 軟件研究所),北京 100190)
3(中國(guó)科學(xué)院大學(xué),北京 100049)
4(秦皇島市第一醫(yī)院 核磁科,河北 秦皇島 066000)
5(山東大學(xué) 軟件學(xué)院,山東 濟(jì)南 250101)
宮頸癌在女性癌癥疾病中發(fā)病率較高,且致死率較高[1].引發(fā)女性患宮頸癌的主要因素是感染人乳頭瘤病毒(human papilloma virus,簡(jiǎn)稱HPV).此外,過早的性生活、免疫抑制以及吸煙都可能引發(fā)宮頸癌[2].
宮頸癌多發(fā)于陰道和子宮之間的宮頸轉(zhuǎn)換區(qū),發(fā)展一般較為緩慢[3].國(guó)際婦產(chǎn)科聯(lián)合會(huì)FIGO(International Federation of Gynecology and Obstetrics)婦科腫瘤學(xué)委員會(huì)根據(jù)臨床上腫瘤大小、周圍組織結(jié)構(gòu)受累情況、遠(yuǎn)處轉(zhuǎn)移以及影像學(xué)和病理結(jié)果將宮頸癌病變分為I 期~IV 期.其中:I 期表現(xiàn)為癌灶局限在宮頸(包括累及宮體); II 期表現(xiàn)為癌灶已超出宮頸,但未到達(dá)盆壁,癌灶累及陰道,但未及陰道的下1/3;III 期表現(xiàn)為癌灶擴(kuò)散至盆壁,并且累及陰道下1/3,導(dǎo)致腎盂積水或無功能腎;IV 期表現(xiàn)為癌擴(kuò)散超出真骨盆或癌浸潤(rùn)膀胱黏膜或直腸粘膜,甚至遠(yuǎn)處轉(zhuǎn)移[4-6],詳見表1.
Table 1 Criteria of FIGO in staging for cervical cancer and recommended treatment options表1 FIGO 宮頸癌分期標(biāo)準(zhǔn)及推薦療法
不同分期的宮頸癌所對(duì)應(yīng)的治療方案不同.根據(jù)美國(guó)國(guó)家綜合癌癥網(wǎng)站NCCN(National Comprehensive Cancer Network)制定的宮頸癌治療方法,手術(shù)治療、放射治療以及化療是宮頸癌治療過程中具有根治效果的方法[7].其中,
? 早期宮頸癌(≤IIA 并且腫瘤到內(nèi)部宮頸口距離>5mm)主要選擇根治性宮頸切除術(shù)治療.該手術(shù)局部切除宮頸,可以保證子宮體的完整性,保存患者的生育能力[8];
? 中晚期宮頸癌(IIB~IV 并且腫瘤≥4cm)除腫瘤較大外,還可能出現(xiàn)宮外擴(kuò)散以及淋巴結(jié)受累.因此,進(jìn)展至這些時(shí)期的病變需要進(jìn)行腔內(nèi)放療和體外照射治療(早期宮頸癌以腔內(nèi)放療為主,體外照射為輔;出現(xiàn)宮旁浸潤(rùn)嚴(yán)重的情況以腔內(nèi)放療為輔,體外照射為主;中晚期宮頸癌需腔內(nèi)放療、體外照射并重);
? 對(duì)于晚期或復(fù)發(fā)轉(zhuǎn)移的患者,主要的治療手段為化療(目前多采用以順鉑為主的多藥聯(lián)合化療).
對(duì)于IIB~IVA 期的宮頸癌患者來說,放化療是主要的治療手段.根據(jù)患者接受放化療后3 個(gè)月內(nèi)MR 圖像檢查,依據(jù)RECIST[9]標(biāo)準(zhǔn)及腫瘤臨床特征[10]對(duì)腫瘤的轉(zhuǎn)歸情況進(jìn)行判斷,將放化療結(jié)果分為完全緩解(放化療敏感)和不完全緩解(放化療不敏感)兩類,如圖1 所示(紅色區(qū)域?yàn)槟[瘤區(qū)域).如果患者接受放化療后,腫瘤出現(xiàn)不完全緩解情況,那么該患者不能繼續(xù)接受放化療,而需要探索個(gè)性化治療方案,如口服靶向藥治療等.但即使調(diào)整治療方案,該部分的患者在放化療后前兩年的無病生存率(disease free survival,簡(jiǎn)稱DFS)僅為14.3%,而腫瘤完全緩解的患者為85.7%[10].因此,在放化療療效欠佳的情況下,患者由于喪失了最佳治療時(shí)機(jī),同時(shí)化療對(duì)正常組織產(chǎn)生損傷,導(dǎo)致患者很難再進(jìn)行及時(shí)有效的治療,嚴(yán)重影響患者預(yù)后[11].因此,在宮頸癌患者治療初期預(yù)測(cè)該患者對(duì)放化療敏感性,進(jìn)而選擇合適的治療手段,提高患者的生存率具有重要意義.
Fig.1 Complete and incomplete remission of the tumor area after radiotherapy and chemotherapy of SCC圖1 宮頸鱗癌放化療后腫瘤區(qū)域完全緩解與不完全緩解
磁共振成像(magnetic resonance imaging,簡(jiǎn)稱MRI)不但具有良好的組織分辨率,能夠同時(shí)對(duì)宮頸及周圍組織,如盆腔內(nèi)部器官,進(jìn)行多方位、多序列地掃描[12],而且提供形態(tài)學(xué)、腫瘤功能及生物學(xué)特性方面信息[13],在宮頸癌分期及療效預(yù)測(cè)方面具有重要作用.T2WI(T2-weighted imaging)結(jié)合脂肪抑制技術(shù)可較好顯示宮頸管的形態(tài)結(jié)構(gòu)與信號(hào),為病變顯示、病變范圍及周圍組織受侵狀況評(píng)估提供良好參考[13].因此,本文旨在依據(jù)患者放化療前的宮頸MR T2WI 預(yù)測(cè)患者接受放化療后的治療療效,提出一種基于隨機(jī)森林[14]的計(jì)算機(jī)輔助預(yù)測(cè)模型.該模型首先利用小波變換及高斯拉普拉斯算子對(duì)宮頸癌MR 去噪并增強(qiáng)圖像,排除噪聲影響;其次,利用在小數(shù)據(jù)集下能準(zhǔn)確分割的U-net 模型分割腫瘤區(qū)域;在U-net 模型訓(xùn)練階段,為防止U-net 模型出現(xiàn)梯度下降甚至消失現(xiàn)象,在該模型中加入深度殘差學(xué)習(xí);然后,對(duì)分割出的腫瘤區(qū)域提取多種形狀及紋理特征,并且引入特征篩選機(jī)制對(duì)提取出的冗余及貢獻(xiàn)較小特征進(jìn)行淘汰;最后,優(yōu)化在小樣本下分類優(yōu)異的隨機(jī)森林算法對(duì)圖像進(jìn)行分類,并評(píng)估該模型在預(yù)測(cè)宮頸癌放化療療效中的價(jià)值.實(shí)驗(yàn)所用MR 都是放化療前圖像,這些圖像根據(jù)患者接受放化療后的遠(yuǎn)期治療效果分為完全緩解組與不完全緩解組.
本文首先介紹宮頸癌相關(guān)背景.第1 節(jié)列出已存關(guān)于宮頸癌的相關(guān)工作.第2 節(jié)列出已存工作不足之處及本文研究重點(diǎn).第3 節(jié)介紹本文提出的預(yù)測(cè)模型并詳細(xì)闡述該模型下各步驟的實(shí)現(xiàn)細(xì)節(jié).第4 節(jié)列出對(duì)比實(shí)驗(yàn)結(jié)果并分析.第5 節(jié)總結(jié)全文.
基于MRI 進(jìn)行宮頸癌放化療療效預(yù)測(cè)相關(guān)研究主要分3 個(gè)研究方向.
第一,通過MRI 的定量參數(shù)對(duì)宮頸癌放化療療效進(jìn)行預(yù)測(cè).如:文獻(xiàn)[15]計(jì)算并比較動(dòng)態(tài)增強(qiáng)磁共振功能成像(dynamic contrast enhancement magnetic resonance imaging,簡(jiǎn)稱DCE-MRI)的定量參數(shù)Ktrans,kep,ve在腫瘤以及正常臀肌的值,論證DCE-MRI 的定量參數(shù)可以對(duì)早期放化療療效進(jìn)行評(píng)估;文獻(xiàn)[16]測(cè)量患者放化療前后DCE-MRI 的定量參數(shù)Ktrans,kep,ve的平均值,并與治療后腫瘤縮小率進(jìn)行Spearman 相關(guān)性分析,實(shí)現(xiàn)對(duì)宮頸癌患者放化療療效預(yù)測(cè);
第二,基于MR 圖像提取宮頸癌的形態(tài)學(xué)及紋理等特征,并利用傳統(tǒng)機(jī)器學(xué)習(xí)算法預(yù)測(cè)放化療療效.如:文獻(xiàn)[17]首先通過影像醫(yī)師手動(dòng)勾畫宮頸癌病灶區(qū)域提取紋理特征,然后利用LASSO-Logistic 回歸分析,建立宮頸癌治療敏感性預(yù)測(cè)模型;
第三,計(jì)算成像方式的參數(shù)值,預(yù)測(cè)宮頸癌放化療療效.如:文獻(xiàn)[18]基于國(guó)內(nèi)外的大數(shù)據(jù)庫,如MEDLINE,Science Citation Index database 以及中國(guó)生物醫(yī)學(xué)數(shù)據(jù)庫等已發(fā)表的研究,利用STATA 12.0 統(tǒng)計(jì)軟件進(jìn)行分析,發(fā)現(xiàn)擴(kuò)散加權(quán)磁共振成像(diffusion-weighted magnetic resonance imaging,簡(jiǎn)稱DWI)的表面彌散系數(shù)(apparent diffusion coefficient,簡(jiǎn)稱ADC)值可以預(yù)測(cè)宮頸癌放化療療效;文獻(xiàn)[19]除了研究ADC 值在預(yù)測(cè)宮頸癌患者接受放化療治療反應(yīng)外,還分析了不同b值對(duì)治療反應(yīng)的評(píng)估結(jié)果;文獻(xiàn)[20]證明DWI 預(yù)測(cè)及早期評(píng)估宮頸癌患者放化療效果有幫助,但對(duì)局部無病生存的判斷能力有限;文獻(xiàn)[21]研究了3.0T MRI 及DWI 在宮頸癌放化療治療過程中的監(jiān)測(cè)作用;文獻(xiàn)[22-25]在臨床上分別獲取宮頸癌患者接受放化療前及放化療后的DWI,計(jì)算DWI的ADC 值,驗(yàn)證ADC 值與宮頸癌放化療后腫瘤反應(yīng)的關(guān)系;文獻(xiàn)[26]利用ADC 值評(píng)估放射治療后宮頸癌細(xì)胞是否殘存;文獻(xiàn)[27]通過ADC 值預(yù)測(cè)局部晚期宮頸癌患者放化療后的生存期;文獻(xiàn)[28]通過獲取251 例宮頸癌IB2~ IVA 期宮頸癌患者在同步放化療前和療后6 周的18F-FDG PET/CT,計(jì)算該圖像的參數(shù)SUVmax 和SUVmean 值,驗(yàn)證18F-FDG PET/CT 可以預(yù)測(cè)放化療療效;文獻(xiàn)[29]研究了PET 能預(yù)測(cè)宮頸癌局部晚期患者接受標(biāo)準(zhǔn)放化療后腫瘤反映和患者存活率,方法是通過獲取療前PET 圖像和每周6 次的順鉑化療和大規(guī)模放療后PET 圖像,計(jì)算標(biāo)準(zhǔn)攝取值(SUV)和治療前后SUVmax 的比值;文獻(xiàn)[30]在宮頸癌患者M(jìn)R 圖像的冠狀面、矢狀面及水平面分別分割腫瘤區(qū)域,提取其形狀及紋理特征并輸入分類器,得到宮頸癌放化療療效預(yù)測(cè)結(jié)果.
MRI 技術(shù)在評(píng)估放化療后腫瘤大小方面敏感性較高,但大量文獻(xiàn)通過計(jì)算彌散加權(quán)MR 圖像(DWI)中腫瘤區(qū)域的ADC 來預(yù)測(cè)宮頸癌放化療療效.此外,還有利用DCE-MRI 的定量參數(shù)以及PET 圖像的SUV 值預(yù)測(cè)療效.這兩種方法除需大量人力,如計(jì)算腫瘤面積、腫瘤消退率等,還可能出現(xiàn)計(jì)算誤差,如計(jì)算ADC 值等.
對(duì)于文獻(xiàn)[17]提出利用機(jī)器學(xué)習(xí)方法預(yù)測(cè)放化療療效,該方法可以有效地減少人力投入.但宮頸癌數(shù)據(jù)集相對(duì)其他數(shù)據(jù)集是極小的.而該方法只提取腫瘤紋理特征,并用較為傳統(tǒng)的方法進(jìn)行分析,可能造成預(yù)測(cè)準(zhǔn)確率低下.文獻(xiàn)[30]提取的腫瘤區(qū)域特征數(shù)量較少,精度不夠,并且提取特征后沒有對(duì)特征進(jìn)行篩選,可能最終影響分類性能.
因此,本文根據(jù)上述問題提出基于隨機(jī)森林算法預(yù)測(cè)放化療療效.為得到準(zhǔn)確預(yù)測(cè)結(jié)果,本文利用U-net 模型準(zhǔn)確分割MR 圖像腫瘤區(qū)域,并提取腫瘤區(qū)域的形狀、大小及紋理等特征,采用小數(shù)據(jù)集下分類性能優(yōu)異的隨機(jī)森林算法預(yù)測(cè)放化療療效.
依據(jù)RECIST[9]標(biāo)準(zhǔn)和腫瘤臨床特征[10],宮頸癌患者接受放化療后3 個(gè)月內(nèi)MR 圖像檢查,對(duì)腫瘤的轉(zhuǎn)歸情況進(jìn)行判斷,將放化療結(jié)果分為完全緩解(放化療敏感)和不完全緩解(放化療不敏感)兩類.現(xiàn)有文獻(xiàn)對(duì)放化療敏感性預(yù)測(cè)大多依靠局限性較大的方法或者依靠統(tǒng)計(jì)學(xué)方法,這些方法不僅耗時(shí)而且準(zhǔn)確率較低.本文根據(jù)MR圖像對(duì)腫瘤大小及放化療后腫瘤轉(zhuǎn)歸情況是最敏感的特性,提出利用宮頸MR 圖像進(jìn)行療效預(yù)測(cè).框架如圖2所示.
Fig.2 Prediction model of radiotherapy and chemotherapy for SCC based on random forests圖2 基于隨機(jī)森林的宮頸鱗癌放化療療效預(yù)測(cè)模型
在宮頸MRI 成像過程中,因成像對(duì)象與硬件電路兩方面的原因,導(dǎo)致MR 圖像存在生理學(xué)噪聲和熱噪聲[31].此外,由于成像機(jī)制的限制,MR 圖像的時(shí)間分辨率使得圖像的信噪比和空間分辨率降低[32],導(dǎo)致圖像組織邊界模糊.因此,為消除圖像中噪聲并增強(qiáng)圖像中組織邊緣細(xì)節(jié),使得圖像中腫瘤區(qū)域的特征更加容易提取,本文利用小波變換(wavelet transform)和高斯拉普拉斯算子(Laplacian of Gaussian,簡(jiǎn)稱LOG)對(duì)宮頸MR 圖像進(jìn)行預(yù)處理,其流程如圖3 所示(包括多尺度小波變換去噪和LOG 增強(qiáng)).
Fig.3 Process of MR image preprocessing圖3 MR 圖像預(yù)處理流程
3.1.1 小波變換
MR 圖像中的噪聲屬于加性噪聲且對(duì)比度較高[33],可直接利用多尺度小波變換將MR 圖像分解為高頻部分和低頻部分.其中:噪聲主要對(duì)應(yīng)圖像分解后的高頻部分,該部分小波系數(shù)幅值較小、數(shù)目眾多;圖像中有效信息主要對(duì)應(yīng)圖像分解后的低頻部分,該部分小波系數(shù)幅值較大、數(shù)目較少[34].通過對(duì)圖像的高頻部分設(shè)置合理閾值,就可消除MR 圖像中的噪聲.
本文分別采用7 種不同的小波基函數(shù)對(duì)MR 圖像進(jìn)行二維小波變換,分別為Haar 小波、Coiflet 小波、Daubechies 小波、Symlet 小波、Biorthogonal 小波、ReverseBior 小波及Dmeyer 小波.每一種小波基函數(shù)都經(jīng)過兩級(jí)小波變換,每次小波變換都產(chǎn)生4 組系數(shù)圖像,共產(chǎn)生56 組系數(shù)圖像用于特征提取.
3.1.2 高斯拉普拉斯算子
為強(qiáng)化MR 圖像中組織邊界細(xì)節(jié),增強(qiáng)MR 圖像的紋理信息,提高腫瘤區(qū)域特征提取的準(zhǔn)確度,本文利用LOG 算法對(duì)MR 圖像進(jìn)行增強(qiáng)操作.LOG 是高斯濾波和拉普拉斯算子結(jié)合生成(其中,高斯濾波對(duì)MR 圖像進(jìn)行平滑處理,拉普拉斯算子提取MR 圖像中邊緣,詳細(xì)如文獻(xiàn)[35]所述).根據(jù)LOG 公式定義,通過調(diào)整取值,可達(dá)到對(duì)MR 圖像的紋理特征強(qiáng)化目的.
宮頸鱗癌圖像數(shù)據(jù)相對(duì)于自然圖像數(shù)據(jù)較少,且預(yù)測(cè)宮頸鱗癌放化療療效需要精確提取MR 圖像中鱗癌區(qū)域的紋理及形狀等特征.因此,本文利用在小樣本下能準(zhǔn)確分割的U-net[36]模型(如圖4 所示:紅色虛線框內(nèi)所示跳躍連接操作,綠色虛線框內(nèi)所示殘差塊結(jié)構(gòu))來分割MR 圖像中腫瘤區(qū)域.同時(shí),為提取腫瘤區(qū)域更多特征信息,如空間信息,本文將宮頸鱗癌3D MR 圖像作為網(wǎng)絡(luò)輸入.
Fig.4 MR image segmentation network model圖4 MR 圖像分割網(wǎng)絡(luò)模型
圖4 所示網(wǎng)絡(luò)結(jié)構(gòu)中,卷積層(conv)都包含2 次卷積操作,卷積核大小為(n=1,2,3,4).網(wǎng)絡(luò)激活函數(shù)為修正線性單元(rectified linear unit,簡(jiǎn)稱ReLU).下采樣采用2×2×2 大小,步長(zhǎng)為2 的最大池化(max-pooling)操作.在下采樣后,將提取的特征通道數(shù)變?yōu)樵瓉? 倍.反卷積層中反卷積核大小為2×2×2,且反卷積后將特征通道數(shù)減半.跳躍連接操作是將編碼器結(jié)構(gòu)中的卷積操作獲取的特征與解碼器結(jié)構(gòu)相對(duì)應(yīng)的特征進(jìn)行連接(如圖4 中紅色虛線框所示).
在網(wǎng)絡(luò)前向傳播過程中,隨著網(wǎng)絡(luò)層的遞增,隱藏層的輸入數(shù)據(jù)分布逐漸向激活函數(shù)取值區(qū)間的兩端產(chǎn)生偏移和變動(dòng),導(dǎo)致網(wǎng)絡(luò)收斂速度下降甚至梯度消失.因此,本文在U-net 中加入殘差學(xué)習(xí)[37](圖4 中綠色虛線框所示)來避免學(xué)習(xí)過程中產(chǎn)生此類問題.
殘差學(xué)習(xí)通過在神經(jīng)網(wǎng)絡(luò)添加恒等映射方式構(gòu)建殘差塊結(jié)構(gòu),將網(wǎng)絡(luò)映射問題轉(zhuǎn)換為多個(gè)尺度的殘差問題,降低模型學(xué)習(xí)難度.同時(shí),恒等映射也能在網(wǎng)絡(luò)訓(xùn)練過程中將梯度通過反向傳播向淺層傳遞,提升模型訓(xùn)練效果.圖4 中的殘差單元首先通過1×1 的卷積操作對(duì)輸入數(shù)據(jù)進(jìn)行降維處理,在輸出之前,再通過1×1 的卷積進(jìn)行還原.這樣,在保證精度的前提下有效地降低網(wǎng)絡(luò)計(jì)算量.
分割得到圖像病灶區(qū)域后,本文對(duì)病灶區(qū)域提取6 種包括形狀及紋理特征,分別為一階統(tǒng)計(jì)量(first order features)、形狀(shape)、灰度共生矩陣(gray level co-occurrence matrix,簡(jiǎn)稱GLCM)、灰度區(qū)域大小矩陣(gray level size zone matrix,簡(jiǎn)稱GLSZM)、灰度游程矩陣(gray level run length matrix,簡(jiǎn)稱GLRLM)以及局部灰度差分矩陣(neighbouring gray tone difference matrix,簡(jiǎn)稱NGTDM),共97 個(gè)特征,詳見附錄A.
First Order Features 通過獲取熵、灰度最小值以及灰度值方差等特征統(tǒng)計(jì)生成MR 圖像中腫瘤區(qū)域像素點(diǎn)的灰度值分布;Shape 描述MR 圖像中腫瘤區(qū)域的體積、面積以及最大直徑;GLCM,GLSZM,GLRLM 以及NGTDM 根據(jù)圖像灰度在空間上的特性及相互之間的關(guān)系,描述MR 圖像中腫瘤區(qū)域的紋理特征.
據(jù)第3.3 節(jié)描述提取的圖像特征中,存在貢獻(xiàn)較小及冗余特征,這些特征會(huì)加大模型訓(xùn)練及特征分析時(shí)間,增加模型的學(xué)習(xí)難度.因此,需對(duì)提取的腫瘤區(qū)域特征進(jìn)行篩選,以減少特征個(gè)數(shù),降低模型過擬合風(fēng)險(xiǎn),提高模型的精確度,并減少模型訓(xùn)練時(shí)間.
特征篩選主要包括特征子集的搜索和評(píng)價(jià)過程.該方法的思想為:先產(chǎn)生一個(gè)特征子集,然后對(duì)其進(jìn)行評(píng)價(jià),根據(jù)評(píng)價(jià)結(jié)果選擇下一個(gè)特征子集并評(píng)價(jià).重復(fù)上述過程,直到無法找到下一個(gè)特征子集為止.詳細(xì)如下.
(1) 特征子集搜索
特征子集搜索分為前向(forward)搜索、后向(backward)搜索和雙向(bidirectional)搜索.本文采用雙向搜索方法選擇特征子集.該方法分別從完整特征集的開始和結(jié)尾處進(jìn)行遍歷,每一次迭代增加選定的相關(guān)特征,同時(shí)去掉無關(guān)特征,直到第N次迭代增加的特征構(gòu)成的特征子集評(píng)價(jià)不如第N-1 次迭代形成的特征子集評(píng)價(jià),或者每次迭代去掉一個(gè)無關(guān)特征形成的特征子集評(píng)價(jià)明顯下降為止.
(2) 特征子集評(píng)價(jià)
本文利用信息增益(information gain,簡(jiǎn)稱IG)作為評(píng)價(jià)特征子集的方法.信息增益公式如公式(1)所示:
其中,假設(shè)根據(jù)特征子集A將特征集D分為V個(gè)子集{D1,D2,…,DV},H(·)表示信息熵函數(shù)(information entropy),公式如公式(2)所示:
信息增益IG(A)越大,表示該特征子集包含的有用特征越多,訓(xùn)練隨機(jī)森林分類器效果越好.
? 實(shí)驗(yàn)數(shù)據(jù)集
根據(jù)宮頸癌細(xì)胞病理類型,可將宮頸癌分為宮頸鱗癌、宮頸腺癌、宮頸鱗腺癌、腺樣囊性癌、小細(xì)胞癌和淋巴癌[38].其中,宮頸鱗癌病例數(shù)約占宮頸癌病例數(shù)的85%[2].根據(jù)腫瘤的惡性程度,不同類型的宮頸癌又可以細(xì)分為高分化、中分化以及低分化[39].實(shí)驗(yàn)數(shù)據(jù)由85 位鱗癌IIB~IVA 期患者(其中,高分化3 例,中分化75 例,低分化7 例,共1 785 幅原始MR 圖像及對(duì)應(yīng)標(biāo)簽數(shù)據(jù))的三維T2 權(quán)重MR 圖像(詳見表2)組成.
根據(jù)患者在臨床上接受放化療治療的遠(yuǎn)期效果,將85 例病例分為不完全緩解組和完全緩解組.其中,不完全緩解組40 例(共840 幅圖像,672 幅圖像用于訓(xùn)練,168 幅圖像用于測(cè)試),完全緩解組45 例(共945 幅圖像,756幅圖像用于訓(xùn)練,189 幅圖像用于測(cè)試).本文的所有實(shí)驗(yàn)(包括各對(duì)比算法)均在上述實(shí)驗(yàn)數(shù)據(jù)集中進(jìn)行.
Table 2 Function of T2-weighted sequences表2 T2 權(quán)重圖像各序列作用
所有病例的MR 圖像均為512×512×21,空間分辨率分別為0.50mm,0.50mm 以及5.2mm.MR 圖像中,宮頸鱗癌腫瘤區(qū)域由資深影像科醫(yī)生通過手動(dòng)勾畫方式對(duì)85 位患者的MR 圖像序列逐一識(shí)別并標(biāo)注(如圖5 所示:第1 行和第2 行分別是兩個(gè)患者的部分MR 圖像,紅色區(qū)域?yàn)獒t(yī)生手動(dòng)勾畫的宮頸鱗癌區(qū)域,每一行最右側(cè)圖像為宮頸癌區(qū)域分割后三維重建圖像).
Fig.5 SCC MR images with manual labeling圖5 手動(dòng)標(biāo)記宮頸鱗癌MR 圖像示例
? 模型訓(xùn)練
融合殘差結(jié)構(gòu)的U-Net 網(wǎng)絡(luò)訓(xùn)練時(shí)設(shè)定初始學(xué)習(xí)率、衰減率及動(dòng)量分別為1e-4、1e-4 和0.3,最大迭代次數(shù)為1 000.對(duì)隨機(jī)森林算法的超參數(shù)設(shè)置,如決策樹數(shù)量,是根據(jù)隨機(jī)森林在訓(xùn)練集上針對(duì)不同超參數(shù)進(jìn)行實(shí)驗(yàn)確定(詳見第4.4 節(jié)).
在放化療療效對(duì)比實(shí)驗(yàn)中,Inception-ResNet-v2 及Inception-v4[40]網(wǎng)絡(luò)設(shè)置及訓(xùn)練策略如下.
(1) 上述兩種網(wǎng)絡(luò)的層數(shù)及結(jié)構(gòu)等超參數(shù)設(shè)置均采用TF-slim(https://github.com/tensorflow/models/tree/ master/research/slim)代碼庫默認(rèn)值;
(2) 由于宮頸鱗癌訓(xùn)練集數(shù)據(jù)有限,無法充分訓(xùn)練上述兩種網(wǎng)絡(luò),本文采用數(shù)據(jù)擴(kuò)增(Tensorflow 框架)策略,將完全緩解組與不完全緩解組訓(xùn)練數(shù)據(jù)中的每幅圖像分別進(jìn)行水平方向的翻轉(zhuǎn)與旋轉(zhuǎn)(角度為4,8,12,16,20 度);
(3) 上述兩種網(wǎng)絡(luò)設(shè)定初始學(xué)習(xí)率1e-4,1 000 輪迭代后學(xué)習(xí)率設(shè)置為1e-5,共訓(xùn)練2 000 輪;衰減率及動(dòng)量分別設(shè)置為1e-4,0.3.
? 實(shí)驗(yàn)環(huán)境
本文實(shí)驗(yàn)環(huán)境基于Ubuntu 18.04 操作系統(tǒng)中的Tensorflow 框架,配置NVIDIA 顯卡及深度學(xué)習(xí)庫,編程IDE為PyCharm,編程語言為Python 3.5;硬件配置:Intel(R) Core(TM) i7-8700K CPU@3.70GHz,NVIDIA GeForce GTX 1080 Ti,32GB 內(nèi)存.
? 分割算法評(píng)估
為定量評(píng)估分割算法性能,本文采用3 種常見的評(píng)價(jià)標(biāo)準(zhǔn)來評(píng)估圖像分割算法準(zhǔn)確率,分別為Dice 相關(guān)系數(shù)、PPV(positive predicted value)以及敏感度(sensitivity).PPV 衡量預(yù)測(cè)的準(zhǔn)確率,Sensitivity 衡量預(yù)測(cè)的召回率,Dice 系數(shù)綜合PPV 和Sensitivity 的評(píng)價(jià)指標(biāo).計(jì)算公式如公式(3)~公式(5)所示:
其中,P表示預(yù)測(cè)結(jié)果,T表示腫瘤區(qū)域標(biāo)記,|P∩T|表示腫瘤區(qū)域預(yù)測(cè)結(jié)果與標(biāo)記之間重疊部分.
? 療效預(yù)測(cè)算法評(píng)估
本文將放化療療效問題歸結(jié)為二分類問題(完全緩解與不完全緩解),而 ROC(receiver operating characteristic)曲線在二分類問題上能有效地反映分類性能.對(duì)ROC 曲線下各部分面積求和得到AUC(area under curve),AUC 是判斷模型分類性能重要標(biāo)準(zhǔn),本文利用AUC 反映不同放化療療效預(yù)測(cè)算法準(zhǔn)確度.
4.2.1 不同損失函數(shù)對(duì)比
本文基于U-net 分割宮頸MR 圖像中腫瘤區(qū)域.在網(wǎng)絡(luò)訓(xùn)練過程,分別使用交叉熵(cross entropy)損失函數(shù)、Dice 損失函數(shù)以及Softmax 損失函數(shù)作實(shí)驗(yàn)對(duì)比.表3 和圖6 分別列出基于不同的損失函數(shù)訓(xùn)練得到的U-net模型分割腫瘤區(qū)域的精度和結(jié)果圖.
Table 3 Segmentation accuracy of U-net on test set with different loss functions表3 基于不同損失函數(shù)的U-net 模型在測(cè)試集上分割準(zhǔn)確率
Fig.6 Segmentation results of U-net on test set based on different loss functions圖6 基于不同損失函數(shù)的U-net 模型在測(cè)試集上分割結(jié)果圖
由表3 及圖6 可知,基于Softmax 損失函數(shù)的U-net 網(wǎng)絡(luò)分割腫瘤區(qū)域準(zhǔn)確率高于基于交叉熵和Dice 損失函數(shù)的分割模型.基于交叉熵?fù)p失函數(shù)的分割模型在模型訓(xùn)練階段對(duì)宮頸MR 圖像中所有像素同等考慮,但在三維宮頸MR 圖像中,腫瘤區(qū)域只占整幅MR 圖像很小部分,這使得交叉熵?fù)p失函數(shù)大量計(jì)算腫瘤區(qū)域以外的像素點(diǎn),無法對(duì)腫瘤區(qū)域的特征進(jìn)行有效地提取,導(dǎo)致分割腫瘤區(qū)域準(zhǔn)確率較低.Dice 損失函數(shù)本質(zhì)上是衡量?jī)蓚€(gè)樣本的重疊部分,在樣本極度不均勻的情況下效果較好.而本實(shí)驗(yàn)使用的數(shù)據(jù)都是同一類別,使用Dice 損失函數(shù)可能會(huì)使得U-net 網(wǎng)絡(luò)訓(xùn)練變得不穩(wěn)定,造成分割準(zhǔn)確率低.
4.2.2 不同分割算法對(duì)比
為驗(yàn)證加入深度殘差學(xué)習(xí)的U-net 模型能提升分割精度,本文通過與未加入深度殘差學(xué)習(xí)的U-net 模型、閾值分割、全卷積網(wǎng)絡(luò)(FCN)以及DeepMedic+CFR[41]模型進(jìn)行實(shí)驗(yàn)對(duì)比.各模型分割腫瘤區(qū)域的平均分割精度見表4,分割結(jié)果如圖7 所示.
Table 4 Segmentation accuracy of different algorithms on test set表4 不同分割算法在測(cè)試集上分割準(zhǔn)確率
Fig.7 Segmentation results obtained by different algorithms on test set圖7 不同算法在測(cè)試集上分割結(jié)果圖
從表4 可知:深度殘差學(xué)習(xí)能降低U-net 網(wǎng)絡(luò)的擬合難度,使得U-net 模型在Dice 系數(shù)、PPV 及Sensitivity標(biāo)準(zhǔn)上比原始U-net 模型分割準(zhǔn)確率分別高0.061、0.057 及0.042 個(gè)百分點(diǎn).基于閾值分割模型首先需要確定腫瘤區(qū)域的大致位置,然后才能進(jìn)行分割.但腫瘤的形狀及位置復(fù)雜多變,確定某一例宮頸鱗癌腫瘤區(qū)域位置不能推廣到其他患者的腫瘤區(qū)域,所以分割精度較低.FCN 模型雖然在分割上提升了效率與準(zhǔn)確率,但沒有充分考慮像素與像素之間的關(guān)系;且在訓(xùn)練階段沒有進(jìn)行充分地訓(xùn)練,導(dǎo)致分割準(zhǔn)確率低于本文方法.DeepMedic+CRF模型在分割腦腫瘤上取得了不錯(cuò)的成績(jī),但在本實(shí)驗(yàn)中分割準(zhǔn)確率低于U-Net+Resblock.可能因?yàn)閷m頸鱗癌數(shù)據(jù)少,導(dǎo)致網(wǎng)絡(luò)模型在訓(xùn)練階段沒有使參數(shù)最優(yōu)化,使得分割的準(zhǔn)確率低.
本文利用U-net 模型分割腫瘤區(qū)域后,對(duì)腫瘤區(qū)域提取6 種97 個(gè)特征,包括紋理及形狀等特征.宮頸鱗癌實(shí)驗(yàn)數(shù)據(jù)集包含1 785 幅圖像,共提取173 145 個(gè)特征.但提取的特征存在貢獻(xiàn)較小及冗余特征,因此,本文利用雙向特征搜索及信息增益對(duì)特征集進(jìn)行篩選,篩選結(jié)果見表5.
Table 5 Types of tumor area features and number before and after screening表5 腫瘤區(qū)域特征種類及篩選前后數(shù)量
本文基于隨機(jī)森林算法預(yù)測(cè)放化療不敏感的宮頸鱗癌患者.實(shí)驗(yàn)將療效預(yù)測(cè)問題歸結(jié)為分類問題(完全緩解或不完全緩解兩類).因此,為了驗(yàn)證本文方法的有效性,加入Inception-ResNet-v2 算法以及Inception-v4[40]算法作為預(yù)測(cè)療效效果對(duì)比模型.通過多種實(shí)驗(yàn)驗(yàn)證算法的有效性,實(shí)驗(yàn)包括決策樹數(shù)量實(shí)驗(yàn)、決策樹剪枝策略實(shí)驗(yàn)以及不同預(yù)測(cè)算法對(duì)比實(shí)驗(yàn).實(shí)驗(yàn)所用AUC 取值范圍是0.5~1,0.5 對(duì)應(yīng)隨機(jī)猜想模型,1 對(duì)應(yīng)理想模型.
4.4.1 決策樹數(shù)量實(shí)驗(yàn)
隨機(jī)森林通過集成大量決策樹達(dá)到較好的泛化性能,但隨機(jī)森林中決策樹數(shù)量對(duì)模型有重要影響.為了使療效預(yù)測(cè)算法性能達(dá)到最優(yōu),本實(shí)驗(yàn)在保持最優(yōu)劃分屬性選擇標(biāo)準(zhǔn)與最大特征數(shù)等參數(shù)不變的前提下,對(duì)包含不同數(shù)量決策樹的隨機(jī)森林算法在訓(xùn)練集上預(yù)測(cè)放化療療效,實(shí)驗(yàn)結(jié)果如圖8 所示.
Fig.8 Prediction results on training set based on the number of different decision trees圖8 訓(xùn)練集上基于不同決策樹數(shù)量預(yù)測(cè)結(jié)果
實(shí)驗(yàn)結(jié)果表明:隨著決策樹數(shù)量的增加,隨機(jī)森林的預(yù)測(cè)性能也在提升.當(dāng)決策樹數(shù)量為55 時(shí),預(yù)測(cè)性能達(dá)到最優(yōu).之后,隨著決策樹數(shù)量的增加,預(yù)測(cè)性能出現(xiàn)下降趨勢(shì).可能因?yàn)殡S著決策樹數(shù)量增多,隨機(jī)森林模型的復(fù)雜度增大,模型的泛化能力下降,出現(xiàn)過擬合現(xiàn)象.因此,本文將隨機(jī)森林中決策樹數(shù)量設(shè)置為55 進(jìn)行以后的預(yù)測(cè)實(shí)驗(yàn).
4.4.2 決策樹剪枝策略實(shí)驗(yàn)
對(duì)隨機(jī)森林中的決策樹進(jìn)行剪枝可以最大限度地平衡模型復(fù)雜度與模型泛化性能.本實(shí)驗(yàn)在與剪枝參數(shù)有關(guān)的最大特征數(shù)量上對(duì)隨機(jī)森林預(yù)測(cè)放化療療效進(jìn)行實(shí)驗(yàn).
最大特征數(shù)量不但能影響決策樹的復(fù)雜度,而且還影響隨機(jī)森林模型中不同決策樹之間的關(guān)聯(lián)程度.假設(shè) 共有N個(gè)特征用于決策樹的構(gòu)造,本實(shí)驗(yàn)分別設(shè)置N,log2N以及為決策樹生成過程中使用到的最大特征數(shù) 量.圖9 展示了在訓(xùn)練集上基于不同最大特征數(shù)下放化療療效預(yù)測(cè)結(jié)果.
Fig.9 Prediction results on training set based on different maximum feature quantity圖9 訓(xùn)練集上基于不同最大特征數(shù)量預(yù)測(cè)結(jié)果
根據(jù)圖9 可知:將最大特征數(shù)量設(shè)置為log2N時(shí),療效預(yù)測(cè)結(jié)果達(dá)到最優(yōu);而使用全部特征來生成決策樹的預(yù)測(cè)結(jié)果最低.
4.4.3 不同預(yù)測(cè)算法對(duì)比
由于目前宮頸癌療效預(yù)測(cè)方法較少,因此,為驗(yàn)證本文提出的放化療療效預(yù)測(cè)算法優(yōu)于其他算法,選取目前圖像分類準(zhǔn)確率較高的兩種算法(Inception-ResNet-v2 和Inception-v4)、文獻(xiàn)[17]方法與本文算法在訓(xùn)練數(shù)據(jù)集及測(cè)試數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn)對(duì)比.圖10、圖11 分別展示了4 種算法在訓(xùn)練集及測(cè)試集上預(yù)測(cè)放化療療效準(zhǔn)確率.
Fig.10 Prediction results obtained by different classification algorithms on training set圖10 不同分類算法在訓(xùn)練集上預(yù)測(cè)結(jié)果
Fig.11 Prediction results obtained by different classification algorithms on test set圖11 不同分類算法在測(cè)試集上預(yù)測(cè)結(jié)果
根據(jù)圖11 可知:本文利用隨機(jī)森林算法預(yù)測(cè)宮頸鱗癌放化療療效的AUC 值達(dá)到0.921,分別高于其他兩種神經(jīng)網(wǎng)絡(luò)分類算法.Inception-ResNet-v2 和Inception-v4 模型雖然分類性能優(yōu)越,但在數(shù)據(jù)量較少的情況下分類效果欠佳.文獻(xiàn)[17]只提取了紋理特征,導(dǎo)致描述腫瘤的特征數(shù)量及種類不足,使得LASSO-Logistic 建立的宮頸癌治療敏感性模型預(yù)測(cè)療效結(jié)果的AUC 值僅為0.7867,遠(yuǎn)低于本文采用的預(yù)測(cè)模型.
本文針對(duì)部分宮頸鱗癌患者對(duì)放化療不敏感的問題,提出了基于隨機(jī)森林算法的療效預(yù)測(cè)模型.在該模型中,為提高M(jìn)R 圖像腫瘤區(qū)域的分割精度,采用了在小樣本下分割性能較好的U-net 模型.同時(shí),為防止U-net 模型訓(xùn)練階段出現(xiàn)梯度消失情況,在U-net 模型中加入了殘差學(xué)習(xí).此外,為訓(xùn)練泛化能力較強(qiáng)的隨機(jī)森林模型,實(shí)驗(yàn)對(duì)提取的圖像特征進(jìn)行篩選,并調(diào)整了隨機(jī)森林中決策樹的數(shù)量以及訓(xùn)練最大特征數(shù)量.實(shí)驗(yàn)結(jié)果表明:本文提出的預(yù)測(cè)模型在分割腫瘤區(qū)域敏感性達(dá)到0.801,預(yù)測(cè)放化療療效的準(zhǔn)確度達(dá)到0.921.
本文未來工作包括:第一,開發(fā)基于不同權(quán)重類型圖像的預(yù)測(cè)模型,包括T1W1,DWI 等MR 圖像,綜合運(yùn)用多種權(quán)重類型的圖像可以得到更全面的診斷信息,進(jìn)一步提高宮頸鱗癌放化療療效預(yù)測(cè)性能;第二,未來將收集更多病例數(shù),尤其是部分少見病理類型,進(jìn)一步豐富實(shí)驗(yàn)數(shù)據(jù)集來訓(xùn)練預(yù)測(cè)模型,提升模型預(yù)測(cè)能力.
致謝在此,我們向?qū)Ρ疚墓ぷ魈峁椭椭С值耐幸约皩?duì)本文提出寶貴意見的各位審稿專家表示衷心的感謝.
附錄A.特征種類及數(shù)量
Table A.1 Type and quantity of features表A.1 特征種類和數(shù)量
Table A.1 Type and quantity of features (Continued 1)表A.1 特征種類和數(shù)量(續(xù)1)
Table A.1 Type and quantity of features (Continued 2)表A.1 特征種類和數(shù)量(續(xù)2)