郭紅博 王佳舟 楊 翠 夏 祥 胡偉剛
(復(fù)旦大學(xué)附屬腫瘤醫(yī)院放射治療中心 復(fù)旦大學(xué)上海醫(yī)學(xué)院腫瘤學(xué)系 上海市放射腫瘤學(xué)重點實驗室 上海 200032)
在放射治療中,危及器官(Organs at risk,OARs)勾畫是一項至關(guān)重要的工作,因為這將直接影響計劃優(yōu)化的結(jié)果,進而影響腫瘤的局部控制率和正常組織并發(fā)癥概率[1‐3],然而,OARs 手動勾畫十分耗時且枯燥。近幾年,自動勾畫方法已在臨床獲得應(yīng)用,基于深度學(xué)習(xí)的自動勾畫相較于其他方法具有明顯優(yōu)勢,已成為OARs自動勾畫的主流方法[4‐6]。當(dāng)前對于自動勾畫的評估,主要基于幾何相似性指標(biāo)。OARs自動勾畫將直接影響計劃優(yōu)化,評估其劑量學(xué)影響具有重要的臨床意義[7‐8]。本研究從幾何學(xué)和劑量學(xué)兩個方面評估將自動勾畫的OARs 應(yīng)用于臨床計劃設(shè)計的可行性,以期為臨床應(yīng)用提供參考。
選取2018 年1 月至2020 年11 月在復(fù)旦大學(xué)附屬腫瘤醫(yī)院接受放射治療的直腸癌患者35 例,入組病例符合我院倫理委員會要求。所有患者采用仰臥位完成CT 掃描,掃描層厚5 mm,定位前1 h排空膀胱。男性23例,女性12例,年齡33~78歲,中位年齡60 歲,病例類型均為中低分化腺癌。由低年資醫(yī)師完成計劃靶區(qū)(Planning target volume,PTV)和OARs的初步勾畫,高年資醫(yī)師審核修改。PTV處方劑量為50 Gy,每次2 Gy,每周治療5 次。OARs 包括左股骨頭、右股骨頭、膀胱、小腸。
OARs的自動勾畫在復(fù)旦大學(xué)附屬腫瘤醫(yī)院放射治療中心自主開發(fā)的深度學(xué)習(xí)系統(tǒng)上進行,該系統(tǒng)采用改進的U‐Net 結(jié)構(gòu),可以完成直腸癌OARs 的自動勾畫。圖1 為網(wǎng)絡(luò)架構(gòu)示意圖,主要包括壓縮路徑的向下采樣和擴展路徑的向上采樣。上采樣階段與下采樣階段對應(yīng)的兩個卷積層之間連接,下采樣層提取的特征可以直接傳遞到上采樣層,這樣使圖像特征更加豐富,定位精度更高。網(wǎng)絡(luò)結(jié)構(gòu)和訓(xùn)練測試的細節(jié)信息已在前期的研究中做了詳盡介紹[9‐12]。
圖1 自動勾畫系統(tǒng)的網(wǎng)絡(luò)架構(gòu)示意圖Fig.1 Network architecture schematic diagram of the automatic delineation system
基于美國瓦里安公司Trilogy 直線加速器,該加速器配備60 對多葉光柵,最大射野范圍40 cm×40 cm。采用荷蘭飛利浦公司Pinnacle39.10 計劃系統(tǒng),6 MV 光子束,7 野靜態(tài)調(diào)強完成計劃設(shè)計。每個病人有兩個計劃,第一個計劃為實際的臨床治療計劃,該計劃基于臨床醫(yī)生手動勾畫的PTV和OARs 完成,已由臨床醫(yī)生審核并用于病人治療,記為Plan_Treat;第二個計劃為重新設(shè)計的計劃,基于醫(yī)生手動勾畫的PTV和自動勾畫的OARs完成,記為Plan_FD。為盡可能減小物理師操作習(xí)慣對結(jié)果的影響,Plan_FD 與Plan_Treat 均由同一物理師完成。Plan_FD的初始射野參數(shù)和優(yōu)化目標(biāo)函數(shù)與Plan_Treat保持一致。所有計劃采用PTV平均劑量歸一法,將PTV 平均劑量的96%歸一到處方劑量。
以醫(yī)生手動勾畫的OARs作為參考,采用以下4個幾何學(xué)指標(biāo)評估自動勾畫的準(zhǔn)確性:戴斯相似系數(shù)(Dice similarity coefficient, DSC)、雅卡爾相似系數(shù)(Jaccard similarity coefficient, JSC)、豪斯多夫距離(Hausdorff distance, HD)和平均一 致 性 距 離(mean distance to agreement,MDA)[13‐15]。DSC(變量記為DSC)和JSC(變量記為JSC)可以很好地評估自動勾畫與手動勾畫的整體匹配性,HD(變量記為HD)和MDA(變量記為MDA)則對自動勾畫與手動勾畫的邊緣匹配特性較為敏感。其定義見式(1)~(6)。
式中:A表示自動勾畫的區(qū)域;B表示醫(yī)生手動勾畫的區(qū)域;|A∩B|表示A和B的交集;|A∪B|表示A和B的并集;|A|表示A的絕對體積;|B|表示B的絕對體積。DSC和JSC值的范圍是[0,1],數(shù)值越大表示自動勾畫結(jié)果越理想,0 表示沒有交集,1表示完全重合。
式中:d(a,b)表示點a與點b的三維豪斯多夫距離;HD值的范圍是[0,+∞),數(shù)值越接近于0,表示自動勾畫結(jié)果越理想,0表示完全重合。
式中:h表示平均三維豪斯多夫距離;MDA值的范圍是[0,+∞),數(shù)值越接近于0,表示自動勾畫結(jié)果越理想,0表示完全重合。
PTV和OARs的劑量學(xué)評估參考國際輻射單位與測量委員會(ICRU)第83 號報告的建議[16]。PTV的劑量學(xué)評價參數(shù)包括D98、D95、D2、V50、HI和CI[17]。OARs的劑量學(xué)評價參數(shù)包括股骨頭V20、V30、Dmean;膀 胱V30、V40、Dmean;小 腸V30、V40、Dmean??紤]到PTV和OARs的劑量體積參數(shù)并不能全面反映計劃的劑量分布,尤其是在遠離靶區(qū)的低劑量區(qū)域。為全面比較Plan_FD 與Plan_Treat 在三維空間的劑量分布,采用美國Sun Nuclear 公司的SunPatient軟件進行了三維γ劑量分析。
圖2為自動勾畫的幾何學(xué)評估結(jié)果,DSC為評估自動勾畫與手動勾畫交疊區(qū)域大小的常用指標(biāo),一般認(rèn)為DSC>0.7為較好的勾畫結(jié)果[18]。本研究中自動勾畫的OARs 均滿足此標(biāo)準(zhǔn),包括膀胱(0.84±0.14)、左股骨頭(0.88±0.08)、右股骨頭(0.87±0.08)、小腸(0.80±0.11)。MDA 主要評估自動勾畫與手動勾畫的邊緣匹配特性,MDA平均值不足2.8 mm,分別為膀胱(2.58±1.50) mm、左股 骨 頭(2.34±1.64) mm、 右 股 骨 頭(2.50±1.40) mm、小腸(3.70±1.08) mm。此結(jié)果表明,自動勾畫與手動勾畫的OARs不僅在三維空間上體積高度重疊,且在邊緣細節(jié)上匹配度良好。
圖2 自動勾畫的幾何學(xué)評估結(jié)果:(a)戴斯相似系數(shù);(b)豪斯多夫距離;(c)雅卡爾相似系數(shù);(d)平均一致性距離Fig.2 Geometric evaluation results for automatic delineation:(a)dice similarity coefficient(DSC);(b)hausdorff distance(HD);(c)jaccard similarity coefficient(JSC);(d)mean distance to agreement(MDA)
表1 和表2 分別為PTV 和OARs 的劑量學(xué)統(tǒng)計結(jié)果。統(tǒng)計分析發(fā)現(xiàn),Plan_FD 與Plan_Treat 的PTV 劑量體積參數(shù)、CI 及HI 差異均無統(tǒng)計學(xué)意義(p>0.05)。Plan_FD 與Plan_Treat 的左股骨頭、右股骨頭、小腸的劑量體積參數(shù)差異均無統(tǒng)計學(xué)意義(p>0.05)。膀胱劑量體積參數(shù)V30、V40、Dmean均有顯著統(tǒng)計學(xué)差異(p<0.05),這可能是因為不同病例PTV 和膀胱有不同程度的交疊,而交疊區(qū)域的勾畫差異會對劑量分布產(chǎn)生重要影響。為進一步評估交疊區(qū)域?qū)┝康挠绊?,對本研究?5 例入組病例,逐個統(tǒng)計了膀胱與靶區(qū)交疊區(qū)域所占膀胱總體積的百分比(記為Vt),最大為67%,最小為5%,中位數(shù)為34%。據(jù)此,我們將病例分為G1、G2 兩組,G1 組Vt≤34%,G2 組Vt>34%。按照以上分組,對Plan_Treat 與Plan_FD 的膀胱劑量進行配對t檢驗,結(jié)果列于表3。G2 組Plan_Treat與Plan_FD 的膀胱V30差異具有統(tǒng)計學(xué)意義(p<0.05),G1 組膀胱V30差異無統(tǒng)計學(xué)意義(p>0.05)。
表1 PTV劑量學(xué)統(tǒng)計結(jié)果Table 1 PTV dosimetry statistics (± s)
表1 PTV劑量學(xué)統(tǒng)計結(jié)果Table 1 PTV dosimetry statistics (± s)
項目Item PTV D98/cGy計劃類別Plan type數(shù)值Value t值t value p值p value 0.26 5 009±41 4 993±52 5 050±34 5 050±33 5 333±54 5 354±48 97.43±1.50 96.69±1.93 0.89±0.02 0.89±0.02 0.05±0.01 0.05±0.01 0.05 0.23 D95/cGy 0.96 D2/cGy 0.25 0.17 V50/%-0.26 0.12 CI 1.93 0.06 HI Plan_Treat Plan_FD Plan_Treat Plan_FD Plan_Treat Plan_FD Plan_Treat Plan_FD Plan_Treat Plan_FD Plan_Treat Plan_FD-1.33 0.09
表2 OARs劑量學(xué)統(tǒng)計結(jié)果Table 2 OARs dosimetry statistics (± s)
表2 OARs劑量學(xué)統(tǒng)計結(jié)果Table 2 OARs dosimetry statistics (± s)
項目Item計劃類別Plan type劑量/體積Dose/Volume t值t value p值p value膀胱Bladder V30/%-3.03 0.01 V40/%-3.07 0.01 Dmean/cGy Plan_Treat Plan_FD Plan_Treat Plan_FD Plan_Treat Plan_FD 67.76±26.23 70.03±25.86 44.05±23.72 47.07±24.92 3 569±980 3 633±984-3.45 0.01左股骨頭Left femoral head V20/%-1.26 0.22 V30/%-2.17 0.14 Dmean/cGy Plan_Treat Plan_FD Plan_Treat Plan_FD Plan_Treat Plan_FD 54.83±19.62 56.65±22.77 15.75±9.75 18.33±11.79 2 160±544 2 212±607-0.85 0.41
表3 膀胱分組劑量學(xué)統(tǒng)計檢驗結(jié)果Table 3 Bladder dosimetry statistical test in groups (± s)
表3 膀胱分組劑量學(xué)統(tǒng)計檢驗結(jié)果Table 3 Bladder dosimetry statistical test in groups (± s)
組別Groups G1 t值t value 0.30 p值p value 0.77劑量/體積Dose/Volume V30/%V30/%V40/%V40/%Dmean/cGy Dmean/cGy V30/%V30/%V40/%V40/%Dmean/cGy Dmean/cGy計劃類別Plan type Plan_Treat Plan_FD Plan_Treat Plan_FD Plan_Treat Plan_FD Plan_Treat Plan_FD Plan_Treat Plan_FD Plan_Treat Plan_FD-2.55 0.02-2.44 0.03 G2-3.76 0-2.85 0.01-3.66 0
續(xù)表
圖3顯示了1例患者三維γ劑量分析結(jié)果,圖3(a)和3(b)清晰直觀地顯示了Plan_Treat 和Plan_FD的三維劑量分布,直觀來看,二者差異不大。圖3(c)為采用3 mm/3%標(biāo)準(zhǔn)的三維γ分析結(jié)果,圖中顯示了γ>1.0 的點,在這些點Plan_Treat和Plan_FD 差異較大。圖3(d)采用柱狀圖對Plan_Treat 和Plan_FD 全部有效劑量點的劑量差異進行了統(tǒng)計。所有35 例病例在5 mm/5%、3 mm/3%、3 mm/2%、2 mm/3%、2 mm/2%標(biāo)準(zhǔn)下,γ≤1.0 的點占全部有效劑量點的百分比分別為(97.73±2.09)% 、(91.63±6.27)% 、(87.72±8.49)%、(88.55±8.80)%、(83.13±10.28)%。
圖3 1例代表性病例的三維γ劑量分析結(jié)果:(a)Plan_Treat的三維劑量分布;(b)Plan_FD的三維劑量分布;(c)在3 mm/3%標(biāo)準(zhǔn)下γ>1.0的點,紅色區(qū)域為劑量熱點,藍色區(qū)域為劑量冷點;(d)劑量偏差統(tǒng)計;彩色見網(wǎng)絡(luò)版Fig.3 3D γ dose analysis results for a representative case:(a)3D dose distribution of Plan_Treat;(b)3D dose distribution of Plan_FD;(c)points with γ>1.0 at 3 mm/3%standard,red area is dose hot spot,blue area is dose cold spot;(d)dose deviation statistics;color online
本研究從幾何學(xué)和劑量學(xué)兩個方面評估了我們中心自主開發(fā)的深度學(xué)習(xí)系統(tǒng)進行直腸癌OARs自動勾畫并應(yīng)用于臨床計劃設(shè)計的可行性。結(jié)果顯示,自動勾畫與手動勾畫的OARs具有較高的幾何相似度,具有應(yīng)用于臨床計劃設(shè)計的潛力。
基于幾何學(xué)指標(biāo)的定量評估是自動勾畫最直接、最常用的評估方法。Song等[19]基于幾何學(xué)指標(biāo)評估了兩種卷積神經(jīng)網(wǎng)絡(luò)DeepLabv3+和ResUNet 對直腸癌CTV 和OARs 的勾畫,發(fā)現(xiàn)DeepLabv3+的表現(xiàn)更好,DeepLabv3+和ResUNet的CTV 幾 何 學(xué) 指 標(biāo)DSC分 別 為(0.88±0.02)和(0.87±0.02),但未對幾何學(xué)指標(biāo)的提升對劑量學(xué)影響進行探討。幾何學(xué)指標(biāo)是評估自動勾畫算法的關(guān)鍵性指標(biāo),使用高質(zhì)量且一致性好的訓(xùn)練和驗證數(shù)據(jù)集,可以對算法性能進行量化和比較。自動勾畫的臨床評估應(yīng)基于臨床實用目的,相比于幾何評估可能要復(fù)雜的多。幾何指標(biāo)的小幅改善(例如DSC增加0.05)可能代表了算法的實質(zhì)性進步,但其實際臨床意義可能相當(dāng)有限。更為合理的評估方法應(yīng)是盡可能模擬臨床流程,該原則也與其他研究提出的基于任務(wù)的評估程序一致[20‐21]。
OARs自動勾畫的最終目標(biāo)是可以直接應(yīng)用于臨床計劃設(shè)計,提升臨床工作效率。然而,當(dāng)前對于自動勾畫的OARs對放療劑量學(xué)影響的相關(guān)研究還較少,van Dijk等[5]直接采用臨床治療計劃評估了自動勾畫與手動勾畫的OARs劑量差異,發(fā)現(xiàn)基于深度學(xué)習(xí)的自動勾畫相較于基于圖譜的自動勾畫幾何相似度更高,劑量差異更小。Kaderka等[22]基于幾何學(xué)指標(biāo)和劑量學(xué)指標(biāo)進行心臟亞結(jié)構(gòu)自動勾畫的評估,并分析二者的相關(guān)性,發(fā)現(xiàn)幾何指標(biāo)不能預(yù)測劑量參數(shù)的準(zhǔn)確性,自動勾畫的質(zhì)量不能僅由幾何學(xué)評估指標(biāo)確定。上述研究都是采用基于醫(yī)生手動勾畫的PTV和OARs優(yōu)化得到的治療計劃,評估手動勾畫和自動勾畫的OARs的劑量學(xué)差異。因為不同OARs的勾畫會對計劃劑量分布產(chǎn)生重要影響,因此上述研究方法尚有可改進之處。本研究基于自動勾畫的OARs重新優(yōu)化放療計劃,并與原始的臨床治療計劃進行比較,發(fā)現(xiàn)僅有膀胱劑量差異具有統(tǒng)計學(xué)意義,這可能是因為不同病例PTV 和膀胱邊緣有不同程度的交疊,而交疊區(qū)域的勾畫差異會對劑量分布產(chǎn)生重要影響。進一步的研究發(fā)現(xiàn),膀胱與靶區(qū)交疊越多,重新優(yōu)化的放療計劃與原始臨床治療計劃之間膀胱劑量差異越顯著。考慮到PTV和OARs的劑量體積參數(shù)并不能完整反映計劃的劑量分布,為全面評估自動勾畫的OARs對劑量分布的影響,進行了三維γ 劑量分析。在3 mm/3%的標(biāo)準(zhǔn)下,γ≤1.0的點占比已達(91.63±6.27)%,表明在現(xiàn)有的勾畫精度下,自動勾畫的OARs對劑量分布的影響并不顯著,具有直接應(yīng)用于臨床計劃設(shè)計的潛力。
本研究存在一定的局限性,所有訓(xùn)練測試數(shù)據(jù)均來自作者單位,而這些數(shù)據(jù)并非標(biāo)準(zhǔn)數(shù)據(jù)集,自動勾畫的結(jié)果也更符合本單位醫(yī)生的勾畫習(xí)慣,其可推廣性有待評估。
綜上所述,基于深度學(xué)習(xí)方法自動勾畫與醫(yī)生手動勾畫的OARs具有較高的幾何相似度,自動勾畫的OARs對劑量分布的影響并不顯著,具有直接應(yīng)用于臨床計劃設(shè)計的潛力。這對減輕醫(yī)生臨床工作壓力和提升臨床工作效率意義重大。
作者貢獻說明 郭紅博負責(zé)數(shù)據(jù)采集和論文撰寫;王佳舟負責(zé)研究思路設(shè)計;楊翠、夏祥協(xié)助完成實驗及數(shù)據(jù)分析;胡偉剛指導(dǎo)論文修改。全體作者都閱讀并同意最終的文本。