梁銀瑩,張凌煙,劉志勇,黃 君*
(1.暨南大學(xué)附屬第一醫(yī)院超聲科,廣東 廣州 510630;2.廣東技術(shù)師范大學(xué)計算機科學(xué)學(xué)院,廣東 廣州 510665)
前列腺癌發(fā)病率位居全球男性惡性腫瘤第二[1]。Gleason分級(Gleason score, GS)系統(tǒng)是臨床廣泛應(yīng)用的評估前列腺癌生物學(xué)侵襲特征的病理學(xué)標準,已成為制定前列腺癌治療方案的重要參考[2]。經(jīng)直腸超聲(transrectal ultrasonography, TRUS)為篩查前列腺癌的一線影像學(xué)檢查手段,但所能提供的信息有限。隨著技術(shù)發(fā)展,人工智能逐漸廣泛用于醫(yī)療領(lǐng)域[3]。本研究基于卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network, CNN)構(gòu)建前列腺癌TRUS模型,觀察其預(yù)測前列腺癌GS的價值。
1.1 一般資料 前瞻性納入2018年5月—2021年1月101例擬于暨南大學(xué)附屬第一醫(yī)院接受TRUS引導(dǎo)下前列腺穿刺活檢的前列腺癌患者,年齡45~88歲、平均(72.0±9.3)歲。納入標準:①隨后經(jīng)穿刺活檢證實為前列腺癌且有明確GS;②無其他惡性腫瘤病史。排除標準:①圖像質(zhì)量不佳;②穿刺前曾接受前列腺疾病相關(guān)治療。本研究經(jīng)院倫理委員會審批通過(KY-2023-154),患者均簽署知情同意書。
1.2 TRUS引導(dǎo)下穿刺前列腺 穿刺前以GE Discovery MR750 3.0T MR儀采集前列腺多參數(shù)MRI(multiparametric MRI, mpMRI),將脂肪抑制T2快速自旋回波序列、彌散加權(quán)成像及動態(tài)對比增強序列圖像以DICOM格式導(dǎo)入超聲設(shè)備。采用GE LOGIQ E9超聲診斷儀,配備可進行融合成像的容積導(dǎo)航儀。囑患者側(cè)臥,對肛周皮膚及直腸下段黏膜進行消毒,之后鋪巾、麻醉;以腔內(nèi)探頭掃查前列腺,針對靶病灶處選取與mpMRI最為一致的TRUS圖像并對二者進行認知融合后實施2針靶向穿刺,之后再行10針系統(tǒng)穿刺;期間每穿刺1針后采集TRUS圖像,由此構(gòu)建前列腺癌超聲數(shù)據(jù)集、共568幅超聲圖像,并按6∶2∶2比例分為訓(xùn)練集(n=340)、驗證集(n=114)和測試集(n=114),見表1。
表1 各集前列腺癌TRUS圖像分布(幅)
1.3 病理分組 根據(jù)2014年國際泌尿外科病理協(xié)會GS系統(tǒng)共識[4],將568幅TRUS前列腺癌圖像分為低危(GS≤6)、中危(GS=7)及高危(GS≥8)并導(dǎo)入Labelme軟件,通過手動點擊于前列腺癌邊緣區(qū)域創(chuàng)建多個離散坐標點,完成標注后形成前列腺癌區(qū)(圖1)。
圖1 采用Labelme勾畫超聲圖像中的前列腺癌區(qū)(紅線區(qū)域) A.患者男,75歲,彌漫性前列腺癌; B.患者男,68歲,前列腺右葉癌
1.4 構(gòu)建模型 構(gòu)建基于改進索貝爾掩模區(qū)域CNN(Soble-mask region CNN, S-Mask R-CNN)+Xception的前列腺癌GS超聲模型。首先,基于S-Mask R-CNN構(gòu)建前列腺癌病灶自動標記網(wǎng)絡(luò),通過全卷積網(wǎng)絡(luò)產(chǎn)生對應(yīng)前列腺癌區(qū)域二值掩碼,自動提取圖像中的前列腺癌ROI;之后對圖像進行形態(tài)學(xué)處理,以脈沖耦合神經(jīng)網(wǎng)絡(luò)(pulse coupled neural network, PCNN)算法行2倍擴增,擴增后訓(xùn)練集含680幅、驗證集含228幅、測試集含228幅圖像;基于Xception網(wǎng)絡(luò)模型構(gòu)建GS系統(tǒng),并以訓(xùn)練集和驗證集進行調(diào)試;最后構(gòu)建可自動識別超聲圖像中前列腺癌區(qū)域并預(yù)測其GS的網(wǎng)絡(luò)模型,并將測試集超聲圖像輸入其中,評估其分級效能。
1.5 評估GS 由2名具有5年前列腺TRUS工作經(jīng)驗的超聲科主治醫(yī)師觀察測試集228幅圖像所示前列腺兩側(cè)葉對稱性、實質(zhì)回聲均勻性、包膜完整性、內(nèi)外腺體分界清晰度、是否出現(xiàn)低回聲結(jié)節(jié)或彌漫性病變,以評估前列腺癌的GS,意見不一致時提請1名具有10年以上工作經(jīng)驗的超聲科主任醫(yī)師判定;最后由另1名具有10年以上工作經(jīng)驗的超聲科主任醫(yī)師以病理所見為金標準對超聲評估結(jié)果進行判斷。
1.6 統(tǒng)計學(xué)分析 基于TensorFlow學(xué)習(xí)框架以matplotlib函數(shù)繪制模型訓(xùn)練過程圖,觀察其準確率及損失率隨迭代次數(shù)增加的變化。采用SPSS 26.0統(tǒng)計分析軟件。以χ2檢驗比較精確率、召回率(Recall)及F1-score。以受試者工作特征(receiver operating characteristic, ROC)曲線和混淆矩陣分析診斷效能,以DeLong檢驗比較曲線下面積(area under the curve, AUC)。P<0.05為差異有統(tǒng)計學(xué)意義。
2.1 模型訓(xùn)練曲線 隨迭代次數(shù)增加,基于CNN的TRUS模型的準確率呈上升趨勢、損失率呈下降趨勢;以Earlystop使網(wǎng)絡(luò)模型收斂時停止訓(xùn)練,模型于迭代次數(shù)約70次時趨于穩(wěn)定,此時準確率趨于1、損失率降至0.2以下。見圖2。
圖2 基于CNN的TRUS模型訓(xùn)練曲線 A.模型準確率變化曲線; B.模型損失率變化曲線
2.2 混淆矩陣檢測 基于CNN的TRUS模型預(yù)測前列腺癌GS≤6、=7和≥8的效能均優(yōu)于超聲醫(yī)師,見圖3。
圖3 預(yù)測前列腺癌GS結(jié)果的混淆矩陣圖 A.基于CNN的TRUS模型預(yù)測結(jié)果; B.超聲醫(yī)師預(yù)測結(jié)果
2.3 精確率、Recall、F1-score及準確率 基于CNN的TRUS模型預(yù)測GS≤6前列腺癌的精確率高于超聲醫(yī)師(P<0.05),而二者Recall和F1-score差異無統(tǒng)計學(xué)意義(P均>0.05);預(yù)測前列腺癌GS=7、GS≥8的精確率、Recall及F1-score均高于超聲醫(yī)師(P均<0.05)。見表2?;贑NN的TRUS模型預(yù)測前列腺癌GS的總體準確率(76.75%)高于超聲醫(yī)師(51.75%,χ2=31.021,P<0.001)。
表2 基于CNN的TRUS模型與超聲醫(yī)師預(yù)測前列腺癌GS的效能
2.4 ROC曲線 以病理結(jié)果為狀態(tài)變量(“GS=7和GS≥8”賦值=1,“GS≤6”賦值=0),基于CNN的TRUS模型和超聲醫(yī)師診斷結(jié)果為檢驗變量(“GS=7和GS≥8”賦值=1,“GS≤6”賦值=0)行ROC分析。結(jié)果顯示,基于CNN的TRUS模型預(yù)測前列腺癌GS的AUC為0.72,特異度為47.22%,敏感度為96.88%;超聲醫(yī)師的AUC為0.67,特異度為52.78%,敏感度為80.21%;二者AUC差異無統(tǒng)計學(xué)意義(Z=0.859,P=0.390)。見圖4。
圖4 基于CNN的TRUS模型與超聲醫(yī)師預(yù)測前列腺癌GS的ROC曲線
前列腺癌發(fā)病隱匿,確診時多已發(fā)展至晚期而錯失手術(shù)治療最佳時期[5]。TRUS剪切波彈性成像[6]、TRUS造影[7]及mpMRI-TRUS融合[8]等技術(shù)可提高超聲診斷前列腺癌的準確率。GS系統(tǒng)是臨床廣泛用于評估前列腺癌組織學(xué)分級的方法,GS≤6預(yù)后較好,≥7則轉(zhuǎn)移率和復(fù)發(fā)率較高,若不及時予以積極治療將使致死率逐年攀升[9]。TRUS引導(dǎo)下穿刺活檢是術(shù)前診斷前列腺癌的“金標準”。目前TRUS已不再局限于診斷前列腺良、惡性疾病,亦可用于術(shù)前評估前列腺癌GS。
LIU等[10]采用基于S-Mask R-CNN的前列腺超聲圖像分割技術(shù)和基于InceptionV3的前列腺聲像圖分類技術(shù)診斷前列腺癌良、惡性病變,發(fā)現(xiàn)其診斷準確率均高于超聲醫(yī)師。張凌煙等[11]指出,利用基于深度學(xué)習(xí)的輔助診斷網(wǎng)絡(luò)模型可對TRUS所示前列腺病變進行良、惡性分類,以提高超聲醫(yī)師診斷前列腺癌的準確性?;谌斯ぶ悄艿某曨A(yù)測模型可用于定性診斷前列腺癌、腫瘤分級和預(yù)后評估[12]。目前已有基于CNN的病理學(xué)[13]和mpMRI[14]的前列腺癌GS研究,但鮮見基于CNN評估TRUS所示前列腺癌GS的報道。
本研究觀察基于CNN的TRUS模型的準確率和損失率變化曲線,發(fā)現(xiàn)隨訓(xùn)練迭代次數(shù)增加,準確率呈上升而損失率呈下降趨勢,表明該模型的適應(yīng)能力、收斂速度及能力均較好。同時,本研究發(fā)現(xiàn)基于CNN的TRUS模型預(yù)測GS≥7前列腺癌的效能較佳,但預(yù)測GS≤6前列腺癌的精確率和Recall并不高,且與超聲醫(yī)師診斷差異無統(tǒng)計學(xué)意義,即二者識別低危前列腺癌的效能均不突出;分析可能原因:①GS≤6前列腺癌入組病例數(shù)較少,結(jié)果可能存在偏倚;②GS≤6前列腺癌超聲常表現(xiàn)為陰性,而GS≥7前列腺癌的組織成分更混雜,可出現(xiàn)明顯占位效應(yīng),更有利于機器學(xué)習(xí)。
本研究發(fā)現(xiàn)基于CNN的TRUS模型與超聲醫(yī)師預(yù)測前列腺癌GS的AUC差異無統(tǒng)計學(xué)意義,但前者略高于后者(0.72vs.0.67),且二者預(yù)測總體準確率差異顯著(76.75%vs.51.75%),說明模型的預(yù)測效能更高,主要原因之一為臨床上超聲醫(yī)師進行診斷時多需結(jié)合病史、CDFI和超聲彈性成像等進行綜合分析,而在本研究中僅觀察二維超聲而忽略了其他信息。無論如何,本研究結(jié)果提示,基于CNN的TRUS模型可輔助超聲醫(yī)師基于二維超聲圖像判斷前列腺癌GS,從而減輕其工作負擔。
本研究的主要不足:①樣本量小且分布不均;②僅對二維超聲圖像進行分析;③所獲結(jié)論是否適用于其他品牌及型號超聲設(shè)備有待進一步觀察。
綜上所述,基于CNN的TRUS模型有助于預(yù)測前列腺癌、尤其需積極治療的中-高危前列腺癌的GS。