34
(1 青島大學附屬醫(yī)院胃腸外二科,山東 青島 266003; 2 青島大學附屬醫(yī)院病理科;3 山東省數(shù)字醫(yī)學與計算機輔助手術(shù)重點實驗室; 4 青島大學附屬醫(yī)院海南分院)
根據(jù)世界衛(wèi)生組織2020年全球癌癥負擔數(shù)據(jù)顯示,結(jié)直腸癌總體發(fā)病率已經(jīng)躍居全球第3位,死亡率居第2位,其中更以直腸癌為高發(fā)[1]。據(jù)統(tǒng)計,早期和晚期直腸癌患者的預(yù)后差別很大,Ⅰ~Ⅳ期患者的5年生存率分別為93.8%、77.4%、14.0%和7.0%,而環(huán)周切緣陽性[2]、淋巴結(jié)轉(zhuǎn)移[3]、脈管癌栓、腫瘤出芽[4]等病理特征均預(yù)示著較晚分期和不良預(yù)后。積極尋求和探索病理診斷新方法對于患者的精準及個性化治療意義重大。
臨床研究發(fā)現(xiàn),脈管癌栓作為直腸癌預(yù)后的獨立危險因素,是腫瘤侵犯脈管系統(tǒng)和淋巴結(jié)轉(zhuǎn)移的先決條件[5],研究顯示脈管癌栓陽性和陰性的患者5年生存率具有顯著差異[6]。目前在臨床病理診斷中脈管癌栓的檢測主要依靠HE染色和免疫組化染色來完成,其中免疫組化染色能明顯提高脈管癌栓的檢出率[7]。目前病理診斷流程的自動化程度較低,診斷結(jié)果完全依靠病理專家的肉眼識別以及經(jīng)驗判斷,受到專業(yè)水平、主觀因素以及環(huán)境因素等的影響比較大。近年來人工智能(AI)技術(shù)發(fā)展迅速,其在病理、影像以及內(nèi)鏡檢查等領(lǐng)域展現(xiàn)出顯著優(yōu)勢[8]。如在HE染色切片中,具有不同病理特征的組織區(qū)域中存在著很多細微差異,這些差異很難通過肉眼識別,但可以通過計算機的圖像分析系統(tǒng)進行識別。例如SHARMA等[9]利用AI算法中的深度卷積神經(jīng)網(wǎng)絡(luò)(DCNN)完成了基于HE染色病理切片的胃癌HER-2陽性和陰性腫瘤分類。AI技術(shù)已被充分證實可用來深度挖掘圖像特征,輔助臨床醫(yī)生做出決策,提高診斷效率。
病理大切片是一種非常規(guī)的病理切片,其可將標本中的信息最大化保留,并降低了拼接誤差,可減少取材造成的偏倚,更有利于神經(jīng)網(wǎng)絡(luò)的訓練。目前尚未有基于病理大切片數(shù)字圖像的AI輔助診斷脈管癌栓的研究報道。本研究首先建立了直腸癌病理大切片數(shù)字圖像數(shù)據(jù)庫,并利用該數(shù)據(jù)庫構(gòu)建了直腸癌脈管癌栓預(yù)測的DCNN模型(以下簡稱模型),并進行了訓練和驗證,旨在輔助臨床醫(yī)生在沒有進行免疫組化檢測的情況下能夠更高效和準確的判斷脈管癌栓。
選取青島大學附屬醫(yī)院(西海岸院區(qū)、市南院區(qū)以及嶗山院區(qū))2019年1—10月確診為直腸癌的患者175例。納入標準:術(shù)前均經(jīng)腸鏡活檢進行了確診并經(jīng)手術(shù)者;排除標準:曾經(jīng)行新輔助治療者、存在遠處器官轉(zhuǎn)移者、并發(fā)其他惡性腫瘤者、行姑息手術(shù)者。
收集175例患者術(shù)中切除的病理標本,固定于40 g/L的甲醛溶液中,完整切取每例患者標本自腸腔至系膜切緣腫瘤組織(沿與腸管縱軸垂直方向),經(jīng)脫水、包埋后制成病理大蠟塊,使用平推式大切片機[Leica SM2010R,徠卡顯微系統(tǒng)(上海)貿(mào)易有限公司]將每個蠟塊先切片1張,置于65 ℃烤片機烤片10 min,HE染色后制成病理大切片,由1名高年資病理醫(yī)師對病理大切片進行初步篩選,排除非腺癌(包括黏液腺癌、印戒細胞癌、未分化癌、腺鱗癌、鱗狀細胞癌、小細胞癌、髓樣癌)以及取材或制作過程中質(zhì)量較差者。最終有160例患者的病理大切片納入研究。
對160例患者病理大切片按照就診的院區(qū)不同分為內(nèi)部數(shù)據(jù)集(西海岸院區(qū))120例和外部數(shù)據(jù)集(市南+嶗山院區(qū))40例,采用隨機數(shù)字表法將內(nèi)部數(shù)據(jù)集患者按7∶3比例分為訓練組(84例)和測試組(36例)。收集所有患者的性別、年齡、腫瘤TNM分期、腫瘤標志物、HE染色結(jié)果及免疫組化病理報告等臨床基本資料,內(nèi)部數(shù)據(jù)集和外部數(shù)據(jù)集臨床基本資料比較差異均無顯著性(P>0.05),可以進行后續(xù)實驗(表1)。
將160例患者的病理大蠟塊以3~5 μm厚連續(xù)切片,每個蠟塊切片15張,均制作成病理大切片并進行HE染色。使用切片掃描儀(NI-U,日本株式會社尼康)放大100倍對切片進行掃描,共獲得內(nèi)部數(shù)據(jù)集數(shù)字圖像1 800張和外部數(shù)據(jù)集數(shù)字圖像600張,其中內(nèi)部數(shù)據(jù)集中的訓練組1 260張,測試組540張。由2位高年資病理醫(yī)師分別使用ASAP軟件對內(nèi)部數(shù)據(jù)集中的訓練組數(shù)字圖像勾畫感興趣區(qū)域(ROI),即癌區(qū),并由第3位病理醫(yī)師確保癌區(qū)勾畫及脈管癌栓判斷的準確性。
訓練組的數(shù)字圖像隨機裁剪成512×512像素大小的圖像小塊后,對每小塊圖像均進行90°、180°隨機旋轉(zhuǎn)和水平、垂直平面隨機翻轉(zhuǎn),以及隨機縮放和仿射變換,通過z-score的歸一化使每一小塊圖像的像素值均服從標準正態(tài)分布。預(yù)處理過程沒有使圖像發(fā)生幾何變形,而是保留了數(shù)字圖像中原有的紋理、顏色、形態(tài)特征以及原始亮度、對比度和強度。測試組和外部訓練集中的數(shù)字圖像僅僅是隨機裁剪成為512×512像素大小的圖像小塊,不再進行后續(xù)處理。
表1 內(nèi)部數(shù)據(jù)集與外部數(shù)據(jù)集臨床基本資料比較[例(χ/%)]Tab.1 Comparison of basic clinical information between internal and external datasets [n(χ/%)]
本研究所構(gòu)建的直腸癌脈管癌栓的AI輔助病理診斷模型由DeepLabV3+語義分割模型和ResNet50分類模型構(gòu)成。首先將訓練組預(yù)處理后的圖像小塊輸入DeepLabV3+語義分割模型中,使用空洞卷積提取并生成圖像的低級別特征,由空洞空間池化金字塔生成高級別特征,兩者級聯(lián)后將所提取的圖像特征及其標簽輸入ResNet50分類模型中,使用隨機梯度下降法計算神經(jīng)網(wǎng)絡(luò)中的各種超參數(shù),并優(yōu)化損失函數(shù)(loss)值。對訓練組中的數(shù)據(jù)進行階段學習,基礎(chǔ)學習率為0.001,上采樣倍率為4,骨干網(wǎng)絡(luò)X-ception65具有65個網(wǎng)絡(luò)層。訓練完成后將裁剪后的測試組圖像輸入模型中進行測試,由Deeplabv3+語義分割模型分割ROI,然后將包含ROI區(qū)域的圖像小塊輸送入ResNet50分類模型中,根據(jù)loss曲線預(yù)測脈管癌栓陽性或陰性,如果整張數(shù)字圖像中有任意小塊圖像被預(yù)測為脈管癌栓陽性,則該小塊圖像對應(yīng)的患者則被評估為脈管癌栓陽性患者。
使用外部數(shù)據(jù)集的數(shù)字圖像對模型進行驗證。將模型預(yù)測的陽性和陰性結(jié)果與患者術(shù)后病理醫(yī)師出具的病理報告中的脈管癌栓結(jié)果對比,繪制受試者工作特征(ROC)曲線和精度-召回率(PR)曲線,計算模型驗證的準確率、精準率、靈敏度、特異度、ROC曲線下面積(AUC)值、RP曲線下面積(AP)值等指標,同時記錄圖像的識別時間。隨后,2位病理醫(yī)師對外部數(shù)據(jù)集的數(shù)字圖像進行觀察并判斷脈管癌栓結(jié)果,將其結(jié)果與病理報告中的脈管癌栓結(jié)果比對,計算診斷準確率、靈敏度和特異度,同時記錄閱片時間。
采用SPSS 23.0軟件對數(shù)據(jù)進行統(tǒng)計分析,采用Python 3.8編程軟件獲取AI機器學習結(jié)果。采用Pearson卡方檢驗、Fisher精確檢驗或者Mann-WhitneyU檢驗對分類變量進行比較;采用兩獨立樣本t檢驗對連續(xù)變量進行比較。采用AUC和AP來評估模型性能。以P<0.05為差異具有統(tǒng)計學意義。
由評估訓練結(jié)果的loss曲線可知,模型在訓練過程中l(wèi)oss值得到不斷地優(yōu)化,曲線逐漸收斂,經(jīng)過3 000次迭代訓練后,loss值達到最小,表明模型達到最高診斷性能(圖1)。
經(jīng)測試組中數(shù)字圖像對模型的診斷性能進行測試后,繪制的ROC曲線及PR曲線結(jié)果顯示,模型測試的準確率為85.2%,精準率為83.8%,靈敏度為84.6%,特異度為84.8%,AUC值為0.83,AP值為0.80。見圖2。
圖1 模型訓練損失曲線Fig.1 The training loss curve of the model
將外部數(shù)據(jù)集的數(shù)字圖像輸入模型后,繪制的ROC曲線及PR曲線結(jié)果顯示(圖3),驗證的準確率為84.7%,精準率為83.1%,靈敏度為84.3%,特異度為84.1%,AUC值為0.82,AP值為0.78;每張圖像的平均診斷時間為0.2 s,醫(yī)師通過每張HE染色數(shù)字圖像的平均診斷時間為30.0 s,兩者比較差異具有顯著性(t=-73.84,P<0.05)。醫(yī)師通過閱讀HE染色數(shù)字圖像對脈管癌栓診斷的準確率為76.3%,靈敏度為77.8%,特異度為75.8%,上述指標與DCNN模型比較,差異均具有顯著意義(χ2=5.028~6.842,P<0.05)。
A:ROC曲線,B:PR曲線圖2 模型在測試組中的ROC曲線及PR曲線Fig.2 The receiver operating characteristic curve and precision-recall curve of the model in the test group
A:ROC曲線,B:PR曲線圖3 模型在外部數(shù)據(jù)集的ROC曲線及PR曲線Fig.3 The receiver operating characteristic curve and precision-recall curve of the model with external dataset
許多研究結(jié)果顯示,早期直腸癌有8%~20%淋巴結(jié)轉(zhuǎn)移的可能性和超過10%的復發(fā)率[10],其中脈管癌栓可能是早期腫瘤淋巴結(jié)轉(zhuǎn)移的高危因素之一[11-13]。另有研究表明,除腫瘤TNM分期外,許多臨床病理學特征也會影響腫瘤患者的預(yù)后,臨床上需要其他的一些病理學特征,如腫瘤出芽、脈管癌栓等來輔助判斷腫瘤的惡性程度[14]。脈管癌栓作為影響患者生存的獨立危險因素[15]和高危病理特征,無論術(shù)前還是術(shù)后對其準確判斷都十分必要。
由于傳統(tǒng)HE染色對組織中癌細胞周圍細胞間隙和真正的癌栓無法準確鑒別,存在誤診或漏診可能,目前脈管癌栓的診斷主要依靠免疫組化染色技術(shù)。然而,脈管癌栓的檢測工作量比較大,觀察者之間的判定存在差異性[16],且免疫組化技術(shù)費用高、耗時長(5~7 d),因此需要更加便捷快速、低成本的檢測方法。近年來,AI在識別疾病亞型和組織形態(tài)特征方面表現(xiàn)出獨有的優(yōu)勢,可以有效整合多種圖像特征,并有自動化檢測生物標志物的潛能。美國斯坦福大學建立的直腸癌相關(guān)微衛(wèi)星不穩(wěn)定(MSI)的預(yù)測模型[17],通過鑒別HE染色的全玻片掃描圖像(WSI)完成MSI的預(yù)測,并將該模型的性能與經(jīng)驗豐富的病理專家進行比較,顯示出了其強大優(yōu)勢(AUC:0.865 vs. 0.605)。另一方面,AI技術(shù)不僅可以大幅提高診斷效率,而且其穩(wěn)定性和客觀性還可以彌補各級醫(yī)院診療水平參差不齊的不足。
本研究所建立的直腸癌脈管癌栓的AI輔助病理診斷模型,是由DeepLabV3+語義分割模型以及ResNet50分類模型構(gòu)成。DeepLabV3+語義分割模型在先前的研究當中已被證實具有良好的特征提取以及圖像語義分割能力,而ResNet50作為經(jīng)典的圖像分類模型,被廣泛用于目標分類等領(lǐng)域[18-19],因此本研究選擇了二者用于圖像的分析和處理。在圖像分析之前,首先對訓練組的圖像進行了預(yù)處理,以使其更加適合AI訓練,同時通過將原始圖像裁剪為大量512×512像素大小的小塊,從而進一步擴充了數(shù)據(jù)集。在經(jīng)過訓練組圖像進行建模以及測試組圖像對模型初步測試后,本研究又納入來自不同院區(qū)的患者作為外部數(shù)據(jù)集來檢驗該模型的泛化能力。驗證結(jié)果顯示,本模型與病理醫(yī)師人工HE染色閱片結(jié)果相比,準確率、靈敏度和特異度均顯著提高,診斷時間顯著縮短,說明模型性能表現(xiàn)良好,在脈管癌栓的診斷方面有望超越人工HE染色閱片,可以在一定程度上輔助臨床醫(yī)生做出決策。
與小切片相比,病理大切片可以清晰地顯示出腫瘤整體結(jié)構(gòu)及其與周圍組織的關(guān)系,同時避免了多張小切片拼接時產(chǎn)生的誤差,已在前列腺癌、乳腺癌、胰腺癌等的診斷中顯示出了不同的優(yōu)勢[20-22]。在脈管癌栓診斷方面,病理大切片的應(yīng)用會減少因取材位置不同(如癌區(qū)和癌旁)導致的診斷結(jié)果的差異[23]。此外,成本效益分析表明,在制作方面小切片比大切片的采樣成本更高[24]。但是,由于大切片的制作過程復雜,操作難度大,目前還未進入常規(guī)病理診斷流程,因此其臨床實用性還需要進一步研究和探討。
本研究的局限性主要體現(xiàn)在:①樣本量較少。臨床中脈管癌栓的發(fā)生率較低,而且本研究未納入經(jīng)新輔助治療的患者,因為這類患者脈管癌栓發(fā)生率更低,腫瘤組織形態(tài)可能改變,會增加模型訓練難度,從而導致陽性數(shù)據(jù)偏少。②模型的臨床實用性需進一步驗證。本研究使用的是大切片數(shù)字圖像,未納入小切片數(shù)字圖像來對模型進行驗證,故并未在臨床實踐中進行試驗和應(yīng)用。③模型的診斷性能有待提高。對模型進行內(nèi)部測試和外部驗證發(fā)現(xiàn),其準確率、精準率、靈敏度和特異度等評價指標并未達到100%,因此目前該模型若作為一個獨立的診斷工具來使用,還有待進一步完善。后續(xù)將納入多中心的更多樣本來擴充數(shù)據(jù)和訓練模型,并納入小切片數(shù)字圖像來進一步驗證其臨床實用性,輔助臨床醫(yī)生實現(xiàn)1+1>2的效果。
綜上所述,本研究使用病理大切片數(shù)字圖像構(gòu)建了直腸癌脈管癌栓預(yù)測的DCNN模型,該模型與人工HE染色閱片相比擁有較高的診斷能力,在輔助臨床醫(yī)生診斷直腸癌脈管癌栓方面具有一定的可行性。
利益沖突聲明:所有作者聲明不存在利益沖突。
ConflictsofInterest: All authors disclose no relevant conflicts of interest.
倫理批準和知情同意:本研究涉及的所有試驗均已通過青島大學附屬醫(yī)院醫(yī)學倫理委員會的審核批準(文件號QYFYWZLL26318)。所有實驗過程均遵照《涉及人的生物醫(yī)學研究國際倫理準則》的條例進行。受試對象或其親屬已經(jīng)簽署知情同意書。
EthicsApprovalandPatientConsent: All experimental protocols in this study were reviewed and approved by The Medical Ethics Committee of The Affiliated Hospital of Qingdao University (Approval Letter No. QYFYWZLL26318), and all experimental protocols were carried out by following International Ethical Guidelines on Biome-dical Research Involving Human Subjects. Consent letters have been signed by the research participants or their relatives.
作者貢獻:鞠宜衡、盧云、趙鵬參與了研究設(shè)計;鞠宜衡、鄭龍波、張憲祥參與了論文的寫作和修改。所有作者均閱讀并同意發(fā)表該論文。
Contributions: The study was designed byJUYiheng,LUYun, andZHAOPeng. The manuscript was drafted and revised byJUYiheng,ZHENGLongbo, andZHANGXianxiang. All the authors have read the last version of the paper and consented submission.