張力,肖丹丹
1.北京中醫(yī)醫(yī)院順義醫(yī)院醫(yī)學工程處,北京 101300;2.北京中醫(yī)醫(yī)院順義醫(yī)院放射科,北京 101300; *通信作者 張力z_z200888@126.com
在全球范圍內,肺癌的發(fā)病率和死亡率高,并呈年輕化趨勢,且較多患者發(fā)現(xiàn)時已處于進展期,其5年生存率僅為19%,早診早治是提高肺癌生存的關鍵[1-2]。早期肺癌在胸部CT主要表現(xiàn)為肺小結節(jié),雖然其檢出率逐年提高,但假陽性率較高,導致目前肺結節(jié)良惡性鑒別診斷存在困難,微小結節(jié)的診斷更具挑戰(zhàn)[3-5]。
非小細胞肺癌約70%為肺腺癌,肺腺癌及浸潤前病變分為不典型腺瘤樣增生(atypical adenocarcinoma hyperplasia,AAH)、原位腺癌(adenocarcinomain situ,AIS)、微浸潤腺癌(microinvasive adenocarcinoma,MIA)和浸潤性腺癌(invasive adenocarcinoma,IAC)[6]。不同類型的治療方式不同,患者預后生存有差別,因此在CT上準確判斷肺腺癌亞型的臨床意義重大[2,5-6]。
人工智能時代,各種分類器可有效鑒別結節(jié)的良惡性,輔助醫(yī)師提高診斷效率的同時,也減少了讀片者的主觀偏差,對肺結節(jié)的定性診斷可無創(chuàng)地量化腫瘤表型特征,降低過度診斷,緩解患者的壓力[1,7-11]。
大量影像組學和深度學習在肺結節(jié)診斷方面的研究充分證明了這種高度定量技術手段的有效性[12-16],目前在肺結節(jié)的鑒別診斷、病理分型甚至分子分型方面有大量研究[12,15,17-18],但對不同模型在不同類型結節(jié)判斷能力的表現(xiàn)鮮有報道,現(xiàn)有的研究無法綜合評估不同組學模型的優(yōu)缺點,也限制了其在臨床上的應用[9,11,16,18]。本研究創(chuàng)新性地引入雙影像組學模型——針對不同大小類型的實性和亞實性肺結節(jié),從良惡性分類以及侵襲程度分級方面對模型進行評估。希望推進個性化醫(yī)療進步,精準指導臨床實踐,并在模型表現(xiàn)不佳的區(qū)間給出可信度提醒。
1.1 研究對象 回顧性分析2015年1月—2019年9月于北京中醫(yī)醫(yī)院順義醫(yī)院行CT胸部平掃肺結節(jié)的875個病例,共包含4 892個肺結節(jié),依據(jù)病灶體積分布分為小、中、大結節(jié)組,小結節(jié)組為體積小于下四分位數(shù)(51.63 mm3)的小病灶,大結節(jié)組是體積大于上四分位數(shù)(434.75 mm3)的大病灶,介于兩者之間為中結節(jié)組。若以球形計算結節(jié)的直徑,則對應分組標準分別是下四分位數(shù)4.6 mm(51.63 mm3)和上四分位數(shù)9.4 mm(434.75 mm3)。
1.2 數(shù)據(jù)采集方式 患者取仰臥位,雙上肢過頭伸展,屏氣訓練,以吸氣末期行胸部CT平掃。以上影像數(shù)據(jù)采集均采用西門子Defintion AS/YSIO CT設備,掃描參數(shù)為電壓120 kV,轉速0.5 s/r,電流110 mAs,層厚3 mm,螺距1.2 mm。CT掃描數(shù)據(jù)采用0.6 mm圖像層厚及Lung算法重建,重建范圍包括雙側鎖骨上線至雙側膈肌下緣。
1.3 病灶分割 圖像數(shù)據(jù)采集完成后,先進行圖像預處理,按照CT肺窗將圖像的灰度值進行截斷處理,線性變換至1~4 097。然后由2位具有10年以上工作經(jīng)驗的副主任醫(yī)師在達爾文智能科研平臺采用盲法手動逐層勾畫共4 892個結節(jié)的感興趣區(qū)(ROI),并標注良惡性及浸潤性(其中2 014個結節(jié)有病理惡性確診結果,為模型2所用),后續(xù)統(tǒng)計分析以醫(yī)師組標注結果為正確結果(金標準)進行對比分析。
1.4 模型建立 肺結節(jié)良惡性分類模型(模型1)的建立用3 669個結節(jié)作為訓練集,1 223個結節(jié)作為測試集,訓練集中小、中、大結節(jié)組分別有901、1 841、927個病灶,測試集中3組分別有299、601、323個病灶。
首先進行特征提取,每一種特征均由一個濾波器函數(shù)和一類特征組合而成,其中包含8種濾波器:指數(shù)濾波器、拉普拉斯-高斯濾波器、平方濾波器、平方根濾波器、對數(shù)濾波器、梯度值濾波器、局域二值圖模式圖、小波變換濾波器。特征包含7大類:一階特征、形狀特征(3D)、灰度共生矩陣、灰度區(qū)域大小矩陣、灰度游程矩陣、相鄰灰度差矩陣、灰度依賴矩陣。經(jīng)過濾波器和特征的排列組合,每個病灶或ROI能計算得到1 223維。然后對所有特征按照公式(1)進行歸一化預處理。
其中n和j分別代表第n個樣本的第j個特征。xmin,j是在所有樣本中,第j個特征最小的那個樣本,同理xmax,j為特征值最大的樣本。
預處理完成后,通過包裹式特征篩選方式中的遞歸特征消除方法,利用邏輯回歸連續(xù)建模選擇特征,逐次刪除最不重要的特征,最后保留10個特征作為模型的輸入,在達爾文智能科研平臺利用以徑向基函數(shù)為核的支持向量機模型分別建立肺結節(jié)良惡性鑒別(模型1)和浸潤性分類模型(模型2)。并對錯誤樣本進行懲罰,懲罰系數(shù)C=100。
模型2則將模型1中確診惡性結節(jié)中屬于腺癌的部分進一步細分,預測腺癌亞型(共2 014個結節(jié)病理確診惡性,其中1 978個結節(jié)為腺癌,25例為鱗癌,11例為其他),根據(jù)浸潤程度預測輸出值分為3類,分別為浸潤前病變(AAH+AIS)、MIA和IAC。
模型建立后選取0.5作為參考閾值,計算2個模型在各種條件下的準確率,對模型表現(xiàn)進行評估。其中陽性在模型中代表惡性結節(jié)(n),陰性代表良性結節(jié),真陽性率(%)=真陽性/(真陽性+假陰性),假陽性率(%)=真陰性/(真陰性+假陽性)。
本研究采用的基本流程見圖1。
圖1 研究流程圖。模型1和模型2的建立研究都分為基于4個基本階段,分別是圖像獲取、ROI分割、提取特征和分析
1.5 模型效能評估 肺結節(jié)直徑及體積以均數(shù)表示,模型1、2分別鑒別肺結節(jié)良惡性及浸潤性的表現(xiàn)用準確率、受試者工作特征(ROC)曲線下面積(AUC)評估。AUC是評價分類器性能的最佳度量之一。整個測試集與驗證集比例為3∶1,測試集各項特征數(shù)據(jù)與驗證集比例一致。模型2評估中使用熱圖,可以直觀表現(xiàn)不同病灶大小和浸潤性水平關系的預測準確率。
2.1 肺結節(jié)良惡性分類模型(模型1)表現(xiàn)評估 胸部CT病灶的良惡性分類模型(模型1)的分類ROC曲線見圖2。訓練集和測試集的表現(xiàn)非常接近,訓練集AUC為0.953(95%CI0.948~0.959),測試集AUC為0.950(95%CI0.938~0.961)。結果無過擬合,置信區(qū)間非常狹窄,模型可信度很高。為了進行更加全面的統(tǒng)計分析,在后續(xù)研究中,利用訓練集和測試集的全部數(shù)據(jù),并且設置總體預測閾值為0.5,在此閾值水平下訓練集敏感度為0.82,特異度為0.914;測試集敏感度為0.852,特異度為0.912。
圖2 模型1在訓練集和測試集上的ROC曲線
進一步評估模型1對惡性病灶檢出的敏感度和特異度(圖3)顯示,在小結節(jié)組中良性病灶占99.0%(296/299),且良性病灶分類準確率達100%;大結節(jié)組中則相反,惡性病灶(n=274)的準確率達0.98,在良性病灶(n=49)鑒別準確率為0.24,在中結節(jié)組中良性病灶占77.7%(467/601)且分類效果更好(準確率為0.93)。
圖3 模型1在不同病灶大小和病灶類型下的準確率。A為模型1不同病灶大小時鑒別良、惡性病灶的準確率,B為熱力圖,進一步展示了不同病灶大小數(shù)量和分類結果,其中每一塊中間數(shù)字為準確率,下方數(shù)字代表該病灶類型包含的結節(jié)數(shù)量(n),色塊由淺到深代表分類準確率由低到高,小、中、大分別為體積大小劃分的組別
2.2 腺癌浸潤性預測模型(模型2)表現(xiàn)評估 模型對良性小結節(jié)和IAC的準確率分別為100%和96.13%(圖4A)。大結節(jié)組中的良性病灶數(shù)量僅49個,占總體良性病灶的6%,總體惡性可能性很高。直徑>9.4 mm的大結節(jié)很容易與惡性病灶混淆,模型2則對這樣的大結節(jié)鑒別有很高的敏感度,其對浸潤前(AAH+AIS)、MIA及IAC,模型準確率分別為92%、94%、100%(圖4B)。對于4.6 mm≤直徑<9.4 mm的中間體積病灶,分類準確率達93%,在浸潤程度由低到高預測準確度分別為0.33、0.61及0.42。
圖4 模型2在測試集上的表現(xiàn)。A中分別將良性結節(jié)和惡性結節(jié)按體積大小和病理亞型分為小、中、大3類,及AAH+AIS、MIA和IAC組。模型對良性小結節(jié)和惡性浸潤型病變(IAC)的檢出最敏感;B中熱力圖將所有病灶按照病理分型和大小進行二維分組,給出了對每一分組的預測準確率。其中每一塊中間數(shù)字為準確率,下方數(shù)字代表該病灶類型包含的結節(jié)數(shù)量(n),色塊由淺到深代表預測準確率由低到高。浸潤前病灶包括AAH與AIS,微浸潤病灶為MIA,浸潤性病灶為IAC
模型2預測腺癌分型結果見圖5。浸潤型病變中大病灶占比>95%,準確率達93%。預后較好的浸潤前和微浸潤病變(AAH、AIS、MIA)的中體積病灶占67%,準確率接近100%,總體準確率達93%。模型1、2輸出結果及精確度見圖6。
圖5 模型2在測試集上的總體表現(xiàn)。熱力圖中將所有病灶按照病理分型和大小進行二維分組,給出了對每一分組的預測準確率
圖6 模型1和2輸出結果及精確度。圖為在各種情況下模型1和模型2輸出結果的精確度示例。其中,“輸入”為病灶勾畫后提取的病灶大小,“輸出”為模型1和2的分類結果及針對不同輸出結果的精確度,其中紅色字體表示惡性可信度,綠色字體表示良性可信度,其他情況為空,需要醫(yī)師進一步結合其他信息判斷其性質
影像學征象在肺結節(jié)的診斷及評估中具有極其重要的意義。本研究建立的模型1對體積>434.75 mm3(直徑9.4 mm)的結節(jié)判斷為惡性的準確率為92%,對所有大小結節(jié)在內的IAC判斷為惡性的準確率為96.13%,對病灶體積>51.63 mm3(直徑4.6 mm)的IAC的判斷準確率為100%。
不同級別浸潤性病變的生存和預后完全不同,從模型2的表現(xiàn)來看,浸潤性肺癌的檢出率同樣高達97%,結合2個模型的表現(xiàn),本研究提出醫(yī)師聯(lián)合影像組學的診斷流程,該流程給出了在不同病灶大小下,模型輸出結果的精確度(可信度),當2個模型同時輸出陽性結果時,該病灶是IAC的可能性非常大。若模型對中體積病灶給出AAH、AIS的預測,建議隨訪觀察,給出MIA的預測,結合組織病理檢查制訂切除方案;若本身為大病灶,模型給出IAC的預測,則浸潤性的可能性非常大,建議進一步行組織病理檢查。
對于手術指征不明確的較大磨玻璃病灶,需要進行大量的輔助類檢查。而PET/CT掃描對實性成分不高的磨玻璃病變并不敏感,當病灶部位恰好難以行支氣管鏡檢查或穿刺活檢等病理檢查時,臨床可考慮行影像組學模型的良惡性分類進行參考,以進一步明確手術指征。
本研究通過對肺結節(jié)良惡性模型和浸潤型病理分型模型評估,可以看出在不同病灶大小下模型的表現(xiàn)不同。模型對小病灶和大病灶有更高的敏感度,基本上可以做到不漏診。對所有病灶的浸潤類型判斷均能達到較高的準確度,對微浸潤型和浸潤性病灶判斷無顯著差異。但是對于4.6 mm≤直徑<9.4 mm的中間體積病灶的準確率不太高,建議位于該范圍的病灶可以通過隨訪并結合組織病理等指標進一步確診。
從模型的表現(xiàn)可認為達爾文智能科研平臺的組學模型有敏銳的特征提取與識別能力,結果可信度很高。本研究基于雙模型組學模型提出了一個AI聯(lián)合放射科醫(yī)師的診斷肺結節(jié)的最佳流程,為直徑<1 cm的肺結節(jié)性質判斷提供了可靠的參考,并對每一種可能情況給出了可信度提醒,方便臨床醫(yī)師結合實際出具診斷意見,有助于實現(xiàn)肺癌的早期診斷。
本研究的局限性:①本研究是一項回顧性研究,可能存在選擇偏倚;②盡管本研究中的模型在一致性和可重復性方面表現(xiàn)優(yōu)秀,但僅在內部進行了驗證,設計時未納入外部驗證,需要在外部數(shù)據(jù)集上驗證模型表現(xiàn)并及時調整;③未來也需要多中心前瞻性試驗進一步驗證,有望給出Lung-RADS分級,精準助力臨床實踐。