梁 潔,孫金磊,李夢遠,周江燕,李葆青
(首都醫(yī)科大學石景山教學醫(yī)院北京市石景山醫(yī)院醫(yī)學影像科,北京 100040)
肋骨骨折在胸部鈍性損傷中占40%~50%[1]。CT用于檢查肋骨骨折掃描速度快、分辨率高,但數(shù)據(jù)量大,醫(yī)師易因視覺疲勞而漏診[2]。深度學習(deep learning, DL)的快速發(fā)展為肋骨骨折檢測帶來機遇[3],多項研究[4-5]結(jié)果表明,應(yīng)用人工智能(artificial intelligence, AI)技術(shù)能顯著提高檢測精度及效率。本研究觀察基于DL的AI輔助系統(tǒng)用于CT檢出肋骨新鮮骨折的效能,并以多閱片者多病例(multi-reader multi-case, MRMC)臨床試驗?zāi)J皆u估AI輔助影像科醫(yī)師診斷肋骨新鮮骨折的價值。
1.1 一般資料 回顧性收集2017年6月—2019年3月北京市石景山醫(yī)院收治的1 000例因胸部外傷接受急診胸部CT檢查患者,男570例、女430例,年齡18~98歲、平均(57.7±16.7)歲,CT圖像均保存為DICOM格式。排除標準:①圖像存在偽影或無法滿足診斷要求;②病理性肋骨骨折;③骨折病程>3周。檢查前患者均簽署知情同意書。
1.2 儀器與方法 采用GE Discovery CT750 HD 128層寶石能譜CT機行胸部掃描。囑患者仰臥,頭先進、雙臂上舉。首先攝取胸部正位定位圖確定掃描范圍,之后自肺尖掃描至雙側(cè)第12肋游離緣;參數(shù):管電壓120 kV,管電流250~350 mA,層厚0.625 mm,層間距0.625 mm,矩陣512×512,FOV 360 mm×360 mm;以骨算法重建圖像。
1.3 診斷標準 將CT圖像導(dǎo)入深睿醫(yī)療標注平臺(https://label.deepwise.com/),由具有10年以上影像學診斷經(jīng)驗的主任及副主任醫(yī)師各1名參照文獻[5]方法對肋骨新鮮骨折進行逐層標注,再由另2名影像科主任醫(yī)師共同進行審核,以最終標注結(jié)果作為真實數(shù)據(jù)(ground truth, GT);以創(chuàng)傷后3周內(nèi)CT顯示骨折邊緣銳利、無骨膜反應(yīng)或骨痂形成[5]為肋骨新鮮骨折。
1.4 圖像分析 將圖像導(dǎo)入深睿醫(yī)療Dr.Wise?骨折CT影像輔助檢測系統(tǒng)(簡稱Dw_AI),基于異常篩選模型和假陽消除模型組成的級聯(lián)結(jié)構(gòu)進行自動檢測。異常篩選模型以CenterNet框架[7]為二維多目標檢測器,以DLA-34網(wǎng)絡(luò)[8]為骨干,提取多尺度特征;假陽剔除模型為3D模型,通過采樣獲取像素為96×96×6的病灶圖像塊,輸入ResNet50網(wǎng)絡(luò)[9]中提取其特征;最后以全連接層進行有、無肋骨新鮮骨折分類。其流程見圖1。
圖1 Dw_AI檢測肋骨新鮮骨折流程圖
隨機抽取60例作為數(shù)據(jù)集2(40例肋骨新鮮骨折、20例無骨折),以其余940例為數(shù)據(jù)集1(902例肋骨新鮮骨折、38例無骨折)。由1名具有10年胸部CT診斷經(jīng)驗的影像科主任醫(yī)師(chief radiologist,CR)基于數(shù)據(jù)集1獨立評估肋骨新鮮骨折,將其結(jié)果與Dw_AI結(jié)果進行對比,以評估Dw_AI的效能。
基于數(shù)據(jù)集2采用MRMC模式[10]閱片,評估Dw_AI輔助各年資醫(yī)師診斷肋骨新鮮骨折的效果;參與者包括具有5年及10年以上影像學診斷經(jīng)驗的住院醫(yī)師各1名(R1和R2)和15年及20年以上主治醫(yī)師各1名(A1和A2)。隨機將數(shù)據(jù)集2分為A組(21例肋骨新鮮骨折、9例無骨折)和B組(19例肋骨新鮮骨折、11例無骨折)。第一輪閱片中,上述4名醫(yī)師分別在Dw_AI輔助下評估A組肋骨新鮮骨折、獨立對B組進行診斷;經(jīng)4周洗脫期后進行第二輪閱片,4名醫(yī)師分別獨立診斷A組肋骨新鮮骨折,并在Dw_AI輔助下對B組進行評估。
1.5 統(tǒng)計學分析 采用SPSS 25.0統(tǒng)計分析軟件。分別于病灶、肋骨及患者級別統(tǒng)計Dw_AI及閱片者診斷肋骨新鮮骨折的結(jié)果。在肋骨及患者級別,以至少于1支肋骨檢出1個病灶與GT一致為真陽性結(jié)果,計算敏感度、特異度、精確率、F1分數(shù)及CT假陽性(false positives per CT, FP/CT),評估診斷效能。采用χ2檢驗比較計數(shù)資料。P<0.05為差異有統(tǒng)計學意義。
2.1 肋骨新鮮骨折GT 數(shù)據(jù)集1全部940例中,共2 946支肋骨存在3 452處新鮮骨折,包括1 848處不完全、1 604處完全性骨折;其中2 425處對位良好,715處輕微移位,312處嚴重移位;1 365處位于前段、941處位于后段、1 146處位于腋段肋骨。數(shù)據(jù)集2共60例中,112支肋骨存在123處新鮮骨折。
2.2 診斷效能 Dw_AI正確檢出3 230處、誤診362處、漏診222處,CR檢出2 900處、誤診610處、漏診552處肋骨新鮮骨折。2 946支肋骨存在新鮮骨折,Dw_AI與CR分別正確檢出2 798支及2 538支;19 328支(196例缺失1~2支)肋骨無骨折,Dw_AI誤診286支、CR誤診353支存在新鮮骨折。全部902例新鮮肋骨骨折中,Dw_AI與CR分別正確檢出893例及847例;38例無骨折,Dw_AI與CR分別誤診16例及23例有新鮮骨折。Dw_AI在各級別上的診斷效能均優(yōu)于CR(P均<0.05),見表1。
表1 Dw_AI與CR針對數(shù)據(jù)1檢測肋骨新鮮骨折的效能
Dw_AI對不同類型及部位肋骨新鮮骨折的檢出率明顯高于CR(P均<0.05)。Dw_AI與CR檢出不同類型肋骨新鮮骨折的差異均有統(tǒng)計學意義(P均<0.05),檢出不同部位骨折差異均無統(tǒng)計學意義(P均>0.05)。見表2及圖2。
表2 Dw_AI與CR對不同類型及部位肋骨新鮮骨折檢出率比較[%(支)]
圖2 Dw_AI與CR診斷不同部位肋骨新鮮骨折 A.Dw_AI檢出前段(上圖)及腋段(下圖)肋骨骨折,而CR漏診; B.Dw_AI及CR均檢出腋段(上圖)和前段(下圖)肋骨骨折; C.Dw_AI及CR均漏診后段(上圖)及前段(下圖)肋骨骨折; D.Dw_AI漏診而CR檢出前段(上、下圖均為前段)肋骨骨折
2.3 Dw_AI輔助診斷肋骨新鮮骨折的效能 Dw_AI輔助下,4名醫(yī)師在3個級別上診斷肋骨新鮮骨折的敏感度均有所提高(P均<0.05),但R1及A2的FP/CT均升高(P均<0.05)。肋骨級別上,無論有無Dw_AI輔助,4名醫(yī)師診斷的特異度差異均無統(tǒng)計學意義(P均<0.05)。在患者級別,于Dw_AI輔助下,除R1診斷的特異度未見提高(P=1.000)外,其余3名醫(yī)師診斷的特異度均有所提高(P均<0.05)。見表3。
表3 Dw_AI輔助4名醫(yī)師針對數(shù)據(jù)集2診斷肋骨新鮮骨折的效能
準確診斷肋骨新鮮骨折對臨床、尤其急診適當選擇治療方案非常重要。AI系統(tǒng)能顯著提高CT對肋骨骨折的檢出率[11-12]。臨床對于陳舊骨折一般不予干預(yù),故本研究主要觀察Dw_AI用于CT檢出肋骨新鮮骨折的效能,發(fā)現(xiàn)無論在病灶、肋骨還是患者級別上,Dw_AI針對數(shù)據(jù)集1檢出肋骨新鮮骨折的敏感度均高于CR,且Dw_AI對于移位性骨折的檢出率較高,提示Dw_AI診斷肋骨新鮮骨折的效能明顯優(yōu)于醫(yī)師獨立診斷,有助于醫(yī)師提高診斷敏感度,避免漏診肋骨移位性骨折。
MRMC是常用于AI輔助診斷的臨床試驗設(shè)計和分析方法之一,指由多名閱片者分別在不同模式下(如單獨閱片與AI輔助下)交叉閱片,可考慮閱片者及病例之間的差異性等,提供更為全面、可靠的信息,使評估結(jié)果更為客觀、準確。本研究基于MRMC模式觀察Dw_AI輔助不同年資影像科醫(yī)師診斷肋骨新鮮骨折的價值,結(jié)果顯示, Dw_AI輔助下,4名醫(yī)師檢出肋骨新鮮骨折的敏感度均顯著提高,且相比中等年資醫(yī)師,Dw_AI輔助下低年資醫(yī)師檢出骨折敏感度提高更為明顯,即Dw_AI輔助能提高影像科醫(yī)師、尤其低年資醫(yī)師對于肋骨新鮮骨折的檢出率。
綜上,AI輔助系統(tǒng)用于CT檢出肋骨新鮮骨折的效能較佳,且能輔助影像科醫(yī)師、尤其低年資醫(yī)師提高對肋骨新鮮骨折的檢出率。但本研究數(shù)據(jù)來自單中心,且AI仍存在一定漏診率,尤其對于對位良好骨折,有待改進和優(yōu)化Dw_AI系統(tǒng)后開展多中心臨床研究進一步完善。