張?zhí)飳?王蔚霖 潘 寧 朱亞男 李正軍 周和平
(1 陜西省安康市中心醫(yī)院影像中心,安康市 725300,電子郵箱:596709283@qq.com;2 北京推想科技有限公司,北京市 100085)
由于環(huán)境的污染、人口的增長和老齡化的加劇等諸多因素,肺癌患者數(shù)量正逐年攀升,2018年全球腫瘤統(tǒng)計結果顯示,新發(fā)肺癌占所有新發(fā)腫瘤病例的11.6%,病死率約18.4%,已成為當前世界范圍內(nèi)發(fā)病率和病死率均居首位的惡性腫瘤,而我國每年因肺癌而死亡的人數(shù)高達62.6萬[1]。因此,肺癌的早期診斷、準確鑒別及正確治療對提高患者生存率有著非常重要的意義。
胸部CT檢查在早期肺癌的檢出與鑒別診斷方面均具有優(yōu)勢,其結節(jié)檢出率是胸部X線的6倍,能清晰顯示結節(jié)位置、大小及其生長特性,其中生長特性是鑒別肺結節(jié)良惡性的重要指標之一:良性結節(jié)往往生長緩慢,倍增時間較長,而惡性結節(jié)生長迅速,倍增時間較短。針對難定性的小結節(jié),臨床上通常采用低劑量CT定期隨訪觀察結節(jié)的動態(tài)變化,尤其是結節(jié)長徑和體積的改變[2],作為臨床治療方案選擇的重要參考。CT圖像層厚會影響肺結節(jié)的檢出率,也會影響放射科醫(yī)師判定結節(jié)大小和體積。有學者指出,薄層圖像所測得的肺結節(jié)數(shù)值較厚層圖像準確,但圖像層厚是否會影響人工智能對肺結節(jié)檢測的準確性還未見相關報道[3]。隨著醫(yī)學科學技術的飛速發(fā)展,人工智能應用于醫(yī)療影像已經(jīng)是必然的趨勢[4],目前計算機輔助診斷技術已逐步應用于臨床,但該技術尚處在初步階段,還存在很多不確定的因素需要探討。因此,本研究通過多層螺旋CT掃描仿真胸部體模內(nèi)肺結節(jié),并利用人工智能技術分析不同重建層厚的CT圖像,探討機器深度學習檢測仿真胸部體模肺結節(jié)長徑及體積測量的準確性。
1.1 模型 (1)本研中使用專業(yè)仿真胸部體模(Multipurpose Chest Phantom N1“LUNGMAN”,日本京都Kagaku株式會社),長40 cm、寬43 cm、高48 cm,包括胸壁、脊椎、肋骨、肺、縱隔及肝臟等模擬器官及組織,見圖1a。體模的軟組織及合成骨骼材料對X射線的吸收率接近人體真實組織。(2)模擬肺結節(jié)(Simulated Tumors,日本京都Kagaku株式會社)共12枚,隨機將結節(jié)散在放置于體模內(nèi)雙肺上、中、下葉,各個肺葉放置的結節(jié)數(shù)量、大小均隨機,但保證每個肺葉都有人工肺結節(jié)。根據(jù)美國Fleischner 學會肺結節(jié)處理建議[5],直徑小于4 mm的結節(jié)不屬于陽性發(fā)現(xiàn),因此本研究所使用的結節(jié)共有4種直徑(5 mm、8 mm、10 mm、12 mm),每種直徑的結節(jié)各3個,CT值分別為100 HU、-630 HU、-800 HU。為避免偽影干擾模擬肺結節(jié)被自然放置在體模內(nèi),未使用工具固定,根據(jù)公式V實際=(4/3)πr3計算得出結節(jié)實際體積。
圖1 研究所使用的模型注:a為仿真胸部體模;b為模擬肺結節(jié),其中A、B、C分別代表3種密度值的結節(jié),A、B、C的CT密度值分別為100 HU、-630 HU、-800 HU,共5種直徑(3 mm、5 mm、8 mm、10 mm、12 mm,但本研究中未使用直徑為3 mm的結節(jié))。
1.2 研究方法 采用GE公司Revolution 256排螺旋CT對仿真體模進行掃描,范圍包括體模全肺組織(肺尖到后肋膈角)。掃描參數(shù):管電壓120 kV,采用自動管電流(80~350 mA),噪聲指數(shù)=14,層厚/層間距為5 mm/5 mm,球管旋轉(zhuǎn)速度0.28 s/r,準直器寬50 cm,矩陣512×512,視野為400×400 mm,螺距0.992 ∶1,掃描層厚設置為5 mm,自適應統(tǒng)計迭代重建圖像重組設置為40%,肺窗(1 500 HU/-500 HU),圖像重建層厚分別為0.625 mm、1.25 mm、2.5 mm。分別將DICOM圖像上傳至推想科技深度學習工作站,利用肺結節(jié)人工智能軟件InferRead?CT肺部疾病檢測這些肺結節(jié),記錄結節(jié)數(shù)目、長徑 (最大直徑)、體積(V測量)等信息 ,見圖2。根據(jù)公式計算長徑、體積測量的絕對錯誤率(absolute percentage error,APE):APE=(測量值-實際值)/實際值×100%。
圖2 肺結節(jié)人工智能軟件在不同方位識別肺結節(jié)注:c、d、e分別代表在水平位、冠狀位及矢狀位標注肺結節(jié)。
1.3 統(tǒng)計學分析 采用SPSS 20.0軟件進行統(tǒng)計分析。符合正態(tài)分布的計量資料以(x±s)表示,多組間比較采用單因素方差分析,不符合正態(tài)分布的計量資料以[M(P25,P75)]表示,比較采用Kruskal-Wallis秩和檢驗。以P<0.05為差異有統(tǒng)計學意義。
在不同重建圖像層厚下,肺結節(jié)的長徑和體積APE差異均無統(tǒng)計學意義(均P>0.05),見表1。不同直徑肺結節(jié)的長徑和體積的APE差異均無統(tǒng)計學意義(均P>0.05),見表2。
表1 不同重建層厚圖像肺結節(jié)長徑、體積測量的APE比較[M(P25,P75),%]
表2 不同長徑肺結節(jié)直徑、體積測量的APE比較[M(P25,P75),%]
肺癌是威脅人類健康和生命最常見的惡性腫瘤之一。肺內(nèi)結節(jié)是肺癌的早期特征性表現(xiàn),薄層CT的普及使得肺結節(jié)的檢出率大大提高,但很多肺部疾病都會形成肺結節(jié),例如結核、塵肺、炎癥出血等[4]。因此,對于肺內(nèi)的小結節(jié)性病灶的良惡性鑒別存在很大困難,導致部分惡性結節(jié)患者早期未得到有效治療,而確診時已處于癌癥中晚期,錯失最佳手術時機,治療效果不佳,預后較差,嚴重影響患者生活質(zhì)量。臨床上針對難以定性的肺結節(jié)常采用CT隨訪觀察結節(jié)的生長特性,如長徑和體積的變化等,因此結節(jié)長徑和體積測量的準確性可能對肺結節(jié)的診斷和治療產(chǎn)生重大影響。然而,有學者利用傳統(tǒng)自動化測量工具研究肺結節(jié)時發(fā)現(xiàn),不同分析軟件測出的肺結節(jié)長徑有著顯著差異,而體積卻無明顯差異[6]。因此,他們認為結節(jié)體積可能是評估肺結節(jié)生長特征更可靠的指標,而造成這種差異的原因是軟件所設定的測量公式不同,測量長徑選用的肺結節(jié)維度方向有所差異[6]。在本研究中,我們也發(fā)現(xiàn)對于直徑>4 mm的肺結節(jié),長徑和體積APE比較差異無統(tǒng)計學意義(P>0.05),說明結節(jié)直徑的變化對肺結節(jié)長徑和體積的APE無顯著影響。
早發(fā)現(xiàn)、早診治可提高肺癌患者5年生存率及生活質(zhì)量。高分辨率CT是目前肺結節(jié)檢出與隨訪最有效的手段[7-8]。但高分辨CT數(shù)據(jù)量較大,明顯增加檢查圖像數(shù)量及影像科醫(yī)生的閱片負擔,疲勞狀態(tài)下很可能導致誤判和漏診[9]。應用計算機輔助診斷技術能夠?qū)T圖像進行初步篩查并標記可疑病灶,從而幫助影像科醫(yī)生進行再次判別,減輕醫(yī)生工作負擔并提高診斷準確率[10-11]。隨著大數(shù)據(jù)軟件的開發(fā)應用、計算機深度學習算法的推動,人工智能可以從圖像中讀取到肉眼易于忽視的信息,從而提高醫(yī)生對病灶的診斷準確率[12]。本研究利用規(guī)則的球體模擬肺結節(jié),但測量結果跟結節(jié)真實值存在不同程度的差異,我們推測其原因可能為模擬的肺組織與真實胸部存在差異,仿真體模材料結構密度單一,而結節(jié)測量的精確度取決于結節(jié)與肺部結構及鄰近正常組織(如支氣管及血管)的緊密程度,緊鄰肺結節(jié)且密度相似的結構可影響檢測結果。本研究中,不同重建層厚下肺結節(jié)的長徑和體積的APE差異均無統(tǒng)計學意義(均P>0.05),說明在不同重建層厚下人工智能對不同結節(jié)長徑與體積的測量基本一致,分析原因可能是由于肺組織天然對比度高,使得肺內(nèi)結構密度分辨率高,結節(jié)檢測結果一致性好,故圖像層厚對人工智能測量肺結節(jié)長徑及體積沒有顯著影響。由此可見,在不同重建層厚下,人工智能軟件對直徑4 mm以上肺結節(jié)的測量結果較為可信,且2.5 mm層厚就能滿足人工智能閱片需求。因此,在能夠保證肺結節(jié)檢測準確性的前提下,可加大圖像層厚,以減少影像醫(yī)師閱片數(shù)量,縮短閱片時間,緩解臨床工作壓力。
薄層CT掃描在肺結節(jié)檢出方面具有非常高的敏感性,能提高早期肺癌診斷的準確性[13]。與人工智能閱片相比,醫(yī)師肉眼閱片的漏診率較高,但假陽性率較低,不易把一些增粗的支氣管或血管束斷面誤判為肺內(nèi)異常小結節(jié)。研究表明,人工智能檢測肺結節(jié)假陽性率較高,尤其容易將小葉核心結構誤診,其他主要誤診原因包括增厚、擴張的細支氣管和交叉、增粗、迂曲的血管影等[14-16]。因此,影像科醫(yī)師仍然需要對人工智能的檢測結果進行復查,做到人工閱片和計算機智能閱片相互補充[17],從而提高肺腫瘤早期診斷的準確率,指導臨床醫(yī)生選擇正確的治療方案,改善患者預后,延長患者存活時間,減輕家庭與社會的經(jīng)濟負擔。
本研究仍存在不足之處:實驗設計較為簡單,數(shù)據(jù)量較少,最終結果可能受到一定程度影響,后續(xù)還需加大樣本量進一步驗證結論;雖然體模軟組織及其合成骨骼材料對X射線的吸收率非常接近人體真實組織,但掃描體模得到的數(shù)據(jù)與臨床實踐還存在一定差距。
綜上所述,對于直徑>4 mm的肺結節(jié),體積可能是機器深度學習軟件測量肺結節(jié)時更可靠的指標。不同重建層厚對機器深度學習技術測量肺結節(jié)長徑及體積的結果影響較小,因此采用人機協(xié)同閱片工作模式時,在能夠保證肺結節(jié)檢測準確性的前提下,可加大圖像層厚以減少影像醫(yī)師閱片數(shù)量,緩解臨床工作壓力。目前人工智能結合醫(yī)學影像診斷模式處于初步探索階段,雖然機器深度學習技術在肺結節(jié)的檢測和分類的研究已取得不錯的成就[18],但該技術還需要更進一步的訓練、優(yōu)化與提升[19]。當前的計算機智能醫(yī)學影像技術在優(yōu)化醫(yī)師資源配置、緩解醫(yī)療資源緊張和提升臨床診療水平方面已展現(xiàn)出巨大的潛力,但該領域還存在許多未知的因素,亟待學者們進一步地探索[20-21]。