沈 潔,劉雅靜,莫 淼,周 瑾,王澤洲,周昌明,周世崇,常 才,鄭 瑩,3
1. 復(fù)旦大學(xué)附屬腫瘤醫(yī)院腫瘤預(yù)防部,復(fù)旦大學(xué)上海醫(yī)學(xué)院腫瘤學(xué)系,上海 200032;
2. 復(fù)旦大學(xué)附屬腫瘤醫(yī)院超聲科,復(fù)旦大學(xué)上海醫(yī)學(xué)院腫瘤學(xué)系,上海 200032;
3. 上海腫瘤疾病人工智能工程技術(shù)研究中心,上海 200032
乳腺癌是全球最常見的惡性腫瘤。國(guó)際癌癥研究機(jī)構(gòu)(International Agency for Research on Cancer,IARC)發(fā)布的2020年全球癌癥報(bào)告數(shù)據(jù)[1]顯示,全球每年新發(fā)乳腺癌226萬例,每年因乳腺癌死亡68萬例,嚴(yán)重威脅著女性健康。在中國(guó)乳腺癌是女性最常見的惡性腫瘤,近年來發(fā)病率和死亡率均呈快速上升趨勢(shì)。中國(guó)國(guó)家癌癥中心2020年最新發(fā)布的中國(guó)惡性腫瘤發(fā)病和死亡數(shù)據(jù)[2]顯示,2016年中國(guó)有30.6萬乳腺癌新發(fā)病例,位居中國(guó)女性癌癥發(fā)病首位,且有7.1萬女性死于乳腺癌,位于女性癌癥死亡的第5位。
有研究[3-4]證實(shí),可以通過大規(guī)模的人群篩查降低乳腺癌的死亡率,在歐美國(guó)家乳腺癌篩查中廣泛采用乳腺X線檢查技術(shù),可以降低40歲以上婦女的乳腺癌死亡率,美國(guó)乳腺癌30年間死亡率下降了43%[5];但X線檢查在以中國(guó)為代表的亞洲婦女中的應(yīng)用卻存在明顯局限性,X線檢查對(duì)于亞洲年輕女性及乳腺致密度較高者,篩查靈敏度(sensitivity,Se)較低,越來越多的亞洲學(xué)者認(rèn)為乳腺超聲作為亞洲女性乳腺癌篩查手段是比較適合的選擇。多項(xiàng)人群研究[6-8]結(jié)果顯示,篩查性超聲在乳腺癌的早期階段可發(fā)現(xiàn)相當(dāng)數(shù)量的乳腺X線檢查不能發(fā)現(xiàn)的腫塊,尤其是在致密乳腺婦女及小乳房中。
但超聲作為篩查方法在社區(qū)大規(guī)模人群中的應(yīng)用也受到明顯制約[9],超聲醫(yī)師的技術(shù)、經(jīng)驗(yàn)及診斷水平等主觀因素等都限制了超聲篩查的普及和推廣。人工智能(artificial intelligence,A I)輔助超聲檢查可以幫助快速篩查出需要優(yōu)先診斷的病例,提高篩查的Se和特異度(specificity,Sp),減少漏診率,有望突破超聲在人群篩查中應(yīng)用的瓶頸。
復(fù)旦大學(xué)附屬腫瘤醫(yī)院自主研發(fā)了一款便攜式AI輔助超聲診斷儀,通過對(duì)復(fù)旦大學(xué)附屬腫瘤醫(yī)院30多萬女性乳腺癌病灶數(shù)據(jù)進(jìn)行機(jī)器學(xué)習(xí),建立了AI輔助超聲的乳腺癌診斷技術(shù)及一套完備的乳腺超聲影像自動(dòng)分析篩查系統(tǒng)[10-12]。本研究通過與常規(guī)超聲的比較,了解AI輔助超聲對(duì)于中國(guó)女性乳腺病灶的實(shí)時(shí)識(shí)別和判斷能力,通過隨訪獲得乳腺癌發(fā)病結(jié)局,了解AI輔助超聲應(yīng)用于人群乳腺癌篩查的潛力,為該技術(shù)應(yīng)用于人群篩查提供科學(xué)依據(jù)。
本研究采用前瞻性、平行對(duì)照的診斷性試驗(yàn)設(shè)計(jì),納入2020年8-12月在復(fù)旦大學(xué)附屬腫瘤醫(yī)院招募來院進(jìn)行乳腺超聲檢查的從未診斷過乳腺癌的女性就診者,年齡在35~74歲。排除標(biāo)準(zhǔn):① 已確診乳腺癌者;② 已確認(rèn)患有其他類型的惡性腫瘤疾病者;③ 有嚴(yán)重的心肺功能不全、肝腎功能不全等系統(tǒng)性疾病者;④ 有嚴(yán)重合并癥,平均期望壽命不超過5年者;⑤ 乳腺部分或全切術(shù)后者;⑥ 不同意參加研究及后續(xù)隨訪 者。
所有對(duì)象均簽署知情同意書,本研究獲得復(fù)旦大學(xué)附屬腫瘤醫(yī)院倫理委員會(huì)審批(審批號(hào):SCCIRB2008223-22)。
本研究使用的AI輔助超聲診斷儀是國(guó)家自然科學(xué)基金委員會(huì)重大儀器專項(xiàng)和上海市科學(xué)技術(shù)委員會(huì)科技創(chuàng)新行動(dòng)計(jì)劃資助的由復(fù)旦大學(xué)附屬腫瘤醫(yī)院、復(fù)旦大學(xué)信息科學(xué)與工程學(xué)院、上海大學(xué)及視隼智能科技(上海)有限公司共同研發(fā)的一款便攜、智能的AI輔助超聲診斷儀[10-12],由一塊500 mm×500 mm×20 mm的顯示面板和一只超聲探頭組成(圖1)。常規(guī)超聲使用荷蘭Philips公司IU22超聲診斷儀L9-3探頭,探頭頻率范圍為3~9 MHz。
圖1 便攜式AI輔助超聲診斷儀Fig. 1 Portable AI-assisted ultrasound diagnostic instrument
AI輔助超聲進(jìn)行檢查時(shí),操作者只需進(jìn)行乳腺超聲標(biāo)準(zhǔn)掃查(圖2),按照?qǐng)D示方向緩緩、全方位進(jìn)行掃查,AI可輔助自動(dòng)進(jìn)行乳腺腫塊圖像識(shí)別、判斷,在顯示屏上框示出可疑病灶部位,并發(fā)出“嘟嘟”的警示音。
圖2 乳腺超聲標(biāo)準(zhǔn)掃查法Fig. 2 Standard breast ultrasound scanning method
所有研究對(duì)象先采用AI輔助超聲進(jìn)行檢查,由超聲醫(yī)師進(jìn)行標(biāo)準(zhǔn)掃查,研究生記錄數(shù)據(jù),然后由超聲醫(yī)師進(jìn)行常規(guī)超聲檢查。
觀察指標(biāo)包括雙側(cè)乳房?jī)?nèi)病灶(囊腫、結(jié)節(jié)或鈣化灶等)的檢出、病灶的形態(tài)、大小、邊界、有無包膜、內(nèi)部光點(diǎn)情況及回聲強(qiáng)弱等,測(cè)量并記錄病灶的形狀、大小、數(shù)量、分布和乳腺影像報(bào)告和數(shù)據(jù)系統(tǒng)(Breast Imaging Reporting and Data System,BI-RADS)分級(jí)。
所有超聲檢查陽(yáng)性/可疑陽(yáng)性(BI-RADS 4級(jí)及以上)對(duì)象建議在復(fù)旦大學(xué)附屬腫瘤醫(yī)院按乳腺癌常規(guī)診療流程進(jìn)行診斷,采用X線檢查,X線檢查陽(yáng)性者通過穿刺取得活組織進(jìn)行病理學(xué)檢查證實(shí)。乳腺癌的診斷時(shí)期別根據(jù)國(guó)際抗癌聯(lián)盟(Union for International Cancer Control,UICC)惡性腫瘤TNM分期標(biāo)準(zhǔn)[13],分成Ⅰ、Ⅱ、Ⅲ、Ⅳ期和不詳5個(gè)類別。
所有對(duì)象完成招募后進(jìn)行兩次隨訪。第1次隨訪在所有對(duì)象納入后6個(gè)月[按照《中國(guó)抗癌協(xié)會(huì)乳腺癌診治指南與規(guī)范(2021年版)》[14],可疑陽(yáng)性對(duì)象在初次發(fā)現(xiàn)病灶后6個(gè)月可完成后續(xù)診斷及治療],通過院內(nèi)病史檢索匹配的方式,了解后續(xù)病理、診斷和分期等信息;第2次隨訪在所有對(duì)象納入后1年(通常新診斷的乳腺癌在1年內(nèi)進(jìn)入上海市腫瘤登記系統(tǒng),可以補(bǔ)充沒有在院內(nèi)診斷的上海戶籍患者的發(fā)病信息),通過上海市疾病預(yù)防控制中心人群基礎(chǔ)腫瘤登記管理系統(tǒng)數(shù)據(jù)庫(kù)匹配研究對(duì)象中上海市戶籍者的乳腺癌發(fā)病信息,包括診斷ICD完整編碼、首次診斷日期、診斷時(shí)腫瘤分期、死亡日期和死亡編碼;對(duì)于來自其他省市的研究對(duì)象,通過電話隨訪了解后續(xù)的發(fā)病信息。通過被動(dòng)隨訪(匹配登記庫(kù))和電話主動(dòng)隨訪,確保得到所有研究對(duì)象完整、可靠的發(fā)病結(jié)局,隨訪率為100.0%。
樣本量估算:常規(guī)超聲識(shí)別乳腺病灶(腫塊)的Se為65.0%,Sp為80.0%,預(yù)計(jì)AI輔助超聲識(shí)別乳腺病灶(腫塊)的Se不低于70.0%,Sp不低于85.0%,按照0.05的顯著性水平和80.0%的把握度,復(fù)旦大學(xué)附屬腫瘤醫(yī)院乳腺腫塊檢出率為80.0%,估算出此次需要樣本量共計(jì)2 300個(gè)乳腺病灶。
采用Excel軟件進(jìn)行數(shù)據(jù)記錄和收集,采用四格表進(jìn)行數(shù)據(jù)整理和統(tǒng)計(jì)。結(jié)局指標(biāo)為對(duì)乳腺病灶的識(shí)別和對(duì)乳腺癌早期診斷的準(zhǔn)確性指標(biāo)[包括Se、Sp、陽(yáng)性預(yù)測(cè)值(positive predictive value,PPV)和陰性預(yù)測(cè)值(negative predictive value,NPV)]及95% CI。具體計(jì)算公式,以常規(guī)超聲檢查結(jié)果為標(biāo)準(zhǔn)(表1),BI-RADS 4級(jí)以上級(jí)別病灶識(shí)別的Se為AI輔助超聲檢查識(shí)別出真乳腺BI-RADS 4級(jí)以上陽(yáng)性病灶在常規(guī)超聲檢查識(shí)別出所有BI-RADS 4級(jí)以上陽(yáng)性病灶中的占比,計(jì)算公式為Se=TP/(TP+FN);BIRADS 4級(jí)以上級(jí)別病灶識(shí)別的Sp為AI識(shí)別出真乳腺BI-RADS 2~3級(jí)病灶在常規(guī)超聲檢查識(shí)別出所有BI-RADS 2~3級(jí)病灶中的占比,計(jì)算公式為Sp=TN/(FP+TN);PPV(BI-RADS 4級(jí)以上級(jí)別)為AI識(shí)別出所有乳腺BI-RADS 4級(jí)以上級(jí)別陽(yáng)性病灶中,真正為BI-RADS 4級(jí)以上級(jí)別(常規(guī)超聲檢查識(shí)別)的比例,計(jì)算公式為PPV=TP/(TP+FP);NPV(BI-RADS 2~3級(jí))為AI識(shí)別出所有乳腺BI-RADS 2~3級(jí)病灶中,真正為BIRADS 2~3級(jí)病灶(常規(guī)超聲識(shí)別)的比例,計(jì)算公式為NPV=TN/(FN+TN);同樣,以乳腺癌診斷為金標(biāo)準(zhǔn),計(jì)算對(duì)于乳腺癌的早期識(shí)別Se、Sp、PPV和NPV等診斷準(zhǔn)確性指標(biāo)。95%CI按照正態(tài)近似法利用率的標(biāo)準(zhǔn)誤和CI進(jìn)行計(jì)算。同時(shí),對(duì)于常規(guī)超聲和AI輔助超聲檢查對(duì)于乳腺病灶的識(shí)別一致性進(jìn)行計(jì)算,并采用配對(duì)McNemar檢驗(yàn)進(jìn)行一致性檢驗(yàn)。
表1 以常規(guī)超聲檢查結(jié)果為標(biāo)準(zhǔn),Se、Sp、PPV和NPV計(jì)算公式示意表Tab. 1 Schematic table for calculating Se, Sp, PPV and NPV,conventional ultrasound diagnosis results used as standard
共有360人同時(shí)進(jìn)行了AI輔助超聲和常規(guī)乳腺超聲檢查,發(fā)現(xiàn)2 504個(gè)乳腺病灶(表2),AI輔助超聲檢查發(fā)現(xiàn)2 217個(gè)病灶,病灶報(bào)告率為88.5%;常規(guī)超聲識(shí)別1 090個(gè),病灶報(bào)告率為43.5%。病灶中BI-RADS 2~3級(jí)共2 453個(gè),AI輔助超聲報(bào)告2 169個(gè)(88.4%),常規(guī)超聲報(bào)告1 039個(gè)(42.4%);BI-RADS 4級(jí)以上的病灶共45個(gè),AI輔助超聲檢查報(bào)告42個(gè)(93.3%),常規(guī)超聲檢查報(bào)告45個(gè)(100.0%)。
表2 2 504個(gè)乳腺病灶BI-RADS分級(jí)情況Tab. 2 BI-RADS grading of 2 504 breast lesions [n( %)]
表3 AI輔助超聲檢查對(duì)BI-RADS分級(jí)不同病灶的識(shí)別有效性(以常規(guī)超聲為標(biāo)準(zhǔn))Tab. 3 Effectiveness of AI-assisted ultrasound in identifying lesions with different BI-RADS grading (conventional ultrasound as standard)
以常規(guī)超聲識(shí)別出的病灶為標(biāo)準(zhǔn),1 084個(gè)乳腺病灶中(去除BI-RADS為0級(jí)的6人),AI輔助超聲對(duì)于BI-RADS 4級(jí)以上病灶識(shí)別的Se為93.3%(95% CI:80.7%~98.3%),Sp為100.0%(95% CI:99.5%~100.0%),PPV(BIRADS 4級(jí)以上的病灶)為100.0%(95% CI:89.6%~100.0%),NPV(BI-RADS 2~3級(jí)的病灶)為99.7%(95% CI:99.1%~99.9%)。兩種超聲識(shí)別乳腺病灶的一致率為99.7%,采用McNemar精確檢驗(yàn),AI輔助超聲和常規(guī)超聲檢查在不同分級(jí)病灶的識(shí)別能力差異無統(tǒng)計(jì)學(xué)意義(P=0.25),AI輔助診斷不劣于常規(guī)超聲檢查(表 3)。
隨訪共發(fā)現(xiàn)1 0 例乳腺癌,其中1 例原位癌,5例為Ⅰ期,3例Ⅱ期,1例為外院手術(shù)分期不詳。AI輔助超聲識(shí)別8例(BI-RADS分級(jí)為4A期4例、4B期2例、4C期2例),AI輔助超聲檢查對(duì)于乳腺癌識(shí)別的Se為80.0%(95%CI:44.2%~96.4%),Sp為88.6%(95% CI:84.6%~91.6%)(表4)。常規(guī)超聲發(fā)現(xiàn)同樣的8例乳腺癌(BI-RADS分級(jí)為4A期4例、4B期2例、4C期2例)(表5),AI識(shí)別乳腺癌的能力與常規(guī)超聲檢查結(jié)果一致(表6)。
表4 AI輔助超聲檢查對(duì)乳腺癌的診斷試驗(yàn)四聯(lián)表Tab. 4 Diagnostic test quad table for AI-assisted ultrasound in diagnosing breast cancer
表5 常規(guī)超聲檢查對(duì)乳腺癌的診斷試驗(yàn)四聯(lián)表Tab. 5 Diagnostic test quad table for conventional ultrasound in diagnosing breast cancer
表6 AI輔助超聲和常規(guī)超聲檢查對(duì)于乳腺癌識(shí)別準(zhǔn)確性匯總表Tab. 6 Summary of the accuracy of AI-assisted ultrasound and conventional ultrasound in diagnosing breast cancer [% (95% CI)]
本研究是在中國(guó)最大規(guī)模的乳腺癌診療中心開展的診斷性試驗(yàn)及前瞻性隨訪研究,系統(tǒng)分析了AI輔助超聲和常規(guī)超聲在乳腺癌診斷中對(duì)于乳腺病灶的識(shí)別能力,報(bào)告了AI輔助超聲和常規(guī)超聲在病灶識(shí)別上的差異,以及對(duì)于乳腺癌診斷的Se和Sp,為AI輔助超聲應(yīng)用于人群乳腺癌篩查提供了臨床數(shù)據(jù)和基礎(chǔ)。
基于乳房X線檢查的乳腺癌篩查在許多發(fā)達(dá)國(guó)家已經(jīng)廣泛實(shí)施并取得很大成效,但中國(guó)乳腺癌篩查仍然存在很多問題,比如篩查人群的界定、檢查時(shí)間及間隔、適宜的篩查技術(shù)等,中國(guó)的乳腺癌發(fā)病年齡相對(duì)較年輕,且中國(guó)女性乳腺體積小、致密度高,國(guó)內(nèi)各個(gè)地區(qū)經(jīng)濟(jì)發(fā)展水平不同,醫(yī)療和健康理念也存在較大差異。中國(guó)的研究者們一直致力于尋找適合中國(guó)女性生理和疾病特征的、適宜于中國(guó)國(guó)情、易于大范圍實(shí)施的中國(guó)乳腺癌篩查策略和篩查方法。2014-2019年基于北京中國(guó)城市癌癥篩查項(xiàng)目的真實(shí)世界研究[15],頭對(duì)頭地比較了乳腺超聲和乳腺X線對(duì)于中國(guó)北京地區(qū)高危女性乳腺癌篩查的有效性,結(jié)果顯示,在15 550名高危乳腺癌人群中,單純?nèi)橄賆線的Se為19.2%,Sp為96.1%,單純超聲的Se為38.5%,Sp為98.6%,超聲聯(lián)合乳房X線的Se為50.0%,Sp為94.7%,表明相對(duì)于乳房X線,乳腺超聲更適合在中國(guó)女性中進(jìn)行乳腺癌篩查。2015年1 501 753名中國(guó)農(nóng)村基于乳腺超聲的女性乳腺癌篩查[16]結(jié)果顯示,基于乳腺超聲的中國(guó)農(nóng)村女性乳腺癌早診率為85.25%,乳腺超聲初篩陽(yáng)性率為96.96%,說明基于乳腺超聲的中國(guó)女性乳腺癌篩查是可行的。
AI技術(shù)越來越多地應(yīng)用于醫(yī)療領(lǐng)域,已有小規(guī)模研究[17-20]提示AI輔助技術(shù)在大腸癌、肺癌及乳腺癌的篩查中具有廣闊的應(yīng)用前景。AI輔助超聲檢查,一方面可幫助快速篩查出需要優(yōu)先診斷的病例,提高篩查的Se,減少漏診;另一方面可以減少對(duì)專業(yè)超聲醫(yī)師經(jīng)驗(yàn)的過分依賴,AI輔助可幫助識(shí)別乳腺異常病灶,篩選出異常者進(jìn)一步診斷,可以顯著減少超聲醫(yī)師的工作量,有助于在人群中大規(guī)模地開展篩查,并且可以幫助超聲經(jīng)驗(yàn)不足的醫(yī)師識(shí)別異常病灶,解決不同地區(qū)受超聲醫(yī)師經(jīng)驗(yàn)不足而給篩查帶來的限制。本研究在醫(yī)院內(nèi)乳腺癌高危人群中開展診斷性試驗(yàn),對(duì)比AI輔助超聲和常規(guī)診斷性超聲檢查對(duì)于乳腺病灶的識(shí)別能力,結(jié)果顯示,與常規(guī)超聲相比,AI可識(shí)別更多的BI-RADS 2~3級(jí)病灶(88.4%vs42.4%),而BI-RADS 4級(jí)以上的病灶識(shí)別率相當(dāng)(93.3%vs100.0%)。以常規(guī)超聲為標(biāo)準(zhǔn),AI識(shí)別BI-RADS 4級(jí)以上乳腺病灶的Se為93.3%(95% CI:80.7%~98.3%),Sp為100.0%(95%CI:99.5%~100.0%),對(duì)乳腺癌診斷的Se和Sp與常規(guī)超聲檢查結(jié)果一致[Se為80.0%(95%CI:44.2%~96.4%),Sp為88.6%(95% CI:84.6%~91.6%)],提示AI輔助超聲檢查對(duì)于乳腺病灶的有較高的識(shí)別度,是一種有效的乳腺癌輔助診斷手段,尤其是對(duì)于4A以上的病灶識(shí)別度較高,非常適合于在一般人群中識(shí)別乳腺癌高危人群,有望廣泛用于人群乳腺癌篩查。
AI輔助超聲檢查對(duì)于乳腺微小鈣化灶的識(shí)別尚有一定的局限性,本研究隨訪共發(fā)現(xiàn)10例乳腺癌,AI和常規(guī)超聲均識(shí)別8例,查閱病史發(fā)現(xiàn)超聲未發(fā)現(xiàn)的2例均為乳腺微小鈣化灶。乳腺微小鈣化灶是由病灶區(qū)局部出現(xiàn)營(yíng)養(yǎng)不良或壞死、局部細(xì)胞溶解而出現(xiàn)的微小而散在的鈣鹽沉著,乳腺腫塊中密集分布的鈣化灶的檢出常常提示乳腺癌,因此乳腺鈣化灶尤其是微小鈣化灶對(duì)于乳腺癌的檢出是一個(gè)敏感的指標(biāo),而常規(guī)超聲檢查對(duì)于乳腺微小鈣化灶的檢出也存在一定局限性,本研究后續(xù)將加強(qiáng)AI對(duì)于乳腺鈣化灶,尤其是微小鈣化灶的機(jī)器學(xué)習(xí)能力,不斷改進(jìn)AI技術(shù),增加AI識(shí)別的Se。另外,最新的《中國(guó)乳腺癌篩查與早期診斷指南》[21]對(duì)于乳腺組織致密的中國(guó)女性,也推薦在乳腺X線攝影篩查的基礎(chǔ)上增加超聲篩查,超聲檢查與乳腺X線攝影篩查相結(jié)合似乎是更符合中國(guó)女性乳腺特征的篩查模式。
本研究存在一定的局限性:首先,研究對(duì)象來源于單中心,僅代表在醫(yī)院進(jìn)行進(jìn)一步診斷的人群;其次,本次研究納入的總樣本量相對(duì)較少,隨訪后的陽(yáng)性乳腺癌數(shù)量也較少,本項(xiàng)目的研究目標(biāo)是探索AI輔助超聲檢查對(duì)中國(guó)女性乳腺病灶的識(shí)別能力,樣本量的估算是以AI對(duì)于乳腺病灶的識(shí)別Se進(jìn)行估算,由于在乳腺癌診療中心就診的對(duì)象多為單個(gè)乳房多個(gè)病灶,實(shí)際入組的研究對(duì)象滿足了病灶數(shù)量,但人數(shù)較少。本項(xiàng)目對(duì)診斷性試驗(yàn)的參與者都進(jìn)行了前瞻性隨訪,在本次研究基礎(chǔ)上,后續(xù)我們將開展AI輔助超聲檢查用于社區(qū)乳腺癌一般風(fēng)險(xiǎn)人群篩查的研究,擬顯著增加參與篩查的人數(shù),以驗(yàn)證AI輔助超聲診斷的有效性和篩查效果。
鑒于AI技術(shù)的良好發(fā)展前景,本研究有一定優(yōu)勢(shì),頭對(duì)頭地比較了AI輔助超聲和常規(guī)診斷超聲檢查對(duì)于乳腺病灶的識(shí)別能力,而且是在乳腺優(yōu)勢(shì)學(xué)科的單中心,在比乳腺癌高風(fēng)險(xiǎn)等更復(fù)雜的女性乳腺檢測(cè)中,AI輔助超聲檢查顯示出良好的識(shí)別能力,尤其是對(duì)于惡性傾向的4A級(jí)以上的病灶,未來期望在社區(qū)中大樣本人群的乳腺癌篩查中發(fā)揮更大作用。
利益沖突聲明:所有作者均聲明不存在利益沖突。