黃穎敏,陳智毅
廣州醫(yī)科大學(xué)附屬第三醫(yī)院超聲醫(yī)學(xué)科(廣東廣州 510150)
2018年全球癌癥統(tǒng)計數(shù)據(jù)報告[1]指出,乳腺癌病死率位列所有腫瘤中的第2位,全球發(fā)病率位列第10位,且呈逐年上升的趨勢。早期發(fā)現(xiàn)及診治可有效改善乳腺癌患者的生存預(yù)后,延長其生存年限。超聲是乳腺癌篩查的主要手段,但常規(guī)超聲檢查具有顯著的主觀性及操作者依賴性,且對早期病變的診斷敏感度欠佳,難以符合新時代下精準醫(yī)學(xué)的發(fā)展要求。隨著計算機技術(shù)的發(fā)展,人工智能(artificial intelligence,AI)在乳腺影像學(xué)領(lǐng)域的應(yīng)用日益廣泛,為解決傳統(tǒng)乳腺超聲存在的局限性提供了新的思路。本文將綜述近年來AI技術(shù)結(jié)合超聲在乳腺疾病診療中的應(yīng)用新進展,并聚焦于AI 在影像的應(yīng)用與挑戰(zhàn)。
AI是計算機效仿人類思維和行為方式等人類智能活動的一般描述,包括了機器學(xué)習(xí)、人工神經(jīng)網(wǎng)絡(luò)及深度學(xué)習(xí)等方法或技術(shù)的統(tǒng)稱[2]。而AI被應(yīng)用于醫(yī)學(xué)影像可實現(xiàn)如檢測、分類、量化或優(yōu)先級排序等功能。作為一個跨學(xué)科領(lǐng)域,AI推動醫(yī)學(xué)成像模式的轉(zhuǎn)變,目前已經(jīng)嘗試開發(fā)增強人們理解的計算機應(yīng)用,如用于乳腺成像的AI技術(shù)。
作為AI技術(shù)在醫(yī)學(xué)應(yīng)用的一個重要分支,CAD可提高病灶檢出率,能有助于提高診斷性能。而檢測與分類是在CAD處理圖像過程中占據(jù)重要地位的兩大功能。
2.1 檢測 超聲是有價值的乳腺影像學(xué)檢查方法,但由于檢出率與掃查者手法關(guān)系密切,故容易出現(xiàn)漏診。計算機輔助檢測(computer-aided detection,CADe)可通過在圖像中定位異?;蚩梢蓞^(qū)域,能提高病灶區(qū)域的檢出率并降低假陰性率。
CADe在乳腺癌篩檢中非常依賴細節(jié),而既往關(guān)于乳腺超聲的CADe也多是基于二維灰階的半自動方式。在使用CADe時,操作者手動定位框在超聲圖像上定位感興趣區(qū),但常縮小采樣區(qū)域以過度集中圖像細節(jié)或者為了減少計算成本只關(guān)注一小部分感興趣區(qū)。而這些不合理的使用將影響CADe的應(yīng)用性能。為實現(xiàn)真正意義上的全自動檢測,很多學(xué)者都把AI技術(shù)的焦點重點集中于自動乳腺容積超聲(automated breast ultrasound,ABUS)上。ABUS可提供一鍵式標準化操作流程和圖像讀取功能,能快速對整個乳房進行自動掃描并產(chǎn)生多種視圖以便醫(yī)生閱讀,但該技術(shù)存在檢查耗時長、后期處理工作量大等缺點。ABUS-CAD是具有全自動定位、檢測和分析診斷乳腺腫物等多層次功能設(shè)備,能顯著改善ABUS在檢測和診斷上的不足,在縮短篩查時間、降低漏診率等方面都占據(jù)優(yōu)勢。Qview Medical開發(fā)了第1款被FDA批準的ABUS-CAD,該系統(tǒng)能夠自動定位檢測最小直徑約5 mm的病灶,并具有導(dǎo)航功能,能為潛在的惡性病變做CAD標記[3]。有研究[4]發(fā)現(xiàn),通過使用ABUS-CAD,觀察者的敏感度均得到改善,但約2/3觀察者的特異度降低。這表明ABUS-CAD具有提高篩查乳腺癌的潛力,但保留部分病例的假陽性。Moon等[5]基于深度學(xué)習(xí)算法開發(fā)的ABUS-CAD能有效減少乳腺癌誤檢率,敏感度高達95.3%,可減少56.8%的假陽性病例。然而,ABUS-CAD的使用也存在一些缺陷[6],首先,雖然它可提高內(nèi)部呈低回聲的浸潤性癌的檢出率,但易忽略體積較小的腫瘤或內(nèi)部呈高或等回聲的腫瘤。其次,ABUS-CAD通過3個維度視圖獲取多種描述乳腺癌特征信息的同時可發(fā)生過度擬合現(xiàn)象,因特征增多,導(dǎo)致算法復(fù)雜、計算難度加大等問題出現(xiàn)。
CADe通過精細的分割技術(shù)來獲取描述乳腺癌最有價值的定量信息,這對早期發(fā)現(xiàn)乳腺癌有重要意義。然而,受乳腺灰階圖像斑點高、邊界模糊、信噪比低、對比度低和強度不均勻等因素的影響,乳腺腫瘤分割過程困難。因此,定位技術(shù)在乳腺超聲圖像上的開發(fā)依舊難度大[7],這也將是未來需要攻克的關(guān)鍵。
2.2 分類 因良惡性乳腺腫瘤特征的共性、差異性及交叉特性,僅通過肉眼和經(jīng)驗在超聲上鑒別這兩者易發(fā)生誤診?;谌橄侔﹫D像特征與病理類型存在相關(guān)性,將CAD應(yīng)用于乳腺超聲圖像,通過量化腫瘤特征,可獲得定性解釋,有助于分類診斷。
2.2.1 基于定義圖像特征的CAD分類 基于定義圖像特征的CAD是指通過人工提取專家限定特征并特征向量化后進行機器學(xué)習(xí)的技術(shù)。該技術(shù)因使用簡便、具有降低運算復(fù)雜度的優(yōu)勢,已被應(yīng)用于乳腺良惡性腫瘤的分類診斷,而常用的特征有紋理、形態(tài)與特征描述符。三陰性乳腺癌是一種侵襲性惡性乳腺腫瘤,但在臨床上常誤診為乳腺纖維腺瘤。有研究[8]表明,基于紋理特征的CAD能有效提高在超聲圖像中鑒別三陰性乳腺癌和良性纖維腺瘤的能力。形態(tài)特征可導(dǎo)致方向性和紋理更加復(fù)雜。有文獻[9]指出,將紋理特征合并形態(tài)學(xué)信息能提高分類診斷的鑒別能力?;谝陨侠碚撝?,Gómez-Flores等[10]分別在超聲及X線圖像上各獲取乳腺腫瘤的39個形態(tài)特征的空間信息,利用CAD獲得診斷乳腺癌的獨特組合。與X線相比,基于超聲的CAD更具分辨乳腺癌的能力,準確度為88%,敏感度為81%,特異度高達91%。此外,由乳腺特征描述符構(gòu)建的BI-RADS詞典是經(jīng)過驗證的定性生物標記物。目前,結(jié)合AI的BI-RADS評估已作為國際上乳腺成像研究中衡量惡性腫瘤的標準[11]。應(yīng)用BI-RADS評估作為診斷的量化指標可改善AI對分析結(jié)果的解析性能。乳腺影像學(xué)的異質(zhì)性可產(chǎn)生不一致的影像報告,可引發(fā)臨床決策的不確定性。有學(xué)者[12]通過AI細分BI-RADS類別4的良惡性,促進基于BI-RADS的結(jié)構(gòu)化報告的使用,可改善罹患乳腺疾病的患者分類管理。然而,基于定義圖像特征的CAD靠專家手工編程,則特征提取過程存在工作量大且人力成本高、主觀偏倚及深層潛在特征不易被機器主動發(fā)現(xiàn)等缺陷。
2.2.2 基于深度學(xué)習(xí)的CAD分類 深度學(xué)習(xí)(deep learning,DL)不依賴人工提取特征,可直接從原始圖像中生成高級特征表示[13]。在算力、數(shù)據(jù)、算法的驅(qū)動下,DL在近年AI領(lǐng)域發(fā)展最為迅猛?;贒L的乳腺超聲CAD能提高診斷乳腺癌的準確性,可與人工讀片媲美,并可在超聲檢查期間進行實時分析,也能有效改善觀察者的診斷效能[14]。卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)作為DL重要算法的一種,在檢測癌癥方面具有良好的應(yīng)用前景[15]。國外學(xué)者[16-17]相繼構(gòu)建基于CNN的乳腺超聲CAD。雖然他們開發(fā)的模型都顯示出優(yōu)越的診斷效能(敏感度、特異度和準確性均>90%),但仍需要大數(shù)據(jù)、更廣泛的多中心研究進行驗證。各種乳腺病變的組織學(xué)分類難以在超聲圖像上被準確地區(qū)分開來。Hizukuri等[18]開發(fā)了基于CNN的CAD來分類浸潤性癌、非浸潤性癌、囊腫和纖維腺瘤等4種乳腺病變,實現(xiàn)了首次基于CAD進行乳腺病變組織學(xué)分類,其準確性范圍為83.9%~87.6%,該研究模型將有助于乳腺病變的鑒別診斷,有望作為診斷的主要輔助手段。DL技術(shù)可提供可喜的分析結(jié)果,但其透明度、是否具有可解釋性等問題仍限制其進一步發(fā)展。為構(gòu)建更為強大的AI系統(tǒng),了解DL的決策機制,仍需各方專家尋求更好的解決辦法。
影像組學(xué)是AI在醫(yī)學(xué)影像的研究熱點,是指從醫(yī)學(xué)圖像中高通量地提取大量定量特征,結(jié)合機器學(xué)習(xí)等AI算法,篩選用以解析臨床信息最有價值的特征,來輔助疾病的診斷、治療及預(yù)后評估的技術(shù)[19]。影像組學(xué)來源于CAD,而融合影像、基因、臨床等信息的新興影像組學(xué)不僅可精準診斷乳腺癌,還可了解分子機制的發(fā)生與基因表達水平,并為臨床提供不同生物學(xué)行為信息,從而推動乳腺癌個體化精準治療的進程。關(guān)于乳腺癌,主要是通過MRI來研究影像組學(xué)。然而,最近出現(xiàn)的一些研究探索了結(jié)合超聲的影像組學(xué)的臨床應(yīng)用潛力。Li等[20]研究表明,影像組學(xué)可提高聲像特征對乳腺癌的精準診斷。他們利用多模態(tài)超聲影像組學(xué)診斷乳腺癌的準確性可達84.12%,敏感度高達92.86%。乳腺癌是以ER、PR、Ki-67、HER2等不同標志物狀態(tài)作為分子亞型分類依據(jù),分為Luminal A型、Luminal B型、HER2陰性型、HER2陽性型、基底樣型/三陰性型及其他特殊類型[21]。表征各異的乳腺癌分子亞型可影響治療計劃的選擇。而關(guān)于乳腺癌分子亞型信息通常是通過組織活檢獲取的,但基于超聲的影像組學(xué)已實現(xiàn)無創(chuàng)獲取組織病理學(xué)信息的優(yōu)化。Zhang等[22]研究發(fā)現(xiàn),不同超聲特征組成的影像組學(xué)可對應(yīng)不同乳腺癌分子亞型:如基于回聲暈、后方聲影的Luminal A型;基于無聲暈和富血供的Luminal B型;基于后方回聲增強、鈣化、富血供和高齡的HER2陽性型;而三陰性型可分為兩種表現(xiàn),其中一種是不規(guī)則分葉形、無鈣化和乏血供型,而另一種則是呈橢圓形、乏血供和微分葉型。此外,乳腺癌不同生物學(xué)標志物的受體狀態(tài)與其腫瘤分級也影響著乳腺癌的超聲表現(xiàn)。Guo等[23]通過開發(fā)一款智能化影像組學(xué)模型發(fā)現(xiàn),超聲特征和乳腺浸潤性導(dǎo)管癌的生物特征存在相關(guān)性。低級別乳腺浸潤性導(dǎo)管癌呈ER+、PR+和HER2陰性型者多表現(xiàn)為形狀不規(guī)則、邊界不清、內(nèi)部呈高或混合回聲和伴后方聲影的超聲特性。而高級別三陰型乳腺浸潤性導(dǎo)管癌則傾向于形狀規(guī)則、邊界清、內(nèi)部呈低回聲和伴側(cè)方增強的超聲表現(xiàn)。由超聲聯(lián)合基因構(gòu)建的影像組學(xué)與浸潤性乳腺癌患者的臨床表型具有較強的相關(guān)性。因此,這種新興影像組學(xué)可有效分類預(yù)后好的ER+、PR+和HER2陰性型乳腺癌與預(yù)后差的三陰性型乳腺癌,這對輔助醫(yī)師制定治療計劃并了解疾病預(yù)后和轉(zhuǎn)歸具有潛在價值。有研究[24]表明,由超聲特征組成的影像組學(xué)可為開展有效的術(shù)前決策提供方向,有望成為預(yù)測乳腺癌術(shù)前分期中腋窩淋巴結(jié)轉(zhuǎn)移的一種無創(chuàng)且可靠的工具。Zheng等[25]利用常規(guī)超聲和剪切波彈性成像等獲取高通量特征信息建立基于深度學(xué)習(xí)的影像組學(xué),用于早期預(yù)測乳腺癌腋窩淋巴結(jié)轉(zhuǎn)移。該方法可預(yù)測臨床T1或T2期乳腺癌患者的腋窩淋巴結(jié)轉(zhuǎn)移狀態(tài),在區(qū)分是否有腋窩淋巴結(jié)轉(zhuǎn)移上明顯優(yōu)于單一成像方式,在識別1~2個腋窩淋巴結(jié)轉(zhuǎn)移和≥3個腋窩淋巴結(jié)轉(zhuǎn)移等方面也具備良好的鑒別能力。由于該方法的假陰性率與腋窩前哨淋巴結(jié)活檢相似,因此,由超聲特征構(gòu)建的影像組學(xué)有望代替腋窩前哨淋巴結(jié)活檢,用于無創(chuàng)評估早期乳腺癌腋窩淋巴結(jié)轉(zhuǎn)移。此外,影像組學(xué)也可用于乳腺癌治療后的療效評估。作為局部晚期乳腺癌的一線治療方法,新輔助化療在手術(shù)前使用可縮小瘤體和降低遠處轉(zhuǎn)移風(fēng)險,但≤50%的患者能達到完全病理緩解。而Sannachi等[26]利用由定量超聲、組織結(jié)構(gòu)分析和分子特征組成的影像組學(xué)預(yù)測新輔助化療后患者病理緩解的能力。因此,影像組學(xué)能預(yù)測治療后反應(yīng)并有助于指導(dǎo)難治性患者的治療計劃實施。
總之,結(jié)合超聲的影像組學(xué)可表征不同乳腺癌分子亞型,可無創(chuàng)獲取乳腺癌分級、分期等有價值信息。這為全面研究腫瘤生物學(xué)行為開啟了新的探索方向。然而,各學(xué)者對影像組學(xué)的基本概念了解有限,不同的學(xué)科對于該術(shù)語具有各自的定義和應(yīng)用,這妨礙了各學(xué)科間的交流。且由于有效、標準化的特征提取和數(shù)據(jù)共享系統(tǒng)等缺乏,限制了影像組學(xué)的發(fā)展。而既往關(guān)于影像組學(xué)的研究是回顧性的,且規(guī)模小、簡單,因此,未來仍需要更大的前瞻性多中心研究來驗證這些初步結(jié)果。而隨著影像組學(xué)的廣泛應(yīng)用,乳腺成像中有用的生物標志物的數(shù)量必將大幅度增加,這對集成和共享患者數(shù)據(jù)的數(shù)據(jù)庫將被迫切地需求。
多模態(tài)醫(yī)學(xué)圖像融合技術(shù)是指綜合多個不同模態(tài)的醫(yī)學(xué)圖像,可獲取比單一功能圖像或解剖圖像更可靠、更準確的病灶類別屬性的描述信息。該技術(shù)將超聲、X線、正電子發(fā)射計算機斷層成像(PET)、CT及MRI等影像進行智能化綜合,實現(xiàn)多信息可視化、信息互補等作用。而超聲容積導(dǎo)航(volume navigation)是一種多模態(tài)圖像融合技術(shù),是通過將超聲圖像融合CT/MRI/PET-CT等影像進行定位追蹤,能提高超聲圖像病變的可視性和影像診斷的準確性,可應(yīng)用于醫(yī)療診斷、外科手術(shù)制定、放射治療方案制定、病理變化示蹤和治療效果評估等多個方面。有學(xué)者[27]提出,在乳腺癌患者的術(shù)前評估中,乳腺超聲磁共振的容積導(dǎo)航技術(shù)能顯著改善MRI可檢出但二次超聲無法檢出的病灶,有助于確定最佳個體化治療方案。二次超聲掃查能夠?qū)RI檢出而首次超聲隱匿的病灶進行評估及引導(dǎo)穿刺活檢。而Aribal等[28]也證實了乳腺超聲磁共振的容積導(dǎo)航技術(shù)具有與二次超聲掃查相似的實用性,可作為超聲隱匿性乳腺病變的MRI引導(dǎo)活檢的替代方法。此外,不管病灶位置有多深,超聲容積導(dǎo)航復(fù)檢均能提高不少乳腺隱匿性病變的檢出率,能有效引導(dǎo)對惡性病變進行安全活檢[29]。近年來,多模態(tài)醫(yī)學(xué)圖像融合技術(shù)在乳腺癌診療中越來越受到重視。然而,精確配準和融合方法仍是多模態(tài)醫(yī)學(xué)融合技術(shù)中最具挑戰(zhàn)性的關(guān)鍵問題,可存在以下因素限制該技術(shù)的發(fā)展:(1)不同模態(tài)的成像機制不同和隨時間變化的生理變化等可影響融合技術(shù)的穩(wěn)定性、速度與精度;(2)缺乏完善、統(tǒng)一的融合及配準技術(shù);(3)暫缺對融合后圖像的客觀評價標準以及不可避免的觀察者間差異等共性弱點顯著。(4)超聲圖像斑點噪聲突出、分辨率低,導(dǎo)致與其他影像配準融合更加困難。盡管如此,多模態(tài)仍是AI的未來,有學(xué)者[30]分析,翻譯、對齊、融合和共同學(xué)習(xí)這種新的分類方法將有助于研究人員更好地了解該領(lǐng)域,從而可確定多模態(tài)AI的未來研究方向。
隨著醫(yī)療技術(shù)的發(fā)展,AI技術(shù)突破傳統(tǒng)超聲的技術(shù)壁壘,為臨床提供高效、精確、可重復(fù)性診斷乳腺腫瘤的有效手段。目前,AI技術(shù)在醫(yī)學(xué)領(lǐng)域中的應(yīng)用展現(xiàn)出巨大潛力,推動了乳腺影像技術(shù)和診斷理念的轉(zhuǎn)變。這一交叉學(xué)科的發(fā)展促進并加深了基因于分子影像學(xué)在乳腺癌發(fā)生、發(fā)展和轉(zhuǎn)歸的探索,有望在乳腺癌篩查、診斷及治療中發(fā)揮更大作用,進而加快推動個體化、精細化、精準化醫(yī)療發(fā)展。然而,仍存在不少不利因素阻礙AI的發(fā)展步伐。
5.1 標準化數(shù)據(jù)與規(guī)范、統(tǒng)一的基礎(chǔ)技術(shù)框架的缺乏 構(gòu)建AI系統(tǒng)需要大量數(shù)據(jù),但多數(shù)數(shù)據(jù)不易獲得,且數(shù)據(jù)標記不正確或達不到質(zhì)量要求、數(shù)據(jù)采集不標準和各種成像機制的差異都可產(chǎn)生有差別的數(shù)據(jù)集合。將噪聲和偽影造成的有損壞數(shù)據(jù)、錯誤錄入、重復(fù)記錄、缺失、不完整記錄等不確定數(shù)據(jù)納入數(shù)據(jù)處理,可干擾使用者或計算機的決策分析結(jié)果。不了解AI在各實踐領(lǐng)域的功能,在開發(fā)、培訓(xùn)、測試和驗證等流程上缺乏統(tǒng)一、規(guī)范及標準的基礎(chǔ)技術(shù)。
5.2 可解析性的探討 因缺乏透明度與可解析的分析結(jié)果,AI技術(shù)將難以廣泛推廣到不同的成像設(shè)備、掃描方式和患者群體中。因此,AI系統(tǒng)應(yīng)包含可解釋的AI元素,以增強AI決策的解釋性能。如何使得AI更透明、更易懂、更可信是未來的熱門研究課題。
5.3 安全監(jiān)察與道德法規(guī)的疑惑、挑戰(zhàn) 醫(yī)生將AI用于臨床實踐前是否應(yīng)對操作醫(yī)生進行培訓(xùn),以及是否將AI教育納入放射科醫(yī)生培訓(xùn)仍未有明確結(jié)論。AI的出現(xiàn)引發(fā)了有關(guān)專家應(yīng)用AI在醫(yī)學(xué)診斷中所處角色定位的疑問。AI決策和其采用的算法是否應(yīng)在法規(guī)和標準化審核中得到認可。為了測試AI的性能和安全性,是否需要建立一個通用測試系統(tǒng)檢測AI在不同成像設(shè)備上的性能。為了在醫(yī)療領(lǐng)域應(yīng)用AI,以支持保護人權(quán),用戶安全和算法透明的法規(guī),是否需要制定道德標準。AI的錯誤分析將涉及算法偏差和錯誤問責(zé)制的倫理挑戰(zhàn)。如何建立保障措施防范AI的潛在陷阱等。
迄今為止,雖然AI在醫(yī)學(xué)影像的應(yīng)用仍不能作為一個獨立的臨床程序用于檢測和診斷乳腺癌。在未來,為了使有效的AI算法在乳腺影像的臨床實踐中得到廣泛而嚴格的驗證,將需建立大規(guī)模、匿名、高質(zhì)量、可共享和可解析的公共數(shù)據(jù)庫。