吳佩琪
深圳市鹽田區(qū)人民醫(yī)院(南方科技大學(xué)鹽田醫(yī)院)放射科,廣東 深圳 518081
乳腺癌的發(fā)病率正逐年遞增,全世界每年約有130萬人診斷為乳腺癌,并且有40萬人死于該病[1]。有研究統(tǒng)計,中國女性最常見腫瘤是乳腺癌,占所有女性癌的15%,死亡率在女性惡性腫瘤中排第4位[2],乳腺癌已成為婦女健康的最大威脅。原發(fā)灶和區(qū)域淋巴結(jié)轉(zhuǎn)移情況是乳腺癌患者預(yù)后的兩個重要因素[3],其中淋巴結(jié)狀態(tài)是評價腫瘤負荷的重要依據(jù),準(zhǔn)確的腋窩淋巴結(jié)(ALN)分期對局部治療計劃的選擇、全身綜合治療決策和預(yù)后判斷等具有重要的指導(dǎo)作用。目前臨床上常用的傳統(tǒng)影像學(xué)檢查方法,包括超聲、鉬靶、CT和MRI等,難以在術(shù)前對乳腺癌患者淋巴結(jié)轉(zhuǎn)移情況進行精準(zhǔn)評價,傳統(tǒng)影像學(xué)檢查在評估乳腺癌淋巴結(jié)轉(zhuǎn)移方面仍存在很大挑戰(zhàn)。影像組學(xué)作為一種高通量的圖像定量特征數(shù)據(jù)挖掘技術(shù),可以提取肉眼不可見的圖像深層次信息并用于建立臨床診斷、預(yù)后和預(yù)測模型,成為目前學(xué)術(shù)研究的一大熱點,影像組學(xué)已逐步開始應(yīng)用于乳腺癌淋巴結(jié)轉(zhuǎn)移的預(yù)測。
影像組學(xué)的概念由Lambin等[4]首先提出,即從放射影像的圖像中高通量地提取大量的影像特征。Lambin等[5]提出,影像組學(xué)是一種高通量的圖像定量特征數(shù)據(jù)挖掘技術(shù),應(yīng)將影像組學(xué)提取的數(shù)據(jù)和患者的臨床信息、免疫組化信息及基因信息等數(shù)據(jù)結(jié)合起來,應(yīng)用于臨床決策支持體系,以提高診斷、預(yù)后和預(yù)測的準(zhǔn)確性,搭建起醫(yī)學(xué)影像與精準(zhǔn)醫(yī)療之間的橋梁。影像組學(xué)主要有兩個方面的優(yōu)勢:能對影像大數(shù)據(jù)進行高通量特征提取,獲得豐富的病灶深層次特征;能解析影像與臨床信息的關(guān)聯(lián)性,借此為臨床提供有價值的精準(zhǔn)診斷信息[6]。
目前影像組學(xué)技術(shù)已發(fā)展成為融合影像、基因、臨床等信息的輔助診斷、分析和預(yù)測的方法,其基本流程主要包括醫(yī)學(xué)影像采集、圖像分割、特征提取與篩選、模型與分類器的構(gòu)建等步驟[7]。
1.2.1 醫(yī)學(xué)影像采集 影像組學(xué)分析的首要步驟就是進行影像數(shù)據(jù)采集,如超聲、鉬靶、CT和MRI等[8],一般采集的圖像均以醫(yī)學(xué)數(shù)字成像和通信格式儲存于圖像存檔和通信系統(tǒng)中,確保所采集的數(shù)據(jù)管理有序,并便于存取和檢索,為影像組學(xué)研究提供了極大便利。
1.2.2 圖像分割 圖像分割是影像組學(xué)分析的關(guān)鍵步驟,準(zhǔn)確的圖像分割對于圖像特征提取具有重要意義。目前圖像分割可分為人工分割、半自動分割和自動分割,一般認(rèn)為人工分割的精度最高,可作為“金標(biāo)準(zhǔn)”,但缺點是可重復(fù)性差、耗時較長。自動分割則通過一些圖像分割算法,提高了分割速度,但分割準(zhǔn)確性有待進一步提高。半自動分割一般是由計算機對目標(biāo)區(qū)域進行自動分割后,再由影像科醫(yī)師進一步細化目標(biāo)區(qū)域輪廓,從而在提高分割速度的同時達到更好的分割準(zhǔn)確性,因此實用性更強[9]。目前圖像分割算法比較經(jīng)典的是基于閾值的分割算法、基于邊緣的分割算法和基于區(qū)域的分割算法,此外,隨著深度學(xué)習(xí)技術(shù)的發(fā)展,基于人工神經(jīng)網(wǎng)絡(luò)、卷積神經(jīng)網(wǎng)絡(luò)等的圖像分割方法也逐漸應(yīng)用于臨床研究中[10-11]。
1.2.3 特征提取與篩選 提取目標(biāo)區(qū)域內(nèi)的高維度特征數(shù)據(jù)以定量描述其屬性是影像組學(xué)的核心。傳統(tǒng)影像學(xué)對病灶的評估主要依賴于影像醫(yī)師肉眼提取的定性特征,如病灶邊緣是否規(guī)則、強化模式等,在計算機中,這些定性表型的特征描述統(tǒng)稱為“語義”特征[12]。傳統(tǒng)影像學(xué)對乳腺癌灶進行視覺分析時存在主觀性強的缺點,而影像組學(xué)通過計算機可提取到圖像深層次定量特征。目前研究中常提取的影像組學(xué)特征包括形態(tài)特征、一階統(tǒng)計特征、紋理特征和小波特征等四大類[7]。形態(tài)特征描述的是病灶所在區(qū)域三維空間的形狀和大小。一階統(tǒng)計特征即灰度直方圖特征,屬于一維統(tǒng)計信息,描述的是圖像內(nèi)體素的強度分布情況。紋理特征描述的是灰度的空間相關(guān)特性或體素強度的空間分布,提供了圖像上不同灰度級的相對位置信息,其分別從灰度共生矩陣、灰度游程長度矩陣和灰度區(qū)域大小矩陣特征進行紋理描述,其中灰度共生矩陣特征是目前圖像特征描述方法中應(yīng)用最為廣泛的一種紋理特征,描述的是圖像中灰度值的空間依賴性,也可以反映紋理模式和灰度空間的內(nèi)在聯(lián)系[13]。小波特征是在直方圖特征和紋理特征的基礎(chǔ)上,進一步使用多尺度的小波濾波處理,然后對不同小波域的圖像進行特征提取,從而獲得更加精準(zhǔn)的影像特征信息[14]。
在一定的樣本量下,特征向量維數(shù)過高時會增加計算的復(fù)雜程度,使預(yù)測模型的性能下降,造成“維度災(zāi)難”,對所提取的大量影像組學(xué)特征進行降維將有助于預(yù)測模型性能提升、減少模型訓(xùn)練時間、避免模型過度擬合、提高模型泛化能力。特征降維的具體方法包括特征抽取和特征選擇兩類。特征抽取是指通過已有特征的組合建立一個新的特征子集,其主要思想是原始空間中樣本之間的距離在低維空間中得以保持,最常用的無監(jiān)督學(xué)習(xí)方法是主成分分析和聚類分析,最常用的監(jiān)督算法是線性判別分析(LDA),又稱Fisher線性判別[15]。特征選擇是指不經(jīng)過變換,直接從原始特征集合中選擇一個子集作為目標(biāo)特征向量,目前常見的特征選擇方法包括過濾式、包裹式和嵌入式三類[15]。過濾式方法以排序技術(shù)為選擇變量的標(biāo)準(zhǔn),使用適當(dāng)排序準(zhǔn)則對變量進行評分,并設(shè)定閾值篩選變量,該法適用于非常高維的數(shù)據(jù)集,計算簡單、速度快,其中文獻報道較為有效的是Wilcoxon檢驗[16]、最小冗余最大相關(guān)性[17]和互信息特征選擇[18]等。包裹式方法計算量較大,應(yīng)用相對較少,常用的有遺傳算法和粒子群優(yōu)化算法。嵌入式方法是在學(xué)習(xí)過程中搜索最佳特征子集的方法,該法注意了數(shù)據(jù)之間的相互依賴性以及與分類器的交互,是目前研究的熱點,常用的包括最小絕對收縮與選擇算子(Lasso)[19]、遞歸特征消除[20]、支持向量機(SVM)[17]和決策樹[21]等。
1.2.4 模型與分類器的構(gòu)建 建立預(yù)測模型是影像組學(xué)分析為臨床提供輔助工具的關(guān)鍵步驟,用于建模的方法包括基于統(tǒng)計學(xué)和基于機器學(xué)習(xí)的方法?;诮y(tǒng)計學(xué)的建模方法主要包括Logistic回歸和偏最小二乘回歸法。Logistic回歸簡便易行,一般用于二分類預(yù)測模型構(gòu)建,也可用于多分類預(yù)測模型,是目前影像組學(xué)研究中最受歡迎且較為常用的建模方法。偏最小二乘回歸法則主要用于多元回歸建模,尤其是各變量內(nèi)部高度線性相關(guān)時,該法更有效[22]。機器學(xué)習(xí)是指從已知數(shù)據(jù)中獲得規(guī)律,并利用規(guī)律對未知數(shù)據(jù)進行預(yù)測的方法,屬于人工智能中一個新的研究領(lǐng)域,可用于自然語言處理、圖像識別、生物信息學(xué)以及風(fēng)險預(yù)測等,分為有監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí)兩種。常用的有監(jiān)督學(xué)習(xí)分類器包括SVM[17]、隨機森林[23]和決策樹[21]等,常用的無監(jiān)督學(xué)習(xí)分類器包括k鄰近算法、K-means和高斯混合聚類等[24]。機器學(xué)習(xí)算法中SVM和隨機森林兩個模型在文獻報道中表現(xiàn)都很穩(wěn)定,應(yīng)用較為廣泛[25]。
有研究對109例乳腺癌患者ALN狀態(tài)進行了鉬靶、CT和MRI評估[26],結(jié)果顯示,鉬靶、CT和MRI診斷ALN轉(zhuǎn)移的敏感度分別為14.0%、93.0%和95.3%,特異度分別為84.8%、57.6%和65.2%,準(zhǔn)確度分別為56.9%、71.6%和77.1%。另有研究比較了超聲、鉬靶、CT和MRI在195例乳腺癌患者ALN狀態(tài)評估方面的價值[27],結(jié)果發(fā)現(xiàn)4種影像學(xué)檢查方法單獨診斷ALN轉(zhuǎn)移的敏感度最高者為MRI(82.1%)、特異度最高者為鉬靶(96.6%)、準(zhǔn)確度最高者為CT和MRI(均為79%),當(dāng)4項檢查聯(lián)合應(yīng)用且檢查結(jié)果一致時,診斷ALN轉(zhuǎn)移的敏感度、特異度和準(zhǔn)確度分別為70.2%、97.5%和92.9%。以上研究結(jié)果表明,目前臨床上常用的傳統(tǒng)影像學(xué)檢查方法,包括超聲、鉬靶、CT和MRI等,難以在術(shù)前對乳腺癌患者淋巴結(jié)轉(zhuǎn)移情況進行精準(zhǔn)評價,傳統(tǒng)影像學(xué)檢查在評估乳腺癌淋巴結(jié)轉(zhuǎn)移方面仍存在很大挑戰(zhàn)。目前國內(nèi)國際上已有基于影像組學(xué)方法預(yù)測乳腺癌ALN或前哨淋巴結(jié)(SLN)轉(zhuǎn)移的相關(guān)研究報道,大大提高了乳腺癌淋巴結(jié)轉(zhuǎn)移預(yù)測的準(zhǔn)確性。
目前基于MRI影像組學(xué)預(yù)測乳腺癌淋巴結(jié)轉(zhuǎn)移的研究已相對豐富。有研究[28]提取了72例乳腺癌患者動態(tài)對比增強磁共振成像(DCE-MRI)圖像中6大類共385個影像組學(xué)特征,降維選擇后得到均勻度、全角度集群突出方差、全角度相關(guān)性、長行程優(yōu)勢及表容比5個影像組學(xué)特征用于建立乳腺癌ALN轉(zhuǎn)移預(yù)測模型,訓(xùn)練集中AUC、敏感度、特異度、準(zhǔn)確度分別為0.953、0.893、0.926、92.6%(50/54),驗證集中AUC、敏感度、特異度、準(zhǔn)確度分別為0.944、0.900、1.000、88.9%(16/18),結(jié)果提示基于影像組學(xué)特征構(gòu)建的預(yù)測模型能無創(chuàng)地對乳腺癌ALN轉(zhuǎn)移風(fēng)險做出有效評估,但該研究樣本量較小,并存在一定的選擇偏倚,可能影響統(tǒng)計學(xué)效能。Cui等[29]研究提取了102例乳腺癌患者的DCE-MRI圖像中的影像組學(xué)特征,采用Lasso法進行特征篩選,對每個特征進行了單獨分析,然后進行特征組合分析,結(jié)果發(fā)現(xiàn)組合特征的效果明顯優(yōu)于任何單個特征。進一步采用SVM、KNN和LDA3個分類器在5倍交叉驗證中進行ALN轉(zhuǎn)移狀態(tài)預(yù)測,結(jié)果表明,SVM分類器預(yù)測乳腺癌ALN轉(zhuǎn)移的效果顯著高于KNN分類器和LDA分類器,AUC、準(zhǔn)確度分別為0.861 5、89.54%。該研究提示基于DCE-MRI影像組學(xué)特征的預(yù)測模型對乳腺癌患者ALN轉(zhuǎn)移具有良好的預(yù)測價值。有研究從411例乳腺癌患者的術(shù)前DCE-MRI圖像中提取了808個影像組學(xué)特征,采用SVM構(gòu)建了一個由12個與ALN轉(zhuǎn)移狀態(tài)相關(guān)影像組學(xué)標(biāo)簽組成的影像組學(xué)標(biāo)簽預(yù)測模型[30],但該模型預(yù)測能力中等,訓(xùn)練集和驗證集中的AUC分別為0.76和0.78。進一步采用Logistic回歸,結(jié)果乳腺癌患者臨床特征與影像組學(xué)標(biāo)簽開發(fā)列線圖,發(fā)現(xiàn)該列線圖對ALN轉(zhuǎn)移具有出色的預(yù)測能力,訓(xùn)練集和驗證集中的AUC為0.84和0.87,該研究提示基于DCE-MRI的影像組學(xué)標(biāo)簽列線圖可以用作協(xié)助臨床醫(yī)生評估乳腺癌患者ALN轉(zhuǎn)移的工具。Dong等[31]研究提取了146例乳腺癌患者T2加權(quán)脂肪抑制(T2-FS)和彌散加權(quán)(DWI)MRI圖像上癌灶的10 962個影像組學(xué)特征和4個非影像組學(xué)特征,采用Logistic回歸進行SLN轉(zhuǎn)移風(fēng)險預(yù)測模型構(gòu)建,結(jié)果顯示,由T2-FS圖像提取影像組學(xué)標(biāo)簽組成的預(yù)測模型在訓(xùn)練集、驗證集中的AUC分別為0.847、0.770,由DWI圖像提取影像組學(xué)標(biāo)簽組成的預(yù)測模型在訓(xùn)練集、驗證集中的AUC分別為0.847、0.787,兩種圖像提取的影像組學(xué)特征組成的聯(lián)合模型在訓(xùn)練集、驗證集中的AUC分別為0.863、0.805,提示充分利用從解剖學(xué)(T2-FS)和功能性MRI(DWI)圖像中提取的乳腺癌特有的紋理特征,可提高影像組學(xué)預(yù)測乳腺癌SLN轉(zhuǎn)移的性能。Liu等[32]對62例乳腺癌患者的DCE-MRI圖像中提取了腫瘤灶的感興趣體積,采用K最佳和Lasso法從所提取的1 409個影像組學(xué)特征中進行特征篩選,最終獲取了6個特征作為模型構(gòu)建的最佳特征,并采用Logistic回歸、XGboost和SVM分類器等3個分類模型進行乳腺癌SLN轉(zhuǎn)移風(fēng)險預(yù)測模型建模,結(jié)果發(fā)現(xiàn)SVM模型預(yù)測性能最高,其AUC、準(zhǔn)確度和靈敏度分別為0.83、0.85和0.71,提示結(jié)合原發(fā)腫瘤特征和DCE-MRI影像組學(xué)特征對乳腺癌SLN轉(zhuǎn)移風(fēng)險進行預(yù)測非常有應(yīng)用前景,但該研究樣本量較少,可能影響統(tǒng)計學(xué)效能。另一研究團隊進行了類似研究[33],該團隊對163例乳腺癌患者的DCE-MRI圖像提取了腫瘤灶的590個影像組學(xué)特征,采用Lasso法進行特征篩選,最終獲取了6個特征作為模型構(gòu)建的最佳特征,并采用Logistic回歸將患者臨床病理特征和影像組學(xué)標(biāo)簽進行乳腺癌SLN轉(zhuǎn)移風(fēng)險預(yù)測模型建模,所建立的模型在訓(xùn)練集和驗證集中AUC分別為0.869和0.806,結(jié)果同樣提示結(jié)合乳腺癌患者臨床病理特征和DCEMRI影像組學(xué)特征的預(yù)測模型對乳腺癌SLN轉(zhuǎn)移風(fēng)險預(yù)測具有廣闊的應(yīng)用前景。
目前基于超聲、鉬靶等非MRI影像的影像組學(xué)在預(yù)測乳腺癌淋巴結(jié)轉(zhuǎn)移的研究相對較少。Yu等[34]對426例早期浸潤性乳腺癌患者的超聲圖像進行手動分割后,采用Lasso法進行影像組學(xué)特征篩選,得到了14個選定的影像組學(xué)標(biāo)簽,該影像組學(xué)標(biāo)簽?zāi)P蛢H能達到中等預(yù)測效果,訓(xùn)練組和驗證組中AUC分別為0.78和0.71,進一步采用多元Logistic回歸構(gòu)建了包括乳腺癌腫瘤大小,超聲診斷的ALN狀態(tài)和影像組學(xué)標(biāo)簽在內(nèi)的列線圖,則達到了較好的預(yù)測性能,訓(xùn)練組和驗證組中AUC分別為0.84和0.81,具有較好的臨床實用性。Zhou等[35]對843例乳腺癌患者的超聲圖像進行了影像組學(xué)研究,采用3種不同的卷積神經(jīng)網(wǎng)絡(luò)進行了訓(xùn)練,其中性能最佳的模型預(yù)測ALN轉(zhuǎn)移的AUC達到了0.89,準(zhǔn)確度、靈敏度和特異度分別為80%、85%和73%,高于具有6年以上專業(yè)訓(xùn)練經(jīng)驗的超聲科醫(yī)師的準(zhǔn)確度(66%)、靈敏度(66%)和特異度(69%),提示基于深度學(xué)習(xí)的乳腺癌超聲影像組學(xué)淋巴結(jié)預(yù)測模型能為臨床提供無創(chuàng)的輔助診斷工具。Yang等[36]對147例乳腺癌患者的鉬靶圖像進行了影像組學(xué)特征提取,并采用Lasso回歸方法進行特征降維建立了10個影像組學(xué)標(biāo)簽,然后采用SVM評估影像組學(xué)標(biāo)簽的性能,通過將影像組學(xué)標(biāo)簽與臨床病理風(fēng)險因素相結(jié)合開發(fā)了乳腺癌ALN轉(zhuǎn)移預(yù)測的列線圖,達到了較好的預(yù)測性能,AUC為0.895,該研究認(rèn)為,基于鉬靶的影像組學(xué)標(biāo)簽列線圖為乳腺癌患者術(shù)前預(yù)測ALN狀態(tài)提供了較為可靠且非侵入性的工具,可用于優(yōu)化當(dāng)前乳腺癌患者的治療策略。
綜上所述,作為一個醫(yī)工交叉的研究領(lǐng)域,影像組學(xué)技術(shù)近年來得到了飛速發(fā)展,成為了國內(nèi)外研究的熱點。影像組學(xué)可充分挖掘肉眼不可見的深層次影像特征,其在乳腺癌ALN轉(zhuǎn)移方面的應(yīng)用方興未艾,尤其是基于MRI的影像組學(xué)在乳腺癌淋巴結(jié)轉(zhuǎn)移預(yù)測方面研究成果已經(jīng)大量涌現(xiàn),影像組學(xué)有望為乳腺癌患者的個體化精準(zhǔn)診療提供可靠依據(jù),應(yīng)用前景十分廣闊。相信隨著計算機技術(shù),尤其是深度學(xué)習(xí)等人工智能技術(shù)對影像組學(xué)技術(shù)的完善,影像組學(xué)將更進一步發(fā)展,在醫(yī)學(xué)領(lǐng)域中發(fā)揮更大作用。