馬曉輝 周海春 梁佳偉 賴燦 賈絢
基因組學(xué)的出現(xiàn)及發(fā)展,闡明了腫瘤是由驅(qū)動其發(fā)生、發(fā)展的不同基因型亞群組成的,同一種腫瘤不同的基因亞型生物學(xué)行為迥異,對放化療的反應(yīng)各異,預(yù)后也迥然不同。同一種基因亞型腫瘤,基于不同的個體和內(nèi)外環(huán)境,所處不同階段,其生物學(xué)行為亦有差異。鑒于腫瘤的這種空間以及時間上的異質(zhì)性,侵入性的活體組織基因分子檢測有假陰性及片面性的可能[1]。為達(dá)到腫瘤的精準(zhǔn)治療,單靠傳統(tǒng)病理及基因測序已顯不足。這種背景下,便出現(xiàn)了以醫(yī)學(xué)影像為研究對象,從解剖及分子影像中提取大量定量信息并將其與相應(yīng)的生物信息和臨床終點相聯(lián)系的新興的領(lǐng)域——放射組學(xué)。
放射組學(xué)通過使用數(shù)據(jù)表征算法可以實現(xiàn)自動化地定量分析一系列的放射表型特征,比如病灶的大小、形狀、紋理等,這些放射表型潛在地反映病變的生物屬性,如腫瘤內(nèi)在的和腫瘤之間的異質(zhì)性[1]。運(yùn)用這些放射組學(xué)數(shù)據(jù),建立生物信息學(xué)模型,將病灶的影像特征與其臨床表型、基因分子標(biāo)志物等相關(guān)聯(lián),成為精準(zhǔn)醫(yī)療的強(qiáng)大推手。本文就放射組學(xué)概念、工作流程、基于Python語言的Pyradiomics工具包在放射組學(xué)中的應(yīng)用及對精準(zhǔn)醫(yī)學(xué)的貢獻(xiàn),人工智能時代放射組學(xué)的機(jī)遇及面臨的挑戰(zhàn)等作一綜述。
1.1 放射組學(xué)概念 2012年,荷蘭學(xué)者Lambin等[2]受到放射基因組學(xué)的啟發(fā),首先提出了放射組學(xué)的概念,后經(jīng)不斷發(fā)展完善,形成一門新興學(xué)科——利用計算機(jī)圖像處理技術(shù),對CT,MRI和PET圖像進(jìn)行高通量、自動化分析,從中提取大量的定量特征數(shù)據(jù),這些數(shù)據(jù)與患者其他數(shù)據(jù)相結(jié)合,并利用先進(jìn)的生物信息學(xué)工具進(jìn)行挖掘、建立模型,對腫瘤的異質(zhì)性進(jìn)行綜合評價,提高對診斷,預(yù)后預(yù)測的準(zhǔn)確性,又稱影像組學(xué)[3]。在強(qiáng)調(diào)個性化精準(zhǔn)診療的背景下,放射組學(xué)使醫(yī)學(xué)影像從診斷為主迅速提升為一種核心工具,為臨床診療作出具體有效的指導(dǎo)[4]。
放射組學(xué)廣泛應(yīng)用于各類疾病,在腫瘤的診斷,療效評估和預(yù)后分析中尤為突出,多項研究表明,其有可能成為一種有效的生物標(biāo)志物,對各種介入治療方法的患者進(jìn)行分層,指導(dǎo)治療并預(yù)測預(yù)后情況,為腫瘤檢測和治療的決策提供定量和客觀的支持[5]。放射組學(xué)需要獲取醫(yī)學(xué)圖像的高維量化特征,最理想的方法是通過使用自動算法來定義并量化醫(yī)學(xué)成像的表型特質(zhì)。計算機(jī)硬件和人工智能技術(shù)快速發(fā)展,各種優(yōu)秀算法大量涌現(xiàn),建造模式識別工具,實現(xiàn)全自動地提取肉眼難以分辨的深層放射學(xué)特征,并將圖像轉(zhuǎn)換成可收集的數(shù)據(jù),促使高通量放射組學(xué)特征提取得以方便、快捷的實現(xiàn);加上各種功能強(qiáng)大的統(tǒng)計軟件出現(xiàn)并不斷完善,復(fù)雜的統(tǒng)計方法能夠簡便的計算機(jī)輔助實現(xiàn),大量的放射組學(xué)數(shù)據(jù)分析也不再是難題。正因為有了醫(yī)學(xué)圖像的高通量提取、數(shù)據(jù)挖掘和人工智能的強(qiáng)大分類能力,放射組學(xué)得以迅速發(fā)展。
基于人工智能的放射組學(xué)技術(shù)主要有兩種,一種通過應(yīng)用工程硬編碼實現(xiàn),另一種使用深度學(xué)習(xí)方法來實現(xiàn)。前者往往需要專業(yè)領(lǐng)域知識,早期人工智能機(jī)器中的大部分智能都是通過編碼實現(xiàn)的,用來解決定義明確的邏輯問題,例如下棋的計算機(jī)程序;后者通過使用反向傳播算法來指導(dǎo)機(jī)器調(diào)整其內(nèi)部參數(shù),從而發(fā)現(xiàn)大數(shù)據(jù)集中的復(fù)雜結(jié)構(gòu),深層卷積網(wǎng)絡(luò)是當(dāng)下主流的深度學(xué)習(xí)方法,在處理圖像、視頻、音頻等方面具有非常強(qiáng)大的功能[6]。無論是基于工程硬編碼算法還是基于深度學(xué)習(xí)方法,都可以用于構(gòu)建預(yù)測性或預(yù)后性非侵入性生物標(biāo)記。
1.2 放射組學(xué)實現(xiàn)的方法 實際工作中,放射組學(xué)涉及到多個相互銜接的步驟,主要包括:(1)獲取標(biāo)準(zhǔn)化的CT、MRI及PET高質(zhì)量圖像,并進(jìn)行預(yù)處理;(2)識別及分割感興趣區(qū)(region of interest,ROI);(3)提取放射組學(xué)特征并量化;(4)建立數(shù)據(jù)庫,深度挖掘數(shù)據(jù),單獨或結(jié)合人口統(tǒng)計學(xué)、臨床、基因組數(shù)據(jù)建立模型,預(yù)測結(jié)果。
實際工作中,因為缺乏標(biāo)準(zhǔn)化的算法定義和圖像處理,使獲得的結(jié)果缺乏重復(fù)性和可比性,阻礙了放射組學(xué)的發(fā)展。為了解決這個問題,科學(xué)家和工程技術(shù)人員開發(fā)出了Pyradiomics工具包[7]。Pyradiomics工具包是一個基于Python語言的開源工具包,通過工程硬編碼算法實現(xiàn)放射組學(xué)特征提取,作為當(dāng)前應(yīng)用最廣的放射組學(xué)工具之一,該工具包支持2維和3維的影像數(shù)據(jù),可以方便和可重復(fù)的提取放射組學(xué)特征,計算ROI的每個特征的單個值(基于分段)或生成特征圖(基于體素)。
Pyradiomics工具包在3D Slicer軟件中提供了一個簡單方便的前端界面,方便了醫(yī)學(xué)專業(yè)人員的使用[7]。3D Slicer是一個用于醫(yī)學(xué)圖像計算的免費開源研究平臺,由美國國立衛(wèi)生研究院和全球開發(fā)者社區(qū)支持研發(fā),Mackin等[8]研究認(rèn)為,基于3D Slicer的半自動分割方法比手動分割具有更好的可重復(fù)性。而且,該軟件內(nèi)直接集成了“radiomics”擴(kuò)展,使兩者功能結(jié)合在一起形成3D Slicer勾畫影像圖片的ROI,然后應(yīng)用“radiomics”擴(kuò)展進(jìn)行放射組學(xué)特征抽取。Pyradiomics工具包默認(rèn)以3維方式考慮體素到體素的關(guān)系,并輸出與一階、形狀和紋理相關(guān)的多個放射組學(xué)特征,其定義的放射組學(xué)特征符合國際圖像生物標(biāo)記標(biāo)準(zhǔn)倡議[7,9]。
應(yīng)用Pyradiomics工具包,可以通過四個步驟來實現(xiàn)自定義放射組學(xué)特征的提?。海?)圖像和分割圖(mask)的加載和預(yù)處理;(2)啟用濾波器(filters);(3)使用不同特征類計算特征;(4)返回結(jié)果。見圖1。圖像采集和重建方法的不同導(dǎo)致圖像質(zhì)量的差異,以及其他因素(如ROI分割的準(zhǔn)確性、編碼變化和基線臨床特征等),都可能影響放射組學(xué)的下游特征提取過程。
圖1 應(yīng)用Pyradiomics工具包實現(xiàn)放射組學(xué)分析的流程
應(yīng)用Pyradiomics工具包可以在原始圖像及預(yù)處理的圖像上獲取放射組學(xué)特征,預(yù)處理的變換圖像通過數(shù)個內(nèi)置的濾波器來獲得,包括小波濾波器(wavelet)和高斯-拉普拉斯(Laplacian of Gaussian,LoG)濾波器,以及幾個簡單的濾波器,如平方、平方根、對數(shù)、指數(shù)濾波器等。每種圖像類型中均可以提取8種不同的組學(xué)特征,包括以下內(nèi)容:(1)一階統(tǒng)計特征值,通過常用和基本度量來描述圖像ROI的體素強(qiáng)度的分布,包括中位數(shù)、平均值、最小和最大值等,共提取19個特征值;(2)三維形狀特征,包括ROI三維尺寸及形狀特征,與灰度強(qiáng)度分布無關(guān),共提取16個特征值;(3)二維形狀特征,包括ROI的二維大小及形狀特征,與灰度強(qiáng)度分布無關(guān),共提取10個特征值;(4)灰度共生矩陣特征,描述了圖像ROI的二階聯(lián)合概率函數(shù),是高階紋理特征,共提取24個特征值;(5)灰度游程矩陣,關(guān)注圖像灰度方向、相鄰間隔和變化幅度等綜合信息,高階的紋理特征,共提取16個特征值;(6)灰度區(qū)域大小矩陣,用于描述圖像亮度的二變量條件分布概率密度,共提取16個特征值;(7)鄰域灰度差矩陣,用來量化灰度值與其距離δ之內(nèi)的相鄰像素的平均灰度值之間的差異,共提取5個特征值 ;(8)灰度依賴矩陣,量化圖像中的灰度依賴性,共提取14個特征值。
Pyradiomics工具包被開發(fā)出來后,基于這一工具的研究開始出現(xiàn)。Griethuysen等[7]應(yīng)用Pyradiomics工具包對429例不同的肺部病變進(jìn)行放射組學(xué)特征抽取,以區(qū)分肺內(nèi)結(jié)節(jié)的良惡性,該研究得到535個穩(wěn)定性較高的放射組學(xué)特征,包括形狀特征5個,一階強(qiáng)度統(tǒng)計特征14個,紋理特征48個,對數(shù)特征310個,小波特征158個,分析發(fā)現(xiàn)基于影像的亞型與肺部病變的良惡性狀態(tài)之間存在關(guān)聯(lián)。Grimm等[10]分析了來自單個機(jī)構(gòu)的275例乳腺癌患者的術(shù)前乳房MRI圖像,使用計算機(jī)視覺算法從每例患者的影像中提取出56個成像特征,包括形態(tài)、紋理和動態(tài)特征,并使用多元分析來確定成像特征和乳腺癌分子亞型之間的關(guān)聯(lián),結(jié)果顯示動態(tài)對比增強(qiáng)MRI的放射組學(xué)特征與luminal A和luminal B激素受體陽性的分子亞型密切相關(guān)。Gao等[11]研究了3個獨立隊列的165例胃癌患者的CT圖像,使用Pyradiomics工具包提取了放射學(xué)特征,并使用LASSO邏輯回歸模型篩選,獲得了6個穩(wěn)健的放射組學(xué)特征來建立模型,這6個放射組學(xué)特征在訓(xùn)練,驗證和測試隊列中顯示出良好的估計腫瘤浸潤調(diào)節(jié)性T細(xì)胞的能力,且多變量Cox回歸分析表明,該放射組學(xué)特征是胃癌患者總體生存不良的獨立危險因素。Kaissis等[12]應(yīng)用Pyradiomics工具包,回顧性分析了207例經(jīng)證實的胰腺導(dǎo)管腺癌患者的術(shù)前CT圖像,并開發(fā)了一種隨機(jī)森林機(jī)器學(xué)習(xí)算法以根據(jù)放射組學(xué)特征預(yù)測胰腺癌的分子亞型,該分類算法的靈敏度(0.84±0.05)、特異度(0.92±0.01)都較高,ROC曲線AUC為0.93±0.01,從而認(rèn)為基于機(jī)器學(xué)習(xí)的術(shù)前CT圖像放射組學(xué)分析可以預(yù)測與胰腺癌患者生存高度相關(guān)的分子亞型。Liu等[13]發(fā)現(xiàn)從Pyradiomics工具包提取的形態(tài)學(xué)特征可用于顱內(nèi)動脈瘤穩(wěn)定程度分層,其中,動脈瘤的平坦度是預(yù)測動脈瘤穩(wěn)定性的最重要的形態(tài)學(xué)決定因素。Shi等[14]應(yīng)用Pyradiomics工具包分析24例HIV感染者的胸部CT誤診圖像,發(fā)現(xiàn)臨床影像學(xué)特征結(jié)合放射組學(xué)可能有助于在HIV感染患者中識別類似肺癌的機(jī)遇性肺部感染。
綜上可以發(fā)現(xiàn)Pyradiomics工具包可以深度發(fā)掘醫(yī)學(xué)影像中的大量特征,并主要用于量化腫瘤的異質(zhì)性,預(yù)測腫瘤病理及基因表型,當(dāng)然關(guān)于腫瘤治療療效及預(yù)后評估也有報道,也可以發(fā)現(xiàn)其在非腫瘤病變的鑒別診斷、血管瘤穩(wěn)定性評估等非腫瘤方面的應(yīng)用潛力。
隨著成像和分析技術(shù)的進(jìn)步,放射組學(xué)已成為腫瘤精準(zhǔn)治療領(lǐng)域的研究熱點之一,其作用已經(jīng)擴(kuò)展到腫瘤管理的各個方面,囊括了從檢測、診斷到治療反應(yīng),以及進(jìn)一步的風(fēng)險監(jiān)測的整個范圍。放射組學(xué)的臨床應(yīng)用有望在腫瘤治療的各個方面發(fā)揮重要作用,而Pyradiomics工具包這一開源的放射組學(xué)工具,將隨放射組學(xué)的發(fā)展而不斷完善,成為這一領(lǐng)域的強(qiáng)大助力。
本文介紹了放射組學(xué)的概念、分析流程、Pyradiomics工具包這一穩(wěn)健的放射組學(xué)工具及其國內(nèi)外應(yīng)用Pyradiomics工具包進(jìn)行研究的現(xiàn)狀,希望能給初入該領(lǐng)域的研究人員一些幫助。雖然放射組學(xué)也面臨一些挑戰(zhàn),比如結(jié)果的標(biāo)準(zhǔn)制定、結(jié)果的可再現(xiàn)性、大數(shù)據(jù)之下的因果關(guān)系的建立等,但在大數(shù)據(jù)、深度學(xué)習(xí)和人工智能的大潮推動下,放射組學(xué)必定會大放異彩。