李 笛,霍 雷,萬(wàn)夢(mèng)云,賈寧陽(yáng),王麗嘉*
基于新型支持向量機(jī)的影像組學(xué)在肝臟結(jié)節(jié)分類中的應(yīng)用
李 笛1,霍 雷2,萬(wàn)夢(mèng)云1,賈寧陽(yáng)2,王麗嘉1*
1. 上海理工大學(xué) 醫(yī)療器械與食品學(xué)院,上海 200093;2. 第二軍醫(yī)大學(xué)附屬東方肝膽外科醫(yī)院 影像科,上海 200438
肝癌是最常見的惡性腫瘤之一,亞洲地區(qū)最為常見的肝癌演變過程為肝炎-肝硬化結(jié)節(jié)-異型增生結(jié)節(jié)-肝細(xì)胞性肝癌.判斷肝臟結(jié)節(jié)在演變過程所處分期,并采取干預(yù)措施,對(duì)降低肝癌的發(fā)生率非常關(guān)鍵.本文針對(duì)影像組學(xué)提出了更精確的支持向量機(jī)(SVM)分類算法——LFOA-F-SVM,用于對(duì)120名患者的腹部動(dòng)態(tài)增強(qiáng)磁共振圖像的肝臟結(jié)節(jié)進(jìn)行四分類.該算法利用了考慮半徑與幾何間距的F-SVM,并結(jié)合萊維飛行策略(LF)的果蠅優(yōu)化算法(FOA)尋求超參.為了驗(yàn)證方法的有效性,本文另外添加了5個(gè)UCI分類數(shù)據(jù)集(心臟、帕金森疾病、虹膜、葡萄酒和動(dòng)物園),并與SVM、PSO-SVM、FOA-SVM、F-SVM進(jìn)行比較.結(jié)果表明,在6個(gè)分類數(shù)據(jù)集(包括肝臟結(jié)節(jié)數(shù)據(jù)集和5個(gè)UCI分類數(shù)據(jù)集)中,相對(duì)于其他分類算法,LFOA-F-SVM的分類準(zhǔn)確率最高,在肝臟結(jié)節(jié)數(shù)據(jù)集中的四分類精確率和查全率也較高.
肝臟結(jié)節(jié);分類;影像組學(xué);LFOA-F-SVM
2019年,國(guó)家癌癥中心發(fā)布的《2015年中國(guó)惡性腫瘤流行情況分析》表明2015年我國(guó)新發(fā)肝癌病例約37.0萬(wàn)例,居十大腫瘤第4位;因肝癌死亡人數(shù)約32.6萬(wàn)例,居十大腫瘤第2位[1].在亞洲地區(qū),肝炎-肝硬化結(jié)節(jié)-異型增生結(jié)節(jié)-肝細(xì)胞性肝癌(Hepatic Cell Carcinoma,HCC)是最為常見的肝癌演變過程.判斷肝臟結(jié)節(jié)在肝癌演變過程中的分期,并提前進(jìn)行預(yù)防和干預(yù),對(duì)降低肝癌的發(fā)生率及死亡率非常關(guān)鍵.
然而,結(jié)節(jié)和腫瘤表面的多樣性和復(fù)雜性使得診斷仍面臨較大的挑戰(zhàn).影像組學(xué)包括圖像獲取、感興趣區(qū)域(Region of Interest,ROI)分割、特征提取及篩選、建模四個(gè)過程.它可以從超聲、電子計(jì)算機(jī)斷層掃描(Computerized Tomography,CT)、正電子發(fā)射斷層掃描(Positron Emission Tomography,PET)和磁共振成像(Magnetic Resonance Imaging,MRI)等醫(yī)學(xué)影像中提取大量高級(jí)的、定量的影像特征,進(jìn)而篩選有價(jià)值的特征參與臨床診斷[2].相比其它成像技術(shù)而言,MRI具有很高的軟組織分辨率,可通過多參數(shù)成像及增強(qiáng)掃描等反映結(jié)節(jié)內(nèi)部結(jié)構(gòu)與成分的病變規(guī)律,為肝臟結(jié)節(jié)性質(zhì)的判定提供更多的影像學(xué)基礎(chǔ),更有利于特征的提取及篩選.Xue等[3]在訓(xùn)練集數(shù)據(jù)量較少的情況下,利用遷徙學(xué)習(xí)影像組學(xué)對(duì)多模態(tài)肝纖維化超聲成像進(jìn)行建模,得到了良好的預(yù)測(cè)模型.Wu等[4]利用影像組學(xué)對(duì)使用了造影劑的HCC和肝血管瘤(Hepatic Hemangioma,HH)磁共振圖像進(jìn)行分類,測(cè)試集的受試者操作特征(Receiver Operating Characteristic,ROC)曲線的曲線下面積(Area Under Curve,AUC)為0.89,診斷性能與具有10年經(jīng)驗(yàn)的放射科醫(yī)生無統(tǒng)計(jì)學(xué)差異.本文將利用影像組學(xué)獲取并分割肝炎、肝硬化結(jié)節(jié)、異型增生結(jié)節(jié)和HCC患者的動(dòng)態(tài)增強(qiáng)磁共振圖像的ROI,并進(jìn)行特征提取及篩選,最后使用機(jī)器學(xué)習(xí)技術(shù)建立分類模型.
在機(jī)器學(xué)習(xí)的分類建模中,Baek等[5]使用支持向量機(jī)(Support Vector Machine,SVM)區(qū)分肝臟狀態(tài),包括正常、低脂纖維化、高脂纖維化和炎癥.Anju等[6]首先基于改進(jìn)的分型紋理分析的分割(Segmentation based Fractal Texture Analysis,SFTA)算法進(jìn)行特征提取,然后利用SVM對(duì)肝腫瘤進(jìn)行分類.以上結(jié)果均表明,SVM分類算法在準(zhǔn)確度、特異度和靈敏度等方面性能較好.然而,懲罰因子()和核函數(shù)寬度()對(duì)SVM分類性能有重要影響,需要重點(diǎn)進(jìn)行優(yōu)化.在以往研究中,果蠅優(yōu)化算法(Fruit Fly Optimization Algorithm,F(xiàn)OA)以參數(shù)設(shè)置少、算法結(jié)構(gòu)簡(jiǎn)便且易于理解等優(yōu)點(diǎn),常應(yīng)用于SVM參數(shù)優(yōu)化問題.例如,F(xiàn)OA-SVM廣泛且成功應(yīng)用于年度電力負(fù)荷預(yù)測(cè)[7]、礦井火災(zāi)圖像模式識(shí)別[8]、滾動(dòng)軸承故障診斷[9]等研究.但研究發(fā)現(xiàn),SVM僅考慮幾何間隔的最大化,而忽略半徑最小化,因此分類器仍具有較大誤差,其誤差范圍一般是半徑和幾何間隔之比的函數(shù)[10].F-SVM是一種新的考慮半徑邊緣的SVM算法,將特征變換(Feature Transportation,F(xiàn))與SVM聯(lián)合學(xué)習(xí),減小了半徑,從而降低了SVM的誤差范圍[11].
為了提高SVM在肝臟結(jié)節(jié)數(shù)據(jù)中的分類性能,本文提出了一種將現(xiàn)有的融合了萊維飛行的果蠅優(yōu)化算法(Levy flight fruit fly optimization,LFOA)和F-SVM相結(jié)合的分類算法—LFOA-F-SVM,對(duì)特征篩選后的肝臟結(jié)節(jié)數(shù)據(jù)建立分類模型.其中,F(xiàn)-SVM考慮了幾何間隔最大化和半徑最小化;LFOA算法則對(duì)FOA進(jìn)行了改進(jìn),以提高參數(shù)尋優(yōu)能力.本文將該算法在5個(gè)UCI數(shù)據(jù)集以及肝臟結(jié)節(jié)數(shù)據(jù)集中進(jìn)行了測(cè)試,并與SVM[12]、粒子群優(yōu)化算法(Particle Swarm Optimization,PSO)-SVM[13]、FOA-SVM[8]、F-SVM[11]進(jìn)行了比較,以評(píng)估LFOA-F-SVM的泛化能力和有效性.
常用且有效的基于機(jī)器學(xué)習(xí)的分類算法包括K近鄰、邏輯回歸、決策樹和SVM等.其中,SVM針對(duì)小樣本,具有較強(qiáng)的非線性分類的能力,因此本文選擇在SVM的基礎(chǔ)上進(jìn)行分類建模.
根據(jù)拉格朗日乘法可得線性F-SVM為:
最后,使用廣義坐標(biāo)下降法(Generalized Block Coordinate Descent,GBCD)[14]求解該模型.
為了解決非線性分類問題,在線性F-SVM的基礎(chǔ)上結(jié)合了核主成分分析(Kernel Principal Component Analysis,KPCA),其主要思想是將二維空間非線性分類問題轉(zhuǎn)換到高維空間的線性分類問題.內(nèi)核化F-SVM為:
參數(shù)設(shè)置常用網(wǎng)格搜索法(Grid Search,GS)、PSO[17]和FOA等群體智能算法進(jìn)行優(yōu)化.其中,F(xiàn)OA以易于操作,可塑性強(qiáng)等優(yōu)勢(shì)在許多方面得到成功應(yīng)用.
FOA是一種元啟發(fā)式算法,其靈感來自果蠅在覓食期間依賴嗅覺和視覺來尋找食物的覓食行為[18].在參數(shù)優(yōu)化時(shí),F(xiàn)OA通過模仿果蠅的飛行方式來尋找全局最優(yōu)解.首先在空間中隨機(jī)生成果蠅種群的位置,然后每個(gè)果蠅將根據(jù)果蠅的飛行模式更新其位置,在更新過程中不斷提高種群的適應(yīng)度.FOA的代碼框架易于構(gòu)建、操作簡(jiǎn)單、計(jì)算速度快,已在多個(gè)領(lǐng)域中得到應(yīng)用[19,20].雖然該算法簡(jiǎn)單易行,但是容易過早的陷入局部最優(yōu),這一問題可采用萊維飛行(Levy Flight,LF)進(jìn)行改善[21].LF是一種步伐短且方向隨機(jī)的搜索路徑,其可以重新調(diào)整種群的位置,避免陷入局部最優(yōu)狀態(tài),從而提高全局搜索能力.使用萊維飛行可以用以下公式表示:
其中,代表調(diào)節(jié)萊維飛行穩(wěn)定性的指標(biāo),代表步長(zhǎng).
本文在FOA的基礎(chǔ)上采用有利于全局尋優(yōu)的LFOA來調(diào)整F-SVM分類器參數(shù).在FOA算法中加入LF后,果蠅種群位置的更新方程為:
圖1 LFOA-F-SVM分類流程
本文的主要研究對(duì)象來自2013年4月至2017年2月在東方肝膽醫(yī)院采集、由病理證實(shí)且具備完整臨床資料的120名患者的腹部動(dòng)態(tài)增強(qiáng)磁共振圖像(共360幅).其中肝炎、肝硬化結(jié)節(jié)、異型增生結(jié)節(jié)和HCC患者(HCC最大直徑小于3 cm)各30名.本研究符合相關(guān)倫理要求.動(dòng)脈期、門脈期和延遲期橫斷面方位圖像采用GE Signa Inifinity Twin Speed 1.5 T磁共振掃描儀,使用8通道體部線圈,通過肝臟加速容積采集(Liver Acquisition with Volume Acceleration,LAVA)成像序列獲得.重復(fù)時(shí)間(Repetition Time,TR)=3.712 ms,回波時(shí)間(Echo Time,TE)=1.724 ms,反轉(zhuǎn)時(shí)間為7 ms,翻轉(zhuǎn)角為15?,圖像矩陣為512*512,層厚為2.5 mm,層間距為2.5 mm.
為了驗(yàn)證LFOA-F-SVM在多分類中的有效性,在肝臟結(jié)節(jié)數(shù)據(jù)集的基礎(chǔ)上,我們另外添加了UCI機(jī)器學(xué)習(xí)開源數(shù)據(jù)庫(kù)(https://archive.ics.uci.edu/ml/index.php)中樣本量較小的2個(gè)二分類與3個(gè)多分類的純數(shù)字無缺失數(shù)據(jù)集,分別為心臟、帕金森疾病、虹膜、葡萄酒和動(dòng)物園,表1描述了這些數(shù)據(jù)的基本信息、最高分類準(zhǔn)確率、所對(duì)應(yīng)的分類器,以及分類器和分類準(zhǔn)確率的文獻(xiàn)來源.在進(jìn)行建模之前對(duì)以上數(shù)據(jù)進(jìn)行歸一化處理,消除數(shù)據(jù)之間的影響[22].
表1 UCI分類數(shù)據(jù)集
*文獻(xiàn)來源指分類器和分類準(zhǔn)確率的文獻(xiàn)來源;SSLSH:結(jié)合對(duì)稱分布和高信心的半監(jiān)督學(xué)習(xí)(semi-supervised learning with symmetrical distribution and high confidence)
360幅圖像的ROI均由專門從事肝臟研究的放射科醫(yī)生通過itk-snap(http://www.itksnap.org/pmwiki/pmwiki.php)手動(dòng)勾畫和分割病灶的所有層面.
對(duì)于每個(gè)病灶,基于PyRadiomics工具包提取了851個(gè)定量的影像組學(xué)特征.這些特征分為四類[25]:一階統(tǒng)計(jì)特征、形狀特征、二階(紋理)特征、高階統(tǒng)計(jì)特征,如表2所示.一階統(tǒng)計(jì)特征可以提供像素值強(qiáng)度在ROI內(nèi)的空間分布情況,并用于分析圖像特征.形狀特征主要是對(duì)結(jié)節(jié)3D大小與形狀的描述,與ROI中的灰度強(qiáng)度分布無關(guān).考慮到球體是標(biāo)準(zhǔn)形狀,本文分析了ROI與球體之間的相似性,并采用最大2D和3D直徑、表面積、體積、表面體積比、伸長(zhǎng)率和平坦度等參數(shù)描述形狀特征.二階(紋理)特征通過密度直方圖描述,它表示了每個(gè)像素的空間位置[26].本文分析了五種類型的紋理特征,包括灰度共生矩陣(Gray Level Co-occurrence Matrix,GLCM)、灰度游程長(zhǎng)度矩陣(Gray Level Run Length Matrix,GLRLM)、灰度大小區(qū)域矩陣(Gray Level Size Zone Matrix,GLSZM)、鄰域灰度差分矩陣(Neighbouring Gray Tone Difference Matrix,NGTDM)和灰度依賴矩陣(Gray Level Dependence Matrix,GLDM).基于一階和二階特征,應(yīng)用小波濾波,我們獲得了魯棒性較強(qiáng)的高階統(tǒng)計(jì)特征.
表2 肝臟結(jié)節(jié)數(shù)據(jù)集提取的影像組學(xué)特征
圖2 肝臟結(jié)節(jié)數(shù)據(jù)集的特征篩選. (a) l對(duì)應(yīng)的MSE變化曲線;(b) l對(duì)應(yīng)的特征系數(shù)(縱坐標(biāo))與系數(shù)為非零的特征個(gè)數(shù)(上方)
圖3 肝臟結(jié)節(jié)數(shù)據(jù)集篩選后的53個(gè)特征及其系數(shù)
為了判斷篩選后的特征是否仍有較多的冗余項(xiàng),對(duì)其進(jìn)行斯皮爾曼相關(guān)性分析(圖4,右側(cè)色標(biāo)代表相關(guān)性).在最終篩選的53個(gè)特征中,僅有2組特征具有較強(qiáng)的相關(guān)性,對(duì)后續(xù)分類建模影響較小,所以本文選擇在這53個(gè)特征變量的基礎(chǔ)上建立分類模型.
圖4 肝臟結(jié)節(jié)數(shù)據(jù)集篩選后特征的斯皮爾曼相關(guān)性熱力圖
繪制ROC曲線,并計(jì)算AUC,以評(píng)估模型在區(qū)分特定類與其他類別時(shí)的能力[28]. 分類模型的性能評(píng)估指標(biāo)還包括分類準(zhǔn)確率(acc和ACC,其中ACC指一次實(shí)驗(yàn)獲得的分類準(zhǔn)確率,acc指10次交叉實(shí)驗(yàn)計(jì)算的平均分類準(zhǔn)確率)、精確率(Precision)和召回率(Recall)計(jì)算如下[29]:
其中,為10次交叉實(shí)驗(yàn),TP(True Positives)為真陽(yáng)性數(shù)量,TN(True Negatives)為真陰性數(shù)量,F(xiàn)P(False Positives)為假陽(yáng)性數(shù)量,F(xiàn)N(False Negatives)為假陰性數(shù)量.精確率越大,表明分類器精度越高;召回率越高,表明分類器的查全率越高[30].
在6種數(shù)據(jù)集上,5種算法的10次交叉實(shí)驗(yàn)分類準(zhǔn)確率的平均值和訓(xùn)練時(shí)間如表3所示.在二分類的心臟和帕金森疾病數(shù)據(jù)集中,相比SVM,使用超參優(yōu)化的FOA-SVM算法,以及F-SVM算法的分類準(zhǔn)確率均有所提高;LFOA-F-SVM算法在二分類數(shù)據(jù)集中的分類準(zhǔn)確率達(dá)到最高,同時(shí)該算法獲得的分類準(zhǔn)確率可達(dá)到或高于之前的研究,分類準(zhǔn)確率分別為89.35%與96.32%.
在肝臟結(jié)節(jié)、虹膜、葡萄酒和動(dòng)物園多分類數(shù)據(jù)集中,相比基本的SVM,使用超參優(yōu)化的PSO-SVM獲得了更高的分類準(zhǔn)確率(除動(dòng)物園數(shù)據(jù)集外);FOA-SVM在4個(gè)數(shù)據(jù)集中均表現(xiàn)出更高的分類準(zhǔn)確率,在動(dòng)物園與肝臟結(jié)節(jié)數(shù)據(jù)中表現(xiàn)尤為顯著.因此,SVM中超參的調(diào)節(jié)對(duì)多分類是有效的.在考慮半徑與幾何距離后,F(xiàn)-SVM的分類準(zhǔn)確率優(yōu)于基本的SVM.相對(duì)于其他算法,LFOA-F-SVM在上述數(shù)據(jù)集中均獲得了最高的分類準(zhǔn)確率,而且葡萄酒數(shù)據(jù)集的分類準(zhǔn)確率與以往研究中的最高分類準(zhǔn)確率相當(dāng),而在虹膜與動(dòng)物園數(shù)據(jù)集的分類準(zhǔn)確率則高于以往研究中的最高分類準(zhǔn)確率.上述結(jié)果均可證明利用LFOA對(duì)F-SVM調(diào)參是有效的.
5種分類算法應(yīng)用于多類數(shù)據(jù)集中的訓(xùn)練時(shí)間(表3)顯示,SVM、PSO-SVM、FOA-SVM在各類數(shù)據(jù)集中需要更少的訓(xùn)練時(shí)間.而F-SVM與LFOA-F-SVM在建立模型過程中,由于需要不斷收斂初始矩陣與(,),得到最優(yōu)分類模型與特征變換矩陣A,所以訓(xùn)練時(shí)間會(huì)較長(zhǎng).在數(shù)據(jù)量較少的情況下,可以犧牲訓(xùn)練時(shí)間,得到更高的分類性能.相比于F-SVM,LFOA-F-SVM在帕金森疾病、虹膜、動(dòng)物園和肝臟結(jié)節(jié)數(shù)據(jù)中的訓(xùn)練時(shí)間更短,因?yàn)長(zhǎng)FOA在超參調(diào)節(jié)中更快捷方便.
表3 5種算法的分類準(zhǔn)確率(acc)和運(yùn)行時(shí)間
圖5顯示了以上數(shù)據(jù)集的10次運(yùn)行的分類準(zhǔn)確率.在圖5(a)中,SVM的分類準(zhǔn)確率較低,最低為77.42%;PSO-SVM與FOA-SVM將最低分類準(zhǔn)確率提高到83.87%;F-SVM將此次運(yùn)行的準(zhǔn)確率提高到87.10%,使全局分類準(zhǔn)確率分布在83.87%~93.55%之間;LFOA-F-SVM在10次運(yùn)行中有9次達(dá)到最高的分類準(zhǔn)確率.在圖5(b)中,SVM、PSO-SVM、FOA-SVM與F-SVM的最低分類準(zhǔn)確率為78.95%;而LFOA-F-SVM使其分類準(zhǔn)確率大幅提高,分類準(zhǔn)確率分布在89.47%~100%,并且有4次分類準(zhǔn)確率為100%.在圖5(c)中,SVM與PSO-SVM的最低分類準(zhǔn)確率為86.67%;FOA-SVM與F-SVM的分類準(zhǔn)確率分布在93.33%~100%之間,并且F-SVM的分類準(zhǔn)確率為100%的次數(shù)達(dá)到7次;LFOA-F-SVM在虹膜數(shù)據(jù)集中,有8次運(yùn)行的分類準(zhǔn)確率達(dá)到了100%,其結(jié)果優(yōu)于其他4種算法.在圖5(d)中,準(zhǔn)確率最低的為88.89%,其余均分布在94.44%~100%;相較于FOA-SVM,F(xiàn)-SVM將分類準(zhǔn)確率為100%的次數(shù)由7次提升到8次;此外,LFOA-F-SVM在10次運(yùn)行中有9次達(dá)到了100%.在圖5(e)中,F(xiàn)OA-SVM與SVM的分類準(zhǔn)確率均分布在90.91%~100%之間,較為穩(wěn)定并且準(zhǔn)確率較高;F-SVM有8次運(yùn)行的準(zhǔn)確率達(dá)到100%,但在第9次準(zhǔn)確率為81.82%;LFOA-F-SVM在動(dòng)物園數(shù)據(jù)的10次運(yùn)行中均獲得了最高的分類準(zhǔn)確率,并且相比其他算法更為穩(wěn)定.在圖5(f)中,SVM經(jīng)10次運(yùn)行的分類準(zhǔn)確率普遍較低,其范圍是52.78%~86.11%;PSO-SVM將最低分類準(zhǔn)確率提升到63.89%;FOA-SVM將最高分類準(zhǔn)確率提高到了88.89%;F-SVM相比于以上方法,準(zhǔn)確率較高并且更為穩(wěn)定,分布在69.44%~83.33%之間;LFOA-F-SVM獲得的最高準(zhǔn)確率為91.67%,并且在10次運(yùn)行中,準(zhǔn)確率普遍較高.以上結(jié)果顯示在5種算法中,LFOA-F-SVM的分類準(zhǔn)確率和穩(wěn)定性均最高.
圖5 5種算法在6種數(shù)據(jù)集上10次運(yùn)行的分類準(zhǔn)確率(ACC)比較
將肝臟結(jié)節(jié)數(shù)據(jù)另外按7:3的比例分為訓(xùn)練集與測(cè)試集,并且在訓(xùn)練過程中采取5折交叉驗(yàn)證來尋找超參.將5種算法訓(xùn)練的模型應(yīng)用于測(cè)試集,得到的4種ROC曲線與AUC值如圖6所示[31]. 其中,F(xiàn)1代表肝炎,F(xiàn)2為肝硬化結(jié)節(jié),F(xiàn)3為異型增生結(jié)節(jié),F(xiàn)4為HCC.LFOA-F-SVM在測(cè)試集的四分類中得到了較高性能,每個(gè)類別的ROC曲線均更靠近左上角,并且AUC值范圍從0.920 9(肝炎)到0.993 6(HCC)均達(dá)到最高.相比于異型增生結(jié)節(jié)與HCC,肝炎與肝硬化結(jié)節(jié)的AUC值、精確率與召回率(表4)較低,其原因是肝炎與肝硬化結(jié)節(jié)內(nèi)包含正常肝細(xì)胞、Kupffer細(xì)胞和膽小管結(jié)構(gòu),并且其結(jié)構(gòu)和血供與正常肝細(xì)胞相似[32].
圖6 5種算法在肝臟結(jié)節(jié)測(cè)試集數(shù)據(jù)中的表現(xiàn)
表4列出了5種分類器中4個(gè)類別的精確率與召回率,對(duì)于肝炎,F(xiàn)OA-SVM與LFOA-F-SVM的精確率均達(dá)到0.8以上,并且LFOA-F-SVM使得召回率顯著提高.肝硬化結(jié)節(jié)與其他進(jìn)行分類時(shí),相對(duì)于其它分類器,LFOA-F-SVM的精確率明顯上升,并且召回率也較高.在異型增生結(jié)節(jié)分類中,LFOA-F-SVM分類器的精確率與召回率均達(dá)到最大.對(duì)于HCC分類,LFOA-F-SVM也得到了較高的精確率與回召率,均為0.89.從以上結(jié)果得知,LFOA-F-SVM分類算法對(duì)肝臟結(jié)節(jié)數(shù)據(jù)進(jìn)行四分類時(shí),會(huì)得到較高的分類器精度與查全率.
表4 5種算法在肝臟結(jié)節(jié)測(cè)試集的分類性能
本文提出一種改進(jìn)的基于LF策略的SVM算法(LFOA-F-SVM)對(duì)肝癌演變過程中的結(jié)節(jié)進(jìn)行分類,可為醫(yī)生提供有意義的臨床決策.與SVM和其他SVM的變體相比,LFOA-F-SVM的主要優(yōu)點(diǎn)是考慮了半徑與幾何間距,對(duì)參數(shù)進(jìn)行更好的全局尋優(yōu),從而得到更高的準(zhǔn)確率.在UCI數(shù)據(jù)集與肝臟結(jié)節(jié)數(shù)據(jù)中的實(shí)驗(yàn)結(jié)果均可表明,LFOA-F-SVM不僅有著更高的分類精度,而且準(zhǔn)確率更為穩(wěn)定.隨著3.0 T MRI在臨床中的廣泛應(yīng)用,可得到更清晰的影像來提取特征,可將本文方法應(yīng)用于該類設(shè)備數(shù)據(jù)來評(píng)估其分類性能.此外,在較多的數(shù)據(jù)集中,可考慮將此方法與深度學(xué)習(xí)結(jié)合,得到更準(zhǔn)確的分類器模型.
無
[1] ZHENG R S,SUN K X,ZHANG S W, et al. Analysis on the prevalence of malignant tumors in China in 2015[J]. Chinese Journal of Oncology, 2019, 41(1):19-28.
鄭榮壽,孫可欣,張思維,等. 2015年中國(guó)惡性腫瘤流行情況分析[J]. 中華腫瘤雜志, 2019, 41(1): 19-28.
[2] LAMBIN P, RIOS-VELAZQUEZ E, LEIJENAAR R, et al. Radiomics: extracting more information from medical images using advanced feature analysis[J]. Eur J Cancer2012, 48(4): 441-446.
[3] XUE L Y, JIANG Z Y, FU T T, et al. Transfer learning radiomics based on multimodal ultrasound imaging for staging liver fibrosis[J]. Eur Radiol, 2020, 30(5): 2973-2983.
[4] WU J J, LIU A L, CUI J J, et al. Radiomics-based classification of hepatocellular carcinoma and hepatic haemangioma on precontrast magnetic resonance images[J]. BMC Med Imaging2019, 19(1): 23.
[5] BAEK J, SWANSON T A, TUTHILL T, et al. Support vector machine (SVM) based liver classification: fibrosis, steatosis, and inflammation[C]// International Ultrasonics Symposium. Las Vegas, NV. USA:IEEE, 2020: 1-4.
[6] ANJU KRISHNA M, EDWIN D, HARIHARAN S. Classification of liver tumor using modified SFTA based multi class support vector machine[C]// International Conference on Current Trends in Computer, Electrical, Electronics and Communication, Mysore, India. USA: IEEE, 2017, 854-859.
[7] LI H Z, GUO S, ZHAO H R, et al. Annual electric load forecasting by a least squares support vector machine with a fruit fly optimization algorithm[J]. Energies, 2012, 5(11): 4430-4445
[8] MIAO X Z, CHEN W, BI F M, et all. Mine fire image recognition based on improved FOA-SVM[J]. Computer Engineering, 2019, 45(4): 267-274.
苗續(xù)芝, 陳偉, 畢方明, 等. 基于改進(jìn)FOA-SVM的礦井火災(zāi)圖像識(shí)別[J]. 計(jì)算機(jī)工程, 2019, 45(4): 267-274.
[9] CHU D L, HE Q, MAO X H. Rolling bearing fault diagnosis by a novel fruit fly optimization algorithm optimized support vector machine[J]. J Vibroeng2016, 18(1): 151-164.
[10] VAPNIK V, CHAPELLE O. Bounds on error expectation for support vector machines [J]. Neural Comput, 2000, 12(9): 2013-2036.
[11] WU X H, ZUO W M, LIN L, et al. F-SVM: Combination of feature transformation and SVM learning via convex relaxation[J]. IEEE T Neur Net Lear2018, 29(11): 5185-5199.
[12] CORTES C,VAPNIK V J M L. Support-vector networks[J]. Mach Learn, 1995, 20(3): 273-297.
[13] SHI Y Y, HE P, LIU Y, et al. Multi-region and multi-parameter classification of MRI MGMT gliomas based on PSO-SVM model[J]. Scientific and Technological Innovation, 2021, 17: 15-18
石鈺陽(yáng), 何平, 劉奕, 等. 基于PSO-SVM模型的多區(qū)域多參數(shù)MRI腦膠質(zhì)瘤MGMT分類[J]. 科學(xué)技術(shù)創(chuàng)新, 2021, 17: 15-18.
[14] XU Y Y, YIN W T. A block coordinate descent method for regularized multiconvex optimization with applications to nonnegative tensor factorization and completion[J]. SIAM J Imaging Sci2013, 6(3): 1758-1789.
[15] CHEN H L, YANG B, WANG S J, et al. Towards an optimal support vector machine classifier using a parallel particle swarm optimization strategy[J]. Appl Math Comput2014, 239: 180-197.
[16] THARWAT A, HASSANIEN, ABOUL E. Chaotic antlion algorithm for parameter optimization of support vector machine[J]. Appl Intell2018, 48(3): 670-686.
[17] SHAN L L, ZHANG H J, WANG J, et al. Parameters optimization and implementation of mixed kernels repsilon-SVM based on improved PSO algorithm[J]. Application Research of Computers2013, 30(6): 1636-1639.
單黎黎,張宏軍,王杰, 等. 一種改進(jìn)粒子群算法的混合核-SVM參數(shù)優(yōu)化及應(yīng)用[J]. 計(jì)算機(jī)應(yīng)用研究, 2013, 30(6): 1636-1639.
[18] PAN W T. A new fruit fly optimization algorithm: Taking the financial distress model as an example[J]. Knowledge-Based Systems2012, 26: 69-74.
[19] WANG L, LV S X, ZENG Y R. Literature survey of fruit fly optimization algorithm[J]. Control and Decision2017, 32(7): 1153-1162.
王林, 呂盛祥,曾宇容. 果蠅優(yōu)化算法研究綜述[J]. 控制與決策, 2017, 32(7): 1153-1162.
[20] ZHANG S P, WANG L N. Research and analysis on progress of fruit fly optimization algorithm[J]. Computer Engineering and Applications, 2021, 57(6): 22-29.
張水平, 王麗娜. 果蠅優(yōu)化算法的進(jìn)展研究分析[J]. 計(jì)算機(jī)工程與應(yīng),2021, 57(6): 22-29.
[21] YANG X S, SUASH D. Cuckoo search via Lévy flights[C]//2009 World Congress on Nature & Biologically Inspired Computing (NaBIC), Coimbatore, India. USA: IEEE, 2009: 210-214.
[22] SHEN L M, CHEN H L, YU Z, et al. Evolving support vector machines using fruit fly optimization for medical data classification[J]. Knowl-Based Syst2016, 96: 61-75.
[23] GU Q H, CHANG Y X, LI X H, et al. A novel F-SVM based on FOA for improving SVM performance[J]. Expert Syst Appl2021, 165: 113713.
[24] ZHANG Y H, WEN J H, WANG X B, et al. Semi-supervised learning combining co-training with active learning[J]. Expert Syst Appl, 2014, 41(5): 2372-2378
[25] HARALICK R M, SHANMUGAM K, DINSTEIN I. Textural features for image classification[J]. IEEE T Syst Man Cy-S1973, SMC-3(6): 610-621.
[26] GILLIES R, KINAHAN P, HRICAK H J R. Radiomics: Images are more than pictures, they are data[J]. Radiology2016, 278: 563-577.
[27] ZOU H, HASTIE T. Regularization and variable selection via the elastic net[J]. J Roy Stat Soc B, 2005, 67(5): 768
[28] WEI Z H, YAN S J, HAN B S, et al. Diagnosis of Alzheimer's disease based on multi-output three-dimensional convolutional neural network[J]. Chinese J Magn Reson, 2021, 38(1): 92-100.
魏志宏, 閆士舉, 韓寶三, 等. 基于多輸出的3D卷積神經(jīng)網(wǎng)絡(luò)診斷阿爾茲海默病[J]. 波譜學(xué)雜志, 2021, 38(1): 92-100.
[29] LIU Y, CHEN J C, HU X Y, et al. Classification and localization of meningioma and acoustic neuroma in cerebellopontine angle based on mask RCNN[J]. Chinese J Magn Reson, 2021, 38(1): 58-68.
劉穎, 陳靜聰, 胡小洋, 等. 基于Mask RCNN的橋小腦角區(qū)腦膜瘤與聽神經(jīng)瘤分類定位研究[J]. 波譜學(xué)雜志, 2021, 38(1): 58-68
[30] TAN Z L, CHEN X C. Study on evaluation index of improved classifier classification performance[J]. Statistics & Information Foroum, 2020, 35(9): 3-8.
譚章祿, 陳孝慈. 改進(jìn)的分類器分類性能評(píng)價(jià)指標(biāo)研究[J]. 統(tǒng)計(jì)與信息論壇, 2020, 35(9): 3-8.
[31] QIN F, YANG B, CHENG Z K. Research on measure criteria in evaluating classification performance[J]. Computer Technology and Development, 2006, 16(10): 85-88.
秦鋒, 楊波, 程澤凱. 分類器性能評(píng)價(jià)標(biāo)準(zhǔn)研究[J]. 計(jì)算機(jī)技術(shù)與發(fā)展, 2006, 16(10): 85-88.
[32] KIM T K, LEE K H, JANG H J, et al. Analysis of gadobenate dimeglumine-enhanced MR findings for characterizing small (1-2-cm) hepatic nodules in patients at high risk for hepatocellular carcinoma[J]. Radiology2011, 259(3): 730-738.
Application of Radiomics Based on New Support Vector Machine in the Classification of Hepatic Nodules
1,2,1,2,1*
1. School of Medical Instrument and Food Engineering, University of Shanghai for Science and Technology, Shanghai 200093, China; 2. Department of Radiology, Eastern Hepatobiliary Hospital, Second Military Medical University, Shanghai 200438, China
Liver cancer is one of the most common malignant tumors. In Asia, liver cancer often develops on a background of cirrhosis caused by chronic hepatitis. The procedure of hepatitis, cirrhotic nodules, dysplastic nodules, and then hepatocellular carcinoma is the most common liver cancer evolutionary process. Judging the stage of hepatic nodules in the evolution process and taking intervention measures are critical for reducing the incidence of liver cancer.In this paper, a more accurate support vector machine (SVM) classification algorithm, LFOA-F-SVM, was proposed for radiomics to classify hepatic nodules from 120 patients into four categories based on dynamic enhanced magnetic resonance images. The algorithm uses radius-margin-based F-SVM, and combines the fruit fly optimization algorithm (FOA) of Levy flight (LF) strategy to optimize the parameters. To verify the effectiveness of the method, five UCI classification data sets (hearts, Parkinson’s disease, iris, wine and zoo) were added and compared with SVM, PSO-SVM, FOA-SVM, F-SVM. The results showed that LFOA-F-SVM has the highest classification accuracy in six data sets compared to the other methods. And in the hepatic nodules data set, the classification precision and recall are relatively high.
hepatic nodules,classification, radiomics, LFOA-F-SVM
O482.53
A
10.11938/cjmr20212916
2021-05-22;
2021-08-20
國(guó)家科技部十三五傳染病重大專項(xiàng)課題(2018ZX10302207-004-005).
* Tel: 021-55271173, E-mail: lijiawangmri@163.com.