李 昕,岳 文,褚治廣
基于圖像特征分析的大數(shù)據(jù)醫(yī)療——肝癌影像AI診斷
李 昕1,岳 文2,褚治廣1
(1.遼寧工業(yè)大學(xué) 工程訓(xùn)練中心,遼寧 錦州 121001;2.遼寧工業(yè)大學(xué) 電子與信息工程學(xué)院,遼寧 錦州 121001)
通過搜集包括健康志愿者和患者的病灶區(qū)的物理信息,對(duì)其進(jìn)行大數(shù)據(jù)分析。利用虛擬MRI技術(shù)對(duì)樣本進(jìn)行數(shù)據(jù)的采集和成像,對(duì)于不同的序列和參數(shù)可生成大量的磁共振圖像,對(duì)樣本不同參數(shù)的參考可以極大地增廣訓(xùn)練樣本,利用漢寧窗等對(duì)診斷返回的聲音信號(hào)進(jìn)行處理,可得到具有參考價(jià)值的病灶特征。實(shí)驗(yàn)表明,該技術(shù)可以提前對(duì)潛在的危險(xiǎn)信號(hào)進(jìn)行反映,判斷患者腫瘤的良惡性,以幫助醫(yī)生更加高效地對(duì)肝癌患者進(jìn)行篩查并且可以應(yīng)對(duì)將會(huì)發(fā)生的風(fēng)險(xiǎn)。
原發(fā)性肝癌;人工智能;MRI技術(shù);CT影像
在經(jīng)濟(jì)快速發(fā)展的繽紛生活下,現(xiàn)代生活給人們帶來方便快捷的生活方式,但不健康的生活方式和食品給人體健康帶來威脅。擔(dān)當(dāng)身體的排毒器官的肝臟首當(dāng)其沖,吸煙酗酒、熬夜以及處于壓力環(huán)境下對(duì)肝臟損害尤為嚴(yán)重,近年來,肝病的發(fā)病開始呈現(xiàn)年輕化[1-2]。
人工智能方法在醫(yī)學(xué)處理方面的應(yīng)用正在逐漸推廣,早期學(xué)者將人工智能方法應(yīng)用到肝臟醫(yī)療圖像的檢測中,但方法仍存在著一些不足,例如訓(xùn)練和測試的運(yùn)算量過大;并且因?yàn)閿?shù)據(jù)集不足,對(duì)于變異度較大的肝臟模型無法適用;此外,為了解決圖像邊界模糊的問題,雖然之前有學(xué)者[3]提出半自動(dòng)分割法,但是,該方法仍然需要預(yù)先構(gòu)建和后期的人工調(diào)整,消耗資源較多,本文的研究旨在對(duì)其做出改善。
為了更加準(zhǔn)確地獲取信息,實(shí)驗(yàn)采取的工作思路是先獲得數(shù)據(jù),因此要分別收集正常人和肝病患者的肝部的物理信息,并對(duì)容易患病的病灶區(qū)域重點(diǎn)觀察,之后利用虛擬磁共振成像技術(shù)對(duì)正常人或者患者的病灶信息完成數(shù)據(jù)的采集和成像,若是過程中采用不同的成像序列以及參數(shù),即可輸出大量的磁共振圖像[4]。因?yàn)檫@些圖像的各類屬性例如分辨率和信噪比,以及權(quán)重和值等的不同,可以對(duì)訓(xùn)練樣本的種類和數(shù)量進(jìn)行增廣[5]。實(shí)現(xiàn)過程如圖1所示。
圖1 人工智能病灶識(shí)別的基本流程
針對(duì)之前研究結(jié)果的分析,為了使聲音信號(hào)處理具有更好的實(shí)際效果,并且從多方面的角度進(jìn)行考慮,結(jié)論是使用漢寧窗[6]可使效果達(dá)到最佳,因此利用漢寧窗對(duì)收集到的觀察區(qū)信號(hào)進(jìn)行處理[5]。定義的公式如式(1):
第二步:對(duì)實(shí)驗(yàn)數(shù)據(jù)做必要的記錄。
并且計(jì)算:
實(shí)驗(yàn)依靠的虛擬掃描技術(shù)可依據(jù)經(jīng)典二維快速傅立葉變換成像的原理,對(duì)病患和正常人的觀察區(qū)域的聲音信號(hào)進(jìn)行采集,然后對(duì)磁共振信號(hào)進(jìn)行K空間填充,以傅立葉變換作為橋梁得到MRI圖像,再根據(jù)二維轉(zhuǎn)換,得到一個(gè)四重積分?jǐn)?shù)據(jù)[6]:
式(3)中,符號(hào)表示的是編碼步數(shù),符號(hào)表示編碼的采樣點(diǎn)數(shù)目;符號(hào)和符號(hào)表示空間參數(shù)的積分項(xiàng),其中符號(hào)表示的是與頻率方向一致的橫軸樣本信息,而表示的是與編碼方向一致的縱軸樣本信息;符號(hào)和表示時(shí)間的積分項(xiàng),其中表示頻率的時(shí)間,符號(hào)表示的是相位的時(shí)間;0表示觀察區(qū)的磁化情況的矢量大小。最終若實(shí)現(xiàn)圖像的重建,則只需要對(duì)式(3)中的進(jìn)行變換即可。但是在實(shí)際的醫(yī)用應(yīng)用時(shí)會(huì)探查到很多受參數(shù)影響的不同信噪比的圖像,因此為了獲取有不同信噪比,并且可以區(qū)分的圖像樣本,需要在式(3)的信號(hào)上疊加程度不相同的噪聲。
若要控制采集的序列互不相同,則需要將式(3)中的0項(xiàng)進(jìn)行修改來實(shí)現(xiàn)。
(1)SE序列,即通常所說的自旋回波[7],0的值為:
式(4)中,符號(hào)表示的實(shí)際含義是樣本質(zhì)子的密度,與初始數(shù)據(jù)的Pd信息對(duì)應(yīng);符號(hào)代表的意義是觀察規(guī)定的放大倍數(shù)。
(2)GRE序列,即梯度回波序列[7],這一序列類型的0有2類,分別是去除剩余磁化的及利用剩余磁化的,公式的表達(dá)分別為:
(3)IR序列,即反差恢復(fù)序列[7],其0為:
各序列的參數(shù)不同,若對(duì)某種序列進(jìn)一步完善以發(fā)揮最大準(zhǔn)確率,則可以通過進(jìn)一步增廣數(shù)據(jù)集或者更改信號(hào)的幅度規(guī)律實(shí)現(xiàn)。在下面的實(shí)驗(yàn)和研究中,可以將非患者的肝部分割為灰質(zhì)、白質(zhì)2種組織類型,然后對(duì)于這2種不同的組織分別進(jìn)行賦典型值作為測試的初始信息,所得的結(jié)果信息能夠適應(yīng)性地拓展到三維像素水平模板和一些細(xì)分組織,以及全身其他部位的掃描數(shù)據(jù)輸入。另外軟件的主要功能是可以獲取初始樣本觀察區(qū)域的不同物理信息的數(shù)據(jù)。在開始之前可以依據(jù)實(shí)驗(yàn)需求,挑選二維或者三維2種模式,也可以更改程度不同的噪聲條件,還有各種不同的掃描序列和各項(xiàng)參數(shù)的組合。例如T1WI_SE300/30_1 mmT,表示采用SE序列、=300 ms、=30 ms、1 mm厚度的橫截面的T1權(quán)重圖像。當(dāng)觀察二維樣本時(shí),可以根據(jù)需求選擇對(duì)應(yīng)模式,選擇不同截面和不同的觀察區(qū)的實(shí)驗(yàn)對(duì)照所需要的可調(diào)節(jié)的傾斜角度。當(dāng)實(shí)際應(yīng)用時(shí),可對(duì)各類參數(shù)進(jìn)行選擇和設(shè)置,包括但不限于序列和結(jié)構(gòu)參數(shù),之后點(diǎn)擊掃描即可顯示所要查找的樣本圖像。除此之外,還可以對(duì)得到的圖像進(jìn)行一些便捷的處理,例如,圖片組織的距離測量、圖片的局部縮放、圖片的平移和旋轉(zhuǎn),還有直方圖的展示與均衡、顏色負(fù)片調(diào)節(jié)、電影瀏覽模式以及必要的標(biāo)注功能。處理完畢后,圖片的保存也是可選的,可依據(jù)菜單選項(xiàng)在不同的模式下(包括2D和3D)選擇不同格式的圖片保存,選擇的方式是區(qū)別NII和DICOM,然后經(jīng)過專業(yè)醫(yī)生的層次處理,點(diǎn)擊保存勾畫痕跡即可保存,存入數(shù)據(jù)集,根據(jù)搭建的模型框架參與訓(xùn)練。
HOG即為方向梯度直方圖,可以用來表示圖像的物體特征,因此能夠?qū)@類物體進(jìn)行檢測識(shí)別[5]。首先對(duì)輸入的圖片進(jìn)行預(yù)處理,然后計(jì)算像素點(diǎn)的梯度值,形成梯度直方圖,對(duì)模塊歸一化后放到SVM中進(jìn)行監(jiān)督學(xué)習(xí)。
HOG特征提取方法就是將一個(gè)要檢測的目標(biāo)或者掃描窗口進(jìn)行下列操作。
(1)圖片灰度處理。
(2)對(duì)進(jìn)行灰度化處理的數(shù)值進(jìn)行歸一化,便于下一步操作,其中可執(zhí)行的包括去除噪點(diǎn)以及對(duì)比度的調(diào)整,局部的加深和增亮。
(3)計(jì)算圖像各個(gè)像素點(diǎn)的梯度值,方便進(jìn)行邊界處理,識(shí)別邊框,并且減少光照的影響。
(4)根據(jù)實(shí)際情況將圖像分為易于處理的多個(gè)較小的模塊。
(5)統(tǒng)計(jì)每個(gè)cell模塊的梯度直方圖,便可得到每個(gè)模塊的描述符。
(6)把小模塊幾個(gè)分組組成1個(gè)大模塊,1個(gè)大模塊內(nèi)的所有小模塊特征的描述符聯(lián)系起來,即可得到這個(gè)大模塊的特征描述符。
(7)將整個(gè)圖像內(nèi)組成的大模塊的HOG特征描述符聯(lián)系起來,可以得到該圖像整體的HOG特征描述符,整體的過程是一個(gè)從宏觀分成微觀,再反饋回宏觀的過程。
實(shí)驗(yàn)后最終的軟件可以基于磁共振成像返回的圖像,經(jīng)過修改勾畫和標(biāo)注后傳送作為訓(xùn)練集樣本。并且根據(jù)應(yīng)用中對(duì)不同情況的靈活選擇(例如對(duì)不同序列和參數(shù),以及成像模式)可以得到不同類型、不同權(quán)重和不同截面所對(duì)應(yīng)的MRI圖像,例如STIR、T2WI、DWI和T1WI等。圖2和圖3分別為正常人的肝部組織和癌變肝部組織,在同一斷面是呈現(xiàn)的物理STIR圖像。
圖2 正常肝部組織圖像
圖3 癌變的肝部組織圖像
對(duì)于不同肝臟疾病分類的情況如圖4~圖7。
圖4 正常肝臟圖像
圖5 脂肪肝肝臟圖像
圖6 肝硬化肝臟圖像
圖7 肝癌肝臟圖像
此外本程序也可應(yīng)用在其他的醫(yī)學(xué)領(lǐng)域,例如腦科、肺部等。根據(jù)操作者的選擇和設(shè)置,不同情況下,即選擇不同的序列參數(shù)時(shí),相同的模型即便利用同樣的序列也能夠得到對(duì)比度不斷變化的觀察過程圖像。這類訓(xùn)練所帶來的智能化的效果可以增加不同設(shè)備互通的容錯(cuò)率,還可以彌補(bǔ)不同醫(yī)生的操作習(xí)慣所產(chǎn)生的圖像的差異。圖8(a)是正常人腦SE序列的圖像隨參數(shù)變化(為10 ms,20 ~8 000 ms),從T1WI到PDWI逐漸變化產(chǎn)生的短時(shí)內(nèi)回歸效果圖;圖8(b)是無病變大腦的SE序列圖像隨參數(shù)變化(為145 ms,從300 ms到10 500 ms)的T2WI變化效果圖;圖8(c)為正常人腦SE序列圖像隨參數(shù)變化(=100、200 ms,=5~145 ms)的圖像效果變化圖;圖8(d)為正常人腦IR序列圖像隨參數(shù)變化(為500 ms,為30 ms,TI 10~2 000 ms)的變化效果圖;圖8(e)為正常人腦SE序列的水成像效果圖。
為準(zhǔn)確獲取病灶信息,采用虛擬MRI技術(shù)對(duì)樣本數(shù)據(jù)進(jìn)行采集和成像,給出了基于奇異值分解的特征提取算法。利用HOG特征提取算法,可有效地檢測識(shí)別病灶特征。通過磁共振成像掃描平臺(tái)上實(shí)驗(yàn)表明,該技術(shù)有助于判斷患者腫瘤的良惡性。因此基于圖像特征的AI肝癌診斷系統(tǒng),可以在診斷時(shí)利用龐大的數(shù)據(jù)總結(jié)并識(shí)別出病患的特征,從而幫助醫(yī)生提高診斷的準(zhǔn)確度。
[1] 呂桂帥, 陳磊, 王紅陽. 我國肝癌研究的現(xiàn)狀與前景[J]. 生命科學(xué), 2015, 27(3): 237-248.
[2] 吳巨海, 商雪林, 瞿炳剛. 低場磁共振對(duì)小肝癌和肝小血管瘤的診斷價(jià)值[J]. 中國醫(yī)師進(jìn)修雜志, 2006(35): 51, 61.
[3] Chartrand G, Cresson T, Chav R, et al. Liver segmentation on CT and MR using laplacian mesh optimization[J]. IEEE Trans Biomed Eng, 2017, 64(9): 2110-2121.
[4] 王鳳霞. 原發(fā)性肝癌的外科治療新進(jìn)展[J]. 中國社區(qū)醫(yī)師: 醫(yī)學(xué)專業(yè)半月刊, 2009, 11(4): 9.
[5] Duncan J S, Ayache N. Medical image analysis: Process over two decades and the challenges ahead[J]. IEEE Trans PAMI, 2000, 22(1): 85-106.
[6] 楊文德, 譚世奇, 黃向明, 等. CT、MRI及超聲對(duì)肝癌診斷的對(duì)比研究[J]. 臨床消化病雜志, 2005(5): 24-25.
[7] 張家崗, 李達(dá)平, 楊曉東, 等. 基于深度卷積特征光流的形變醫(yī)學(xué)圖像配準(zhǔn)算法[J]. 計(jì)算機(jī)應(yīng)用, 2020, 40(6): 1799-1805.
Big Data Medical Treatment Based on Image Feature Analysis: Image AI Diagnosis of Liver Cancer
LI Xin1, YUE Wen2, CHU Zhi-guang1
(1.Engineering Training Center, Liaoning University of Technology, Jinzhou 121001, China;1.School of Electronics and Information Engineering, Liaoning University of Technology, Jinzhou 121001, China)
With the continuous improvement of living standards, people’s lives begin to become more diversified. But there are many health problems hidden in the beauty. For example, up to 2018, there are about 422000 deaths of primary liver cancer in China every year. The occurrence of this disease is related to drinking, viral hepatitis, food and drinking water, poisons and parasites, genetic factors and so on. There are often no obvious symptoms in the early stage, but once it develops to the late stage, it is in danger. So early diagnosis and treatment are the most effective methods. By collecting healthy volunteers and patients’ physical information of the lesion area, the big data analysis was carried out. The virtual MRI technology is used to collect and image the data of the samples. For different sequences and parameters, a large number of MRI images can be generated. The reference of different parameters of the samples can greatly enlarge the training samples. Then the Hanning window is used to process the sound signal returning from the diagnosis, and the lesion features with reference value can be obtained. Experiments show that the technology can respond to the potential danger signals in advance, judge the benign and malignant tumor of patients, so as to help doctors screen liver cancer patients more efficiently and deal with the risk that will occur.
primary liver cancer; artificial intelligence; MRI technology; CT image
10.15916/j.issn1674-3261.2021.06.009
TP311
A
1674-3261(2021)06-0392-04
2020-09-04
李昕(1966-),男(滿族),遼寧錦州人,教授,博士。
責(zé)任編輯:孫 林