王紅歡+陳芝薇+吳真斌
摘要:大數據環(huán)境下的腦腫瘤圖像的特征提取,根據不同的特征提取技術生成不同的特征向量將這些特征向量獨立的保存在特征數據庫中,通過計算機的輔助診斷,能夠快速準確地判斷出醫(yī)學圖像某些部位的正常與異常。
關鍵詞:大數據環(huán)境;特征提??;顏色;紋理;形狀
中圖分類號:TP391 文獻標識碼:A 文章編號:1009-3044(2017)14-0167-02
1背景
腦腫瘤的發(fā)病率逐年上升。腦腫瘤在20-50歲間最為常見。各項數據表明,腦腫瘤死亡率較高,進行研究治療迫在眉睫。但醫(yī)療行業(yè)遇到了海量數據和非結構化數據的挑戰(zhàn),因而很多國家都在積極推進醫(yī)療大數據化發(fā)展。大數據的意義在于,對大體量、高復雜數據、影像的挖掘和運用,讓個性化、精準化的醫(yī)療服務成為可能。
2項目研究
2.1大數據收集及數據預處理
大數據的收集意義在于對大體量、高復雜數據、影像的挖掘和運用,讓個性化、精準化的醫(yī)療服務。大數據不依賴于隨機取樣,樣本等于總體。目前我們收集到300多組數據,主要包含3類腫瘤圖像:膠質瘤、腦膜瘤、垂體瘤。數據集包含來自患者的切片。
醫(yī)學圖像常常存在很多問題,例如非均勻性,不一致性,噪聲大,缺少結構等等。所以要對數據進行預處理。數據預處理就是通過計算機輔助進行各種加工。處理手段有利用局部和卷積算子以及像素運算等技術對圖像去噪與增強等等。我們小組前期通過opencv3.2+vs做了算法比較。也使用醫(yī)學影像處理軟件MIPAV對收集到的圖像進行去殼以及灰度均衡化的預處理工作以及統(tǒng)一了所有數據的格式。圖1顯示了MIPAV軟件對腦腫瘤圖像的恢復結果。
2.2特征提取
在對醫(yī)學影像分析,特征提取便是第一步。根據不同的特征提取技術生成不同的特征向量將這些特征向量獨立的保存在特征數據庫中。圖像的特征提取就是把不重要的特征過濾,逐步提取重要的特征。我們通過圖像的顏色、形狀、紋理分類多尺度提取圖像特征。
2.2.1顏色特征
顏色特征是基于像素點的特征,顏色對圖像或圖像區(qū)域的方向、大小等變化不敏感,所以顏色特征不能很好地捕捉圖像中對象的局部特征。我們主要使用顏色直方圖,使用RGB和HSV顏色空間。使用kmeans聚類。
2.2.2形狀特征
形狀特征有兩類表示方法,一類是輪廓特征,另一類是區(qū)域特征。我們使用改進的傅立葉形狀描述符。