• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于高斯混合模型的結核菌圖像檢測

      2014-04-29 23:21:39王旭鞠穎
      電腦知識與技術 2014年10期
      關鍵詞:結核菌

      王旭 鞠穎

      摘要:結核病是嚴重危害人類健康的一類疾病。通過計算機圖像處理手段進行自動檢測結核菌計數(shù)可以大幅提高醫(yī)生診斷效率。高斯混合模型是單一高斯分布的延伸,是使用多個高斯分布加權來擬合給定的數(shù)據(jù)樣本,通過確定擬合參數(shù)確定每個樣本的分類概率。該文首先通過向量量化算法對圖像預處理,降低所需處理數(shù)據(jù)量,然后從HSV、CIEL*a*b*、YCbCr顏色空間提取特征分量并送入高斯混合模型進行訓練。根據(jù)實驗結果,高斯混合模型比其他無監(jiān)督分類算法(如K-means算法)準確度更高,與有監(jiān)督的分類算法(如樸素貝葉斯分類算法)相比可以簡化訓練樣本的制作,具有一定優(yōu)勢。

      關鍵詞:結核菌;痰涂片;高斯混合模型;最大期望

      中圖分類號:TP18 文獻標識碼:A 文章編號:1009-3044(2014)10-2363-04

      Abstract: Cell recognition plays an important role in medical image-processing. First, we preprocess the images with vector quantization algorithm to reduce the computation. Then we extract different feature channels from HSV, CIEL*a*b* and YCbCr color spaces and put them into a Gaussian mixture model. Gaussian mixture models is a mature method for clustering unknown data. To determine the parameters of GMM, we use expectation maximization algorithm, which uses unlabeled data for model training. The experiment shows GMM finished the initial work of TB detection, while its performance wasnt high enough.

      Key words: Tuberculosis, Sputum Smear, Gaussian Mixture Models, Expectation Maximization

      結核病是嚴重危害人類健康的一類疾病[1]。人為進行結核菌檢測計數(shù)非常耗時且容易出錯,通過計算機圖像處理手段進行自動檢測結核菌計數(shù)可以大幅提高醫(yī)生診斷效率,避免經(jīng)驗因素和人為因素引起的診斷失誤。

      已有的結核菌圖像檢測研究中,大部分采用有監(jiān)督的分類方法,例如貝葉斯分類器[2]。需要人工制作大量的訓練數(shù)據(jù)對分類器進行訓練,需要涵蓋結核菌的各種形態(tài),重疊分叉狀況,顏色變化范圍等,也需要制作偽目標,顏色相近、形態(tài)類似的雜質等[2][3]。分類得到的效果較好,但花費時間較久,制作過程復雜。無監(jiān)督的分類算法如K-means因無法很好的適應圖像特征,分類效果較差。M.G.Forero等人曾使用高斯混合模型對熒光染色的結核菌進行自動分割[4],該文則對使用了齊-尼式鈉氏(Ziehl-Neelsen)抗酸性染色法染色的圖像進行分割。

      1 結核菌痰涂片顯微圖像分析

      本研究采用的痰涂片鏡下圖像經(jīng)齊-尼式鈉氏染色法染色,結核桿菌染成紅色,其他非抗酸性細菌及細胞漿質等呈藍色。其中結核菌桿菌為細條形,形態(tài)上會略有彎曲,分布密集程度視采樣環(huán)境決定。背景組織分布不均,有些部分較為清晰,無顏色物質干擾,其余混雜有組織成分或雜質。由于圖像分辨率、光線、染色程度、等因素,采樣到的痰涂片圖像相差很大。

      本文嘗試采用高斯混合模型進行自動圖像分割。單個高斯分布具有很多良好性質,在許多統(tǒng)計測試中應用廣泛,但僅通過期望和標準差無法代表復雜分布樣本的位置和形狀。高斯混合模型是單一高斯分布的延伸,是使用多個高斯分布加權來擬合給定的數(shù)據(jù)樣本,通過確定擬合參數(shù)確定每個樣本的分類概率。高斯混合模型在圖像上表現(xiàn)為使用多個橢圓來近似任意形狀的密度分布。高斯分布適用于擬合非人為操縱的數(shù)據(jù),比其他無監(jiān)督分類算法(如K-means算法)準確度更高,與有監(jiān)督的分類算法(如樸素貝葉斯分類算法)相比可以簡化訓練樣本的制作,具有一定優(yōu)勢。

      本文算法主要有以下步驟:

      1.1 圖像預處理

      向量量化(Vector-Quantization)是一種將信號離散化的算法,算法將樣本分為若干組,每組中的點相互間距離最[5]。向量量化算法可以簡化圖像并降低高斯混合模型計算量,自動確定高斯混合模型的分類數(shù)目,以便輸入高斯混合模型進行訓練。

      向量量化過程使用K-means算法,算法在數(shù)據(jù)集中選出K個類,每一類選出一個中心點,并且每一個類中的點到該類中心點的距離小于到其他類中心點的距離,即最小化下式

      [J=n=1Nk=1Krnkxn-μk2]

      其中

      [rnk=1, n∈ cluster k0, n? cluster k]

      具體計算時通過迭代法,先固定[μk],求得[rnk]。再固定[rnk],計算[μk]。

      計算過程:

      1) 隨機生成K個中心點。

      2) 將每個點歸類于離它最近的中心點。

      3) 用下式計算新的中心點。

      [μk=nrnkxnnrnk]

      4) 重復2-3步直至J的前后步之差小于閾值或達到最大迭代步數(shù)。

      1.2 提取特征分量

      經(jīng)過實驗,從HSV空間提取Hue分量,從Lab空間提取L、a分量,從YCbCr空間提取Cr分量可以較有效的提取結核桿菌部分(圖2-a、2-b)。算法將使用以上特征分量。

      1.3 使用最大期望算法訓練高斯混合模型

      我們將提取后的色彩分量重新組合并以此對高斯混合模型進行訓練,訓練算法為最大期望算法(Expectation Maximization)。最大期望用于尋找概率模型的參數(shù)最大似然估計,算法分為兩步,第一步計算期望(E步),第二步最大化(M步)。兩個步驟循環(huán)迭代可獲得要求精度下的概率模型。

      1.4 使用高斯混合模型對樣本進行分類

      訓練高斯混合模型需要一定時間,訓練后輸入測試樣本,高斯混合模型將對圖像進行分類,模型數(shù)據(jù)可以保存供以后反復使用。

      2 高斯混合模型與最大期望算法

      2.1 高斯混合模型

      高斯分布具有很多良好性質,在許多統(tǒng)計測試中應用廣泛,但對于單個高斯分布無法擬合的概率分布,我們可以使用多個高斯分布來任意的逼近已知的分布。

      高斯混合模型是K個高斯分布的線性組合,它的概率密度函數(shù)如下:

      [px=k=1K pkpx|k=k=1KπkNx|μk, σk]

      使用高斯混合模型之前需要確定未知的系數(shù)[πk]以及每個高斯分布的參數(shù)[μk],[σk]。

      要求取未知參數(shù),我們通過給定的數(shù)據(jù)點得到概率:

      [i=1Npxi]

      令其等于概率密度函數(shù)并求解使其最大的參數(shù):

      [i=1Npxi=k=1KπkNx|μk, σk]

      在實際計算中我們兩邊取對數(shù)得到對數(shù)似然函數(shù),并求導解方程:

      [i=1Npxi=i=1Nlogk=1KπkNx|μk, σk]

      2.2 最大期望算法

      最大期望算法是一種在統(tǒng)計模型下尋找最大似然估計的迭代算法。迭代步驟中的E步使用當前的參數(shù)估計計算對數(shù)似然函數(shù)期望值,M步則利用上一次迭代的值計算新的模型參數(shù)。具體操作步驟如下:

      1) E步

      估計每個數(shù)據(jù)點屬于第k類的概率,式子中的[πk],[μk],[σk]假定已知,取上一次迭代后的值。

      [γi, k=πkNxi|μk, σkj=1KπjNxi|μj, σj]

      2) M步

      估計每個高斯分布的參數(shù),利用E步求得的[γ(i, k)],容易得到:

      [πk=NkN]

      [μk=1Nki=1Nγi, kxi]

      [σk=1Nki=1Nγi, kxi-μkxi-μkT]

      其中[Nk=i=1Nγi, k]。

      3) 重復迭代1、2步直到似然函數(shù)的兩次計算結果小于給定的閾值,即似然函數(shù)收斂,算法結束。

      3 實驗結果及分析

      分類測試時我們把數(shù)據(jù)分為4組,使用1組對高斯混合模型進行訓練,再全部輸入高斯混合模型進行分類,并與人工分類得到的結果作對比。對分類準確率的評判我們使用以下四個指標:

      1) 是結核菌并被正確分類的目標Positive;

      2) 是結核菌未被正確分類的目標Unrecognized;

      3) 不是結核菌被誤分類的目標False;

      4) 分類器的靈敏度可用下式表示:

      4 結論

      本文提出了一種基于高斯混合模型的結核菌痰涂片圖像分類算法,用于提取痰涂片圖像中的結合軍目標。算法首先使用向量量化算法對圖像進行預處理,降低了運算量并自動獲取分類數(shù),然后分析并提取了HSV、Lab、YCbCr顏色空間下具有較高識別性的圖像特征,最終算法以H、L、a、Cr通道作為特征輸入高斯混合模型,最后使用樣本數(shù)據(jù)訓練高斯混合模型并測試,實驗結果如圖3所示。通過對準確率的考察,高斯混合模型能夠完成結核菌圖像的大部分分類工作,準確率在K-means與監(jiān)督分類算法之間,保持了較好的性能和易用性。

      參考文獻:

      [1] Global Tuberculosis Control: WHO Report 2010[M]. World Health Organization,2010.

      [2] 翟永平,周東翔,劉云輝. 基于顏色及梯度統(tǒng)計特征的結核桿菌目標識別[J].國防科技大學學報,2012,34(5).

      [3] KHUTLANG R, KRISHNAN S, DENDERE R等人. Classification of Mycobacterium tuberculosis in Images of ZN-Stained Sputum Smears[J]. IEEE Transactions on Information Technology in Biomedicine, 2010,14(4):949-957.

      [4] FORERO M G, CRIST?BAL G, M. DESCO. Automatic identification of Mycobacterium tuberculosis by Gaussian mixture models[J]. Journal of Microscopy,2006,223(2):120-132.

      [5] Vector quantization[J]. Wikipedia, the free encyclopedia,2014.

      猜你喜歡
      結核菌
      PCR-反向點雜交法耐藥基因檢測和BD960結核菌藥敏在耐藥結核病檢測中的應用價值
      牛副結核病的發(fā)病過程及診斷方法
      飼料博覽(2020年3期)2020-12-30 12:05:51
      艾滋病病毒結核菌雙重感染預防控制策略
      結核菌Xpertrpob基因利福平耐藥快速檢測的臨床價值
      健康大視野(2020年3期)2020-02-24 07:14:33
      痰液性狀和保存條件對結核菌培養(yǎng)陽性率的影響
      重新認識結核病
      大眾健康(2018年3期)2018-01-29 01:53:32
      結核菌培養(yǎng)方法對照與效果研究
      今日健康(2016年5期)2017-01-23 06:50:10
      12例隱球菌腦膜炎患者的臨床誤診分析
      gp10基因的原核表達及其聯(lián)合異煙肼的體外抗結核菌活性
      肺結核合并糖尿病68例臨床治療分析
      宁安市| 鄂托克前旗| 高碑店市| 龙川县| 松桃| 娱乐| 西城区| 晋江市| 驻马店市| 嘉义县| 建平县| 无为县| 吉安市| 古丈县| 巴林右旗| 怀安县| 汉源县| 望城县| 灌阳县| 瓦房店市| 张家界市| 新田县| 东方市| 大同县| 清涧县| 通州市| 广东省| 开江县| 万荣县| 四会市| 翁牛特旗| 灵璧县| 慈利县| 读书| 长武县| 平利县| 上高县| 榆社县| 漠河县| 鄂州市| 奉贤区|