鐘彩
摘要人體細(xì)胞直接關(guān)系到身體各項(xiàng)指標(biāo)的性能,在圖像特征的研究過程中,顯微細(xì)胞圖像數(shù)據(jù)非常復(fù)雜,這些數(shù)據(jù)對(duì)下一步的研究將會(huì)受到很大的影響。為了提高圖像的識(shí)別效果,文章以尿液中紅細(xì)胞圖像分析研究為例,采用LDA算法,對(duì)細(xì)胞圖像的主要特征進(jìn)行變換,提取數(shù)據(jù)的主要特征,以達(dá)到提取圖像特征的目的。
關(guān)鍵詞LDA算法;圖像分析;特征識(shí)別
中圖分類號(hào):TP391 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1671-7597(2014)12-0067-01
Study of LDA algorithm in image feature extraction
Zhong Cai
(Changde Vocational Technical College Hunan ChangDe 415000)
Abstract: The cells of the body is directly related to the performance indexes of the body,In the process of the image feature;Microscopic cell image data is very complex;These data have great influence on the study will be the next step. In order to improve the recognition effect, In this paper, red blood cells in the urine image analysis as an example, Using LDA algorithm; The main feature of the cell image transform, Feature extraction of data;In order to achieve the purpose of image feature extraction.
Key words: LDA algorithm; Image analysis; Feature recognition
尿液中的紅細(xì)胞經(jīng)過分割后,我們可以確定一個(gè)圓,但這類圓的形狀、大小都是不規(guī)則的,其中還有一些雜質(zhì),我們將這些特征統(tǒng)稱為非紅細(xì)胞。細(xì)胞特征研究是辨別紅細(xì)胞和非紅細(xì)胞研究最重要的理論參考依據(jù),而其中的特征提取是目前研究中最主要的課題之一。
1LDA算法原理
線性判別式分析是模式識(shí)別和人工智能領(lǐng)域中應(yīng)用最為廣泛而且是最為經(jīng)典的算法之一。通過將高維的模式樣本利用一定的技術(shù)手段投影到相關(guān)的最佳鑒別矢量空間,通過一系列分析之后抽取相關(guān)的分類信息以及壓縮特征空間維數(shù)的相關(guān)數(shù)據(jù),從而計(jì)算出樣本的max類間距和min類間距,作為空間有效分離性的基本數(shù)據(jù)。線性判別式分析是LDA算法的理論基礎(chǔ),從建立起到現(xiàn)在已經(jīng)成為L(zhǎng)DA最主要的算法之一。
樣本類內(nèi)離散度矩陣可以定義為:
可以定義為:
,
其中,是先驗(yàn)概率,是類的均值。樣本的類間離散度矩陣可定義為
是所有樣本的均值。由上面公式可以推導(dǎo)出,如果是非異性矩陣的話,投影效果可以得出,各類樣本的效果與分散度以及類內(nèi)離散度有著相當(dāng)大的關(guān)系,通常離散度越大,投影效果越明顯;類內(nèi)離散度越小,投影效果越理想??偠灾绻胍@得最優(yōu)的投影方向,可以讓樣本之間的“類離散度矩陣/樣本類內(nèi)樣本類內(nèi)離散度矩陣的行列式”比值最大,得出其中的正交特征向量,以便達(dá)到理想的投影效果。
具體可以定義Fisher準(zhǔn)則函數(shù)如下:
求出,取最大值時(shí)對(duì)應(yīng)的特征向量,通過數(shù)學(xué)變換可以得出,滿足如下等式的解:,,由公式可以看出是由之間的較大特征值所決定的。
如果非奇異,就是求的本征值問題,其中該矩陣最多有非零特征值,是類別數(shù)目。但是在LDA成像具體操作過程中,有時(shí)也會(huì)出現(xiàn)一些偏差,其中最主要的是樣本內(nèi)一般情況下呈現(xiàn)為奇異性的狀態(tài)。這是因由細(xì)胞圖像特出的數(shù)據(jù)是高維數(shù)據(jù),這些數(shù)據(jù)本身的維數(shù)就明顯大于樣本數(shù),因此,,理論上呈現(xiàn)的是不可逆的狀態(tài)。這就使得即廣義特征值在求值過程中會(huì)出現(xiàn)一些問題,即小樣本的問題。對(duì)于此類的問題,我們首先要對(duì)高維數(shù)據(jù)進(jìn)行充分分析,然后根據(jù)具體情況研究分析,的特性空間,再次就是轉(zhuǎn)換角度,讓LDA對(duì)圖像分析進(jìn)行降維處理,從而使得呈現(xiàn)為可逆狀態(tài)。
通過LDA算法一些測(cè)算,可以有效地將特征子空間進(jìn)行融合,從而獲取融合后的特征空間。其次將訓(xùn)練樣本以及測(cè)試樣本在此空間進(jìn)行投影,將識(shí)別特征進(jìn)行記錄。將識(shí)別樣本和訓(xùn)練樣本進(jìn)行規(guī)范化處理,然后對(duì)其向特征子空間進(jìn)行投影,獲得一組投影向量,(A為以前規(guī)范化的樣本)。通過公式帶入可以得出一組投影向量。通過對(duì)一組投影向量進(jìn)行分析和整理,列出維的列向量,即每個(gè)投影向量。然后將這組投影向量組成一個(gè)矩陣如下:,式中,為大小的矩陣,該矩陣稱為細(xì)胞圖像樣本的特征矩陣,此矩陣即為所要提取的細(xì)胞樣本的特征。
2實(shí)驗(yàn)結(jié)果
本文通過對(duì)LDA算法的實(shí)驗(yàn)研究,能有效地將尿液中紅細(xì)胞高維圖像降低為低維圖像,生成低維細(xì)胞空間,這樣有利于圖像特征的提取,從而達(dá)到研究的目的。但在研究過程中,我們發(fā)現(xiàn)LDA算法還是存在某些局限性,如對(duì)那些形體不規(guī)則的細(xì)胞不能很好的提取特征,在以后的研究中,我們還將進(jìn)一步完善該算法,繼續(xù)挖掘紅細(xì)胞的新特征,爭(zhēng)取達(dá)到更好的實(shí)驗(yàn)效果。同時(shí),在人體尿沉渣中,存在更小的紅細(xì)胞與小結(jié)晶,有形成分中目標(biāo)比較復(fù)雜、類型較多,即使同一類細(xì)胞在形態(tài)及紋理上都有不同的特征,還有其它成分尚未進(jìn)行識(shí)別,而且有些成分與已識(shí)別的成分非常相近,很容易造成誤識(shí),這些都是我們應(yīng)該做更深入的研究。本文實(shí)驗(yàn)結(jié)果是在windows XP/Matlab7.0.1環(huán)境下運(yùn)行得到。
通過以上研究可以得知,LDA算法對(duì)于人體細(xì)胞圖像特征中的應(yīng)用有十分重要的作用,對(duì)于人類細(xì)胞的研究方法提供了更加清晰地解析。同時(shí)LDA算法對(duì)于人類醫(yī)學(xué)研究方面提供了豐富的數(shù)據(jù)參考。盡管這種算法還有待完善,但我們相信,隨著技術(shù)的改進(jìn)和算法的完善,LDA算法對(duì)于細(xì)胞成像的相互之間的轉(zhuǎn)化以及特征研究必將發(fā)揮它關(guān)鍵性的作用。
參考文獻(xiàn)
[1]雷松澤.基于k-means聚類的快速LDA算法在語(yǔ)音識(shí)別上的應(yīng)用[J].科技通報(bào),2013.
[2]許伯熹,胡寧,陳文斌,等.LDA算法在Mahout下的高效實(shí)現(xiàn) [J].華東師范大學(xué)學(xué)報(bào),2013.
[3]黃軒宇.基于KL投影LDA人臉識(shí)別及正交辨識(shí)分析[A].江蘇省通信學(xué)會(huì)論文集[C].南京:2004.
[4]雷赟,龔葵花.基于線性矩和小波變換的醫(yī)學(xué)圖像特征提取[J].科技信息,2010(03).
[5]韓爭(zhēng)勝,李映,張艷寧.基于LDA算法的人臉識(shí)別方法的比較研究[J].微電子學(xué)與計(jì)算機(jī),2005(07).
endprint