張培培高仕軍李 東
BP神經(jīng)網(wǎng)絡(luò)在骨髓細胞分類中的應(yīng)用
張培培①*高仕軍①李 東①
人工神經(jīng)網(wǎng)絡(luò)是人工智能的重要分支,模式分類是其主要應(yīng)用之一。設(shè)計一個三層BP神經(jīng)網(wǎng)絡(luò),利用從骨髓細胞圖像提取出來的訓(xùn)練樣本集,對其進行訓(xùn)練,而后進行骨髓細胞的分類,實驗證明,該分類器對紅系細胞和粒系細胞具有很好的分類效果。
人工智能;骨髓細胞圖像;模式分類;BP神經(jīng)網(wǎng)絡(luò)
[First-author's address]North China Coal Medical University, Tangshan 063000, China.
早在上世紀50年代,人工智能[1](Artificial Intelligence, 簡記為AI)的概念就被引入,它研究怎樣讓計算機模仿人腦從事推理、設(shè)計、思考、學(xué)習(xí)等四位活動,以解決和處理較復(fù)雜的問題。作為人工智能的重要技術(shù)之一,人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Networks, 簡記為ANN)[2],是對人腦或自然神經(jīng)網(wǎng)絡(luò)若干基本特性的抽象和模擬,是一種給予連接學(xué)說構(gòu)造的智能仿生模型,是由大量神經(jīng)元組成的非線性動力系統(tǒng)。人工神經(jīng)網(wǎng)絡(luò)具有出色的學(xué)習(xí)能力,模式分類[3]是其重要應(yīng)用之一。針對彩色骨髓細胞圖像,設(shè)計了基于BP神經(jīng)網(wǎng)絡(luò)分類器。實驗證明,該分類器具有很好的分類效果。
BP(Back Propagation)網(wǎng)絡(luò)是1986年由Rumelhart和McCelland為首的科學(xué)家小組提出,是一種按誤差逆?zhèn)鞑ニ惴ㄓ?xùn)練的多層前饋網(wǎng)絡(luò),是目前應(yīng)用最廣泛的神經(jīng)網(wǎng)絡(luò)模型之一[4]。BP網(wǎng)絡(luò)的學(xué)習(xí)規(guī)則是使用最速下降法,通過反向傳播來不斷調(diào)整網(wǎng)絡(luò)的權(quán)值和閾值,使網(wǎng)絡(luò)的誤差平方和最小。BP神經(jīng)網(wǎng)絡(luò)模型拓撲結(jié)構(gòu)包括輸入層(input)、隱層(hide layer)和輸出層(output layer),如圖1所示。
圖1 BP神經(jīng)網(wǎng)絡(luò)拓撲結(jié)構(gòu)
1.1 人工神經(jīng)元
人工神經(jīng)元模型是生物神經(jīng)元的模擬與抽象,其結(jié)構(gòu)如圖2所示,
圖2 人工神經(jīng)元模型
人工神經(jīng)元相當(dāng)于一個多輸入單輸出的非線性閾值器件,這里X1,X2...,Xn表示它的n個輸入;W1,W2...,Wn表述與它相連的n個突出的鏈接強度,其值成為權(quán)值;
成為激活值,表示這個人工神經(jīng)元的輸入總和,對應(yīng)于生物神經(jīng)細胞的膜電位;O表示這個人工神經(jīng)元的輸出;θ表示這個人工神經(jīng)元的閾值。如果輸入信號的加權(quán)和超過θ,則人工神經(jīng)元被激活。這樣,人工神經(jīng)元的輸出可描述為:
式中,f(*)是表示神經(jīng)元輸入-輸出關(guān)系的函數(shù),成為激活函數(shù)。激活函數(shù)有許多類型,其中比較常用激活函數(shù)可歸結(jié)為三種形式:
(1) 閾值函數(shù)
BP中的神經(jīng)元均采用Sigmoid型傳遞函數(shù)。
1.2 BP學(xué)習(xí)過程
BP網(wǎng)的學(xué)習(xí)過程主要由如下四部分組成,分別是輸入模式順傳播、輸出誤差逆?zhèn)鞑ァ⒀h(huán)記憶訓(xùn)練和學(xué)習(xí)結(jié)果判別。
1.2.1 輸入模式順傳播
這一過程主要是利用輸入模式求出它所對應(yīng)的實際輸出。
(1) 確定輸入向量Xk
(k=1,2,…,m; m是學(xué)習(xí)模式對數(shù);n是輸入層單元個數(shù))
(2) 確定期望輸出向量Yk
(q是輸出層單元數(shù))
(3) 計算中間層各神經(jīng)元的激活值Sj
其中Wij是輸入層至中間層的連接權(quán); θj是中間層單元的閾值;p是中間層單元數(shù)。激活函數(shù)采用s型函數(shù),即
這里之所以選s型函數(shù)為BP網(wǎng)神經(jīng)元的激活函數(shù),是因為它是連續(xù)可微分的,而且更接近于生物神經(jīng)元的信號輸出形式。
(4) 計算中間層 j 單元的輸出值
將上面的激活值帶入激活函數(shù)中可得到中間層j單元的輸出為
閾值θj在學(xué)習(xí)過程中與權(quán)值一樣也不斷地被修正。同理,可求得輸出端的激活值和輸出值。
(5)計算輸出層第 t 個單元的激活值Ot
式中,Wjt是中間層至輸出層的權(quán)值;θt是輸出層單元閾值;f是s型激活函數(shù)。
1.2.2 輸出誤差逆?zhèn)鞑?/p>
在第一步的模式順傳播計算中得到了網(wǎng)絡(luò)的實際輸出值,當(dāng)這些實際的輸出值與希望的輸出值不一樣或者誤差大于所限定的數(shù)值時,就要對網(wǎng)絡(luò)進行校正。這里的校正時從后向前進行的,所以叫做誤差逆?zhèn)鞑?,計算時是從輸出層到中間層,再從中間層到輸入層。
(1) 輸出層的校正誤差為
其中,j=1,2,…,p (p是中間層單元數(shù));k=1,2,…,m。
(3) 對于輸出層至中間層連接權(quán)和輸出層閾值的校正量為
1.2.3 循環(huán)記憶訓(xùn)練
為使網(wǎng)絡(luò)的輸出誤差趨向于極小值,對BP網(wǎng)絡(luò)輸入的每一組訓(xùn)練模式,一般要經(jīng)過數(shù)百次甚至上萬次的循環(huán)記憶訓(xùn)練,才能使網(wǎng)絡(luò)記住這一模式。這種循環(huán)記憶訓(xùn)練實際上是反復(fù)重復(fù)上面介紹的輸入模式。1.2.4 學(xué)習(xí)結(jié)果的判別
當(dāng)每次循環(huán)記憶訓(xùn)練結(jié)束后,都要進行學(xué)習(xí)結(jié)構(gòu)的判別。判別的目的主要是檢查輸出誤差是否已經(jīng)道道可以允許的程度。如果此熬到允許的程度,就可以結(jié)束整個學(xué)習(xí)過程,否則還要進行循環(huán)訓(xùn)練。
2.1 網(wǎng)絡(luò)結(jié)構(gòu)
本系統(tǒng)采用三層BP神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu),對骨髓細胞提取了23個特征,對每一特征量經(jīng)過歸一化后,作為神經(jīng)網(wǎng)絡(luò)的輸入,根據(jù)隱含層節(jié)點數(shù)大約是輸入節(jié)點數(shù)的兩倍關(guān)系,確定隱含層取46個節(jié)點,因為輸出種類有13個,輸出為二進制數(shù),所以輸出層取4個節(jié)點,其結(jié)構(gòu)如圖3所示:
圖3 實驗中使用的BP神經(jīng)網(wǎng)絡(luò)的拓撲結(jié)構(gòu)
2.2 初始化
為了使初始權(quán)值對學(xué)習(xí)速度影響最小,采用均勻分布的小數(shù)經(jīng)驗值,本實驗為(-1, 1)之間的隨機數(shù)。
學(xué)習(xí)速率決定每一次循環(huán)訓(xùn)練中所產(chǎn)生權(quán)值變化量??斓膶W(xué)習(xí)速率可能導(dǎo)致系統(tǒng)的不穩(wěn)定,為了保證分類器的穩(wěn)定性,選取較慢的學(xué)習(xí)速率,取rate_w1=0.1, rate_w=0.1, rate_b1=0.01, rate_ b2=0.01。
2.3 輸入數(shù)據(jù)
本系統(tǒng)針對骨髓細胞的特征提取了23個特征量,大的方向主要是三個方面:形狀、顏色和紋理。其中形狀共提取了12個特征量,如表1所示:
表1 選取骨髓細胞特征量
2.4 輸出數(shù)據(jù)
輸出數(shù)據(jù)是四位二進制數(shù),表示13類細胞,如表2所示:
表2 細胞類別對應(yīng)的二進制輸出值
用訓(xùn)練樣本訓(xùn)練神經(jīng)網(wǎng)絡(luò),待網(wǎng)絡(luò)穩(wěn)定后便可進行分類識別。讀入彩色細胞圖像后,經(jīng)過特征計算,對圖像上的細胞類型進行分類,程序運行結(jié)果如圖4所示。
圖4 系統(tǒng)分類結(jié)果
實驗中,隨機抽取出700幅骨髓圖像,共識別出2986個骨髓細胞,正確識別了2787個,誤識別了199個,其各類識別結(jié)果如表3所示:
表3 系統(tǒng)分類結(jié)果
本文將BP神經(jīng)網(wǎng)絡(luò)應(yīng)用到骨髓細胞分類過程中,借助于人工神經(jīng)網(wǎng)絡(luò)強大的學(xué)習(xí)能力,實現(xiàn)了骨髓細胞的分類器,經(jīng)試驗證明,該分類器可以很好地對紅系細胞和粒系細胞進行分類,但是對于淋巴細胞、單核細胞,其分類效果有待提高,這可能與淋巴細胞和單核細胞訓(xùn)練樣本不夠多和不夠典型有關(guān),接下來的工作是要繼續(xù)尋找好的訓(xùn)練樣本,并研究有分類價值的特征量,繼續(xù)訓(xùn)練該分類器,使其能夠很好的對各系細胞進行分類。
[1]唐勇敏,鄭軍婷,于雪梅等. 基于人工智能的HICAI[J].電腦知識與技術(shù).2006,10(29):140-141.
[2]陸偉華.人工神經(jīng)網(wǎng)絡(luò)BP算法在評價網(wǎng)站中的應(yīng)用[J].科技情報開發(fā)與經(jīng)濟. 2007,6(6):176-178.
[3]潘雷,鄧世建,劉榮華. 基于模式分類的大蒜瓣尖分類研究[J]. 農(nóng)機化研究.2010(5):57-60.
[4]秦威,秦書玉.基于BP神經(jīng)網(wǎng)絡(luò)的工程圖形數(shù)據(jù)遠程安全快速傳輸法[J].中國工程科學(xué).2007,9(1):53-56.
Classification of bone marrow cell nuclei with BP neural networks
ZHANG Pei-pei,GAO Shi-jun,LI Dong
Artificial neural network is an important branch of artificial intelligence. Pattern classification is one of its main applications. This paper designed a threelayer BP neural network using the training samples set extracted from the bone marrow cells images. After training, the bone marrow cells were classified. Experimental results show that the classifier is suitable for classification of red blood cell series and granulocytic series.
Artificial neural network; Bone marrow cell image; Pattern classification; BP neural network
1672-8270(2010)07-0062-05
TP 183
B
張培培,女,(1981- ),碩士?,F(xiàn)就職于華北煤炭醫(yī)學(xué)院衛(wèi)生事業(yè)管理系,信息管理與信息系統(tǒng)學(xué)科教研組,助教。研究方向:醫(yī)學(xué)信息處理。
2010-03-14
①華北煤炭醫(yī)學(xué)院衛(wèi)生事業(yè)管理系 河北 唐山 063000
*通訊作者:E-mail: zzpppp112233@126.com
China Medical Equipment,2010,7(7):62-66.