李佳 陳亮
摘 要:從神經(jīng)元幾何形態(tài)特征的角度考慮,對神經(jīng)元進(jìn)行分類。由于神經(jīng)元的幾何形態(tài)復(fù)雜多樣,直接用于分類會使得算法運行時間長、分類精度低。采用稀疏主成分分析法提取神經(jīng)元的主要特征,不僅能實現(xiàn)幾何特征的降維,減小分類難度,而且提取出的主成分部分載荷為0,使得主成分更具解釋能力。依據(jù)主要特征,采用極限學(xué)習(xí)機(jī)算法對神經(jīng)元進(jìn)行分類。實驗結(jié)果表明,該分類模型具有較高的運行效率和分類精度,能夠?qū)ι窠?jīng)元實現(xiàn)有效分類。
關(guān)鍵詞:神經(jīng)元;幾何形態(tài)特征;稀疏主成分分析;極限學(xué)習(xí)機(jī)
中圖分類號:TP391 文獻(xiàn)標(biāo)識碼:A DOI:10.15913/j.cnki.kjycx.2017.03.013
神經(jīng)元,又被稱為神經(jīng)原或神經(jīng)細(xì)胞,是構(gòu)成神經(jīng)系統(tǒng)結(jié)構(gòu)和功能的基本單位。神經(jīng)元形態(tài)和功能多種多樣,但在結(jié)構(gòu)上大致可以分成細(xì)胞體和突起兩部分。突起又分軸突和樹突。神經(jīng)元有接受、整合和傳遞信息的功能。一般就長軸突神經(jīng)元而言,樹突和胞體接受從其他神經(jīng)元傳來的信息,并進(jìn)行整合,
然后通過軸突將信息傳遞給另一些神經(jīng)元或效應(yīng)器。大腦是生物體內(nèi)結(jié)構(gòu)和功能最復(fù)雜的組織,其中包含上千億個神經(jīng)元,了解人腦對于當(dāng)前的科學(xué)研究來說是一項巨大的挑戰(zhàn)。傳統(tǒng)的細(xì)胞生物學(xué)相關(guān)的實驗室研究對于解決人腦對復(fù)雜信息的獲取、處理、加工和高級認(rèn)知功能的機(jī)制非常有限。人類腦計劃(Human Brain Project,HBP)致力于開發(fā)現(xiàn)代化的信息工具,為全世界的神經(jīng)信息學(xué)數(shù)據(jù)庫建立共同的標(biāo)準(zhǔn),加速人類對大腦的認(rèn)識。
作為大腦構(gòu)造的基本單位,神經(jīng)元的結(jié)構(gòu)和功能包含很多因素,其中,神經(jīng)元的幾何形態(tài)特征和電學(xué)物理特性是兩個重要方面。電學(xué)特性包含神經(jīng)元不同的電位發(fā)放模式;幾何形態(tài)特征主要包含接受信息的樹突、處理信息的胞體和傳出信息的軸突三部分。鑒于樹突、軸突的生長變化,神經(jīng)元的幾何形態(tài)千變?nèi)f化。電學(xué)特性和空間形態(tài)等多個因素一起綜合體現(xiàn)了神經(jīng)元的信息傳遞功能。要想加深對大腦的研究,應(yīng)先認(rèn)識神經(jīng)元的特性,實現(xiàn)神經(jīng)元的分類。
神經(jīng)元的分類有多種方法,常以神經(jīng)元突起的數(shù)目、功能和所釋放的遞質(zhì)進(jìn)行分類。根據(jù)神經(jīng)元突起的數(shù)目可以分為假單極神經(jīng)元、雙極神經(jīng)元和多極神經(jīng)元;根據(jù)神經(jīng)元的功能,
可將其分為感覺神經(jīng)元、運動神經(jīng)元和中間神元;按照釋放的遞質(zhì)的不同,可將其分為膽堿能神經(jīng)元、胺能神經(jīng)元、氨基酸能神經(jīng)元和肽能神經(jīng)元。
本文基于神經(jīng)元的幾何形態(tài),利用神經(jīng)元的空間幾何特征,通過稀疏主成分分析和極限學(xué)習(xí)機(jī)建立神經(jīng)元的分類模型,提出神經(jīng)元的一個空間形態(tài)分類方法,并將神經(jīng)元根據(jù)幾何形態(tài)進(jìn)行了較為準(zhǔn)確的分類。
1 稀疏主成分分析
神經(jīng)元的形態(tài)復(fù)雜多變,大量的參數(shù)從不同的角度刻畫了
神經(jīng)元的形態(tài)特征。此外,在實際研究中,對象的特征不會直
觀顯示出來,而需要從中提取。為了全面表示對象,在特征提取的過程中,可能盡量選擇比較多的特征變量,以防對象特征的丟失。這就容易出現(xiàn)2種情況:①為了避免遺漏重要信息而選擇盡可能多的特征;②隨著特征的增多增加了問題的復(fù)雜性,同時,造成信息的大量重疊。鑒于此,需要合理處理并提取數(shù)據(jù),在盡可能代替原始變量的所有信息的同時,還要求減少處理后的變量數(shù)。
主成分分析是一種廣泛應(yīng)用于工程學(xué)、生物學(xué)和社會科學(xué)等領(lǐng)域的數(shù)據(jù)處理與統(tǒng)計降維的方法,它可以將原來變量重新組合成一組新的互相無關(guān)的幾個綜合變量。然而,主成分分析存在一些不足之處,由于每一個主成分都是其他原始變量的線性組合,也就是說主成分依賴于所有原始變量,因此,很多時候主成分難以作出解釋。用主成分分析處理某些實際問題時,往往只能給出數(shù)據(jù)的統(tǒng)計、解釋,而很難給出對應(yīng)的實際意義的解釋。
Zou.H提出了一種新的方法——稀疏主成分分析。該方法將主成分的求解問題轉(zhuǎn)化為LASSO(Least absolute shrinkage and selection operator)回歸問題,因此,稀疏主成分的求解就有效轉(zhuǎn)化為線性模型的變量選擇問題。在此基礎(chǔ)上,引入彈性網(wǎng)(E-lasticNet)懲罰結(jié)構(gòu),提出了稀疏主成分分析方法。其計算步驟如下。
3 實驗與分析
本文使用的神經(jīng)元數(shù)據(jù)來自于Neuronmorpho.Org網(wǎng)站。根據(jù)神經(jīng)元的特征描述,選取神經(jīng)元的胞體表面積、干的數(shù)目、分叉的數(shù)目等20個空間幾何特征量,采用稀疏主成分分析法對數(shù)據(jù)進(jìn)行降維處理,研究神經(jīng)元的分類。
表1為神經(jīng)元的20個幾何特征參數(shù)的含義及計算方法。
選取7類神經(jīng)元的空間幾何數(shù)據(jù)記為數(shù)據(jù)集D,共選取98個樣本進(jìn)行實驗。其中,70個樣本為訓(xùn)練集Dtr,28個樣本為測試集Dte,用于訓(xùn)練ELM網(wǎng)絡(luò)。具體實驗步驟如下:①數(shù)據(jù)預(yù)處理,對數(shù)據(jù)集D進(jìn)行標(biāo)準(zhǔn)化處理;②利用稀疏主成分分析對數(shù)據(jù)進(jìn)行降維,提取主要特征;③ELM訓(xùn)練,給定訓(xùn)練樣本集的特征向量xi和類別標(biāo)簽ti,設(shè)置隱層結(jié)點的個數(shù)N0,ELM隨機(jī)產(chǎn)生輸入權(quán)值wi和偏值bi,求解輸出權(quán)值;④ELM測試,輸入未知樣本的特征向量,利用ELM訓(xùn)練時求解得到的輸出權(quán)值矩陣β構(gòu)建分類模型。
表2給出了稀疏主成分的分析結(jié)果,前4個稀疏主成分的累計貢獻(xiàn)率超過70%,因此,神經(jīng)元的20個形態(tài)特征可以用4個主成分來表示。從幾何形態(tài)的意義上分析,4個主成分表征了神經(jīng)元的4個方面,即:①第一主成分SPC1反映了胞體的表面積、寬度、高度、深度、長度、表面積和體積7個特征,表征了神經(jīng)元的空間形態(tài)的幾何輪廓信息;②第二主成分SPC2反映了分叉數(shù)目、分支數(shù)目、分支級數(shù)、破碎程度、非對稱分化5個特征,表征了神經(jīng)元空間形態(tài)的分支分叉的相關(guān)信息;③第三主成分SPC3反映了干的數(shù)目、直徑、羅爾比率、局部分叉角和遠(yuǎn)端分叉角5個特征,表征了神經(jīng)元空間形態(tài)的房室和分叉角度的相關(guān)信息;④第四主成分SPC4反映了歐式距離、路徑距離、壓縮比3個特征,表征了神經(jīng)元空間形態(tài)的伸縮性。
為了驗證提出的神經(jīng)元形態(tài)分類方法的有效性,對比極限學(xué)習(xí)機(jī)、支持向量機(jī)和BP神經(jīng)網(wǎng)絡(luò)的性能,結(jié)果如表3所示。其中,支持向量機(jī)采用libsvm工具箱,BP神經(jīng)網(wǎng)絡(luò)采用MATLAB神經(jīng)網(wǎng)絡(luò)工具箱。由表3可知,極限學(xué)習(xí)機(jī)的分類精度與支持向量機(jī)有微小的差距,但是,訓(xùn)練速度遠(yuǎn)快于支持向量機(jī)和BP神經(jīng)網(wǎng)絡(luò)。支持向量機(jī)和BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練參數(shù)耗時比較長,如果訓(xùn)練樣本較大,則二者的訓(xùn)練會非常緩慢;極限學(xué)習(xí)機(jī)只要給定合適的隱層結(jié)點數(shù)目,就能獲得良好的分類性能,并一次求得全局最優(yōu)解,泛化性能好于BP神經(jīng)網(wǎng)絡(luò)。
4 結(jié)論
從神經(jīng)元的空間幾何形態(tài)出發(fā),利用稀疏主成分分析法對神經(jīng)元的幾何特征進(jìn)行降維,通過原變量的少數(shù)幾個線性組合來解釋原變量的絕大多數(shù)信息,大大減少了分析時變量的維數(shù),增強(qiáng)了主成分的可解釋性,為后續(xù)分類奠定了良好的基礎(chǔ)。在稀疏主成分分析的基礎(chǔ)上,采用ELM算法對神經(jīng)元分類,實驗結(jié)果表明,ELM算法的分類精度比較高,相比于支持向量機(jī)和BP神經(jīng)網(wǎng)絡(luò)的訓(xùn)練速度更快,能夠?qū)ι窠?jīng)元進(jìn)行有效分類。
參考文獻(xiàn)
[1]Shepherd G M,Mirsky J S,Healy M D,et al.The Human Brain Project:neuroinformatics tools for integrating,searching and modeling multidisciplinary neuroscience data.Trends in Neurosciences,1998,21(11):460.
[2]Jiang R,Liu Q,Liu Q,et al.A proposal for the morphological classification and nomenclature of neurons. Neural Regeneration Research,2011,6(25):1925-1930.
[3]Wang T,Liao D.Neuronal morphology classification based on SVM.International Conference on Computer Science and Service System.IEEE,2011:3344-3347.
[4]尚小晶,劉小梅,李成鳳,等.神經(jīng)元的幾何形態(tài)分類[J].吉林大學(xué)學(xué)報(信息科學(xué)版),2011,29(3):237-244.