• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于SOM神經(jīng)網(wǎng)絡(luò)的半監(jiān)督分類算法

      2015-07-18 11:21:23
      關(guān)鍵詞:權(quán)值分類器聚類

      趙 建 華

      (1. 西北工業(yè)大學(xué)計算機(jī)學(xué)院,陜西 西安 710072; 2. 商洛學(xué)院數(shù)學(xué)與計算機(jī)應(yīng)用學(xué)院,陜西 商洛 726000)

      ·計算機(jī)軟件理論、技術(shù)與應(yīng)用·

      基于SOM神經(jīng)網(wǎng)絡(luò)的半監(jiān)督分類算法

      趙 建 華1,2

      (1. 西北工業(yè)大學(xué)計算機(jī)學(xué)院,陜西 西安 710072; 2. 商洛學(xué)院數(shù)學(xué)與計算機(jī)應(yīng)用學(xué)院,陜西 商洛 726000)

      為提高半監(jiān)督分類的性能,提出一種基于SOM神經(jīng)網(wǎng)絡(luò)的半監(jiān)督分類算法SSC-SOM。結(jié)合SOM的聚類特性,基于先聚類后標(biāo)記的思想,充分利用有標(biāo)記樣本和未標(biāo)記樣本訓(xùn)練SOM分類器;將聚類的形成和有標(biāo)記樣本分配到各個聚類中同時進(jìn)行,并根據(jù)有標(biāo)記樣本計算各個聚類的聚類中心;在整個未標(biāo)記樣本的范圍內(nèi),根據(jù)聚類中心,使用K近鄰算法對未標(biāo)記樣本進(jìn)行標(biāo)記,挖掘未標(biāo)記樣本的隱含信息。在UCI數(shù)據(jù)集中進(jìn)行分類實驗,其結(jié)果表明,SSC-SOM的分類率比SSOM提高2.22 %,且收斂性較好。

      半監(jiān)督學(xué)習(xí);自組織特征映射神經(jīng)網(wǎng)絡(luò);分類;聚類

      0 引言

      半監(jiān)督學(xué)習(xí)是一種結(jié)合有監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí)的學(xué)習(xí)方法,綜合利用少量有標(biāo)記樣本和大量的未標(biāo)記樣本來提高學(xué)習(xí)性能,是一個非常熱門的研究方向[1]。半監(jiān)督分類[2-3]利用大量未標(biāo)記數(shù)據(jù)擴(kuò)大分類算法的訓(xùn)練集,主要研究從有監(jiān)督學(xué)習(xí)的角度出發(fā), 當(dāng)已標(biāo)記訓(xùn)練樣本不足時, 如何自動地利用大量未標(biāo)記樣本信息輔助分類器的訓(xùn)練。

      將自組織神經(jīng)網(wǎng)絡(luò)(self-organizing feature maps,SOM)引入到半監(jiān)督學(xué)習(xí)領(lǐng)域,設(shè)計基于SOM的半監(jiān)督學(xué)習(xí)算法,是目前學(xué)者涉入較少的一個課題。孫雁飛等[4]提出一種基于半監(jiān)督學(xué)習(xí)的GA-SOM聚類方法,該方法用半監(jiān)督學(xué)習(xí)進(jìn)行樣本的初始化,利用SOM作為訓(xùn)練器對無標(biāo)簽樣本進(jìn)行聚類,并申請了專利。在該專利中,SOM僅僅用于處理半監(jiān)督學(xué)習(xí)初始化后的數(shù)據(jù)。Shen Furao 等[5]提出一種基于自組織增量型神經(jīng)網(wǎng)絡(luò)(SOINN)的半監(jiān)督自主學(xué)習(xí)算法,將SOINN作為學(xué)習(xí)器,通過輸入數(shù)據(jù)的不同拓?fù)浣Y(jié)構(gòu)將其分類成不同的族群,并主動標(biāo)簽一些教師節(jié)點,用這些教師節(jié)點實現(xiàn)對所有未標(biāo)簽樣本進(jìn)行標(biāo)記;然而,該算法僅僅使用最初的有標(biāo)記樣本訓(xùn)練分類器,使得算法對初始的已標(biāo)簽樣本的依賴性太強(qiáng);同時該算法嚴(yán)格地講,并不是一種真正意義上的SOM半監(jiān)督分類算法。Astudillo等[6]利用基于樹拓?fù)浣Y(jié)構(gòu)SOM算法 (tree-based topology oriented SOM ,TTOSOM)進(jìn)行半監(jiān)督分類,首先使用TTOSOM建立隨機(jī)的、有結(jié)構(gòu)的網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu),將網(wǎng)絡(luò)分為幾個聚類,將有標(biāo)記的樣本分配到不同的SOM的神經(jīng)元中,最后在每個聚類中,實現(xiàn)對標(biāo)記樣本的分類。然而,在該算法中,如何將標(biāo)記樣本有效地分布到每個聚類中,本身就是一個較復(fù)雜的過程;同時在每個聚類中,用有監(jiān)督分類算法實現(xiàn)對未標(biāo)記樣本進(jìn)行標(biāo)記,也只能在局部找到最優(yōu)值。陽時來等[7]在已有的無監(jiān)督生長型分層自組織映射GHSOM神經(jīng)網(wǎng)絡(luò)算法的基礎(chǔ)上,提出一種半監(jiān)督GHSOM算法,該算法借鑒cop-kmeans算法的半監(jiān)督思想,使用Must-Link和Cannot-Link 2種約束關(guān)系作為先驗知識,利用少量有標(biāo)記的數(shù)據(jù)指導(dǎo)大規(guī)模未標(biāo)記數(shù)據(jù)的聚類過程。該算法是一種半監(jiān)督聚類算法,同樣存在分類精度不高,分類結(jié)果不易統(tǒng)計等缺點。

      針對以上問題,本文將SOM神經(jīng)網(wǎng)絡(luò)引入到半監(jiān)督分類領(lǐng)域,提出一種基于SOM的半監(jiān)督分類算法SSC-SOM (semi supervised classification algorithm based on SOM neural network)。SSC-SOM基于先聚類后標(biāo)記的思想,擴(kuò)充有標(biāo)記樣本的數(shù)目,提高算法的分類精度。它充分利用有標(biāo)記樣本和未標(biāo)記樣本訓(xùn)練分類器SOM,訓(xùn)練輸入層和競爭層之間的權(quán)值W(1),同時,充分利用有標(biāo)記樣本的標(biāo)記信息,調(diào)整競爭層和輸出層之間的權(quán)值W(2),實現(xiàn)對樣本的分類和類別預(yù)測;在訓(xùn)練SOM過程中,聚類的形成和有標(biāo)記樣本分配到各個聚類中同時進(jìn)行,并計算各個聚類的聚類中心,在整個未標(biāo)記樣本的范圍內(nèi),根據(jù)聚類中心,使用K近鄰算法實現(xiàn)對未標(biāo)記樣本的標(biāo)記,擴(kuò)充有標(biāo)記樣本,反復(fù)迭代。最后,在UCI數(shù)據(jù)集進(jìn)行分類實驗,驗證該算法的有效性。

      1 SOM神經(jīng)網(wǎng)絡(luò)

      自組織特征映射(SOM)神經(jīng)網(wǎng)絡(luò)是由芬蘭學(xué)者Teuvo Kohonen 于1981 年提出的,是一種無監(jiān)督聚類方法,它能將輸入模式在輸出層映射成一維或二維離散圖形,識別環(huán)境特征并自動聚類[8]。

      SOM結(jié)構(gòu)如圖1所示,包括輸入層和競爭層2層結(jié)構(gòu),輸入層的維數(shù)與輸入樣本向量維數(shù)一致,競爭層節(jié)點一般呈二維陣列分布,一個競爭層節(jié)點代表一個神經(jīng)元。SOM 網(wǎng)絡(luò)的基本工作原理為:網(wǎng)絡(luò)學(xué)習(xí)過程中,當(dāng)樣本輸入網(wǎng)絡(luò)時,競爭層的各神經(jīng)元通過競爭來獲取對輸入模式的響應(yīng),與輸入樣本距離最小的神經(jīng)元成為競爭神經(jīng)元;調(diào)整獲勝神經(jīng)元和相鄰神經(jīng)元權(quán)值,使其權(quán)值靠近輸入樣本;通過反復(fù)訓(xùn)練,各神經(jīng)元被劃分為不同區(qū)域,各區(qū)域?qū)斎肽P途哂胁煌捻憫?yīng)特征,實現(xiàn)對輸入模型的聚類[8]。

      圖1 SOM結(jié)構(gòu)圖

      SOM可以對未標(biāo)記樣本進(jìn)行無監(jiān)督聚類,但是分類結(jié)果中同一類別數(shù)據(jù)對應(yīng)不同的競爭層節(jié)點,競爭層節(jié)點的數(shù)目比實際類別的數(shù)目多。文獻(xiàn)[9]將SOM改進(jìn)為一種有監(jiān)督的SSOM (supervised SOM),在SOM 2層結(jié)構(gòu)的基礎(chǔ)上,增加了第3層——輸出層,輸出層的個數(shù)同數(shù)據(jù)分類類別數(shù)一致,每個輸出節(jié)點代表一種數(shù)據(jù)類別。在進(jìn)行網(wǎng)絡(luò)學(xué)習(xí)訓(xùn)練時,根據(jù)每個輸入樣本的預(yù)測類別和實際類別是否相等,選取不同的權(quán)值調(diào)整公式對權(quán)值進(jìn)行調(diào)整。它不僅調(diào)整輸入層節(jié)點和競爭層優(yōu)勝節(jié)點領(lǐng)域內(nèi)的權(quán)值W(1),而且調(diào)整輸出節(jié)點和競爭層優(yōu)勝節(jié)點領(lǐng)域內(nèi)的權(quán)值W(2)。根據(jù)輸入樣本Xi的輸出類別Yi和獲勝神經(jīng)元g對應(yīng)的輸出類別Og是否相等,進(jìn)行權(quán)值調(diào)整。若Og=Yi,則根據(jù)公式(1) (2)調(diào)整神經(jīng)元權(quán)值;否則,根據(jù)式(3) (4)調(diào)整神經(jīng)元權(quán)值。通過2個權(quán)值的組合,便可以很容易實現(xiàn)對輸入樣本的類別進(jìn)行分類和統(tǒng)計。

      (1)

      (2)

      (3)

      (4)

      2 基于SOM的半監(jiān)督分類算法

      2.1 基本思想

      本文基于“先聚類后標(biāo)記”的思想,實現(xiàn)對未標(biāo)記樣本的標(biāo)記和分類。大體的方法如下:利用聚類算法SOM對未標(biāo)記樣本集進(jìn)行聚類,形成幾個聚類中心;然后利用SSOM對有標(biāo)記樣本進(jìn)行訓(xùn)練,使得有標(biāo)記樣本分布在每個聚類中心的區(qū)域內(nèi),形成聚類中心;最后,在包含標(biāo)記樣本和未標(biāo)記樣本的聚類中心的區(qū)域內(nèi),使用K近鄰算法實現(xiàn)對未標(biāo)記樣本的標(biāo)記,擴(kuò)充有標(biāo)記樣本的數(shù)目[6,10-12]。

      2.2 算法實現(xiàn)

      首先,充分利用有標(biāo)記樣本集和未標(biāo)記樣本集的屬性特征信息訓(xùn)練SOM,形成多個聚類,確定輸入層和競爭層之間的權(quán)值W(1);接著,利用有標(biāo)記樣本訓(xùn)練SSOM,確定競爭層和輸出層之間的權(quán)值W(2),根據(jù)有標(biāo)記樣本類別數(shù)確定聚類數(shù)和聚類的標(biāo)記信息;然后,根據(jù)每個聚類中有標(biāo)記樣本計算出虛擬的聚類中心;最后,在每個聚類中,以虛擬的聚類中心為中心,使用K近鄰算法實現(xiàn)對其他未標(biāo)記樣本進(jìn)行標(biāo)記,將新標(biāo)記的樣本擴(kuò)充到有標(biāo)記樣本集中。算法的框架如圖2所示,其具體步驟如下。

      第1步:聚類過程。SOM是一種包括輸入層和競爭層2層結(jié)構(gòu)、基于聚類思想的無監(jiān)督分類算法。在對SOM進(jìn)行訓(xùn)練時,競爭層是根據(jù)輸入層樣本特征之間的距離進(jìn)行動態(tài)調(diào)整、自動聚類,因此輸入層和競爭層之間不需要樣本的標(biāo)記。SSOM是一種3層結(jié)構(gòu)、基于聚類思想的有監(jiān)督分類算法,是在SOM結(jié)構(gòu)的基礎(chǔ)上增加了1個輸出層,輸出層會根據(jù)樣本的標(biāo)記實現(xiàn)對樣本的分類,競爭層和輸出層之間需要有標(biāo)記的樣本進(jìn)行訓(xùn)練。

      基于以上事實,使用有標(biāo)記樣本集和未標(biāo)記樣本集共同訓(xùn)練SOM,形成SOM神經(jīng)網(wǎng)絡(luò)的競爭層節(jié)點布局,確定輸入層和競爭層之間的權(quán)值W(1)。接著,使用有標(biāo)記樣本訓(xùn)練SSOM,確定競爭層和輸出層之間的權(quán)值W(2)。使用權(quán)值W(1)和權(quán)值W(2)的組合形成m分類(即m聚類),每一類都有一個類標(biāo)記。

      通過這樣的處理方式,一方面能充分利用大量未標(biāo)記樣本和少量有標(biāo)記樣本的豐富信息,訓(xùn)練出競爭層分布合理、精確度高的SOM分類器,使有標(biāo)記樣本的分類布局更合理、更符合實際性,另一方面,結(jié)合標(biāo)記樣本的標(biāo)記信息,實現(xiàn)每個聚類中都有標(biāo)記樣本,方便計算聚類中心,實現(xiàn)對未標(biāo)記樣本的標(biāo)記。

      第2步:尋找聚類中心。對于具有某一類標(biāo)記的所有樣本,按照式(5)計算該聚類中的虛擬聚類中心。該聚類中心之所以是虛擬的,是因為它是該聚類中所有有標(biāo)記樣本的平均值,并不一定是一個實實在在的、存在于標(biāo)記集之中的真實樣本。

      (5)

      式中:μi表示第i類樣本的聚類中心;ni表示第i類樣本的樣本數(shù)目;xij表示第i類樣本中第j個樣本。

      第3步:標(biāo)記。使用K近鄰方法給距離該聚類中心最近的k個樣本使用類標(biāo)記進(jìn)行標(biāo)記。對于每一個輸入,計算其與聚類中心之間的距離。若其與某一個聚類中心的距離小于某一個閾值,則用該標(biāo)記給這個未標(biāo)記樣本進(jìn)行標(biāo)記,將標(biāo)記后的樣本增加到訓(xùn)練集中。將標(biāo)記后的樣本添加到標(biāo)記樣本集,重新訓(xùn)練SOM,反復(fù)迭代。描述算法如表1所示。

      表1 SSC-SOM算法過程描述

      第4步:分類。使用最終的半監(jiān)督分類器SSC-SOM實現(xiàn)對樣本的分類。

      為防止算法陷入局部最優(yōu)點,在對每個輸入樣本進(jìn)行標(biāo)記時,不是從每個聚類的范圍內(nèi)尋找距離該聚類中心的最小值,而是從所有的未標(biāo)記樣本中尋找距離該聚類中心的最小值。

      2.3 算法分析

      SSC-SOM算法與SOM相比較,都根據(jù)輸入層所有樣本特征屬性信息之間的距離進(jìn)行動態(tài)調(diào)整,實現(xiàn)對樣本的聚類,都充分利用了所有樣本,包括有標(biāo)記樣本和未標(biāo)記樣本的特征信息;但是,SOM沒有用到有標(biāo)記樣本的標(biāo)記信息,這是一個巨大的浪費。SOM只能根據(jù)競爭層節(jié)點的數(shù)目進(jìn)行聚類,聚類的類別比樣本的實際類別要多,分類精度不高; SSC-SOM充分利用了有標(biāo)記樣本的標(biāo)記信息,利用有標(biāo)記樣本調(diào)整競爭層和輸出層之間的權(quán)值,實現(xiàn)對樣本的分類和類別預(yù)測,分類精度更高。

      SSC-SOM算法與SSOM算法相比較,都利用了有標(biāo)記樣本調(diào)整競爭層和輸出層之間的權(quán)值,實現(xiàn)對樣本的分類和類別預(yù)測。但是,SSOM僅僅用到有標(biāo)記樣本的信息,大量未標(biāo)記樣本中的隱含信息被浪費了; SSC-SOM充分利用了所有樣本的信息訓(xùn)練輸入層和競爭層之間的權(quán)值W(1),同時,在聚類中通過K近鄰算法擴(kuò)充有標(biāo)記樣本的數(shù)目。很容易推測出,SSOM訓(xùn)練出的分類器精度不如SSC-SOM,這在實驗部分得到了證明。

      3 實驗和結(jié)果分析

      實驗平臺選用Intel Core2 Duo CPU 2.0GHz、內(nèi)存2.0GB的PC,安裝Windows XP 操作系統(tǒng)和MATLAB 7.8.0 (R2009.0a) 編程環(huán)境。

      MATLAB程序中,實驗參數(shù)選取如下:η1=0.8(學(xué)習(xí)率1),η2=0.8(學(xué)習(xí)率2),μ=0.2(權(quán)值系數(shù)),M=12(競爭層神經(jīng)元個數(shù)),r=1.5(學(xué)習(xí)半徑),K=1。其中,終止條件F表示未標(biāo)記樣本集為空。學(xué)習(xí)率和權(quán)值系數(shù)為SSOM中的參數(shù),不同的參數(shù)對SSOM的分類精度影響比較大,這里使用交叉驗證方法[9]選取最優(yōu)參數(shù)作為實驗參數(shù)。

      實驗采用UCI數(shù)據(jù)(http://archive.ics.uci.edu/ml/)中常用的6個數(shù)據(jù)集,如表2所示。

      對于表2所選取的樣本,將訓(xùn)練集和測試集的樣本數(shù)目比例設(shè)為1∶1。將訓(xùn)練集分為有標(biāo)記樣本和未標(biāo)記樣本2種,按照有標(biāo)記樣本占訓(xùn)練集樣本總數(shù)目的百分比不同,構(gòu)造3類半監(jiān)督分類實驗數(shù)據(jù)集,百分比λ的計算公式如式(6)所示。λ的取值分別為5%、10%和20%。

      (6)

      表2 實驗數(shù)據(jù)集

      對于構(gòu)造的3類半監(jiān)督分類實驗數(shù)據(jù)集,分別使用普通的SSOM分類算法(即訓(xùn)練集僅使用最初的有標(biāo)記樣本集訓(xùn)練SSOM分類器)、經(jīng)典的半監(jiān)督分類算法tri-training[13](其中分類器采用SSOM作為有監(jiān)督分類算法)和本文提出的SSC-SOM算法(即SOM的訓(xùn)練集使用所有的有標(biāo)記樣本集和未標(biāo)記樣本集,使用SOM和SSOM擴(kuò)充有標(biāo)記樣本數(shù)目,使用擴(kuò)充后的有標(biāo)記樣本訓(xùn)練分類器)進(jìn)行分類實驗。按照式(7)統(tǒng)計實驗結(jié)果, rate表示對測試集樣本進(jìn)行分類測試的正確分類率。實驗結(jié)果如表3—10所示。

      (7)

      表3—6是SSC-SOM和SSOM的實驗結(jié)果對比。表7—10是SSC-SOM和tri-training的實驗結(jié)果對比。

      從表3—5可以看出,相對于僅僅使用有標(biāo)記樣本訓(xùn)練分類器的SSOM而言,SSC-SOM分類率rate得到了提高,平均提高2.22 %(如表6所示)。這是因為:1)SSC-SOM充分利用有標(biāo)記樣本和未標(biāo)記樣本數(shù)據(jù)的信息訓(xùn)練分類器SOM,確定輸入層和競爭層之間的權(quán)值W(1),此時的W(1)更能準(zhǔn)確反映出輸入層到競爭層的映射關(guān)系,比SSOM算法得到的權(quán)值精確度要高;2)SSC-SOM在全局范圍內(nèi)使用K近鄰算法對未標(biāo)記樣本進(jìn)行標(biāo)記,能有效地挖掘未標(biāo)記樣本的隱含信息,增加有標(biāo)記樣本的數(shù)目。所以,SSC-SOM訓(xùn)練出來的分類器比僅僅使用最初的標(biāo)記樣本訓(xùn)練出來的SSOM分類器精度要高,這也表明SSC-SOM能有效地增加有標(biāo)記樣本,具有較好的分類性能。

      同時還可以看到,隨著標(biāo)記樣本集數(shù)目不斷增加,到達(dá)一定程度時,SSC-SOM和SSOM的分類率差距越來越小。這是由于此時有標(biāo)記樣本數(shù)目已經(jīng)非常充足,半監(jiān)督學(xué)習(xí)已經(jīng)演化成有監(jiān)督學(xué)習(xí)。這也反映出SSC-SOM算法具有較好的收斂性,分類率收斂于有監(jiān)督學(xué)習(xí)SSOM (所有的訓(xùn)練樣本都是有標(biāo)記的)的求解,但是,該算法和SSOM一樣,對初始化的有標(biāo)記樣本集的依賴性較強(qiáng),合理選取初始的有標(biāo)記集L能減小算法的誤差;所以SSC-SOM算法是條件穩(wěn)定的。

      另外,需要注意的是,SSOM僅僅使用已有的有標(biāo)記樣本訓(xùn)練網(wǎng)絡(luò),而SSC-SOM需要實現(xiàn)對未標(biāo)記樣本進(jìn)行標(biāo)記。在擴(kuò)充新標(biāo)記樣本的過程中,SSC-SOM勢必增加一些時間的開銷。在對未標(biāo)記進(jìn)行標(biāo)記之前,可以采用主動學(xué)習(xí)算法縮減未標(biāo)記樣本的規(guī)模,只選取信息量豐富的未標(biāo)記樣本進(jìn)行標(biāo)記。這樣需要標(biāo)記的未標(biāo)記樣本的數(shù)目就大大減小,可以有效地減小時間開銷。

      將SSC-SOM與tri-training進(jìn)行對比,其結(jié)果如表7—10所示??梢钥闯?,SSC-SOM能較好地提高分類率,具有較好的穩(wěn)定性。

      表3 分類率rate(λ=5%) %

      表4 分類率rate(λ=10%) %

      表5 分類率rate(λ=20%) %

      表6 分類率提高值統(tǒng)計表 %

      表7 分類率rate(λ=5%) %

      表8 分類率rate(λ=10%) %

      表9 分類率rate(λ=20%) %

      表10 分類率提高值統(tǒng)計表 %

      4 結(jié)束語

      本文將SOM神經(jīng)網(wǎng)絡(luò)引入半監(jiān)督分類領(lǐng)域,基于“先聚類后標(biāo)記”的思想,結(jié)合無監(jiān)督SOM神經(jīng)網(wǎng)絡(luò)的聚類特征和有監(jiān)督SSOM神經(jīng)網(wǎng)絡(luò)的分類性能,提出一種基于SOM神經(jīng)網(wǎng)絡(luò)的半監(jiān)督分類算法(SSC-SOM),充分利用未標(biāo)記樣本和有標(biāo)記樣本的信息訓(xùn)練分類器,實現(xiàn)對未標(biāo)記樣本的標(biāo)記和分類。實驗結(jié)果表明,該算法操作簡單,能較容易實現(xiàn)對未標(biāo)記樣本的分類,性能良好。

      [1]周志華. 基于分歧的半監(jiān)督學(xué)習(xí)[J]. 自動化學(xué)報, 2013, 39(11):1871-1878.

      [2]ZHU X J. Semi-supervised Learning Literature Survey[R]. Madison: University of Wisconsin, 2008.

      [3]李昆侖,曹錚,曹麗蘋,等.半監(jiān)督聚類的若干新進(jìn)展[J].模式識別與人工智能,2009,22(5):735-742.

      [4]孫雁飛,張順頤,亓?xí)x,等.一種基于半監(jiān)督學(xué)習(xí)的GA-SOM聚類方法:中國,201010576193[P]. 2011-04-20.

      [5]Shen Furao, Yu Hui, Sakurai Keisuke, et al. An Incremental Online Semi-supervised Active Learning Algorithm Based on Self-organizing Incremental Neural Network[J]. Neural Computing & Applications,2011, 20(7):1061-1074.

      [6]Astudillo Cesar A, John Oommen B. On Achieving Semi-supervised Pattern Recognition by Utilizing Tree-based SOMs[J].Pattern Recognition, 2013,46:293-304.

      [7]陽時來, 楊雅輝, 沈晴霓, 等. 一種基于半監(jiān)督 GHSOM 的入侵檢測方法[J]. 計算機(jī)研究與發(fā)展, 2013, 50(11):2375-2382.

      [8]HAGAN M T, DEMUTH H B, BEALE M H. Neural Network Design[M]. Beijing: China Machine Press,2002:64-85.

      [9]趙建華,李偉華.有監(jiān)督SOM神經(jīng)網(wǎng)絡(luò)在入侵檢測中的應(yīng)用[J]. 計算機(jī)工程,2012, 38(12) :110-111.

      [10]唐明珠,陽春華,桂衛(wèi)華. 基于改進(jìn)的QBC和CS-SVM的故障檢測[J].控制與決策.2012, 27 (10):1489-1493.

      [11]文志強(qiáng),胡永祥,朱文球.流行上的K最近鄰分類方法[J].計算機(jī)應(yīng)用,2012,32(12):3311-3314.

      [12]趙建華.一種安全的基于分歧的半監(jiān)督分類算法[J].西華大學(xué)學(xué)報:自然科學(xué)版,2014,33(5):1-6.

      [13]ZHOU Z H, LI M. Tri-Training: Exploiting Unlabeled Data using Three Classifiers[J].IEEE Transactions on Knowledge and Data Engineering,2005,17(11):1529-1542.

      (編校:饒莉)

      Semi-supervisedClassificationAlgorithmBasedonSOMNeuralNetwork

      ZHAO Jian-hua1,2

      (1.CollegeofComputer,NorthwesternPolytechnicalUniversity,Xi’an710072China;2.SchoolofMathematicsandComputerApplication,ShangluoUniversity,Shangluo726000China)

      In order to improve the performance of semi-supervised classifier, a kind of semi-supervised classification algorithm SSC-SOM is proposed. Based on the clustering characteristics of SOM and the Cluster-then-Label idea, labeled data and unlabeled data are all used to train SOM. The labeled samples are assigned to each cluster and the clusters form simultaneously. The clustering centers are work out.K-NN algorithm is adopted to label the unlabeled samples according to the clustering centers and the information from the unlabeled samples is mined. With UCI dataset, experiments were carried out and the results show that the classification rate of SSC-SOM increases by 2.22 % than SSOM and the SSC-SOM method had good convergence.

      semi-supervised learning; SOM; classification; clustering

      2014-03-15

      陜西省教育廳科研計劃項目資助(12JK0748);商洛學(xué)院科研項目資助(14SY006,14SKY007)。

      趙建華(1982—),男,講師,博士研究生,主要研究方向為機(jī)器學(xué)習(xí)。

      TP181

      :A

      :1673-159X(2015)01-0036-05

      10.3969/j.issn.1673-159X.2015.01.006

      猜你喜歡
      權(quán)值分類器聚類
      一種融合時間權(quán)值和用戶行為序列的電影推薦模型
      CONTENTS
      BP-GA光照分類器在車道線識別中的應(yīng)用
      電子測試(2018年1期)2018-04-18 11:52:35
      基于DBSACN聚類算法的XML文檔聚類
      電子測試(2017年15期)2017-12-18 07:19:27
      基于權(quán)值動量的RBM加速學(xué)習(xí)算法研究
      加權(quán)空-譜與最近鄰分類器相結(jié)合的高光譜圖像分類
      結(jié)合模糊(C+P)均值聚類和SP-V-支持向量機(jī)的TSK分類器
      基于改進(jìn)的遺傳算法的模糊聚類算法
      一種層次初始的聚類個數(shù)自適應(yīng)的聚類方法研究
      基于LLE降維和BP_Adaboost分類器的GIS局部放電模式識別
      长岛县| 连南| 定南县| 高尔夫| 老河口市| 集贤县| 咸宁市| 长阳| 海宁市| 上杭县| 长汀县| 维西| 扎兰屯市| 衡阳县| 孝昌县| 凉城县| 弥勒县| 台东县| 铁岭县| 宁陵县| 民丰县| 博野县| 巴林右旗| 麟游县| 庆城县| 湟源县| 隆子县| 镇坪县| 民乐县| 达尔| 新丰县| 璧山县| 珠海市| 罗甸县| 安顺市| 信宜市| 肥西县| 遵化市| 东兰县| 夏邑县| 通海县|