• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      一種基于R-FSVM的文本分類算法

      2012-04-29 18:34:26田冬陽
      電腦知識與技術(shù) 2012年15期
      關(guān)鍵詞:文本分類魯棒性

      田冬陽

      摘要:目前模糊支持向量機(jī)使用的隸屬度很大程度上依賴于先驗知識、后驗概率和多個自由參數(shù),應(yīng)用面不廣、計算復(fù)雜、較難執(zhí)行性能調(diào)優(yōu)。為獨立于學(xué)科領(lǐng)域知識,讓模糊支持向量機(jī)利用樣本集構(gòu)造出性能更優(yōu)的分類器,引入了一種更具魯棒性的隸屬度計算方法:R-FSVM,該算法使用重構(gòu)誤差計算每個文檔相對于歸屬類別的隸屬度。最后構(gòu)造了文本分類實驗系統(tǒng),實驗結(jié)果表明改進(jìn)算法在準(zhǔn)確率、召回率、F1值上具有更好的性能。

      關(guān)鍵詞:隸屬度;模糊支持向量機(jī);魯棒性;重構(gòu)誤差;文本分類;

      中圖分類號:TP181文獻(xiàn)標(biāo)識碼:A文章編號:1009-3044(2012)15-3674-05

      A Kind of Text Classification Algorithm Based on Robust Fuzzy Support Vector Machines

      TIAN Dong-yang

      (Wulumuqi Central Sub-branch of the Peoples Bank of China,Wulumuqi 830002,China)

      Abstract:The fuzzy support vector machines using membership is more dependent on prior knowledge, posteriori probability and some free parameters. It makes application is not wide, computational complexity. In order to be more independent of subject area knowledge, fuzzy support vector machine use the sample sets to construct better performance of the classifier. It introduces a kind of more robust calcu? lation method of the membership(R-FSVM), using the reconstruction error to calculate membership of Each document. Finally, it con? struct a text classification experiment, the experimental results show that the improved algorithm has better performance in accuracy, recall rate, the F1 value.

      Key words:membership; fuzzy support vector machines; robustness; reconstruction error; text classification

      分類器是文本分類系統(tǒng)核心部分,目前廣泛使用的是支持向量機(jī)(SVM)模型。但SVM存在的主要問題是假設(shè)訓(xùn)練集中的所有文檔具有同樣的權(quán)重,這將導(dǎo)致訓(xùn)練集中的噪音數(shù)據(jù)對分類結(jié)果產(chǎn)生較大影響。為解決該問題,一些學(xué)者提出了模糊支持向量機(jī)(FSVM)模型,試圖減小噪音樣本的影響。但現(xiàn)有的FSVM模型中,多數(shù)需要先驗領(lǐng)域知識或含有太多自由參數(shù),需要人為干預(yù)優(yōu)化。針對以上問題,做了如下工作:

      1)為FSVM引入更具魯棒性的隸屬度計算方法。這種隸屬度計算方法通過重構(gòu)誤差衡量單個文檔對預(yù)設(shè)類別的隸屬度,并且通過網(wǎng)格搜索法獲取其中一個自由變量。引入這種計算方法,隸屬度函數(shù)將不再依賴先驗領(lǐng)域知識、后驗概率以及人為干預(yù)。從而使得分類器模型更具魯棒性:能夠有效降低干擾數(shù)據(jù)對模型訓(xùn)練的影響;獨立于學(xué)科領(lǐng)域的分類器模型能夠很容易地改造并應(yīng)用于其他領(lǐng)域。

      2)使用R-FSVM分類器模型構(gòu)建文本分類算法實驗。實驗結(jié)果表明,R-FSVM相對于SVM、FSVM-F、I-FSVM,在查準(zhǔn)率、召回率、F1值上有了提升,實驗取得了較好的預(yù)期目標(biāo)。

      猜你喜歡
      文本分類魯棒性
      武漢軌道交通重點車站識別及網(wǎng)絡(luò)魯棒性研究
      荒漠綠洲區(qū)潛在生態(tài)網(wǎng)絡(luò)增邊優(yōu)化魯棒性分析
      基于確定性指標(biāo)的弦支結(jié)構(gòu)魯棒性評價
      基于時差效用的雙目標(biāo)資源約束型魯棒性項目調(diào)度優(yōu)化
      基于組合分類算法的源代碼注釋質(zhì)量評估方法
      基于貝葉斯分類器的中文文本分類
      基于蟻群智能算法的研究文本分類
      基于樸素貝葉斯分類的Java課程網(wǎng)絡(luò)答疑反饋系統(tǒng)
      基于K—means算法的文本分類技術(shù)研究
      文本分類算法在山東女子學(xué)院檔案管理的應(yīng)用
      科技視界(2016年24期)2016-10-11 09:36:57
      开远市| 九龙城区| 万盛区| 滨州市| 九龙城区| 玛沁县| 贵南县| 公安县| 安陆市| 昌黎县| 铁力市| 常州市| 黄山市| 大石桥市| 盈江县| 禄丰县| 三河市| 东辽县| 太仓市| 富蕴县| 甘孜县| 乌拉特后旗| 井冈山市| 陇川县| 长沙县| 依兰县| 湖口县| 安福县| 临沭县| 穆棱市| 绥阳县| 平乐县| 沅陵县| 毕节市| 静海县| 苗栗县| 盐源县| 澜沧| 咸丰县| 门源| 榆林市|