• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于C-SVC模型的汽車評估

      2018-03-30 07:12:29董婷
      微型電腦應(yīng)用 2018年2期
      關(guān)鍵詞:接受程度個數(shù)向量

      董婷

      (榆林學(xué)院 信息工程學(xué)院,榆林 719000)

      0 引言

      隨著經(jīng)濟(jì)的發(fā)展,我國汽車行業(yè)發(fā)展越來越快,人們對汽車的需求越來越大,未來幾乎每個家庭都將至少擁有一輛汽車。但是,大多數(shù)人對于汽車的認(rèn)知比較少,僅僅通過汽車價格來判定一輛汽車的好壞,很明顯這是不足的。目前,在我國還沒有一套汽車評估系統(tǒng)。

      支持向量機(jī)方法(Support Vector Machine,SVM)是Vapnik在上個世紀(jì)90年代提出的基于統(tǒng)計學(xué)習(xí)理論框架的一種全新的機(jī)器學(xué)習(xí)方法,它避免了人工神經(jīng)網(wǎng)等方法的網(wǎng)絡(luò)結(jié)構(gòu)難于確定、過學(xué)習(xí)和欠學(xué)習(xí)以及局部極小等問題[1]。本文首次將支持向量機(jī)方法中的支持向量分類模型(C-SVM for Classification,C-SVC)應(yīng)用到汽車評估當(dāng)中,具有廣泛的現(xiàn)實意義,并以UCI提供的數(shù)據(jù)作為實例,從評價系統(tǒng)的計算中得到汽車是否值得購買,為人們購買汽車時提供參考意見[2]。

      1 汽車評估系統(tǒng)的建立

      1.1 屬性項和標(biāo)簽項的確定

      選定的訓(xùn)練集和測試集的屬性項和標(biāo)簽項是整個模型的核心所在,只有找出影響人們購買汽車的真正因素,所建立的汽車評估系統(tǒng)才具有現(xiàn)實意義[3]。根據(jù)UCI提供的數(shù)據(jù),在UCI中,共有1728條該類數(shù)據(jù),其中選取前864條數(shù)據(jù)作。

      1.2 屬性項和標(biāo)簽項的確定

      選定的訓(xùn)練集和測試集的屬性項和標(biāo)簽項是整個模型的核心所在,只有找出影響人們購買汽車的真正因素,所建立的汽車評估系統(tǒng)才具有現(xiàn)實意義。根據(jù)UCI提供的數(shù)據(jù),在UCI中,共有1728條該類數(shù)據(jù),其中選取前864條數(shù)據(jù)作為訓(xùn)練集,采用交叉驗證選取最佳懲罰參數(shù)(c)和核函數(shù)參數(shù)(g)。后864條數(shù)據(jù)作為實例,對汽車的可接受程度進(jìn)行預(yù)測,最后評估結(jié)果與實際基本一致,這表明所建立的汽車評估系統(tǒng)可以位汽車是否值得購買提供參考意見。確定的屬性項如表1所示。

      標(biāo)簽項,如表2所示。

      1.3 建立汽車評估模型

      本系統(tǒng)的可接受程度共有4類,每一類的樣本均為6維向量。由于評估結(jié)果涉及多類狀態(tài)識別,因此選用基于一對余類算法的多類SVM狀態(tài)評估模型[4]。

      一類對余類法(One versus rest,OVR)是最早出現(xiàn)也是目前應(yīng)用最為廣泛的方法之一,其步驟是構(gòu)造k個兩類分類機(jī)(設(shè)共有k個類別),其中第i個分類機(jī)把第i類同余下的各類劃分開,訓(xùn)練時第i個分類機(jī)取訓(xùn)練集中第i類為正類,其余類別為負(fù)類進(jìn)行訓(xùn)練[5]。

      對于本系統(tǒng),分4種情況進(jìn)行訓(xùn)練及預(yù)測:

      1)設(shè)可接受程度unacc為正類(1),其余三類為負(fù)類(-1),進(jìn)行訓(xùn)練、預(yù)測

      表1 汽車屬性及賦值

      表2 可接受程度指標(biāo)分類

      2)設(shè)可接受程度acc為正類(1),其余三類為負(fù)類(-1),進(jìn)行訓(xùn)練、預(yù)測

      3)設(shè)可接受程度good為正類(1),其余三類為負(fù)類(-1),進(jìn)行訓(xùn)練、預(yù)測

      4)設(shè)可接受程度vgood為正類(1),其余三類為負(fù)類(-1),進(jìn)行訓(xùn)練、預(yù)測

      1.3 評估結(jié)果及分析

      考慮到數(shù)據(jù)過大,這里我們從每個狀態(tài)中隨機(jī)選取10個預(yù)測結(jié)果,數(shù)據(jù)分布如表3、表4、表5、表6所示:

      第一種情況中,真正樣本個數(shù):TP為638個,真負(fù)樣本個數(shù):TN為89個:,假正樣本個數(shù):FP為81個,假負(fù)樣本個數(shù):FN為29個。所以敏感度為TP/(TP+FN)=95.65%,特異性為TN/(TN+FP)=0.523 5,正確率為(TP+TN)/(TP+TN+FP+FN)=86.857 8%。

      第二種情況中,真正樣本個數(shù):TP為112個,真負(fù)樣本個數(shù):TN為639個:,假正樣本個數(shù):FP為27個,假負(fù)樣本個數(shù):FN為55個。所以敏感度為TP/(TP+FN)=67.07%,特異性為TN/(TN+FP)=0.959 5,正確率為(TP+TN)/(TP+TN+FP+FN)=90.156 1%。

      第三種情況中,真正樣本個數(shù):TP為0個,真負(fù)樣本個數(shù):TN為833個:,假正樣本個數(shù):FP為0個,假負(fù)樣本個數(shù):FN為0個。所以t特異性為TN/(TN+FP)=1,正確率為(TP+TN)/(TP+TN+FP+FN)=100%。

      第四種情況中,真正樣本個數(shù):TP為0個,真負(fù)樣本個數(shù):TN為833個:,假正樣本個數(shù):FP為0個,假負(fù)樣本個數(shù):FN為0個。所以特異性為TN/(TN+FP)=1,正確率為(TP+TN)/(TP+TN+FP+FN)=100%。

      表3 unacc為正類時,預(yù)測結(jié)果及正確情況(g為0.5,c為32)

      (真正樣本TP:被判定為正樣本,事實上也是正樣本;真負(fù)樣本TN:被判定為負(fù)樣本,事實上也是負(fù)樣本;假正樣本FP:被判定為正樣本,事實上是負(fù)樣本;假負(fù)樣本FN:被判定為負(fù)樣本,事實上是正樣本)

      由以上結(jié)果可知,在最佳參數(shù)下,基于C-SVC的評估方法的準(zhǔn)確率較高,在10個預(yù)測中基本都與實際符合,汽車可接受性評估的準(zhǔn)確率非常高。

      表4 acc為正類時,預(yù)測結(jié)果及正確情況(g為0.5,c為8)

      表5 good為正類時,預(yù)測結(jié)果及正確情況(g為0.031 25,c為8 192)

      表6 vgood為正類時,預(yù)測結(jié)果及正確情況(g為0.5,c為8)

      2 總結(jié)

      本文基于C-SVC所建立的汽車評估系統(tǒng),利用UCI提供的數(shù)據(jù)作為實驗數(shù)據(jù),選取合理的輸出向量,最后預(yù)測的結(jié)果與實際值基本上一致,表明該評估系統(tǒng)的可用性和有效性[6]。但是,由于本次實驗的數(shù)據(jù)量較小,在實際應(yīng)用中,數(shù)據(jù)量較大,因此今后將進(jìn)一步通過mcc系數(shù)和roc曲線來補(bǔ)充和修改現(xiàn)有的系統(tǒng)模型[7]。

      [1] 奉國和. SVM分類核函數(shù)及參數(shù)選擇比較[J].計算機(jī)工程與應(yīng)用, 2011(3):58-59.

      [2] 鄧乃揚(yáng),田英杰. 數(shù)據(jù)挖掘中的新方法——支持向量機(jī)[M].北京:科學(xué)出版社,2004: 202-354.

      [3] 瓦普尼克.統(tǒng)計學(xué)習(xí)理論[M]. 北京:電子工業(yè)出版社,2004: 192-447.

      [4] 杜曉東,李岐強(qiáng). 支持向量機(jī)及其算法研究[J]. 信息技術(shù)與信息化, 2005(3): 123-124.

      [5] 魏丹. 支持向量機(jī)多分類預(yù)測技術(shù)研究[D]. 西安:西安科技大學(xué), 2008:98-99.

      [6] 沃爾斯(Craig Walls).Spring實戰(zhàn)[M].北京:人民郵電出版社,2013:102-117.

      [7] 吐爾遜-達(dá)吾提.新疆師范大學(xué)就業(yè)管理系統(tǒng)的設(shè)計與實現(xiàn)[J].吉林:吉林大學(xué),2014:1-10.

      猜你喜歡
      接受程度個數(shù)向量
      向量的分解
      怎樣數(shù)出小正方體的個數(shù)
      聚焦“向量與三角”創(chuàng)新題
      等腰三角形個數(shù)探索
      怎樣數(shù)出小木塊的個數(shù)
      關(guān)于公眾保肝護(hù)肝中藥認(rèn)識和接受程度的調(diào)查
      中成藥(2018年11期)2018-11-24 02:57:36
      怎樣數(shù)出小正方體的個數(shù)
      向量垂直在解析幾何中的應(yīng)用
      向量五種“變身” 玩轉(zhuǎn)圓錐曲線
      淺析民族音樂在小學(xué)音樂中的教育作用
      魅力中國(2015年32期)2015-08-06 11:09:40
      晋中市| 扎赉特旗| 双流县| 海南省| 措美县| 大足县| 延寿县| 台北县| 雷山县| 婺源县| 苏尼特左旗| 吐鲁番市| 阿尔山市| 唐河县| 扶沟县| 炎陵县| 鹤山市| 东平县| 高雄市| 德庆县| 河东区| 伊春市| 阜新市| 洛隆县| 舟山市| 海南省| 綦江县| 南郑县| 离岛区| 桃江县| 通道| 鄂伦春自治旗| 喀喇| 嘉兴市| 筠连县| 瑞金市| 萨嘎县| 依安县| 丹棱县| 彭山县| 攀枝花市|