• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于統(tǒng)計(jì)學(xué)習(xí)方法的模型構(gòu)建與數(shù)據(jù)分析

      2021-09-06 08:55:30瑞,唐
      喀什大學(xué)學(xué)報(bào) 2021年3期
      關(guān)鍵詞:企業(yè)管理者分類器標(biāo)簽

      姚 瑞,唐 泉

      (新疆師范大學(xué) 數(shù)學(xué)科學(xué)學(xué)院,烏魯木齊 830017)

      統(tǒng)計(jì)學(xué)習(xí),也稱為統(tǒng)計(jì)機(jī)器學(xué)習(xí),在計(jì)算機(jī)及其應(yīng)用領(lǐng)域中具有重要意義.統(tǒng)計(jì)學(xué)習(xí)[1]的主要方法是基于數(shù)據(jù)建立統(tǒng)計(jì)模型來(lái)預(yù)測(cè)和分析數(shù)據(jù),由監(jiān)督學(xué)習(xí)、非監(jiān)督學(xué)習(xí)、半監(jiān)督學(xué)習(xí)和強(qiáng)化學(xué)習(xí)組成,包括k近鄰法、樸素貝葉斯方法、支持向量機(jī)等方法.半監(jiān)督學(xué)習(xí)是一種同時(shí)兼顧標(biāo)簽樣本和無(wú)標(biāo)簽樣本的學(xué)習(xí)方法,利用標(biāo)記樣本的優(yōu)點(diǎn)來(lái)精確描述單個(gè)樣本,同時(shí)使用大量無(wú)標(biāo)記數(shù)據(jù)來(lái)進(jìn)一步提高分類器的性能[2].半監(jiān)督支持向量機(jī)(S3VM)最初應(yīng)用于文本分類[3],主要有梯度下降法(Gradient descent)[4]、確定性退火方法(Deterministic annealing)[5]和半正定規(guī)劃方法(Semi-definite programming)[6]等研究方法.模糊支持向量機(jī)在傳統(tǒng)支持向量機(jī)基礎(chǔ)上提出,分類精度和回歸精度更高,查翔等[7]提出了一種基于多區(qū)域劃分的模糊支持向量機(jī)方法;譚萍等[8]結(jié)合模糊C-均值與FSVM 提出了一種多級(jí)的模糊支持向量機(jī)對(duì)說(shuō)話人進(jìn)行語(yǔ)音識(shí)別;Muscat R 等[9]提出了分層模糊支持向量機(jī)模型.本文討論支持向量機(jī)模型,對(duì)支持向量機(jī)模型的基本思想、發(fā)展完善及應(yīng)用情況進(jìn)行概述,并深入探討一種通過(guò)識(shí)別誤分類點(diǎn)來(lái)構(gòu)造半監(jiān)督的模糊支持向量機(jī)模型及算法實(shí)現(xiàn).

      1 模糊支持向量機(jī)

      1.1 線性可分的模糊支持向量機(jī)

      對(duì)于模糊訓(xùn)練集

      模糊約束規(guī)劃為:

      其中,λ(0 ≤λ≤1)為置信區(qū)間.

      其對(duì)偶問(wèn)題為:

      Step4:計(jì)算ω*和b*,如式(4);

      Step5:構(gòu)造最優(yōu)分類超平面(ω*·x)+b*=0,得到最優(yōu)分類函數(shù)式(5).

      2.2 非線性可分的模糊支持向量機(jī)

      對(duì)于模糊非線性問(wèn)題,引入變換

      則對(duì)應(yīng)的模糊非線性訓(xùn)練集變換為:

      其中,Xi=Φ(xi) (i=1,···,l).在置信水平λ(0 ≤λ≤1)下,模糊分類問(wèn)題轉(zhuǎn)化為:

      其中,C>0為懲罰參數(shù);ξi=(ξ1,…,ξl)T為松弛變量.

      該二次規(guī)劃存在最優(yōu)解,通過(guò)取適當(dāng)?shù)暮撕瘮?shù),使得K(xi,xj)=Φ(xi)·Φ(xj).可求得二次規(guī)劃式的對(duì)偶問(wèn)題為:

      最優(yōu)分類超平面為(ω*·x)+b*=0,令g(x)=(ω*·x)+b*,最優(yōu)分類函數(shù)為:

      模糊支持向量機(jī)的算法:

      Step1:構(gòu)造隸屬度函數(shù),確定隸屬度

      Step2:給定模糊非線性可分的訓(xùn)練集

      Step3:求解線性規(guī)劃式(8)得到最優(yōu)解

      Step4:求解(10),計(jì)算b*;

      Step5:構(gòu)造最優(yōu)分類超平面(ω*·x)+b*=0,得到最優(yōu)分類函數(shù)式(11).

      2 一種半監(jiān)督模糊支持向量機(jī)的模型

      2.1 半監(jiān)督支持向量機(jī)模型

      由于可疑的誤標(biāo)記點(diǎn)仍包含有用信息,如特征位置信息,在數(shù)據(jù)分類中仍起重要作用,為充分利用可疑的誤標(biāo)記點(diǎn),下文使用位置信息的方法獲得最佳分離.

      對(duì)于集合S中任一點(diǎn),保留位置信息xi,刪除標(biāo)簽yi.令Xl=S表示所有標(biāo)簽訓(xùn)練點(diǎn)數(shù)據(jù)集,Xu={1,…,n} 是無(wú)標(biāo)簽訓(xùn)練點(diǎn)的數(shù)據(jù)集.假設(shè)令yi表示標(biāo)簽向量,軟間隔的半監(jiān)督二次曲面支持向量機(jī)(SSQSSVM)模型:

      2.2 分支與界定算法

      令α≥0n為拉格朗日對(duì)偶變量,則問(wèn)題(12)的拉格朗日函數(shù)可寫(xiě)為:

      對(duì)于一個(gè)給定的yu,任意向量α(yu) 使D(α(yu),yu)≤maxαD(α,yu).

      SVM 最優(yōu)值為下界,所有葉節(jié)點(diǎn)中目標(biāo)函數(shù)的最優(yōu)值為上界.

      2.3 半監(jiān)督模糊支持向量機(jī)算法

      輸入:訓(xùn)練數(shù)據(jù)集(xi,yi) (i=1,…,n);ε.

      Step1:用CL-stability 算法檢測(cè)訓(xùn)練集中可疑的錯(cuò)誤標(biāo)記點(diǎn)并刪除標(biāo)簽.獲得數(shù)據(jù)集Xl和Xuχu.設(shè)k=1,U=+∞.將原始問(wèn)題重新定義為(12).

      Step3:找到具有最小下界L的節(jié)點(diǎn).如果U-L<ε,則在該節(jié)點(diǎn)獲得返回值uˉ,算法停止并進(jìn)行Step4;否則,遵循深度優(yōu)先策略到達(dá)下一個(gè)節(jié)點(diǎn).給無(wú)標(biāo)記的點(diǎn)si分配標(biāo)簽yi,用分支相應(yīng)的si及標(biāo)簽-yi探索相反的分支.返回Step2.

      Step4:通過(guò)分解(14)中的uˉ得到原始空間中的分離二次曲面.

      3 算法的MATLAB實(shí)現(xiàn)

      3.1 MATLAB中的SVM算例

      圖1 和圖2 是人工數(shù)據(jù)集分類結(jié)果,準(zhǔn)確率達(dá)到100%.

      圖1 線性可分支持向量機(jī)

      圖2 線性不可分支持向量機(jī)

      圖3 使用Iris 數(shù)據(jù)集,在實(shí)驗(yàn)精度0.80的閾值下,選取數(shù)據(jù)中前兩個(gè)特征值,進(jìn)行實(shí)驗(yàn).

      圖3 Iris數(shù)據(jù)集實(shí)驗(yàn)

      3.2 實(shí)例分析

      本節(jié)將支持向量機(jī)應(yīng)用到國(guó)有企業(yè)管理者的考評(píng)系統(tǒng)中,將企業(yè)管理者的表現(xiàn)分為優(yōu)、良、中、差四個(gè)等級(jí),由于支持向量機(jī)是二分類模型,所以需要將多個(gè)支持向量機(jī)以子分類器的形式加以組合.

      表1將14家國(guó)有控股企業(yè)的管理者作為樣本,數(shù)據(jù)來(lái)源于毛惠媛對(duì)東北地區(qū)企業(yè)家管理創(chuàng)新機(jī)制的研究[10],用支持向量機(jī)對(duì)企業(yè)管理者的績(jī)效進(jìn)行考核等級(jí)的分類處理.

      表1 國(guó)有企業(yè)管理者評(píng)價(jià)指標(biāo)得分表

      由表1 可以看出,對(duì)企業(yè)管理者的考評(píng)打分的量綱是不同的,為了消除這一偏差,我們先對(duì)所有數(shù)據(jù)進(jìn)行歸一化處理,得到如表2中數(shù)據(jù).

      表2 國(guó)有企業(yè)管理者評(píng)價(jià)指標(biāo)得分歸一化處理結(jié)果

      在給出的14 位企業(yè)管理者的數(shù)據(jù)中,首先選定1~12 號(hào)企業(yè)管理者的數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),13 號(hào)與14 號(hào)企業(yè)管理者為測(cè)試數(shù)據(jù)集.1—3 號(hào)企業(yè)管理者的分類為優(yōu);4—6 號(hào)企業(yè)管理者的分類為良,7—9 號(hào)企業(yè)管理者的分類為中,10—12 號(hào)企業(yè)管理者的分類為差.

      將上述分類數(shù)據(jù)兩兩組合構(gòu)造子分類器,既構(gòu)造優(yōu)-良、優(yōu)-中、優(yōu)-差、良-中、良-差、中-差六個(gè)分類器,對(duì)進(jìn)行數(shù)據(jù)訓(xùn)練.由于上述訓(xùn)練數(shù)據(jù)集可能存在誤分類數(shù)據(jù),于是可以構(gòu)造模糊支持向量機(jī),將測(cè)試集分別帶入6 個(gè)子分類器中,出現(xiàn)頻數(shù)最多的分類結(jié)果認(rèn)定為對(duì)企業(yè)管理者績(jī)效的分類最終結(jié)果.訓(xùn)練得到六個(gè)子分類器的分類閾值分別為:-0.0244;-0.0082;-0.0214;0.5579;-0.2947;0.479.(詳見(jiàn)表3)

      表3 測(cè)試集分類結(jié)果

      從表3知,13號(hào)企業(yè)管理者的績(jī)效考核分類結(jié)果為“差”,14 號(hào)企業(yè)管理者的績(jī)效考核分類結(jié)果為“中”.

      4 總結(jié)

      本文提出的半監(jiān)督模糊支持向量機(jī)方法有效地縮短了計(jì)算時(shí)間,該算法比基準(zhǔn)SDP 松弛方法更高效.另外,本文將SVM 方法應(yīng)用于企業(yè)管理者的表現(xiàn)等級(jí)評(píng)定系統(tǒng)這一實(shí)際問(wèn)題,得到較好的分類結(jié)果.但該方法處理大規(guī)模的數(shù)據(jù)集(n>>1000)方面受限制.后續(xù),我們將考慮如何解決此問(wèn)題.

      猜你喜歡
      企業(yè)管理者分類器標(biāo)簽
      企業(yè)管理者縱論品牌建設(shè)
      無(wú)懼標(biāo)簽 Alfa Romeo Giulia 200HP
      車迷(2018年11期)2018-08-30 03:20:32
      不害怕撕掉標(biāo)簽的人,都活出了真正的漂亮
      海峽姐妹(2018年3期)2018-05-09 08:21:02
      BP-GA光照分類器在車道線識(shí)別中的應(yīng)用
      中國(guó)企業(yè)管理者心理健康調(diào)查研究
      加權(quán)空-譜與最近鄰分類器相結(jié)合的高光譜圖像分類
      結(jié)合模糊(C+P)均值聚類和SP-V-支持向量機(jī)的TSK分類器
      標(biāo)簽化傷害了誰(shuí)
      基于多進(jìn)制查詢樹(shù)的多標(biāo)簽識(shí)別方法
      企業(yè)管理者要為社會(huì)奉獻(xiàn)正能量
      灵川县| 琼结县| 渝中区| 塘沽区| 洛阳市| 宝兴县| 含山县| 安康市| 乌苏市| 大城县| 翁源县| 仁怀市| 汝城县| 于都县| 临城县| 庆阳市| 博野县| 临城县| 微博| 江北区| 乌拉特中旗| 阿尔山市| 通山县| 杭锦旗| 分宜县| 临潭县| 长寿区| 大悟县| 天津市| 锦州市| 松原市| 湛江市| 安远县| 三明市| 岱山县| 济宁市| 彩票| 华宁县| 呈贡县| 顺昌县| 怀仁县|