• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于stacking模型的竊漏電用戶檢測(cè)

      2020-10-09 10:23:04譚臺(tái)哲周宇才謝旭軒
      電腦知識(shí)與技術(shù) 2020年18期

      譚臺(tái)哲 周宇才 謝旭軒

      摘要:為了進(jìn)一步提高對(duì)竊漏電用戶檢測(cè)的準(zhǔn)確性,本文提出了一種基于Stacking融合模型對(duì)竊漏電用戶進(jìn)行分類(lèi)的檢測(cè)方法。該模型分成兩層架構(gòu),第一層基礎(chǔ)模型對(duì)原始特征進(jìn)行特征變換后得到新的二級(jí)特征,再把二級(jí)特征輸入到第二層訓(xùn)練元學(xué)習(xí)器從而實(shí)現(xiàn)對(duì)樣本數(shù)據(jù)的最終分類(lèi)。實(shí)驗(yàn)結(jié)果表明,stacking融合模型很好融合了各個(gè)單一模型的優(yōu)點(diǎn),相比于單一的分類(lèi)模型,Stacking模型表現(xiàn)出了更好的檢測(cè)效果。

      關(guān)鍵詞:竊漏電;AdaBoost;KNN;CART決策樹(shù);Stacking

      中圖分類(lèi)號(hào):TP311 文獻(xiàn)標(biāo)識(shí)碼:A

      文章編號(hào):1009-3044(2020)18-0207-02

      開(kāi)放科學(xué)(資源服務(wù))標(biāo)識(shí)碼(OSID):

      用戶的竊漏電行為一直是電力系統(tǒng)行業(yè)需要解決的一個(gè)痛點(diǎn)問(wèn)題,竊漏電行為不僅擾亂了用電市場(chǎng)的正常秩序,還會(huì)因?yàn)橛秒娺^(guò)載而可能破壞供電設(shè)備以及計(jì)量裝置,甚至還可能引發(fā)火災(zāi)等嚴(yán)重問(wèn)題。信息技術(shù)在電力系統(tǒng)的應(yīng)用,使得竊漏電檢測(cè)不再只單純的依賴人工定期巡檢和定期檢驗(yàn)電表等方式來(lái)發(fā)現(xiàn)問(wèn)題,大大地提高了竊漏電檢測(cè)的效率和準(zhǔn)確度。

      本文使用Adaboost算法、KNN算法和CART決策樹(shù)算法來(lái)構(gòu)建基礎(chǔ)分類(lèi)模型,并基于Stacking方法融合這三種基礎(chǔ)分類(lèi)模型對(duì)竊漏電用戶進(jìn)行分類(lèi)檢測(cè)。實(shí)驗(yàn)結(jié)果表明,融合多模型的stacking方法能很好地識(shí)別出竊漏電用戶。

      1 算法介紹

      1.1 Adaboost算法

      1.2 KNN算法

      KNN算法的思想和實(shí)現(xiàn)都比較簡(jiǎn)單,基本原理是在訓(xùn)練數(shù)據(jù)中選取k個(gè)跟測(cè)試數(shù)據(jù)距離較近的樣本點(diǎn),并判斷選取的k個(gè)樣本中哪種標(biāo)簽所占的比例最高,從而得出測(cè)試數(shù)據(jù)的標(biāo)簽類(lèi)別。

      算法的基本流程可總結(jié)如下:

      (1)輸入訓(xùn)練數(shù)據(jù)和測(cè)試數(shù)據(jù)。

      (2)計(jì)算測(cè)試數(shù)據(jù)和訓(xùn)練數(shù)據(jù)各樣本點(diǎn)間的距離。

      (3)對(duì)計(jì)算出的測(cè)試數(shù)據(jù)和訓(xùn)練數(shù)據(jù)的距離進(jìn)行從小到大的排序,選取出k個(gè)距離最小的數(shù)據(jù)樣本點(diǎn)。

      (4)統(tǒng)計(jì)選取出的k個(gè)訓(xùn)練樣本數(shù)據(jù)的標(biāo)簽類(lèi)型,根據(jù)多數(shù)表決的決策方法,出現(xiàn)頻率次數(shù)最高的標(biāo)簽就是測(cè)試數(shù)據(jù)的預(yù)

      其中,Dv為數(shù)據(jù)集中取值為v的樣本。CART決策樹(shù)的實(shí)現(xiàn)步驟如下:

      (1)計(jì)算數(shù)據(jù)集D的基尼值,并計(jì)算數(shù)據(jù)集D中每一個(gè)屬性的基尼指數(shù)Gini_index(D,a)。

      (2)選擇基尼指數(shù)最小的特征,根據(jù)其特征值對(duì)數(shù)據(jù)進(jìn)行劃分。

      (3)去除上述步驟已被選擇的特征,在每個(gè)已被劃分的數(shù)據(jù)集中重復(fù)上述步驟直到所有樣本數(shù)據(jù)不能再次劃分。

      (4)生成CART決策樹(shù)。

      1.4 Stacking算法

      Stackingc2]的基本思想是通過(guò)融合多個(gè)單一模型來(lái)提升算法整體性能。算法本質(zhì)上是一種分層結(jié)構(gòu),第一層為基模型層,其輸出結(jié)果將被當(dāng)作新的特征輸入到第二層當(dāng)中訓(xùn)練模型,第二層的輸出結(jié)果輸入到第三層訓(xùn)練模型,以此類(lèi)推,最后一層的輸出即為模型的分類(lèi)結(jié)果。

      本文的算法模型設(shè)計(jì)為二層結(jié)構(gòu),選取AdaBoost、KNN和CART決策樹(shù)模型作為第一層基礎(chǔ)模型,由SVM作為元分類(lèi)器輸出最后的分類(lèi)類(lèi)別。由于實(shí)驗(yàn)數(shù)據(jù)樣本較小,為了保證模型能夠更好地學(xué)習(xí)到所有的數(shù)據(jù),本文以5折交叉驗(yàn)證的方式來(lái)對(duì)數(shù)據(jù)進(jìn)行學(xué)習(xí),算法具體的實(shí)現(xiàn)步驟如下:

      (1)將原始數(shù)據(jù)劃分為訓(xùn)練集和測(cè)試集后,把訓(xùn)練集分成5份為模型訓(xùn)練做準(zhǔn)備。

      (2)不重復(fù)的在步驟(1)中劃分的5份訓(xùn)練集數(shù)據(jù)選取4份對(duì)AdaBoost、KNN和CART決策樹(shù)模型進(jìn)行訓(xùn)練,每訓(xùn)練完一個(gè)模型就用剩下的1份數(shù)據(jù)進(jìn)行預(yù)測(cè),得到的預(yù)測(cè)結(jié)果作為第二層模型的特征輸入值。

      (3)每訓(xùn)練完一個(gè)基礎(chǔ)模型后,就用整個(gè)測(cè)試集來(lái)做預(yù)測(cè),最終產(chǎn)生5份預(yù)測(cè)結(jié)果取其平均值作為下一層輸入。

      (4)步驟(2)輸出的預(yù)測(cè)結(jié)果作為第二層模型的輸入,訓(xùn)練第二屋模型;步驟(3)輸出的結(jié)果作為新的測(cè)試集對(duì)模型進(jìn)行測(cè)試,得出整個(gè)模型的分類(lèi)結(jié)果。

      2 實(shí)驗(yàn)結(jié)果與分析

      2.1 數(shù)據(jù)集

      本文實(shí)驗(yàn)數(shù)據(jù)選自某市①經(jīng)過(guò)處理后的竊漏電用戶數(shù)據(jù),數(shù)據(jù)包含291條竊漏電用戶的統(tǒng)計(jì)數(shù)據(jù),包括經(jīng)過(guò)特征處理后提取出來(lái)的電量趨勢(shì)下降指標(biāo)、線損指標(biāo)和告警類(lèi)指標(biāo)三類(lèi)特征。

      電量趨勢(shì)的值是以某一天及其前后5天為統(tǒng)計(jì)周期,然后用電量直線擬合的斜率[3]。其計(jì)算公式為:

      2.3 結(jié)果分析

      單個(gè)基礎(chǔ)模型和Stacking融合模型的實(shí)驗(yàn)結(jié)果對(duì)比如下表1。

      實(shí)驗(yàn)的預(yù)測(cè)結(jié)果顯示,Stacking融合模型的精確率明顯高于AdaBoost、KNN和CART決策樹(shù)模型,證明了模型的可行性。F.值是精確率和召回率的調(diào)和平均值,作為精確率和回召率的綜合評(píng)價(jià)指標(biāo),Stacking融合模型的F.值也高于三個(gè)單一的基礎(chǔ)模型,反映了本文提出模型性能的有效性和穩(wěn)健性。

      3 結(jié)語(yǔ)

      介召了AdaBoost、KNN以及CART決策樹(shù)算法,并以這三個(gè)算法為基礎(chǔ)模型構(gòu)建了用于檢測(cè)竊漏電用戶的Stacking融合模型。實(shí)驗(yàn)結(jié)果表明,本文提出的竊漏電用戶檢測(cè)模型相比于單個(gè)檢測(cè)模型在綜合性能上表現(xiàn)出了一定的優(yōu)勢(shì),對(duì)于輔助斷定用戶是否存在竊漏電行為具有一定的指導(dǎo)性作用。

      注釋?zhuān)?/p>

      ①https://edu.tipdm.org/c ourse/96

      參考文獻(xiàn):

      [1] Freund Y,Schapire R E.A decision-theoretic generalizationof on-line learning and an application to boosting[Cl// Pro-ceedings of the Second European Conference on Computation-al Learning Theory. SpringeI-Verlag, 1995.

      [2] Wolpert D H.Stacked generalization[J]. Neural Networks,1992。5(2):241-259.

      [3]張良均,王路.Python數(shù)據(jù)分析與挖掘?qū)崙?zhàn)[M].北京:機(jī)械工業(yè)出版社,2015:154-156.

      【通聯(lián)編輯:唐一東】

      作者簡(jiǎn)介:譚臺(tái)哲(1970-),男,副教授,主要研究方向:機(jī)器學(xué)習(xí)、計(jì)算機(jī)視覺(jué)和生物特征識(shí)別;周宇才(1992-),男,碩士研究生,王要研究方向:數(shù)據(jù)挖掘;謝旭軒(1993-),男,碩士研究生,主要研究方向:深度學(xué)習(xí)。

      通榆县| 蕲春县| 修武县| 玉田县| 三原县| 阿尔山市| 漾濞| 宁明县| 门源| 嘉祥县| 临泽县| 拜城县| 蛟河市| 海晏县| 日照市| 庆阳市| 泰顺县| 永泰县| 大城县| 集安市| 望江县| 贵德县| 财经| 清原| 宁强县| 弥勒县| 襄樊市| 茶陵县| 田阳县| 南皮县| 承德县| 琼中| 茌平县| 宁乡县| 宁国市| 淮阳县| 乡城县| 兴国县| 五河县| 永平县| 彩票|