• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于改進(jìn)Apriori算法的配電網(wǎng)設(shè)備退役信息挖掘

      2021-09-13 04:11:44廖孟柯李忠政
      科學(xué)技術(shù)與工程 2021年24期
      關(guān)鍵詞:復(fù)雜度數(shù)據(jù)挖掘配電網(wǎng)

      廖孟柯,樊 冰,李忠政,付 林,舒 楠*

      (1.國(guó)網(wǎng)新疆電力有限公司經(jīng)濟(jì)技術(shù)研究院,烏魯木齊 830002; 2.華北電力大學(xué)電氣與電子工程學(xué)院,北京 102206)

      配電網(wǎng)設(shè)備作為電網(wǎng)的重要組成設(shè)備,是影響電網(wǎng)運(yùn)行安全性和穩(wěn)定性的重要因素[1]。隨著配電網(wǎng)設(shè)備資產(chǎn)規(guī)模不斷擴(kuò)大,合理提高設(shè)備利用率降低設(shè)備成本顯得愈發(fā)重要[2]。通過(guò)對(duì)配電網(wǎng)設(shè)備退役信息研究,挖掘出影響因素不僅對(duì)設(shè)備的設(shè)計(jì)制造具有實(shí)際意義[3],并且能夠完善配電網(wǎng)退役策略,有效地指導(dǎo)配電網(wǎng)設(shè)備的運(yùn)維管理,提高配電網(wǎng)資產(chǎn)使用效率,優(yōu)化配電網(wǎng)設(shè)備配置及更新方案[4-5]。一些學(xué)者在不同的方面考慮到了可能會(huì)造成配電網(wǎng)設(shè)備提前退役的因素。文獻(xiàn)[6]研究了配電網(wǎng)設(shè)備運(yùn)行環(huán)境的溫度會(huì)加快設(shè)備老化的速度。文獻(xiàn)[7]表明氣壓會(huì)影響設(shè)備散熱以及絕緣的性能。文獻(xiàn)[8]研究發(fā)現(xiàn)極端環(huán)境因素會(huì)增加設(shè)備故障的概率。但由于配電網(wǎng)設(shè)備種類繁多,工作場(chǎng)景各異,可能涉及的影響因素錯(cuò)綜復(fù)雜。但目前尚無(wú)利用數(shù)據(jù)挖掘手段針對(duì)不同種設(shè)備退役因素的系統(tǒng)研究,無(wú)法有效地指導(dǎo)退役決策,使得配電網(wǎng)設(shè)備投資效率普遍較低。

      利用數(shù)據(jù)挖掘手段可以在龐大的配電網(wǎng)設(shè)備退役信息中得到對(duì)設(shè)備退役影響關(guān)系緊密的各個(gè)因素。其中,Apriori算法是最經(jīng)典的數(shù)據(jù)挖掘算法。但是傳統(tǒng)的Apriori算法在計(jì)算過(guò)程中存在大量冗余過(guò)程。隨著數(shù)據(jù)量的增加,算法的時(shí)間復(fù)雜度會(huì)大大增加[9-10]。針對(duì)這一問(wèn)題,對(duì)Apriori算法進(jìn)行改進(jìn),應(yīng)用在配電網(wǎng)設(shè)備提前退役信息的挖掘中,更高效地探究外部因素對(duì)設(shè)備退役的影響情況。

      1 配電網(wǎng)設(shè)備退役相關(guān)信息處理

      1.1 配電網(wǎng)設(shè)備退役相關(guān)指標(biāo)

      較為成熟的配電網(wǎng)設(shè)備全壽命周期管理與研究的發(fā)展已積累了眾多壽命數(shù)據(jù)。如表1所示,根據(jù)配電網(wǎng)設(shè)備全壽命數(shù)據(jù)可以分為基礎(chǔ)數(shù)據(jù)、檢試數(shù)據(jù)、實(shí)時(shí)數(shù)據(jù)、環(huán)境數(shù)據(jù)、經(jīng)濟(jì)數(shù)據(jù)和其他數(shù)據(jù)等6類[11-12]。

      表1 配電網(wǎng)設(shè)備全壽命周期數(shù)據(jù)分類

      主要研究環(huán)境因素對(duì)配電網(wǎng)設(shè)備的影響,較為關(guān)切其中的環(huán)境數(shù)據(jù)。因此在進(jìn)行統(tǒng)計(jì)配電網(wǎng)設(shè)備的退役信息時(shí),對(duì)目標(biāo)設(shè)備搜集的信息應(yīng)包括設(shè)備類型、設(shè)備壽命、設(shè)備地域等基礎(chǔ)數(shù)據(jù)之外,還需要收集設(shè)備相關(guān)的環(huán)境數(shù)據(jù)。

      1.2 配電網(wǎng)設(shè)備退役相關(guān)數(shù)據(jù)的預(yù)處理

      根據(jù)配電網(wǎng)設(shè)備的相關(guān)指標(biāo),收集目標(biāo)設(shè)備相關(guān)信息,并且對(duì)收集的數(shù)據(jù)進(jìn)行預(yù)處理。配電網(wǎng)設(shè)備的壽命數(shù)據(jù)分布連續(xù)且區(qū)間較長(zhǎng),在應(yīng)用前需先對(duì)設(shè)備壽命的分布曲線進(jìn)行分析,取分布曲線中段分布較為集中且數(shù)據(jù)量足夠的部分,平均分為3段進(jìn)行離散化。根據(jù)設(shè)備的設(shè)計(jì)壽命將其劃分為正常退役、稍早退役和較早退役。

      對(duì)環(huán)境數(shù)據(jù)需要進(jìn)行二值化處理。依據(jù)氣象預(yù)警標(biāo)準(zhǔn)以及配電網(wǎng)設(shè)備的物理特性劃定因素是否會(huì)影響設(shè)備狀態(tài)的標(biāo)準(zhǔn)[13-15]。如果氣溫大于 35 ℃ 視為高溫情況,氣溫低于0 ℃視為低溫情況。如果相對(duì)濕度大于90%視為過(guò)濕情況。如果海拔高于2 500 m視為高海拔。如果有沙塵暴天氣算受沙塵影響情況。如果所受風(fēng)力大于八級(jí)算強(qiáng)風(fēng)情況。符合條件的屬性按所在列順序進(jìn)行標(biāo)號(hào),不符合的則不記。部分?jǐn)?shù)據(jù)記錄如表2所示。

      表2 部分配電網(wǎng)設(shè)備退役信息

      2 基于三維矩陣的數(shù)據(jù)挖掘算法

      2.1 算法描述

      2.1.1 相關(guān)定義

      挖掘關(guān)聯(lián)規(guī)則所用到的每一條事務(wù)t存儲(chǔ)在數(shù)據(jù)倉(cāng)庫(kù)D中,記為

      D={t1,t2,…,tM}

      (1)

      式(1)中:每一條事務(wù)t由各項(xiàng)屬性i構(gòu)成,可表示為

      t={i1,i2,…,iN}

      (2)

      定義屬性X和Y之間的關(guān)聯(lián)規(guī)則為X?Y。該關(guān)聯(lián)規(guī)則的支持度Support等于事務(wù)同時(shí)擁有屬性X和屬性Y的數(shù)量與總事務(wù)數(shù)的比值,可表示

      (3)

      式(3)中:M為事務(wù)的總數(shù);Count(X∪Y)為屬性X和屬性Y同時(shí)出現(xiàn)的事務(wù)的次數(shù)。

      該關(guān)聯(lián)規(guī)則的置信度Confidence等于規(guī)則的支持度與屬性X本身的支持度之比,可表示

      (4)

      式(4)中:Support(X)為屬性X出現(xiàn)的次數(shù)。

      數(shù)據(jù)挖掘通過(guò)設(shè)置最小支持度和最小置信度來(lái)控制所得關(guān)聯(lián)規(guī)則需要滿足的最低要求。

      2.1.2 算法過(guò)程

      傳統(tǒng)的Apriori算法在數(shù)據(jù)量較大且分析類別較多的情況下會(huì)產(chǎn)生大量的候選項(xiàng)集,尤其是生成二項(xiàng)集和三項(xiàng)集時(shí)。并且在進(jìn)行每次生成更高一級(jí)的頻繁項(xiàng)集時(shí),都需要重新掃描數(shù)據(jù)庫(kù),會(huì)產(chǎn)生大量計(jì)算冗余,效率較低。在Apriori算法的基礎(chǔ)上,針對(duì)傳統(tǒng)算法的這些缺點(diǎn),進(jìn)行了改進(jìn)。改進(jìn)后的算法思路如下。

      (1)首先掃描數(shù)據(jù)庫(kù),將數(shù)據(jù)庫(kù)根據(jù)所有其事務(wù)所含有的屬性,抽象成二維矩陣,用于存儲(chǔ)該數(shù)據(jù)庫(kù)中所有的信息。

      (2)遍歷二維矩陣中每個(gè)事務(wù)的每個(gè)屬性。通過(guò)每次讀取同一事務(wù)中的兩個(gè)不同屬性且不重復(fù)讀取,建立三維上三角屬性矩陣Matrix(i,j,k),并根據(jù)對(duì)應(yīng)的屬性來(lái)建立坐標(biāo)。三個(gè)維度上的坐標(biāo)區(qū)間均為[1,N](N為最大屬性種類)。掃描過(guò)程中,坐標(biāo)每重復(fù)一次,對(duì)應(yīng)的權(quán)重加一,矩陣可表示為

      Matrix(i,j,k)=Matrix(i,j,k)+1

      (5)

      (3)其次通過(guò)讀取三維屬性矩陣,直接獲取頻繁一項(xiàng)集、頻繁二項(xiàng)集和頻繁三項(xiàng)集。三維矩陣第一卦限的空間對(duì)角線上即頻繁一項(xiàng)集的支持度,對(duì)應(yīng)平面上的坐標(biāo)(i,j,j)為頻繁二項(xiàng)集的支持度,坐標(biāo)(i,j,k)為對(duì)應(yīng)三項(xiàng)集的支持度。

      (4)因?yàn)樵趯傩詳?shù)量小于k的事務(wù)中,必然不存在含有k項(xiàng)集的可能。因此在得到頻繁三項(xiàng)集后,掃描數(shù)據(jù)庫(kù)。刪去包含的屬性不大于四項(xiàng)的事務(wù),簡(jiǎn)約數(shù)據(jù)庫(kù)。

      (5)通過(guò)已經(jīng)得到的頻繁三項(xiàng)集,再利用標(biāo)準(zhǔn)的Apriori算法進(jìn)行后續(xù)計(jì)算。

      具體的算法流程如圖1所示。

      圖1 三維矩陣算法流程

      2.2 算法時(shí)間復(fù)雜度分析

      假設(shè)數(shù)據(jù)庫(kù)中事務(wù)數(shù)量為M,事務(wù)平均屬性數(shù)量為n,屬性數(shù)量小于4的事務(wù)比例為b。表示頻繁k項(xiàng)集的項(xiàng)集數(shù)量,表示候選k項(xiàng)集的項(xiàng)集數(shù)量。

      參考文獻(xiàn)[16]對(duì)傳統(tǒng)Apriori算法的時(shí)間復(fù)雜度的分析,對(duì)比兩種算法的時(shí)間復(fù)雜度,時(shí)間復(fù)雜度用O表示。Apriori算法在形成頻繁一項(xiàng)集L1后,通過(guò)連枝得到候選二項(xiàng)集的時(shí)間復(fù)雜度表示為

      (6)

      隨后通過(guò)掃描數(shù)據(jù)庫(kù),計(jì)算支持度得到頻繁二項(xiàng)集L2的時(shí)間復(fù)雜度表示為

      (7)

      (8)

      可見(jiàn)式(8)表示的復(fù)雜度與式(6)相同,則計(jì)算頻繁二項(xiàng)集L2的過(guò)程中,基于三維矩陣的數(shù)據(jù)挖掘算法可以節(jié)省的時(shí)間為式(6)+式(7)-式(8)=式(7)。可以看出計(jì)算頻繁二項(xiàng)集的過(guò)程節(jié)省的時(shí)間與M、n和L1有關(guān),在較大的數(shù)據(jù)樣本中能夠有效地節(jié)省計(jì)算時(shí)間。

      根據(jù)頻繁二項(xiàng)集L2,通過(guò)連枝、剪枝得到候選三項(xiàng)集的時(shí)間復(fù)雜度,可表示為

      O[L2(L2-1)]

      (9)

      隨后通過(guò)掃描數(shù)據(jù)庫(kù),計(jì)算支持度得到頻繁三項(xiàng)集C3的時(shí)間復(fù)雜度,可表示為

      O(C3Mn)

      (10)

      而利用三維矩陣的形式得到頻繁三項(xiàng)集,只需要按照候選三項(xiàng)集中的各候選項(xiàng)集(i,j,k)逐一讀取矩陣中對(duì)應(yīng)坐標(biāo)的支持度,即可得到頻繁三項(xiàng)集。其時(shí)間復(fù)雜度可表示為

      O(C3)

      (11)

      則計(jì)算頻繁三項(xiàng)集的過(guò)程,基于三維矩陣的數(shù)據(jù)挖掘算法可以節(jié)省的時(shí)間為式(9)+式(10)-式(11),可表示為

      O{L2(L2-1)+C3[(MN)-1]}

      (12)

      顯然式(12)遠(yuǎn)大于0,且節(jié)省的時(shí)間與M、n、L2和C3有關(guān)。在進(jìn)行較大數(shù)據(jù)集的關(guān)聯(lián)規(guī)則挖掘時(shí)能夠節(jié)省大量的計(jì)算時(shí)間。在進(jìn)行后續(xù)計(jì)算前,會(huì)刪去屬性數(shù)量小于4的事務(wù)。因此在每次掃描數(shù)據(jù)庫(kù)的時(shí)候,能夠減少的最大時(shí)間復(fù)雜度為

      O(bM3)

      (13)

      能夠減少的最小時(shí)間復(fù)雜度為

      O(bM)

      (14)

      對(duì)比分析可知,改進(jìn)后的算法較傳統(tǒng)的Apriori算法降低了時(shí)間復(fù)雜度,提高了計(jì)算的效率。

      3 配電網(wǎng)設(shè)備退役因素挖掘

      3.1 配電網(wǎng)設(shè)備退役信息采集

      期望挖掘配電網(wǎng)設(shè)備與外部自然環(huán)境因素之間的關(guān)聯(lián)性,需要在溫度、濕度、氣壓、風(fēng)力、沙暴等環(huán)境因素具有鮮明特色的地域進(jìn)行分析。因此選取具有地域特色的3個(gè)典型城市的配電網(wǎng)設(shè)備數(shù)據(jù)(表3),按照1.2節(jié)提出的預(yù)處理方法進(jìn)行處理。

      表3 配電網(wǎng)設(shè)備地域信息

      3.2 配電網(wǎng)設(shè)備退役主要因素

      為了準(zhǔn)確挖掘出外部因素對(duì)配電網(wǎng)設(shè)備的影響,分析時(shí)使用相同的設(shè)備類型,以三地提供的變壓器設(shè)備退役數(shù)據(jù)為例進(jìn)行關(guān)聯(lián)規(guī)則挖掘。各地域均選取400條變壓器退役信息進(jìn)行數(shù)據(jù)挖掘。設(shè)最小支持度Smin=0.1和最小置信度Cmin=0.5。從計(jì)算出的關(guān)聯(lián)規(guī)則中篩選出具有分析價(jià)值的部分關(guān)聯(lián)規(guī)則進(jìn)行分析。

      喀什地區(qū)部分關(guān)聯(lián)規(guī)則如表4所示,可以看出:喀什地區(qū)較常發(fā)生強(qiáng)風(fēng)和沙塵暴天氣,兩者共同對(duì)當(dāng)?shù)氐淖儔浩魍艘郛a(chǎn)生影響。其中強(qiáng)風(fēng)天氣發(fā)生的概率更高,對(duì)設(shè)備的影響也較大,是當(dāng)?shù)刈儔浩魈崆巴艘鄣闹饕蛩?。沙塵暴發(fā)生概率較低,屬于次要因素。

      表4 喀什地區(qū)部分關(guān)聯(lián)規(guī)則

      拉薩地區(qū)部分關(guān)聯(lián)規(guī)則如表5所示,可以得到結(jié)論:拉薩地區(qū)對(duì)變壓器提前退役產(chǎn)生影響的主要是低溫和高海拔因素,強(qiáng)風(fēng)是次要因素。低溫和高海拔的關(guān)系較為緊密,同時(shí)高海拔也帶來(lái)了低氣壓的因素,共同影響變壓器設(shè)備提前退役。

      表5 拉薩地區(qū)部分關(guān)聯(lián)規(guī)則

      廣州地區(qū)部分關(guān)聯(lián)規(guī)則如表6所示,可以得到結(jié)論:廣州地區(qū)對(duì)變壓器提前退役的主要因素有高溫、過(guò)濕和強(qiáng)風(fēng)。其中高溫與過(guò)濕因素聯(lián)系較為緊密,可以猜測(cè)雨熱同期可能會(huì)加速設(shè)備腐蝕。高溫與強(qiáng)風(fēng)因素聯(lián)系緊密,且強(qiáng)風(fēng)更易導(dǎo)致設(shè)備較早退役,可以猜測(cè)強(qiáng)風(fēng)天氣對(duì)設(shè)備影響更大。

      表6 廣州地區(qū)部分關(guān)聯(lián)規(guī)則

      3.3 配電網(wǎng)設(shè)備退役信息挖掘效率分析

      使用基于三維矩陣的數(shù)據(jù)挖掘算法對(duì)配電網(wǎng)設(shè)備退役數(shù)據(jù)進(jìn)行計(jì)算,并在相同的最小支持度和最小置信度條件下與傳統(tǒng)的Apriori算法以及文獻(xiàn)[17]中提出的壓縮矩陣算法進(jìn)行比對(duì)。3種算法的運(yùn)行時(shí)間對(duì)比如圖2所示。

      圖2 算法運(yùn)行時(shí)間對(duì)比

      通過(guò)比較發(fā)現(xiàn),利用三維矩陣算法在運(yùn)行時(shí)間上有明顯的優(yōu)勢(shì)。另外地,通過(guò)比較傳統(tǒng)Apriori算法與三維矩陣算法運(yùn)行時(shí)間來(lái)得出優(yōu)化效率。優(yōu)化效率η的計(jì)算公式為

      (15)

      式(15)中:t1為傳統(tǒng)的Apriori算法運(yùn)行時(shí)間;t2為改進(jìn)算法運(yùn)行時(shí)間。

      比較結(jié)果如表7所示,可以看出,相較于傳統(tǒng)算法,基于三維矩陣的數(shù)據(jù)挖掘算法在關(guān)聯(lián)規(guī)則挖掘的效率上有明顯的優(yōu)化,各地區(qū)數(shù)據(jù)的優(yōu)化效率平均能達(dá)到24.95%。

      表7 配電網(wǎng)設(shè)備退役信息效率分析

      4 結(jié)論

      對(duì)傳統(tǒng)的Apriori算法進(jìn)行改進(jìn),并針對(duì)3個(gè)地區(qū)的變壓器設(shè)備進(jìn)行數(shù)據(jù)挖掘,對(duì)挖掘結(jié)果以及計(jì)算效率進(jìn)行分析,得出如下結(jié)論。

      (1)提出的一種利用三維矩陣的數(shù)據(jù)挖掘算法,改善了傳統(tǒng)Apriori算法計(jì)算時(shí)間復(fù)雜度過(guò)大的不足,并驗(yàn)證了計(jì)算效率的提高。

      (2)通過(guò)算例進(jìn)行關(guān)聯(lián)規(guī)則的挖掘,使用本文算法得到了外部自然因素與配電網(wǎng)設(shè)備壽命之間的關(guān)聯(lián)性。證明該算法能夠應(yīng)用于配電網(wǎng)設(shè)備退役信息的挖掘。

      猜你喜歡
      復(fù)雜度數(shù)據(jù)挖掘配電網(wǎng)
      探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢(shì)
      一種低復(fù)雜度的慣性/GNSS矢量深組合方法
      配電網(wǎng)自動(dòng)化的應(yīng)用與發(fā)展趨勢(shì)
      求圖上廣探樹(shù)的時(shí)間復(fù)雜度
      基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
      電力與能源(2017年6期)2017-05-14 06:19:37
      基于IEC61850的配電網(wǎng)數(shù)據(jù)傳輸保護(hù)機(jī)制
      某雷達(dá)導(dǎo)51 頭中心控制軟件圈復(fù)雜度分析與改進(jìn)
      配電網(wǎng)不止一步的跨越
      河南電力(2016年5期)2016-02-06 02:11:24
      一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
      出口技術(shù)復(fù)雜度研究回顧與評(píng)述
      石首市| 教育| 镇雄县| 南陵县| 夏河县| 镇赉县| 昌邑市| 通山县| 庆元县| 剑阁县| 司法| 南汇区| 弥勒县| 安丘市| 新干县| 清原| 温州市| 崇阳县| 禹州市| 双桥区| 库车县| 博客| 科尔| 翁源县| 宜宾县| 大方县| 西充县| 高陵县| 关岭| 化隆| 囊谦县| 布尔津县| 博野县| 西乡县| 镇雄县| 大安市| 台北市| 彭山县| 科技| 蕉岭县| 高淳县|