• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于AFWA的二次系統(tǒng)故障關(guān)聯(lián)分析參數(shù)優(yōu)化

      2022-08-17 08:16:50王鳴譽(yù)
      關(guān)鍵詞:煙花關(guān)聯(lián)規(guī)則

      徐 巖, 王鳴譽(yù), 范 文

      (新能源電力系統(tǒng)國(guó)家重點(diǎn)實(shí)驗(yàn)室(華北電力大學(xué)),河北 保定 071003)

      0 引 言

      在智能站中,二次設(shè)備的運(yùn)行狀態(tài)會(huì)影響整個(gè)變電站的工作情況。雖然智能站在經(jīng)濟(jì)、節(jié)能等方面存在優(yōu)勢(shì),但是也存在著二次設(shè)備邏輯回路不可視、故障排查難的特點(diǎn)。傳統(tǒng)的二次系統(tǒng)故障分析依賴人力,手段簡(jiǎn)單,在運(yùn)行人員面對(duì)海量數(shù)據(jù)時(shí),難以做出快速判斷,二次設(shè)備全部基于標(biāo)準(zhǔn)化的微處理機(jī)制造,可以實(shí)現(xiàn)信息交互,同時(shí)還具備自檢能力[1],并通過告警等方式輸出異常信號(hào)。通常情況下,智能站的二次設(shè)備故障記錄由調(diào)度人員記錄在在調(diào)度管理系統(tǒng)中,或者由檢修人員手動(dòng)記錄在調(diào)度管理系統(tǒng)中[2]。

      為了提升數(shù)據(jù)分析的效率,近年來數(shù)據(jù)挖掘技術(shù)在電力系統(tǒng)數(shù)據(jù)分析方面應(yīng)用越來越廣泛,文獻(xiàn)[3]利用Apriori算法結(jié)合聚類算法實(shí)現(xiàn)用戶側(cè)負(fù)荷分解;文獻(xiàn)[4]利用FP-growth算法實(shí)現(xiàn)電力設(shè)備故障預(yù)判。以上傳統(tǒng)FIM(Frequent Itemsets Mining)算法雖然簡(jiǎn)單有效,但是仍然存在需要多次掃描數(shù)據(jù)庫(kù)造成處理速度較慢的特點(diǎn)。

      在二次故障方面,文獻(xiàn)[5]利用H-mine算法實(shí)現(xiàn)對(duì)二次故障數(shù)據(jù)的分析,該算法在數(shù)據(jù)稀疏時(shí),運(yùn)行效率要高于傳統(tǒng)FIM算法。文獻(xiàn)[6]利用改進(jìn)Apriori實(shí)現(xiàn)二次設(shè)備缺陷部位、原因的分析,該算法與傳統(tǒng)Apriori相比,運(yùn)行速度有顯著提升,同時(shí)可以直觀有效的分析缺陷數(shù)據(jù)。文獻(xiàn)[7]利用一種只用掃描一次數(shù)據(jù)庫(kù)的FIM算法來處理配網(wǎng)薄弱點(diǎn)分析,以上方法雖然與傳統(tǒng)FIM算法相比有一定的改善,但是在關(guān)鍵參數(shù)的選擇上面,只能依靠分析人員的經(jīng)驗(yàn),并沒有給出很好的解決辦法,同時(shí)與傳統(tǒng)關(guān)聯(lián)分析一樣,缺乏有效的規(guī)則篩選辦法,導(dǎo)致生成的無用規(guī)則過多,分析結(jié)果可閱讀性較差,分析時(shí)過于依賴人力。

      針對(duì)上述問題,本文使用ITL-mine(ItemTransLink-mine)算法[8],實(shí)現(xiàn)對(duì)頻繁項(xiàng)集的快速挖掘,同時(shí)結(jié)合自適應(yīng)煙花算法[9-13],優(yōu)化關(guān)鍵參數(shù)的選擇,最后利用關(guān)聯(lián)規(guī)則冗余淘汰機(jī)制選出質(zhì)量最高的關(guān)聯(lián)規(guī)則,從而簡(jiǎn)化分析過程,減少對(duì)人力的依賴。同時(shí)方便維護(hù)人員記錄,為二次設(shè)備高效管控和運(yùn)維提供有價(jià)值信息。

      1 二次設(shè)備故障數(shù)據(jù)庫(kù)模型

      1.1 二次設(shè)備故障數(shù)據(jù)

      運(yùn)維人員通常會(huì)在日常工作時(shí),在調(diào)度日志中記錄下發(fā)現(xiàn)日期、變電站名稱、設(shè)備名稱、告警信號(hào)、故障原因等信息,這些信息可以從生產(chǎn)管理系統(tǒng)或者在站端的缺陷記錄中獲得[14]。

      變電站站端的信息更加完整,有利于挖掘設(shè)備故障和告警信號(hào)之間的信息,因此本文的數(shù)據(jù)來源來自某地區(qū)智能站的站端故障記錄。

      通常記錄的數(shù)據(jù)可以分為如表1幾種類別,不同類別之間設(shè)置不同的編碼以便于識(shí)別,見表1。

      表1 數(shù)據(jù)表

      數(shù)據(jù)庫(kù)中的變電站名稱包括某地區(qū)6座智能變電站。生產(chǎn)廠家則是這些變電站中二次設(shè)備的實(shí)際生產(chǎn)廠家。

      設(shè)備類型總共包括10多種設(shè)備,主要包括:通信鏈路、五防機(jī)、交換機(jī)、保護(hù)裝置、故障錄波器等。

      故障原因包括:“程序出錯(cuò)”、“配置出錯(cuò)”、“電源故障”、“光纖故障”等。處理情況則是發(fā)生故障后的解決方法。

      其中,可以利用FIM算法,尋找數(shù)據(jù)背后的一些特征,例如:可以通過數(shù)據(jù)挖掘,找出同一個(gè)智能站內(nèi)的各設(shè)備發(fā)生故障的概率、設(shè)備不同部位發(fā)生故障的概率。

      也可以尋找不同數(shù)據(jù)之間的數(shù)學(xué)關(guān)系,利用關(guān)聯(lián)規(guī)則的形式找尋在一種事務(wù)發(fā)生的情況下,另一種事務(wù)發(fā)生的概率。

      1.2 數(shù)據(jù)準(zhǔn)備

      在進(jìn)行挖掘之前首先設(shè)置日期,將同一發(fā)生時(shí)間下不同類型的信息整理成如下元組形式:

      D=(a,b,c,d)

      (1)

      式中:D是元組名稱代表故障編號(hào),a,b,c表示不同的告警信號(hào),d表示故障元件。故障數(shù)據(jù)在分析前要整理成公式1的形式,以便后續(xù)挖掘告警信號(hào)與故障元件之間的關(guān)系。

      本文的重點(diǎn)是找到某些數(shù)據(jù)之間存在的“if-then”的關(guān)聯(lián)關(guān)系;以便直觀的得到數(shù)據(jù)之間的聯(lián)系。

      在分析故障時(shí),通過挖掘數(shù)據(jù)之間的關(guān)系,找到它們之間的關(guān)聯(lián)規(guī)則,得到在告警信號(hào)發(fā)生的情況下,故障原因?yàn)槟撤N特定原因的概率。

      本文的研究的重點(diǎn)是利用優(yōu)化算法優(yōu)化生成的關(guān)聯(lián)規(guī)則,提高關(guān)聯(lián)規(guī)則的質(zhì)量、減少冗余規(guī)則,從而找出對(duì)檢修人員有用的信息。

      2 煙花算法

      2.1 傳統(tǒng)煙花算法

      煙花算法目前在多個(gè)領(lǐng)域都得到了應(yīng)用,其中文獻(xiàn)[15]利用煙花算法計(jì)算萊文斯坦距離相似度實(shí)現(xiàn)虛端子的連接,文獻(xiàn)[16]利用煙花算法結(jié)合混沌爆炸改進(jìn),實(shí)現(xiàn)多能源系統(tǒng)并網(wǎng)優(yōu)化調(diào)度。文獻(xiàn)[17]利用柯西變異結(jié)合傳統(tǒng)煙花算法,實(shí)現(xiàn)移動(dòng)式儲(chǔ)能的削峰填谷。

      煙花算法在不僅全局搜索能力較好、適應(yīng)度值在分配資源、信息交流時(shí),可以平衡搜索能力,兼顧局部和總體,適合用來優(yōu)化多目標(biāo)問題。同時(shí)爆炸機(jī)制可以提高算法精度和速度。

      煙花爆炸產(chǎn)生的火花數(shù)目以及爆炸半徑的計(jì)算公式如下:

      (2)

      (3)

      式中:fmin以及fmax分別是最小、最大適度值。

      A和M是常數(shù),ε是常量。

      為限制火花數(shù)量,需要對(duì)火花進(jìn)行數(shù)量限制,其中上限為Smax、下限為Smin。

      隨機(jī)選擇煙花的z個(gè)維度進(jìn)行位移,公式如下:

      (4)

      rand(0,Ai)為(0,Ai)范圍內(nèi)的隨機(jī)數(shù)。

      煙花算法除了爆炸火花外,為了提高火花多樣性,還有高斯變異算子求出的變異火花:

      (5)

      除此之外,需要將超出可行域的火花重新映射到新的位置:

      (6)

      2.2 EFWA算法

      傳統(tǒng)煙花算法存在如下問題[18-20]:

      (1) 高斯火花的位置傾向于原點(diǎn),這就導(dǎo)致在最優(yōu)解遠(yuǎn)離原點(diǎn)時(shí),產(chǎn)生的火花會(huì)更加原理最優(yōu)解。

      (2) 很多情況下,超出解空間范圍的火花超出的幅度并不大,這會(huì)導(dǎo)致映射過來的新火花分布在原點(diǎn)位置。

      為了避免適應(yīng)度低的煙花爆炸半徑過小,EFWA(Enhanced Fireworks Algorithm)算法規(guī)定了爆炸半徑最小值,Aik

      Aik=Amin,k

      (7)

      其他情況下爆炸幅度不變。

      爆炸半徑最小值使用如下公式選擇:

      (8)

      evalsmax是評(píng)估次數(shù)的最大值,Ainit是爆炸半徑的起始檢測(cè)值,Afinal是爆炸半徑的最終檢測(cè)值。

      同時(shí)為了避免傳統(tǒng)煙花算法中高斯變異會(huì)導(dǎo)致在原點(diǎn)附近產(chǎn)生過多火花,增強(qiáng)煙花算法的變異操作是:在當(dāng)前解和當(dāng)前最優(yōu)解之間進(jìn)行變異。

      xik=xik+(xBk-xik)×e

      (9)

      e為均值等于0,方差等于1的隨機(jī)變量,xik是當(dāng)前解,xBk為當(dāng)前種群中的最優(yōu)解。

      同時(shí)映射規(guī)則改為

      xik=xlb,k+U(0,1)·(xub,k-xlb,k)

      (10)

      xub,k為上限,xlb,k為下限。

      選擇下一代煙花時(shí),增強(qiáng)煙花算法使用ERP選擇方法:先選擇一個(gè)適應(yīng)度值較低的個(gè)體,再隨機(jī)選擇若干煙花作為下一代煙花。

      2.3 自適應(yīng)煙花算法

      除了上述缺點(diǎn),傳統(tǒng)煙花算法以及EFWA中,最優(yōu)煙花不爆炸,這意味著最優(yōu)煙花對(duì)收斂過程的貢獻(xiàn)有限,但是由于它生成的個(gè)體數(shù)量最多,因此它有利于促進(jìn)算法的收斂性。

      AFWA(Adaptive Fireworks Algorithm)算法利用已經(jīng)生成的火花求取最優(yōu)煙花爆炸半徑,利用父代求取最優(yōu)煙花在子代中的爆炸半徑。

      首先需要選擇一個(gè)個(gè)體,利用它和最優(yōu)煙花之間的距離作為下一代爆炸半徑,選擇的條件如下:

      (1) 適應(yīng)度比上一代差;

      (2) 到最優(yōu)個(gè)體的距離是所有滿足1條件中的個(gè)體中最小的,即滿足如下公式:

      (11)

      同時(shí)滿足:

      f(si)>f(X)

      (12)

      si為煙花生成的個(gè)體;s*為當(dāng)前種族中具有最小適應(yīng)值的個(gè)體;d為距離函數(shù),本文采用無窮范數(shù)作為距離度量;X表示煙花。

      最優(yōu)煙花的爆炸半徑如下:

      (13)

      3 關(guān)聯(lián)分析算法

      3.1 關(guān)聯(lián)規(guī)則關(guān)鍵指標(biāo)參數(shù)

      通常情況下,評(píng)價(jià)規(guī)則好壞的量度主要有:支持度、置信度:

      (14)

      (15)

      其中,D為總數(shù)據(jù)個(gè)數(shù),Sup(BA)為同時(shí)包含B和A的數(shù)據(jù)個(gè)數(shù),Sup(A)為A出現(xiàn)的次數(shù)。

      傳統(tǒng)關(guān)聯(lián)規(guī)則中并沒有引入其他指標(biāo)來排除相關(guān)性差、獨(dú)立性差的關(guān)聯(lián)規(guī)則,導(dǎo)致可能會(huì)產(chǎn)生大量無意義的關(guān)聯(lián)規(guī)則甚至含有誤導(dǎo)性的關(guān)聯(lián)規(guī)則,為了解決這個(gè)問題,傳統(tǒng)的篩選指標(biāo)有:

      (1)CF(Certainty Factor)值

      若Conf(A→B)>Sup(B):

      (16)

      反之,則:

      (17)

      CF為正數(shù)時(shí),說明前后件具有正相關(guān)關(guān)系,CF為負(fù)數(shù)時(shí),說明二者為負(fù)相關(guān)關(guān)系,同時(shí)CF越接近1,規(guī)則的置信度越高。

      (2)提升度Lift

      (18)

      提升度這個(gè)指標(biāo)反映了兩個(gè)變量的相關(guān)度,通常認(rèn)為提升度越高,二者正相關(guān)關(guān)系越明顯,以1為界,提升度為1時(shí),二者并無相關(guān)性。

      (3)規(guī)則中的項(xiàng)目數(shù)量N以及規(guī)則的總數(shù)Num

      N(A→B)=A+B

      (19)

      A和B代表前后件的數(shù)量。

      通常情況下,關(guān)聯(lián)規(guī)則前后件的總數(shù)越少,則越方便理解,同時(shí)規(guī)則總數(shù)也可以體現(xiàn)分析結(jié)果的復(fù)雜程度,規(guī)則數(shù)較少時(shí),分析人員容易提取有用的結(jié)論。

      上述指標(biāo)只針對(duì)單獨(dú)的關(guān)聯(lián)規(guī)則,本文的主要優(yōu)化目標(biāo)是針對(duì)關(guān)聯(lián)分析算法產(chǎn)生的全部關(guān)聯(lián)規(guī)則,因此在考慮上述指標(biāo)時(shí),需要求取所有規(guī)則的平均值。

      除此之外,為了防止規(guī)則太少導(dǎo)致覆蓋率下降,本文還設(shè)置了數(shù)據(jù)覆蓋率這個(gè)指標(biāo),它指的是規(guī)則覆蓋的數(shù)據(jù)占比,該指標(biāo)越大,得到的信息越豐富。計(jì)算公式如下:

      (20)

      式中:suffixi為生成的規(guī)則的后件,也就是故障原因;N為數(shù)據(jù)集中故障原因的總數(shù)。

      本文設(shè)置的需要優(yōu)化的參數(shù)為:最小支持度、最小置信度、最小提升度三種指標(biāo),在挖掘規(guī)則時(shí)應(yīng)當(dāng)刪除不滿足這三種指標(biāo)的結(jié)果,本文中的煙花便是由這三種參數(shù)組成,通常情況下,這三種參數(shù)由分析人員自行根據(jù)數(shù)據(jù)集確定,但是這個(gè)過程中需要耗費(fèi)人力,同時(shí)如果指標(biāo)設(shè)置過小,將導(dǎo)致結(jié)果中含有大量無意義的數(shù)據(jù),而如果三種指標(biāo)過大,結(jié)果將難以覆蓋全部數(shù)據(jù)。因此本文設(shè)置的優(yōu)化目標(biāo)為:保證較大的數(shù)據(jù)覆蓋率的情況下,盡量使所有的關(guān)聯(lián)規(guī)則有較好的提升度和CF值,所要優(yōu)化的目標(biāo)函數(shù)如下:

      f(x1)=-(K1*CoverRate+K2*(Liftave+CFave))

      (21)

      式中:K1和K2是數(shù)據(jù)覆蓋率和提升度與CF值之和的權(quán)重。

      特別地,提升度的取值通常大于1,而數(shù)據(jù)覆蓋率和CF值的取值通常小于1,因此在求取適應(yīng)度之前需要將其標(biāo)準(zhǔn)化:

      (22)

      3.2 ITL關(guān)聯(lián)分析算法

      傳統(tǒng)關(guān)聯(lián)分析算法主要包括Apriori、FP-growth等,這些算法大都存在多次掃描數(shù)據(jù)庫(kù)導(dǎo)致效率較低的問題,文獻(xiàn)[5]利用H-mine算法實(shí)現(xiàn)故障數(shù)據(jù)分析,本文提出了一種ITL-mine算法,在H-mine的基礎(chǔ)上結(jié)合水平和垂直數(shù)據(jù)結(jié)構(gòu),實(shí)現(xiàn)了挖掘效率的進(jìn)一步提高。項(xiàng)目表中包括項(xiàng)目名稱和它們的支持?jǐn)?shù),并且與事務(wù)鏈接中項(xiàng)目第一次出現(xiàn)時(shí)的位置鏈接在一起,事務(wù)鏈接則是把所有事務(wù)中包含的每個(gè)項(xiàng)目從第一次出現(xiàn)到最后一次出現(xiàn)用鏈接串聯(lián)起來,以便快速計(jì)數(shù)。ITL結(jié)構(gòu)不僅建立了每個(gè)項(xiàng)目之間的垂直鏈接,還可以跳過一些事務(wù)集,直接對(duì)各個(gè)項(xiàng)目進(jìn)行掃描,因此具備不錯(cuò)的靈活性。

      ITL-mine算法分為如下步驟:

      (1) 構(gòu)造項(xiàng)目表和事務(wù)鏈接。

      (2) 刪除項(xiàng)目表中支持度低于指標(biāo)的項(xiàng)。

      (3) 利用鏈接挖掘頻繁項(xiàng)集。

      具體的案例如表2。

      表2 事務(wù)集表

      表2是全部事務(wù)集,設(shè)支持度數(shù)閾值為2。首先掃描一次數(shù)據(jù)集,構(gòu)造項(xiàng)目表和事務(wù)鏈接。形式見圖1。

      圖1 事務(wù)鏈接圖

      在項(xiàng)目表中記錄項(xiàng)目出現(xiàn)的次數(shù),同時(shí)建立事務(wù)鏈接,將小于支持度閾值的項(xiàng)目從項(xiàng)目表和事務(wù)鏈接中刪除,修剪之后的事務(wù)鏈接如圖1所示。

      頻繁項(xiàng)集挖掘過程如下:

      以A為例,通過指向A的鏈接指針得到所有與A一同出現(xiàn)的項(xiàng)目,形成一個(gè)隊(duì)列,記錄在一個(gè)臨時(shí)的表中,見表2,包含支持度計(jì)數(shù),對(duì)于A項(xiàng),與A一同出現(xiàn)的頻繁項(xiàng)有BCD,生成此步驟時(shí),可以得到二項(xiàng)集:AB(2)、AC(3)、AD(2)。再通過將A項(xiàng)為首項(xiàng)構(gòu)成的隊(duì)列與其他元素為首項(xiàng)的隊(duì)列求交集來獲得多項(xiàng)集,如A可以與B的隊(duì)列求交集得出以A、B為首項(xiàng)的隊(duì)列,從而求出三項(xiàng)集,接下來再將以A、B為首項(xiàng)的隊(duì)列與其他隊(duì)列求交集,直到無法找到新的頻繁項(xiàng)集為止。所有結(jié)果見表3。

      表3 頻繁項(xiàng)集表

      得到頻繁項(xiàng)集后,下一步則是根據(jù)結(jié)果生成規(guī)則,例如三項(xiàng)集ABC,可以通過求AB→C的置信度、提升度來判斷該規(guī)則是否符合要求。

      整個(gè)關(guān)聯(lián)分析參數(shù)優(yōu)化過程的輸入量與輸出量如下:

      本文基于AFWA算法的關(guān)聯(lián)分析優(yōu)化的輸入量為數(shù)據(jù)集和需要優(yōu)化的支持度、置信度、提升度三種指標(biāo)的變化范圍以及AFWA算法的基本運(yùn)行參數(shù)。

      輸出量為當(dāng)前最優(yōu)的三種指標(biāo)參數(shù)和它對(duì)應(yīng)的適應(yīng)度值以及對(duì)應(yīng)的數(shù)據(jù)覆蓋率、平均提升度、以及平均CF值,以及所有滿足最優(yōu)參數(shù)的規(guī)則。

      AFWA算法優(yōu)化關(guān)聯(lián)分析關(guān)鍵參數(shù)的流程圖如圖2。

      圖2 AFWA流程圖

      3.3 關(guān)聯(lián)規(guī)則篩選策略

      通常情況下,告警信號(hào)一般都會(huì)伴隨衍生告警信號(hào),這會(huì)導(dǎo)致生成的關(guān)聯(lián)規(guī)則項(xiàng)目過多,從而影響可理解性,例如:頻繁項(xiàng)集{ABCD}可以生成ABC→D,AC→D,AB→D,為了減少規(guī)則的冗余,本文設(shè)置了相似度指標(biāo)用來淘汰多余的規(guī)則:

      (23)

      式中:S(ARi,ARj)是規(guī)則ARi,ARj中同時(shí)出現(xiàn)的事務(wù)數(shù);S(ARi)是ARi的總事務(wù)數(shù);Simi[i,j]是指規(guī)則i相對(duì)于j的相似度。

      本文設(shè)置的相似度主要指的是前件的相似度:

      (24)

      同理還可以得到j(luò)相對(duì)于i的相似度。當(dāng)某兩種規(guī)則的后件相同,前件相似度大于指標(biāo)時(shí),過濾掉規(guī)則中項(xiàng)目數(shù)量較多的規(guī)則。

      4 數(shù)據(jù)分析

      實(shí)驗(yàn)數(shù)據(jù)取自某地區(qū)過去幾年的故障站端記錄,為了驗(yàn)證本文提出的方法的優(yōu)越性,本文不僅對(duì)比了ITL-mine算法與其他FIM算法的速度,同時(shí)還對(duì)比了AFWA與傳統(tǒng)煙花算法(Fireworks Algorithm)、標(biāo)準(zhǔn)粒子群算法(Standard Particle Swarm Optimization)在關(guān)聯(lián)分析中的參數(shù)優(yōu)化效果,以證明本文提出方法的優(yōu)越性。

      首先本文設(shè)置了幾組數(shù)據(jù),并且利用傳統(tǒng)Apriori、H-mine算法與ITL-mine進(jìn)行對(duì)比,對(duì)不同支持度下的數(shù)據(jù)進(jìn)行處理,對(duì)比它們的運(yùn)行時(shí)間,如圖3。

      圖3 算法性能對(duì)比圖

      可見ITL-mine算法的性能要優(yōu)于Apriori、H-mine,原因如下:1.該算法只遍歷數(shù)據(jù)庫(kù)一次,并使用ITL執(zhí)行其余的挖掘過程。2.構(gòu)造ITL數(shù)據(jù)結(jié)構(gòu)以去除不頻繁的1項(xiàng)集后,在挖掘所有頻繁模式時(shí)保持不變。而在H-Mine中,在頻繁模式的提取過程中,H-struct中的指針需要不斷地重新調(diào)整,因此需要額外的計(jì)算過程。3.H-Mine中的遞歸調(diào)用還涉及對(duì)H-struct相關(guān)部分的重復(fù)遍歷。而ITL-Mine通過使用利用隊(duì)列求交集避免了這些重復(fù)的部分。

      本文適應(yīng)度函數(shù)的權(quán)重設(shè)置為K1=0.8,K2=0.2。三種優(yōu)化算法的具體運(yùn)行參數(shù)設(shè)置如表4。

      表4 參數(shù)表

      為了使對(duì)比過程更加科學(xué),本文設(shè)置的種群大小均為8次,迭代次數(shù)均為300次,并且重復(fù)做了10次十折交叉驗(yàn)證,三種算法的對(duì)比如表5。

      表5 算法對(duì)比表

      三種算法在優(yōu)化參數(shù)過程中適應(yīng)度的平均排名為:AFWA為1.3,F(xiàn)WA為2.6,SPSO為2.1,可以發(fā)現(xiàn)AFWA算法較其他兩種優(yōu)化算法相比搜索到的適應(yīng)度最小,因此參數(shù)優(yōu)化效果更好。AFWA算法產(chǎn)生的規(guī)則質(zhì)量更高。不僅可以保證覆蓋全部數(shù)據(jù),同時(shí)還有較高的提升度和CF值。

      除了對(duì)關(guān)聯(lián)分析參數(shù)的優(yōu)化之外,還需要對(duì)產(chǎn)生的規(guī)則進(jìn)行篩選,保留項(xiàng)數(shù)較少的規(guī)則,以提高可理解性。本文設(shè)置的相似度指標(biāo)為0.6。

      本文將故障原因作為后件,將告警信號(hào)作為前件,以便于分析兩者之間的關(guān)系,本文只排除在后件相同的情況下,前件存在冗余的規(guī)則。篩選前的部分規(guī)則如表6。

      表6 篩選前規(guī)則

      經(jīng)過關(guān)聯(lián)規(guī)則篩選處理后,上述規(guī)則將只保留化簡(jiǎn)后的形式,使規(guī)則的平均項(xiàng)數(shù)減少,過濾掉部分衍生信號(hào)。這樣不僅提高了規(guī)則的參考價(jià)值,同時(shí)可理解性也得到了提高,見表7。

      表7 篩選后規(guī)則

      為了說明本文所提出的方法的優(yōu)越性,本文通過對(duì)比傳統(tǒng)關(guān)聯(lián)分析來對(duì)比兩種方法的差別。

      本文設(shè)置了平均相似度來說明該方法相比于傳統(tǒng)關(guān)聯(lián)分析的先進(jìn)性,其定義為:所有規(guī)則之間的相似度的平均值。計(jì)算公式如下:

      (25)

      由于傳統(tǒng)關(guān)聯(lián)分析算法大多原理相似,因此本文選擇基礎(chǔ)的Apriori作為對(duì)比算法,該算法只存在支持度、置信度的概念,本文將兩者調(diào)整為與AFWA的優(yōu)化結(jié)果一致,見表8。

      表8 結(jié)果對(duì)比

      Aprior總共生成規(guī)則426條,并且平均規(guī)則長(zhǎng)度較長(zhǎng),同時(shí)提升度較低,CF值也較低,這說明規(guī)則前后件之間的相關(guān)性并不明顯,同時(shí)包括大量的無用規(guī)則,需要人力篩選。

      本文提出的AFWA-ITL-mine關(guān)聯(lián)規(guī)則優(yōu)化方法,生成規(guī)則數(shù)為285,不僅總數(shù)小于傳統(tǒng)方法,同時(shí)質(zhì)量更高,提升度、CF值指標(biāo)更好,并且引入的規(guī)則篩選策略在一定程度上減少了規(guī)則長(zhǎng)度,提高了可理解性,便于檢修人員理解。

      5 結(jié) 論

      文中利用AFWA算法對(duì)關(guān)聯(lián)分析中的支持度、置信度以及提升度指標(biāo)進(jìn)行優(yōu)化,并且利用數(shù)據(jù)覆蓋率、所有結(jié)果的平均提升度和CF值的加權(quán)組合作為目標(biāo)函數(shù),經(jīng)過與傳統(tǒng)煙花算法、SPSO算法對(duì)比分析,該算法可以得到更好的適應(yīng)度值,可以較為精確的計(jì)算出要優(yōu)化的三種參數(shù),同時(shí)利用ITL-mine算法挖掘頻繁項(xiàng)集,該算法與Apriori、h-mine算法相比減少了掃描次數(shù),同時(shí),利用ItemTransLink的數(shù)據(jù)結(jié)構(gòu),結(jié)合了水平和垂直數(shù)據(jù)結(jié)構(gòu),利用隊(duì)列交集求取頻繁項(xiàng)集,比傳統(tǒng)關(guān)聯(lián)分析速度更快,規(guī)則挖掘完畢之后,利用關(guān)聯(lián)規(guī)則篩選策略,對(duì)相似度過高的策略進(jìn)行刪減,只保留項(xiàng)數(shù)較少、可理解性更好的規(guī)則。經(jīng)過驗(yàn)證,本文所提的方法無需人工設(shè)置支持度、置信度、提升度等參數(shù),并且經(jīng)過優(yōu)化的關(guān)聯(lián)規(guī)則不僅質(zhì)量更高,同時(shí)項(xiàng)數(shù)較少,在一定程度上減少了冗余,便于檢修人員理解。

      猜你喜歡
      煙花關(guān)聯(lián)規(guī)則
      國(guó)慶煙花秀
      撐竿跳規(guī)則的制定
      數(shù)獨(dú)的規(guī)則和演變
      放煙花
      “一帶一路”遞進(jìn),關(guān)聯(lián)民生更緊
      煙花
      奇趣搭配
      讓規(guī)則不規(guī)則
      Coco薇(2017年11期)2018-01-03 20:59:57
      煙花
      智趣
      讀者(2017年5期)2017-02-15 18:04:18
      阿鲁科尔沁旗| 原阳县| 瑞昌市| 连州市| 镇巴县| 永宁县| 临澧县| 龙陵县| 平果县| 合阳县| 宁化县| 沙雅县| 遂溪县| 延寿县| 吴旗县| 涿鹿县| 宜君县| 泗阳县| 文登市| 安达市| 砚山县| 班戈县| 湖口县| 紫金县| 图们市| 银川市| 石狮市| 民丰县| 印江| 石城县| 黔西县| 墨竹工卡县| 邮箱| 汶上县| 休宁县| 虹口区| 三门县| 黄龙县| 寿光市| 广饶县| 聊城市|