• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      實現(xiàn)故障監(jiān)控的智能預(yù)警

      2020-08-13 07:17:51李虹韓永佳
      軟件 2020年6期
      關(guān)鍵詞:關(guān)聯(lián)度預(yù)警分類

      李虹 韓永佳

      摘 ?要: 本文提出了一種基于K-平均算法的智能監(jiān)控預(yù)警算法。對于被監(jiān)控的系統(tǒng),該算法首先對所發(fā)生的故障進行分類,然后對故障類兩兩進行分析,建立故障實例之間的關(guān)聯(lián)關(guān)系。在此基礎(chǔ)上,該算法進一步搜索關(guān)聯(lián)故障實例在故障類中的最佳分布并計算故障類之間的絕對和相對關(guān)聯(lián)度。當關(guān)聯(lián)度達到設(shè)定的閾值,我們則認為分組故障類存在關(guān)聯(lián)關(guān)系,彼此之間存在相互觸發(fā)動因。本文正是通過尋找這種關(guān)聯(lián)關(guān)系來幫助實現(xiàn)故障監(jiān)控的連帶預(yù)警功能,實現(xiàn)潛在故障規(guī)避。為了對所提出的算法進行客觀的評估,我們以企業(yè)內(nèi)部的關(guān)鍵業(yè)務(wù)系統(tǒng)作為樣本數(shù)據(jù)進行測試。測試結(jié)果表明,本算法能夠高效并較準確地挖掘故障之間的關(guān)聯(lián)性,對故障的智能監(jiān)控預(yù)警具有實際意義。

      關(guān)鍵詞: K-平均算法;分類;故障;關(guān)聯(lián)度;監(jiān)控;預(yù)警

      中圖分類號: TP277 ? ?文獻標識碼: A ? ?DOI:10.3969/j.issn.1003-6970.2020.06.049

      本文著錄格式:李虹,韓永佳. 實現(xiàn)故障監(jiān)控的智能預(yù)警[J]. 軟件,2020,41(06):237241

      【Abstract】: This paper presents an algorithm of intelligent pre-warning of exceptions based on K-means algorithm. For the system monitored, the algorithm firstly classifies the exceptions already occurred. Then, it works out the associate relationship of the exception instances for every two exception classifications and finds out the best distribution of the associated exception instances in the exception classifications. Thus, the algorithm calculates the absolute and relative association degree of every two exception classifications and chooses those exception classifications whose association degree meets the threshod request as the associated ones. Thus, the algorithm is able to pre-warn the exception of one classification possible to happen when it detects some exceptions of the associated classification already happened, and help to tell us to do something to avoid it. To evaluate the algorithm justly, we test it using some of our key business systems as data samples. The result shows that our algorithm can discover the relationship of exceptions efficiently and fairly exactly. It is quite valuable in the intelligent pre-warning of exceptions.

      【Key words】: Data-mining; Classification; Exception; Association degree; Monitor; Pre-warning

      0 ?引言

      就如何提升客戶滿意度,近年來業(yè)界展開了大量的探討。需求滿足、支撐到位是客戶的基本訴求。而這全依賴于企業(yè)信息化水平的不斷發(fā)展。業(yè)務(wù)系統(tǒng)的合理建設(shè)為各種業(yè)務(wù)的創(chuàng)新和規(guī)模發(fā)展提供了良好的基礎(chǔ)。而后期系統(tǒng)的高效運維則是業(yè)務(wù)得以長久持續(xù)發(fā)展的保障。因此,業(yè)務(wù)系統(tǒng)支撐效率對客戶的滿意度起著至關(guān)重要的作用。因此,就如何提高業(yè)務(wù)系統(tǒng)健壯性(參見[1-6]),確保系統(tǒng)穩(wěn)定可靠;加強系統(tǒng)監(jiān)控(參見[7-10]),及時消除潛在故障,降低故障發(fā)生率;提升搶修技能、強化搶修工具配置,進而提高故障響應(yīng)速度,降低故障處理時長均成為我們重點探討的方向。

      隨著工業(yè)互聯(lián)網(wǎng)的不斷發(fā)展,企業(yè)對業(yè)務(wù)系統(tǒng)連貫不中斷的要求越來越高。而業(yè)務(wù)系統(tǒng)數(shù)量、規(guī)模的快速增長,系統(tǒng)功能結(jié)構(gòu)的日益復(fù)雜與傳統(tǒng)后置型故障管理模式(故障發(fā)生之后才進行搶修恢復(fù)的模式)效率低之間的矛盾不斷擴大。錯中復(fù)雜的故障使得排障困難重重,傳統(tǒng)后置型的故障處理模式在持續(xù)提高故障處理效率上遇到了巨大的瓶頸,更無法達到降低故障發(fā)生率以實現(xiàn)系統(tǒng)高可靠、業(yè)務(wù)不中斷的目的。因此近年來,我們開始轉(zhuǎn)向研究前置型的故障運維管理(參見[11-15]),擬通過提升系統(tǒng)穩(wěn)定性,加強對潛在故障的提前識別能力,有效實現(xiàn)故障規(guī)避,降低故障發(fā)生率,力求實現(xiàn)系統(tǒng)連貫可用、支撐及時到位。

      就提升系統(tǒng)穩(wěn)定性和可用性,業(yè)界圍繞項目開發(fā)的過程管理、系統(tǒng)構(gòu)建模式和軟件質(zhì)量管理等,已經(jīng)總結(jié)了一系列系統(tǒng)開發(fā)運維和項目管理的方法論(參見[16-22])。迭代式的開發(fā)過程、模塊化的系統(tǒng)架構(gòu)、質(zhì)檢模塊的引入等,均有助于降低程序的復(fù)雜度,提高系統(tǒng)故障的可識別率。通過實現(xiàn)功能模塊的高內(nèi)聚低耦合,采用修正式增量開發(fā),可以進一步提高系統(tǒng)的可維護和可延續(xù)性,從而達到提高系統(tǒng)的穩(wěn)定可靠性的目的。但是,當業(yè)務(wù)系統(tǒng)規(guī)模擴張到一定程度,功能結(jié)構(gòu)和模塊間的關(guān)系錯綜復(fù)雜,系統(tǒng)故障的可識別率就難以持續(xù)提高,故障發(fā)生時的響應(yīng)速度和恢復(fù)時間就會受到較大的影響。而且往往還無法避免蝴蝶效應(yīng)下的連帶故障(由另一個故障所引起發(fā)生的故障)發(fā)生。因此,在企業(yè)業(yè)務(wù)和信息化不斷發(fā)展的新形勢下,我們要進一步破除壁壘,重點研究系統(tǒng)監(jiān)控手段,強化故障監(jiān)控能力,通過故障規(guī)避來實現(xiàn)更深層次的系統(tǒng)健壯性和可維護性的提升。

      一般來說,常用的系統(tǒng)監(jiān)控手段包括系統(tǒng)級和應(yīng)用級的,主要針對系統(tǒng)軟硬件環(huán)境和應(yīng)用連接心跳、服務(wù)響應(yīng)等方面來展開監(jiān)控。這些監(jiān)控的場景基本都是已知并預(yù)設(shè)好的,往往也沒有深入到系統(tǒng)功能內(nèi)部,缺乏對更小顆粒度故障間關(guān)聯(lián)關(guān)系的思考和應(yīng)用。突破系統(tǒng)級和應(yīng)用級監(jiān)控,我可以把顆粒度進一步縮小至故障本身。每一個故障都可以作為一個對象顆粒,他們之間可能存在千絲萬縷的關(guān)系:單一的前置關(guān)系、組合的后置結(jié)果等。通過對海量的故障數(shù)據(jù)進行清洗、過濾、整理,我們可以挖掘出大量的高價值信息,找出故障之間的充分必要條件,實現(xiàn)連帶故障的提前預(yù)警。從而可以對復(fù)雜的功能組合場景進行深層監(jiān)控和告警,進一步降低故障發(fā)生率,提升系統(tǒng)穩(wěn)定性。

      對此,本文提出了基于K-平均的智能監(jiān)控預(yù)警算法。算法的原理背景是:總是在某個時間段內(nèi) ? 結(jié)隊出現(xiàn)的故障之間,必然存在某種關(guān)聯(lián)關(guān)系。精準挖掘這種潛在關(guān)系,可以實現(xiàn)對連帶故障的觸發(fā)告警。

      結(jié)合二次數(shù)據(jù)挖掘技術(shù)(參見[23-26]),本文采用并優(yōu)化了分類聚類的K-平均算法,提升了故障分類的準確性,為預(yù)警算法整體有效奠定了堅實的基礎(chǔ)。在精準分類的基礎(chǔ)上,智能監(jiān)控預(yù)警算法進一步找出在設(shè)定時間窗口內(nèi)成對出現(xiàn)頻次達到閾值的故障類,標記為關(guān)聯(lián)故障類。當一類故障發(fā)生時,即可觸發(fā)另一類關(guān)聯(lián)故障的告警,可以有效規(guī)避微小故障所帶來的破壞性蝴蝶效應(yīng)。從算法思想和實際檢驗來看,基于K-平均的智能預(yù)警算法可以有效突破單一系統(tǒng)內(nèi)部故障告警的局限,進一步延伸至對跨系統(tǒng)、更多組合場景下系統(tǒng)間的故障關(guān)聯(lián)預(yù)警,為業(yè)務(wù)穩(wěn)定、智能運維提供強有力的支撐。

      以下的內(nèi)容,第1節(jié)將介紹預(yù)備知識和概念;第2節(jié)給出本文所提出的智能預(yù)警算法;第3節(jié)給出測試數(shù)據(jù)和結(jié)果;第4節(jié)為小結(jié)。

      1 ?預(yù)備知識和概念

      1.1 ?定義1

      已知故障類EC(kw1, kw2,…, kwn),kw1, kw2,…, kwn是EC類的關(guān)鍵詞;已捕捉的故障實例中e1, e2,…ei∈EC,且e1, e2,…, ei的發(fā)生時間分別為t1, t2,…, ti,則我們稱EC((kw1, kw2,…, kwn), (e1, e2,…,ei), (t1, t2,…, ti))為故障類EC的實例分布,簡記為O(EC)。

      1.2 ?定義2

      已知故障實例e1, e2的發(fā)生時間分別為t1, t2,假設(shè)選定時間關(guān)聯(lián)區(qū)域為T,則,若t2∈{t1–T, t1+T},我們稱e1, e2在T時間區(qū)內(nèi)關(guān)聯(lián),記為e1∞T e2。

      設(shè)?表示空實例,則對于任意的故障實例e,在任意的時間關(guān)聯(lián)區(qū)域T內(nèi),均有e∞T ?。

      其中,{t1–T, t1+T}表示以時間t1為中心,前后展開時間段T的時間區(qū)域。

      1.3 ?定義3

      已知故障實例e和故障實例集E,選定時間關(guān)聯(lián)區(qū)域T,若對于"ei∈E, e∞T ei,則我們記e∞T E。

      1.4 ?定義4

      已知故障類EC1(kw1, kw2,…, kwm)和EC2(kwk, kwk+1,…, kwn)的實例分布分別為EC1((kw1, kw2,…, kwm), (e1, e2,…, ei), (t1, t2,…, ti))和EC2((kwk, kwk+1,…, kwn), (eh, eh+1,…, ej), (th, th+1,…, tj));選定時間關(guān)聯(lián)區(qū)域T,對于"eu∈(e1, e2,…, ei),$Eu? (?,eh, eh+1,…, ej), eu∞T Eu,且,?$Eu′, (?, eh, eh+1,…, ej) ? Eu? Eu, eu∞T Eu′,則:

      我們定義T(EC1, EC2) ={(e1:e′1:E1, e2:e′2:E2,…, ei:e′i:Ei)}為EC1和EC2在當前實例分布下的T關(guān)聯(lián)分布,其中,e′u∈Eu (1≤u≤i),且"v, 1≤v≤i, v≠u, ? e′u≠e′v。

      1.5 ?定義5

      已知T(EC1, EC2)為故障類EC1和EC2在實例分布O(EC1)和O(EC2)下的T關(guān)聯(lián)分布,r = (e1: e′1:E1, e2:e′2:E2,…, ei:e′i:Ei)∈T(EC1, EC2),則,我們定義:

      (1)|r| = ∑1;

      (2)|Eu| = ∑1。

      1.6 ?定義6

      已知T(EC1, EC2)為故障類EC1和EC2在實例分布O(EC1)和O(EC2)下的T關(guān)聯(lián)分布,則:

      我們定義EC1和EC2在當前事件分布下的最優(yōu)T關(guān)聯(lián)分布為r,其中,r∈T(EC1, EC2),且?$r′, ? ? r′∈T(EC1,EC2), |r′|>|r|。

      1.7 ?定義7

      已知r = (e1:e′1:E1, e2:e′2:E2,…, ei:e′i:Ei)是故障類EC1和EC2在實例分布O(EC1)和O(EC2)下的最優(yōu)T關(guān)聯(lián)分布,則,我們定義:

      (1)EC1和EC2在當前實例分布下的絕對T關(guān)聯(lián)度為|r|。

      (2)EC1和EC2在當前實例分布下的相對T關(guān)聯(lián)度為|r|/|E|,E = {e1, e2,…, ei}。

      2 ?算法

      2.1 ?簡介

      本文所提出的基于K-平均的智能監(jiān)控預(yù)警算法,它以已監(jiān)控入庫的故障實例為基礎(chǔ),通過對故障進行關(guān)鍵詞聚類和分類,再對每個故障類搜索其實例分布(參考1.1定義1)在指定的時間區(qū)域內(nèi)與之關(guān)聯(lián)的另一類故障集(參考1.2定義2和1.3定義3),得出故障類之間的關(guān)聯(lián)分布(參考1.4定義4)和最優(yōu)關(guān)聯(lián)分布(參考1.5定義5和1.6定義6),從而計算出它們的絕對T關(guān)聯(lián)度和相對T關(guān)聯(lián)度。當關(guān)聯(lián)度達到設(shè)定閾值時,系統(tǒng)自動標記這兩類 ?故障為關(guān)聯(lián)故障類,為后續(xù)觸發(fā)連帶故障預(yù)警提供基礎(chǔ)。

      算法的核心關(guān)鍵在于獲取故障類間的最優(yōu)關(guān)聯(lián)分布。其實現(xiàn)的思路是,根據(jù)關(guān)聯(lián)故障集大小從小到大對中心實例(即每個分組都以其中一類故障作為參考物,以該類故障的實例分布為中心)進行排序,優(yōu)先考慮關(guān)聯(lián)故障集集合較小者,然后對中心實例進行關(guān)聯(lián)故障成員選擇,即1.7定義7中r = (e1:e′1:E1, e2:e′2:E2,…, ei:e′i:Ei)的e′1, e′2,…, e′i,優(yōu)先選擇在本分組實例中參與關(guān)聯(lián)次數(shù)較少的作為其關(guān)聯(lián)故障,進而通過排序計算獲得最優(yōu)關(guān)聯(lián)分布。

      本算法結(jié)果有效的基本前提是高準確度的故障分類。因此,本文在基于K-平均的分類聚類算法的基礎(chǔ)上,通過二次數(shù)據(jù)挖掘,對K-平均算法進行優(yōu)化,提升了故障類的分類準確性。根據(jù)本文算法思想,故障的入庫數(shù)、時間關(guān)聯(lián)區(qū)域和關(guān)聯(lián)度閾值的選取對智能監(jiān)控預(yù)警算法結(jié)果的有效性也有著重大的影響。

      2.2 ?具體算法

      /*偽碼內(nèi)部的關(guān)鍵變量*/

      EC[]:用以存儲故障類;

      Tobj[][]:用以存儲每個故障類的故障實例的發(fā)生時間;

      Robj[][]:用以存儲在某關(guān)聯(lián)時間區(qū)域下,兩類故障的故障實例間的關(guān)聯(lián)分布情況;

      Rdegree[]:在計算兩類故障的故障實例間的 ?關(guān)聯(lián)分布時,用以記錄被關(guān)聯(lián)對象參與所有關(guān)聯(lián)的次數(shù);

      Tfield:用以表示時間關(guān)聯(lián)區(qū)域;

      Bobj[]:用以記錄某類故障與另一類故障的最優(yōu)關(guān)聯(lián)分布;

      ABRelation[][]:用以存儲兩兩故障類之間的絕對關(guān)聯(lián)度;

      CompRelation[][]:用以存儲兩兩故障類之間的相對關(guān)聯(lián)度;

      ABLeast:絕對關(guān)聯(lián)度下限;

      CompLeast:相對關(guān)聯(lián)度下限;

      /*算法偽碼*/

      (1)根據(jù)K中心算法,對已沉淀的故障進行分類聚類,從而得到EC[],分類的同時把故障類的實例對象的發(fā)生時間記錄在Eobj[][]中。

      (2)根據(jù)每類故障的實例分布,計算故障類兩兩之間的絕對關(guān)聯(lián)度和相對關(guān)聯(lián)度,偽碼如下:

      ABRelation.Clear();

      CompRelation.Clear();

      for(EC1 = 0; EC1 < EC.Length; EC1++){

      for(EC2 = EC1+1; EC2

      Robj.Clear();

      Rdegree.Clear();

      for(i = 0; i

      k = 0;

      for(j = 0; j

      if((Tobj[EC2][j]>=Tobj[EC1][i]-Tfield) &&(Tobj[EC2][j]<=Tobj[EC1][i]+Tfield)){

      Robj[i][k++]=j; //記錄EC1第i個故障實例的關(guān)聯(lián)故障

      Rdegree[j]++; //記錄EC2第j個故障實例參與關(guān)聯(lián)的次數(shù)

      }

      }

      }

      //尋找最優(yōu)關(guān)聯(lián)分布

      Robj.Sort(); //根據(jù)Robj[i].Length從小到大排序,即對于EC1的每個故障實例,優(yōu)先考慮關(guān)聯(lián)故障數(shù)較少者

      for(i = 0; i

      //關(guān)聯(lián)故障數(shù)相同的故障實例歸為一組,進而根據(jù)關(guān)聯(lián)故障的參與關(guān)聯(lián)次數(shù)選擇最優(yōu)關(guān)聯(lián)分布的 成員

      for(j=i+1; j

      if(Robj[i].Length

      }

      Choose(Robj,Bobj,i,j,Rdegree);//優(yōu)先選擇參與關(guān)聯(lián)次數(shù)較少的關(guān)聯(lián)故障作為最優(yōu)關(guān)聯(lián)分布成員

      }

      for(i = 0; i

      if(Bobj[i] >= 0){ ?//Bobj[i]<0表示?

      ABRelation[EC1][EC2]++;

      CompRelation[EC1][EC2]=CompRelation [EC1][EC2]+(float)1/Robj[i].Length;

      }

      }

      CompRealtion[EC1][EC2] = CompRelation[EC1] [EC2]/Tobj[EC1].Length;

      }

      }

      (3)根據(jù)ABRelation[][],CompRelation[][],ABLeast和CompLeast確定故障類之間的絕對和相對關(guān)聯(lián)關(guān)系,即當ABRelation[EC1][EC2] >= ABLeast,則我們認為EC1和EC2絕對關(guān)聯(lián);當Comp?Relation[EC1][EC2] >= CompLeast,我們認為EC1和EC2相對關(guān)聯(lián)。

      (4)故障預(yù)警時,根據(jù)實際情況選取絕對關(guān)聯(lián)或相對關(guān)聯(lián)的故障作為故障的預(yù)警輸出。

      3 ?實驗數(shù)據(jù)

      根據(jù)智能預(yù)警的算法原理,故障預(yù)警結(jié)果的準確性取決于故障分類的精確度,時間關(guān)聯(lián)區(qū)域的大小以及關(guān)聯(lián)度閾值三個關(guān)鍵要素。三要素的選取因故障實例的積累數(shù)量和被監(jiān)控系統(tǒng)當前的穩(wěn)定性不同而變化。例如,在智能預(yù)警模塊投入使用初期,由于故障實例沉積數(shù)量較少,此時故障分類應(yīng)選取較高的精確度,分類宜小不宜大;同時,若被監(jiān)控系統(tǒng)已處于較穩(wěn)定的狀態(tài),則時間關(guān)聯(lián)區(qū)域應(yīng)適當放寬,關(guān)聯(lián)度閾值選取較大值,否則,若被監(jiān)控系統(tǒng)正好處于變更活動期,則時間關(guān)聯(lián)區(qū)域和關(guān)聯(lián)閾值可參考采用正常平均值。而當智能預(yù)警模塊投入使用并經(jīng)過較長一段時間,故障實例的積累數(shù)量足夠多時,故障分類的精確度可相對下調(diào),時間關(guān)聯(lián)區(qū)域和關(guān)聯(lián)閾值可統(tǒng)一采用正常平均值。

      猜你喜歡
      關(guān)聯(lián)度預(yù)警分類
      分類算一算
      法國發(fā)布高溫預(yù)警 嚴陣以待備戰(zhàn)“史上最熱周”
      分類討論求坐標
      數(shù)據(jù)分析中的分類討論
      園林有害生物預(yù)警與可持續(xù)控制
      教你一招:數(shù)的分類
      基于灰色關(guān)聯(lián)度的水質(zhì)評價分析
      機載預(yù)警雷達對IFF 的干擾分析
      基于灰關(guān)聯(lián)度的鋰電池組SOH評價方法研究
      預(yù)警個啥
      小說月刊(2014年11期)2014-04-18 14:12:28
      抚松县| 海门市| 丽水市| 承德市| 新津县| 秦安县| 鹤庆县| 雷山县| 阳泉市| 金溪县| 全椒县| 汶川县| 岳池县| 开远市| 织金县| 察隅县| 南投市| 融水| 西藏| 渝北区| 朝阳县| 杭锦后旗| 元氏县| 阿坝县| 巴楚县| 南川市| 介休市| 灵宝市| 和平县| 河南省| 桓台县| 宁陕县| 牙克石市| 静宁县| 伊金霍洛旗| 青冈县| 高州市| 海宁市| 奉化市| 铁岭县| 阿尔山市|