• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      一種新型網(wǎng)絡(luò)告警管理系統(tǒng)設(shè)計

      2015-10-10 01:10:38中國移動通信集團黑龍江有限公司運維管理部主任
      信息通信技術(shù)與政策 2015年12期
      關(guān)鍵詞:網(wǎng)絡(luò)故障模擬退火網(wǎng)絡(luò)管理

      薛 銳 中國移動通信集團黑龍江有限公司運維管理部主任

      劉春華 中國移動通信集團黑龍江有限公司綜合室分析員

      王景堯 中國信息通信研究院技術(shù)與標準研究所高級工程師

      一種新型網(wǎng)絡(luò)告警管理系統(tǒng)設(shè)計

      薛銳中國移動通信集團黑龍江有限公司運維管理部主任

      劉春華中國移動通信集團黑龍江有限公司綜合室分析員

      王景堯中國信息通信研究院技術(shù)與標準研究所高級工程師

      網(wǎng)絡(luò)故障的解決很大程度上依賴網(wǎng)絡(luò)告警管理和快速診斷,高效的網(wǎng)絡(luò)故障管理對保障網(wǎng)絡(luò)正常運行、提高網(wǎng)絡(luò)穩(wěn)定性具有重要作用。本文基于模擬退火的人工神經(jīng)網(wǎng)絡(luò)技術(shù)對網(wǎng)絡(luò)告警信息進行管理,通過聯(lián)想記憶的方式發(fā)掘出告警信息背后的真實原因。本文所提出的算法已經(jīng)在電信運營商的實際網(wǎng)絡(luò)中得到了應(yīng)用,并取得了較好的效果。

      電信網(wǎng)絡(luò)管理 告警分析 模擬退火

      1 引言

      隨著我國信息服務(wù)的不斷發(fā)展,電信網(wǎng)絡(luò)的穩(wěn)定運行已經(jīng)成為保障民生的重要任務(wù)。因此,當(dāng)網(wǎng)絡(luò)發(fā)生故障時,運營商必須準確地檢測到故障,在最短時間內(nèi)找到網(wǎng)絡(luò)故障的原因,以最快的速度解決網(wǎng)絡(luò)故障,修復(fù)網(wǎng)絡(luò)故障,確保通信網(wǎng)絡(luò)正常穩(wěn)定的運行。

      網(wǎng)絡(luò)故障的解決很大程度上依賴網(wǎng)絡(luò)告警管理和快速診斷,高效的網(wǎng)絡(luò)故障管理對保障網(wǎng)絡(luò)正常運行、提高網(wǎng)絡(luò)穩(wěn)定性具有重要作用。然而,由于電信網(wǎng)絡(luò)規(guī)模越來越大,一旦通信網(wǎng)絡(luò)出現(xiàn)的故障,往往會引發(fā)海量告警事件,形成“告警風(fēng)暴”,使故障被淹沒在大量的告警信息中而難以及時發(fā)現(xiàn)。與此同時,告警信息本身不確定又加大了故障診斷的難度。

      網(wǎng)絡(luò)故障管理的關(guān)鍵就是對告警信息進行相關(guān)性分析。迄今為止,告警的相關(guān)性的研究主要基于專家系統(tǒng),通過預(yù)先設(shè)定的規(guī)則是進行分析最常用的方法之一。但是,規(guī)則庫的建立過分依賴于專家的實踐經(jīng)驗,具有極大的主觀色彩且無法隨著網(wǎng)絡(luò)的改變而實時更新。因此,隨著網(wǎng)絡(luò)日益復(fù)雜,這種方法已經(jīng)很難滿足當(dāng)前電信網(wǎng)絡(luò)的需要。

      針對以上問題,本文基于模擬退火的人工神經(jīng)網(wǎng)絡(luò)技術(shù)對網(wǎng)絡(luò)告警信息進行管理,通過聯(lián)想記憶的方式發(fā)掘出告警信息背后的真實原因。本文所提出的算法已經(jīng)在電信運營商的實際網(wǎng)絡(luò)中得到了應(yīng)用,并取得了較好的效果,本文成果對于相關(guān)研究的開展有著很好的借鑒意義。

      2 網(wǎng)絡(luò)故障關(guān)聯(lián)的數(shù)學(xué)模型

      在通信網(wǎng)絡(luò)中,所有網(wǎng)絡(luò)故障都可以視為一些最基本的“原子”網(wǎng)絡(luò)故障單獨或疊加產(chǎn)生的。因此,網(wǎng)絡(luò)故障可以看作是通過網(wǎng)絡(luò)所表現(xiàn)出來的“行為”來判斷其背后的故障組成。這可以看作是類似的旅行商問題(TSP)、最短路徑問題這樣的一類最優(yōu)化問題,即通過優(yōu)化得到網(wǎng)絡(luò)故障原因的“最優(yōu)”組成,其具體的作用機制可以由圖1所示模式描述。

      圖1 網(wǎng)絡(luò)告警與網(wǎng)絡(luò)故障的關(guān)聯(lián)關(guān)系網(wǎng)絡(luò)

      上述問題是運籌學(xué)和組合優(yōu)化領(lǐng)域中的NP問題,相關(guān)領(lǐng)域已經(jīng)積累了大量的理論研究,但是其在相關(guān)行業(yè)上的應(yīng)用依然是一個巨大的難題。近年來,人們提出了一些不依賴于具體問題的直接搜索方法。例如,模擬退火算法(SimulatedAnnealing,SA)就是近年來備受重視的一類軟計算方法。

      模擬退火算法是1983年5.KirkPatrick首次提出的,其可以求解各類非線性問題,且常常以較大概率求得近似解,具有很強的工程應(yīng)用意義。同時,這種方法對目標函數(shù)和約束函數(shù)要求較少,因此其在結(jié)構(gòu)優(yōu)化中顯得尤為重要。

      模擬退火算法在搜索策略上與傳統(tǒng)的梯度搜索方法不同,該方法通過引入適當(dāng)?shù)碾S機因素,來模擬物理系統(tǒng)退火過程的自然機理。“退火”的過程就是不僅接收使目標函數(shù)變“好”的步驟,同時也以一定的概率接受使目標函數(shù)值變“差”。模擬退火算法通過對物理過程的模擬提高了算法的可行性,對于工程實踐有著巨大的指導(dǎo)意義。

      3 基于模擬退火的網(wǎng)絡(luò)故障關(guān)聯(lián)

      (1)網(wǎng)絡(luò)告警的預(yù)處理

      在真實網(wǎng)絡(luò)中,網(wǎng)絡(luò)告警是多種信息的組合。根據(jù)ITU-TX.733標準,告警一般含有以下方面的屬性信息:設(shè)備名稱、設(shè)備類型、告警級別、告警類型、告警狀態(tài)、告警時間等。如何選擇告警屬性來分析通信網(wǎng)絡(luò)中的故障信息,是告警管理的一項重要任務(wù)。

      在通信網(wǎng)絡(luò)中,告警與故障之間的關(guān)系錯綜復(fù)雜,并非一一對應(yīng)的關(guān)系,即在一個復(fù)雜的通信網(wǎng)絡(luò)中,僅僅通過告警信息無法直接確定出現(xiàn)的故障。因此,需要對不同告警之間的關(guān)聯(lián)性進行挖掘,依據(jù)告警的特征定義來確定網(wǎng)絡(luò)故障的根源。

      然而,僅僅原始告警信息挖掘網(wǎng)絡(luò)故障的準確率依然較差。因此,除了對告警屬性的提取,還需要對告警信息進行預(yù)處理,使之轉(zhuǎn)化成為適合網(wǎng)絡(luò)告警合并的“告警事務(wù)”。

      所謂“告警事務(wù)”是指對原始告警信息進行的時間同步化處理后,得到的告警項集合。例如,對于觀察時段,用滑動步長Δs在時間軸上進行推移,開始下一個時間窗口進行告警事務(wù)的提取。如圖2所示,其中,W1,W2,…,W5告警事件包括A、B、C、D共4種,隨著時間窗口的滑動,可以得到不同的告警事務(wù)。

      其中,W1,W2,…,W5為取的告警事務(wù),通過將同一時間窗口內(nèi)的告警合并。形成含有一定歷史記錄的“事務(wù)”信息。從而將原本離散、孤立的告警變換成為定量、可處理的事件單元,并為后期的告警管理提供可靠的前提。

      (2)模擬退火在告警關(guān)聯(lián)中的應(yīng)用

      構(gòu)造起告警事務(wù)后,需要對告警與故障之間的關(guān)聯(lián)進行標注,來描述告警與故障之間的相對重要性。告警與故障之間的關(guān)系可以通過前文所述的網(wǎng)絡(luò)結(jié)果進行表征。通過對網(wǎng)絡(luò)結(jié)構(gòu)的定量化構(gòu)建,就可以得到網(wǎng)絡(luò)故障與告警事務(wù)之間的相關(guān)度和影響性,使之更接近于真實網(wǎng)絡(luò)中告警產(chǎn)生的原因,挖掘出頻繁度偏低而興趣度偏高的關(guān)聯(lián)信息,同時也解決了告警信息不確定、不完整等問題。

      圖2 網(wǎng)絡(luò)告警事務(wù)的生成方式

      為了解決上述問題,本文采用模擬退火的方法對故障與告警之間的關(guān)聯(lián)進行分析。在物理中,讓多粒子系統(tǒng)達到最低能量的方法稱之為“退火”。具體過程為:更新系統(tǒng)的狀態(tài)序列:設(shè)系統(tǒng)中某粒子相初始狀態(tài)i,其對應(yīng)能量為Ei;選取其中某個粒子產(chǎn)生微小變化,得到一個新狀態(tài)j,對應(yīng)能量Ej;如果,則更新狀態(tài)。最終系統(tǒng)處于狀態(tài)i和狀態(tài)j幾率比值等于的玻爾茲曼因子,即:

      其中,P(t)在溫度t時的粒子能量為Ei的概率分布函數(shù),KB為玻爾茲曼常數(shù)為分配函數(shù)。

      設(shè)L(S,f)為優(yōu)化問題中的一個實例,S表示解空間,f:S→R表示解空間到實數(shù)域的映射,t為模擬退火過程中溫度的控制參數(shù)。設(shè)L(S,f)中存在最優(yōu)解,f(i)、f(j)分別是某對應(yīng)于i、j目標函數(shù)值,則備選解由i過渡到j(luò)的概率為:

      對于本文所述的告警合并這一“最優(yōu)化”問題,其本質(zhì)是一種學(xué)習(xí)問題,即通過訓(xùn)練數(shù)據(jù)對故障和告警的相互影響關(guān)系進行分析。具體而言,假設(shè)故障與告警之間相關(guān)的實際概率分布為Q(α),模擬退火的任務(wù)就是通過隨機仿真獲得給定樣本的概率分布P(α)用來對分布Q(α)進行學(xué)習(xí),其學(xué)習(xí)的精度可由Kullback-Leibler距離來衡量:

      告警合并的學(xué)習(xí)的過程是基于相對熵的梯度下降算法,即對于初始網(wǎng)絡(luò),按照下式更新結(jié)構(gòu)中的每一個邊的權(quán)重(概率):

      其中,η是學(xué)習(xí)的步長,注意到在前文構(gòu)建的連接告警和故障的網(wǎng)絡(luò)結(jié)構(gòu)中,P(α)具有固有明確的權(quán)值構(gòu)成,而Q(α)則不然。因此,對于相鄰的節(jié)點集合(α,β)有:

      其中,Si(α,β)表示系統(tǒng)處于狀態(tài)i時的網(wǎng)絡(luò)連接結(jié)構(gòu)。在學(xué)習(xí)過程中,通過不斷減低溫度使系統(tǒng)“活躍”程度逐步降低,最終使得系統(tǒng)趨于收斂。因此,通過對給定樣本的學(xué)習(xí),就可以定量地給出網(wǎng)絡(luò)故障導(dǎo)致告警的概率。

      通過訓(xùn)練好的網(wǎng)絡(luò)可以對告警背后的網(wǎng)絡(luò)故障進行判斷,不僅可以容易地實現(xiàn)對網(wǎng)絡(luò)告警的合并,同時可以直接向網(wǎng)絡(luò)管理人員發(fā)送更容易理解的網(wǎng)絡(luò)故障判斷,從而提升網(wǎng)絡(luò)管理的效率,并極大降低網(wǎng)絡(luò)管理的開銷。

      (3)算法驗證

      為了驗證本文所提出算法的有效性,采用天津移動的現(xiàn)網(wǎng)數(shù)據(jù)對告警進行分析。通過對10萬條告警數(shù)據(jù)的分析,通過模擬退火算法構(gòu)建告警—故障的對應(yīng)網(wǎng)絡(luò)結(jié)構(gòu),并基于此結(jié)構(gòu)對告警樣本進行分析。

      在訓(xùn)練中,對于某一個告警事務(wù)的故障判斷學(xué)習(xí)過程如圖3所示,其中橫縱兩軸代表了該告警事務(wù)為故障1和故障2的概率。可以看到,隨著訓(xùn)練次數(shù)的不斷增長,對于該告警事務(wù)的判斷不斷發(fā)生變化,并最終落入結(jié)束點中,即將該告警事務(wù)作為故障1的大概率原因。

      同時,本文對訓(xùn)練樣本和分類準確地影響進行了模擬,結(jié)果如圖4所示??梢钥吹?,隨著訓(xùn)練樣本數(shù)量以指數(shù)提升,本文所提出的算法正確率首先出現(xiàn)了快速提升,繼而保持在70%左右的水平??梢姡ㄟ^增加訓(xùn)練樣本數(shù)量可以大大提升原有網(wǎng)絡(luò)管理系統(tǒng)的性能。目前,該算法目前已經(jīng)在運營商實際的網(wǎng)絡(luò)中得到了初步的推廣和應(yīng)用,并取得了較好的成果。

      4 結(jié)束語

      網(wǎng)絡(luò)故障診斷是網(wǎng)絡(luò)管理功能中的重要組成部分,它負責(zé)檢測、收集、處理、分析以及預(yù)測網(wǎng)絡(luò)中的故障信息。有效的網(wǎng)絡(luò)故障診斷需要對網(wǎng)絡(luò)告警進行有效的處理,并及時找出網(wǎng)絡(luò)中最關(guān)鍵的故障。本文基于模擬退火的思想提出了一種網(wǎng)絡(luò)告警合并的方法,該方法可以通過對告警的分析找到引起告警最大概率的網(wǎng)絡(luò)故障,從而幫助網(wǎng)絡(luò)管理人員更加準確的對網(wǎng)絡(luò)進行管理和維護。本文所提出的算法目前已經(jīng)在運營商的實際網(wǎng)絡(luò)中進行了小規(guī)模驗證,并取得了顯著成效。未來隨著相關(guān)領(lǐng)域的研究和工程化的不斷深入,相關(guān)工作將產(chǎn)生巨大的科研和經(jīng)濟效益。

      圖3 基于模擬退火的網(wǎng)絡(luò)故障判斷訓(xùn)練結(jié)果

      圖4 算法準確率隨樣本數(shù)量變化

      2015-10-20)

      猜你喜歡
      網(wǎng)絡(luò)故障模擬退火網(wǎng)絡(luò)管理
      VxWorks網(wǎng)絡(luò)存儲池分析在網(wǎng)絡(luò)故障排查中的應(yīng)用
      基于信息流的RBC系統(tǒng)外部通信網(wǎng)絡(luò)故障分析
      模擬退火遺傳算法在機械臂路徑規(guī)劃中的應(yīng)用
      電動汽車充電服務(wù)網(wǎng)絡(luò)管理初探
      基于EOC通道的SHDSL網(wǎng)絡(luò)管理技術(shù)
      Wireshark協(xié)議解析在網(wǎng)絡(luò)故障排查中的應(yīng)用
      基于模糊自適應(yīng)模擬退火遺傳算法的配電網(wǎng)故障定位
      SOA結(jié)合模擬退火算法優(yōu)化電容器配置研究
      基于遺傳-模擬退火算法的城市軌道交通快慢車停站方案
      通訊網(wǎng)絡(luò)故障類型研究
      兴和县| 文水县| 桂东县| 三亚市| 华宁县| 桑植县| 石狮市| 山西省| 绩溪县| 双牌县| 宣恩县| 玛纳斯县| 郓城县| 十堰市| 永定县| 平武县| 肥东县| 宣城市| 泌阳县| 应用必备| 邓州市| 翼城县| 七台河市| 东阳市| 沽源县| 清新县| 太原市| 贵阳市| 长春市| 灯塔市| 郸城县| 龙门县| 岗巴县| 桦南县| 普安县| 浦东新区| 平安县| 宜阳县| 内江市| 潮安县| 长葛市|