• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)中心故障預(yù)測(cè)方法的研究

      2019-07-01 02:35:55李鵬園黃進(jìn)馮濤
      關(guān)鍵詞:故障預(yù)測(cè)機(jī)房設(shè)備數(shù)據(jù)中心

      李鵬園 黃進(jìn) 馮濤

      摘 要:數(shù)據(jù)中心作為信息化社會(huì)的IT基礎(chǔ)設(shè)施,存儲(chǔ)管理大量關(guān)鍵數(shù)據(jù),發(fā)揮著越來(lái)越重要的作用,因此如何實(shí)現(xiàn)數(shù)據(jù)中心機(jī)房的智能化管理越來(lái)越得到業(yè)內(nèi)廣泛重視。提出一種基于神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)中心故障預(yù)測(cè)方法,根據(jù)已有的機(jī)房設(shè)備日志數(shù)據(jù),提取出關(guān)鍵的設(shè)備性能指標(biāo)作為訓(xùn)練特征,輸入神經(jīng)網(wǎng)絡(luò)訓(xùn)練模型,得到的模型可以根據(jù)所提供的設(shè)備數(shù)據(jù)預(yù)測(cè)出當(dāng)前設(shè)備運(yùn)行狀態(tài)。

      關(guān)鍵詞: 數(shù)據(jù)中心;神經(jīng)網(wǎng)絡(luò);故障預(yù)測(cè);TensorFlow;機(jī)房設(shè)備

      文章編號(hào): 2095-2163(2019)03-0184-04 中圖分類號(hào): TP393.06 文獻(xiàn)標(biāo)志碼: A

      0 引 言

      隨著現(xiàn)代科技的迅猛發(fā)展,為適應(yīng)數(shù)據(jù)中心長(zhǎng)期穩(wěn)定運(yùn)營(yíng)的實(shí)際需要,實(shí)現(xiàn)智能化管理已是大勢(shì)所趨。以前,大多是依靠經(jīng)驗(yàn)豐富的專業(yè)運(yùn)維人員通過(guò)計(jì)算機(jī)自動(dòng)化來(lái)監(jiān)管機(jī)房設(shè)備各項(xiàng)指標(biāo),運(yùn)維人員每天需對(duì)設(shè)備做出多次重復(fù)檢查,這一工作不僅耗時(shí),而且繁瑣。已有研究成果表明,若能結(jié)合深度學(xué)習(xí)、人工智能技術(shù)對(duì)數(shù)據(jù)中心進(jìn)行智能化管理,將可有效提高數(shù)據(jù)中心的智能化運(yùn)維水平,而其中涉及的數(shù)據(jù)中心智能預(yù)警的分析設(shè)計(jì)也就隨即成為與智能化管理研究密切相關(guān)的基礎(chǔ)重要內(nèi)容。

      目前,國(guó)內(nèi)外已有相當(dāng)數(shù)量的專家學(xué)者針對(duì)數(shù)據(jù)中心機(jī)房設(shè)備故障診斷方面展開了一些研究,取得了一定進(jìn)展。這些研究主要是利用機(jī)器學(xué)習(xí)的方法進(jìn)行故障預(yù)測(cè),而基于深度學(xué)習(xí)的同類研發(fā)技術(shù)應(yīng)用卻才是剛剛起步。文獻(xiàn)[1]采用nProbe工具對(duì)數(shù)據(jù)中心大規(guī)模網(wǎng)絡(luò)進(jìn)行被動(dòng)測(cè)量,該方法結(jié)合歷史數(shù)據(jù)得到正常連接率、吞吐率、設(shè)備響應(yīng)時(shí)間的偏離度,能夠在一定程度上反映設(shè)備的性能好壞,但是作為評(píng)估參數(shù)的TCPflags在TCP連接超時(shí)后,發(fā)生TCP重傳,從而提高TCP連接的比率,可能會(huì)造成評(píng)估值增大,影響性能評(píng)估效果,無(wú)法如實(shí)反映設(shè)備技術(shù)性能;文獻(xiàn)[2]主要分析了不同事件與網(wǎng)絡(luò)設(shè)備性能之間的關(guān)聯(lián),考慮的影響因素較多,由于網(wǎng)絡(luò)設(shè)備各個(gè)性能指標(biāo)之間存在著較為復(fù)雜的關(guān)系,若僅是考慮某一種因素的作用影響,并不能科學(xué)準(zhǔn)確地判斷設(shè)備性能,同時(shí)還會(huì)增加系統(tǒng)復(fù)雜度;利用深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò),通過(guò)向神經(jīng)網(wǎng)絡(luò)中輸入數(shù)據(jù),設(shè)置參數(shù)進(jìn)行訓(xùn)練,可以綜合分析設(shè)備狀態(tài)和性能。

      1 模型的研究與設(shè)計(jì)

      數(shù)據(jù)中心機(jī)房設(shè)備類型眾多,且引發(fā)故障的原因也錯(cuò)綜復(fù)雜。本文選取了較為常見的機(jī)房故障類型展開故障預(yù)測(cè)方法的研究。

      深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)在分類預(yù)測(cè)方面表現(xiàn)出較好的性能,采用TensorFlow搭建神經(jīng)網(wǎng)絡(luò)模型,將采集到的機(jī)房日志經(jīng)過(guò)數(shù)據(jù)歸一化處理,提取特征,送入神經(jīng)網(wǎng)絡(luò)訓(xùn)練模型,實(shí)現(xiàn)利用設(shè)備運(yùn)行日志數(shù)據(jù)預(yù)測(cè)出設(shè)備可能發(fā)生的狀態(tài)。

      1.1 特征數(shù)據(jù)預(yù)處理

      服務(wù)器、交換機(jī)、路由器是數(shù)據(jù)中心機(jī)房的重要基礎(chǔ)設(shè)施,而對(duì)應(yīng)設(shè)備的性能優(yōu)劣將直接影響數(shù)據(jù)中心網(wǎng)絡(luò)的運(yùn)行效率。網(wǎng)絡(luò)設(shè)備的性能參數(shù)主要包括CPU利用率、內(nèi)存利用率以及設(shè)備響應(yīng)時(shí)間等,這些參數(shù)能夠反映出網(wǎng)絡(luò)的運(yùn)行狀態(tài)。

      因此,研究在采集機(jī)房設(shè)備日志數(shù)據(jù)時(shí),選取上述能夠反映設(shè)備性能的關(guān)鍵指標(biāo)參數(shù),主要包含:CPU使用率、內(nèi)存利用率、設(shè)備響應(yīng)時(shí)間、接收IP報(bào)文速率、設(shè)備當(dāng)前時(shí)間,利用所選取的各項(xiàng)指標(biāo)數(shù)據(jù)就可綜合評(píng)價(jià)設(shè)備狀態(tài)。

      由于采集到的日志數(shù)據(jù)存在無(wú)效數(shù)據(jù)以及冗余數(shù)據(jù),因此需要對(duì)采集到的原始數(shù)據(jù)進(jìn)行預(yù)處理加工,處理流程如圖1所示。按照采集時(shí)樣本數(shù)據(jù)當(dāng)前對(duì)應(yīng)的設(shè)備狀態(tài),分類標(biāo)注“正?!焙汀肮收稀睌?shù)據(jù),得到訓(xùn)練集和測(cè)試集數(shù)據(jù),并保存為.csv格式。

      本文基于四川省自然資源廳數(shù)據(jù)中心機(jī)房設(shè)備數(shù)據(jù)進(jìn)行測(cè)試和驗(yàn)證,在研究中利用主動(dòng)輪詢的方式,按照預(yù)先選取的性能指標(biāo)采集數(shù)據(jù)中心設(shè)備性能參數(shù)數(shù)據(jù)。總共整理了20 000條樣本數(shù)據(jù)作為數(shù)據(jù)集。

      如前所述,數(shù)據(jù)中心機(jī)房設(shè)備類型眾多,造成機(jī)房設(shè)備性能故障的原因較為復(fù)雜,這里選取了較為典型的機(jī)房設(shè)備故障類型作為故障樣本數(shù)據(jù)集數(shù)據(jù),詳見表1。表1中包含了設(shè)備正常狀態(tài)下、由于CPU利用率過(guò)高以及內(nèi)存利用率過(guò)高導(dǎo)致設(shè)備出現(xiàn)故障的部分?jǐn)?shù)據(jù)。此外,數(shù)據(jù)集中還包含了設(shè)備響應(yīng)時(shí)間過(guò)長(zhǎng)、傳輸報(bào)文速率過(guò)低等引起的設(shè)備故障。

      不同的特征往往具有不同的量綱和量綱單位,這樣的情況會(huì)影響到數(shù)據(jù)分析的結(jié)果,為了消除指標(biāo)之間的量綱影響,需要再次進(jìn)行數(shù)據(jù)標(biāo)準(zhǔn)化處理。在此過(guò)程后,各指標(biāo)處于同一數(shù)量級(jí),適合進(jìn)行綜合對(duì)比評(píng)價(jià)。研究中,采用Z-score均方差的方法將數(shù)據(jù)做到歸一化處理。研究推得數(shù)學(xué)公式可表示為:

      其中 xi表示樣本數(shù)據(jù);μ表示總體平均值;δ表示總體標(biāo)準(zhǔn)差。

      歸一化處理后的數(shù)據(jù)符合均值為0,方差為1的正態(tài)分布曲線,經(jīng)過(guò)歸一化處理后的各數(shù)據(jù)指標(biāo)處于同一數(shù)量級(jí),適于后續(xù)的綜合對(duì)比評(píng)價(jià)研究。

      1.2 神經(jīng)網(wǎng)絡(luò)模型的設(shè)計(jì)

      神經(jīng)網(wǎng)絡(luò)在分類預(yù)測(cè)方面表現(xiàn)出良好的性能,神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)在整體上包含3層:輸入層、隱藏層、輸出層,通過(guò)全連接的方法,可將多個(gè)隱藏層連接起來(lái),從而擴(kuò)充神經(jīng)網(wǎng)絡(luò)模型的深度來(lái)解決較為復(fù)雜的問題。由于數(shù)據(jù)中心機(jī)房設(shè)備性能數(shù)據(jù)關(guān)系復(fù)雜,通常為非線性關(guān)系,本文搭建多層神經(jīng)網(wǎng)絡(luò)來(lái)進(jìn)行故障預(yù)測(cè)。 對(duì)此可做研究闡述如下。

      1.2.1 模型結(jié)構(gòu)

      在實(shí)驗(yàn)中,利用TensorFlow框架搭建了一個(gè)簡(jiǎn)單的神經(jīng)網(wǎng)絡(luò)模型用于故障訓(xùn)練和預(yù)測(cè),模型結(jié)構(gòu)設(shè)計(jì)如圖2所示。該結(jié)構(gòu)圖中主要包含輸入層、輸出層、全連接層(隱藏層),輸入層輸入數(shù)據(jù),經(jīng)過(guò)全連接層的處理,從輸出層輸出分類結(jié)果。

      該模型的輸入層包括4部分,即輸入了4個(gè)特征,分別是:CPU利用率(CPU)、內(nèi)存利用率(Memory Usage)、接收?qǐng)?bào)文速率(Re message rate)、以及設(shè)備響應(yīng)時(shí)間(Response time)。輸出層輸出2種設(shè)備狀態(tài),分別是:設(shè)備“故障”或是“正?!?,在實(shí)驗(yàn)中,1表示設(shè)備狀態(tài)故障,0表示設(shè)備狀態(tài)正常。

      全連接層的核心操作就是矩陣相乘,并通過(guò)激活函數(shù)產(chǎn)生非線性特性,其輸入輸出公式為:

      其中,x,z分別為輸入輸出特征向量;W為權(quán)重矩陣;b為偏置;f(·)代表激活函數(shù)。在實(shí)驗(yàn)中,設(shè)置全連接層神經(jīng)網(wǎng)絡(luò)共2層,每層的維度分別為128和64。

      1.2.2 模型的訓(xùn)練與預(yù)測(cè)

      使用Softmax函數(shù)作為最終判斷設(shè)備狀態(tài)屬于哪一種類別的概率計(jì)算,其損失函數(shù)為交叉熵,定義如下:

      在訓(xùn)練過(guò)程中,加入正則化項(xiàng),盡量防止過(guò)擬合現(xiàn)象的發(fā)生。對(duì)此,可將公式寫作如下形式:

      1.2.3 評(píng)價(jià)指標(biāo)

      本次研究是針對(duì)數(shù)據(jù)中心機(jī)房故障進(jìn)行預(yù)測(cè),本質(zhì)上是對(duì)機(jī)房設(shè)備狀態(tài)進(jìn)行分類判斷,屬于二分類問題,因此使用損失變化和分類準(zhǔn)確率作為評(píng)測(cè)指標(biāo)。在實(shí)驗(yàn)中,利用梯度下降法來(lái)最小化損失。

      1.3 實(shí)驗(yàn)結(jié)果與分析

      設(shè)置學(xué)習(xí)率為0.01,采用梯度下降法最小化損失,在實(shí)驗(yàn)中一共訓(xùn)練了1 000輪。運(yùn)行后繪制得到的損失曲線圖和準(zhǔn)確率曲線圖分別如圖3、圖4所示。由圖3可以看出,隨著迭代次數(shù)的增加,訓(xùn)練出的模型損失曲線呈收斂趨勢(shì),最終在800步之后趨于穩(wěn)定。由圖4可以看出,隨著迭代次數(shù)的增加,準(zhǔn)確率逐漸增加,最終穩(wěn)定在0.99,輸入測(cè)試數(shù)據(jù),可以較為準(zhǔn)確地預(yù)測(cè)出數(shù)據(jù)所對(duì)應(yīng)的設(shè)備狀態(tài)。

      輸入部分樣本數(shù)據(jù),調(diào)用模型預(yù)測(cè),預(yù)測(cè)后的結(jié)果數(shù)據(jù)見表2。由表2可以看到,基本可以準(zhǔn)確預(yù)測(cè)出當(dāng)前設(shè)備狀態(tài)。表2中,1表示設(shè)備狀態(tài)故障,0表示設(shè)備狀態(tài)正常。

      2 結(jié)束語(yǔ)

      綜上所述,可以看出利用TensorFlow框架搭建的神經(jīng)網(wǎng)絡(luò)模型,經(jīng)過(guò)訓(xùn)練后可以根據(jù)設(shè)備數(shù)據(jù)信息預(yù)測(cè)出設(shè)備狀態(tài)。而當(dāng)設(shè)備性能不佳時(shí),可以提前提醒數(shù)據(jù)中心運(yùn)維人員對(duì)設(shè)備進(jìn)行維護(hù),盡可能避免故障發(fā)生,減少損失。同時(shí),預(yù)測(cè)出設(shè)備狀態(tài)也是解決數(shù)據(jù)中心機(jī)房故障問題、實(shí)現(xiàn)機(jī)房智能故障預(yù)警過(guò)程中必不可少的關(guān)鍵步驟。

      參考文獻(xiàn)

      [1]唐飛,唐海娜,恰汗·合孜爾,等. 一種基于被動(dòng)測(cè)量的網(wǎng)絡(luò)性能評(píng)估方法[J]. 計(jì)算機(jī)與數(shù)字工程,2013(4):602-604,672.

      [2] 童曉薇. 一種基于網(wǎng)絡(luò)的業(yè)務(wù)系統(tǒng)健康度評(píng)估方法[J]. 重慶理工大學(xué)學(xué)報(bào)(自然科學(xué)),2012,26(8):101-105,126.

      [3] 陳慶. 淺談數(shù)據(jù)中心設(shè)備及機(jī)房的智能化運(yùn)維管理[J]. 中國(guó)金融電腦,2018(3):58-61.

      猜你喜歡
      故障預(yù)測(cè)機(jī)房設(shè)備數(shù)據(jù)中心
      酒泉云計(jì)算大數(shù)據(jù)中心
      加強(qiáng)電視臺(tái)機(jī)房設(shè)備維護(hù)管理的策略探討
      民航綠色云數(shù)據(jù)中心PUE控制
      基于物聯(lián)網(wǎng)技術(shù)的鐵路機(jī)房設(shè)備狀態(tài)和環(huán)境監(jiān)測(cè)系統(tǒng)
      論提高裝備故障預(yù)測(cè)準(zhǔn)確度的方法途徑
      論如何做好廣播電視機(jī)房設(shè)備的日常維護(hù)工作
      電子制作(2016年18期)2016-03-31 10:01:37
      基于云計(jì)算的交通運(yùn)輸數(shù)據(jù)中心實(shí)現(xiàn)與應(yīng)用
      山區(qū)輸電線路在線監(jiān)測(cè)研究
      綜合模塊化航空電子系統(tǒng)的故障預(yù)測(cè)與健康管理技術(shù)
      加強(qiáng)廣播機(jī)房設(shè)備維護(hù)管理
      泊头市| 金门县| 西林县| 房产| 建宁县| 大同县| 清涧县| 杭锦旗| 长子县| 南江县| 沁阳市| 石嘴山市| 礼泉县| 翼城县| 古田县| 独山县| 石河子市| 阳原县| 榆中县| 连州市| 德兴市| 神木县| 长宁县| 钦州市| 内江市| 松潘县| 同德县| 庆元县| 噶尔县| 邯郸市| 通许县| 扎囊县| 道真| 龙口市| 高唐县| 阳西县| 芦溪县| 永平县| 宣武区| 巴林左旗| 新民市|