• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      云資源池探針的故障檢測方法研究

      2018-03-29 04:34:50權鵬宇車文剛余任周志元
      軟件 2017年8期
      關鍵詞:故障檢測虛擬化大數(shù)據(jù)

      權鵬宇 車文剛 余任 周志元

      摘要:隨著大數(shù)據(jù)時代的發(fā)展,人們越來越重視保存歷史數(shù)據(jù),通過海量的歷史數(shù)據(jù)挖掘數(shù)據(jù)潛藏的價值。在云計算與大數(shù)據(jù)發(fā)展的背景下,虛擬化資源產(chǎn)生的大量狀態(tài)文件、日志信息將為云平臺的故障診斷與預測提供了有力地預測與快速定位依據(jù)。通過建立探針機制的挖掘虛擬化資源池日志等信息,找出其中潛在的關聯(lián)信息。本文構建云計算資源池的大數(shù)據(jù)分析模型,通過利用大數(shù)據(jù)技術對資源池各管理層日志進行關聯(lián)性分析,快速對故障和性能瓶頸進行探查,準確給出探查出的每層資源故障路後或性能瓶頸軌跡,以智能化的方式替換隨機性和經(jīng)驗性的人工模式?通過注入云計算操作系統(tǒng)的控制臺接口和日志、利用SDN技術對網(wǎng)絡流量進行采集、通過存儲虛擬化控制工具采集存儲性能和日志,再結合現(xiàn)有應用性能分析系統(tǒng)API接口開發(fā),研發(fā)基于探針技術的資源池故障及性能分析探針系統(tǒng)。通過該模型系統(tǒng)能對不同資源類型的數(shù)據(jù)和日志進行綜合分析,從這些數(shù)據(jù)中捕獲隱患信息和故障發(fā)生點的位置信息并予以可視化表示。

      關鍵詞:大數(shù)據(jù);虛擬化;資源池探針;故障檢測

      中圖分類號:TP391.9文獻標識碼ADOI:10.3969/j.issn.l003-6970.2017.08.026

      本文著錄格式:權鵬宇,車文剛,余任,等云資源池探針的故障檢測方法研究[J]軟件,2017,38(8):13本141

      引言

      在云計算與大數(shù)據(jù)發(fā)展的背景下,虛擬化資源產(chǎn)生的大量狀態(tài)文件、日志信息將為云平臺的故障診斷與預測提供了有力地預測與快速定位依據(jù)。通過建立探針機制的挖掘虛擬化資源池日志等信息,找出其中潛在的關聯(lián)信息。

      故障診斷的目的是尋找故障發(fā)生的原因或故障位置,加快修復過程。故障和失效的關系往往異常的復雜,很難直接描述從故障到失效直接的關系。故障診斷通過檢測診斷對象的故障模式,提取故障特征,根據(jù)預定的推理原則,評估故障信息,向上層做出提示,以便于故障修復。

      云計算環(huán)境中,數(shù)據(jù)量龐大,人工直接進行故障診斷在很大程度上依賴于系統(tǒng)管理員的經(jīng)驗,其可靠性很難保證,所以人工無法應對云資源需求。由于沒有參考,診斷錯誤很難被發(fā)現(xiàn)與更正。為了避免人為因素帶來的影響與誤差,對于故障診斷現(xiàn)多使用一定的模型來進行,如神經(jīng)網(wǎng)絡、模糊邏輯等。使用故障診斷模型可以降低由專家經(jīng)驗等人為因素所帶來的偶然性與主觀性,提高診斷的精確度。

      1.2 探針監(jiān)測基礎信息資源

      由于計算機的CPU、內(nèi)存、網(wǎng)絡和磁盤資源的消耗不僅能夠反映出機器當前運行的狀態(tài),還能幫助判斷主機當前是否出現(xiàn)異常,通過建立探針技術方式獲取CPU、內(nèi)存、網(wǎng)絡和磁盤資源是整個故障與可靠性。

      基于上述原因,本文提出了基于各型號虛擬化產(chǎn)品提供的事件API作二次開發(fā),通過采集事件的分級和告警做故障的判斷、日志分析、運行狀態(tài)判斷,可在資源池中物理服務器眾多、承載大量虛擬服務器的情況下,快速發(fā)現(xiàn)已發(fā)生的故障,并提供控制臺準確預測和定位故障。

      1 系統(tǒng)設計

      1.1 系統(tǒng)架構設計

      通過建立主動式監(jiān)測探針,獲取云計算操作系統(tǒng)的控制臺接口和日志、利用SNMP協(xié)議對網(wǎng)絡資源信息進行采集、通過存儲虛擬化控制工具以及SNMP協(xié)議訪問存儲設備OID號采集存儲設備的性能數(shù)據(jù)通過存儲虛擬化控制工具采集存儲性能和日志,再結合VMwarev Sphere接口開發(fā)數(shù)據(jù)源探針,實現(xiàn)對資源池內(nèi)的虛擬資源(計算資源、存儲資源、網(wǎng)絡資源),以及承載虛擬資源的主機設備、網(wǎng)絡設備等對象的信息遠程探針。故障監(jiān)控系統(tǒng)主要由數(shù)據(jù)采集系統(tǒng)、數(shù)據(jù)分析系統(tǒng)和數(shù)據(jù)可視化三個子系統(tǒng)組成。系統(tǒng)總體架構如圖1所示:

      分析與快速定位的基石。目前關于單點故障檢測技術已經(jīng)很成熟,通過資源監(jiān)控來監(jiān)測CPU壓力、網(wǎng)絡帶寬得出當前虛擬機的運行情況。云平臺下虛擬化資源池包括計算資源池、網(wǎng)絡資源池和存儲資源池,通過底層監(jiān)控系統(tǒng)獲得虛擬機CPU、內(nèi)存、磁盤10等指標。虛擬機網(wǎng)絡包括網(wǎng)絡ICMP報文、丟包率等。以下羅列了部分計算資源、存儲資源、磁盤IO資源、進程資源、網(wǎng)絡資源信息參數(shù)。

      2 探針部署

      2.1 數(shù)據(jù)采集整體架構

      通過建立主動式監(jiān)測探針,獲取云計算操作系統(tǒng)的控制臺接口和日志、利用SNMP協(xié)議對網(wǎng)絡流量進行采集、通過存儲虛擬化控制工具采集存儲性能和日志,再結合現(xiàn)有應用性能分析系統(tǒng)AI>I接口開發(fā)數(shù)據(jù)源探針,實現(xiàn)對資源池內(nèi)的虛擬資源(計算資源、存儲資源、網(wǎng)絡資源),以及承載虛擬資源的主機設備、網(wǎng)絡設備等對象的信息遠程探針。數(shù)據(jù)采集子系統(tǒng)的架構如圖2所示:

      數(shù)據(jù)采集流程如圖3所示。

      2.2 數(shù)據(jù)采集策略

      傳統(tǒng)的數(shù)據(jù)采集方式通過設置一定的時間間隔,定時的對虛擬機性能指標進行采集。如果設置的數(shù)據(jù)采集的時間間隔較小,數(shù)據(jù)采集頻率較大。則會嚴重消耗虛擬機資源。影響用戶的正常使用。如果設置的數(shù)據(jù)采集的時間間隔較大,數(shù)據(jù)采集的頻率較小,單位時間內(nèi)采集到的虛擬機數(shù)據(jù)少,也會不能很好的反映出虛擬機的實際運行情況。對此需要采用自適應的方法保證平臺的穩(wěn)定。我們需要根據(jù)基于時間軸收集日志系統(tǒng)數(shù)據(jù)。對整體虛擬化平臺分析潛在的關聯(lián)故障關系。

      數(shù)據(jù)采集器使用自適應數(shù)據(jù)采集策略對虛擬機的性能指標進行采集。數(shù)據(jù)采集器使用的數(shù)據(jù)采集策略如圖4所示,包含粗粒度數(shù)據(jù)采集和細粒度數(shù)據(jù)采集。在粗粒度的數(shù)據(jù)采集過程中,設置的數(shù)據(jù)采集的時間間隔較大,數(shù)據(jù)采集頻率較低,這種模式下對虛擬機的性能影響較少;在細粒度的數(shù)據(jù)采集過程中,設置的數(shù)據(jù)采集的時間間隔較小,數(shù)據(jù)采集的頻率較高,這種模式下對虛擬機的性能影響較大,但單位時間內(nèi)采集的數(shù)據(jù)較大,虛擬機的實際運行狀況的反映更加全面、準確。

      2.3 計算資源探針部署

      VMwarev Sphere利用虛擬化功能將數(shù)據(jù)中心轉(zhuǎn)化

      為簡化的云計算基礎架構,使IT組織能夠提供靈活可靠的IT服務。VMwarev Sphere虛擬化并匯總多個系統(tǒng)間的基礎物理硬件資源,同時為數(shù)據(jù)中心提供大量虛擬資源。作為云操作系統(tǒng),VMwarev Sphere可作為無縫動

      態(tài)操作環(huán)境管理大型基礎架構(如CPU,存儲器河網(wǎng)絡),同時還管理復雜的數(shù)據(jù)中心。本項目從vCenter的數(shù)據(jù)庫中將歷史數(shù)據(jù)直接導出根據(jù)從vCenter數(shù)據(jù)庫導出的數(shù)據(jù)建立拓撲關系圖,并用歷史數(shù)據(jù)進行學習,建立故障模型。

      2.4 網(wǎng)絡資源探針部署

      傳統(tǒng)交換機的設備與端口數(shù)據(jù)通過SNMP協(xié)議接口采集,當前SNMP開發(fā)工具很多,常見的有:SNMP4J、SNVIII++、Winsnmp等。本系統(tǒng)可采用Java實現(xiàn)的SNMP4J。

      SNMP4J開源項目采用Java實現(xiàn),為SNMP編程提供了良好框架,支持SNMPvl、SNMPv2c和SNMPv3版本。SNMP4J既同時提供命令產(chǎn)生和命令響應,封裝了SNMP的底層編程接口,含有多個SNMP中重要的協(xié)議處理類。而且有多線程、易維護、易使用、可擴展的優(yōu)勢。SNMP數(shù)據(jù)采集的接口數(shù)據(jù)信息如圖5所示:

      3 數(shù)據(jù)分析

      構建云計算業(yè)務資源池的大數(shù)據(jù)分析模型,通過利用大數(shù)據(jù)技術對資源池各管理層日志進行關聯(lián)性分析,快速對故障和性能瓶頸進行探查,準確給出探查出的每層資源故障路徑或性能瓶頸軌跡,以智能化的方式替換隨機性和經(jīng)驗性的人工模式。通過注人云計算操作系統(tǒng)的控制臺接口和日志、利用SDN技術對網(wǎng)絡流量進行采集、通過存儲虛擬化控制工具采集存儲性能和日志,再結合現(xiàn)有應用性能分析系統(tǒng)API接口開發(fā),結合現(xiàn)有虛擬化平臺中已經(jīng)部署的監(jiān)控模塊,設計并實現(xiàn)一款基于探針技術和大數(shù)據(jù)分析技術的資源故障監(jiān)控系統(tǒng),在客戶操作系統(tǒng)中部署探針程序獲取日志數(shù)據(jù),通過使用大數(shù)據(jù)分析技術對日志數(shù)據(jù)進行分析,建立并訓練故障模型,從而對關聯(lián)故障的故障源進行定位,以及識別出引發(fā)故障的行為模式從而提供故障預警功能,并予以可視化表示。

      數(shù)據(jù)分析模塊研究資源池各類型探針獲得的檢測數(shù)據(jù)并構成障診斷分析模型。采用大數(shù)據(jù)分析技術對采集的各項指標數(shù)據(jù)進行分析,構建一個適應多種數(shù)據(jù)類型分析和預測的算法模型,通過該模型能對不同資源類型的數(shù)據(jù)和日志進行綜合分析,從這些數(shù)據(jù)中捕獲隱患信息和故障發(fā)生點的位置信息,通過將這些信息加工處理后以標準方式提供云計算的管理系統(tǒng)或IT服務的管理監(jiān)控系統(tǒng)進行呈現(xiàn),及時發(fā)現(xiàn)安全隱患和加快故障處繊率和質(zhì)量。

      數(shù)據(jù)分析模塊劃分為數(shù)據(jù)預處理,故障分析,趨勢預測三個部分。數(shù)據(jù)分析流程圖如圖6所示。

      步驟如下:

      (1)采集虛擬機各項指標的正常異常和故障數(shù)據(jù)作為樣本。定義為節(jié)點在某時刻的狀態(tài),其中xit為刻畫節(jié)點性能指標的第i類變量。刻畫節(jié)點性能的指標主要包含計算、內(nèi)存、網(wǎng)絡及存儲等方面。

      (2)進行預處理由于采集的性能指標具有復雜、高維、冗余等特征,所以首先需要進行標準化處理并提取數(shù)據(jù)集的主要特征。

      (3)針對主要特征選擇數(shù)據(jù)分析模式,并利用其它帶標簽的和不帶標簽的數(shù)據(jù)樣本訓練分類器建立故障診斷模型和預測模型。

      (4)進行故障診斷對診斷為故障的數(shù)據(jù)進行故障定位,對異常數(shù)據(jù)進行趨勢預測。

      3.1 數(shù)據(jù)預處理

      由于不同的系統(tǒng)度量值的原始數(shù)據(jù)范圍非常不同,需要對數(shù)據(jù)進行標準化處理。數(shù)據(jù)標準化也就是統(tǒng)計數(shù)據(jù)的指數(shù)化。數(shù)據(jù)標準化處理主要包括數(shù)據(jù)同趨化處理和無量綱化處理兩個方面。數(shù)據(jù)同趨化處理主要解決不同性質(zhì)數(shù)據(jù)問題對不同性質(zhì)指標直接加總不能正確反映不同作用力的綜合結果。數(shù)據(jù)無量綱化處理主要解決數(shù)據(jù)的可比性。在此擬采用指數(shù)化處理方法。指數(shù)化處理以指標的最大值和最小值的差距進行數(shù)學計算,其結果介于0到1之間具體計算公式如下。

      3.2 故障診斷

      故障分析診斷通過分析系統(tǒng)歷史運行情況建立故障te型,在故障發(fā)生時目纟及時報警并進一步確定最可能發(fā)生故障的節(jié)點或組件、程序,縮小對于故障發(fā)生原因的搜索空間。

      為了識別整個故障發(fā)生過程中出現(xiàn)的特征,針對采集的系統(tǒng)數(shù)據(jù)進行建模,構建特征識別器.特征識別器實際上是一個分類器,將日志中體現(xiàn)的特征映射為預設的故障類型.常見的分類器構造方法包括決策樹分類法、神經(jīng)網(wǎng)絡、貝葉斯分類法等?;舅悸肥沁x擇一種學習算法用來確定分類模型,從而擬合樣本數(shù)據(jù)中故障類型和屬性集之間的映射關系,這樣面對未知故障類型的樣本數(shù)據(jù)時,可以基于此分類模型預測樣本的故障類型。

      在構建分類器的過程中,需要將數(shù)據(jù)劃分為訓練集和檢驗集,訓練集是標識了故障類型的數(shù)據(jù)用來建模,檢驗集未標識故障類型,用來檢驗模型的有效性。有效性可用精確率和召回率進行衡量。

      4 故障檢測模型設計

      4.1 BP神經(jīng)網(wǎng)絡

      BP神經(jīng)網(wǎng)絡是一種多層前饋神經(jīng)網(wǎng)絡,由非線性變換單元組成的BP神經(jīng)網(wǎng)絡,不僅結構簡單,而且具有良好的非線性映射能力。

      利用神經(jīng)網(wǎng)絡的自學習能力,建立故障的征兆與原因之間的映射關系,即神經(jīng)網(wǎng)絡模型,使用神經(jīng)網(wǎng)絡模型在新的數(shù)據(jù)到來時,可以由故障征兆快速的推理出故障原因。

      在建立神經(jīng)網(wǎng)絡模型時需確定隱層節(jié)點數(shù)量、隱層數(shù)目可以采用遺傳算法對BP神經(jīng)網(wǎng)絡隱含層進行優(yōu)化。一個三層的BP網(wǎng)絡已能映射或逼近任何有理函數(shù),故可采用含有一個隱層的BP網(wǎng)絡。

      采用含有標簽的節(jié)點狀態(tài)向量訓練神經(jīng)網(wǎng)絡6,由學習數(shù)據(jù)輸入向量的長度n確定網(wǎng)絡輸入層節(jié)點數(shù)為n;由學習實例輸出向量的長度m確定網(wǎng)絡輸出層的節(jié)點數(shù)為m;定義各層間的初始連接權重矩陣,第1層連接到第1+1層的連接矩陣為。

      4.1.1 神經(jīng)網(wǎng)絡模型訓練

      采用含有標簽的節(jié)點狀態(tài)向量訓練神經(jīng)網(wǎng)絡,由學習數(shù)據(jù)輸入向量的長度n確定網(wǎng)絡輸入層節(jié)點數(shù)為n;由學習實例輸出向量的長度m確定網(wǎng)絡輸出層的節(jié)點數(shù)為m;定義各層間的初始連接權重矩陣,第1層連接到第1+1層的連接矩陣為。根據(jù)經(jīng)驗公式隱層神經(jīng)元數(shù)量分布在一定范圍內(nèi)。

      對幾種選取方式進行了測試。經(jīng)測試隱層節(jié)點選?。╝ttribs+classes)/2準確率最高。此外對神經(jīng)網(wǎng)絡的其他各項參數(shù)包括激勵函數(shù)和連接方式均進行了測試和調(diào)整。

      4.2 決策樹算法

      決策樹是一種簡單有效的分類技術,通常用于處理多屬性數(shù)據(jù)的分類問題??梢酝ㄟ^決策樹算法建立故障模型分析故障類型。

      為了提取故障特征,我們需要使用正常情況下的特征向量與故障發(fā)生時間窗口內(nèi)采集的特征向量作為基本分析單元輸入,經(jīng)訓練輸出決策樹及規(guī)則。以此得到能夠判別故障類型的模型。

      基于邏輯分析的決策樹方法最重要的特點是能把復雜決策過程分解為簡單決策過程的累加,依此提供易于解釋的解決方法。決策樹是一個類似于流程圖的樹結構。把決策樹方法引入故障診斷,可以生成故障判別樹,獲得精練的判別規(guī)則,為故障的歸類提供有力的決策依據(jù)。

      4.2.1 決策樹算法步驟

      Quinlan在1993年提出了ID3算法的改進版C4.5算法。C4.5算法采用信息增益率來代替信息增益作為屬性選擇的標準,同時還增加了悲觀剪枝,連續(xù)型屬性處理,缺失值屬性處理和產(chǎn)生規(guī)則等功能。

      特征A對訓練數(shù)據(jù)集的信息增益率定義為其信息增益與訓練數(shù)據(jù)集D關于特征A的值的熵之比,其中:

      是特征A取值的數(shù)算法選擇最大的屬性,作為分支屬性,解決了選取作為分支屬性導致的多值屬性偏向的問題。

      具體算法步驟如下:

      輸入:訓練樣本,候選屬性的集合為attribute_list

      輸/5:由輸入訓練樣本產(chǎn)生一棵決策樹(1)創(chuàng)建節(jié)點N;

      (2)如果訓練集為空,在返回節(jié)點N標記為Failure;

      (3)如果訓練集中的所有記錄都屬于同一個類別,則以該類別標記節(jié)點N;

      (4)如果候選屬性為空,則返回N作為葉節(jié)

      點,標記為訓練集中最普通的類;

      (5)foreach候選屬性attribute_list;

      (6)if候選屬性是聯(lián)系的then;

      (7)對該屬性進行離散化;

      (8)選擇候選屬性attribute_list中具有最高信息增益的屬性D;

      (9)標記節(jié)點N為屬性D;

      (10)foreach屬性D的一致值d;

      (11)由節(jié)點N長出一個條件為D=d的分支;

      (12)設s是訓練集中D=d的訓練樣本的集合;

      (13)ifs為空;

      (14)加上一個樹葉,標記為訓練集中最普通

      的類;

      (15)else加上一個有返回的點。

      4.2.2 決策樹剪枝

      當由此得到一棵完全生長的決策樹后,C4.5采用了一種后剪枝方法。該方法可以避免樹的高度無節(jié)制地增長,防止數(shù)據(jù)過度擬合,同樣也是用訓練樣本本身來估計剪枝前后的誤差,從而決定是否真正進行剪枝10,其實質(zhì)是為了消除訓練產(chǎn)生的集中孤立點和噪聲方法中使用的公式如下:

      當由此得到一棵完全生長的決策樹后,C4.5采用了一種后剪枝方法。該方法可以避免樹的高度無節(jié)制地增長,防止數(shù)據(jù)過度擬合,同樣也是用訓練樣本本身來估計剪枝前后的誤差,從而決定是否真正進行剪枝,其實質(zhì)是為了消除訓練產(chǎn)生的集中孤立點和噪聲方法中使用的公式如下:

      通過判斷剪枝前后e的大小,從而決定是否需要剪枝。

      4.3 關聯(lián)規(guī)則算法

      云計算資源池的節(jié)點異常模式挖掘?qū)τ诳焖僭\斷資源池異常和挖掘節(jié)點中參數(shù)之間的隱藏關系具有重要作用,本文提出了基于改進的Edat關聯(lián)規(guī)則算法處理資源池節(jié)點之間的關系,挖掘其中的高位-高位、低位-高位模式,并且與傳統(tǒng)Eclat算法進行了比較。通過實驗驗證了算法的有效性和高效性。未來將通過資源池節(jié)點狀態(tài)信息挖掘異常模式以提前預測節(jié)點異常,以及提供節(jié)點異常分類、節(jié)點定位等服務。

      4.3.1 關聯(lián)規(guī)則定義

      定義1關聯(lián)規(guī)則是具有X—Y形式的蘊含關系,X和Y在關聯(lián)規(guī)則中分別稱之為先導和后繼。X—Y表示如果X成立那么Y—定成立,其中X和Y為項目集合。

      定義2支持度support(X—Y)表示在事務數(shù)據(jù)庫中包含XuY項目集的事務占全體數(shù)據(jù)庫事務的百

      分比,即:support(xuY)=support(x—y)=p(xuY),

      其中XuY表示一條事務中同時包含X和Y。

      定義3置信度confidence(X—Y)表tk事務數(shù)據(jù)

      庫中包含XuY的項目集事務數(shù)目占包含X的項目

      集事務數(shù)目的比重。即:

      4.3.2 關聯(lián)規(guī)則定理

      定理1非頻繁項集的超集一定是非頻繁項集。

      證明:設表示項目集合,根據(jù)定義1、定義,那么假設support(X->Y)

      定理2任何繁項集的非空子集也是頻繁項集。

      證明:設表示項目集合,根據(jù)定義1、定義2,,假設即是頻繁的。那么對于一個項目集合Z,其中,且中包含的項目數(shù)要少于或等于X和Y合并項目數(shù),那么也是頻繁的。

      4.3.2 模型參數(shù)定義

      由于各物理設備或虛擬主機運行情況不同,并且不同的物理設備的參數(shù)也不相同,所以需要首先確定各個節(jié)點狀態(tài)信息模式評判標準,本文通過統(tǒng)計各個節(jié)點狀態(tài)信息在歷史數(shù)據(jù)中低位運行狀態(tài)、正常運行狀態(tài)和高位運行狀態(tài)比重進行模式劃分,實現(xiàn)所有的狀態(tài)信息轉(zhuǎn)化成可處理數(shù)據(jù)模型。

      定義1 對于云計算環(huán)境

      表示云計算環(huán)境中資源池中所有節(jié)點集合。P中節(jié)點包括虛擬主機、網(wǎng)絡設備、存儲服務器等。本文統(tǒng)一用其IP地址作為其唯一標識符。數(shù)據(jù)集合表示時間戳,表示數(shù)據(jù)集收集了t個時間戳節(jié)點狀態(tài)信息集合。

      定義2,其中表示節(jié)點中存在的參數(shù)種類,如CPU狀態(tài)、內(nèi)存狀態(tài)、虛擬網(wǎng)卡端口狀態(tài)等,其中。

      定義3定義其中valuei表不低位狀態(tài),value2表亦正常狀態(tài),value3表示高位狀態(tài)。

      定義4高位-高位模式表示在云計算環(huán)境中一個處于高位運行的節(jié)點集合會導致另外一個高位運行節(jié)點集合的產(chǎn)生,在真實的生產(chǎn)環(huán)境中即一個節(jié)點的異常會導致另外一個節(jié)點的異常,如分布式業(yè)務系統(tǒng),往往一臺虛擬主機的異常會導致其他虛擬主機狀態(tài)異常。這種模式反映了虛擬主機由于內(nèi)在的關聯(lián),一臺虛擬主機的異常往往會產(chǎn)生連鎖反應,導致其他虛擬主機異常。

      定義5低位-高位模式表示在云計算環(huán)境中一個處于低位運行的節(jié)點集合會導致另外一個高位運行節(jié)點集合的產(chǎn)生,在真實的生產(chǎn)環(huán)境中,如一臺物理主機中存在多臺虛擬主機,其中多臺虛擬主機一直處于空閑狀態(tài),而一臺虛擬主機處于高位運行,此種模式反映了需要將其虛擬主機上的業(yè)務系統(tǒng)轉(zhuǎn)移到其他虛擬主機上以減輕虛擬主機運行壓力。

      5 結論

      面向業(yè)務應用資源池的故障分析與檢測是一個具有重要理論價值和實際應用價值的重點研究課題。隨著云計算的發(fā)展,虛擬化技術將各種物理資源抽象為邏輯上的資源,隱藏了各種物理上的限制,為在更細粒度上對其進行管理和應用提供了可能性,大量的應用和用戶數(shù)據(jù)都部署在云端,云計算的可靠性面臨著巨大的挑戰(zhàn)。因此必須從故障預警和快速故障定位兩個方面加強資源池運維相關技術研究以提高計算資源池的運行穩(wěn)定性和承載能力。

      本系統(tǒng)利用SNMP協(xié)議對網(wǎng)絡資源、存儲資源進行采集、通過存儲虛擬化控制工具采集計算資源性能和日志,再結合現(xiàn)有應用性能分析系統(tǒng)API接口開發(fā),獲取系統(tǒng)有用信息。構建云計算資源池的大數(shù)據(jù)分析模型,通過使用大數(shù)據(jù)分析技術對日志數(shù)據(jù)進行分析,建立并訓練故障模型,從而對關聯(lián)故障的故障源進行定位,以及識別出引發(fā)故障的行為模式從而提供故障告警功能。由以上分析可見推廣探針系統(tǒng)具有良好的可行性和經(jīng)濟性。是以智能化的方式替換隨機性和經(jīng)驗性的人工模式的良好方法。

      猜你喜歡
      故障檢測虛擬化大數(shù)據(jù)
      基于OpenStack虛擬化網(wǎng)絡管理平臺的設計與實現(xiàn)
      電子制作(2019年10期)2019-06-17 11:45:10
      對基于Docker的虛擬化技術的幾點探討
      電子制作(2018年14期)2018-08-21 01:38:20
      虛擬化技術在計算機技術創(chuàng)造中的應用
      電子測試(2017年11期)2017-12-15 08:57:56
      電子電路的故障檢測技術
      新型探測線圈淺析
      科技視界(2016年21期)2016-10-17 17:53:37
      基于大數(shù)據(jù)背景下的智慧城市建設研究
      科技視界(2016年20期)2016-09-29 10:53:22
      暖通空調(diào)系統(tǒng)故障檢測與診斷技術探討
      試論暖通空調(diào)系統(tǒng)故障檢測與診斷研究
      存儲虛擬化還有優(yōu)勢嗎?
      微山县| 开阳县| 闵行区| 定安县| 安达市| 清新县| 莱州市| 峨眉山市| 永昌县| 麦盖提县| 化隆| 峨边| 米林县| 天水市| 康平县| 白河县| 曲麻莱县| 宽甸| 雅江县| 宣恩县| 江油市| 郸城县| 古蔺县| 赤壁市| 大邑县| 高密市| 保定市| 洛川县| 双峰县| 华容县| 中西区| 资中县| 新河县| 光泽县| 湘西| 黎平县| 鄂尔多斯市| 吴忠市| 兴义市| 民丰县| 龙口市|