• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      云計算環(huán)境下虛擬機故障預測

      2022-12-14 02:17王開放陳威偉
      現(xiàn)代電子技術(shù) 2022年24期
      關鍵詞:計算環(huán)境馬爾可夫準確率

      王開放,姜 瑛,陳威偉

      (1.云南省計算機技術(shù)應用重點實驗室,云南 昆明 650500;2.昆明理工大學信息工程與自動化學院,云南 昆明 650500)

      0 引 言

      隨著計算機技術(shù)的發(fā)展,基于虛擬化技術(shù)的大型分布式云計算系統(tǒng)開始廣泛地部署和應用。云計算作為當今互聯(lián)網(wǎng)的主要計算方式,將軟硬件資源以共享的方式提供給相應的計算機,并以這種方式為網(wǎng)絡用戶提供服務,使得用戶能夠按需獲得計算資源、存儲資源等[1]。作為實現(xiàn)云計算架構(gòu)的關鍵,虛擬化技術(shù)能夠?qū)⒂邢薜奈锢碣Y源抽象虛擬出多個具有相似特性的虛擬機實體,以便提供給更多的服務對象使用[2],從而使云計算環(huán)境中不同的物理資源都以虛擬機的形式靈活進行封裝和分配,為用戶按需提供租用服務。虛擬機作為云計算平臺的服務實體,其內(nèi)部通常會部署很多密集型和關鍵型的應用,它們會產(chǎn)生頻繁的訪存操作,這可能導致虛擬機內(nèi)存崩潰,一旦內(nèi)存崩潰,與內(nèi)存相關的所有訪存操作都將終止,會極大地影響云計算環(huán)境下虛擬機的運行[3]。特別在大規(guī)模的云計算環(huán)境中,提供服務的虛擬機有成千上萬臺,部分虛擬機會因為內(nèi)存、CPU、網(wǎng)絡等各種原因發(fā)生故障,導致虛擬機性能下降、宕機等,這將對云計算環(huán)境下虛擬機的可靠性、服務質(zhì)量及用戶體驗造成嚴重影響。因此,有效預測出虛擬機的故障是亟待解決的問題。

      1 相關工作

      國內(nèi)外已經(jīng)開展了對云計算環(huán)境下的虛擬機故障預測的廣泛研究。目前云計算環(huán)境下虛擬機故障預測的研究工作主要是:在虛擬機正常工作的條件下,采集虛擬機運行狀態(tài)數(shù)據(jù);然后通過對采集的數(shù)據(jù)進行分析,得到故障發(fā)生的規(guī)律,用于判斷虛擬機在未來一段時間內(nèi)是否發(fā)生故障。在虛擬機發(fā)生故障之前采取相關的預防措施,可以避免故障的發(fā)生或者降低故障發(fā)生帶來的損失,為云計算環(huán)境下虛擬機的可用性和可靠性提供保證[4]。

      通過預測云計算環(huán)境中物理節(jié)點的故障,可以將虛擬機分配和遷移到健康節(jié)點,從而提高服務可用性。Lin 等人提出了一種MING 模型,該模型根據(jù)歷史數(shù)據(jù)預測云服務系統(tǒng)中節(jié)點的故障傾向性,返回排序為Topr的節(jié)點為故障節(jié)點[5]。Guan 等人提出利用貝葉斯方法和決策樹方法來預測云計算系統(tǒng)中的故障。該方法需要管理員驗證檢測到的異常行為后,將這些數(shù)據(jù)添加標簽即獲取到一些具有標簽的數(shù)據(jù)集;然后利用監(jiān)督學習方法將數(shù)據(jù)集訓練出決策樹分類器來預測云計算中的故障[6]。

      魯明等人提出了一種虛擬機性能異常的預測方法,通過采用隱馬爾可夫模型刻畫當前系統(tǒng)的正確狀態(tài),并根據(jù)業(yè)務系統(tǒng)預測結(jié)果是否偏移正常狀態(tài)來判定業(yè)務系統(tǒng)是否出現(xiàn)性能異常[7]。丁三軍等人利用虛擬機的運行日志數(shù)據(jù)進行故障的模糊關聯(lián)規(guī)則挖掘,提出一種基于規(guī)則的日志數(shù)據(jù)加權(quán)處理方法,并獲得故障預測的關聯(lián)規(guī)則,得出故障預測結(jié)果[8]。Li 等人提出了一種AdaBoost 和隱馬爾可夫模型的虛擬機故障預測算法,以預測虛擬機未來的故障狀態(tài)[9]。Saxena 等人提出了一種在線虛擬機故障預測和容錯模型(OFP?TM),根據(jù)未來的資源使用情況實時估計容易發(fā)生故障的虛擬機,對易發(fā)生故障的虛擬機進行遷移,提前處理中斷,提高云平臺的可用性[10]。

      在上述研究中,如文獻[5?6]基于云計算節(jié)點運行的時間特征建立了相應的機器學習故障預測方法和模型,并根據(jù)節(jié)點的性能數(shù)據(jù)來預測性能數(shù)據(jù),然后對預測結(jié)果進行分析,這易受到云計算平臺高動態(tài)性的影響。

      此外,還有通過虛擬機可觀測的系統(tǒng)特征來對虛擬機進行故障檢測和故障預測的研究,文獻[7]通過可觀測的系統(tǒng)特征如CPU 利用率,來對云計算環(huán)境下虛擬機系統(tǒng)當前的異常狀態(tài)進行預測,但不能預測系統(tǒng)下一個時刻虛擬機系統(tǒng)的運行狀態(tài)。部分研究針對云計算平臺下的虛擬機故障預測主要是采取收集相關的日志數(shù)據(jù),根據(jù)數(shù)據(jù)挖掘規(guī)則進行故障預測,如文獻[8]易受到數(shù)據(jù)挖掘使用樣本的限制。文獻[9?10]的預測方法中存在由虛擬機負載所表現(xiàn)出的觀測狀態(tài)與虛擬機內(nèi)部安全狀態(tài)之間的關系存在不確定性,這需要進一步的探究。

      針對上述研究中存在的問題,本文提出了一種基于虛擬機的歷史故障規(guī)律建立故障預測的方法。本文方法通過分析虛擬機的歷史數(shù)據(jù)和當前運行數(shù)據(jù)的差異度來判定虛擬機當前的狀態(tài),隨后根據(jù)虛擬機的當前狀態(tài)結(jié)合歷史故障轉(zhuǎn)移規(guī)律預測下一時刻故障。為了保證云計算環(huán)境下虛擬機的可靠性和可用性,本文方法根據(jù)云計算環(huán)境下虛擬機的運行,持續(xù)對預測方法中的訓練數(shù)據(jù)進行動態(tài)更新,不斷提升其故障預測的有效性。

      2 虛擬機故障預測方法的建立

      本文將云計算環(huán)境下虛擬機故障限定為性能故障,指偏離虛擬機正常行為性能退化。與造成虛擬機立即停止運行的宕機或崩潰失效不同,性能故障通常只是造成虛擬機運行效率下降,如虛擬機CPU 負載過高,或內(nèi)存泄露可能會導致可用CPU 占用率上升、內(nèi)存數(shù)量減少等。而因為故障導致的性能異常,均可以通過對虛擬機的運行狀態(tài)的監(jiān)測數(shù)據(jù)來進行判斷。因此,本文通過監(jiān)測云計算環(huán)境下虛擬機的性能數(shù)據(jù)來預測虛擬機的故障。

      云計算平臺下的虛擬機在持續(xù)運行過程中其狀態(tài)數(shù)據(jù)始終源源不斷地產(chǎn)生,新的數(shù)據(jù)可能蘊含著新的故障規(guī)律?,F(xiàn)有的故障預測方法大多利用固定的數(shù)據(jù)集進行一次性學習,根據(jù)學習結(jié)果進行預測,未學習新運行數(shù)據(jù)所包含的故障規(guī)律。因此,本文的故障預測方法通過持續(xù)將虛擬機產(chǎn)生的運行數(shù)據(jù)加入到訓練集進行不斷訓練,學習新數(shù)據(jù)所蘊含的故障規(guī)律,以提高故障預測的準確性。

      本文的故障預測方法過程為:首先對持續(xù)采集的性能指標數(shù)據(jù)進行預處理;接著對預處理之后的數(shù)據(jù)進行特征選擇;然后計算現(xiàn)有數(shù)據(jù)與歷史數(shù)據(jù)正常狀態(tài)和故障狀態(tài)下的特征差異,并根據(jù)特征差異度來對虛擬機的當前狀態(tài)進行判斷;再根據(jù)虛擬機的歷史狀態(tài)變化規(guī)律建立馬爾可夫鏈故障預測方法,預測虛擬機下一時刻的故障狀態(tài);最后持續(xù)的更新訓練集,學習新故障發(fā)生規(guī)律。云計算環(huán)境下虛擬機故障預測方法的流程如圖1所示。

      圖1 虛擬機故障預測方法流程

      2.1 預處理虛擬機運行數(shù)據(jù)

      由于虛擬機運行數(shù)據(jù)各個指標的量綱和單位不同,有些指標數(shù)據(jù)值很大但卻不是造成故障的主要因素,而有些指標數(shù)據(jù)值很小但卻有可能是造成故障的重要因素,在不對特征進行歸一化時很難選出與故障預測、故障估測具有強相關的特征,因此本文采用StandarScaler方法對采集到的數(shù)據(jù)集進行標準化處理,使得新的數(shù)據(jù)集方差為1,均值為0,目的是消除不同維度的數(shù)據(jù)量級對故障特征選擇的影響。標準化之后的數(shù)據(jù)既保留了原數(shù)據(jù)的特性,又避免了數(shù)據(jù)值比較集中的情況。

      2.2 對運行數(shù)據(jù)進行特征選擇

      2.1 節(jié)中對數(shù)據(jù)進行標準化處理之后,消除了量綱不同而造成的影響,但是由于采集到的虛擬機運行數(shù)據(jù)的指標過多,其中有一些指標屬于噪聲數(shù)據(jù)或者與故障不相關,而這些數(shù)據(jù)輸入到預測方法將會增大運算量和開銷,并且會影響方法的預測準確性。所以為了獲得云計算環(huán)境下虛擬機的有效狀態(tài)特征,對原始數(shù)據(jù)進行降維處理是不可或缺的過程。目前常用的特征降維方法是特征提取和特征選擇,特征提取得到的最終特征集失去了原始特征集的物理含義,從而使得新得到的特征子集的可理解性差;特征選擇可以剔除掉無關的、冗余的及對虛擬機故障預測起副作用的狀態(tài)特征后,得到與故障預測強相關的精簡數(shù)據(jù)特征子集,更能反映故障規(guī)律的本質(zhì)特征[11]。且在云計算的環(huán)境中,一旦發(fā)現(xiàn)故障,可根據(jù)特征子集進行反差其故障原因,可解釋性強。因此,本文利用特征選擇的方法,即Relief 算法來獲取與虛擬機故障預測具有強相關的特征。

      2.3 根據(jù)特征差異度判斷虛擬機狀態(tài)

      通過第2.2 節(jié)中的特征選擇方法,得到了和虛擬機的故障預測具有強相關的精簡特征子集,該特征子集能反映故障規(guī)律的本質(zhì)特征,且能夠很好地判別出虛擬機的運行狀態(tài)。由于虛擬機上的負載具有復雜性、動態(tài)性,其運行數(shù)據(jù)的波動性大,所以虛擬機在故障狀態(tài)下和在正常狀態(tài)下所表現(xiàn)出的特征具有很大的差異性。根據(jù)歸屬同一類別的對象之間具有很強的相似性,反之具有極大的差異性這一特點,選取能夠刻畫不同類標簽的代表性對象實例作為參考目標,并利用其余對象與代表性對象之間的差異性來判斷其余對象的類別。本文根據(jù)差異性判別的基本思想是:訓練樣本集E中包含正常數(shù)據(jù)訓練集M和故障數(shù)據(jù)訓練集F。正常訓練集M中包含n個對象實例,故障訓練集F中包含n個對象實例,即M={x1,x2,…,xn},F(xiàn)={f1,f2,…,fn},分別從各自的訓練集中選取r個對象構(gòu)成原型集Y1,Y2,Y1={q1,q2,…,qr},Y2={s1,s2,…,sr},要求該r個對象實例能夠顯著刻畫該類標簽的特征。i∈E,q1∈Y1,s1∈Y2,Label(q1)=A,Label(s1)=B,若dis(i,q1)>dis(i,s1),則Label(i)=B,其中dis(·)函數(shù)表示兩個樣本間的距離函數(shù),本文根據(jù)樣本之間的距離大小來表示差異度。

      在差異度計算的方法中,原型集代表了一類對類標簽具有顯著識別能力的有用的樣本子集,將其作為差異度計算過程中的參考數(shù)據(jù)集[12]。本文采用文獻[12]中的二進制粒子群優(yōu)化算法選取最佳的樣本子集作為原型集。通過分析虛擬機當前運行數(shù)據(jù)與不同的原型集之間的差異度判斷虛擬機當前的故障狀態(tài)。根據(jù)特征差異度判斷虛擬機狀態(tài)算法,如算法1 所示。

      算法1:根據(jù)特征差異度判斷虛擬機狀態(tài)

      輸入:虛擬機歷史正常數(shù)據(jù)ntraindata 和標簽nlabel,歷史故障數(shù)據(jù)ftraindata 和標簽flabel,虛擬機當前數(shù)據(jù)cdata

      輸出:虛擬機故障狀態(tài)plabel

      2.4 馬爾可夫鏈預測方法構(gòu)建

      第2.3 節(jié)中利用虛擬機歷史運行數(shù)據(jù)得到了通過特征差異,來對虛擬機當前的故障狀態(tài)進行判定,然后在當前狀態(tài)的基礎上對虛擬機進行故障預測。雖然虛擬機的運行情況是根據(jù)其負載情況而動態(tài)變化的,但是虛擬機下一時刻的運行情況往往只受當前情況的影響,即虛擬機下一個時刻的運行狀態(tài)受當前狀態(tài)的影響較大而受除當前狀態(tài)之前的狀態(tài)影響較小。基于虛擬機運行情況的無后效性特點,本文提出了基于一階馬爾可夫鏈的故障預測方法,利用上文所述的虛擬機當前狀態(tài)的判定方法判定虛擬機的當前狀態(tài),并通過虛擬機的歷史運行狀態(tài)來得出其馬爾可夫的預測方法。

      馬爾可夫鏈是由俄國數(shù)學家安德雷馬爾可夫提出,相關定義和性質(zhì)在文獻[13]中有詳細的介紹,本文中簡單地引入介紹在故障模型建立的過程中所用到的一些相關的定義和性質(zhì)。馬爾可夫鏈是一組具有馬爾可夫性質(zhì)的離散隨機變量的集合,具體而言,假設隨機過程{Xn,n∈T}的參數(shù)集T是離散的時間集合,其相應Xn的狀態(tài)空間是離散的狀態(tài)集I={i1,i2,…},如果對于任意的整數(shù)n∈T和任意的i1,i2,…,in+1∈I,條件概率滿足P{Xn+1=in+1|X0=i0,X1=i1,X2=i2,…,Xn=in}=P{Xn+1=in+1|Xn=in},則稱{Xn,n∈T}為馬爾可夫鏈[14]。通過上述馬爾科夫鏈的定義不難看出,馬爾可夫鏈具有無后效性,即系統(tǒng)下一次的狀態(tài)只與當前狀態(tài)有關。

      在一個完整的馬爾可夫鏈預測過程中,條件轉(zhuǎn)移概率是至關重要的,條件轉(zhuǎn)移概率:pij(n)=P{Xn+1=j|Xn=i},即馬爾可夫鏈Xn在時刻n的一步轉(zhuǎn)移概率,其中i,j為狀態(tài)集中的狀態(tài)。根據(jù)一步轉(zhuǎn)移概率可以得出系統(tǒng)狀態(tài)的一步轉(zhuǎn)移概率矩陣P。虛擬機歷史階段中每一次狀態(tài)與下一次狀態(tài)發(fā)生的種類轉(zhuǎn)移的次數(shù),即為狀態(tài)轉(zhuǎn)移矩陣K。公式如下:

      式中:kij的物理意義為上次系統(tǒng)的狀態(tài)是i而下一次系統(tǒng)的狀態(tài)是j的次數(shù);pij為條件概率,其物理意義為上一次發(fā)生的是狀態(tài)i的條件下,下一次發(fā)生的是狀態(tài)j的概率。根據(jù)條件概率的定義,得:

      根據(jù)概率的加法公式得到:

      綜合以上兩個公式并考慮kij的物理意義,則P{xs=因此有

      根據(jù)其物理意義統(tǒng)計虛擬機歷史數(shù)據(jù)狀態(tài)轉(zhuǎn)移次數(shù)即狀態(tài)轉(zhuǎn)移矩陣K,并計算一步轉(zhuǎn)移概率矩陣P,并將當前虛擬機的狀態(tài)作為初始概率向量。根據(jù)初始概率向量和轉(zhuǎn)移概率矩陣計算出下一時刻的故障概率,根據(jù)概率判斷是否發(fā)生故障?;谔摂M機歷史數(shù)據(jù)構(gòu)建的馬爾可夫鏈預測算法如算法2 所示。

      算法2:根據(jù)虛擬機歷史數(shù)據(jù)構(gòu)建一階馬爾可夫鏈預測算法

      輸入:虛擬機歷史狀態(tài)集transition

      輸出:預測狀態(tài)state

      2.5 虛擬機下一時刻的運行狀態(tài)預測

      根據(jù)第2.3 節(jié)中對虛擬機當前狀態(tài)判定的結(jié)果和第2.4 節(jié)中的一階馬爾可夫鏈預測方法,可以預測虛擬機下一時刻的運行狀態(tài)。

      具體過程為:根據(jù)第2.3 節(jié)中介紹的差異度計算方式求出當前虛擬機當前的運行狀態(tài),確定初始概率向量,并根據(jù)轉(zhuǎn)移概率矩陣和初始概率矩陣構(gòu)建虛擬機故障預測方法,預測下一時刻虛擬機故障;然后動態(tài)更新訓練數(shù)據(jù)。在動態(tài)更新訓練數(shù)據(jù)時,首先是利用測試集來驗證預測方法的準確性,將預測的結(jié)果保存下來,預測結(jié)束后將預測結(jié)果與真實結(jié)果進行對比,計算其預測準確率,然后將測試集當作訓練集,繼續(xù)訓練來修正預測誤差。具體算法如算法3 所示。

      算法3:預測虛擬機故障算法

      輸入:虛擬機運行測試數(shù)據(jù)集data

      輸出:下一時刻的虛擬機故障狀態(tài)fstate

      3 實驗及分析

      為了驗證所提方法的有效性,本文在實驗部分搭建了Hadoop 平臺,并對平臺中虛擬機運行的真實數(shù)據(jù)進行了采集。該平臺有1 個NameNode 節(jié)點、9 個DataNode節(jié)點,共10 個虛擬機節(jié)點,分別部署在3 臺不同的物理節(jié)點上,其中2 臺為工作站,另外1 臺為服務器。數(shù)據(jù)采集部分,利用dstat 監(jiān)測工具和筆者開發(fā)的監(jiān)控程序獲取各個虛擬機運行狀態(tài)相關的數(shù)據(jù)。NameNode 節(jié)點為Master 節(jié)點,DataNode 節(jié)點為Slave 節(jié)點。DataNode 節(jié)點負責獲取虛擬機的運行數(shù)據(jù),NameNode 節(jié)點負責處理各個虛擬機的運行數(shù)據(jù)并進行故障預測。物理節(jié)點的配置如表1所示。DELL Precesion(3630)是工作站,SR650 是服務器。本文搭建的Hadoop 平臺中每臺虛擬機的環(huán)境配置都是相同的,即全都采用CentOS 7.6 版本的操作系統(tǒng),3 個VCPU,3GB 運行內(nèi)存,30 GB 的磁盤大小,Name Node 節(jié)點的IP 地址為192.168.100.223,DataNode1~DataNode9 節(jié)點的IP 地址為192.168.100.171~192.168.100.179。

      表1 物理節(jié)點配置表

      NameNode 部署在服務器上,DataNode1~DataNode5部署在工作站A 上,DataNode6~DataNode9 部署在工作站B 上。將云平臺下的各個虛擬機設置在同一個網(wǎng)段中,使得其能夠相互通信和執(zhí)行分布式的工作。

      將采集到的原始屬性通過特征選擇,選擇出16 個和虛擬機故障預測具有密切相關的屬性特征,特征信息表如表2所示。

      表2 特征信息表

      表2是通過特征選擇方法選擇的16 個特征,其能夠很好地表現(xiàn)虛擬機的運行狀態(tài),且和故障預測有較強的相關性。故障預測效果的評估方法有很多種,比較常見的評估方法有準確率(Accuracy)、召回率、精確度(Precision)和F值(召回率與精確度的調(diào)和平均)等[15]。本文的實驗評價指標是以預測準確率和預測效率作為評價指標。其中預測準確率是正確預測到的虛擬機運行狀態(tài)的樣本數(shù)占總樣本數(shù)的比率,預測效率是預測出虛擬機狀態(tài)所花費的時間。

      實驗部分一共采集各虛擬機的運行數(shù)據(jù)540 936條,其中包括140 532 條故障數(shù)據(jù)。本文將前270 000 條數(shù)據(jù)作為訓練數(shù)據(jù),剩下的數(shù)據(jù)作為測試數(shù)據(jù)。訓練數(shù)據(jù)用以獲取正常數(shù)據(jù)原型集和故障數(shù)據(jù)原型集作為差異度計算依據(jù),以及構(gòu)建一階馬爾可夫鏈預測方法,并將訓練完成的方法保存在NameNode 節(jié)點上。

      3.1 實驗一

      在本次實驗中使用270 000 條訓練數(shù)據(jù),按照本文的方法和文獻[9]的方法分別進行了訓練,270 000 條數(shù)據(jù)中有故障數(shù)據(jù)68 522 條。然后將虛擬機所發(fā)送的25 000 條測試據(jù)作為測試集,分別輸入以上兩個預測方法中進行驗證。實驗過程中通過記錄各個方法的預測準確率和預測效率來進行實驗效果的對比。兩種方法的預測準確率和預測效率如圖2、圖3所示。

      圖2 故障預測準確率

      圖3 故障預測效率

      圖2和圖3中S1~S9表示虛擬機DataNode1~DataNode9。通過以上實驗的結(jié)果可知:本文方法在對各臺虛擬機進行故障預測時,預測準確率平均在85%,預測效率為0.19 s;而文獻[9]方法,預測準確率平均在76%,效率為7.50 s。對比實驗結(jié)果可以看出,本文方法在預測準確率和預測效率上均優(yōu)于文獻[9]方法。因為文獻[9]方法利用Adaboost 進行預測,而Adaboost 集成了很多的弱分類器,每次通過迭代來更新不同分類器的權(quán)值,相對比較耗時,且文獻[9]方法針對預測的觀測結(jié)果和虛擬機隱狀態(tài)之間尚存在不確定性,所以預測準確率欠佳。

      3.2 實驗二

      在本次實驗中,利用每臺虛擬機所發(fā)送的25 000 條數(shù)據(jù)作為測試數(shù)據(jù)來驗證預測方法,在NameNode 節(jié)點上將每個虛擬機的25 000 條數(shù)據(jù)分為5 個批次進行測試和訓練,每個批次為連續(xù)的5 000 條數(shù)據(jù)。首先用第1 批次的數(shù)據(jù)在本文的預測方法上進行驗證,得出其預測預測準確率和預測效率;然后將第1 批次的測試數(shù)據(jù)作為訓練數(shù)據(jù)在之前訓練好的方法的基礎之上繼續(xù)訓練,學習新運行數(shù)據(jù)的故障規(guī)律。在第1 批次數(shù)據(jù)訓練結(jié)束后,以第2 批次的數(shù)據(jù)繼續(xù)作為測試數(shù)據(jù)進行測試,得出其預測結(jié)果;接著將第2 批數(shù)據(jù)作為訓練數(shù)據(jù),在第1 批數(shù)據(jù)訓練完成的基礎上進行繼續(xù)訓練,繼續(xù)學習新的運行數(shù)據(jù)所包含的故障規(guī)律,依次進行迭代,直到將第5 批數(shù)迭代完成,最終得到通過迭代更新訓練數(shù)據(jù)集的故障預測方法對每臺虛擬機的預測效果。

      在訓練數(shù)據(jù)未更新之前,以及加入前一批次作為訓練數(shù)據(jù),相鄰的后一批次作為測試數(shù)據(jù),在本文故障預測方法上進行驗證的預測效果如圖4所示。

      圖4 訓練數(shù)據(jù)更新之后故障預測準確率

      由圖4實驗結(jié)果可以看出:在未對訓練數(shù)據(jù)集進行迭代更新之前,本文方法對各個虛擬機的預測準確率為85%左右;在每次進行訓練集迭代更新之后,對故障的預測準確率都有不同程度的提高,在測試集的5 批數(shù)據(jù)迭代更新完之后,該方法最終的預測準確率達到了90%左右。該實驗結(jié)果說明了通過對訓練集的迭代更新能夠提升對故障的預測準確率。

      在訓練數(shù)據(jù)未進行更新迭代時,本文預測方法的預測效率是0.2 s,隨著訓練樣本進行累計更新,預測效率是2.2 s,預測效率隨著樣本累計而有所降低,但仍高于文獻[9]的預測效率。

      從實驗結(jié)果可以看出,本文預測方法的初始預測準確率不高,數(shù)據(jù)更新迭代之后存在一定的收斂等,通過分析認為,本文方法對于突變情況下預測虛擬機狀態(tài)的效果有待提高。

      4 結(jié) 語

      針對云計算環(huán)境下虛擬機故障預測,本文提出了一種基于馬爾可夫鏈的故障預測算法。首先對虛擬機運行數(shù)據(jù)進行預處理;然后對運行數(shù)據(jù)進行特征選擇,選擇出和故障預測具有強相關性的最佳特征子集;接著利用特征差異來判斷虛擬機當前的故障狀態(tài);最后利用虛擬機的歷史運行數(shù)據(jù)建立馬爾可夫鏈故障預測方法,并持續(xù)地將虛擬機的運行數(shù)據(jù)加入到訓練集對訓練集進行持續(xù)更新。實驗結(jié)果表明,本文建立的故障預測方法對虛擬機故障的預測是有效的,且對訓練數(shù)據(jù)進行持續(xù)的更新能夠提高故障的預測準確率。但是本文中也存在對于突發(fā)性故障的預測性不是很好,下一步將針對虛擬機突發(fā)故障開展相關研究。

      猜你喜歡
      計算環(huán)境馬爾可夫準確率
      云計算環(huán)境下網(wǎng)絡安全等級保護的實現(xiàn)途徑
      乳腺超聲檢查診斷乳腺腫瘤的特異度及準確率分析
      不同序列磁共振成像診斷脊柱損傷的臨床準確率比較探討
      2015—2017 年寧夏各天氣預報參考產(chǎn)品質(zhì)量檢驗分析
      高速公路車牌識別標識站準確率驗證法
      大數(shù)據(jù)云計算環(huán)境下的數(shù)據(jù)安全
      保費隨機且?guī)в屑t利支付的復合馬爾可夫二項模型
      云計算環(huán)境中任務調(diào)度策略
      基于SOP的核電廠操縱員監(jiān)視過程馬爾可夫模型
      應用馬爾可夫鏈對品牌手機市場占有率進行預測
      舒城县| 章丘市| 潜江市| 南投市| 防城港市| 溧阳市| 峨眉山市| 监利县| 兴隆县| 大名县| 青岛市| 新民市| 芦山县| 井陉县| 北流市| 尉犁县| 正蓝旗| 苍山县| 思茅市| 成安县| 林周县| 图片| 顺义区| 怀宁县| 梅州市| 海晏县| 斗六市| 密云县| 启东市| 贺州市| 凯里市| 瓮安县| 成安县| 武邑县| 凤城市| 宁阳县| 昆山市| 得荣县| 永福县| 承德市| 志丹县|