• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于CCF-PLS的通訊系統(tǒng)異常根因分析

      2021-02-27 10:03:24熊智華
      關(guān)鍵詞:根因貢獻(xiàn)度通訊

      郁 楓,楊 帆,熊智華

      (清華大學(xué)自動(dòng)化系,北京信息科學(xué)與技術(shù)國(guó)家研究中心,北京100084)

      在通訊網(wǎng)絡(luò)的運(yùn)行維護(hù)過(guò)程中,技術(shù)人員通常需要監(jiān)控大量的系統(tǒng)性能數(shù)據(jù)。為了提高監(jiān)控效率,基于關(guān)鍵性能指標(biāo)(KPI)的監(jiān)控方法通過(guò)反映系統(tǒng)運(yùn)行的整體運(yùn)行情況來(lái)輔助運(yùn)行維護(hù)人員進(jìn)行合理判斷,以保證系統(tǒng)的可靠運(yùn)行。由于KPI 指標(biāo)的異常通常反映相關(guān)服務(wù)的異常(如服務(wù)器宕機(jī)、網(wǎng)絡(luò)負(fù)載過(guò)大等)[1],因此對(duì)于KPI變量的監(jiān)控顯得尤為重要。同時(shí),隨著技術(shù)的不斷發(fā)展,通訊網(wǎng)絡(luò)將不可避免地進(jìn)行升級(jí)。面對(duì)升級(jí)后可能出現(xiàn)的關(guān)鍵性能指標(biāo)性能下降的異常問(wèn)題,技術(shù)人員需要及時(shí)找到導(dǎo)致問(wèn)題出現(xiàn)的根本原因。由于存在著大量的監(jiān)測(cè)變量,要實(shí)現(xiàn)對(duì)所有變量的逐個(gè)排查是不現(xiàn)實(shí)的,因此,在對(duì)關(guān)鍵性能指標(biāo)進(jìn)行監(jiān)控的同時(shí),仍然需要實(shí)現(xiàn)對(duì)根本原因變量的自動(dòng)檢測(cè),使得技術(shù)人員能夠根據(jù)系統(tǒng)自動(dòng)檢測(cè)的結(jié)果進(jìn)行進(jìn)一步分析,從而得到真正的原因變量,保證通訊網(wǎng)絡(luò)的平穩(wěn)運(yùn)行。

      偏最小二乘(PLS)的思想是建立從自變量到因變量的回歸方程[2],當(dāng)研究需要關(guān)注于過(guò)程變量和質(zhì)量變量之間的關(guān)系時(shí),則應(yīng)該建立質(zhì)量變量與過(guò)程變量之間的PLS模型[3]。這與通訊網(wǎng)絡(luò)的關(guān)注重點(diǎn)即KPI與其他變量之間的關(guān)系是類似的,因而對(duì)于此類通訊網(wǎng)絡(luò)問(wèn)題可以考慮使用PLS建模,得到KPI 的監(jiān)測(cè)模型。

      基于PLS模型的根因檢測(cè)方法主要基于貢獻(xiàn)圖[4],貢獻(xiàn)較大的變量可能是導(dǎo)致故障的根本原因。文獻(xiàn)[5]給出了貢獻(xiàn)度的不同定義,并將基于貢獻(xiàn)圖的方法大體上分為3 類:廣義貢獻(xiàn)分解[5](GDC)、重構(gòu)貢獻(xiàn)分解[6](RBC)、對(duì)角貢獻(xiàn)分解[7-8](DC)。通過(guò)計(jì)算各個(gè)變量的貢獻(xiàn)度,能夠檢測(cè)出導(dǎo)致異常情況的主要變量。

      然而,PLS模型沒(méi)有解決過(guò)程變量中含有與質(zhì)量變量變化不相關(guān)成分的問(wèn)題[9],顯然與質(zhì)量無(wú)關(guān)的過(guò)程變量會(huì)導(dǎo)致模型分析結(jié)果不準(zhǔn)確[10]。由于通訊網(wǎng)絡(luò)監(jiān)控了大量的性能數(shù)據(jù),與KPI變量無(wú)關(guān)特別是無(wú)因果關(guān)系的變量將會(huì)嚴(yán)重影響數(shù)學(xué)模型的可解釋性,從而降低分析結(jié)果的準(zhǔn)確性。一方面,以交叉驗(yàn)證準(zhǔn)則為代表的PLS參數(shù)選擇方法更注重?cái)M合結(jié)果的精確度而忽略了變量間關(guān)系對(duì)數(shù)學(xué)模型合理性的探討,有利于擬合的無(wú)關(guān)變量也可能在數(shù)學(xué)模型建立過(guò)程中有較大的作用;另一方面,發(fā)生在無(wú)關(guān)變量上且幅值較大的故障將會(huì)在貢獻(xiàn)度分析過(guò)程帶來(lái)較高的占比,從而導(dǎo)致根因變量的誤判。

      面對(duì)無(wú)關(guān)變量對(duì)分析結(jié)果帶來(lái)的影響,在評(píng)估通訊網(wǎng)絡(luò)的性能時(shí),常常首先確立代表KPI 原因的變量集[11]?;ハ嚓P(guān)函數(shù)(CCF)[12]通過(guò)計(jì)算不同延時(shí)下的互相關(guān)系數(shù),得到與質(zhì)量變量相關(guān)性較強(qiáng)的過(guò)程變量,可以被認(rèn)為是因果分析的一種近似,因而可以用來(lái)篩選變量。文獻(xiàn)[13]利用互相關(guān)函數(shù)給出了性能數(shù)據(jù)與事件數(shù)據(jù)的相關(guān)系數(shù)以及相應(yīng)時(shí)延,得出了事件與變量之間的相互影響關(guān)系。類似的,文獻(xiàn)[14]給出了性能數(shù)據(jù)波動(dòng)序列的相關(guān)系數(shù)及相應(yīng)時(shí)延,得到了變量間相互的影響關(guān)系。然而,上述文獻(xiàn)僅能給出關(guān)系模型,雖然可以依據(jù)關(guān)系模型進(jìn)行故障原因推斷,但并沒(méi)有對(duì)KPI的數(shù)學(xué)模型進(jìn)行有效分析,無(wú)法從預(yù)測(cè)性能的角度對(duì)KPI變量進(jìn)行實(shí)時(shí)監(jiān)控。

      本文從通訊網(wǎng)絡(luò)的實(shí)際需求出發(fā),將PLS引入KPI變量的監(jiān)控過(guò)程,針對(duì)通訊網(wǎng)絡(luò)性能數(shù)據(jù)體量大的特點(diǎn),改進(jìn)傳統(tǒng)的PLS,利用互相關(guān)函數(shù)作為前端處理部分,在PLS的基礎(chǔ)上,結(jié)合貢獻(xiàn)圖方法,得到異常情況的根因變量。

      1 基于PLS的根因分析方法

      1.1 PLS模型

      PLS模型應(yīng)用于過(guò)程監(jiān)控時(shí)通常是以T2統(tǒng)計(jì)量和Q統(tǒng)計(jì)量作為監(jiān)測(cè)指標(biāo)。假設(shè)觀測(cè)到一個(gè)新的觀測(cè)向量x,則新樣本的得分向量和殘差向量如式(2)所示:

      可以認(rèn)為,如果T2統(tǒng)計(jì)量超過(guò)了控制限,則發(fā)生了與質(zhì)量相關(guān)的故障,如果Q統(tǒng)計(jì)量超過(guò)了控制限,則發(fā)生了與質(zhì)量變量無(wú)關(guān)的故障[18]。

      1.2 貢獻(xiàn)圖分析方法

      對(duì)T2統(tǒng)計(jì)量和Q統(tǒng)計(jì)量的監(jiān)控雖然可以判別是否發(fā)生異常,但無(wú)法給出故障發(fā)生的根源。貢獻(xiàn)圖方法通過(guò)計(jì)算各變量的貢獻(xiàn)率來(lái)找出引起異常的根源,在根因識(shí)別領(lǐng)域得到了廣泛的應(yīng)用。

      對(duì)于具有二次型I ndex(x)=xTMx的監(jiān)控統(tǒng)計(jì)量,文獻(xiàn)[5]給出3種貢獻(xiàn)度定義,如式(5)所示:

      在以上3 類貢獻(xiàn)圖中,DC并沒(méi)有考慮變量間的相關(guān)性,完全等價(jià)于單變量貢獻(xiàn)圖。GDC方法不能很好地解決故障在回路間傳播的問(wèn)題,這會(huì)導(dǎo)致大量變量都具有較高的貢獻(xiàn)度,而RBC方法能很好地減輕這種現(xiàn)象,因此本文采用RBC方法。

      在進(jìn)行根因分析的過(guò)程中,可以給出一段時(shí)間內(nèi)各變量的單獨(dú)告警序列以及總貢獻(xiàn)度百分比,這樣可以根據(jù)對(duì)象特點(diǎn),從總體貢獻(xiàn)程度和超出控制限的先后順序兩個(gè)角度來(lái)輔助技術(shù)人員進(jìn)行根因分析。

      2 CCF-PLS根因分析

      2.1 CCF分析方法

      為盡可能地滿足PLS模型的輸入變量與輸出變量相關(guān)的要求,可以通過(guò)互相關(guān)分析方法給出所有觀測(cè)變量中相關(guān)性較強(qiáng)的變量作為PLS 模型的輸入變量。

      2.2 CCF-PLS根因分析

      CCF很好地滿足了PLS 模型的輸入變量與輸出變量相關(guān)性問(wèn)題,因而可以作為PLS模型的前端處理過(guò)程。本文提出的CCF-PLS方法原理如圖1所示。

      在離線階段,通過(guò)CCF方法篩選出與KPI 變量存在相關(guān)關(guān)系的變量以建立更加精確的PLS模型。需要注意的是,系統(tǒng)內(nèi)可能存在多個(gè)超過(guò)相關(guān)性閾值的變量,此時(shí)可以選取前E%(E為根據(jù)經(jīng)驗(yàn)選取的最大相關(guān)變量百分比)的監(jiān)測(cè)變量以減少系統(tǒng)的存儲(chǔ)量,一般可以取60%~80%。在線監(jiān)控時(shí),利用學(xué)習(xí)到的PLS模型對(duì)系統(tǒng)進(jìn)行性能監(jiān)控,繪制預(yù)測(cè)值曲線與實(shí)際值曲線,并且實(shí)時(shí)監(jiān)控相應(yīng)的性能指標(biāo)。當(dāng)性能下降時(shí),采用貢獻(xiàn)圖分析,繪制一定時(shí)間內(nèi)的告警序列,計(jì)算貢獻(xiàn)度百分比。根據(jù)貢獻(xiàn)度的大小以及報(bào)警時(shí)間的先后綜合判斷根因變量。

      2.3 CCF-PLS與PLS的聯(lián)系

      需要注意的是,CCF-PLS方法僅僅是在PLS方法的基礎(chǔ)上采用CCF作為篩選變量的前端處理部分,而這樣的處理在通訊網(wǎng)絡(luò)的分析中是必須的。一方面,通訊系統(tǒng)中性能數(shù)據(jù)體量大,篩選后的變量能有效降低性能監(jiān)控時(shí)的數(shù)據(jù)存儲(chǔ)量;另一方面,由于CCF引入的時(shí)延特性可以被認(rèn)為是因果分析的一種近似處理。將CCF應(yīng)用于變量篩選過(guò)程,提高了建立PLS數(shù)學(xué)模型時(shí)的可解釋性,同時(shí),也減輕了無(wú)關(guān)變量對(duì)根因分析造成的不利影響。

      3 實(shí)驗(yàn)仿真與分析

      3.1 數(shù)據(jù)預(yù)處理

      圖1 CCF-PLS原理圖Fig.1 Schematic diagram of CCF-PLS

      實(shí)驗(yàn)數(shù)據(jù)采用某通訊公司基站采集的真實(shí)數(shù)據(jù),共有1個(gè)KPI變量、201個(gè)待觀測(cè)變量,觀測(cè)數(shù)據(jù)采樣間隔為15 min,較大的采樣間隔滿足了PLS模型靜態(tài)特性的要求。正常運(yùn)行狀態(tài)下共采集10 d 的數(shù)據(jù),升級(jí)后共采集6 d 數(shù)據(jù),數(shù)據(jù)長(zhǎng)度為1 536。

      實(shí)際采集中,某些觀測(cè)數(shù)據(jù)存在大量缺失的情況,仿真中去除這些觀測(cè)變量,共得到92個(gè)觀測(cè)變量序列和1個(gè)KPI 序列。

      由專家經(jīng)驗(yàn)可知,系統(tǒng)存在兩種模式:6:45之前為“閑時(shí)”,6:45之后為“忙時(shí)”,考慮到“閑時(shí)”系統(tǒng)可能未充分運(yùn)行,并不能用PLS模型表示,故本文僅采用“忙時(shí)”數(shù)據(jù)。

      實(shí)際仿真數(shù)據(jù)為92 個(gè)輸入變量,1 個(gè)輸出變量;升級(jí)前共680 個(gè)數(shù)據(jù),升級(jí)后共408 個(gè)數(shù)據(jù)。

      3.2 CCF分析

      采用CCF對(duì)實(shí)驗(yàn)數(shù)據(jù)進(jìn)行分析,得到各變量之間的互相關(guān)系數(shù),相關(guān)系數(shù)熱圖如圖2所示,其中時(shí)延為10個(gè)采樣時(shí)刻。本文僅關(guān)注KPI和其他變量的相關(guān)關(guān)系,因此熱圖種的第1行或第1列是用戶真正關(guān)心的。計(jì)算得出,89/92的變量超過(guò)了相關(guān)性閾值,由此也可以看出,系統(tǒng)具有較強(qiáng)的線性特性。本文選取相關(guān)系數(shù)前65%的變量作為PLS模型的輸入,得到60個(gè)輸入變量。為方便進(jìn)行后續(xù)比較,60個(gè)輸入變量的序號(hào)仍采用原92個(gè)變量中的索引號(hào)。

      圖2 相關(guān)系數(shù)熱圖Fig.2 Cross-correlation heat map

      3.3 PLS根因分析

      PLS建模最重要的是選取主元個(gè)數(shù)A,本文采取交叉驗(yàn)證的方式選取主元個(gè)數(shù),如圖3所示。選取均方誤差(MSE)下降趨緩時(shí)刻的主元個(gè)數(shù)作為實(shí)際建模的主元個(gè)數(shù),本文選取為14。

      建模時(shí)采用升級(jí)前70%數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),對(duì)升級(jí)前后所有數(shù)據(jù)進(jìn)行預(yù)測(cè),結(jié)果如圖4所示??梢钥闯觯琍LS模型對(duì)升級(jí)前數(shù)據(jù)有很好的擬合效果,用作預(yù)測(cè)的剩余30%升級(jí)前數(shù)據(jù)也能和實(shí)際曲線較好地?cái)M合,而升級(jí)后預(yù)測(cè)數(shù)據(jù)則與實(shí)際數(shù)據(jù)存在明顯偏差,說(shuō)明系統(tǒng)升級(jí)伴隨了性能的下降。

      圖3 MSE-A 交叉驗(yàn)證曲線Fig.3 MSE-A plot using crossvalidation

      圖4 訓(xùn)練數(shù)據(jù)和預(yù)測(cè)數(shù)據(jù)曲線Fig.4 Training data and predicting data plots

      本文考慮與KPI 相關(guān)的異常情況,所以只給出了T2統(tǒng)計(jì)量的檢測(cè)曲線,如圖5所示。從圖5可以看出,升級(jí)后T2統(tǒng)計(jì)量明顯超過(guò)控制限,這也提示著系統(tǒng)出現(xiàn)了異常情況。

      性能下降后1 d 內(nèi)各變量累加貢獻(xiàn)度所占百分比見(jiàn)圖6??梢钥闯?,18號(hào)變量占據(jù)了最大部分,為8.45%,排名前3的變量分別為18、44、47號(hào)變量。

      圖5 T2 統(tǒng)計(jì)量監(jiān)測(cè)曲線Fig.5 T2 statistic plot

      圖6 T2貢獻(xiàn)度百分比Fig.6 Contribution percentage using the T2 statistic

      考慮到系統(tǒng)最先發(fā)出告警的變量也很有可能是根本原因變量,故應(yīng)該綜合考慮貢獻(xiàn)度告警序列,如圖7所示。從圖7可以看出,最先發(fā)出告警的變量序號(hào)分別為6、18、29、39、44、47號(hào)變量,綜合考慮累計(jì)貢獻(xiàn)率和貢獻(xiàn)度報(bào)警序列,CCF-PLS系統(tǒng)將給出的根本原因?yàn)?8、44、47號(hào)變量。

      由專家經(jīng)驗(yàn)判斷可知,實(shí)際的根本原因?yàn)?8號(hào)變量,CCF-PLS方法很好地找到了系統(tǒng)性能下降的根本原因。需要注意的是,其他變量所占貢獻(xiàn)比較高的原因可能是18號(hào)變量發(fā)生故障后導(dǎo)致了故障的傳播,而采樣時(shí)間為15 min 的情況下,某些變量已經(jīng)在一個(gè)采樣間隔內(nèi)受到了影響,故也較早地發(fā)出了告警。

      圖7 T2貢獻(xiàn)度告警序列Fig.7 Alarm sequencesusing the T2 contribution plot

      3.4 對(duì)比分析

      將CCF-PLS方法與傳統(tǒng)PLS方法進(jìn)行對(duì)比。傳統(tǒng)PLS方法采用了文獻(xiàn)[16]提供的PLS代碼,根因分析時(shí)采用了文獻(xiàn)[6]所述的RBC方法。為便于比較,傳統(tǒng)PLS的主元個(gè)數(shù)選擇與CCF-PLS方法一致。

      圖8示出了不采用CCF時(shí)各變量累計(jì)貢獻(xiàn)度百分比,可以看出,累計(jì)貢獻(xiàn)度最大的為23號(hào)變量,占3.56%,前3名分別為23、17、55號(hào)變量,并沒(méi)有顯示到根因變量18號(hào)變量。圖9示出了不采用CCF時(shí)各變量貢獻(xiàn)度的告警序列,可以看出最先報(bào)警的為28號(hào)告警序列,也沒(méi)有顯示根因變量18號(hào)變量,且累計(jì)貢獻(xiàn)度最大的變量和最先告警的變量并未存在交集,這樣的不一致將會(huì)導(dǎo)致技術(shù)人員的困惑。

      表1給出了采用CCF前后PLS根因結(jié)果的對(duì)比情況,可以看出,采用CCF后PLS根因分析方法能夠得到正確的根因變量,而傳統(tǒng)的PLS方法得到的根因變量經(jīng)專家經(jīng)驗(yàn)證實(shí)完全與KPI變量無(wú)關(guān),這驗(yàn)證了CCF-PLS方法的合理性。

      表2給出CCF-PLS和PLS方法在正常數(shù)據(jù)集上進(jìn)行測(cè)試的預(yù)測(cè)結(jié)果對(duì)比,評(píng)價(jià)指標(biāo)為均方誤差(RMSE)和相關(guān)系數(shù)(r),可以看出,CCF-PLS方法由于進(jìn)行過(guò)變量篩選而在擬合精度上稍劣于PLS方法,但是預(yù)測(cè)性能降低情況并不明顯。結(jié)合表1情況可知,CCF-PLS方法在保持一定擬合精度的情況下提高了數(shù)學(xué)模型的可解釋性,使得根因分析的方法更具備可靠性,因而更適合于通訊網(wǎng)絡(luò)的KPI數(shù)據(jù)監(jiān)控以及異常根因分析。

      圖8 不采用CCF時(shí)T2 貢獻(xiàn)度百分比Fig.8 Contribution percentageusing the T2 statistic without CCF

      圖9 不采用CCF時(shí)T2 貢獻(xiàn)度告警序列Fig.9 Alarm sequences using the T2 contribution plot without CCF

      表1 采用CCF前后根因分析結(jié)果對(duì)比Table 1 Comparison between root cause analysis of CCF-PLS and PLS

      表2 采用CCF前后KPI 正常數(shù)據(jù)預(yù)測(cè)結(jié)果對(duì)比Table 2 Comparison between KPI prediction results using normal data of CCF-PLSand PLS

      4 結(jié) 論

      本文改進(jìn)了傳統(tǒng)的PLS根因分析方法,將CCF作為PLS分析的前端處理步驟,通過(guò)仿真分析,驗(yàn)證了其在通訊網(wǎng)絡(luò)應(yīng)用的合理性。本文仿真對(duì)象具有較強(qiáng)的線性特性和靜態(tài)特性,對(duì)非線性以及動(dòng)態(tài)特性明顯的通訊系統(tǒng)的根因分析將是下一步重點(diǎn)研究的內(nèi)容。

      猜你喜歡
      根因貢獻(xiàn)度通訊
      《茶葉通訊》簡(jiǎn)介
      茶葉通訊(2022年2期)2022-11-15 08:53:56
      《茶葉通訊》簡(jiǎn)介
      茶葉通訊(2022年3期)2022-11-11 08:43:50
      通訊報(bào)道
      根因分析法提高藥品不良反應(yīng)報(bào)告合格率
      充分把握教育對(duì)經(jīng)濟(jì)社會(huì)發(fā)展的貢獻(xiàn)度
      基于貢獻(xiàn)度排序的腎透明細(xì)胞癌串?dāng)_通路分析
      基于矩陣編碼的自動(dòng)路測(cè)根因定位方法
      根因分析法在提高科室備用藥品質(zhì)量管理中的應(yīng)用
      通訊簡(jiǎn)史
      高齡PICC導(dǎo)管堵塞的根因分析及護(hù)理對(duì)策
      合江县| 额敏县| 襄城县| 正镶白旗| 上思县| 如皋市| 张家界市| 巴中市| 芷江| 阳山县| 青田县| 东城区| 荔波县| 运城市| 平遥县| 多伦县| 凤阳县| 辽源市| 子长县| 淮滨县| 家居| 陵水| 平顺县| 罗城| 苏尼特左旗| 金昌市| 汕头市| 乌拉特后旗| 丹巴县| 科技| 基隆市| 交城县| 金沙县| 尖扎县| 永登县| 东阿县| 泰顺县| 永新县| 时尚| 安陆市| 阿鲁科尔沁旗|