吳英友,胡剛義,唐靜,嚴(yán)謹(jǐn),許騰騰
(1.廣東海洋大學(xué),廣東 湛江 524005;2.中國(guó)艦船研究設(shè)計(jì)中心,湖北 武漢 430064;3.北京石油化工學(xué)院,北京 102617;4.遠(yuǎn)光軟件股份有限公司,廣東 珠海 519085)
為保障運(yùn)行及作業(yè),大型船舶與海洋工程平臺(tái)的機(jī)艙裝備了由數(shù)以百計(jì)的機(jī)電設(shè)備構(gòu)成的大型裝備系統(tǒng)。由于海上運(yùn)行環(huán)境惡劣,高溫、高濕、高鹽,因此船舶與海洋工程平臺(tái)機(jī)艙的設(shè)備、系統(tǒng)的故障率遠(yuǎn)遠(yuǎn)高于陸上。如果無法及時(shí)檢測(cè)并診斷設(shè)備異常,將造成系統(tǒng)無法正常運(yùn)行,可靠性降低,嚴(yán)重時(shí)整船停止運(yùn)行或出現(xiàn)嚴(yán)重的生產(chǎn)安全事故,帶來巨大經(jīng)濟(jì)損失。因此,設(shè)備異常檢測(cè)方法的研究對(duì)于及時(shí)發(fā)現(xiàn)異常、降低設(shè)備故障損失具有積極的實(shí)際意義。
異常檢測(cè)是指檢測(cè)給定數(shù)據(jù)集中不符合已建立的健康狀態(tài)模式的過程[1]。異常檢測(cè)技術(shù)已經(jīng)成為數(shù)據(jù)挖掘領(lǐng)域中的研究熱點(diǎn)。一般異常檢測(cè)方法包括基于統(tǒng)計(jì)學(xué)方法[2]、基于分類方法(如支持向量機(jī)、神經(jīng)網(wǎng)絡(luò))[3–4]、基于距離的方法[5]、基于密度的方法[6]、基于聚類分析的方法[7]等。
目前國(guó)內(nèi)對(duì)于機(jī)械系統(tǒng)的異常檢測(cè)主要從以下2 個(gè)方面進(jìn)行:1)針對(duì)局部設(shè)備進(jìn)行異常檢測(cè)和故障診斷;2)通過整理大量的設(shè)備故障經(jīng)驗(yàn)數(shù)據(jù)建立知識(shí)庫,開展基于機(jī)器學(xué)習(xí)等方法的異常檢測(cè)。該方法對(duì)于實(shí)際應(yīng)用場(chǎng)景下的設(shè)備異常檢測(cè),存在一定的局限性。首先,該方法針對(duì)局部設(shè)備的異常,對(duì)系統(tǒng)的運(yùn)行缺乏整體性把握,且不易擴(kuò)展應(yīng)用;機(jī)械系統(tǒng)的故障類型眾多且故障重復(fù)頻率低,較難構(gòu)建完備的故障數(shù)據(jù)知識(shí)庫。
針對(duì)以上問題,本文提出基于兩階段聚類的設(shè)備異常檢測(cè)的方法。該方法對(duì)獲取的時(shí)間序列數(shù)據(jù)進(jìn)行預(yù)處理后,通過第一階段聚類獲取特征數(shù)據(jù)的離群時(shí)間信息,采取第二階段聚類算法評(píng)估系統(tǒng)異常情況。本文所提出的基于兩階段聚類評(píng)估系統(tǒng)異常的方法,從無監(jiān)督學(xué)習(xí)的角度出發(fā),不需要大量的專業(yè)知識(shí)經(jīng)驗(yàn),僅從最近的歷史數(shù)據(jù)學(xué)習(xí),配合少量的業(yè)務(wù)經(jīng)驗(yàn),即可快速的確定故障位置和對(duì)應(yīng)時(shí)間。該方法采用兩階段聚類思想減少了一次聚類的不確定性,可有效提高異常檢測(cè)的準(zhǔn)確性。
一般的異常檢測(cè)方法包括:基于距離的異常檢測(cè)、基于密度的異常檢測(cè),以及在此基礎(chǔ)上發(fā)展的基于聚類的異常檢測(cè)[8]:
1)基于距離的異常檢測(cè)
基于距離的異常值檢測(cè)方法計(jì)算某個(gè)數(shù)據(jù)點(diǎn)與周圍其他數(shù)據(jù)之間的距離,結(jié)合設(shè)置的距離閾值判斷異常。對(duì)于異常數(shù)據(jù)距離的度量方法可以根據(jù)數(shù)據(jù)集的分布情況進(jìn)行選取,一般有歐式距離、曼哈頓距離等。
2)基于密度的異常檢測(cè)方法
該方法建立在基于距離的檢測(cè)方法基礎(chǔ)上,主要思想是結(jié)合數(shù)據(jù)點(diǎn)之間的距離和設(shè)定范圍內(nèi)的數(shù)據(jù)點(diǎn)數(shù)目2 個(gè)參數(shù),進(jìn)而獲得“密度”概念,通過密度的計(jì)算判斷異常[9]。
3)基于聚類的異常檢測(cè)方法
基于聚類的異常檢測(cè)方法是通過聚類分析將數(shù)據(jù)歸為不同的簇中,異常數(shù)據(jù)則是不屬于任何簇或者遠(yuǎn)離簇心的數(shù)據(jù)點(diǎn)[10–12]。包括基于距離聚類、基于密度聚類和基于層次聚類等[13]。
該方法作為一種無監(jiān)督學(xué)習(xí)方法,在不需要大量標(biāo)簽數(shù)據(jù)的條件下就可以實(shí)現(xiàn)異常檢測(cè),適用于多種數(shù)據(jù)類型且具有較廣闊的應(yīng)用范圍。但僅僅使用一次聚類方法進(jìn)行異常檢測(cè)具備一定的局限性,異常檢測(cè)結(jié)果受聚類簇結(jié)果的影響,如果聚類簇的效果不夠理想,異常檢測(cè)結(jié)果也相對(duì)較差。
本文提出的基于兩階段的聚類異常檢測(cè)方法,采用兩次聚類分析檢測(cè)系統(tǒng)異常,通過一次聚類構(gòu)建離群時(shí)間段矩陣,再通過層次聚類分析對(duì)離群時(shí)間段矩陣進(jìn)行異常檢測(cè)和定位。該方法有效緩解基于一次聚類進(jìn)行異常檢測(cè)的局限性,進(jìn)一步降低異常檢測(cè)的誤報(bào)率。
基于兩階段聚類的異常檢測(cè)方法通過系統(tǒng)測(cè)點(diǎn)數(shù)據(jù)預(yù)處理進(jìn)行特征計(jì)算,利用特征聚類算法構(gòu)建系統(tǒng)多測(cè)點(diǎn)離群時(shí)間矩陣,采取層次聚類算法并結(jié)合專家經(jīng)驗(yàn)實(shí)現(xiàn)系統(tǒng)異常信息檢測(cè)。本文提出的異常檢測(cè)方法框架如圖1 所示。
圖1 異常檢測(cè)方法框架圖Fig.1 Frame diagram of anomal detection method
一般而言,獲取的測(cè)點(diǎn)數(shù)據(jù)為時(shí)間數(shù)據(jù)序列,具備高維度、高特征相關(guān)及有序等特點(diǎn),因此為降低數(shù)據(jù)挖掘所造成的計(jì)算成本同時(shí)提高數(shù)據(jù)挖掘的準(zhǔn)確性,本文采用靜態(tài)數(shù)據(jù)分割方法對(duì)測(cè)點(diǎn)數(shù)據(jù)進(jìn)行分段信息提取。
為了在數(shù)據(jù)維度簡(jiǎn)約的基礎(chǔ)上最大化保留數(shù)據(jù)特征,選取三角極值點(diǎn)線性分段方法[14]對(duì)測(cè)點(diǎn)時(shí)間數(shù)據(jù)序列進(jìn)行分段操作。該方法通過評(píng)估相鄰極值點(diǎn)之間的變化幅度進(jìn)而獲取關(guān)鍵點(diǎn)序列。
首先,通過遍歷時(shí)間數(shù)據(jù)序列,按照順序?qū)ふ覙O值點(diǎn)。假設(shè)oi(i=2,3,4,···) 作為時(shí)間序列O的某個(gè)數(shù)據(jù)點(diǎn),如果存在oi>oi+1,oi>oi?1(或者oi 其中,h表示點(diǎn)oi到線段|oi?1oi+1|的距離,即△oi?1oioi+1的高。 由此可得,在確定極值點(diǎn)oi?1和oi+1情況下,取決于極值點(diǎn)oi,越大,oi成為關(guān)鍵點(diǎn)的可能性越大。該問題可以轉(zhuǎn)換為oi到線段|oi?1oi+1|的距離h和的關(guān)系,則h越大,oi成 為關(guān)鍵點(diǎn)的可能性越大,相反地,h越小,oi成為關(guān)鍵點(diǎn)的可能性越小。因此,可利用h表示極值點(diǎn)oi的線性偏離度,h越大,偏離程度越大,oi作為分段點(diǎn)的重要性越高。依次對(duì)三個(gè)連續(xù)的極值點(diǎn)計(jì)算線性偏離度,進(jìn)而得到線性偏離度序列hi(i=1,2,···,n;n=length(O′)?2)。通過設(shè)置線性偏離度閾值進(jìn)行判斷,當(dāng)hi大于該閾值時(shí),將其作為分段點(diǎn)進(jìn)行時(shí)間數(shù)據(jù)序列的分段操作;當(dāng)hi小于該閾值時(shí),表明該極值點(diǎn)不可作為分段點(diǎn),則剪掉該極值點(diǎn),保存數(shù)據(jù)趨勢(shì)特征,降低噪聲的干擾。 完成時(shí)間序列數(shù)據(jù)的分段處理后,對(duì)分段的數(shù)據(jù)進(jìn)行特征提取和特征降維操作。為反映數(shù)據(jù)異常變化,提取測(cè)點(diǎn)數(shù)據(jù)相關(guān)特征信息,主要包括反映數(shù)據(jù)趨勢(shì)的指標(biāo)、反映波動(dòng)的指標(biāo)、反映分布特征的指標(biāo)和反映變異的指標(biāo)。 由于各指標(biāo)之間存在一定的信息重疊,為了避免后續(xù)聚類的效果受數(shù)據(jù)量和簇的個(gè)數(shù)的影響,需進(jìn)行降維處理,減少信息冗余,采用機(jī)器學(xué)習(xí)中常用的主成分分析法進(jìn)行數(shù)據(jù)特征的降維處理。 本文采用EM 算法[15]對(duì)降維處理的特征數(shù)據(jù)進(jìn)行第一階段聚類構(gòu)建離群時(shí)間段矩陣。EM 算法是一種通過模型進(jìn)行聚類的方法,主要用于包含隱變量的概率模型參數(shù)的極大似然估計(jì)或極大似然概率估計(jì)。采用混合高斯模型[16]通過EM 算法進(jìn)行測(cè)點(diǎn)多個(gè)分段數(shù)據(jù)的聚類。假設(shè)某個(gè)測(cè)點(diǎn)的分段數(shù)據(jù)符合高斯分布,該算法利用計(jì)算確定的每個(gè)高斯部件的參數(shù)擬合給定的分段數(shù)據(jù),獲得模糊聚類結(jié)果。即由確定的參數(shù)決定每個(gè)數(shù)據(jù)實(shí)例屬于各高斯分布的概率。 對(duì)于一個(gè)完整數(shù)據(jù)集 (x1,x2,···,xn),其中xi的每一列表示每個(gè)時(shí)段數(shù)據(jù)的特征向量,將引入的隱含變量用zi表示。 假設(shè)zi獨(dú) 立同分布M 類,那么其對(duì)應(yīng)的概率分別為π1,π2,···,πM,通過xi確定zi的密度函數(shù)為因此數(shù)據(jù)所對(duì)應(yīng)的似然函數(shù)為: EM 算法迭代過程分兩步進(jìn)行:1)E-step,通過觀測(cè)向量xi和當(dāng)前的參數(shù)估計(jì),計(jì)算獲得似然函數(shù)L(θk,πk,zik|x)的條件期望值z(mì)ik;2)根據(jù)E-step的計(jì)算結(jié)果,獲得最大化似然函數(shù)值的參數(shù)估計(jì),包括均值、所占權(quán)重和協(xié)方差矩陣。 基于聚類分析結(jié)果,將每個(gè)測(cè)點(diǎn)可能出現(xiàn)異常的時(shí)間段構(gòu)建為測(cè)點(diǎn)的離群時(shí)間段矩陣,然后通過第二階段聚類分析檢測(cè)系統(tǒng)具體的異常情況。 通過一階段聚類篩選初始各測(cè)點(diǎn)異常信息,由于該過程未考慮多測(cè)點(diǎn)之間的聯(lián)動(dòng)性,無法準(zhǔn)確定位異常情況,因此應(yīng)在多個(gè)測(cè)點(diǎn)的離群時(shí)間段上采用層次聚類方法進(jìn)行二次聚類評(píng)估,尋找聚類的核心簇點(diǎn),進(jìn)而確定系統(tǒng)具體的異常情況。 基于層次聚類的異常檢測(cè)方法通過對(duì)第一階段聚類結(jié)果進(jìn)行相似度計(jì)算,采用自底向上或者自頂向下的方法對(duì)離群時(shí)間段數(shù)據(jù)進(jìn)行層次劃分,進(jìn)而形成樹形結(jié)構(gòu)圖。本文采用凝聚算法即自底向上的聚合方法進(jìn)行聚類操作,首先將每個(gè)離群時(shí)間段數(shù)據(jù)作為初始的聚類簇,其次聚合相似度最高的兩個(gè)類別,接著不斷迭代聚合過程直至分類完成。具體過程為: 1)將離群時(shí)間段數(shù)據(jù)矩陣SA=(X1,X2,···,Xn)中的每個(gè)實(shí)例Xi表示為一個(gè)類別,即只具有單成員的類ci=Xi(i=1,2,···,n) 構(gòu)建為樣本集SA的初始聚類,表示為: 綜上所述,隨著時(shí)代的發(fā)展,很多新的理論與技術(shù)都應(yīng)用于現(xiàn)如今的電力系統(tǒng)繼電保護(hù)當(dāng)中,和以前相比,相關(guān)工作人員應(yīng)該具備更多的業(yè)務(wù)知識(shí)來滿足時(shí)代發(fā)展的需求,由此可見,相關(guān)工作人員在實(shí)際工作過程中,只有通過不斷加強(qiáng)實(shí)踐操作,對(duì)電力系統(tǒng)相關(guān)知識(shí)領(lǐng)域進(jìn)行不斷探索與研究,才能為我國(guó)電力事業(yè)做出貢獻(xiàn)。 2)利用全連接算法度量各實(shí)例類別之間的相似性,如下式: 其中:c1,c2表示簇;Xi,Xj表 示離群時(shí)段數(shù)據(jù)對(duì)象。 3)通過上式計(jì)算,合并相似度最大的2 個(gè)類別為新的類別,因此構(gòu)成新的聚類。 4)再進(jìn)行步驟2,反復(fù)迭代直至達(dá)到終止條件。 5)返回層次聚類的結(jié)果。 根據(jù)層次聚類結(jié)果,找出各類別的核心簇點(diǎn),該簇點(diǎn)對(duì)應(yīng)的時(shí)間段一般為異常發(fā)生的時(shí)間段,同時(shí)核心簇點(diǎn)的監(jiān)測(cè)數(shù)據(jù)為子系統(tǒng)在各測(cè)點(diǎn)對(duì)應(yīng)的異常數(shù)據(jù)。將獲得的各測(cè)點(diǎn)對(duì)應(yīng)的異常數(shù)據(jù)反饋到,第一階段聚類和第二階段聚類,用于真實(shí)評(píng)價(jià)異常的結(jié)果,標(biāo)記異常對(duì)錯(cuò),決策學(xué)習(xí)和優(yōu)化異常的閾值參數(shù)。通過以上流程,能夠有效監(jiān)測(cè)除絕大部分系統(tǒng)變化異常的測(cè)點(diǎn),對(duì)于未檢測(cè)到的小部分導(dǎo)致異常變化的數(shù)據(jù),利用專家系統(tǒng)進(jìn)行篩選。 考慮到船舶或海洋工程平臺(tái)開展實(shí)驗(yàn)的復(fù)雜性及經(jīng)濟(jì)性,在方法研究初始階段,可用已有的同類數(shù)據(jù)開展驗(yàn)證。證明方法可行性后,下一階段可到船舶或海工平臺(tái)開展深入實(shí)驗(yàn)驗(yàn)證。目前普遍裝備有安全儀表系統(tǒng),較方便獲取足夠的數(shù)據(jù),而且數(shù)據(jù)類型多,可驗(yàn)證方法對(duì)不同類型數(shù)據(jù)的適應(yīng)性。本文以某系統(tǒng)的實(shí)時(shí)運(yùn)行數(shù)據(jù)進(jìn)行實(shí)驗(yàn)分析。通過對(duì)測(cè)點(diǎn)運(yùn)行數(shù)據(jù)進(jìn)行兩階段聚類獲取異常情況,采用相應(yīng)的評(píng)價(jià)指標(biāo)對(duì)實(shí)驗(yàn)結(jié)果進(jìn)行有效性驗(yàn)證,同時(shí)和其他異常檢測(cè)方法進(jìn)行性能對(duì)比。 選取系統(tǒng)的主要測(cè)點(diǎn)如表1 所示。采集7 月16 日02:00:00 至7 月16 日 22:00:00的測(cè)點(diǎn) 數(shù)據(jù),采 集頻率為2 s。 表1 選取的系統(tǒng)主要測(cè)點(diǎn)Tab.1 Selected main measuring points of pulverizing system 為了消除數(shù)據(jù)屬性之間的差異性,提高聚類效果的準(zhǔn)確性,采取常用的離差標(biāo)準(zhǔn)化算法對(duì)測(cè)點(diǎn)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)歸一化處理。設(shè)某測(cè)點(diǎn)數(shù)據(jù)集為Xi=(xi1,xi2,···,xin),那么標(biāo)準(zhǔn)化過程為: 為了更加直觀地驗(yàn)證本文提出的異常檢測(cè)方法性能,根據(jù)實(shí)驗(yàn)結(jié)果對(duì)比系統(tǒng)數(shù)據(jù)異常缺陷單進(jìn)行對(duì)比驗(yàn)證,采用相應(yīng)的評(píng)價(jià)指標(biāo)進(jìn)行分析。評(píng)價(jià)指標(biāo)為:指標(biāo)包括誤檢率(FAR)和準(zhǔn)確率(PR)。 其中,誤檢率是指沒有被正確判斷出所屬類別的數(shù)目E與檢測(cè)數(shù)據(jù)集中總的正常數(shù)目RN之比,即 準(zhǔn)確率是指被正確判斷出所屬類別的數(shù)目RA與總的數(shù)目N之比,即 在進(jìn)行層次聚類時(shí),根據(jù)聚類效果進(jìn)行參數(shù)的調(diào)整。由于實(shí)驗(yàn)數(shù)據(jù)是無標(biāo)簽的,因此采用輪廓系數(shù)法進(jìn)行聚類性能的評(píng)價(jià)。輪廓系數(shù)的計(jì)算公式如下: 其中,a代表樣本與同類數(shù)據(jù)中所有其他點(diǎn)之間的平均距離,b代表樣本與下一個(gè)最近聚類簇中所有其他點(diǎn)之間的平均距離。最終整體的輪廓系數(shù)是計(jì)算出所有樣本的輪廓系數(shù)后取平均值得到的,因此輪廓系數(shù)得分越高,說明此時(shí)的聚類結(jié)果使得同一種類之間聚集的比較緊密,同時(shí)不同的類之間聚集的比較遠(yuǎn),據(jù)此可以判定此時(shí)的聚類效果較好。 本文選取層次聚類的不同簇間距離度量方法為最大距離標(biāo)準(zhǔn)方法,同時(shí)考慮聚類數(shù)目選擇的實(shí)驗(yàn)區(qū)間至20 種,分不同的情況進(jìn)行實(shí)驗(yàn)進(jìn)而得到聚類的輪廓系數(shù)。實(shí)驗(yàn)結(jié)果如圖3 所示,其中橫坐標(biāo)表示聚類數(shù)目,縱坐標(biāo)表示輪廓系數(shù)的值。由圖可知,最佳聚類數(shù)目為6。 圖3 聚類最佳數(shù)目Fig.3 Optimal number of clusters 根據(jù)二次聚類異常檢測(cè)結(jié)果,進(jìn)而獲聚類核心簇點(diǎn),獲取精準(zhǔn)異常測(cè)點(diǎn)和對(duì)應(yīng)的時(shí)間段。由實(shí)驗(yàn)結(jié)果可得,系統(tǒng)出現(xiàn)異常的測(cè)點(diǎn)分別為主蒸汽壓力測(cè)點(diǎn)和鍋爐總風(fēng)量測(cè)點(diǎn)。圖4 為檢測(cè)到主蒸汽壓力測(cè)點(diǎn)出現(xiàn)異常情況,其中虛線表示時(shí)間段分割,灰色區(qū)域表示異常檢測(cè)數(shù)據(jù)所分布的時(shí)間段。該測(cè)點(diǎn)異常時(shí)段包括4 個(gè),分別為12:54:02 至13:24:16,15:02:26-16:06:18,17:54:12-18:56:04 和19:26:12-20:30:36。 圖4 主蒸汽壓力測(cè)點(diǎn)對(duì)應(yīng)異常時(shí)段Fig.4 Corresponding abnormal period of main steam pressure measuring points 圖5 為時(shí)間段內(nèi)的數(shù)據(jù)點(diǎn)異常情況,其中“1”表示正常數(shù)據(jù),“0”表示異常數(shù)據(jù)。 圖5 主蒸汽壓力異常時(shí)段數(shù)據(jù)情況Fig.5 Data in abnormal period of main steam pressure 鍋爐總風(fēng)量測(cè)點(diǎn)異常情況如圖6 所示。二次聚類獲得的異常數(shù)據(jù)分布在2 個(gè)時(shí)間段,分別為03:36:24-04:24:32 和08:48:00-10:06:12,如圖中灰色區(qū)域所示。圖7為異常時(shí)間段的數(shù)據(jù)異常情況,其中“1”表示正常數(shù)據(jù),“0”表示異常數(shù)據(jù)。 圖6 鍋爐總風(fēng)量測(cè)點(diǎn)對(duì)應(yīng)異常時(shí)段Fig.6 Abnormal period corresponding to total air volume measuring point of boiler 圖7 鍋爐總風(fēng)量壓力異常時(shí)段數(shù)據(jù)情況Fig.7 Data during abnormal period of total air volume and pressure of boiler 為驗(yàn)證本文異常檢測(cè)方法性能,結(jié)合系統(tǒng)各測(cè)點(diǎn)異常缺陷單,對(duì)比兩階段聚類(GMM+HC)和僅采用一階段聚類(GMM)的結(jié)果,如表2 所示。其中,兩階段聚類方法比僅采用一階段聚類方法有效降低了異常檢測(cè)誤檢率,同時(shí)提高檢測(cè)準(zhǔn)確度。 表2 一階段聚類檢測(cè)和兩階段聚類檢測(cè)方法性能對(duì)比Tab.2 performance comparison of one-stage cluster detection and two-stage cluster detection methods 為進(jìn)一步驗(yàn)證本文方法性能,研究多種異常檢測(cè)方法并采用同一數(shù)據(jù)集進(jìn)行對(duì)比分析,結(jié)合表2 性能對(duì)比結(jié)果,繪制不同異常檢測(cè)方法性能對(duì)比圖,如圖8所示。其中基于局部離群點(diǎn)檢測(cè)(LOF)[9]和基于DBSCAN 檢測(cè)方法[17]在誤檢率和準(zhǔn)確率方面明顯不如本文提出的基于兩階段聚類的異常檢測(cè)方法。主要在于LOF 檢測(cè)方法僅依賴于鄰域內(nèi)的密度之比,未充分考慮全局信息即測(cè)點(diǎn)之間的聯(lián)動(dòng)性;而DBSCAN 檢測(cè)方法受聚類參數(shù)影響較大。本文提出的方法充分考慮各測(cè)點(diǎn)間的聯(lián)動(dòng)性。 圖8 不同異常檢測(cè)方法性能對(duì)比Fig.8 performance comparison of different anomal detection methods 針對(duì)現(xiàn)有異常檢測(cè)方法在機(jī)電系統(tǒng)異常檢測(cè)中存在局限性、誤檢率高等問題,本文提出基于兩階段聚類的異常檢測(cè)方法。該算法主要包括數(shù)據(jù)采集、預(yù)處理、兩階段聚類異常檢測(cè),通過一次聚類進(jìn)行初始異常時(shí)段篩選,再根據(jù)二次聚類進(jìn)行異常定位,進(jìn)而達(dá)到降低誤檢率的目的。同時(shí),該方法從無監(jiān)督學(xué)習(xí)出發(fā),不需要大量的專業(yè)知識(shí)經(jīng)驗(yàn),僅從最近的歷史數(shù)據(jù)學(xué)習(xí),并配合少量的業(yè)務(wù)經(jīng)驗(yàn)就可以實(shí)現(xiàn)機(jī)電系統(tǒng)異常的檢測(cè)。實(shí)驗(yàn)表明,該方法提高了異常檢測(cè)準(zhǔn)確率,有效減少了異常誤判的產(chǎn)生。因此,基于兩階段聚類的異常檢測(cè)方法可以實(shí)現(xiàn)精準(zhǔn)的快速故障檢測(cè),具有良好的應(yīng)用前景。2.2 基于層次聚類的異常檢測(cè)
3 實(shí)驗(yàn)與評(píng)估
3.1 數(shù)據(jù)獲取與準(zhǔn)備
3.2 評(píng)價(jià)指標(biāo)
3.3 實(shí)驗(yàn)過程與結(jié)果討論
4 結(jié)語