• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      時序數(shù)據(jù)故障點檢測方法分析比較及應用

      2012-11-22 02:29:00賀力克
      湖南師范大學自然科學學報 2012年2期
      關鍵詞:變點引力時序

      賀力克

      (湖南工業(yè)職業(yè)技術學院電氣工程系,中國 長沙 410208)

      時序數(shù)據(jù)是一種服從某分布的隨機變量,在不同時刻有一個取值,并按照時間發(fā)生的順序排列而成的統(tǒng)計序列.隨機變量的分布主要用分布函數(shù)參數(shù)如均值、方差等來表示.當形成時序數(shù)據(jù)的一系列隨機變量,由于某種條件的變化而不再服從之前的分布,則稱該時間序列發(fā)生了故障(有文獻稱之為“變點”、“孤立點”等).故障點的檢測在各個領域得到了廣泛的應用.在一個時序數(shù)據(jù)中,利用已有信息對下一秒是否異常點并給出合理的估計和警報的類型,是現(xiàn)代故障檢測和故障容錯領域的熱點研究問題[1];采用這種方法也能有效的檢測圖像中隱藏的信息,檢測計算機網(wǎng)絡是否收到病毒或者黑客的攻擊.基于此類廣泛的應用,故障點的檢測算法已在統(tǒng)計學界得到了廣泛的研究.

      目前對時序數(shù)據(jù)的分析方法主要包括兩種類型:數(shù)理統(tǒng)計方法和數(shù)據(jù)挖掘方法[2].數(shù)據(jù)統(tǒng)計方法是通過統(tǒng)計學中的模型假設、參數(shù)估計、模型檢驗等手段獲取描述時序數(shù)據(jù)的規(guī)律.數(shù)據(jù)挖掘方法則從時間序列局部特性出發(fā),從大量的、不完備的、有噪聲的數(shù)據(jù)中, 提取隱含在其中的一些規(guī)律[3].早在1995年Nikiforov就提出了異常點檢測模型用于檢測和避免時間序列中突發(fā)的變化[4].目前學者們已經(jīng)開發(fā)了大量的孤立點檢測算法,可以分為三類:基于模型的技術[5]、基于臨近度的技術[6]和基于密度的技術.王建州等人[5]指出排除時序數(shù)據(jù)中故障點能使故障點對時序數(shù)據(jù)的影響變小,但是可能導致重要的隱藏信息的丟失.為了解決此類問題,提出了一種統(tǒng)計分析結合小波變換的方法.文獻[7]結合密度和臨近度的概念,提出了一種基于引力的孤立點檢測方法,通過考慮數(shù)據(jù)周圍的密度和數(shù)據(jù)對象間的距離等參數(shù)對孤立點定義的影響來挖掘數(shù)據(jù)集中隱含的孤立.此外,小波變換具有自動改變窗長的功能,可以很好地把信號在空間和頻率上局部化,這以特性使得小波變換對信號的變點分析也有一席之地[8].

      對國內外文獻調查分析發(fā)現(xiàn),研究學者針對不同的時序數(shù)據(jù),提出了很多時間序列變點的檢測方法,每種方法都是針對某一種情況有著較好的檢測效率,然而并沒有對常見的檢測算法進行行之有效的對比.本文旨在對幾種主要的時間序列的故障點檢測算法進行性能分析,為其他研究者在選取基于數(shù)理統(tǒng)計和分線性序列分析兩種基本檢測方法時提供一些參考.

      1 時序數(shù)據(jù)基本模型

      在變點檢測問題中,有一系列的觀測值(觀測樣本),多數(shù)情況下,觀測值按其垂涎時間的先后排序.在某個位置時刻,樣本的分布或其他數(shù)字特征起了突然的變化,這個時刻就是變點.也有可能樣本分布依賴于某種空間參數(shù),而變點則是空間中的位置或時間軸上的某一時刻.設x1,x2,…,xn是相互獨立的隨機變量,并且服從某種分布.通常xi可以表示成如下形式

      (1)

      假設在一個未知的時刻t時,ξ(i)的值為ξ(t)=ξ0;而到下一個時刻t+1時,ξ(i)的值為ξ(t+1)=ξ1.因此式(1)描述了帶有異常點時間系統(tǒng)的一般模型,ξ0表示了對于系統(tǒng)F而言正常的狀態(tài),而ξ1表示一系列非正常狀態(tài)(故障、變點).假設系統(tǒng)F的輸出值表示為x1,x2,…,xn,變點檢測即檢測和盡量地避免ξ(i)的非正常變化,例如從ξ0狀態(tài)變?yōu)棣?.

      根據(jù)上述離散時間系統(tǒng)的一般模型,本文討論的在某未知時刻t+1時發(fā)生的故障ξ1簡化表示為

      2 幾種孤立點檢測方法分析

      2.1 基于引力的孤立點檢測算法

      這種孤立點檢測算法主要借鑒了牛頓萬有引力的思想,考慮將數(shù)序數(shù)據(jù)看作是n個質量均勻的點,不均勻地分布在數(shù)據(jù)空間中,每個數(shù)據(jù)對象的影響可以用一個引力函數(shù)來表示[7].依據(jù)時序數(shù)據(jù)點對臨近時刻數(shù)據(jù)的引力函數(shù)的大小來作為判斷孤立點的標準.具體的引力函數(shù)如下式所示

      其中d(xi,xj)表示數(shù)據(jù)對象xi與xj的距離;ln[ln(ni+1)]表示數(shù)據(jù)點i的質量;ni表示數(shù)據(jù)xi在距離d內的鄰居數(shù).這里用ln[ln(ni+1)]表示第i個數(shù)據(jù)點的質量,是為了避免密度較大的數(shù)據(jù)點相乘使得引力急劇增大而出現(xiàn)“黑洞”現(xiàn)象,算法過程參見文獻[7],這里不再贅述.

      但是從此類算法的本質來看,處理序列時間數(shù)據(jù)具有一定的局限性.通常來說時序數(shù)據(jù)是連續(xù)性的一維數(shù)據(jù),定義相鄰數(shù)據(jù)點的方法也比較單一,不能放在一個多維向量中來考慮,必須采取有效的分段才能處理分段時序數(shù)據(jù)[9],而且此類處理方法通常用于圖像等維數(shù)較多的數(shù)據(jù)處理[10].針對此類問題,學者們專門研究了時序數(shù)據(jù)變點的檢測算法.

      2.2 基于均值變點的檢測算法

      文獻[11]研究了一般情況下均值變點檢測模型,如式(1)所描述的一般系統(tǒng)模型.取一個位置或時刻i,考察i附近的局部內樣本均值或樣本和的變化,即指定一個適當?shù)淖匀粩?shù)d,把i左右的各d個觀測值(一般稱d為步長或窗口長度)求和并相減,得

      yi=(xi+…+xi+d-1)-(xi-d+…+xi-1).

      (2)

      其中i=d+1,d+2,…,n-d+1,若i非變點并且與變點位置t+1的距離不小于d,則上式右邊兩項有相似的均值且yi趨近于0;反之若當前檢測點i等于t+1或離t+1很近,則式(2)左右兩項的均值不同,yi趨遠于0.

      該變點檢測算法對步長d的選擇具有較大的依賴性,若d選取過小,對觀測值的變化會過于敏感;反之若d選取過大,會使隨機誤差的影響削弱,對誤差的呈現(xiàn)不敏感.文獻[11]對d的取值給出了一個估計方法,本文中不再做討論.但是在對d的估計過程中,須已知所有觀測值樣本的總數(shù)n,然而這對于在線變點檢測是一個瓶頸.

      2.3 基于均值方差變點估計的孤立點檢測

      文獻[12]研究了獨立序列中均值與方差變點的估計問題,作者考慮了序列的均值和方差是否有變點的情況.

      設序列{xt|t=1,…,T} 滿足E(xn)=μ(t), Var(xn)=σ(t) .若μ(t),σ(t)取值分別為μ1、μ2和σ1、σ2,且有

      其中

      其中

      上述變點估計問題只是針對一個序列中存在單一變點的情況,對于多變點的情況作者并沒有考慮,然而時序數(shù)據(jù)中變點的多發(fā)性是必然的,因此這也是該檢測算法的一個缺陷.

      3 GPS采集數(shù)據(jù)的模擬試驗與實例分析

      本節(jié)用實際采集的GPS數(shù)據(jù)作為模擬研究和分析的源數(shù)據(jù),用于對比文章中提到的3種基于時序類型的變點檢測方法,而采用文獻[8]中提到的小波檢測結果作為真實結果.GPS接收機可以采集到導航坐標系中東向、北向和天向3個方向的速度,然而GPS接收機在運動過程中可能會收到系統(tǒng)誤差、機器誤差、噪聲的影響而對采集到的數(shù)據(jù)產(chǎn)生數(shù)據(jù)變點,準確估計變點發(fā)生的位置或時間對數(shù)據(jù)下一步的使用有著重要的意義.本文在測試算法性能過程中采用了一組GPS接收數(shù)據(jù)來評價幾種檢測方法的性能,限于篇幅原因,僅選取兩個方向進行分析,原始數(shù)據(jù)圖見圖1(a),(b).

      (a) GPS接收機采集到的東向速度原始數(shù)據(jù) (b) GPS接收機采集到的北向速度原始數(shù)據(jù)圖1 GPS接收機采集到的東、北向速度原始數(shù)據(jù)

      測試數(shù)據(jù)的樣本容量為6 906,即T=6 906,采樣頻率為10 Hz.從圖1中看出數(shù)據(jù)是部分平穩(wěn)的,發(fā)生了較多的跳變,需要采用變點檢測算法對其進行變點檢測,確定變點的位置.

      (a) 東向速度“引力”檢測結果 (b) 北向速度“引力”檢測結果圖2 基于引力的孤立點檢測結果

      圖2(a),(b)所示為基于引力的孤立點檢測算法對GPS東北向速度采樣數(shù)據(jù)的修正結果,檢測結果見表1.可以看出在前半段修正后的結果比采樣結果有較大的偏差,后半段較?。?中也可以看出檢測變點數(shù)目比其他兩種方式都小,可見該檢測算法發(fā)生了誤檢和漏檢.這與該算法的理論基礎有關,定義該“虛擬引力”的概念有些牽強.不能很好地解釋數(shù)據(jù)中發(fā)生變點的內在原因[13].

      圖3和圖4為另外兩種基于統(tǒng)計模型的變點檢測方法.圖中有3條線,分別代表誤差、誤差估計上閾值、誤差估計下閾值.超過估計閾值的時刻則檢測為變點,在區(qū)間內的則表示正常數(shù)據(jù)時刻.在處理這兩個類似檢測算法時,作者對GPS采樣數(shù)據(jù)進行了一階差分操作,接著對查分序列進行變點檢測.從表1中可以看出“均值變點檢測算法”和“均值方差變點檢測算法”的檢測效率和結果不相上下.相比較而言,圖3中所示的均值變點檢測方法算法較為簡單,因此計算代價比較小,而圖4中的均值方差變點檢測方法需要檢測觀測數(shù)據(jù)序列的兩種統(tǒng)計量的變化,因此計算消耗的代價較大,而性能沒有得到太大的提高.

      (a)東向速度均值變點點檢測結果 (b)北向速度均值變點點檢測結果圖3 均值變點檢測結果

      (a)東向速度均值方差變點點檢測結果 (b)北向速度均值方差變點點檢測結果圖4 均值方差變點檢測結果

      由以上的模擬研究和實例分析來看,本文精確地比較了幾種變點檢測算法的性能,每種檢測算法均能較好地判斷變點的個數(shù)并準確地估計變點發(fā)生的時刻,采用變點檢測算法之前需要確定的較重要的參數(shù)為步長,該參數(shù)較大地影響了變點檢測算法的效果.此外,基于“引力”的孤立點檢測算法由于其理論性不強的緣故,檢測效率和其他兩種算法略有差別.而其他兩種檢測算法在檢測性能上不相上下,只是算法代價有差別.

      表1 3種檢測算法檢測率的比較

      4 結束語

      本文比較了3種不同的序列故障點檢測算法,分別是:基于“引力”的孤立點檢測算法,基于“均值變點”的檢測算法和基于“均值方差變點估計”的檢測算法.分別對這3種算法進行了分析比較,并從試驗的角度對3種算法進行了性能評價.試驗以GPS接收機實測的東北天3個方向的速度數(shù)據(jù)為基礎,最后給出了檢測結果和性能結果.試驗表明:基于“引力”的孤立點檢測算法效果不如其他兩種算法,而基于“均值變點”的檢測算法在計算代價上又優(yōu)于基于“均值方差變點估計”的檢測算法.本文的工作能為選取變點檢測算法時提供有價值的參考.

      參考文獻:

      [1] 程瑞琪,周美玉.基于統(tǒng)計與時間序列的內燃機車機油光譜數(shù)據(jù)分析與故障診斷[J]. 鐵道學報,1999,21(4):20 -24.

      [2] 劉齊宏,李大德,周志斌,等.基于RFaD與基因表達式編程的經(jīng)濟統(tǒng)計時序挖掘[J]. 四川大學學報:工程科學版,2008,40(5):121-124.

      [3] 蘇圣超,張正道,朱大奇.基于時間序列數(shù)據(jù)挖掘的旋轉機械故障預報[J].南京航空航天大學學報,2006,38(1):121-123.

      [4] NIKIFOROV I. A generalized change detection problem[J]. IEEE Trans Inf Theor, 1995, 41(1): 171- 187.

      [5] 王建州,楊 勇.基于統(tǒng)計分布的小波分析對時間序列孤立點數(shù)據(jù)的識別與挖掘[J]. 西北師范大學自然科學學報,2004,40(2):3-6.

      [6] 孫煥良,鮑玉斌,于 戈,等.一種基于劃分的孤立點檢測算法[J].軟件學報,2006, 17(5):1009-1016.

      [7] 孟建良,姚 亮, 程偉想.基于引力的孤立點檢測算法[J].計算機應用與軟,2009, 26(1): 254-257.

      [8] 齊培艷,田 錚,段西發(fā),等.噪聲為單位根過程的非參數(shù)函數(shù)變點的小波檢測[J]. 控制理論與應用,2009,26(1):57-61.

      [9] 劉合兵,尚俊平. 基于距離和密度的聚類和孤立點檢測算法[J]. 河南師范大學自然科學學報,2008,36 (3):38-40.

      [10] 馬 捷,嚴家斌,劉貴忠,等.混合噪聲的各向異性擴散平滑[J].中南大學自然科學學報,2010,41(1): 213-237.

      [11] 王曉原,雋志才,樸基男,等.局部比較的變點統(tǒng)計理論及其在交通流突變研究中的應用[J]. 公路交通科技,2002,19(6):112-115.

      [12] 袁 芳,田 錚,蘇曉麗,等. 獨立序列均值與方差變點的累積和估計及應用[J]. 控制理論與應用, 2010, 27(3): 395-399.

      [13] 鄢團軍,劉 勇.孤立點檢測算法與應用[J]. 三峽大學學報:自然科學版,2009,31(1):98-103.

      猜你喜歡
      變點引力時序
      時序坐標
      基于Sentinel-2時序NDVI的麥冬識別研究
      回歸模型參數(shù)的變點檢測方法研究
      正態(tài)分布序列均值變點檢測的貝葉斯方法
      基于二元分割的多變點估計
      河南科學(2020年4期)2020-06-03 07:18:22
      獨立二項分布序列變點的識別方法
      引力
      初中生(2017年3期)2017-02-21 09:17:40
      一種毫米波放大器時序直流電源的設計
      電子制作(2016年15期)2017-01-15 13:39:08
      感受引力
      A dew drop
      马尔康县| 博兴县| 介休市| 神池县| 泸州市| 黄陵县| 阜新市| 绥宁县| 蕉岭县| 永善县| 康马县| 西安市| 安塞县| 玉山县| 怀安县| 察哈| 当涂县| 漳平市| 闵行区| 旅游| 通海县| 永福县| 修武县| 商都县| 中西区| 自治县| 湖南省| 信丰县| 武强县| 施秉县| 上饶市| 崇礼县| 平顶山市| 阿荣旗| 徐汇区| 得荣县| 霍林郭勒市| 岑巩县| 三江| 庄河市| 沾化县|