程繼紅,阮傳峰,崔 嘉,齊玉東
(1.海軍航空工程學院 科研部,山東 煙臺 264001;2.海軍航空工程學院 研究生管理大隊,山東 煙臺 264001;3.海軍航空工程學院 控制工程系,山東 煙臺 264001;4.海軍航空工程學院 兵器科學與技術(shù)系,山東 煙臺 264001)
?
大數(shù)據(jù)分析技術(shù)在裝備監(jiān)測系統(tǒng)中應(yīng)用研究
程繼紅1,阮傳峰2,崔 嘉3,齊玉東4
(1.海軍航空工程學院 科研部,山東 煙臺 264001;2.海軍航空工程學院 研究生管理大隊,山東 煙臺 264001;3.海軍航空工程學院 控制工程系,山東 煙臺 264001;4.海軍航空工程學院 兵器科學與技術(shù)系,山東 煙臺 264001)
針對裝備狀態(tài)監(jiān)測系統(tǒng)中長期積累的大量數(shù)據(jù)缺乏有效分析手段、利用率低等問題,對裝備監(jiān)測系統(tǒng)中存儲的在線監(jiān)測數(shù)據(jù)和積累的歷史數(shù)據(jù),建立可分析挖掘的大數(shù)據(jù)集;運用數(shù)據(jù)分析和機理分析的方法建立比較模型,采用異步信息融合的算法對數(shù)據(jù)進行處理,利用大數(shù)據(jù)的多尺度特性研究裝備生命周期的分析預(yù)測、優(yōu)化運行、預(yù)知維修等目標,提高了裝備運用知識的獲取速度,有利于構(gòu)建完整的裝備生命周期預(yù)測診斷體系。
裝備;大數(shù)據(jù);數(shù)據(jù)分析;數(shù)據(jù)挖掘
隨著裝備信息化程度的不斷提升,信息系統(tǒng)對裝備使用、維護各個環(huán)節(jié)的監(jiān)測記錄,促進了大數(shù)據(jù)的形成。但對該大數(shù)據(jù)的知識挖掘比較欠缺,未能有效地為裝備的使用、維護等提供高質(zhì)量的輔助決策。本文在建立大數(shù)據(jù)集的基礎(chǔ)上,運用模型算法,通過不同尺度的分析和不同層面的知識挖掘,所形成的結(jié)論對于裝備良好工況的保持、維護費用的降低、安全性的提高具有重要的指導(dǎo)意義。
在裝備監(jiān)測信息系統(tǒng)平臺的統(tǒng)一數(shù)據(jù)元標準下,裝備生命周期中的在線狀態(tài)監(jiān)測數(shù)據(jù)、檢維修數(shù)據(jù)、裝備檔案與裝備變更、故障模式分析等各種形態(tài)的數(shù)字信息資源集合具有了統(tǒng)一的、標準的描述方法和檢索手段。這使得監(jiān)測系統(tǒng)中儲存的大數(shù)據(jù),運用算法對它進行多尺度分析,知識挖掘變得簡便有效[1]。有益于決策分析品質(zhì)的提高,使構(gòu)建完整的裝備生命周期預(yù)測體系成為可能[2]。裝備監(jiān)測系統(tǒng)中儲存的大數(shù)據(jù)分析系統(tǒng)結(jié)構(gòu)如圖1所示。
圖1 數(shù)據(jù)分析系統(tǒng)結(jié)構(gòu)圖
當前科技進步日新月異,尤其是互聯(lián)網(wǎng)、云計算、云存儲等計算機網(wǎng)絡(luò)技術(shù)的跨越發(fā)展,大數(shù)據(jù)呈現(xiàn)出海量性(Volume)、多樣性(Variety)、高速性(Velocity)、易變性(Variability)四個典型特征[3]。表現(xiàn)為數(shù)據(jù)量更多,不是片段的數(shù)據(jù)樣本,而是全體數(shù)據(jù);數(shù)據(jù)結(jié)構(gòu)更混雜,非結(jié)構(gòu)化數(shù)據(jù)量激增,所占比重越來越大;數(shù)據(jù)之間的關(guān)系更復(fù)雜,并非容易理解的因果關(guān)系,而是難懂晦澀的相關(guān)關(guān)系[4]。而在高技術(shù)裝備生命周期中,運行、維護、檢修等全過程中采集累積的大數(shù)據(jù),不僅具有上述特性,自身還有著以下獨有的特點:
1)數(shù)據(jù)變量多且維度高。各種復(fù)雜的物理、化學變化不可避免的發(fā)生在裝備運行過程中,由于參數(shù)之間互相產(chǎn)生耦合,這使得系統(tǒng)將變得復(fù)雜且空間多維,致使描述系統(tǒng)需要的參數(shù)增多,對數(shù)據(jù)的理解難度也將相應(yīng)的增加。
2)數(shù)據(jù)呈復(fù)雜的非線性。描述裝備監(jiān)測系統(tǒng)狀態(tài)的絕大部分變量的變化是非線性的。比如,在熱力學中溫度對應(yīng)于焓值之間的變化并不是簡單的線性關(guān)系。隨著數(shù)據(jù)規(guī)模的不斷增大,越來越復(fù)雜難懂的非線性關(guān)系,增加了對數(shù)據(jù)的理解分析、知識發(fā)掘的難度。
3)樣本數(shù)據(jù)采集分布不均勻。裝備通常會長時間運行在狀態(tài)良好且效率較高的工況下,考慮到裝備磨損以及安全性,不會讓系統(tǒng)運行在某些過渡過程。裝備工作方式的這個特點使得監(jiān)測數(shù)據(jù)點比較密集的落在較窄的時空區(qū)域內(nèi),不便于對裝備狀態(tài)的建模分析。
4)高噪聲。由于在裝備的運行過程中難以屏蔽復(fù)雜電磁的干擾、惡劣環(huán)境的影響,狀態(tài)監(jiān)測的信息中必定會有噪聲的產(chǎn)生。一般而言監(jiān)測信號的信噪比越低,數(shù)據(jù)存在的誤差越大,數(shù)據(jù)分析的可靠性也越差。
因此,監(jiān)測系統(tǒng)中存儲的大數(shù)據(jù)夾雜著錯誤決的辦法是對大數(shù)據(jù)按照清洗、集成、變換、規(guī)約的步驟進行數(shù)據(jù)預(yù)處理[1]。這個過程改善了數(shù)據(jù)的品質(zhì),為高效的分析數(shù)據(jù)創(chuàng)造了必要的前提條件。
3.1 常用算法
運用算法先把監(jiān)測系統(tǒng)中存儲的大數(shù)據(jù)分為兩類,一類為提供建立基準模型所需的建模數(shù)據(jù),另一類為作為基準模型輸入的運行數(shù)據(jù)。根據(jù)裝備運行在不同的工況下,使用數(shù)據(jù)建模或機理建模的方法,分別建立裝備對象的動態(tài)和穩(wěn)態(tài)的兩種基準模型。把裝備運行中的數(shù)據(jù)作為基準模型的輸入,輸出為裝備狀態(tài)的預(yù)測數(shù)據(jù),與在線監(jiān)測的實時狀態(tài)數(shù)據(jù)相比較,分別獲得兩種工況下模型對應(yīng)的殘差值。按照信息?;母拍?,把殘差分解為多層次的信息粒,由于信息粒存在的不同程度的延遲現(xiàn)象,采用異步信息融合進行信息處理的方法,大大提高融合殘差的精確度。根據(jù)監(jiān)測狀態(tài)的差異性,對融合殘差進行不同尺度的評測分析,構(gòu)建出狀態(tài)監(jiān)測信號,為裝備的分析決策提供參考依據(jù)[5]。數(shù)據(jù)算法分析如圖2所示。
圖2 數(shù)據(jù)算法分析
3.2 基準模型的建立
建立基準模型的目的是獲取裝備運行狀態(tài)參數(shù)的預(yù)測數(shù)據(jù),為裝備狀態(tài)監(jiān)測的數(shù)據(jù)提供比較的參考。在數(shù)據(jù)算法分析中,通過預(yù)測數(shù)據(jù)和監(jiān)測數(shù)據(jù)兩者相比較得到的差值,也稱之為殘差序列。該差值與裝備狀態(tài)存在某種對應(yīng)的關(guān)系。嚴格的講,當裝備狀態(tài)處于正常時,該差值為零,非正常時,該差值將出現(xiàn)較大的振動。
建立基準模型時應(yīng)考慮以下幾點:
1)運行數(shù)據(jù)作為基準模型的輸入直接影響到輸出的預(yù)測數(shù)據(jù)。為保證模型預(yù)測的準確一致性,所以選取裝備在良好狀態(tài)下的運行數(shù)據(jù)是非常必要的。如使用新裝備經(jīng)過磨合期后處于性能較好且穩(wěn)定狀態(tài)的運行數(shù)據(jù)建模。
2)基準模型并非對象的完備模型。由于參數(shù)相互耦合、干擾的存在,高技術(shù)裝備運行時狀態(tài)的變化的極其復(fù)雜過程。因此,構(gòu)建比較完備的模型是不易實現(xiàn)的。不過,構(gòu)建模型的目的是獲得僅僅與狀態(tài)監(jiān)測數(shù)據(jù)有對應(yīng)關(guān)系的預(yù)測數(shù)據(jù),要求模型輸出的預(yù)測數(shù)據(jù)的變量參數(shù)只要能和選取的監(jiān)測數(shù)據(jù)一一對應(yīng)即可。因此,模型不必要是完備的,建模也將變得簡單可行。
3)建模方法的選擇??梢酝ㄟ^機理分析、數(shù)據(jù)分析以及兩者混合分析的方法建立模型[6]。無論選擇何種方法,都應(yīng)首先對建立模型的難度、精確度、花費等因素加以權(quán)衡。
4)建模變量的選取。一是如何確定模型的變量,應(yīng)由建模對象的特性和模型的目的共同決定。通常選取那些具有容易監(jiān)測且精度較高特性的狀態(tài)變量。特別是溫度、壓強等這類沒有延遲且數(shù)據(jù)易獲得且精準的變量。二是如何確定變量的個數(shù),只要能夠滿足模型精度的要求即可,因為較多的變量不僅會造成模型的復(fù)雜程度,而且不利于模型對數(shù)據(jù)的處理效率,也會使模型的適應(yīng)性變差。
5)區(qū)分穩(wěn)態(tài)工況與動態(tài)工況的基準模型。裝備運行通常會控制在穩(wěn)定的狀態(tài)下,也稱之為穩(wěn)態(tài)工況。但根據(jù)具體情況相應(yīng)的對裝備的運行做出調(diào)整是必要且不可避免的。運行狀態(tài)的改變,與之對應(yīng)的是多個參量的變化,這種過程稱之為動態(tài)工況,它具有持續(xù)短暫、動態(tài)變化、臨時過渡的特點。穩(wěn)態(tài)工況和動態(tài)工況具有的不同特點,要求對它們分別建立模型,以便能更真實的準確的描述相對應(yīng)的裝備運行狀態(tài)。其次,裝備運行中,因為部分狀態(tài)參數(shù)存在延遲、滯后,所以穩(wěn)態(tài)工況模型往往適用于已較長時間在穩(wěn)態(tài)運行下的狀態(tài)描述。因此,區(qū)分穩(wěn)態(tài)工況與動態(tài)工況分別建立基準模型,更能夠較好描述裝備運行的真實狀態(tài)的變化。
3.3 殘差及其信息?;?/p>
針對比較模型得到的穩(wěn)態(tài)和動態(tài)殘差數(shù)據(jù)規(guī)模大的問題,一是采用并行方式對大數(shù)據(jù)進行處理,可以有效地減少運算時間。二是按各自的特征和性能對數(shù)據(jù)進行信息?;?,通過相互間的有機結(jié)合,根據(jù)需要按不同的層次劃分出不同的信息粒,然后再對其進行并行的運算處理,這樣就可以大大提高運算處理的效率[7]。
3.4 單一信息粒的異步信息融合
經(jīng)過信息粒化處理的穩(wěn)態(tài)與動態(tài)殘差并不是同步信息,而是在時域上的異步信息。運用卡爾曼濾波通過對輸出和輸入觀測數(shù)據(jù)的信息處理,能夠?qū)崿F(xiàn)對系統(tǒng)狀態(tài)進行最優(yōu)的估計[7]。
3.5 融合殘差的多尺度分析
對于由系統(tǒng)的擾動和觀測而形成的噪聲,可以通過分析其統(tǒng)計特性進行評估處理,從而使噪聲對觀測的狀態(tài)參數(shù)的影響處于可控制的范圍,即對狀態(tài)監(jiān)測精度造成的下降是微不足道的。根據(jù)相關(guān)的尺度對融合殘差進行多尺度的分析、重構(gòu),可以得到與不同狀態(tài)相對應(yīng)的狀態(tài)檢測參數(shù)信號。多尺度分析信息處理過程如圖3所示。
圖3 信息處理過程
對數(shù)據(jù)進行分析挖掘首先應(yīng)明確目標,特別要清楚需要獲得那些信息知識。這個過程具有創(chuàng)造性,需要多種技術(shù)和大量知識的綜合共同的參與[8]。在裝備運行狀態(tài)監(jiān)測系統(tǒng)中應(yīng)用大數(shù)據(jù)分析挖掘技術(shù),應(yīng)時刻圍繞者裝備預(yù)測的目標對數(shù)據(jù)分析挖掘。在模型中應(yīng)用大數(shù)據(jù)分析挖掘技術(shù)應(yīng)明確以下三點,才能避免大數(shù)據(jù)分析挖掘應(yīng)用的盲目性[9]。
1)理解和定義。數(shù)據(jù)規(guī)模大且變化微弱時,僅依靠人類專家分析處理大數(shù)據(jù)并發(fā)現(xiàn)其中所隱含的應(yīng)用知識信息是不現(xiàn)實的。例如裝備的使用者能夠感知到裝備總體系統(tǒng)特征的較大幅度的變化,但對部分系統(tǒng)狀態(tài)特征的小幅度變化所引起的監(jiān)測數(shù)據(jù)微乎其微的變化傳遞的信息知識卻很難覺察到。
2)建立可分析挖掘的大數(shù)據(jù)集。監(jiān)測系統(tǒng)中存儲的種類多樣結(jié)構(gòu)復(fù)雜大數(shù)據(jù),要圍繞數(shù)據(jù)分析挖掘的目標構(gòu)建可分析挖掘的大數(shù)據(jù)集,之后,要對其中數(shù)據(jù)進行選擇、清理、變換和歸約四個方面的預(yù)處理。這樣才能提高大數(shù)據(jù)集的品質(zhì),以便能夠為模型的算法所高效處理。
3)模型的應(yīng)用。隨著裝備的長期不斷的運行,積累的運行數(shù)據(jù)的規(guī)模越來越大,模型會在不斷地數(shù)據(jù)累積中學習更新,從而智能的發(fā)現(xiàn)裝備新的運行狀態(tài),機器的自我學習提高了大數(shù)據(jù)分析預(yù)測的準確度。
對裝備狀態(tài)監(jiān)測和預(yù)測評估的過程是一個閉環(huán)系統(tǒng),包括信號采集、特征提取、狀態(tài)識別和預(yù)測分析四個步驟。通常一個往復(fù)循環(huán)并不能對裝備狀態(tài)進行可靠的預(yù)測評估,解決的辦法就是增加預(yù)測評估的循環(huán)次數(shù),才能夠不斷地深化認識和提高預(yù)測的準確度。不過隨著裝備監(jiān)測系統(tǒng)中存儲的數(shù)據(jù)規(guī)模越來越大,帶來了新的問題使得對數(shù)據(jù)的運算難度也不斷加大,進行循環(huán)的處理過程也將變得越來越困難。
隨著大數(shù)據(jù)分析挖掘技術(shù)的不斷進步,大數(shù)據(jù)所隱含的價值也將會慢慢凸顯出來。本文把大數(shù)據(jù)分析挖掘技術(shù)應(yīng)用于裝備狀態(tài)監(jiān)測系統(tǒng)中,大大提高了裝備預(yù)測診斷系統(tǒng)的知識獲取速率,有益于構(gòu)建裝備生命周期的預(yù)測體系,具有很好的應(yīng)用前景。
[1] 劉繼偉. 基于大數(shù)據(jù)的多尺度狀態(tài)監(jiān)測方法及應(yīng)用[D]. 北京:華北電力大學,2013.
[2] 尤明懿,孟 光. 基于狀態(tài)監(jiān)測數(shù)據(jù)的產(chǎn)品壽命預(yù)測與預(yù)測維護規(guī)劃方法研究[D]. 上海:上海交通大學,2012.
[3] 伊恩.艾瑞斯. 大數(shù)據(jù)思維與決策[M]. 北京:人民郵電出版社,2014.
[4] 維克托.邁爾,肯尼思.庫克耶.大數(shù)據(jù)時代[M].浙江:浙江人民出版社,2013.
[5] 王永卿,秦亮曦. 高維海量數(shù)據(jù)聚類算法研究[D]. 南寧:廣西大學,2007.
[6] Mark Meerschaert,劉來福. 數(shù)學建模方法與分析[M]. 北京:機械工業(yè)出版社,2009.
[7] 申 彥,宋順林.大規(guī)模數(shù)據(jù)集高效數(shù)據(jù)挖掘算法研究[D].鎮(zhèn)江:江蘇大學,2013.
[8] 錢 超. 高速公路ETC數(shù)據(jù)挖掘研究與應(yīng)用[D]. 西安:長安大學,2013.
[9] 楊風召. 高維數(shù)據(jù)挖掘中若干關(guān)鍵問題的研究[D].上海:復(fù)旦大學,2003.
Research on the Application of Large Data Analysis Technology in Equipment Monitoring System
Cheng Jihong1, Ruan Chuanfeng2, Cui Jia3, Qi Yudong4
(1.Department of Scientific Research,Yantai 264001, China;2.Graduate Students’Brigade,Naval Aeronautical and Astronautical University,Yantai 264001, China; 3.Department of Ordnance Science and Technology Engineering,Naval Aeronautical and Astronautical University,Yantai 264001, China; 4.Department of Control Engineering,Naval Aeronautical and Astronautical University,Yantai 264001, China)
Aiming at the long-term accumulation of large amounts of data of the equipment condition monitoring system lack of effective means of analysis and low utilization of data, establish the large data set based on the equipment monitoring system in the storage of online monitoring data and long-term accumulation of historical data. Then, establish method analysis with data analysis and comparison of mechanism model, using asynchronous information fusion algorithm for data processing and adopting the multi-scale characteristics of big data to research the analysis and forecast, operation optimization, predictive maintenance of equipment life cycle etc. This method improves the acquisition speed of the equipment knowledge and is conducive to the equipment life to build a complete cycle prediction and diagnosis system.
equipment; big data; data analysis; data mining
2016-06-22;
2016-08-02。
程繼紅(1964-),男,安徽省桐城市人,教授,碩士研究生導(dǎo)師,主要從事海軍航空、導(dǎo)彈裝備綜合保障方向的研究。
1671-4598(2016)09-0152-03
10.16526/j.cnki.11-4762/tp.2016.09.042
TP393
A