梁超
摘? 要:預測性維護是工業(yè)互聯(lián)網(wǎng)應用的重點,實現(xiàn)預測性維護的關鍵是對設備系統(tǒng)或核心部件的壽命進行有效預測。隨著近年來機器學習的發(fā)展,機械設備海量數(shù)據(jù)已成為工業(yè)互聯(lián)網(wǎng)分析核心部件剩余壽命的關鍵指標,也成為設備健康管理決策性數(shù)據(jù)?;诠こ虣C械設備大數(shù)據(jù),結合XGBoost、隨機森林、LightGBM等多種機器學習模型,多維度探究影響機械核心部件壽命的機器學習模型效果,建立Stacking算法模型融合的部件壽命預測模型,并在核心部件數(shù)據(jù)上驗證模型預測有效性,從而減少設備非計劃停機時間,推進智能制造和預測性維護的進步。
關鍵詞:工程機械;壽命預測;機器學習;Stacking
中圖分類號:TP181? ? ?文獻標識碼:A
Life Prediction of Construction Machinery Core Components
Based on Stacking Model Fusion
LIANG Chao
(School of Information Science and Technology,Zhejiang SCI-TECH University,Hangzhou 310018,China)
Life Prediction of Construction Machinery Core Components
Based on Stacking Model Fusion
LIANG Chao
(School of Information Science and Technology,Zhejiang SCI-TECH University,Hangzhou 310018,China)
1? ?引言(Introduction)
在工業(yè)4.0的環(huán)境下,工程機械設備自動化發(fā)展高速,設備部件在傳統(tǒng)機械行業(yè)運行通信環(huán)境惡劣,為工程機械設備監(jiān)控管理帶來了新的挑戰(zhàn)。設備部件長期運行,零部件壽命減少,可靠性降低將大大影響工程設備使用,甚至威脅人類生命財產(chǎn)安全。那么及時維護更換工程設備核心部件成為設備健康管理的關鍵。壽命預測是工程機械設備安全運行的重要基礎[1]。早期部件壽命研究指的是基于理論物理學和統(tǒng)計學,計算部件壽命,探索其電壓、電流、轉速、工作時長、溫度等數(shù)據(jù)挖掘出指標之間的規(guī)律[2]。統(tǒng)計學模型則選擇合適的壽命分布模型,建立統(tǒng)計學可靠性高的概率性公式研究零部件特征分布,如正態(tài)分布、指數(shù)分布等[3]。物理學壽命預測模型則是根據(jù)零部件運行過程物理感應失效模型,損傷力學,能量等方法對零部件失效類型進行了定義分析,對各類零部件退化機能對應物理模型定義,均偏重理論研究[4,5]。目前已經(jīng)廣泛運用在汽車零部件等制造業(yè)中,但是在工程機械使用過程中,存在著數(shù)據(jù)非線性、不等長、維度多等波動,眾多參數(shù)甚至是傳感器無法及時傳播的,導致理論壽命計算出現(xiàn)較大誤差。
本文運用大數(shù)據(jù)分析機器學習的方法評估零部件運行中晚期健康狀態(tài),數(shù)據(jù)挖掘分析核心部件電動機在相同情況下歷史數(shù)據(jù),探究影響機械核心部件壽命指標關聯(lián)關系,如電流電壓、振動、噪聲、轉速、溫度等,結合機器學習K-means聚類分析、線性回歸算法、隨機森林、LightGBM和XGBoost等方法,構建與壽命相關的高質量特征Stacking集成算法預測模型,可預先知曉設備零部件結果,及時檢測更換,有利于在機械設備使用中期發(fā)現(xiàn)設備零部件異常狀態(tài),增強零部件健康質量把控。
2? 工程機械核心部件壽命預測數(shù)據(jù)處理(Processing of life prediction data for core components of construction machinery)
中期壽命預測是工程設備監(jiān)控管理的重要內(nèi)容,主要針對機械設備運行過程中出現(xiàn)的狀態(tài)把控,防止運行過程中發(fā)生意外[6]。很多設備零部件在未充分使用到設計壽命規(guī)定年限時,就已經(jīng)損耗嚴重需要報廢。如果不能及時發(fā)現(xiàn),將會造成很大的影響,設備不合理使用也將會造成極大的浪費[7]。通常在實際使用環(huán)境中預測存在較大偏差。因為現(xiàn)實采集到的數(shù)據(jù)數(shù)量龐大,復雜多變,基礎數(shù)據(jù)質量差,能都對大量數(shù)據(jù)探索性分析研究,從中挖掘出與壽命相關隱藏的信息非常重要。
針對工程機械設備耗損性部件電動機,獲取到數(shù)據(jù)集包含訓練集和測試集兩部分。訓練集中涵蓋電動機全壽命物聯(lián)網(wǎng)采樣數(shù)據(jù),即從安裝后一直到更換之間的對應數(shù)據(jù),形式為多維時間序列[8]。字段“部件工作時長”的最大值,即為該部件實例的實際壽命。測試集中包含部件一段時間內(nèi)的電動機物聯(lián)網(wǎng)采樣數(shù)據(jù),基于該段數(shù)據(jù),預測電動機此后的剩余壽命。數(shù)據(jù)集中樣本EDA后特征數(shù)據(jù)字段如表1所示。
數(shù)據(jù)標準化(歸一化)處理,將消除指標之間的量綱影響,解決數(shù)據(jù)指標之間的可比性,使各指標處于同一數(shù)量級,適合進行綜合對比評價[9]。采用Min-Max Normalization如公式(1),對數(shù)據(jù)進行歸一化構造量化[0,1]區(qū)間,特征縮放后梯度下降過程會更加筆直,收斂可以得到更快的提升,得到數(shù)據(jù)歸一化處理結果如表2所示。
3 工程機械核心部件壽命預測模型構造(Construction of life prediction model for core components of construction machinery)
3.1? ?K-Means聚類
使用K-Means聚類無須進行模型的訓練,無監(jiān)督學習效率高,處理大數(shù)據(jù)集,算法保持可伸縮性和高效性當簇接近高斯分布時,效果較好[10]。本文利用優(yōu)秀的特征進行聚類,使用最小距離分類器MDC進行測試獲得最佳K均值聚類k值為5,結果得分如表所示。