洪忠鋮
摘 要:大型工程機(jī)械設(shè)備的核心部件故障通常會(huì)造成計(jì)劃位停機(jī),致使整個(gè)生產(chǎn)現(xiàn)場其他配套設(shè)施等待發(fā)生故障的核心部件的修復(fù),從而導(dǎo)致很大的經(jīng)濟(jì)損失。對(duì)核心部件進(jìn)行壽命預(yù)測(cè)可以提前安排相關(guān)部件的停機(jī)計(jì)劃和維護(hù),可以很大程度上減少整個(gè)設(shè)備的非計(jì)劃停機(jī)時(shí)間,極大地減少停機(jī)帶來的經(jīng)濟(jì)損失。有鑒于此,文中借助梯度提升決策樹對(duì)某類工程機(jī)械設(shè)備的核心損耗部件進(jìn)行建模,實(shí)現(xiàn)了工程機(jī)械核心部件的剩余壽命預(yù)測(cè),有助于實(shí)現(xiàn)預(yù)測(cè)性維護(hù),從而減低大型機(jī)械設(shè)備的維護(hù)成本。
關(guān)鍵詞:機(jī)器學(xué)習(xí);工程機(jī)械;壽命預(yù)測(cè);梯度提升決策樹;物聯(lián)網(wǎng);非計(jì)劃停機(jī)
中圖分類號(hào):TP391.73文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):2095-1302(2020)01-0-04
0 引 言
隨著生產(chǎn)技術(shù)的快速發(fā)展和人類社會(huì)分工的進(jìn)一步細(xì)化,在許多領(lǐng)域出現(xiàn)了復(fù)雜的大型工程機(jī)械設(shè)備及其配套設(shè)施[1-2]。這些大型工程設(shè)備極大地提升了人類生產(chǎn)活動(dòng)的效率。圖1所示為由我國中鐵科工集團(tuán)機(jī)械院自主研制的高鐵施工裝備—40 m跨1 000 t運(yùn)輸與架設(shè)成套設(shè)備,其已成功架設(shè)了100榀千噸級(jí)高鐵箱梁,可以極大的提升高速鐵路建設(shè)的速度和降低建設(shè)成本。然而,隨之而來的是大型機(jī)械工程設(shè)備由于自身結(jié)構(gòu)復(fù)雜、外部因素影響大、配套設(shè)施繁多等,容易造成大型機(jī)械設(shè)備的一些損耗性的核心部件的性能及健康狀態(tài)產(chǎn)生衰退或甚至出現(xiàn)故障和完全報(bào)廢[3]。由于大型機(jī)械工程設(shè)備在生產(chǎn)過程中通常起著關(guān)鍵作用,只要核心部件發(fā)生了計(jì)劃外的故障或報(bào)廢,就很容易給整個(gè)設(shè)備帶來嚴(yán)重后果,給生產(chǎn)活動(dòng)帶來巨大的經(jīng)濟(jì)損失。同時(shí),由于大型機(jī)械故障本身的復(fù)雜結(jié)構(gòu)和受到的外部影響及配套設(shè)施的繁多,其故障表現(xiàn)形式呈現(xiàn)多樣化、故障發(fā)生機(jī)理呈現(xiàn)復(fù)雜化。特別是核心部件的損耗導(dǎo)致的壽命變化,目前尚無合適的模型來刻畫其演變機(jī)理。因此,如何保障大型工程機(jī)械設(shè)備在實(shí)際生產(chǎn)環(huán)境下的安全、穩(wěn)定、可靠、經(jīng)濟(jì)的運(yùn)行成為了當(dāng)前的熱點(diǎn)研究問題。對(duì)于大型工程機(jī)械設(shè)備而言,科學(xué)評(píng)估好損耗性的核心部件的壽命,并以此安排好生產(chǎn)和維護(hù)計(jì)劃,可以極大的減少計(jì)劃外停機(jī)造成的生產(chǎn)事故和經(jīng)濟(jì)損失。因此,通過物聯(lián)網(wǎng)技術(shù)來收集大型機(jī)械設(shè)備的損耗性的核心部件的全生命周期的運(yùn)行數(shù)據(jù),借助機(jī)器學(xué)習(xí)和大數(shù)據(jù)分析技術(shù),建立科學(xué)合理的模型預(yù)測(cè)出核心部件的壽命,對(duì)大型機(jī)械設(shè)備的運(yùn)行和維護(hù)有著非常重要的意義。
1 相關(guān)研究工作
現(xiàn)有的機(jī)械部件的壽命預(yù)測(cè)研究主要分為基于物理模型的預(yù)測(cè)方法和基于數(shù)據(jù)驅(qū)動(dòng)的壽命預(yù)測(cè)方法等。基于物理模型的剩余壽命預(yù)測(cè)方法起步比較早。隨著對(duì)機(jī)械部件的物理模型的壽命實(shí)驗(yàn)和失效退化機(jī)制研究的不斷深入,一些具有較大研究價(jià)值的常用核心部件的物理模型及其失效退化機(jī)制的研究已經(jīng)較為成熟,并獲得了精度很高的預(yù)測(cè)結(jié)果。然而,在實(shí)際工程應(yīng)用中,建立起種類眾多的核心部件的物理模型及其失效機(jī)制模型難度非常高而且費(fèi)時(shí)費(fèi)力,因此基于物理模型的只適用于一些使用普遍、對(duì)壽命預(yù)測(cè)精度要求非常高的少量關(guān)鍵的核心部件的壽命預(yù)測(cè)。在基于物理模型的剩余壽命研究方面,針對(duì)材料的低周疲勞壽命問題,商體松等人在基于三參數(shù)冪函數(shù)公式對(duì)比分析的基礎(chǔ)上,分析了引起材料疲勞損傷的原因,建立了一種能夠直觀反應(yīng)設(shè)備的損傷能量密度跟疲勞壽命之間的關(guān)聯(lián)關(guān)系的剩余壽命預(yù)測(cè)模型[4]。范磊等人則針對(duì)行星架的剩余壽命預(yù)測(cè)問題,提出了一種以裂紋長度為指標(biāo)的剩余壽命預(yù)測(cè)方法[5]。謝吉偉等人則針對(duì)產(chǎn)品的衰退模式的動(dòng)態(tài)轉(zhuǎn)移現(xiàn)象,在IMM算法的基礎(chǔ)上提出了一種新的剩余壽命預(yù)測(cè)模型[6]。這些方法都是在分析設(shè)備本身的性能衰退等的機(jī)理的基礎(chǔ)上建立的剩余壽命預(yù)測(cè)模型,需要對(duì)設(shè)備的物理模型、性能衰退機(jī)制等非常熟悉。
基于數(shù)據(jù)驅(qū)動(dòng)的剩余壽命預(yù)測(cè)方法是借助物聯(lián)網(wǎng)技術(shù)大量收集核心部件整個(gè)全生命周期內(nèi)的運(yùn)行工況數(shù)據(jù),以機(jī)器學(xué)習(xí)和大數(shù)據(jù)分析技術(shù)來在大量數(shù)據(jù)的基礎(chǔ)上建立核心部件的壽命預(yù)測(cè)模型,并根據(jù)要預(yù)測(cè)的核心部件現(xiàn)有的運(yùn)行工況數(shù)據(jù),預(yù)測(cè)其剩余壽命?;跀?shù)據(jù)驅(qū)動(dòng)的方法主要難點(diǎn)在于需要大量的核心部件全生命周期的運(yùn)行工況數(shù)據(jù)作為訓(xùn)練集來構(gòu)建模型。隨著物聯(lián)網(wǎng)技術(shù)和云計(jì)算技術(shù)的快速發(fā)展和普及,核心部件的歷史運(yùn)行工況數(shù)據(jù)的采集與收集已經(jīng)變得越來越容易,使得數(shù)據(jù)驅(qū)動(dòng)的剩余壽命預(yù)測(cè)方法越來越成為研究的主流。在基于數(shù)據(jù)驅(qū)動(dòng)的剩余壽命研究方面,蔡忠義等人在發(fā)現(xiàn)性能退化過程服從Wiener過程,在此基礎(chǔ)上提出了基于貝葉斯估計(jì)的融合線上線下產(chǎn)品失效數(shù)據(jù)的壽命預(yù)測(cè)方法[7]。胡姚剛等人則針對(duì)電軸承構(gòu)建溫度特征量的性能退化模型,提出一種基于溫度特征量的風(fēng)電軸承性能退化建模及其實(shí)時(shí)剩余壽命預(yù)測(cè)方法[8]。這些方法都是在對(duì)設(shè)備運(yùn)行工況數(shù)據(jù)的分布規(guī)律進(jìn)行分析的基礎(chǔ)上,利用了機(jī)器學(xué)習(xí)方法來建立剩余壽命預(yù)測(cè)模型。
大型工程機(jī)械的核心部件壽命預(yù)測(cè)問題本質(zhì)上是一個(gè)典型的回歸預(yù)測(cè)問題,因此可以采用目前主流的回歸預(yù)測(cè)算法,如線性回歸、隨機(jī)森林[9]、樸素貝葉斯[10]、梯度提升決策樹等算法。其中,嶺回歸和邏輯回歸算法運(yùn)算速度快,但在泛化能力和魯棒性等方面不如隨機(jī)深林和梯度提升決策樹等算法。隨機(jī)深林對(duì)噪聲數(shù)據(jù)不敏感、泛化能力和魯棒性都很強(qiáng),但參數(shù)設(shè)置不當(dāng)很容易出現(xiàn)過擬合的問題。而梯度提升決策樹算法在模型的魯棒性、泛化能力、運(yùn)算速度、抗干擾能力以及對(duì)枚舉型參量的支持能力等方面都表現(xiàn)優(yōu)異,因此綜合考慮核心部件壽命預(yù)測(cè)問題的需求,本文采用梯度提升決策樹算法作為構(gòu)建預(yù)測(cè)模型使用的回歸算法。
2 任務(wù)描述
2.1 數(shù)據(jù)格式
為了實(shí)現(xiàn)對(duì)某工程機(jī)械設(shè)備的核心部件進(jìn)行剩余壽命預(yù)測(cè),需要采集一批該類設(shè)備的歷史全生命周期的運(yùn)行數(shù)據(jù),包括該部件的工作時(shí)長、溫度、轉(zhuǎn)速、電流、電壓等多類工況數(shù)據(jù),其數(shù)據(jù)表的結(jié)構(gòu)見表1所列。
由于大型工程機(jī)械設(shè)備的損耗性的核心部件的運(yùn)行數(shù)據(jù)涉及到整個(gè)工程機(jī)械運(yùn)行的安全以及商業(yè)機(jī)密,因此在本文中使用的設(shè)備類型、工況數(shù)據(jù)等的具體值都是經(jīng)過一定脫敏處理后的數(shù)據(jù)。在脫敏過程中已考慮了盡量不影響數(shù)據(jù)之間蘊(yùn)含的關(guān)系。數(shù)據(jù)集共采集了916個(gè)核心部件的全生命周期的運(yùn)行工況數(shù)據(jù)共計(jì)約2 600萬條。
2.2 任務(wù)描述
基于表1中916個(gè)核心部件的約2 600萬條全生命周期的運(yùn)行工況數(shù)據(jù),通過數(shù)據(jù)分析,建立一個(gè)機(jī)器學(xué)習(xí)模型,獲取對(duì)于給定的一批損耗性的核心部件的歷史運(yùn)行過程中的工況數(shù)據(jù),預(yù)測(cè)每個(gè)核心部件的剩余壽命,即通過每個(gè)給定的損耗性的核心部件的歷史運(yùn)行過程的工況數(shù)據(jù)預(yù)測(cè)表2所列的數(shù)據(jù)。
3 基于梯度提升決策樹的剩余壽命預(yù)測(cè)模型
3.1 整體框架
本文提出的基于梯度提升決策樹(Gradient Boosting Decision Tree,GBDT)的整體框架如圖2所示。首先,對(duì)利用物聯(lián)網(wǎng)技術(shù)采集的核心部件的全生命周期的運(yùn)行數(shù)據(jù)進(jìn)行初步的預(yù)處理,修訂缺失值或異常值等;隨后,根據(jù)要預(yù)測(cè)的任務(wù),通過設(shè)定不同的設(shè)備運(yùn)行時(shí)間和剩余壽命的標(biāo)簽值來將訓(xùn)練集的數(shù)據(jù)擴(kuò)充4倍,實(shí)現(xiàn)數(shù)據(jù)增強(qiáng)。其次,對(duì)核心設(shè)備歷史運(yùn)行過程中的工況數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析,提取刻畫核心設(shè)備歷史運(yùn)行狀態(tài)和運(yùn)行過程的特征。然后再進(jìn)行數(shù)據(jù)集劃分、構(gòu)建GBDT模型和進(jìn)行模型評(píng)估。
3.2 數(shù)據(jù)預(yù)處理與數(shù)據(jù)增強(qiáng)
實(shí)際生產(chǎn)過程中采集的數(shù)據(jù)通常都有不同程度的數(shù)據(jù)質(zhì)量問題,包括數(shù)據(jù)缺失、數(shù)據(jù)異常等,因此需要先對(duì)這些數(shù)據(jù)進(jìn)行預(yù)處理。此外,由于采集大型機(jī)械設(shè)備的損耗性的核心部件的全生命周期的運(yùn)行數(shù)據(jù)需要長時(shí)間的積累,導(dǎo)致所能收集到的樣本的數(shù)量非常少,因此必須根據(jù)數(shù)據(jù)和問題的特點(diǎn)來使用合理的數(shù)據(jù)增強(qiáng)方式,擴(kuò)充數(shù)據(jù)集的大小。在數(shù)據(jù)預(yù)處理方面,主要是針對(duì)該列數(shù)據(jù)的含義,將缺失值填充為0、均值、中值、前一個(gè)有效值等??紤]到核心部件的壽命預(yù)測(cè)是一個(gè)回歸問題,因此采用了將訓(xùn)練集的全生命周期數(shù)據(jù)截取不同比例來產(chǎn)生不同的樣本:比如分別截取前面25%,50%,75%和100%的運(yùn)行數(shù)據(jù)分別作為不同的樣本。這些樣本的剩余壽命(標(biāo)簽)都會(huì)存在差異,從而形成有效的新樣本。采用截取方式進(jìn)行數(shù)據(jù)增強(qiáng)的方式如圖3所示。
3.3 特征工程
給定的損耗性的核心設(shè)備的運(yùn)行數(shù)據(jù)是借助物聯(lián)網(wǎng)技術(shù)采集的每個(gè)時(shí)刻的運(yùn)行工況數(shù)據(jù),無法直接用于刻畫該設(shè)備的歷史運(yùn)行狀況和磨損等的整體情況,因此需要借助統(tǒng)計(jì)分析來提取有效的數(shù)值化的統(tǒng)計(jì)特征作為機(jī)器學(xué)習(xí)模型的輸入數(shù)據(jù)。通過分析可能對(duì)核心部件的剩余壽命產(chǎn)生影響的因素,這里提取了表3所列的特征來構(gòu)建GBDT模型。
表3中,“xxx”為核心部件的運(yùn)行工況數(shù)據(jù)中的工作時(shí)長、累積量參數(shù)、轉(zhuǎn)速、壓力、溫度、流量等,即對(duì)這些工況數(shù)據(jù)中的每一種都提取其最大值、最小值、中值、均方差和標(biāo)準(zhǔn)差等統(tǒng)計(jì)特征。
3.4 梯度提升決策樹模型
通過上述的數(shù)據(jù)預(yù)處理、數(shù)據(jù)增強(qiáng)和特征工程,提取出損耗性的核心部件歷史運(yùn)行過程中的工況信息的統(tǒng)計(jì)特征。將核心部件的某個(gè)時(shí)刻的數(shù)據(jù)轉(zhuǎn)化為對(duì)該部件的整個(gè)歷史運(yùn)行過程進(jìn)行刻畫的數(shù)值化特征信息,從而只需借助現(xiàn)有的機(jī)器學(xué)習(xí)回歸算法如梯度提升決策樹即可利用標(biāo)注好的訓(xùn)練集數(shù)據(jù)進(jìn)行訓(xùn)練,構(gòu)建出預(yù)測(cè)模型??紤]到現(xiàn)有的梯度提升決策樹模型的不同實(shí)現(xiàn)之間的易用性、性能等,本文采用微軟開源的LightGBM[11]作為梯度提升決策樹模型的算法實(shí)現(xiàn),基于上述特征工程部分提取的特征來構(gòu)建預(yù)測(cè)模型。
4 實(shí)驗(yàn)評(píng)估
4.1 評(píng)測(cè)方案
為驗(yàn)證所提出的基于梯度提升決策樹的核心部件的壽命預(yù)測(cè)模型的性能,本文使用了某公司提供的某類機(jī)械設(shè)備的損耗性的核心部件的全生命周期的實(shí)際運(yùn)行工況數(shù)據(jù)共計(jì)約2 600萬條,涉及核心部件約900個(gè),該數(shù)據(jù)的分布情況見表4所列。
從表4中可以看出,work_time字段表示的是工作時(shí)長,應(yīng)該都是大于或等于0的數(shù)值,但在實(shí)際環(huán)境中由于各種原因?qū)е铝藬?shù)據(jù)錯(cuò)誤或異常,出現(xiàn)了負(fù)數(shù),因此必須要進(jìn)行數(shù)據(jù)預(yù)處理。
4.2 評(píng)價(jià)指標(biāo)
為了了解所建立的機(jī)器學(xué)習(xí)模型的性能指標(biāo),考慮到大型工程機(jī)械的損耗性的核心部件的壽命預(yù)測(cè)問題的特點(diǎn),采用如下的評(píng)價(jià)指標(biāo)作為模型的評(píng)價(jià)函數(shù):
式中:ri表示第i個(gè)樣本的真實(shí)剩余壽命;表示第i個(gè)樣本的剩余壽命的預(yù)測(cè)值。
4.3 評(píng)測(cè)結(jié)果及分析
為檢驗(yàn)所建立的核心部件的預(yù)測(cè)模型的效果,對(duì)數(shù)據(jù)增強(qiáng)后獲得的4 580個(gè)樣本分別按10%,20%和30%的比例劃歸為測(cè)試樣本,另外部分的90%,80%和70%作為訓(xùn)練樣本,分別構(gòu)建隨機(jī)森林和GBDT模型進(jìn)行了對(duì)別測(cè)試,其評(píng)測(cè)得分結(jié)果見表5所列。
由表5可見,基于梯度提升決策樹構(gòu)建的機(jī)器學(xué)習(xí)模型在大型機(jī)械工程設(shè)備的損耗性的核心部件的剩余壽命預(yù)測(cè)中獲得了較好的效果。
5 結(jié) 語
大型工程機(jī)械的損耗性的核心部件的剩余壽命預(yù)測(cè)是對(duì)機(jī)械設(shè)備進(jìn)行預(yù)測(cè)性維護(hù)的基礎(chǔ),可極大的減低大型工程機(jī)械設(shè)備的計(jì)劃外停機(jī)時(shí)間和次數(shù)、減低維護(hù)成本。本文提出了基于梯度提升決策樹的大型機(jī)械設(shè)備的損耗性的核心部件的預(yù)測(cè)模型,采用按設(shè)備使用時(shí)長進(jìn)行截?cái)鄟頂U(kuò)展數(shù)據(jù)的數(shù)據(jù)增強(qiáng)方法和基于統(tǒng)計(jì)分析提取特征的特征工程技術(shù),基于梯度提升決策樹來構(gòu)建機(jī)器學(xué)習(xí)模型,實(shí)現(xiàn)了對(duì)核心設(shè)備的剩余壽命預(yù)測(cè),取得了較好的效果。
參 考 文 獻(xiàn)
[1]馬建,孫守增,芮海田,等.中國筑路機(jī)械學(xué)術(shù)研究綜述·2018[J].中國公路學(xué)報(bào),2018,31(6):1-164.
[2]楊青.我國工程機(jī)械行業(yè)發(fā)展的機(jī)遇與挑戰(zhàn)[J].科技風(fēng),2018(29):220.
[3]徐寧.公路工程機(jī)械發(fā)動(dòng)機(jī)的主要零件耗損及維護(hù)[J].交通世界,2019(9):112-113.
[4]商體松,趙明,陳養(yǎng)惠.基于三參數(shù)冪函數(shù)的低周疲勞壽命預(yù)測(cè)方法研究[J].推進(jìn)技術(shù),2015,36(6):907-911.
[5]范磊,王少萍,張超,等.直升機(jī)行星架疲勞裂紋擴(kuò)展壽命預(yù)測(cè)[J].北京航空航天大學(xué)學(xué)報(bào),2016,42(9):1927-1935.
[6]謝吉偉,劉君強(qiáng),王小磊.應(yīng)用交互式多模型算法的設(shè)備剩余壽命預(yù)測(cè)[J].空軍工程大學(xué)學(xué)報(bào)(自然科學(xué)版),2016,17(2):98-102.
[7]蔡忠義,陳云翔,李韶亮,等.考慮隨機(jī)退化和信息融合的剩余壽命預(yù)測(cè)方法[J].上海交通大學(xué)學(xué)報(bào),2016,50(11):1778-1783.
[8]胡姚剛,李輝,廖興林,等.風(fēng)電軸承性能退化建模及其實(shí)時(shí)剩余壽命預(yù)測(cè)[J].中國電機(jī)工程學(xué)報(bào),2016,36(6):1643-1649.
[9] LING Gan,F(xiàn)U Chen. Human action recognition using apj3d and random forests [J]. Journal of software,2013,8(9):188-198.
[10] FLASH Peter A,LACHICHE Nicolas. Naive bayesian classification of structured data. [J]. Mach learn,2004,57(3):233-269.