呂婷婷,王清,柏林元
(陸軍工程大學(xué) 野戰(zhàn)工程學(xué)院,江蘇 南京 210007)
隨著裝備信息化水平的不斷提高,其維修保障和作戰(zhàn)訓(xùn)練的難度也在持續(xù)增加,為保證裝備戰(zhàn)斗力持續(xù)生成,在裝備的使用與維護(hù)中,其健康度的預(yù)測精準(zhǔn)度對于是否能順利完成任務(wù)至關(guān)重要。近年來諸多學(xué)者在健康預(yù)測方面進(jìn)行了深入研究,文獻(xiàn)[1]針對齒輪箱健康狀態(tài)的好壞,提出了相對健康度的評價(jià)模型,將齒輪箱的健康度劃分到0-1的范圍,實(shí)現(xiàn)了齒輪箱健康狀態(tài)的量化評估。文獻(xiàn)[2]針對風(fēng)機(jī)葉片開裂的問題,使用了機(jī)器學(xué)習(xí)的兩種方法對其進(jìn)行健康預(yù)測,為風(fēng)機(jī)葉片的健康狀況的檢測提供了參考標(biāo)準(zhǔn)。文獻(xiàn)[3]使用機(jī)器學(xué)習(xí)中邏輯回歸、支持向量機(jī)和深度神經(jīng)網(wǎng)絡(luò)對哮喘早期預(yù)測均有明顯優(yōu)勢,其預(yù)測的準(zhǔn)確性也大大提高。大部分裝備健康度主要停留在定性分析與評估層面[4],雖然能一定程度上解決裝備健康度等級劃分的問題,但是仍然存在分類標(biāo)準(zhǔn)不統(tǒng)一、評估結(jié)果粗糙、主觀性較大、準(zhǔn)確性較低等問題,對裝備缺乏精細(xì)化管理。針對當(dāng)前裝備健康度預(yù)測現(xiàn)狀,在原有裝備科學(xué)分類的基礎(chǔ)上,結(jié)合裝備結(jié)構(gòu)本身特點(diǎn)及運(yùn)行機(jī)制,以一種定量的方法對裝備健康度進(jìn)行細(xì)化管理,即建立一種可以進(jìn)行連續(xù)值輸出的裝備健康度回歸預(yù)測模型,從而實(shí)現(xiàn)根據(jù)現(xiàn)有裝備健康狀況預(yù)測未來裝備的健康狀態(tài)。
裝備的結(jié)構(gòu)組成復(fù)雜,不同的零部件和子系統(tǒng)都具有不同的健康運(yùn)行狀態(tài),在對裝備進(jìn)行健康度預(yù)測前應(yīng)建立裝備健康度評估指標(biāo)體系,確定其預(yù)測指標(biāo),統(tǒng)一預(yù)測標(biāo)準(zhǔn),方可得到準(zhǔn)確的預(yù)測結(jié)果。影響裝備健康度預(yù)測的因素較多,這些因素從不同角度、不同層次反映了裝備運(yùn)行情況的好壞。在裝備健康度預(yù)測指標(biāo)體系中,指標(biāo)選取的并非越多越好,而是從基于預(yù)測指標(biāo)的代表性出發(fā),即盡量選擇最能反映裝備健康狀態(tài)好壞的典型指標(biāo),剔除相對次要的指標(biāo),并且保證每個(gè)指標(biāo)的可測性、完備性、獨(dú)立性、客觀性、靈敏性及一致性[5]。筆者綜合考慮裝備壽命、使用維修情況、裝備及其子系統(tǒng)健康狀況的特點(diǎn),構(gòu)建了裝備健康度預(yù)測指標(biāo)體系,并將其分為兩大類,分別是裝備總體健康度和裝備子系統(tǒng)健康度,具體指標(biāo)體系如圖1所示。
表1 裝備健康度預(yù)測指標(biāo)體系
在以往的裝備健康狀態(tài)等級劃分中,一般將裝備的綜合健康度分成優(yōu)、良、中、差、故障5個(gè)類別,為區(qū)分同一健康等級下裝備的具體健康度,采取更加精細(xì)化的連續(xù)分值表示。基于此,建立裝備健康度回歸預(yù)測模型,將簡單的裝備健康度的分類分級評估轉(zhuǎn)為實(shí)數(shù)回歸,結(jié)合客觀評估規(guī)則和專家評判法最終確定裝備健康度[6],以0~100分值表示,具體劃分范圍如表2所示。
表2 裝備健康狀態(tài)劃分范圍
機(jī)器學(xué)習(xí)回歸算法是一種有監(jiān)督的算法,用來構(gòu)建自變量和應(yīng)變量之間的關(guān)系,從而實(shí)現(xiàn)對數(shù)據(jù)的連續(xù)預(yù)測。常用的回歸算法有線性回歸(LR)[7]、K近鄰分類算法(KNN)[8]、支持向量機(jī)(SVM)[9]、決策樹(DT)[8]、隨機(jī)森林(RF)[8, 10]、梯度提升決策樹(GBDT)[11]、Adaboost算法[12]、Bagging算法[13]和極端隨機(jī)樹(ET)[14]等。由于各類算法在同一應(yīng)用場景下效果不一,為論證機(jī)器學(xué)習(xí)回歸算法在本問題研究中的實(shí)際運(yùn)用情況,筆者基于以上典型回歸算法構(gòu)建裝備健康度預(yù)測模型。
根據(jù)前文分析,裝備健康度中子指標(biāo)機(jī)器健康度的計(jì)算方法基本一致,因此可采集不同種類裝備的健康運(yùn)行數(shù)據(jù)構(gòu)建數(shù)據(jù)集,將其作為原始數(shù)據(jù)集用于后續(xù)回歸預(yù)測,以提高模型準(zhǔn)確性。
裝備健康度預(yù)測是對裝備的綜合健康度進(jìn)行預(yù)測,筆者所建立的基于回歸算法的裝備健康度預(yù)測模型具體步驟如下:
1)根據(jù)裝備健康度評估指標(biāo)體系進(jìn)行裝備的健康狀態(tài)監(jiān)測,從而獲取健康數(shù)據(jù),得到數(shù)據(jù)集樣本特征值。
2)使用表2中的客觀評估規(guī)則和基于主觀描述的專家打分,對裝備健康度進(jìn)行實(shí)數(shù)打分,得到數(shù)據(jù)集樣本標(biāo)簽。
2018年度第五屆法國INNODESIGN PRIZE國際創(chuàng)新設(shè)計(jì)大獎(jiǎng)?lì)C獎(jiǎng)典禮于11月7日在法國梅斯隆重舉行。活動得到了法國梅斯市政廳、法國創(chuàng)意與設(shè)計(jì)專業(yè)委員會及中國駐斯特拉斯堡總領(lǐng)館的大力支持。今年大獎(jiǎng)注重設(shè)計(jì)與生態(tài)、科技、環(huán)保、商業(yè)相結(jié)合,堅(jiān)持多元與融合的審核標(biāo)準(zhǔn)下,法國INNODESIGN PRIZE國際創(chuàng)新設(shè)計(jì)大獎(jiǎng)專業(yè)評審團(tuán)共收到各國參賽設(shè)計(jì)作品1607套,其中中方(含港澳臺地區(qū))設(shè)計(jì)師成果豐碩,獲得提名作品162套,在平面設(shè)計(jì)、產(chǎn)品設(shè)計(jì)、空間設(shè)計(jì)類等方面獲獎(jiǎng)作品36套。
3)對劃分后的健康度數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗,得到數(shù)據(jù)集T。
4)將數(shù)據(jù)集T劃分為訓(xùn)練集D和測試集S,并且D、S中各健康等級的樣本比例保持基本一致。
5)基于機(jī)器學(xué)習(xí)中的典型回歸算法構(gòu)建裝備健康度回歸預(yù)測模型,使用訓(xùn)練集訓(xùn)練模型(使用交叉驗(yàn)證)并用測試集預(yù)測。
6)重復(fù)步驟4和5共100次,得到預(yù)測結(jié)果,取平均值。
7)將預(yù)測結(jié)果與真實(shí)專家評分結(jié)果進(jìn)行對比分析,驗(yàn)證裝備健康度預(yù)測方法的有效性。
基于回歸算法的裝備健康度預(yù)測模型如圖1所示。
為驗(yàn)證模型效果,選取3 285臺裝備健康度作為數(shù)據(jù)集樣本,其裝備健康度評估類別分布如圖2所示。
根據(jù)裝備健康度預(yù)測指標(biāo)體系得到裝備健康狀態(tài)的各項(xiàng)指標(biāo)值,以及使用客觀評估規(guī)則結(jié)合專家打分法得到裝備健康度的實(shí)數(shù)評分,如表3所示。
表3 裝備健康度評估采集部分?jǐn)?shù)據(jù)示例表
由于各類不確定因素影響,實(shí)驗(yàn)結(jié)果不可避免存在預(yù)測誤差,預(yù)測誤差是指預(yù)測值與實(shí)際值之間的差距。常用的評價(jià)標(biāo)準(zhǔn)如以下所示:
1)平均平方誤差,就是對誤差的平方和取平均值,可表示為
(1)
式中:n為樣本量;yt為實(shí)際值;ytp為預(yù)測值。
2)平均絕對誤差,可表示為
(2)
3)均方根誤差,可表示為
(3)
4)模型解釋度R2,可表示為
(4)
MSE值越大,證明真實(shí)值與模型預(yù)測值差值越大,誤差越大;從MAE表達(dá)式中絕對值可以看出,其損失函數(shù)有不可導(dǎo)點(diǎn),因此,其目標(biāo)函數(shù)不能被優(yōu)化,不利于模型的評估,并且該指標(biāo)對離群點(diǎn)以及噪點(diǎn)都不敏感;RMSE表示模型誤差的標(biāo)準(zhǔn)差,其值越小則模型的性能越好;R2表示的是評估模型的擬合優(yōu)度,反應(yīng)回歸算法中自變量對因變量波動的可解釋程度,該值在0~1之間,其評估參數(shù)值越接近1,模型的回歸效果越好,可解釋性就越強(qiáng)。
為驗(yàn)證所建模型的有效性,將機(jī)器學(xué)習(xí)中常用的Adaboost、Bagging、ExtraTree、DT、GBDT、KNN、LR、RF、SVM共9種回歸算法代入到模型中進(jìn)行實(shí)驗(yàn)。
數(shù)據(jù)集按照7∶3劃分訓(xùn)練集和測試集,采集交叉驗(yàn)證的方法,并且保證每份中各類類別所占比例一樣,為避免結(jié)果隨機(jī)性的影響,將各算法對應(yīng)的回歸模型均運(yùn)行100次,評估指標(biāo)采用前述MSE、RMSE、R2來進(jìn)行評估,并獲取其最大值、最小值和均值,分析結(jié)果如表4所示。
表4 回歸預(yù)測模型的評估指標(biāo)
3.3.1 模型有效性分析
從表4中的R2指標(biāo)可以看出,模型對數(shù)據(jù)的擬合優(yōu)度可達(dá)到0.98以上,即使擬合效果最差的KNN算法也達(dá)到0.86以上,說明基于機(jī)器學(xué)習(xí)回歸算法所構(gòu)建的裝備健康度預(yù)測模型能較好的擬合專家評分結(jié)果,可有效拓展到實(shí)際運(yùn)用中。
3.3.2 模型算法優(yōu)選策略分析
根據(jù)最優(yōu)化理論中的“沒有免費(fèi)的午餐”定理,機(jī)器學(xué)習(xí)在不同應(yīng)用場景或特征下各回歸算法優(yōu)劣性不一,針對筆者提出的裝備健康度預(yù)測評估指標(biāo)體系,表4展示了筆者選用的9種常見回歸算法實(shí)驗(yàn)結(jié)果優(yōu)劣。
Bagging、RF、GBDT和DT算法都是集成算法,綜合考量了多個(gè)分類器的預(yù)測效果,泛化能力較強(qiáng),表現(xiàn)總體較好;Adaboost的弱學(xué)習(xí)器數(shù)目難以確定,相比其他集成辦法,其預(yù)測精度下降;SVM、LR、KNN容易被異常值所影響,而采取專家打分法的裝備健康度標(biāo)簽具有一定的人為影響,難以完全避免異常值出現(xiàn),因此效果不太理想。綜上所述,Bagging算法的實(shí)驗(yàn)結(jié)果最理想,其次是RF、GBDT和DT,因此在后續(xù)裝備健康度預(yù)測研究中,若采取與本文類似的裝備健康度預(yù)測指標(biāo)體系,可優(yōu)選以上4種算法構(gòu)建回歸預(yù)測模型。
3.3.3 結(jié)果可視化
為進(jìn)一步驗(yàn)證算法的性能,取測試集中的前100項(xiàng)數(shù)據(jù)樣本,對Bagging、RF、GBDT和DT這4種算法構(gòu)建模型的預(yù)測結(jié)果與真實(shí)值進(jìn)行繪圖對比,結(jié)果如圖3所示。
由圖3可知,Bagging、RF、GBDT和DT這4種算法對裝備健康度的擬合效果較好,未出現(xiàn)明顯的過擬合與欠擬合現(xiàn)象,進(jìn)一步說明了其對應(yīng)的模型具備較高的實(shí)用價(jià)值。
為克服傳統(tǒng)裝備健康度評估粗糙的缺陷,筆者以通用裝備為研究對象,針對裝備的健康度預(yù)測,結(jié)合裝備的結(jié)構(gòu)特點(diǎn)和運(yùn)行機(jī)制,提出了裝備健康度預(yù)測指標(biāo)體系,構(gòu)建了基于常見機(jī)器學(xué)習(xí)回歸算法的裝備健康度預(yù)測模型,通過實(shí)驗(yàn)數(shù)據(jù)驗(yàn)證了所建模型的有效性,并經(jīng)過數(shù)據(jù)分析給出了模型對選用算法的優(yōu)選策略,提高了未來裝備健康度預(yù)測效率,為裝備健康度科學(xué)預(yù)測和裝備的視情維修提供了依據(jù),同時(shí)也在任務(wù)裝備優(yōu)選及平時(shí)裝備優(yōu)化保障方面具備一定參考價(jià)值。