王莉靜,趙海盟,戴遠東,樂亮
(天津城建大學控制與機械工程學院,天津 300384)
施工升降機是建筑行業(yè)中通用的載人、載貨施工機械,主要應用于城市高層、超高層建筑施工現(xiàn)場[1]。隨著我國高層、超高層建筑施工作業(yè)的持續(xù)增加,每年由升降機引起的安全生產(chǎn)事故也呈上升趨勢[2]。為進一步提高施工升降機的作業(yè)安全性,國內(nèi)外學者在施工設備可靠性分析[3]方面進行了大量研究。Moller和Beer運用模糊集合理論,即根據(jù)模糊數(shù)學的隸屬度理論把定性評價轉(zhuǎn)化為定量評價,實現(xiàn)了可靠性的定量化評價[4];沈建榮[5]通過分析影響施工升降機的運行質(zhì)量的因素,提出了一種改善運行質(zhì)量的措施來提高可靠性;鄧錚強等[6]建立了一套安全管理綜合評價指標體系,利用改進的BP神經(jīng)網(wǎng)絡進行評價預測;程躍等[7]提出了一種基于支持向量機的非概率可靠性分析方法;翟勝等[8]提出了一種基于貝葉斯網(wǎng)絡的多態(tài)系統(tǒng)可靠性分析方法,利用貝葉斯網(wǎng)絡的多態(tài)變量節(jié)點來描述故障模式的多態(tài)性。這些可靠性分析方法雖然在其研究領域取得了有較好的應用,但由于施工升降機的設備劣化程度受運行工況、作業(yè)環(huán)境和人為操作規(guī)范性等多種主客觀因素的共同制約,僅通過單一類型算法模型進行可靠性分析,其準確度較低。
因此,在2020年1月開始實施的《施工升降機安全監(jiān)控系統(tǒng)》的國家標準規(guī)定下[9],通過采集、分析施工升降機“人-機-管理”多因素的融合數(shù)據(jù),提出了一種基于隨機森林(random forest,RF)算法及集成學習(ensemble learning,EL)融合的施工升降機可靠性分析模型,并進行相關實例分析,驗證其準確性和適用性。
施工升降機的作業(yè)環(huán)境一般較惡劣,其運行是否可靠直接影響著施工人員的生命安全和建筑效率[10]。因此,基于專家調(diào)查法,綜合分析人-機-管理3個方面因素,選取28個指標建立施工升降機可靠性指標體系,如圖1所示。
圖1 施工升降機可靠性指標體系Fig.1 Construction lift reliability index system
施工升降機的可靠性等級引用梯形隸屬函數(shù)[11]進行描述,梯形隸屬函數(shù)可由4個參數(shù)確定,分別為a1、a2、a3、a4。設 模 糊 集 為Y=(a1,a2,a3,a4),且a1≤a2≤a3≤a4,則梯形隸屬函數(shù)表示為
根據(jù)5名資深施工升降機專家的經(jīng)驗,將施工升降機的可靠性評價等級劃分為5個級別,則可靠性評價等級與對應的模糊系數(shù)關系見表1。
表1 可靠性等級與模糊系數(shù)Tab.1 Reliability grade and fuzzy coefficient
通過與某工程施工單位合作,采集了SCD200型號施工升降機在2020年10月—2021年10月期間的200組歷史數(shù)據(jù)樣本,每組樣本中包含28個可靠性相關因素。首先利用RF算法對28個可靠性分析指標進行特征重要度計算,約減不重要因素,再利用基于EL的可靠性模型進行分析。
為避免“維數(shù)災難”,首先利用RF算法對28個指標進行預處理,對訓練樣本按照隨機有放回的方式進行抽取,并生成新子集進行迭代;再按照3∶5的比例對樣本劃分,將袋外數(shù)據(jù)作為測試集,并計算各指標重要度;最后利用平均準確率下降(mean decrease accuracy,MDA)法對每個指標的重要度進行排序,以達到降維的目的。設定參數(shù)決策樹個數(shù)M為200,特征屬性為log2(M+1),決策樹的迭代過程如圖2所示,不難發(fā)現(xiàn)出袋錯誤量在決策樹數(shù)量為35后趨于穩(wěn)定,此時可決系數(shù)R2為0.88,如圖3所示。
圖2 決策樹迭代過程Fig.2 Decision tree iterative process
圖3 擬合優(yōu)度散點圖Fig.3 Goodness of fit scatter diagram
其次,利用袋外數(shù)據(jù)對28個可靠性分析指標進行重要度計算,屬性重要度結(jié)果如圖4所示,其中各個指標的重要度值見表2。
圖4 指標重要度分析Fig.4 Index importance analysis
表2 重要度系數(shù)表Tab.2 Importance coefficient table
根據(jù)各指標重要度系數(shù)排序,選取V19、V14、V26、V10、V9、V15、V25、V13共8個可靠性因素,故將此8個相關因素作為EL算法進行可靠性模型的輸入數(shù)據(jù),約減其余重要度低的相關因素。
最后,將篩選的8個因素數(shù)值乘以對應重要度系數(shù),組成新的樣本,并設定參數(shù)決策樹個數(shù)為200,特征屬性為log2(M+1),則新樣本的決策樹的迭代過程如圖5所示,出袋錯誤量在決策樹數(shù)量為12后趨于穩(wěn)定,此時R2為0.94,相比較舊樣本的R2有所提升,如圖6所示,說明經(jīng)過篩選后的新樣本擬合優(yōu)度更好,準確率更高。
圖5 新樣本決策樹迭代過程Fig.5 New sample decision tree iteration process
圖6 新樣本擬合度散點圖Fig.6 Scatter plot of new sample fit degree
根據(jù)RF算法得出的重要度分析結(jié)果,得到8個可靠性相關因素。在200組歷史樣本數(shù)據(jù)中隨機選取120組數(shù)據(jù)作為訓練樣本,完成遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡(genetic algorithm-back propagation neural network,GA-BP)、粒子群算法優(yōu)化支持向量機(particle swarm optimization-support vector machine,PSO-SVM)以及樸素貝葉斯(Bayesian network,BN)基學習器的訓練數(shù)據(jù),其余80組數(shù)據(jù)作為測試樣本完成對算法模型的檢測,數(shù)據(jù)分布如圖7所示。
圖7 樣本數(shù)據(jù)分布圖Fig.7 Sample data distribution diagram
GA-BP神經(jīng)網(wǎng)絡:引用遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡,將8個可靠性相關因素作為訓練樣本數(shù)據(jù)歸一化后輸入網(wǎng)絡,可靠性等級作為輸出,根據(jù)文獻[12]設定GA算法相關參數(shù)。利用GA算法優(yōu)化后的BP神經(jīng)網(wǎng)絡的訓練集準確率為96.67%,測試集準確率為88.75%。
PSO-SVM:一般地,在SVM模型中懲罰函數(shù)C與gamma值兩個參數(shù)非常重要[13],根據(jù)文獻[14]的優(yōu)化流程利用PSO優(yōu)化SVM算法進行最優(yōu)求解。設置PSO參數(shù)局部搜索能力c1為1.5,c2為1.7,最大進化數(shù)量為200,種群最大數(shù)量為20。可以得出SVM最優(yōu)的懲罰函數(shù)C為64.6241,gamma值為0.20315,最佳分類準確率為93.3333%。再利用最優(yōu)參數(shù)對SVM模型進行訓練,訓練集準確率為93.33%,測試集準確率為92.50%。
BN:貝葉斯網(wǎng)絡實際上是一種利用對圖形的推理表示變量與變量之間因果關系的模型。根據(jù)文獻[15]采用故障樹建模的方法來建立BN模型,對可靠性指標進行分析,首先采用交叉驗證選取訓練集和測試集,將測試集在總數(shù)據(jù)集的占比設為40,將分類標簽轉(zhuǎn)化為數(shù)據(jù),并計算條件概率,最后對每個特征的每個取值進行數(shù)量統(tǒng)計,再使用測試集進行數(shù)據(jù)測試;訓練集準確率為94.17%,測試集準確率為90.83%。
集成學習模型算法:將GA-BP神經(jīng)網(wǎng)絡、PSOSVM和BN進行集成使用,采用并行集成方式及學習法結(jié)合策略,使得模型可以自適應的針對多種數(shù)據(jù)做出更加準確的分類。集成學習模型訓練集和檢測集上訓練測試結(jié)果分別如圖8、圖9所示。
圖8 EL訓練集的實際分類和預測分類Fig.8 Actual classification and predictive classification diagram of EL training set
圖9 EL測試集的實際分類和預測分類Fig.9 The actual and predicted classification diagram of the EL test set
由圖8、圖9可知,利用EL訓練的訓練集準確率為99.20%,檢測集準確率為97.50%。表明了EL具有較好的分類能力,不論是在訓練集還是測試集中都有較高的分類準確率,避免了“維數(shù)災難”,且具有較高的泛化能力,運算速度快,集成學習模型具有良好的魯棒性。各學習器的數(shù)據(jù)集分類準確率結(jié)果對比見表3。
表3 各學習器的數(shù)據(jù)集分類準確率結(jié)果對比Tab.3 Comparison of data set classification accuracy of each learner %
針對施工升降機的可靠性評價問題,提出了一種基于RF-EL算法的施工升降機可靠性分析模型,得到的主要結(jié)論為:
(1)利用RF算法對遠程監(jiān)控平臺采集的施工升降機28個可靠性相關因素進行了量化和重要度分析,最終確定超負荷運行時間、載重量、風速、當前速度、吊籠傾角、輸入電壓、作業(yè)環(huán)境、故障報警次數(shù)8個相關因素,通過對8個相關因素的RF算法二次分析,R2從0.88提升至0.94,證明經(jīng)過約減后的8個相關因素組成的新樣本擬合更好,準確率更高。
(2)分別利用BP神經(jīng)網(wǎng)絡、SVM和BN基學習器對120組訓練樣本進行訓練,并通過80組測試樣本進行驗證,在訓練集中表現(xiàn)最好的是利用GA算法優(yōu)化的BP神經(jīng)網(wǎng)絡算法,其分類準確率為96.67%;在測試集中表現(xiàn)最好的是利用PSO算法優(yōu)化的SVM算法,其分類準確率為92.50%;再將3個基學習器集成后利用EL進行訓練及驗證,可得出EL在訓練集中準確率為99.20%,測試集中準確率為97.50%。
(3)經(jīng)過實例驗證分析,證明RF-EL算法對施工升降機可靠性分析具有良好的準確性、穩(wěn)定性。該模型的建立以及實際應用對保障施工升降機的高效、安全、可靠運行具有重要的現(xiàn)實意義。