吳紅 王曉明 王斌 顧翩
(江蘇省安全生產(chǎn)科學(xué)研究院 南京 210009)
化工行業(yè)中涉及危險(xiǎn)化學(xué)品生產(chǎn)、存儲(chǔ)、運(yùn)輸?shù)拳h(huán)節(jié),容易存在較大的事故隱患。一旦發(fā)生事故,將嚴(yán)重危害社會(huì)公共安全。對(duì)化工行業(yè)生產(chǎn)過(guò)程進(jìn)行事故前的風(fēng)險(xiǎn)預(yù)測(cè),可以快速了解生產(chǎn)系統(tǒng)的風(fēng)險(xiǎn)狀態(tài),從而在事故發(fā)生前制定出有效的防范和控制措施,有助于降低化工行業(yè)安全生產(chǎn)系統(tǒng)的風(fēng)險(xiǎn),進(jìn)而減少事故的發(fā)生。
我國(guó)正處于大數(shù)據(jù)技術(shù)迅速發(fā)展時(shí)期,機(jī)器學(xué)習(xí)算法在自然災(zāi)害、設(shè)備設(shè)施診斷、交通運(yùn)輸事故、信息通訊和煤礦瓦斯等行業(yè)領(lǐng)域已有廣泛應(yīng)用[1-3],目前國(guó)內(nèi)許多學(xué)者在化工行業(yè)進(jìn)行了風(fēng)險(xiǎn)研究,也取得一些成果。包其富等[4]采用模糊綜合評(píng)價(jià)法基于人的因素、設(shè)備安全可靠性、生產(chǎn)工藝、安全管理和周邊環(huán)境五個(gè)方面影響因素,確定各因素評(píng)語(yǔ)集和權(quán)重,進(jìn)而計(jì)算儲(chǔ)罐區(qū)的整體風(fēng)險(xiǎn)。張子揚(yáng)等[5]基于貝葉斯模型,選取人員(班組)因素、設(shè)備因素,運(yùn)用動(dòng)態(tài)風(fēng)險(xiǎn)分析方法,對(duì)化工生產(chǎn)企業(yè)反應(yīng)器壓力安全控制系統(tǒng)事故風(fēng)險(xiǎn)值進(jìn)行評(píng)估和預(yù)測(cè)。
綜上可知,在化工行業(yè)對(duì)于風(fēng)險(xiǎn)預(yù)測(cè)研究主要集中于危險(xiǎn)源定性分析、定量評(píng)價(jià)和事故后果分析。但是當(dāng)某些風(fēng)險(xiǎn)因素發(fā)生動(dòng)態(tài)變化時(shí),無(wú)法做到及時(shí)計(jì)算和預(yù)測(cè)風(fēng)險(xiǎn)程度。隨著數(shù)據(jù)挖掘技術(shù)的成熟發(fā)展,本文研究了PSO-SVM模型在化工事故風(fēng)險(xiǎn)預(yù)測(cè)中的應(yīng)用,基于化工安全生產(chǎn)過(guò)程中人員因素、設(shè)備設(shè)施因素、管理因素、環(huán)境因素及對(duì)應(yīng)風(fēng)險(xiǎn)值樣本數(shù)據(jù)對(duì)模型進(jìn)行訓(xùn)練學(xué)習(xí),并將測(cè)試樣本數(shù)據(jù)代入模型作風(fēng)險(xiǎn)值預(yù)測(cè),對(duì)比預(yù)測(cè)風(fēng)險(xiǎn)值與計(jì)算風(fēng)險(xiǎn)值,以此驗(yàn)證模型的準(zhǔn)確性。研究過(guò)程中采用PSO尋優(yōu)算法對(duì)預(yù)測(cè)模型參數(shù)進(jìn)行優(yōu)化,提高模型預(yù)測(cè)準(zhǔn)確性,為及時(shí)、準(zhǔn)確預(yù)測(cè)化工安全生產(chǎn)過(guò)程中的事故風(fēng)險(xiǎn)提供了有力的技術(shù)支撐。
以2015年至2019年5年期間全國(guó)發(fā)生的較大及以上化工和?;钒采a(chǎn)事故案例為分析對(duì)象,共計(jì)67起。依據(jù)“2-4”事故致因模型分析框架,通過(guò)逐個(gè)讀取事故案例的事故調(diào)查報(bào)告,分析提取各例事故的致因因素。67起事故中人員的不安全行為主要包括一線員工在涉及高溫加熱工藝、帶壓設(shè)備、有毒有害環(huán)境和動(dòng)火作業(yè)及有限空間作業(yè)中的違規(guī)違章操作,管理人員違章指揮,以及人員不規(guī)范求援導(dǎo)致事故影響進(jìn)一步擴(kuò)大;設(shè)備設(shè)施類因素主要包括:工藝、設(shè)計(jì)本身存在缺陷,相關(guān)的安全防護(hù)和警示標(biāo)識(shí)缺失,設(shè)備設(shè)施隱患不消除“帶病”運(yùn)行,以及自動(dòng)化控制系統(tǒng)異常等;管理方面因素主要包括:事故企業(yè)未健全安全管理制度及相關(guān)規(guī)章制度,教育培訓(xùn)走形式等原因?;な鹿手懈髦乱蛞蛩氐慕y(tǒng)計(jì)情況如表1所示。
表1 化工事故致因因素統(tǒng)計(jì)
結(jié)合危險(xiǎn)源理論、事故致因理論,從人員因素、設(shè)備因素、管理因素和環(huán)境因素4個(gè)方面建立了風(fēng)險(xiǎn)預(yù)測(cè)指標(biāo)體系,指標(biāo)體系具體劃分成4個(gè)一級(jí)指標(biāo)和若干二級(jí)指標(biāo)組成,見(jiàn)表2。
表2 事故風(fēng)險(xiǎn)預(yù)測(cè)指標(biāo)體系
利用PSO-SVM模型預(yù)測(cè)化工事故風(fēng)險(xiǎn)值,首先確定模型輸入,即預(yù)測(cè)指標(biāo)為化工安全生產(chǎn)過(guò)程中人員因素、設(shè)備設(shè)施因素、管理因素及環(huán)境因素對(duì)應(yīng)風(fēng)險(xiǎn)值,將以上指標(biāo)數(shù)據(jù)值代入模型作訓(xùn)練并利用PSO算法優(yōu)化模型參數(shù),使模型的風(fēng)險(xiǎn)值預(yù)測(cè)結(jié)果更準(zhǔn)確,通過(guò)對(duì)比預(yù)測(cè)風(fēng)險(xiǎn)值與計(jì)算風(fēng)險(xiǎn)值,以此驗(yàn)證模型的準(zhǔn)確性。PSO-SVM模型進(jìn)行化工事故風(fēng)險(xiǎn)預(yù)測(cè)的流程見(jiàn)圖1。
圖1 PSO-SVM模型預(yù)測(cè)風(fēng)險(xiǎn)值流程
為實(shí)現(xiàn)化工安全生產(chǎn)系統(tǒng)事故風(fēng)險(xiǎn)預(yù)測(cè)模型研究,建立了25組預(yù)測(cè)指標(biāo)參數(shù)值樣本數(shù)據(jù),數(shù)值涵蓋5個(gè)風(fēng)險(xiǎn)程度等級(jí),即風(fēng)險(xiǎn)值非常低(0,20]、風(fēng)險(xiǎn)值較低(20,40]、風(fēng)險(xiǎn)值一般(40,60]、風(fēng)險(xiǎn)值較高(60,80]、風(fēng)險(xiǎn)值非常高(80,100]。每個(gè)風(fēng)險(xiǎn)等級(jí)有5組數(shù)據(jù),共產(chǎn)生25組數(shù)據(jù)作為不同指標(biāo)風(fēng)險(xiǎn)程度的評(píng)語(yǔ)集,結(jié)合第1節(jié)預(yù)測(cè)指標(biāo)對(duì)應(yīng)權(quán)重,由公式(1)可計(jì)算得到25組指標(biāo)值樣本數(shù)據(jù)依次對(duì)應(yīng)的事故風(fēng)險(xiǎn)程度。
(1)
式中,αi為第i個(gè)預(yù)測(cè)指標(biāo)的風(fēng)險(xiǎn)數(shù)據(jù)值,wi為其對(duì)應(yīng)的權(quán)重,S為所屬預(yù)測(cè)指標(biāo)樣本數(shù)據(jù)對(duì)應(yīng)的化工事故風(fēng)險(xiǎn)數(shù)據(jù)值。
將25組樣本數(shù)據(jù)中20組作為訓(xùn)練數(shù)據(jù)集,用于PSO-SVM模型的訓(xùn)練。另外5組數(shù)據(jù)作為測(cè)試數(shù)據(jù)集,用于模型的驗(yàn)證。
支持向量機(jī)模型(SVM)是一種以統(tǒng)計(jì)學(xué)理論為基礎(chǔ),基于結(jié)構(gòu)風(fēng)險(xiǎn)最小化準(zhǔn)則的較新的機(jī)器學(xué)習(xí)算法,適用于處理小樣本、非線性、高維模式識(shí)別等問(wèn)題。SVM模型通過(guò)核函數(shù)可以將復(fù)雜的非線性問(wèn)題映射到高維空間,轉(zhuǎn)化成線性問(wèn)題。模型算法能夠快速地訓(xùn)練學(xué)習(xí),找到輸入和輸出之間復(fù)雜的函數(shù)關(guān)系?;谶@些特性,SVM模型得到快速發(fā)展,目前己被廣泛應(yīng)用于化工建模、故障診斷、模式識(shí)別等各種領(lǐng)域進(jìn)行回歸預(yù)測(cè)及分類。
最優(yōu)平面方面記為y=ωx+b樣本集的線性回歸函數(shù)可表示為:
f(x)=ωx+b
(2)
SVM模型以線性可分的最優(yōu)分類平面為基礎(chǔ),回歸訓(xùn)練策略就是尋找一個(gè)回歸面使支持向量到該平面的間隔最大。利用SVM作回歸預(yù)測(cè),即需要找到這個(gè)最優(yōu)分類平面,也就是所求最優(yōu)回歸平面。求解最優(yōu)平面過(guò)程中,對(duì)于非線性樣本集數(shù)據(jù),利用核函數(shù)將其轉(zhuǎn)變?yōu)楦呔S空間的線性可分。核函數(shù)可表示如下:
K(xi,xj)=φ(xi)·φ(xj)
(3)
式中,φ(x)為樣本集到高維空間的非線性映射,根據(jù)線性SVM回歸模型處理思路,則非線性支持向量機(jī)回歸函數(shù)可表示為:
f(x)=ωφ(x)+b
(4)
在回歸函數(shù)表達(dá)式的求取中,引入損失函數(shù)L,并采用ε-insensiεtive誤差函數(shù)約束最優(yōu)平面。損失函數(shù)L如式(5)所示。
L(y,f(x,w))=|y-f(x,w)|
(5)
(6)
懲罰因子C(C>0)是一個(gè)常數(shù),用來(lái)調(diào)整誤差超過(guò)ε的樣本懲罰程度。
通過(guò)拉格朗日乘子αi,利用對(duì)偶原理求解上述最小值問(wèn)題,建立方程如式(7):
(7)
約束條件:
(8)
最終確定支持向量機(jī)回歸模型函數(shù):
(9)
基于以上SVM模型原理,支持向量機(jī)模型在進(jìn)行回歸預(yù)測(cè)時(shí),核函數(shù)的選擇對(duì)回歸預(yù)測(cè)的性能、運(yùn)算速度等具有很大的影響,同時(shí)對(duì)預(yù)測(cè)結(jié)果的精度也有一定的影響。因此本文在對(duì)化工事故風(fēng)險(xiǎn)進(jìn)行預(yù)測(cè)的過(guò)程中先后選擇了不同核函數(shù),并進(jìn)行結(jié)果對(duì)比。在回歸預(yù)測(cè)模型建立中,核函數(shù)的選擇方式只需改變PSO-SVM模型中的參數(shù)-t,該參數(shù)設(shè)置值分別為:0代表線性核函數(shù)、1代表多項(xiàng)式核函數(shù)、2代表徑RBF核函數(shù)、3代表Sigmoid核函數(shù)。依次采用這些核函數(shù)建立預(yù)測(cè)模型,并對(duì)比預(yù)測(cè)結(jié)果見(jiàn)表3。
表3 不同核函數(shù)對(duì)應(yīng)模型預(yù)測(cè)結(jié)果對(duì)比
由表3可知,4種核函數(shù)預(yù)測(cè)結(jié)果的相關(guān)系數(shù)均較高,其中基于RBF核函數(shù)建立的模型預(yù)測(cè)結(jié)果相關(guān)系數(shù)最高,且均方差最小,說(shuō)明RBF核函數(shù)縮減模型預(yù)測(cè)效果更好。因此本文中的核函數(shù)選擇徑向基核函數(shù)(RBF),即核函數(shù)參數(shù)-t取值為2。
確定核函數(shù)后,需要對(duì)支持向量機(jī)模型相關(guān)參數(shù)尋優(yōu),確定參數(shù)最優(yōu)值。參數(shù)最優(yōu)值的確定可以約束模型的擬合程度,保證模型泛化能力和預(yù)測(cè)效果達(dá)到最佳。本文主要對(duì)模型的懲罰因子C和核函數(shù)參數(shù)g作參數(shù)尋優(yōu)。SVM模型算法中懲罰因子C控制模型可容忍的誤差范圍,C值過(guò)大會(huì)導(dǎo)致模型過(guò)擬合,模型泛化不強(qiáng);C值過(guò)小降低模型復(fù)雜度,會(huì)導(dǎo)致模型欠擬合。文中2.2節(jié)中已確定模型核函數(shù)為RBF,RBF核函數(shù)表達(dá)式如式(10)。
(10)
式中,δ為徑向基半徑,影響核函數(shù)學(xué)習(xí)能力。δ設(shè)置過(guò)大,令g=1/δ2代入式(10),則得到:
K(x,xi)=exp(-g‖x-xi‖2)
(11)
因此需要對(duì)SVM模型懲罰因子C和核函數(shù)參數(shù)g作尋優(yōu),確定最佳取值,用此參數(shù)組合訓(xùn)練樣本數(shù)據(jù)獲取最佳模型,提高模型預(yù)測(cè)準(zhǔn)確性。
PSO算法在參數(shù)尋優(yōu)過(guò)程中依次設(shè)置種群數(shù)量為25,最大迭代次數(shù)為200,學(xué)習(xí)因子c1=1.5,c2=1.7,終止迭代次數(shù)為200,見(jiàn)圖2。通過(guò)圖2可看出粒子在開(kāi)始迭代時(shí)就找到最佳適應(yīng)度,并保持較長(zhǎng)時(shí)間穩(wěn)定,得到最小交叉驗(yàn)證均方差值CVmse=0.068 28,通過(guò)粒子群算法得到最優(yōu)懲罰參數(shù)C=4.176 5,最優(yōu)徑向基核函數(shù)參數(shù)g=0.01。代入PSO算法尋優(yōu)得到的參數(shù)最優(yōu)值確定PSO-SVM模型。
圖2 PSO-SVM參數(shù)優(yōu)化結(jié)果
在MATLAB環(huán)境下,基于確定的PSO-SVM模型,代入5組測(cè)試樣本指標(biāo)數(shù)據(jù):人員因素、設(shè)備因素、管理因素及環(huán)境因素對(duì)應(yīng)的各指標(biāo)數(shù)據(jù)值。經(jīng)過(guò)模型預(yù)測(cè)得到5組預(yù)測(cè)指標(biāo)數(shù)據(jù)對(duì)應(yīng)的事故風(fēng)險(xiǎn)預(yù)測(cè)值,模型均方差為0.001 520、相關(guān)系統(tǒng)R2為0.999 794。5組測(cè)試樣本數(shù)據(jù)的風(fēng)險(xiǎn)預(yù)測(cè)值與計(jì)算值對(duì)比結(jié)果見(jiàn)圖3。由預(yù)測(cè)風(fēng)險(xiǎn)值與計(jì)算風(fēng)險(xiǎn)值對(duì)比可知,預(yù)測(cè)值與計(jì)算值趨勢(shì)一致,且誤差較低,預(yù)測(cè)效果良好。
圖3 PSO-SVM模型預(yù)測(cè)結(jié)果對(duì)比
(1)化工安全生產(chǎn)事故致因因素中為人員因素(違規(guī)操作、安全知識(shí)欠缺、管理決策不正確)、設(shè)備因素(設(shè)備設(shè)施存在故障隱患、設(shè)備設(shè)施設(shè)計(jì)缺陷、安全防護(hù)和安全警示標(biāo)識(shí)缺失)占比較大,在事故風(fēng)險(xiǎn)動(dòng)態(tài)預(yù)測(cè)模型中引入以上因素作為預(yù)測(cè)指標(biāo)可提高預(yù)測(cè)結(jié)果準(zhǔn)確性。
(2)PSO-SVM模型訓(xùn)練速度快、預(yù)測(cè)精度較高,且對(duì)于小樣本量數(shù)據(jù)的回歸預(yù)測(cè)效果較好,解決了化工行業(yè)事故風(fēng)險(xiǎn)預(yù)測(cè)研究中異常數(shù)據(jù)缺少的問(wèn)題,為化工行業(yè)事故風(fēng)險(xiǎn)預(yù)測(cè)提供了一種新的科學(xué)有效的方法。