劉素兵,趙志輝,吳聰偉
(第二炮兵工程大學(xué) 數(shù)學(xué)與軍事運籌教研究,陜西 西安 710054)
目前礦山安全事故預(yù)測常用的方法主要有灰色預(yù)測法、回歸預(yù)測法、馬爾可夫鏈預(yù)測法、平滑指數(shù)法等[1-2].由于礦山安全事故受多隨機性、有限樣本性等多種因素的影響,單一預(yù)測模型難以達(dá)到理想的預(yù)測精度.針對此情況,需將灰色預(yù)測理論與支持向量機結(jié)合起進行綜合考慮.灰色預(yù)測具有弱化數(shù)據(jù)隨機波動性、少數(shù)據(jù)、貧信息的建模特點.支持向量機在解決小樣本、局部極小點、非線性等方面具有突出表現(xiàn)[3].因此,為了更好地對礦山安全事故進行預(yù)測,提高礦山安全事故預(yù)測的可靠性、有效性,建立了灰色支持向量機組合預(yù)測模型(簡稱G-SVM).仿真結(jié)果表明,該模型比單一的預(yù)測方法具有更高的預(yù)測精度.
灰色問題建模使用最多的是GM(1,1)模型[4].
1) 數(shù)列選擇.設(shè)X(0)為原始數(shù)據(jù)數(shù)列
X(0)={x(0)(1),x(0)(2),…,x(0)(n)}.
2) 生成1-AGO數(shù)據(jù)序列X(1)={x(1)(1),x(1)(2),…,x(1)(n)},
3) 建立灰色預(yù)測模型.緊鄰均值生成序列為:Z(1)=(z(1)(2),z(1)(3),…,z(1)(n)),
其中,背景值
GM(1,1)模型:
x(0)(k)+az(1)(k)=b,
(1)
由最小二乘估計得(2)中參數(shù)列 [a,b]T=(BTB)-1BTY,且
灰微分方程的白化方程為:
(2)
取x(1)(1)=x(0)(1),模型的響應(yīng)時間序列為:
(3)
(4)
支持向量機的基本思想如下[5-7]: 設(shè)訓(xùn)練樣本集:D={(x1,y1),(x2,y2),…,(xn,yn)},其中,輸入xi∈Rn(i=1,2,…,n),輸出值yi∈R.
回歸模型:
y(x)=ωT·φ(x)+b,
(5)
式(5)中,ω為加權(quán)向量;φ(x)為從輸入空間到高維特征空間的非線性映射,通過在高維空間中進行線性回歸,以達(dá)到在低維空間中作非線性回歸的效果;b為常值偏差.
SVM采用Vapnik的ε不敏感損失函數(shù)度量風(fēng)險,即
(6)
為訓(xùn)練ω,b,極小化下式的泛函
(7)
式(7)中,第1項為經(jīng)驗風(fēng)險;第2項為結(jié)構(gòu)風(fēng)險最小化原則得到的正則化部分,主要控制模型的復(fù)雜度;c為正規(guī)化常數(shù),用來平衡經(jīng)驗風(fēng)險項和正則化項.
由于式(7)中,特征空間的維數(shù)高且目標(biāo)函數(shù)不可微,因此不能對其直接求解.通過引入核函數(shù)K(xi,x),利用Wolfe對偶技巧,上述問題轉(zhuǎn)化為對偶問題:
(8)
則式(5)的回歸函數(shù)表達(dá)式可寫為:
(9)
本文選擇Guass徑向基RBF核
(10)
首先采用GM(1,1)對礦山安全事故次數(shù)進行預(yù)測,預(yù)測其趨勢變化規(guī)律,然后采用SVM對GM(1,1)的殘差進行修正,建立殘差序列的SVM模型,將SVM的預(yù)測結(jié)果與GM(1,1)的結(jié)果進行相加,從而實現(xiàn)對礦山安全事故次數(shù)的預(yù)測,其預(yù)測流程圖如圖1所示.
利用我國2007年1至2月—2010年11至12月的實際礦業(yè)安全事故數(shù)據(jù)為樣本進行實證分析,并與GM(1,1)模型、支持向量機模型的預(yù)測精度進行比較.利用2007年1至2月—2010年3至4月數(shù)據(jù)作為訓(xùn)練學(xué)習(xí)樣本,分別建立GM(1,1)模型、支持向量機模型和G-SVM組合模型,并以2010年5至6月—2010年11至12月的4個數(shù)據(jù)用于檢測樣本,對各模型的預(yù)測精度進行檢驗.
對于G-SVM模型,選擇具有較好統(tǒng)計性能的徑向基核函數(shù).根據(jù)以往經(jīng)驗,采用交叉驗證法來選擇不敏感損失參數(shù)和核函數(shù),基于樣本選擇的懲罰因子C=50,核參數(shù)σ2= 0.04,不敏感損失參數(shù)ε=0.15.預(yù)測結(jié)果見圖2.將組合模型G-SVM和單項預(yù)測模型GM(1,1)、SVM的預(yù)測結(jié)果進行比較,以驗證模型的有效性.各模型的礦山安全事故次數(shù)的預(yù)測如圖2所示.由圖2可看出,采用G-SVM的組合模型比其它2種模型更接近真實值,說明本文建立的G-SVM的組合模型具有較高的預(yù)測精度,取得了較好的預(yù)測效果.
選取平均絕對誤差、平均相對誤差、均方誤差對3種模型的預(yù)測性能進行評價,結(jié)果見表1.
表1 不同模型的誤差比較
由表1可知,GM(1,1)和SVM的MAE(平均絕對誤差)、MPE(平均相對誤差)和MPE(均方誤差)的值較大,而G-SVM的相應(yīng)的3個指標(biāo)值明顯減小,分別為0.85, 0.05,1.04.以上結(jié)果表明本文所提出的灰色支持向量機組合模型,在隨機性較強、小樣本條件下具有獨特的優(yōu)越性,其預(yù)測精度較高,明顯優(yōu)于GM(1,1)和SVM.
本文針對隨機性、小樣本條件下的礦山安全事故預(yù)測問題,建立了一種灰色支持向量機組合預(yù)測模型.該模型結(jié)合了灰色預(yù)測和支持向量機的優(yōu)點,提高了預(yù)測的精度.試驗結(jié)果表明,灰色支持向量機模型的預(yù)測誤差明顯小于其它2種單一預(yù)測模型,組合模型比單一的GM(1,1)模型和SVM模型具有更高的預(yù)測精度,證明了模型的可行性、有效性.該模型為礦業(yè)的安全管理、安全控制措施的制定提供了理論依據(jù),從而以最大限度地減少礦山安全事故的發(fā)生.
參考文獻:
[1] 程平亮. 傷亡事故統(tǒng)計分析信息管理系統(tǒng)的開發(fā)[J]. 工業(yè)安全與環(huán)保,2007,33(3):56-57.
[2] 朱慶明,張浩. 三次指數(shù)平滑法在煤礦事故預(yù)測中的應(yīng)用研究[J].中國安全生產(chǎn)科學(xué)技術(shù),2012,8(4):103-106.
[3] MOHANDES M A, HALAWANI T O, REHMAN S,et al. Support vector machines for wind speed prediction[J]. Renewable Energy, 2004,29(6):939-935.
[4] 劉思峰,黨耀國,方志耕,等. 灰色系統(tǒng)理論及其應(yīng)用[M].5版.北京:科學(xué)出版社,2010:146-168.
[5] 白鵬,張喜斌,張斌,等. 支持向量機理論及工程應(yīng)用實例[M].西安:西安電子科技大學(xué)出版社,2008.
[6] VAPNIK V. The nature of statistical learning theory[M].New York:Springer,1999
[7] 吳鈺,王杰. 綜合最優(yōu)灰色支持向量機模型在季節(jié)型電力負(fù)荷預(yù)測中的應(yīng)用[J].華東電力,2012,40(1):18-22.