王月紅,高 萌,趙帥博
(華北理工大學(xué)礦業(yè)工程學(xué)院,河北 唐山 063210)
礦塵不僅危害井下工作人員的身體,當?shù)V塵達到一定濃度也會引發(fā)爆炸,還會造成更嚴重的井下災(zāi)害事故。在煤礦生產(chǎn)作業(yè)過程中,如鉆井、爆破作業(yè)、采煤機及掘進機作業(yè)、煤礦的運輸轉(zhuǎn)運等多個環(huán)節(jié)都會產(chǎn)生礦塵[1]。在不同礦井中,由于地質(zhì)條件、煤的變質(zhì)程度以及采掘方法、機械化程度等不同,礦塵的產(chǎn)生量也有很大的差異;在同一礦井內(nèi),礦塵量也處于動態(tài)變化中。為了減小礦塵事故,預(yù)測井下礦塵濃度,許多學(xué)者進行了相關(guān)研究。相關(guān)文獻表明,學(xué)者們主要采用神經(jīng)網(wǎng)絡(luò)模型對粉塵濃度進行預(yù)測,如:改進的神經(jīng)網(wǎng)絡(luò)模型[2]、BP神經(jīng)網(wǎng)絡(luò)模型[3]、熵權(quán)法RBF神經(jīng)網(wǎng)絡(luò)[4]。對礦塵濃度進行預(yù)測的同時,也建立了相關(guān)模型預(yù)測塵肺病。譚強等[5]、王維等[6]基于灰色數(shù)列模型GM(1,1)對職業(yè)病的發(fā)病情況進行預(yù)測,時冬青[7]在灰色GM(1,1)模型的基礎(chǔ)上結(jié)合馬爾科夫過程構(gòu)建灰色GM(1,1)-馬爾科夫預(yù)測模型探討該模型在職業(yè)病預(yù)測領(lǐng)域的應(yīng)用,王永斌等[8]等建立灰色-廣義回歸神經(jīng)網(wǎng)絡(luò)組合模型,研究該模型對塵肺病預(yù)測的準確性。通過對塵肺病進行預(yù)測,使煤礦管理人員根據(jù)塵肺病的發(fā)病情況制定具有針對性的預(yù)防措施。
ARIMA模型在塵肺病的預(yù)測方面有一定的應(yīng)用[9],但在粉塵濃度預(yù)測方面的研究尚少,本文通過建立ARIMA模型并結(jié)合實例,具體分析了ARIMA模型在井下粉塵濃度預(yù)測方面的應(yīng)用。
ARIMA模型稱為求和自回歸滑動平均模型,由博克思(Box)和詹金斯(Jenkins)于20世紀70年代初提出的一種著名時間序列預(yù)測方法,所以又稱為Box-Jenkins模型、博克思-詹金斯法。 所謂ARIMA模型,是指將非平穩(wěn)時間序列轉(zhuǎn)化為平穩(wěn)時間序列,然后將因變量僅對它的滯后值以及隨機誤差項的現(xiàn)值和滯后值進行回歸所建立的模型。ARIMA模型根據(jù)原序列是否平穩(wěn)以及回歸中所含部分的不同,可分為以下三類:自回歸模型(Autoregressive Model,AR模型),滑動平均模型(Moving Average Model,MA模型),自回歸滑動平均模型(Auto-Regressive and Moving Average Model,ARMA模型)[10]。
1) AR模型。AR(p)為p階AR模型,它是僅用時間序列不同滯后項作為解釋變量的模型。模型見式(1)。
Yt=φ1Yt-1+φ2Yt-2+…+φpYt-p+et
(1)
式中:φ1,φ2,…,φp為自回歸系數(shù);p為自回歸階數(shù),也是模型中解釋變量的個數(shù);et為t時刻的誤差。
2) MA模型。MA(q)為q階MA模型,它是僅用誤差的不同滯后項作為解釋變量的模型,模型見式(2)。
Yt=et+θ1et-1+θ2et-2+…+θqet-q
(2)
式中:θ1,θ2,…,θq為移動平均系數(shù);q為移動平均階數(shù),即模型中解釋變量的個數(shù)。
3) ARMA模型。ARMA(p,q)為(p,q)階ARMA模型,模型見式(3)。
Yt=φ1Yt-1+φ2Yt-2+…+φpYt-p+et+
θ1et-1+θ2et-2+…+θqet-q
(3)
特殊情況,若p=0,模型是移動平均模型,記為MA(q),或ARMA(0,q);若q=0,模型是自回歸模型,記為AR(p)或ARMA(p,0)。
ARIMA模型簡單,只需通過自身的歷史觀測值就可反映出未來趨勢,在預(yù)測過程中需要對非平穩(wěn)數(shù)列進行平穩(wěn)化處理,模型既考慮了時間序列上的依存性,又考慮了隨機波動的干擾性。在獲得初步模型以后,可以根據(jù)貝葉斯信息準則對比模型的優(yōu)劣程度,從而選出最優(yōu)模型,提高模型預(yù)測的準確率。
以某礦5424工作面粉塵濃度為原始數(shù)據(jù)來源,通過擬合時間在9∶31~10∶13之間的22組數(shù)據(jù),建立合適的ARIMA模型,用于預(yù)測10∶15和10∶17這兩個時間點的粉塵濃度,再將預(yù)測值與實際值進行比較,進而驗證模型的適用性。
表1 原始數(shù)據(jù)Table 1 Original data
在SPSS軟件中導(dǎo)入粉塵濃度與時間數(shù)據(jù),再繪制序列圖,見圖1。
從圖1中可以看出,隨著時間的推移,粉塵濃度有一定的下降趨勢,因此認為該序列不是平穩(wěn)序列,需要對其進行平穩(wěn)化處理。此時選用差分的方式對數(shù)據(jù)進行平穩(wěn)化處理,這里選擇二階差分,這是由于在后期建模過程中,如果只進行一階差分,所得模型的擬合程度較低。對數(shù)據(jù)進行二階差分并繪制時序圖,差分后的數(shù)據(jù)在某一值上下波動,認為序列平穩(wěn),見圖2,故ARIMA模型d取2。
圖1 粉塵濃度時序圖Fig.1 Sequence diagram of dust concentration
圖2 二階差分時序圖Fig.2 Second order difference sequence diagram
對于ARIMA模型,如果自相關(guān)函數(shù)的滯后數(shù)為p后截尾,且偏相關(guān)函數(shù)的滯后數(shù)為q后截尾,則其階數(shù)分別為p,q。本文通過自相關(guān)與偏自相關(guān)系數(shù)來確定p值,q值。
通過圖3和圖4可以看出,圖像呈明顯的拖尾現(xiàn)象,偏自相關(guān)圖中滯后編號為1時,偏自相關(guān)系數(shù)超出置信區(qū)間,故p取1。同理,自相關(guān)圖中滯后編號為1時自相關(guān)系數(shù)超過置信區(qū)間,故q取1。再通過BIC準則,即選取BIC值最小的,BIC值見表2。
表2 BIC值Table 2 Numerical value of BIC
圖4 二階差分偏自相關(guān)Fig.4 Second order difference partial autocorrelation
圖3 二階差分自相關(guān)Fig.3 Second order difference autocorrelation
根據(jù)以上自相關(guān)偏相關(guān)系數(shù)及BIC準則,最后選定ARIMA(1,2,1)最合適。
輸出的ARIMA(1,2,1)模型統(tǒng)計量見表3。
表3 ARIMA(1,2,1)模型統(tǒng)計量Table 3 ARIMA(1,2,1) model statistics
由表3可知,模型自由度為16,P值(Sig.)為0.927顯著大于0.05的檢驗水平,因此不能拒絕該序列為白噪聲的原假設(shè)。由圖5分析可得,殘差自相關(guān)和偏自相關(guān)函數(shù)均在2倍標準差范圍內(nèi),因此,認為殘差沒有相關(guān)性,是白噪聲序列,進一步驗證了模型的合理性。
圖5 殘差自相關(guān)與偏自相關(guān)Fig.5 Residual autocorrelation and partial autocorrelation
利用建立的模型對時間在9∶31~10∶13之間的22組數(shù)據(jù)進行擬合,并對10∶15和10∶17兩個時間點的粉塵濃度進行了預(yù)測,預(yù)測結(jié)果見表4。
表4 模型預(yù)測結(jié)果Table 4 Model prediction results
由表4可以看出建立的ARIMA(1,2,1)模型對10∶15和10∶17兩個時間點的粉塵濃度的預(yù)測與實測值相差不大,相對誤差最大為8.34%,最小為2.40%,都在10%以內(nèi),可以認為該模型合理,能夠?qū)Ψ蹓m濃度變化進行較好的預(yù)測。
1) 影響粉塵濃度的因素有很多,如作業(yè)場所、通風系統(tǒng)等,通過分析得出利用時間序列對粉塵濃度預(yù)測是可行的。
2) 粉塵濃度是非平穩(wěn)隨機序列,在前人的相關(guān)研究基礎(chǔ)上,將ARIMA模型運用到粉塵濃度預(yù)測方面,結(jié)合某礦監(jiān)測數(shù)據(jù),建立ARIMA(1,2,1)預(yù)測模型,并對模型進行檢驗,最后將預(yù)測值與實測值進行對比,得到相對誤差都控制在10%以內(nèi),進一步驗證了模型的合理性。
3) 雖然模型精度較高,但是ARIMA模型是基于歷史數(shù)據(jù)的變化趨勢對未來進行預(yù)測,并不能準確了解到未來環(huán)境變化對數(shù)據(jù)的影響,可見模型對短期預(yù)測效果較好,若需要長期預(yù)測還要進一步結(jié)合其它模型進行研究。