李丹青,楊超宇
(安徽理工大學(xué)a.管理科學(xué)與工程系; b.經(jīng)濟(jì)與管理學(xué)院,安徽 淮南 232000)
瓦斯災(zāi)害是威脅煤礦安全高效生產(chǎn)的主要災(zāi)害之一, 對礦井下瓦斯?jié)舛茸兓厔菥珳?zhǔn)預(yù)測是預(yù)防瓦斯事故發(fā)生的重要方法[1]。 許多專家學(xué)者在瓦斯預(yù)測方面做了大量的研究。 李樹剛等[2]利用循環(huán)神經(jīng)網(wǎng)絡(luò)的方法建立了瓦斯?jié)舛阮A(yù)測模型, 有效提升了預(yù)測的精確度;張震等[3]基于ARIMA 構(gòu)建了瓦斯?jié)舛阮A(yù)測模型;孫卓越等[4]建立了長短時記憶神經(jīng)網(wǎng)絡(luò)動態(tài)預(yù)測模型,實(shí)時預(yù)測瓦斯?jié)舛鹊奈磥碲厔?。上述研究僅選用ARIMA 模型或LSTM 神經(jīng)網(wǎng)絡(luò)模型等單一模型進(jìn)行瓦斯?jié)舛阮A(yù)測, 無法對預(yù)測模型的優(yōu)劣得出評價。 本文選用ARIMA 模型和LSTM 模型以實(shí)測的瓦斯?jié)舛葦?shù)據(jù)作為訓(xùn)練樣本進(jìn)行瓦斯?jié)舛鹊念A(yù)測, 通過對2 種模型得到的預(yù)測結(jié)果的對比分析,選出較優(yōu)的預(yù)測模型,為瓦斯?jié)舛阮A(yù)測提供一定的依據(jù)。
ARIMA 差分自回歸移動平均模型是由Box 和Jenkins 提出的一種經(jīng)典的時間序列預(yù)測模型, 簡記為ARIMA (p,d,q),其中:AR 為自回歸模型;p 代表自回歸階數(shù), 用于獲取自變量;d 代表差分次數(shù);MA為移動平均模型;q 代表移動平均階數(shù),用于時間數(shù)據(jù)的平滑處理。 ARIMA 模型不僅可以處理平穩(wěn)序列,還可通過差分來處理非平穩(wěn)序列[5],該模型的數(shù)學(xué)表達(dá)式為
利用ARIMA 模型預(yù)測的具體步驟為:(1)數(shù)據(jù)平穩(wěn)性檢驗(yàn)與處理。 通常平穩(wěn)性檢驗(yàn)的方法分為直接觀察法和單位根檢驗(yàn)法2 種。 直接觀察法通過繪制數(shù)據(jù)序列圖判斷其是否平穩(wěn), 單位根檢驗(yàn)法通過計算T 檢驗(yàn)值來判斷序列是否平穩(wěn)。 (2)確定ARIMA 模型的p、q 值。 通過觀察樣本的自相關(guān)圖和偏自相關(guān)圖來選取參數(shù)p 和q,一般以自相關(guān)圖和偏自相關(guān)圖中各自截尾的位置作為p 和q 的最大值,然后利用貝葉斯信息量準(zhǔn)則(BIC)或赤池信息量準(zhǔn)則(AIC)從多組p、q 中選擇一組最優(yōu)參數(shù)。 (3)模型的殘差檢驗(yàn)。 通過繪制模型的殘差自相關(guān)圖和殘差偏自相關(guān)圖來判斷殘差是否服從正態(tài)分布。 (4)模型預(yù)測。
LSTM 模型通過3 種特殊的門控裝置選擇性地存儲和遺忘信息, 通過控制全局記憶達(dá)到延緩記憶衰退的效果[6],其結(jié)構(gòu)如圖1 所示。
圖1 LSTM 結(jié)構(gòu)
本文實(shí)驗(yàn)采取山東省某礦進(jìn)風(fēng)巷掘進(jìn)工作面2021 年1 月21 日5 時 至2021 年1 月22 日5 時 的瓦斯實(shí)測數(shù)據(jù)作為樣本數(shù)據(jù),分別采用ARIMA 模型與LSTM 模型進(jìn)行預(yù)測,并將預(yù)測結(jié)果進(jìn)行對比。
(1)數(shù)據(jù)平穩(wěn)性檢驗(yàn)與處理
運(yùn)用單位根檢驗(yàn)法(ADF)判斷瓦斯?jié)舛葦?shù)據(jù)序列是否平穩(wěn),結(jié)果見表1。 由表1 知,原始時間序列為非平穩(wěn)序列, 經(jīng)過一階差分處理后的序列為平穩(wěn)序列,模型中d 確定為1。
表1 單位根檢驗(yàn)結(jié)果
(2)確定模型階數(shù)
繪制模型的自相關(guān)圖(ACF)和偏自相關(guān)圖(PACF)(圖2)。 由圖2 知自相關(guān)系數(shù)和偏自相關(guān)系數(shù)在滯后階數(shù)為3 之后開始衰減, 當(dāng)滯后階數(shù)為4時其衰減為0, 因此模型的p、q 可能取值為0、1、2、3。 進(jìn)一步采用BIC 信息準(zhǔn)則來判斷p、q 的最優(yōu)值,BIC 信息準(zhǔn)則的結(jié)果見表2。 由表2 可知,ARIMA(2,1,2) 對應(yīng)的BIC 結(jié)果為最小值, 因此可以確定p=2,q=2 為模型的最優(yōu)參數(shù)。
圖2 自相關(guān)圖和偏自相關(guān)圖
表2 BIC 信息準(zhǔn)則分析結(jié)果
(3)模型的殘差檢驗(yàn)
為了判斷模型的殘差之間是否相互獨(dú)立, 以及驗(yàn)證模型是否成立, 利用模型殘差自相關(guān)圖像(ACF)和殘差偏自相關(guān)圖像(PACF)(圖3)來進(jìn)行檢驗(yàn)。 由圖3 知,圖中的點(diǎn)基本上處于置信區(qū)間內(nèi),模型的殘差檢驗(yàn)通過檢驗(yàn)。
圖3 殘差自相關(guān)圖和殘差偏自相關(guān)圖
(4)模型預(yù)測
將選取的瓦斯?jié)舛葦?shù)據(jù)按照7∶3 的比例分割為訓(xùn)練集和測試集, 使用建立好的模型對測試數(shù)據(jù)集進(jìn)行預(yù)測, 模型預(yù)測結(jié)果與測試樣本實(shí)際值的對比情況如圖4 所示。 由圖4 知,預(yù)測值和實(shí)際值相差很小,ARIMA(2,1,2)模型較為準(zhǔn)確地預(yù)測了瓦斯?jié)舛入S著時間變化情況。
圖4 采用ARIMA 模型的瓦斯?jié)舛阮A(yù)測值與實(shí)際值的對比
實(shí)驗(yàn)平臺采用Tensorflow 框架來完成深度學(xué)習(xí)的過程, 并利用已有的數(shù)據(jù)訓(xùn)練出理想的LSTM 模型。 在訓(xùn)練模型前,為保障模型的精度,提升模型訓(xùn)練效率,首先要對瓦斯?jié)舛葦?shù)據(jù)進(jìn)行歸一化處理,歸一化處理后LSTM 模型的數(shù)學(xué)表達(dá)式為
對瓦斯?jié)舛葦?shù)據(jù)進(jìn)行歸一化處理后, 將數(shù)據(jù)集按照7∶3 的比例劃分為訓(xùn)練集和測試集。 LSTM 網(wǎng)絡(luò)層通常包括輸入層、隱含層和輸出層3 層結(jié)構(gòu),在訓(xùn)練過程中, 模型的輸入層節(jié)點(diǎn)數(shù)和輸出層節(jié)點(diǎn)數(shù)都為1,隱含層節(jié)點(diǎn)數(shù)設(shè)置為4,模型訓(xùn)練的epochs 設(shè)置為50 輪,batch_size 設(shè)置為72, 選用Adam 優(yōu)化誤差。利用訓(xùn)練好的模型對測試集進(jìn)行預(yù)測,預(yù)測結(jié)果與實(shí)際值對比見圖5。
圖5 采用LSTM 模型的瓦斯?jié)舛阮A(yù)測值與實(shí)際的對比
為了更好地比較ARIMA 模型和LSTM 模型的預(yù)測效果, 本文選擇均方根誤差 (Root Mean Squared Error,RMSE) 和 平 均 絕 對 誤 差(Mean Absolute Error,MAE)兩種指標(biāo)來評價模型的預(yù)測準(zhǔn)確度,其計算公式分別為
ARIMA 模型和LSTM 模型的RMSE 和MAE 見表3,由表3 可以看出,ARIMA 模型的RMSE 和MAE小于LSTM 模型的RMSE 和MAE,ARIMA 預(yù)測模型的精度略高于LSTM 預(yù)測模型,ARIMA 預(yù)測模型的預(yù)測效果更好。
表3 不同模型預(yù)測誤差對比
本文以山東省某礦井工作面2021 年1 月21 日至22 日瓦斯?jié)舛戎档膶?shí)測數(shù)據(jù)作為樣本數(shù)據(jù),采用ARIMA 模型與LSTM 模型進(jìn)行預(yù)測, 通過對比2 種模型預(yù)測結(jié)果發(fā)現(xiàn),ARIMA 模型和LSTM 模型在預(yù)測瓦斯?jié)舛确矫婢辛己玫谋憩F(xiàn), 其中采用ARIMA模型的預(yù)測較為精準(zhǔn)。 本文的不足之處在于僅選用瓦斯?jié)舛葐我恢笜?biāo)進(jìn)行了預(yù)測, 而瓦斯?jié)舛葧艿街車h(huán)境因素的影響,如風(fēng)速、溫度等,因此,下一步將考慮將瓦斯?jié)舛燃爸車h(huán)境的影響因素共同加入模型,進(jìn)一步提高模型預(yù)測精度。
參考文獻(xiàn):[1] 孫建華,張志立,石茜,等.基于主成分-逐步回歸分析法的瓦斯涌出量預(yù)測研究[J].煤炭工程,2020,52(1):89-94.
[2] 李樹剛,馬莉,潘少波,等.基于循環(huán)神經(jīng)網(wǎng)絡(luò)的煤礦工作面瓦斯?jié)舛阮A(yù)測模型研究[J].煤炭科學(xué)技術(shù),2020,48(1):33-38.
[3] 張震,朱權(quán)潔,李青松,等. 基于Python 的瓦斯?jié)舛華RIMA 預(yù)測模型構(gòu)建及其應(yīng)用[J].華北科技學(xué)院學(xué)報,2020,17(2):23-28.
[4] 孫卓越,曹垚林,楊東,等. 基于長短時記憶神經(jīng)網(wǎng)絡(luò)的回采工作面瓦斯?jié)舛葎討B(tài)預(yù)測[J].煤礦安全,2019,50(12):152-157.
[5] YANG X N, ZHANG K X, YANG H G, et al.Multiple regression and ARIMA model prediction on the yield of MSW in Xi’an[J]. Environmental sanitation engineering,2020,28(2):37-41.
[6] 李莎,林暉.結(jié)合MLR 和ARIMA 模型的時空建模及預(yù)測[J].計算機(jī)工程與應(yīng)用,2021,57(13):276-282.
[7] 王鑫,吳際,劉超,等. 基于LSTM 循環(huán)神經(jīng)網(wǎng)絡(luò)的故障時間序列預(yù)測[J].北京航空航天大學(xué)學(xué)報,2018,44(4):772-784.