侯恩科 ,榮統(tǒng)瑞 ,衛(wèi)勇鋒 ,夏冰冰 ,謝曉深
(1.西安科技大學(xué) 地質(zhì)與環(huán)境學(xué)院,陜西 西安 710054;2.陜西省煤炭綠色開發(fā)地質(zhì)保障重點(diǎn)實(shí)驗(yàn)室,陜西 西安 710054;3.陜西陜煤黃陵礦業(yè)有限公司,陜西 黃陵 727307)
煤層瓦斯含量既是瓦斯地質(zhì)規(guī)律分析的主要內(nèi)容,也是預(yù)測瓦斯涌出量和煤與瓦斯突出危險性的重要參數(shù)[1]。但瓦斯含量受諸多地質(zhì)因素影響,各因素條件復(fù)雜多樣,且對煤層瓦斯含量影響程度大小也存在較大差異,具有不確定性、動態(tài)性和復(fù)雜性的特點(diǎn)[2-3]。因此,精準(zhǔn)預(yù)測煤層瓦斯含量對煤礦瓦斯災(zāi)害事故的預(yù)防與治理具有重要意義[4]。
近年來,國內(nèi)外學(xué)者提出眾多方法來解決煤層瓦斯含量預(yù)測問題,如多元回歸、灰色理論[5]、神經(jīng)網(wǎng)絡(luò)[6]、支持向量機(jī)[7]和極限學(xué)習(xí)機(jī)[8]等算法被應(yīng)用于煤層瓦斯含量預(yù)測研究中。其中,由于BP 神經(jīng)網(wǎng)絡(luò)預(yù)測煤層瓦斯含量的效果較好而被廣泛運(yùn)用。吳觀茂等[9]以煤層深度、煤層厚度、煤層頂?shù)装鍘r性、井田地質(zhì)構(gòu)造和煤的變質(zhì)程度為主要影響因素,建立了比多元回歸分析預(yù)測精度更高的煤層瓦斯含量預(yù)測模型;沈金山等[10]運(yùn)用灰色關(guān)聯(lián)分析選取影響瓦斯賦存的主要因素進(jìn)行建模預(yù)測,證明了灰色理論與神經(jīng)網(wǎng)絡(luò)預(yù)測模型的可靠性;為了克服BP 神經(jīng)網(wǎng)絡(luò)模型收斂速度慢和易陷入局部極小的問題,劉景艷等[11]采用粒子群算法優(yōu)化BP 神經(jīng)網(wǎng)絡(luò)的神經(jīng)元個數(shù)和連接權(quán)值,建立了粒子群算法優(yōu)化BP 神經(jīng)網(wǎng)絡(luò)預(yù)測模型(PSO-BP);曹博等[12]先采用主成分分析降低變量間的相關(guān)性,然后用遺傳算法優(yōu)化BP 神經(jīng)網(wǎng)絡(luò)的權(quán)值和閾值,建立了PCA-GA-BP 神經(jīng)網(wǎng)絡(luò)預(yù)測模型,證明該模型可以準(zhǔn)確預(yù)測煤層瓦斯含量;趙偉等[13]提出了自適應(yīng)混沌海鷗算法(ACSOA),建立了基于自適應(yīng)混沌海鷗算法優(yōu)化BP 神經(jīng)網(wǎng)絡(luò)的瓦斯含量預(yù)測模型(ACSOA-BP),證明該模型具有更高的預(yù)測精度和穩(wěn)定性;馬磊等[14]提出了遺傳算法(GA)和模擬退火算法(SA)混合初始化BP 神經(jīng)網(wǎng)絡(luò)的瓦斯含量預(yù)測模型(GASA-BPNN 模型),該模型將GA 和具有時變概率突跳性的SA 整合為GASA 算法協(xié)同初始化BPNN 的權(quán)值和閾值,有效提高了BPNN 的參數(shù)學(xué)習(xí)能力。由于影響煤層瓦斯含量的因素眾多且各因素之間存在復(fù)雜的非線性關(guān)系,使得預(yù)測模型的精度和效率還有待提高[11]。綜上,為了解決瓦斯預(yù)測的精度和效率,利用Logistic 混沌映射算法麻雀種群進(jìn)行初始化,增加麻雀種群位置的多樣性,提升麻雀算法的全局搜索能力,再將改進(jìn)的麻雀搜索算法用于優(yōu)化BP 神經(jīng)網(wǎng)絡(luò),使得LSSA-BP 預(yù)測模型較其他模型,收斂速度更快、預(yù)測精度更高、穩(wěn)定性更佳[15]。
因此,以黃陵一號煤礦為例,先采用灰色關(guān)聯(lián)分析法篩選出影響煤層瓦斯含量的主控因素作為BP 神經(jīng)網(wǎng)絡(luò)輸入層神經(jīng)元,建立基于Logistic 混沌映射改進(jìn)的麻雀搜索算法優(yōu)化BP 神經(jīng)網(wǎng)絡(luò)的煤層瓦斯含量預(yù)測模型(LSSA-BP),并通過將該模型的預(yù)測結(jié)果與麻雀搜索算法優(yōu)化BP 神經(jīng)網(wǎng)絡(luò)模型(SSA-BP)及標(biāo)準(zhǔn)BP 神經(jīng)網(wǎng)絡(luò)模型的預(yù)測結(jié)果進(jìn)行綜合對比分析,以期得到準(zhǔn)確率和穩(wěn)定性更優(yōu)的預(yù)測模型。
麻雀搜索算法(sparrow search algorithm, SSA)是由XUE 等[16]受麻雀捕食過程引導(dǎo)啟發(fā)而提出的一種新型群智能優(yōu)化算法,主要通過麻雀的捕食和反捕食行為進(jìn)行迭代尋優(yōu),包括發(fā)現(xiàn)者、跟隨者和預(yù)警者3 種群體。捕食行為主要與算法中的發(fā)現(xiàn)者和跟隨者相對應(yīng),一般占種群的70%,作為發(fā)現(xiàn)者在迭代尋優(yōu)過程中適應(yīng)度較高,具有更廣泛的搜索能力,其作用是為跟隨者的捕食行為提供向?qū)?,隨后交由跟隨者進(jìn)行捕食;而反捕食行為則與算法中的偵查預(yù)警機(jī)制相對應(yīng),一般占據(jù)種群的20%,種群的部分麻雀作為預(yù)警者,其作用是根據(jù)捕食過程中危險的出現(xiàn)與否來決定是否放棄捕食。
發(fā)現(xiàn)者位置更新如式(1):
跟隨者位置更新如式(2):
式中:Xbest為全局最優(yōu)位置;β為步長參數(shù),服從[0,1]的正態(tài)分布;K∈[-1,1]為隨機(jī)數(shù);fi為適應(yīng)度值;fg、fw分別為全局最優(yōu)和最差的適應(yīng)度值;ε為常數(shù)。
利用logistic 混沌映射如式(4):
式中:yn(t)為logistic 混沌映射對麻雀種群分布進(jìn)行初始化后的序列;t為迭代次數(shù);υ為控制參數(shù)。
對式(1)中的麻雀種群分布進(jìn)行初始化,以增強(qiáng)種群多樣性,并擴(kuò)大種群搜索區(qū)域范圍,其中yn∈ [0,1],y0為初始條件,其產(chǎn)生的映射序列是非周期性的且不收斂,此外生成的映射序列必于某一特定值收斂; υ為控制參數(shù),決定該算法的演變過程,一般1≤υ≤4,隨著 υ值的增大,映射序列的取值范圍也隨之增大,且映射分布更均勻,并當(dāng)υ=4 時均勻性達(dá)到頂峰[17]。
BP 神經(jīng)網(wǎng)絡(luò)預(yù)測模型的精度是通過不斷調(diào)整模型的權(quán)值和閾值來提高的。因此,可使用SSA算法解決由權(quán)值和閾值隨機(jī)初始化導(dǎo)致模型局部最優(yōu)的問題,并引入logistic 混沌映射初始化麻雀種群位置,增加麻雀種群位置的多樣性,擴(kuò)大麻雀種群的搜索范圍[18],從而提升LSSA-BP 模型的預(yù)測精度、收斂速度和穩(wěn)定性。LSSA-BP 模型預(yù)測流程如圖1。
圖1 LSSA-BP 模型預(yù)測流程Fig.1 LSSA-BP model prediction flowchart
以黃陵一號煤礦2#煤層為例,該礦瓦斯地質(zhì)較為簡單且瓦斯資料數(shù)據(jù)有限,根據(jù)前人對煤層瓦斯含量預(yù)測的研究,將影響煤層瓦斯含量X0的樣本數(shù)據(jù)初步選取為以下7 個具有代表性且易于量化表達(dá)的影響因素:煤層厚度X1、煤層埋深X2、煤層上覆基巖厚度X3、煤層頂板20 m 內(nèi)砂巖(粗粒砂巖、中粒砂巖、細(xì)粒砂巖)厚度X4、煤層頂板20 m 內(nèi)泥巖厚度X5、揮發(fā)分X6和灰分X7。選取45 組瓦斯含量及影響因素的數(shù)據(jù)作為模型的數(shù)據(jù)集,其中數(shù)據(jù)前80%的部分作為訓(xùn)練集,剩余數(shù)據(jù)作為測試集,瓦斯含量及影響因素數(shù)據(jù)見表1。
表1 瓦斯含量及影響因素數(shù)據(jù)Table 1 Gas content and influencing factors dat a
借助MATLAB R2021a 平臺,利用灰色關(guān)聯(lián)分析法篩選主控因素作為模型的輸入層節(jié)點(diǎn)數(shù)[19],步驟如下:
1)確定參考序列和比較序列。瓦斯含量X0為參考序列,影響瓦斯含量的7 個因素為比較序列Xe。
2)數(shù)據(jù)按式(5)進(jìn)行歸一化處理。
式中:re為關(guān)聯(lián)度; θ 為 樣本數(shù)量;wk為指標(biāo)權(quán)重。
灰色關(guān)聯(lián)度分析結(jié)果見表2。
表2 灰色關(guān)聯(lián)分析結(jié)果Table 2 Gray association analysis results
由表2 可知:7 個影響因素的關(guān)聯(lián)度均高于0.7,當(dāng)關(guān)聯(lián)度不小于0.8 時,認(rèn)為關(guān)聯(lián)性很好,因此選取關(guān)聯(lián)度在0.8 以上的作為模型的輸入層節(jié)點(diǎn)數(shù)。影響因素X6和X7的關(guān)聯(lián)度值一致,說明這2 個因素對瓦斯含量的影響效果一樣,只需保留1 個即可,剔除X7。最終確定將煤層厚度、煤層埋深、煤層上覆基巖厚度、煤層頂板20 m 內(nèi)砂巖厚度和煤的揮發(fā)分共5 個影響因素作為模型的輸入層節(jié)點(diǎn)數(shù)。
為驗(yàn)證LSSA-BP 模型的穩(wěn)定性、預(yù)測精度和運(yùn)行速度,借助MATLAB R2021a 平臺,將篩選出的5 維樣本數(shù)據(jù)按照圖1 預(yù)測流程進(jìn)行訓(xùn)練,并利用SSA-BP 模型和BP 模型與該模型的預(yù)測結(jié)果進(jìn)行綜合對比。經(jīng)過BP 模型的反復(fù)訓(xùn)練,隱含層節(jié)點(diǎn)數(shù)和均方誤差見表3。
表3 隱含層節(jié)點(diǎn)數(shù)與均方誤差Table 3 Implied layer node count and mean squared error
當(dāng)隱含層節(jié)點(diǎn)數(shù)為11 時,BP 神經(jīng)網(wǎng)絡(luò)訓(xùn)練集的均方誤差最小。因此,將構(gòu)建結(jié)構(gòu)為5-11-1的BP 神經(jīng)網(wǎng)絡(luò),訓(xùn)練次數(shù)設(shè)置為1 000,學(xué)習(xí)速率為0.01,訓(xùn)練目標(biāo)最小誤差為0.000 01。SSA 算法中的初始種群規(guī)模為20,最大迭代次數(shù)為30,發(fā)現(xiàn)者占比為全部種群的70%,其余作為跟隨者,預(yù)警者比重為20%,安全值為0.6。
優(yōu)化收斂曲線如圖2。
圖2 優(yōu)化收斂曲線Fig.2 Optimizing convergence curves
由圖2 可知,LSSA-BP 模型在迭代15 次后達(dá)到全局最優(yōu),具有較強(qiáng)的尋優(yōu)能力,而SSA-BP 模型在迭代25 次后才趨于平穩(wěn),且LSSA-BP 模型訓(xùn)練的均方誤差更低;LSSA-BP 模型較SSA-BP模型具有更強(qiáng)的全局搜索能力、更高的預(yù)測精準(zhǔn)度和更快的收斂速度。
為驗(yàn)證LSSA-BP 模型在煤層瓦斯含量預(yù)測方面的有效性和優(yōu)越性,選取數(shù)據(jù)樣本中的后9 組數(shù)據(jù)作為預(yù)測樣本進(jìn)行預(yù)測,LSSA-BP 模型預(yù)測結(jié)果見表4,預(yù)測樣本預(yù)測值與實(shí)測值對比如圖3,預(yù)測結(jié)果絕對誤差對比如圖4。
表4 LSSA-BP 模型預(yù)測結(jié)果Table 4 SSA-BP model prediction results
圖3 預(yù)測樣本預(yù)測值與實(shí)測值對比Fig.3 Comparison of predicted and measured values of predicted samples
圖4 預(yù)測結(jié)果絕對誤差對比Fig.4 Comparison of absolute error of prediction results
由圖3 可知:LSSA-BP 模型中除鉆孔L83 的預(yù)測值與實(shí)測值相差較大外,其余鉆孔的預(yù)測值與實(shí)測值在整體上接近程度較高;SSA-BP 模型,雖然部分鉆孔的預(yù)測結(jié)果較好,但是其中鉆孔L73 和L76 的預(yù)測值與實(shí)測值偏離幅度較大;而BP 模型的預(yù)測值與實(shí)測值偏離幅度總體較大,預(yù)測結(jié)果較差。
由圖4 可知:LSSA-BP 模型的預(yù)測穩(wěn)定性較其他模型最好,在整體上最接近于0,且較為平緩,其中鉆孔L83 的預(yù)測誤差最大,誤差達(dá)到了0.734 4 m3/t,小于SSA-BP 模型的最大誤差1.304 2 m3/t;而單一的BP 模型預(yù)測誤差總體上均較大,最大誤差高達(dá)2.191 9 m3/t。
由以上各模型的預(yù)測值以及預(yù)測誤差對比可知,LSSA-BP 模型預(yù)測結(jié)果準(zhǔn)確度較高且穩(wěn)定性更佳。
為了能夠有效反映模型預(yù)測的精度,選擇平均絕對誤差(MAE)、均方誤差(MSE)、均方根誤差(RMSE)和平均絕對百分比誤差(MAPE)4 個指標(biāo)作為模型預(yù)測精度的評價指標(biāo)[20-21]。模型精度指標(biāo)見表5。
表5 模型精度指標(biāo)Table 5 Model accuracy indexes
LSSA-BP 模型的4 項(xiàng)指標(biāo)均優(yōu)于SSA-BP 模型和BP 模型;較SSA-BP 模型4 項(xiàng)指標(biāo)分別提升了 0.059 5 m3/t、 0.181 4 m3/t、 0.179 7 m3/t 和18.385 3%,其中在MSE、RMSE 和MAPE 這3 項(xiàng)指標(biāo)的提升效果較明顯。
LSSA-BP 模型的4 項(xiàng)指標(biāo)較BP 模型4 項(xiàng)指標(biāo)分別提升了0.867 8 m3/t、1.672 2 m3/t、0.943 2 m3/t 和76.598 0%;總體提升效果非常明顯,表明LSSA-BP 模型在煤層瓦斯含量預(yù)測方面具有一定優(yōu)勢;而對BP 模型的4 項(xiàng)指標(biāo)數(shù)值均較大的情況,是由于BP 模型在搜索過程中易陷入局部極小值,且搜索效率較低,甚至出現(xiàn)“過擬合”現(xiàn)象的原因。
通過對比3 種模型預(yù)測結(jié)果的4 項(xiàng)指標(biāo),LSSA-BP 預(yù)測模型的各項(xiàng)指標(biāo)均為最優(yōu),可滿足在煤層瓦斯含量準(zhǔn)確預(yù)測的需要。
1)通過灰色關(guān)聯(lián)分析法計算出各個因素與煤層瓦斯含量之間的關(guān)聯(lián)度,可篩選出影響煤層瓦斯含量的主控因素,從而能確定模型的輸入層節(jié)點(diǎn)個數(shù),降低模型的數(shù)據(jù)維度,減小模型的計算量和預(yù)測誤差。
2)利用Logistic 混沌映射初始化麻雀種群,可增加種群多樣性,擴(kuò)大全局搜索能力,并通過LSSA 對BP 神經(jīng)網(wǎng)絡(luò)權(quán)值和閾值的優(yōu)化,所建立的基于LSSA-BP 的煤層瓦斯含量預(yù)測模型,有效解決了單一BP 模型收斂速度慢和易陷入局部極小的問題。
3)就訓(xùn)練結(jié)果對比,LSSA-BP 模型較SSABP 模型對數(shù)據(jù)的學(xué)習(xí)迭代次數(shù)明顯減少,具有較強(qiáng)的尋優(yōu)能力。通過對比LSSA-BP、SSA-BP 和BP 模型預(yù)測結(jié)果,LSSA-BP 模型的預(yù)測值與實(shí)測值貼合度較好,具有更佳的穩(wěn)定性。同時,LSSABP 模型的平均絕對誤差(MAE)、均方誤差(MSE)、均方根誤差(RMSE)和平均絕對百分比誤差(MAPE)分別為0.346 9 m3/t、0.172 1 m3/t、0.414 9 m3/t 和27.403 6%均優(yōu)于其他模型,具有較高的精準(zhǔn)度。由此表明,LSSA-BP 模型在煤層瓦斯含量預(yù)測方面具有一定的優(yōu)勢,可為煤礦瓦斯災(zāi)害防治提供比較可靠的分析和決策依據(jù)。
4)在本次煤層瓦斯含量預(yù)測研究中,樣本數(shù)據(jù)初步選取為7 個具有代表性且易于量化的影響因素,并且樣本數(shù)量有限;在今后的研究中,進(jìn)一步豐富樣本數(shù)據(jù)的類型和數(shù)量預(yù)測效果會更佳。另外,當(dāng)訓(xùn)練樣本數(shù)目較多時,LSSA-BP 模型訓(xùn)練耗時較長,未來需在這方面有進(jìn)一步的優(yōu)化提升,以提高模型在煤層瓦斯含量預(yù)測方面的實(shí)用性。