• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于隨機森林的礦壓預測方法

      2021-08-26 02:17:14冀汶莉劉藝欣
      采礦與巖層控制工程學報 2021年3期
      關鍵詞:礦壓巖層光纖

      冀汶莉,劉藝欣,柴 敬,王 斌

      1. 西安科技大學 通信與信息工程學院,陜西 西安 710054;2. 西安科技大學 西部礦井開采及災害防治教育部重點實驗室,陜西 西安 710054;3. 西安科技大學 能源學院,陜西 西安 710054 )

      煤炭一直以來都是我國的主體能源。隨著煤礦開采深度和強度的加大,煤壁片幫、支架“壓死”、地表坍塌等礦壓顯現(xiàn)愈加劇烈,制約著礦井的安全高效生產(chǎn)[1-2]。工作面來壓直接影響了安全生產(chǎn),其中來壓步距和強度是其重要特征,因此工作面來壓的準確預測對于指導煤礦安全高效生產(chǎn)有著重要意義[3-6]。

      國內(nèi)外學者從不同的角度研究了礦壓顯現(xiàn)的預測方法,第一類是基于統(tǒng)計學與數(shù)值模擬等數(shù)學方法的礦壓顯現(xiàn)預測研究?;舯躘7]等依據(jù)不同開采因素對礦壓顯現(xiàn)的定量影響關系,利用模糊數(shù)學理論建立了堅硬頂板煤層礦壓顯現(xiàn)分級預測模型,可在工作面開采前較準確地評估開采過程中礦壓顯現(xiàn)強度的等級;張通[8]等采用回歸分析和概率統(tǒng)計的方法,結(jié)合淺埋工作面現(xiàn)場實測礦壓數(shù)據(jù)分析工作面覆巖硬度指數(shù)、工作面長度、開采高度及埋深與工作面礦壓顯現(xiàn)之間的非線性關系,并估算出工作面礦壓最大值、初次及周期來壓步距等信息;金寶圣[9]等利用現(xiàn)場實測及數(shù)值模擬的方法對麻家梁礦的頂板破斷特征進行研究,得出的來壓步距與現(xiàn)場實測數(shù)據(jù)基本一致。這類方法計算得出的礦壓顯現(xiàn)強度及來壓步距等參數(shù),只是在工作面開采前宏觀評估礦壓顯現(xiàn)的強度及來壓步距的范圍,在實際開采過程中來壓位置或來壓步距則隨工作面的推進而動態(tài)變化。因此,上述方法并非真正意義上的工作面礦壓預測。

      第二類是基于礦壓監(jiān)測系統(tǒng)產(chǎn)生的監(jiān)測數(shù)據(jù),利用機器學習或深度學習等智能算法進行礦壓預測研究[10]。趙毅鑫[11]等運用長短時記憶網(wǎng)絡( LSTM )深度學習方法建立了礦壓預測模型,較為準確地預測了紅慶河大采高工作面礦山壓力,由于只選取位于工作面中間位置的支架壓力數(shù)據(jù),未全面反映不同支架的壓力數(shù)據(jù)和礦壓顯現(xiàn)之間的非線性關系。隨著新技術的發(fā)展,分布式感測技術被引入礦山圍巖變形監(jiān)測及礦壓顯現(xiàn)的研究中,柴敬[12-13]等將分布式光纖傳感系統(tǒng)應用于煤層采動過程中覆巖變形監(jiān)測及來壓判別,定義了光纖頻移平均變化度的概念,通過光纖頻移平均變化度的經(jīng)驗閾值判別工作面礦壓的發(fā)生情況;并在此基礎上,引入混沌理論,采用XGBoost算法建立礦壓顯現(xiàn)預測模型,取得了一定的效果,但此方法只能預測未來的光纖頻移平均變化度,仍需以經(jīng)驗閾值進行來壓判別。綜上可知,目前光纖傳感技術在礦山圍巖監(jiān)測中的應用仍處于現(xiàn)場應用研究階段,將分布式光纖用于工作面礦壓監(jiān)測及預測還處于實驗室和理論研究階段,未見實際的工程應用[14]。

      筆者以相似材料物理模擬試驗中分布式光纖監(jiān)測數(shù)據(jù)為數(shù)據(jù)源,引入多步逆向云變換( MBCTSR ),并利用機器學習算法中的隨機森林( Random Forest,RF ),建立MBCT-SR-RF工作面來壓位置預測模型,對相似物理模型試驗工作面開采過程中的來壓位置進行預測。

      1 試驗背景與礦壓分析

      1.1 試驗背景與光纖頻移值

      以千秋煤礦工作面上覆巖層的實際組成為原型,利用相似材料模擬搭建了工作面及上覆巖層的三維立體物理模型,模型的相似比為1∶400,尺寸為360 cm×200 cm×200 cm,模擬單個工作面長度為60 cm,煤層厚度為6 cm,上覆巖層厚度為174 cm。三維立體模型如圖1( a )所示。在相似材料物理模型搭建的過程中,沿工作面開采方向在模 型的120,180,240 cm處的上覆巖層內(nèi)布設了3根垂直光纖FV1,F(xiàn)V2和FV3,垂直光纖的分布如圖1( b )所示。每根垂直光纖上可以獲得174個監(jiān)測位置的數(shù)據(jù)。

      圖1 相似材料物理模型組成 Fig. 1 Physical model composition diagram of similar materials

      模擬煤層厚度為6 cm,模擬工作面開挖步距為4 cm,共計開挖60次,推進距離為240 cm。在開挖過程中,光纖監(jiān)測系統(tǒng)采集3根垂直光纖上所有測點的監(jiān)測值。為了表征巖體的變形情況,定義了光纖頻移值的概念[15],表達式為

      通過物理模擬試驗,研究光纖頻移值與工作面周期來壓之間的表征關系。

      1.2 工作面礦壓觀測及分析

      在模擬試驗過程中工作面共出現(xiàn)了1次初次來壓和15次周期來壓,記錄每次來壓的位置和來壓步距等試驗數(shù)據(jù),見表1。

      表1 三維立體模型試驗礦壓觀測數(shù)據(jù) Table 1 Three-dimensional model test rock pressure observation data

      假設在物理模型試驗中單根垂直光纖上有n個光纖傳感器測點,在工作面第i次開采時可得到當前垂直光纖上每個監(jiān)測點的光纖頻移值集合表示當前垂直光纖上的監(jiān)測點總數(shù)。每根垂直光纖在整個開采周期內(nèi)產(chǎn)生60組Xi,頻移值集合記為U,則。三維立體模型內(nèi)鋪設有3根垂直光纖,將垂直光纖獲得的頻移數(shù)據(jù)集記為D,則

      研究表明光纖頻移值可以表征上覆巖層的變形、破斷及垮落的狀態(tài)[15-16],而工作面周期來壓的發(fā)生與上覆巖層的變形狀態(tài)有直接關系,光纖頻移值可以用來表征工作面初次來壓和周期來壓的發(fā)生。定義分布式光纖頻移平均變化度的概念來反映工作面來壓的發(fā)生情況[17],表達式為

      式中,Dx為工作面推進x距離時光纖頻移平均變化度;n為某根光纖傳感器上所有傳感器測點個數(shù)。

      因此,可以通過光纖平均頻移變化度的經(jīng)驗閾值判定周期來壓的發(fā)生情況。

      上覆巖層中垂直光纖不同測點的光纖頻移值蘊含了與工作面礦壓顯現(xiàn)的相關信息,即光纖頻移值與工作面周期來壓之間具有復雜的非線性關系。機器學習算法可以很好地表達這種復雜非線性關系。因此,本文提出基于隨機森林的工作面來壓位置預測模型。

      2 基于隨機森林的工作面來壓位置預測模型

      2.1 隨機森林算法

      隨機森林算法是BREIMAN L[18]在2001年提出的以決策樹為基分類器的集成學習算法,其能夠處理分類和回歸問題。RF在訓練階段,使用自助法重采樣( Bootstrap )技術從輸入訓練數(shù)據(jù)集中采集多個不同的子訓練數(shù)據(jù)集來依次訓練多個不同決策樹,將這些決策樹擬合到數(shù)據(jù)集的各個子樣本上。在預測階段,通過計算隨機森林內(nèi)部決策樹的預測結(jié)果的平均值得到最終預測值,以提高預測的準確性。在訓練過程中等價于式( 3 )的優(yōu)化問題[19]。

      式中,G為決策樹的平方誤差和;lc為決策樹終端葉子節(jié)點的預測值;yi為數(shù)據(jù)集中第i個樣本的輸出值。

      隨機森林回歸算法流程如圖2所示,算法的實現(xiàn)流程如下:

      圖2 隨機森林算法訓練流程 Fig. 2 Training flowchart of random forest algorithm

      ( 1 ) 通過Bootstrap重采樣方法從原始樣本集X中有放回地抽取ntree個樣本,作為訓練數(shù)據(jù)集;

      ( 2 ) 對抽取到的ntree個樣本分別生成對應的ntree個回歸決策樹模型;

      ( 3 ) 設樣本集X包含M個特征屬性,從M個屬性中隨機選取m個屬性作為子集(m<M),根據(jù)最小Ginni系數(shù)原則從這個子集中選取最優(yōu)屬性作為分裂變量;

      ( 4 ) 重復步驟( 1 )~( 3 ),建立多個決策回歸樹組成隨機森林,分別利用ntree個回歸決策樹進行回歸預測。將新樣本數(shù)據(jù)輸入隨機森林,并取每個決策樹預測結(jié)果的平均值作為最終的預測結(jié)果。

      2.2 工作面來壓預測的特征提取

      2.2.1 垂直光纖的加權(quán)頻移平均變化度

      光纖頻移平均變化度忽略了工作面上覆巖層具有不同的巖性,隨著工作面的推進,不同巖層變形狀態(tài)不一致,對工作面周期來壓的影響程度也各不相同。為了更準確地表達不同巖層變形對工作面周期來壓的影響,定義光纖加權(quán)頻移平均變化度xV,表達式為

      式中,Vx為工作面推進至x距離時光纖加權(quán)頻移平均變化度;p為上覆巖層的層數(shù);wr為權(quán)重系數(shù),表示第r層覆巖變形對礦壓顯現(xiàn)的影響程度;Dr為光纖測點所在第r層的光纖頻移平均變化度;為第r層內(nèi)第k個光纖測點在第i次開挖時的頻移值;m為第r層覆巖內(nèi)光纖的監(jiān)測點個數(shù)。

      根據(jù)相似物理模型的配比,將工作面上覆巖層分為5類,對應物理模型的1~16,35~96,160~174 cm為軟弱巖層,17~34 cm為亞關鍵層,97~159 cm為關鍵層。按照各層所在模型高度從上至下將巖層依次標記為1~5。采用極端隨機樹( Etra-Trees )[20]模型計算5類巖層中埋設光纖的頻移變化度的權(quán)重系數(shù)rw。該模型的輸入為工作面開采過程中獲得第r層內(nèi)光纖頻移值的算術平均值,即,輸出為當前時刻工作面的礦壓發(fā)生情況,用“1”表示有周期來壓發(fā)生,“0”表示無周期來壓發(fā)生,權(quán)重系數(shù)wr在隨機數(shù)迭代優(yōu)化過程中計算得出。采用Etra-Trees模型對三維立體模型試驗中的訓練部分歷史數(shù)據(jù)進行計算,得到權(quán)重系數(shù)訓練集的數(shù)據(jù),見表2。

      表2 訓練部分數(shù)據(jù)得到各巖層內(nèi)頻移平均 變化度的權(quán)重系數(shù) Table 2 Weight distribution of the average change degree of the frequency shift within calculated from the training data

      由表2可知,3根垂直光纖對應的不同權(quán)重系數(shù)反映了開采過程中不同巖層變形對工作面周期來壓發(fā)生的影響程度。其中FV1垂直光纖離開切眼最近,也是最先監(jiān)測到第1層巖石的垮落,即第1層覆巖變形對工作面周期來壓的影響最大,權(quán)重也最大;而第4層關鍵層和第2層亞關鍵層的權(quán)重次之,說明該層內(nèi)巖石變形對周期來壓的影響也較大;巖層最上方的軟弱巖層即第5層的權(quán)重最小,巖石變形對周期來壓的影響最小。FV2垂直光纖位于整個開采工作面的中部,其經(jīng)歷了巖石多種形態(tài)的變形過程,因此整體上對工作面來壓的影響高于第1和第3根光纖,且各層權(quán)重的均值比其他2根大。而FV3垂直光纖的位置接近工作面開采的結(jié)束部位,對工作面來壓影響最大的是關鍵層。由此可知,利用Etra-Trees模型得到的計算結(jié)果符合物理模擬試驗的相關結(jié)論。

      考慮到模型預測的有效性和準確性,筆者同時采用三維立體模型試驗的全部歷史數(shù)據(jù)進行了光纖頻移平均變化度的權(quán)重系數(shù)的計算,計算結(jié)果見表3。 訓練部分數(shù)據(jù)與全部歷史數(shù)據(jù)得到的各巖層內(nèi)頻移平均變化度的權(quán)重系數(shù)偏差,見表4。

      表3 全部歷史數(shù)據(jù)得到各巖層內(nèi)頻移平均 變化度的權(quán)重系數(shù) Table 3 Weight distribution of the average change degree of frequency shift within each rock layer calculated from all historical data

      表4 不同數(shù)據(jù)集光纖頻移平均變化度的權(quán)重系數(shù)偏差 Table 4 Error of fiber weighted frequency shift average change degree on different data-sets

      由表4可知,訓練集部分光纖監(jiān)測數(shù)據(jù)與全部光纖監(jiān)測數(shù)據(jù)得到的頻移平均變化度的權(quán)重系數(shù)偏差均在0.087以內(nèi),說明訓練集和測試集對應巖層權(quán)重系數(shù)的分布是一致的。因此,可以使用訓練數(shù)據(jù)獲得的權(quán)重系數(shù)處理光纖頻移值,得到加權(quán)頻移平均變化度,進而構(gòu)建預測模型的輸入樣本是可行的。

      2.2.2 垂直光纖頻移值的統(tǒng)計特征

      數(shù)據(jù)集的統(tǒng)計特征在宏觀上反映了數(shù)據(jù)的真實變化情況,通過1.2節(jié)分析可知,3根垂直光纖所有測點在某一次工作面推進時會產(chǎn)生3個獨立的數(shù)據(jù)集U,U中每一個數(shù)據(jù)子集i X都具有獨立的統(tǒng)計特性。在機器學習中數(shù)據(jù)集的統(tǒng)計特性可以作為樣本重要的特征屬性,為了更準確地描述每根光纖在工作面開挖時產(chǎn)生的頻移數(shù)據(jù)的統(tǒng)計特征,引入多步逆向云變換算法( Multi-step backward cloud transformation algorithm based on sampling with replacement,MBCT-SR )[21],該算法為基于云模型理論計算Ex,En,He的改進方法[22-23]。

      MBCT-SR算法的計算步驟如下:

      Step2:對光纖頻移數(shù)據(jù)集Xi進行隨機可重復的抽樣,每次抽取r個數(shù)據(jù)為一組,共抽取m組( 其中m,r∈N+,m和r的乘積不一定等于n),形成新的子集,并計算每組數(shù)據(jù)集的期望,計算公式為

      2.3 工作面礦壓位置預測模型的構(gòu)建

      預測模型整體流程框架如圖3所示,模型構(gòu)建的主要步驟如下:

      圖3 工作面礦壓預測模型整體流程 Fig. 3 Overall flow chart of mine pressure of working face prediction mode

      ( 1 ) 數(shù)據(jù)預處理

      數(shù)據(jù)預處理是模型訓練的基礎,為保證預測結(jié)果的準確性,需要對原始頻移數(shù)據(jù)進行預處理,包括去除噪聲和數(shù)據(jù)清洗。采用小波去噪的方法去除頻移數(shù)據(jù)的噪聲。數(shù)據(jù)清洗包含缺失值填補和異常數(shù)據(jù)去除,采用鄰近均值法,根據(jù)相關性分析確定離缺失值或異常數(shù)據(jù)最近樣本,對其計算加權(quán)平均值來代替異常值或缺失值。同時為減小不同值域數(shù)據(jù)樣本特征對模型訓練的影響,通過差分歸一化方法將數(shù)據(jù)轉(zhuǎn)換成均值為0,標準差為1的形式。

      ( 2 ) SMOTE數(shù)據(jù)增強

      由于相似物理模擬試驗采集到的光纖頻移樣本數(shù)據(jù)有限,為提高模型的預測精度,采用SMOTE( Synthetic Minority Over-sampling Technique )算法對光纖頻移時間序列數(shù)據(jù)進行數(shù)據(jù)增強。通過SMOTE提高樣本容量,從而提高模型的預測精度。

      ( 3 ) 樣本數(shù)據(jù)特征值提取

      采用光纖加權(quán)頻移平均變化度作為工作面來壓位置預測方法的輸入樣本特征。采用3根垂直光纖在第i次開采時全測點頻移值集合的期望Ex、熵En和超熵He,作為工作面來壓位置預測方法的輸入特征。

      ( 4 ) 工作面來壓位置預測模型的構(gòu)建

      將上述垂直光纖加權(quán)頻移平均變化度,以及光纖頻移數(shù)據(jù)的統(tǒng)計特征作為模型訓練的輸入樣本,建立基于隨機森林算法的礦壓預測模型,模型輸出為未來時刻工作面礦壓發(fā)生位置,并評估模型的性能。

      2.4 預測模型的評價指標

      選用均方根誤差RMSE( Root Mean Squares Error )、平均絕對誤差MAE( Mean Absolute Error )和平均絕對百分比誤差MAPE( Mean Absolute Percentage Error )作為預測模型性能的評價指標,計算公式為

      式中,yi為實際值;為預測值;n為樣本個數(shù)。

      RMSE是回歸預測中常用的評價指標,但易受異常值的影響。MAPE用來評估相對誤差,降低了個別離群點帶來的絕對誤差影響。3個評價指標的值越小表示預測值與真實值之間的偏差越小,模型的預測性能越好。

      3 仿真試驗與結(jié)果分析

      3.1 預測樣本集構(gòu)成

      相似材料物理模型試驗中,3根光纖各產(chǎn)生了60組不同測點的頻移數(shù)據(jù)。在試驗過程中發(fā)生了1次初次來壓和15次周期來壓,對應的周期來壓位置見表1。構(gòu)造的樣本集見表5,其中1?Ex,1?En,1?He為垂直光纖FV1全測點在工作面推進一次所獲得的光纖頻移數(shù)據(jù)的期望、熵和超熵的估計值;1xV為垂直光纖FV1頻移值的加權(quán)頻移平均變化度,垂直光纖FV2和FV3同理;Y表示模型輸出,即未來時刻工作面來壓發(fā)生的位置。

      表5 樣本集部分數(shù)據(jù) Table 5 Partial data display of sample set

      將樣本數(shù)據(jù)集劃分為訓練集和測試集。3根垂直光纖上的測點產(chǎn)生的頻移數(shù)據(jù)具有時間序列的特征,取前40次模擬開采獲得的樣本數(shù)據(jù)作為訓練集進行預測模型的訓練,并采用十折交叉法驗證模型的有效性。利用訓練好的模型,根據(jù)當前時刻測點頻移值計算出輸入樣本就可以預測未來時刻周期礦壓發(fā)生的位置。為了驗證預測模型的有效性和準確性,將剩余20次模擬開采產(chǎn)生的數(shù)據(jù)作為測試集,與模擬試驗中實際周期來壓位置進行比較,評估預測模型的性能。

      3.2 模型的參數(shù)設置

      本文基于Python語言,使用scikit-learn庫中Ensemble框架內(nèi)的RandomForestRegressor. predict( )函數(shù)建立RF模型。RF算法在建模過程中首先需要設定2個參數(shù),即決策樹的數(shù)量n_estimators和每棵樹的最大特征變量max_features。若n_eatimators太小容易導致模型欠擬合,太大則不能顯著提升模型的性能。最大特征變量值max_features越小則隨機森林中決策樹的差異越大,導致模型產(chǎn)生過擬合而降低算法精度,最大特征變量值max_features越大則會降低模型的運算速度,一般情況下max_ features=2log( n_features ),n_features為樣本集中特征向量的維度。

      在RF訓練過程中需要優(yōu)化的2個參數(shù)為決策樹最大深度max_depth和節(jié)點可分的最小樣本數(shù)min_samples_split。

      在訓練過程中,對n_estimators,max_depth,min_samples_split等3個參數(shù)采用網(wǎng)格搜索方法進行尋優(yōu),即給定n_estimators的參數(shù)范圍為[10,200],步長為10;max_depth和min_samples_split的參數(shù)范圍為[1,10],步長為1。通過網(wǎng)格搜索遍歷給定參數(shù) 后 得 到n_estimators=100,max_depth=4,min_ samples_split=2。

      為驗證預測模型的有效性,在相同試驗環(huán)境和數(shù)據(jù)集條件下,分別采用BP神經(jīng)網(wǎng)絡、SVM支持向量機方法建立預測模型,與隨機森林方法進行對比分析。SVM算法的核函數(shù)選取高斯徑向基函數(shù)( RBF ),σ和懲罰因子C是影響SVM回歸性能的2個重要參數(shù),其中σ決定數(shù)據(jù)映射到在新特征空間的分布狀態(tài),不同取值會影響模型在測試集中的準確率;懲罰因子C能夠平衡模型的逼近誤差和復雜度,C越大越容易過擬合,越小則容易欠擬合,2種情況都會使模型的精度變差。在模型訓練過程中對參數(shù)進行尋優(yōu)后得到最優(yōu)參數(shù)組合為σ=0.01,C=10。BP神經(jīng)網(wǎng)絡模型的激活函數(shù)選用relu,并通過模型的不斷迭代確定最優(yōu)的輸入權(quán)重、輸出權(quán)重和隱藏層連接的權(quán)重。

      3.3 試驗結(jié)果分析

      根據(jù)RF,SVM,BP等3種學習算法的最優(yōu)參數(shù)組合建立對應的預測模型,各模型訓練集的預測結(jié)果如圖4所示。

      圖4 工作面礦壓位置訓練集預測訓練結(jié)果 Fig. 4 Prediction training results of mine pressure position training set in working face

      由圖4( a )可知,在模型訓練階段,沒有打亂訓練樣本數(shù)據(jù)集時,BP,SVM和RF模型的擬合能力都較差。3個預測學習曲線在第15次和第22次開采時都出現(xiàn)了向下的尖峰,而對應位置的真實曲線是水平的,特別是SVM模型在整個模型訓練階段的預測結(jié)果與真實值之間的偏差較大,總體來看出現(xiàn)預測值在真實曲線上下波動的情況,說明模型對數(shù)據(jù)樣本的學習不夠徹底。為了在模型訓練過程中消除數(shù)據(jù)之間的相關性,減少模型的過擬合,在訓練過程中打亂了訓練集順序。由圖4( b )可知,在打亂訓練樣本數(shù)據(jù)集后,模型較全面地學習了訓練樣本輸入和輸出之間復雜的非線性關系,BP,SVM和RF模型的預測精度均得到了提升,且均能較好地擬合真實值。但相對來說SVM的學習表現(xiàn)最差,在第3,12,29和36次都有較大的誤差,而這些點均與前一次樣本數(shù)據(jù)間存在較大的數(shù)據(jù)落差。表6為3種預測模型在訓練階段的各項性能評估指標。

      表6 不同預測模型訓練集性能評價指標對比 Table 6 Comparison of performance evaluation indexes of different prediction model on training sets

      由表6可知,無論是否打亂訓練樣本順序,在訓練集中3個模型的RMSE,MAE和MAPE均較小,但打亂訓練樣本順序的訓練模型性能更好。相較于BP和RF預測模型,SVM預測模型的總體誤差相對較大,RF在訓練階段表現(xiàn)更優(yōu)。

      各模型測試集的預測結(jié)果如圖5所示。

      圖5 工作面礦壓位置測試集預測訓練結(jié)果 Fig. 5 Prediction training results of mine pressure position test set in working face

      由圖5可知,在測試集中BP神經(jīng)網(wǎng)絡模型、SVM支持向量機模型的預測值與真實值有較大的偏差。對于BP神經(jīng)網(wǎng)絡模型在第40,41,42,45,46,47,49次開采時的預測曲線與真實值的誤差較大,原因為BP易陷入局部最優(yōu),在訓練過程中出現(xiàn)了過擬合現(xiàn)象,導致預測模型在測試集中表現(xiàn)較差。對于SVM支持向量機模型在第40,41,42,48,49,52,53,57次預測值都與真實值有較大偏差。總體來看,在測試集中RF預測模型整體上與真實值之間的擬合效果最優(yōu),僅在第45,46,56,57次開采時預測值與真實值有一定偏差,原因為當開采工作臨近結(jié)束時光纖頻移值變化較為緩慢,導致預測效果不佳,但與BP神經(jīng)網(wǎng)絡模型、SVM模型在對應位置相比偏差更小,預測效果表現(xiàn)更優(yōu)。

      當利用歷史監(jiān)測數(shù)據(jù)生成的訓練樣本集完成預測模型的訓練后,就可以用模型進行未來時刻工作面來壓位置的預測。如,將第42次模擬開采時3根垂直光纖所獲得的頻移值,利用2.2節(jié)特征值提取方法計算得到輸入樣本;然后輸入預測模型進行計算,輸出結(jié)果是未來時刻發(fā)生周期來壓的位置180.3 cm,與試驗記錄的真實值184 cm偏差為3.7 cm,可以認為預測有效。表7為預測過程中預測值與真實值的偏差。

      表7 預測值與真實值的偏差 Table 7 Error between the predicted value and the true value

      表8為測試集中各預測模型的性能評價指標。將3個預測模型的評價指標與表6中亂序訓練集對應的指標相比,每個預測模型的性能評價指標變大,說明3種模型在測試集上的預測性能低于訓練集。BP模型的各項指標顯著大于亂序訓練集,說明BP模型在訓練階段出現(xiàn)了過擬合現(xiàn)象,導致測試集的誤差明顯增大。SVM預測模型在測試集的RMSE顯著低于BP模型,但MAE和MAPE值的大小與BP模型評估指標的值非常接近。RF預測模型在測試集中的評價指標均最小,表明RF預測模型的準確性和魯棒性在3個預測模型中最優(yōu)。

      表8 不同預測模型測試集性能評價指標對比 Table 8 Comparison of performance evaluation indexes of different prediction models on test sets

      3.4 工作面來壓位置預測模型泛化能力分析

      3.4.1 樣本數(shù)據(jù)擴充后預測模型性能分析

      筆者使用的數(shù)據(jù)樣本屬于小樣本,為了提升預測效果及預測模型的普適性,使用SMOTE數(shù)據(jù)增強技術對原始數(shù)據(jù)進行了擴充,擴充后訓練集為79個樣本數(shù)據(jù),測試集保持不變。

      預測結(jié)果如圖6所示,性能評價指標見表9。由圖6和表9可知,當樣本數(shù)據(jù)擴充后預測效果都有了進一步的提升,更加接近真實值。

      圖6 數(shù)據(jù)擴展后工作面來壓位置預測測試結(jié)果 Fig. 6 Predictive results of pressing position on test data sets after data augmentation

      表9 數(shù)據(jù)擴展后不同預測模型性能評價指標對比 Table 9 Comparison of performance evaluation used different prediction models after data augmentation

      從表9中可以看出,3種預測方法的各項評價指標均低于未進行數(shù)據(jù)擴充的指標值,同時相比于其他2種預測模型,RF模型的性能指標也低于其他2個預測模型。說明在進行數(shù)據(jù)擴充后該預測模型有更優(yōu)的表現(xiàn)和更準確的預測效果。

      3.4.2 預測模型泛化能力分析

      為研究MBCT-SR-RF工作面礦壓位置預測模型的泛化能力,以內(nèi)蒙古某礦工作面地質(zhì)結(jié)構(gòu)為原型搭建的相似材料模擬試驗產(chǎn)生的光纖監(jiān)測數(shù)據(jù)及工作面來壓數(shù)據(jù)作為預測模型的數(shù)據(jù)源。物理模型內(nèi)沿工作面開采方向布置3根垂直光纖,煤層厚4 cm,開挖步距為3 cm,共計開挖51步。

      采用與前述相同的樣本特征提取和樣本集構(gòu)造方法,共產(chǎn)生51個樣本數(shù)據(jù),其中前35個樣本用于模型訓練,后16個樣本用于預測模型性能測試。3種預測模型的預測結(jié)果如圖7所示,預測性能的評估指標見表10。

      圖7 內(nèi)蒙古某礦模擬試驗中工作面來壓位置預測結(jié)果 Fig. 7 Predictive results of pressing position on test data sets by physical model based on Inner Mongolia mine

      表10 預測模型性能評價指標對比 Table 10 Comparison of prediction performance indicators on test data sets

      由圖7可知,新測試集中BP神經(jīng)網(wǎng)絡模型和SVM支持向量機的預測值與真實曲線之間存在較大的偏差,RF隨機森林預測模型的擬合效果最優(yōu),預測值與實際來壓位置基本一致,表示模型預測性能穩(wěn)定。由表10可知,RF隨機森林預測模型的RMSE,MAE和MAPE值最小,說明RF隨機森林的預測模型具有穩(wěn)定的非線性擬合能力和較強的泛化能力,對于處理光纖頻移數(shù)據(jù)與工作面來壓之間的非線性關系,是一種簡單、準確、穩(wěn)定、可靠的方法。結(jié)合垂直光纖全測點頻移值的期望、熵和超熵統(tǒng)計特征和光纖加權(quán)頻移平均變化度作為輸入樣本,基于RF隨機森林工作面礦壓位置預測是一種有效的礦壓預測方法。

      4 結(jié) 論

      ( 1 ) 針對光纖加權(quán)頻移平均變化度,采用隨機森林算法,考慮了不同巖性和厚度的巖層對工作面礦壓的影響程度,可以對工作面礦壓進行預測。

      ( 2 ) 引入多步逆向云變換算法,提取了以期望、熵和超熵為重要屬性的樣本特征,融合光纖加權(quán)頻移平均變化度形成了輸入樣本數(shù)據(jù),提高了模型的預測性能。 ( 3 ) 將基于RF隨機森林的預測模型與BP神經(jīng)網(wǎng)絡、SVM支持向量機預測方法在相同樣本集下進行預測效果對比,MBCT-SR-RF預測模型具有較強的準確性、穩(wěn)定性和泛化能力,適用于分布式光纖監(jiān)測的礦壓顯現(xiàn)位置預測。

      猜你喜歡
      礦壓巖層光纖
      Spain
      高應力巖層巷道鉆孔爆破卸壓技術
      FIBBR King-A系列HDMI光纖線
      地球故事之復理石巖層
      高品質(zhì)的忠實還原 FIBBR Ultra Pro2 HDMI光纖線
      一條光纖HDMI線的誕生長飛/長芯盛FIBBR工廠走訪實錄
      全國產(chǎn)1550nm 窄脈寬光纖放大器
      電子制作(2017年13期)2017-12-15 09:00:11
      采煤工作面礦壓顯現(xiàn)規(guī)律影響因素分析
      綜放工作面礦壓顯現(xiàn)規(guī)律研究
      山西煤炭(2015年4期)2015-12-20 11:36:18
      礦壓監(jiān)測系統(tǒng)在煤礦安全管理中的應用
      機電信息(2014年27期)2014-02-27 15:53:59
      桑日县| 抚州市| 张北县| 米林县| 富蕴县| 永靖县| 嘉义县| 柳林县| 陆川县| 灵石县| 离岛区| 柘荣县| 灵武市| 建平县| 南城县| 黔东| 枞阳县| 陕西省| 平陆县| 鹤山市| 石首市| 肥城市| 鹤山市| 珠海市| 田阳县| 蕲春县| 瑞安市| 喀什市| 仙桃市| 淮滨县| 乌兰察布市| 临西县| 常山县| 昌邑市| 休宁县| 博乐市| 大埔区| 长沙县| 布拖县| 白沙| 奉贤区|