杜義康
【摘要】隧道工程地質(zhì)條件具有復(fù)雜多變的特點(diǎn),造成圍巖分級(jí)存在一定的模糊性。依托鄭萬高鐵湖北段隧道工程,文章建立了不同級(jí)別不同巖性的隨鉆參數(shù)與圍巖級(jí)別的數(shù)據(jù)庫,研究了推進(jìn)速度與其他隨鉆參數(shù)之間的相關(guān)性,建立了隨鉆參數(shù)與圍巖級(jí)別的Stacking集成學(xué)習(xí)模型,增加了模型分類的穩(wěn)定性,提高了模型預(yù)測(cè)準(zhǔn)確度。該方法解決了傳統(tǒng)隧道圍巖分級(jí)方法存在評(píng)價(jià)方法單一、評(píng)價(jià)不及時(shí)、主觀誤差大等問題。
【關(guān)鍵詞】隧道工程; 集成學(xué)習(xí); 圍巖分級(jí)
【中國分類號(hào)】U451+.2
【文獻(xiàn)標(biāo)志碼】
A
隧道圍巖級(jí)別是制定巖變我變、因巖施策的設(shè)計(jì)施工參數(shù)的主要依據(jù)。當(dāng)前,研究隧道圍巖分級(jí)方法主要分為間接方法和直接方法。其中,間接方法主要包括RQD方法、RMR方法、BQ方法。間接方法缺點(diǎn)是圍巖信息采集往往需要地質(zhì)人員到現(xiàn)場(chǎng)掌子面進(jìn)行巖石取樣與素描,存在人身安全風(fēng)險(xiǎn)。同時(shí),現(xiàn)場(chǎng)測(cè)試巖體強(qiáng)度條件下需要手動(dòng)輸入少量指標(biāo)參數(shù)代入經(jīng)驗(yàn)公式,難以全面、準(zhǔn)確地描述隧道圍巖的性能與狀態(tài)。
隨著信息技術(shù)與計(jì)算機(jī)技術(shù)的進(jìn)步,越來越多國內(nèi)外研究者開始關(guān)注直接方法,即應(yīng)用模糊數(shù)學(xué)[1-2]、高斯回歸聚類[3]、相關(guān)系數(shù)[4]、人工智能[5]等技術(shù),建立隨鉆參數(shù)與巖體之間的表征關(guān)系,快速評(píng)價(jià)隧道圍巖質(zhì)量,力求解決人為認(rèn)知差異性問題。程士俊[1]研究應(yīng)用專家系統(tǒng)實(shí)現(xiàn)圍巖自動(dòng)分級(jí)。Galende-Hernández, M [2]提出了應(yīng)用模糊與機(jī)器學(xué)習(xí)結(jié)合的方法,建立了隨鉆參數(shù)與圍巖級(jí)別的數(shù)學(xué)模型,快速評(píng)估隧道圍巖質(zhì)量。Navarro, J.[4]應(yīng)用互相關(guān)方法,研究了隨鉆變量之間的相關(guān)關(guān)系,得到推進(jìn)壓力超前于其他隨鉆參數(shù)。鄧洪亮[6]基于隧道監(jiān)控量測(cè)數(shù)據(jù),提出了圍巖動(dòng)態(tài)分級(jí)的修正公式。王琦[7]等基于能量分析法,推導(dǎo)了巖石單位切削能與隨鉆參數(shù)關(guān)系式,并依據(jù)試驗(yàn)結(jié)果建立了隨鉆參數(shù)與巖石單軸抗壓強(qiáng)度的DP -UCS 模型。姚萌[8]研究了利用支持向量機(jī)方法建立隨鉆參數(shù)與圍巖智能分級(jí)模型。
以上研究成果促進(jìn)了隧道圍巖分級(jí)進(jìn)步,但是這些成果多數(shù)研究了單一隨鉆參數(shù)(或單一建模方法)與巖體性質(zhì)映射關(guān)系,存在準(zhǔn)確率偏低、模型泛化性能差的問題。當(dāng)前,集成學(xué)習(xí)在數(shù)據(jù)建模與挖掘領(lǐng)域取得了非常好的效果,正逐漸成為研究的熱點(diǎn)。結(jié)合國內(nèi)外學(xué)者的研究,本文借鑒集成學(xué)習(xí)思想,提出將多個(gè)機(jī)器學(xué)習(xí)模型進(jìn)行融合,通過取長補(bǔ)短的方式建立性能更優(yōu)的集成學(xué)習(xí)模型,解決圍巖級(jí)別預(yù)測(cè)準(zhǔn)確率低、模型泛化性能差的難題。
1 項(xiàng)目背景
本項(xiàng)目主要依托鄭萬高鐵湖北段隧道工程展開,隧道有32.5座,隧道總長167.619 km,占本段線路總長58.37 %。隧道開挖斷面面積約150 m2,屬于單洞雙線大斷面隧道,工程線路見圖1所示。鄭萬高鐵湖北段隧道II、III、IV、V級(jí)圍巖主要涵蓋頁巖、灰?guī)r、白云巖、砂巖、泥巖、變質(zhì)砂巖、輝綠巖7種主要巖性,其中頁巖、灰?guī)r、白云巖、砂巖、泥巖5種巖性圍巖地段長度占比88.8 %。目前,該隧道的多個(gè)標(biāo)段均使用三臂鑿巖臺(tái)車進(jìn)行掌子面開挖,應(yīng)用鑿巖臺(tái)車構(gòu)建的自感知系統(tǒng),自動(dòng)采集鑿巖過程中的隨鉆參數(shù),其作業(yè)現(xiàn)場(chǎng)如圖2所示。
2 隧道圍巖智能分級(jí)方法構(gòu)建
2.1 數(shù)據(jù)樣本庫建立
本文建立的隨鉆參數(shù)與圍巖級(jí)別樣本庫主要來自高家坪隧道、楚烽隧道、新華隧道、向家灣隧道、香爐坪隧道及安久鐵路界子墩隧道等,涵蓋白云巖、變質(zhì)砂巖、灰?guī)r、頁巖、泥巖,主要包含III級(jí)、IV級(jí)、V級(jí)圍巖,如表1所示。對(duì)于有監(jiān)督機(jī)器學(xué)習(xí)分類問題,圍巖級(jí)別標(biāo)簽正確性將影響圍巖級(jí)別預(yù)測(cè)的準(zhǔn)確性。依據(jù)JTG D70-2004《公路隧道設(shè)計(jì)規(guī)范》,本文采集了掌子面地質(zhì)素描,并進(jìn)行了巖石回彈、單軸飽和壓縮強(qiáng)度、巖石波速、巖體波速等測(cè)試(圖3~圖5),驗(yàn)證現(xiàn)場(chǎng)地質(zhì)工程師標(biāo)注圍巖級(jí)別標(biāo)簽的正確性,具體計(jì)算過程詳見JTG D70-2004《公路隧道設(shè)計(jì)規(guī)范》。
2.2 相關(guān)性分析
鑿巖機(jī)隨鉆參數(shù)包含推進(jìn)速度、沖擊壓力、推進(jìn)壓力、回轉(zhuǎn)壓力、回轉(zhuǎn)速度、水壓力、水流量參數(shù)。其中,回轉(zhuǎn)速度設(shè)置為恒定值,本文不考慮。一般情況下,推進(jìn)速度一定程度上
反映了隧道圍巖地質(zhì)軟弱。因此,應(yīng)用Spearman方法分析推進(jìn)速度與其他隨鉆參數(shù)的相關(guān)系數(shù),獲得參數(shù)之間相關(guān)性。表2表示參數(shù)相關(guān)性強(qiáng)弱。
本文從隨機(jī)選取多個(gè)隧道施工輪次下的隨鉆數(shù)據(jù),由于篇幅限制,僅列出了5個(gè)輪次的計(jì)算結(jié)果。表3是沖擊壓力與推進(jìn)速度、推進(jìn)壓力與推進(jìn)速度的相關(guān)系數(shù)。從表3得到,沖擊壓力、推進(jìn)壓力均與推進(jìn)速度呈現(xiàn)正相關(guān),即增大沖擊壓力(或增大推進(jìn)壓力),增大推進(jìn)速度。同時(shí),發(fā)現(xiàn)輪次1~5的沖擊壓力與速度的相關(guān)系數(shù)大于推進(jìn)壓力與速度的相關(guān)系數(shù)。表4是水壓力、水流量與推進(jìn)速度的相關(guān)系數(shù)。從表4得到,水壓力、水流量與鉆孔速度相關(guān)系數(shù)最大值為0.29,大多數(shù)小于0.2,呈現(xiàn)弱相關(guān)性。因此,巖體狀態(tài)參數(shù)與機(jī)電液設(shè)備參數(shù)之間存在一定相關(guān)關(guān)系。
2.3 數(shù)據(jù)預(yù)處理
根據(jù)上文可知,深度、鉆孔速度、回轉(zhuǎn)壓力、推進(jìn)壓力、沖擊壓力參數(shù)較重要。在此基礎(chǔ)上,從能量轉(zhuǎn)換角度,本文計(jì)算了定性判斷隧道地層脆弱帶特征的巖石鉆進(jìn)量,增大數(shù)據(jù)樣本特征維度。針對(duì)鑿巖機(jī)意外停機(jī)、回退等情況,本文提出了符合實(shí)際情況的數(shù)據(jù)預(yù)處理規(guī)則,如表5所示。同時(shí),本文應(yīng)用歸一化方法對(duì)不同特征參數(shù)進(jìn)行無量綱化處理,避免特征參數(shù)數(shù)據(jù)量級(jí)影響。
式中:de為鉆進(jìn)能量(J/cm3),He為打擊能量(J),Ns為打擊次數(shù)(bpm),le為損失系數(shù),V為鉆進(jìn)速度(cm/min),Ap為孔隙剖面面積(cm2);
式中:Api為活塞受壓面積,Sp為活塞行程,Hp為沖擊壓力。
由于不同隧道的施工進(jìn)度有差異,隧道圍巖級(jí)別數(shù)目不一致,存在類樣本不平衡現(xiàn)象,導(dǎo)致分類器重視多數(shù)類而忽略少數(shù)類。為此,本文應(yīng)用SMOTE(Synthetic Minority Oversampling Technique)方法處理不平衡數(shù)據(jù)分類方法,解決數(shù)據(jù)不平衡問題。其中,SMOTE隨機(jī)過采樣策略的原理與推導(dǎo)過程參考文獻(xiàn)[9],本文不再贅述。
2.4 隧道圍巖分級(jí)集成學(xué)習(xí)模型
機(jī)器學(xué)習(xí)方法可以有效解決統(tǒng)計(jì)回歸模型難以處理的強(qiáng)非線性、高耦合性問題。支持向量機(jī)、隨機(jī)森林、KNN等方法具有較強(qiáng)的非線性問題建模能力。然而,單一機(jī)器學(xué)習(xí)方法也存在泛化能力弱的缺點(diǎn)。因此,需要研究Stacking多模型融合的集成學(xué)習(xí)方法克服單個(gè)學(xué)習(xí)器泛化能力弱的缺點(diǎn)。
2.4.1 Stacking集成學(xué)習(xí)模型
Stacking集成學(xué)習(xí)模型建立有兩個(gè)步驟:一是基分類器選擇與生成;二是組合策略選擇。首先,預(yù)處理后的隨鉆數(shù)據(jù)集輸入到第一層學(xué)習(xí)模型,即各個(gè)學(xué)習(xí)器,每個(gè)基學(xué)習(xí)器輸出各自的預(yù)測(cè)結(jié)果;然后,將第一層輸出結(jié)果作為第二層學(xué)習(xí)模型輸入,對(duì)元學(xué)習(xí)器進(jìn)行訓(xùn)練,再由元學(xué)習(xí)器輸出最終預(yù)測(cè)的圍巖級(jí)別,具體流程,如圖6所示。本文將采用支持向量機(jī)、K近鄰、隨機(jī)森林算法作為基學(xué)習(xí)器以及線性回歸算法作為元學(xué)習(xí)器,通過10折交叉驗(yàn)證方法對(duì)每個(gè)基學(xué)習(xí)器進(jìn)行訓(xùn)練,訓(xùn)練完成后,對(duì)測(cè)試樣本進(jìn)行測(cè)試。
2.4.2 學(xué)習(xí)器基本原理
支持向量機(jī)算法是基于結(jié)構(gòu)風(fēng)險(xiǎn)最小和VC維理論的傳統(tǒng)機(jī)器學(xué)習(xí)方法,通過對(duì)訓(xùn)練樣本構(gòu)建一個(gè)最優(yōu)分類超平面,達(dá)到各相對(duì)集中的訓(xùn)練樣本與最優(yōu)分類超平面的距離最遠(yuǎn)。該方法主要針對(duì)小樣本數(shù)據(jù)進(jìn)行學(xué)習(xí)、分類和預(yù)測(cè),它有一個(gè)正則化項(xiàng),有助于避免數(shù)據(jù)的過擬合,能夠很好地處理非結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù)。由于類標(biāo)簽和特征之間的關(guān)系是非線性關(guān)系,本專題選擇Gauss徑向基核函數(shù),可以將樣本映射到一個(gè)更高維空間。
KNN(K-nearest neighbot)算法的核心思想是:每個(gè)數(shù)據(jù)樣本都對(duì)應(yīng)特征空間的1個(gè)點(diǎn),如果在樣本空間內(nèi)1個(gè)距離當(dāng)前未知類別數(shù)據(jù)樣本最相鄰的K個(gè)已知類別樣本大多數(shù)屬于某一個(gè)類別,則當(dāng)前樣本也屬于這個(gè)類別[10]。KNN方法在類別決策時(shí),主要依靠周圍有限相鄰樣本,而不是依靠判別類域的方法來確定所屬類別的。因此,對(duì)于類域的交叉或重疊較多的待分樣本集來說,KNN方法較其他方法更為適合。
隨機(jī)森林算法是使用分類回歸樹生成的決策樹作為基分類器,在構(gòu)建Bagging集成基礎(chǔ)上,進(jìn)一步在決策樹的訓(xùn)練過程中引入了隨機(jī)屬性選擇,依靠于決策樹的投票選擇來決定最后的分類結(jié)果[11]。該算法的特點(diǎn)能夠處理具有高維特征的輸入樣本。
線性回歸算法是應(yīng)用多元線性公式解決回歸問題,線性回歸算法結(jié)構(gòu)簡單,原理易懂,同時(shí)又包含了機(jī)器學(xué)習(xí)算法的典型特征,是機(jī)器學(xué)習(xí)算法的典型代表[12]。
2.4.3 模型結(jié)果分析
2.4.3.1 分類模型評(píng)估指標(biāo)
模型評(píng)估指標(biāo)用于反映模型效果,需要將模型預(yù)測(cè)結(jié)果和真實(shí)標(biāo)注進(jìn)行比較。對(duì)于分類模型往往用混淆矩陣(表6)來進(jìn)行效果評(píng)價(jià),其中TP表示樣本標(biāo)簽為正且模型預(yù)測(cè)結(jié)果也為正的樣本數(shù)量,F(xiàn)P、FN和TN的含義類似,不再贅述。在混淆矩陣基礎(chǔ)上,引申出精準(zhǔn)率、召回率、F1-score多個(gè)評(píng)估指標(biāo),可以從不同角度來評(píng)價(jià)分類結(jié)果的優(yōu)劣。為此,本文采用精準(zhǔn)率、召回率、f1-score、準(zhǔn)確率評(píng)估指標(biāo),全面評(píng)估KNN、SVM、RandomForest以及Stacking模型分類效果。各項(xiàng)評(píng)估指標(biāo)定義及表達(dá)式如下所示:
(1)準(zhǔn)確率(Accuracy):分類正確的樣本占所有樣本的比重,反映分類整體上正確率的評(píng)價(jià)。
(2)精確率(precision):在所有預(yù)測(cè)類別為正的樣本中,模型預(yù)測(cè)正確的樣本所占比重,反映分類器預(yù)測(cè)為某一個(gè)圍巖級(jí)別正確率。
2.4.3.2 分類模型結(jié)果討論
將交叉驗(yàn)證的測(cè)試集輸入到訓(xùn)練好的模型,對(duì)圍巖級(jí)別進(jìn)行分類效果進(jìn)行評(píng)估。本文采用精準(zhǔn)率、召回率、f1-score、正確率指標(biāo)全面評(píng)估單個(gè)分類器、集成分類器學(xué)習(xí)效果的優(yōu)劣,計(jì)算結(jié)果如表7~表10所示。從表7~表10可知,在Ⅲ、Ⅳ、Ⅴ圍巖條件下,RandomForest模型的精準(zhǔn)率、召回率、f1-score、正確率指標(biāo)均優(yōu)于KNN模型以及SVM模型。Stacking集成學(xué)習(xí)模型的精準(zhǔn)率、召回率、f1-score與RandomForest模型相當(dāng),但交叉平均準(zhǔn)確率提高了4 %,達(dá)到了92 %,證明了本文模型準(zhǔn)確性與有效性。
分級(jí)方法,通過分析得出以下結(jié)論:
(1)依托鄭萬高鐵湖北段隧道工程,本文建立了III級(jí)、IV級(jí)、V級(jí)圍巖條件下的隨鉆參數(shù)、圍巖級(jí)別數(shù)據(jù)樣本庫,涵蓋了白云巖、變質(zhì)砂巖、灰?guī)r、頁巖、泥巖,為集成學(xué)習(xí)建模提供了數(shù)據(jù)基礎(chǔ)。
(2)本文研究了定性反映地質(zhì)軟弱的推進(jìn)速度與其他隨鉆參數(shù)相關(guān)性,確定了圍巖分級(jí)特征參數(shù)。結(jié)合實(shí)際工況,確定了數(shù)據(jù)預(yù)處理規(guī)則以及不平衡類樣本處理方法,解決數(shù)據(jù)“臟”與不平衡問題。
(3)本文建立了隨鉆參數(shù)與圍巖級(jí)別的Stacking集成學(xué)習(xí)模型,增加了模型分類的穩(wěn)定性,克服了模型預(yù)測(cè)準(zhǔn)確度難以提高的問題,實(shí)現(xiàn)了預(yù)測(cè)準(zhǔn)確率達(dá)到92 %。
后續(xù)工作:為了進(jìn)一步提高隧道圍巖智能分級(jí)方法的準(zhǔn)確性,繼續(xù)收集隧道施工現(xiàn)場(chǎng)隨鉆數(shù)據(jù)、地質(zhì)數(shù)據(jù),擴(kuò)大數(shù)據(jù)樣本庫的圍巖級(jí)別及數(shù)量。同時(shí),由于隨機(jī)誤差的原因,收集的圍巖級(jí)別樣本中存在少數(shù)圍巖級(jí)別標(biāo)簽不正確現(xiàn)象,須深入研究修正少數(shù)不正確圍巖級(jí)別標(biāo)簽的建模方法。
致謝
本文的研究工作得到了湖南省創(chuàng)新型省份建設(shè)專項(xiàng)“超級(jí)地下工程智能成套裝備關(guān)鍵技術(shù)研究與應(yīng)用”經(jīng)費(fèi)資助(2019GK1010)、國鐵集團(tuán)科技研究開發(fā)計(jì)劃“鄭萬高鐵大斷面隧道安全快速標(biāo)準(zhǔn)化修建關(guān)鍵技術(shù)研究”經(jīng)費(fèi)資助(2017G007-H),在此表示感謝!
參考文獻(xiàn)
[1] 程士俊. 鐵路隧道圍巖分類專家系統(tǒng)[C]//第四屆全國工程地質(zhì)大會(huì)文集. 北京, 1992.
[2] Galende-Hernández M, Menéndez M, Fuente MJ,etal. Monitor-While-Drilling-based estimation of rock mass rating with computational intelligence: The case of tunnel excavation front[J]. Automation in Construction,2018, 93:325-38.
[3] Zhou H HP, Monteiro S T. Automatic Rock Recognition from Drilling Performance Data[C]// 2012 IEEE International Conference on IEEE.2012.
[4] Navarro J, Sanchidrian JA, Segarra P, etal. On the mutual relations of drill monitoring variables and the drill control system in tunneling operations[J]. Tunnelling & Underground Space Technology,2018, 72:294-304.
[5] Eskandarian S, Bahrami P, Kazemi P. A comprehensive data mining approach to estimate the rate of penetration: Application of neural network, rule based models and feature ranking[J]. Journal of Petroleum Science and Engineering,2017,156:605-15.
[6] 鄧洪亮, 周世生, 高文學(xué),等. 基于監(jiān)控量測(cè)的圍巖分級(jí)修正方法研究[J]. 施工技術(shù),2016,45:129-33.
[7] 王琦, 秦乾, 高松,等. 數(shù)字鉆探隨鉆參數(shù)與巖石單軸抗壓強(qiáng)度關(guān)系[J]. 煤炭學(xué)報(bào),2018,43:1289-95.
[8] 姚萌. 基于鉆進(jìn)參數(shù)和SVM的圍巖智能分級(jí)研究[J]. 四川建筑, 2020,40:149-51.
[9] Chawla NV, Bowyer KW, Hall LO, etal. SMOTE: Synthetic Minority Over-sampling Technique[J]. Journal of Artificial Intelligence Research, 2002,16:321-57.
[10] 閭城, 陳時(shí)熠, 華心果,等. 基于改進(jìn)KNN算法的汽輪機(jī)通流故障診斷方法及應(yīng)用[J]. 熱力發(fā)電,2021,1-7.
[11] 李旭東, 方杰, 王培聰, 等. 基于隨機(jī)森林的氧氣-液氧摻混冷凝流型研究[J]. 武漢大學(xué)學(xué)報(bào):工學(xué)版,2021,54:116-21.
[12] 董美娜, 劉麗平, 王澤忠,等. 基于Stacking集成學(xué)習(xí)的有源臺(tái)區(qū)線損率評(píng)估方法[J]. 電測(cè)與儀表, 2021,1-7.