江 南,盛永清,褚長(zhǎng)海
(1.盾構(gòu)及掘進(jìn)國(guó)家重點(diǎn)實(shí)驗(yàn)室,河南 鄭州 450001;2.武漢地鐵集團(tuán)有限公司,湖北 武漢 430000)
隨著國(guó)民經(jīng)濟(jì)的快速發(fā)展,地鐵隧道,鐵路隧道更多地采用了隧道掘進(jìn)機(jī)進(jìn)行開(kāi)挖。隧道開(kāi)挖前,對(duì)施工隧道地區(qū)資料的獲取是必不可少的環(huán)節(jié),結(jié)合地質(zhì)資料,才能根據(jù)開(kāi)挖隧道地層情況調(diào)節(jié)相應(yīng)的掘進(jìn)參數(shù)進(jìn)行施工作業(yè),但在實(shí)際施工中,地質(zhì)情況復(fù)雜多變,地質(zhì)資料只能提供局部區(qū)域有限地質(zhì)情況,而實(shí)時(shí)監(jiān)測(cè)和分析開(kāi)挖面的地質(zhì)情況可以幫助司機(jī)在不利地質(zhì)條件下采取預(yù)防措施,保證安全高效掘進(jìn)。由于掘進(jìn)參數(shù)可以看作是圍巖與TBM 相互作用結(jié)果的動(dòng)態(tài)反映,當(dāng)前有許多利用掘進(jìn)參數(shù)預(yù)測(cè)圍巖性質(zhì)的工作。朱夢(mèng)琦等提出基于集成CART 算法的圍巖等級(jí)預(yù)測(cè)模型,利用TBM 掘進(jìn)過(guò)程中的參數(shù)預(yù)測(cè)圍巖等級(jí)并取得了較好的效果。張娜等分別采用分步回歸和聚類分析的方法建立巖機(jī)關(guān)系模型,該模型能利用監(jiān)測(cè) TBM 掘進(jìn)參數(shù)對(duì)巖石抗壓強(qiáng)度、體積節(jié)理數(shù)和圍巖等級(jí)等參數(shù)進(jìn)行實(shí)時(shí)感知??傮w來(lái)說(shuō)目前基于各種機(jī)器學(xué)習(xí)算法的圍巖性質(zhì)預(yù)測(cè)工作均取得了一定的進(jìn)展,但是預(yù)測(cè)模型通常在同一條線路上構(gòu)建和測(cè)試,缺乏模型應(yīng)用在其他線路的準(zhǔn)確率數(shù)據(jù)而對(duì)于TBM 施工真正有效的模型是能運(yùn)用在新施工線路的模型,這一情況阻礙了圍巖地質(zhì)判別模型的實(shí)際應(yīng)用與推廣。
青島地鐵1 號(hào)線是青島已經(jīng)投入使用的一條跨海線路,其全長(zhǎng)60.11km,總體大致呈南北走向,共設(shè)置41 座車站,全部為地下車站。
本文使用的數(shù)據(jù)為青島地鐵1 號(hào)線人民廣場(chǎng)站-衡山路站和衡山路-天目山站兩個(gè)區(qū)間的TBM 掘進(jìn)數(shù)據(jù),兩個(gè)區(qū)間內(nèi)的圍巖主要成分為閃長(zhǎng)巖,石英二長(zhǎng)巖,花崗斑巖,風(fēng)化程度為微風(fēng)化到中風(fēng)化。兩個(gè)區(qū)間使用的掘進(jìn)設(shè)備分別為中船重工生產(chǎn)的DS6290-TBM-015 和DS6290--TBM-016。TBM 運(yùn)行時(shí)數(shù)據(jù)每10s 采集一次,數(shù)據(jù)中心記錄了TBM 掘進(jìn)過(guò)程中總推進(jìn)力、刀盤扭矩、刀盤轉(zhuǎn)速、推進(jìn)速度和撐靴壓力在內(nèi)的195 類數(shù)據(jù)。
本文使用神經(jīng)網(wǎng)絡(luò),隨機(jī)森林,支持向量機(jī)3 種機(jī)器學(xué)習(xí)模型分別對(duì)圍巖無(wú)側(cè)限抗壓強(qiáng)度進(jìn)行預(yù)測(cè),并比較不同算法的優(yōu)勢(shì),探究不同模型在跨線路應(yīng)用上的性能優(yōu)劣。
基于深度神經(jīng)網(wǎng)絡(luò)的分類算法已經(jīng)在自然語(yǔ)言處理,數(shù)字圖像處理,數(shù)據(jù)挖掘等任務(wù)和應(yīng)用場(chǎng)景上取得了優(yōu)良的效果,顯示出深度神經(jīng)網(wǎng)絡(luò)的在大數(shù)據(jù)應(yīng)用上巨大潛力。本文構(gòu)造的神經(jīng)網(wǎng)絡(luò)先對(duì)輸入按字段分別進(jìn)行全連接,然后總體全連接的方式構(gòu)建神經(jīng)網(wǎng)絡(luò),具體網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示。
圖1 模型結(jié)構(gòu)圖
其中,fc 表示全連接過(guò)程,concat 表示維度拼接過(guò)程,數(shù)字代表向量維度。本文使用先分組全連接,再進(jìn)行融合全連接的方式相比于直接在整個(gè)輸入向量上做全連接操作的方式參數(shù)量和計(jì)算量均有一定的減小。
隨機(jī)森林就是通過(guò)集成學(xué)習(xí)的思想將多棵樹(shù)集成的一種算法,它的基本單元是決策樹(shù),屬于機(jī)器學(xué)習(xí)的集成學(xué)習(xí)方法。在隨機(jī)森林中,每棵決策樹(shù)都是一個(gè)分類器,對(duì)于一個(gè)輸入樣本,每課樹(shù)都會(huì)產(chǎn)生一個(gè)分類結(jié)果。而隨機(jī)森林集成了所有的分類投票結(jié)果,將投票次數(shù)最多的類別指定為最終的輸出。在節(jié)點(diǎn)特征變量選擇上,本文使用Gini 不純度作為決策指標(biāo),避免了信息增益易偏向于取值較多的屬性的問(wèn)題。
設(shè)數(shù)據(jù)集D={(x1,y1),(x2,y2),…,(xn,yn)}的屬性空間X?Rm中某一特征變量Xj,j=1,2,…,m有q個(gè)取值,則Gini不純度定義如下
式中pi——特征變量值為i的概率。
本文將圍巖的無(wú)側(cè)限抗壓強(qiáng)度分成了7 個(gè)類別,屬于多分類問(wèn)題,而標(biāo)準(zhǔn)的SVM 是基于二元分類問(wèn)題設(shè)計(jì)的算法,無(wú)法直接處理多分類問(wèn)題。利用標(biāo)準(zhǔn)SVM 的計(jì)算流程有序地構(gòu)建多個(gè)決策邊界以實(shí)現(xiàn)樣本的多分類,通常的實(shí)現(xiàn)為“一對(duì)多(one-against-all)”和“一對(duì)一(oneagainst-one)”。一對(duì)多SVM 對(duì)m 個(gè)分類建立m個(gè)決策邊界,每個(gè)決策邊界判定一個(gè)分類對(duì)其余所有分類的歸屬;一對(duì)多SVM 通過(guò)對(duì)標(biāo)準(zhǔn)SVM的優(yōu)化問(wèn)題進(jìn)行修改可以實(shí)現(xiàn)一次迭代計(jì)算所有決策邊界。
本文使用的軟硬件環(huán)境如表1 所示。
表1 模型使用硬件與軟件版本情況
為了檢驗(yàn)本文所提出算法有效性,本文采用正確率為評(píng)價(jià)指標(biāo),計(jì)算如下
式中Nr——無(wú)側(cè)限抗壓輕度預(yù)測(cè)正確的樣本數(shù);
Nt——無(wú)側(cè)限抗壓強(qiáng)度預(yù)測(cè)的總樣本數(shù)。
目前基于TBM 掘進(jìn)參數(shù)的圍巖地質(zhì)判別模型往往在同一條線路上訓(xùn)練與測(cè)試,缺乏跨區(qū)間的模型研究與應(yīng)用。本文使用3 種不同的機(jī)器學(xué)習(xí)算法對(duì)跨區(qū)間的模型研究與應(yīng)用開(kāi)展研究,如表2 所示。表2 的結(jié)果表明基于掘進(jìn)參數(shù)的地質(zhì)無(wú)側(cè)限抗壓強(qiáng)度的跨區(qū)間應(yīng)用價(jià)值較低。
表2 模型在不同區(qū)間上的準(zhǔn)確率
盡管基于掘進(jìn)參數(shù)的圍巖抗壓強(qiáng)度預(yù)測(cè)模型在同一區(qū)間上達(dá)到了一定準(zhǔn)確率,但想要將模型推廣到不同區(qū)間,則難以達(dá)到足以指導(dǎo)TBM 掘進(jìn)工作的準(zhǔn)確率。3 種不同的機(jī)器學(xué)習(xí)模型都出現(xiàn)了同樣的情況。原因在于本文選取的青島地鐵兩個(gè)區(qū)間雖然相鄰,但圍巖分布狀況仍然存在較大差異,這種地質(zhì)上的差異造成掘進(jìn)數(shù)據(jù)的差異,最終影響了模型的跨區(qū)間應(yīng)用。這種模型跨區(qū)間應(yīng)用能力弱的問(wèn)題不能簡(jiǎn)單歸于過(guò)擬合問(wèn)題,因?yàn)槟P蜏?zhǔn)確率在訓(xùn)練集和測(cè)試集差異較小,只在跨區(qū)間應(yīng)用時(shí)準(zhǔn)確率下降。
本文分別使用了分組的全連接神經(jīng)網(wǎng)絡(luò)算法、隨機(jī)森林算法、支持向量機(jī)算法構(gòu)建圍巖的實(shí)時(shí)抗壓強(qiáng)度預(yù)測(cè)模型,并研究模型的跨線路,跨區(qū)間應(yīng)用問(wèn)題。有如下結(jié)論。
1)幾組實(shí)驗(yàn)下的神經(jīng)網(wǎng)絡(luò)模型表現(xiàn)對(duì)比隨機(jī)森林或支持向量機(jī)算法無(wú)明顯優(yōu)勢(shì)。
2)本文構(gòu)建的圍巖的無(wú)側(cè)限抗壓強(qiáng)度的預(yù)測(cè)模型僅在本區(qū)間能取得較好的預(yù)測(cè)準(zhǔn)確率,難以跨區(qū)間使用。
綜上所述,基于機(jī)器學(xué)習(xí)模型的圍巖無(wú)側(cè)線抗壓強(qiáng)度預(yù)測(cè)模型目前是難以應(yīng)用在不同區(qū)間,問(wèn)題主要在于,未掘進(jìn)區(qū)間的地質(zhì)分布和掘進(jìn)過(guò)區(qū)間的地質(zhì)分布可能完全不同,即使這兩個(gè)區(qū)間相鄰,模型可能完全沒(méi)有訓(xùn)練過(guò)這種地質(zhì),判別自然失準(zhǔn)。在更長(zhǎng)掘進(jìn)線路上訓(xùn)練模型是有可能會(huì)持續(xù)提升模型判別精度,但此時(shí)掘進(jìn)機(jī)設(shè)計(jì)壽命也即將結(jié)束,模型的應(yīng)用價(jià)值降低。研究人員不應(yīng)僅僅滿足于追求預(yù)測(cè)模型在某一條線路上的預(yù)測(cè)準(zhǔn)確率,畢竟能在不同地理位置、不同地質(zhì)狀況的均取得較高預(yù)測(cè)準(zhǔn)確度的模型才具有實(shí)際工程應(yīng)用價(jià)值。