楊民強
(中鐵十四局集團(tuán)大盾構(gòu)工程有限公司, 江蘇 南京 211800)
盾構(gòu)法擁有較強的先進(jìn)性與高效性等優(yōu)勢,在城市地下交通系統(tǒng)建設(shè)中起到了至關(guān)重要的作用[1]。盾構(gòu)機作為一種集機械技術(shù)、電子技術(shù)、控制技術(shù)、通信技術(shù)等多學(xué)科融合的重型工程機械[2],是實施盾構(gòu)法的主要設(shè)備,而對于泥水盾構(gòu)機來說,液壓推進(jìn)系統(tǒng)又是盾構(gòu)機的關(guān)鍵構(gòu)成。因其面臨工作負(fù)荷大,地質(zhì)復(fù)雜性高,工作環(huán)境惡劣等環(huán)境,所以其系統(tǒng)故障發(fā)生頻率高[3]。盾構(gòu)機的每次故障都會引起停工檢修,造成巨大的人力物力的損失甚至引發(fā)安全事故,所以如何提前預(yù)測盾構(gòu)機液壓系統(tǒng)數(shù)據(jù)的變化以提供有效的信息預(yù)測故障的發(fā)生是大盾構(gòu)領(lǐng)域一個新興的研究方向。目前,盾構(gòu)機液壓推進(jìn)系統(tǒng)都配置了相關(guān)的傳感器設(shè)備,用來記錄盾構(gòu)機液壓推進(jìn)系統(tǒng)運行時的運行參數(shù)值[4], 基于盾構(gòu)機液壓推進(jìn)系統(tǒng)傳感器采集的運行數(shù)據(jù)來預(yù)測盾構(gòu)機液壓推進(jìn)系統(tǒng)未來時刻的待預(yù)測參數(shù),從而構(gòu)建盾構(gòu)機液壓推進(jìn)系統(tǒng)待預(yù)測參數(shù)的預(yù)測模型,對盾構(gòu)機的數(shù)據(jù)預(yù)測方向起重要的作用[5]。
傳統(tǒng)的盾構(gòu)機液壓推進(jìn)系統(tǒng)參數(shù)預(yù)測的方法可以概括為三類:經(jīng)驗預(yù)測方法、巖土力學(xué)預(yù)測方法和數(shù)值模擬預(yù)測法。其中,經(jīng)驗法是在1976年由SAUCER G[6]根據(jù)盾構(gòu)機物理模型進(jìn)行了使用,并證明了在盾構(gòu)機作業(yè)中二維載荷小于三維載荷。之后在2016年,ZHANG Q等[7]基于巖土力學(xué)預(yù)測法將盾構(gòu)機推進(jìn)過程地層結(jié)構(gòu)拓展為多層地層,在此基礎(chǔ)上,預(yù)測盾構(gòu)機與巖土力學(xué)性質(zhì)之間的關(guān)系。SU C等[8]基于數(shù)值模擬預(yù)測法,通過對盾構(gòu)機切削過程進(jìn)行了數(shù)值分析,采用回歸方法對盾構(gòu)機刀盤扭矩進(jìn)行研究,分析并且預(yù)測了負(fù)荷參數(shù)與多種狀態(tài)之間的關(guān)系。
本研究以蕪湖長江隧道項目所采用的盾構(gòu)機液壓推進(jìn)系統(tǒng)的運行數(shù)據(jù)為研究對象,采用基于時間序列分析ARIMA方法,對盾構(gòu)機推進(jìn)過程中的數(shù)據(jù)變化進(jìn)行預(yù)測分析,重點比較了基于K-means聚類的RNN預(yù)測方法與線性回歸方法的預(yù)測準(zhǔn)確率。
本研究以中鐵十四局集團(tuán)大盾構(gòu)有限公司某隧道項目中所使用的大型泥水混合式盾構(gòu)機液壓推進(jìn)系統(tǒng)為研究對象,該對象具有應(yīng)用普適性。如圖1所示,為該盾構(gòu)機液壓推進(jìn)系統(tǒng)液壓泵組成結(jié)構(gòu),整個系統(tǒng)包括56個液壓泵,分為A~F共6組。
圖1 盾構(gòu)機推進(jìn)系統(tǒng)液壓油泵分組結(jié)構(gòu)
基于該盾構(gòu)機的挖掘數(shù)據(jù),本研究所獲得的原始數(shù)據(jù)主要有5種類別,如表1所示。
表1中液壓推進(jìn)系統(tǒng)區(qū)域壓力共分4類:pA,pB,pC,pD,分別代表4組液壓推進(jìn)系統(tǒng)的液壓泵壓力。pA~pD對應(yīng)了圖1中A~D組液壓泵。雖然圖1中顯示擁有A~F組的驅(qū)動單元,但是在數(shù)據(jù)處理過程中整個刀盤對稱,選取A~D驅(qū)動單元的數(shù)據(jù)已經(jīng)足夠體現(xiàn)數(shù)據(jù)變化特性,為減少數(shù)據(jù)運算量,節(jié)省運算時間,本研究只針對驅(qū)動單元A~D進(jìn)行分析。
表1 盾構(gòu)機數(shù)據(jù)類別
獲得的數(shù)據(jù)為2個月的盾構(gòu)機液壓推進(jìn)系統(tǒng)數(shù)據(jù),每類數(shù)據(jù)有25萬數(shù)據(jù)量,因為數(shù)據(jù)量較大且數(shù)據(jù)質(zhì)量參差不齊,所以針對所獲得的數(shù)據(jù)需要進(jìn)行數(shù)據(jù)預(yù)處理,便于后續(xù)的分析與預(yù)測過程。
針對所獲得的數(shù)據(jù)的清洗, 為滿足后續(xù)數(shù)據(jù)分析需要,且所有的數(shù)據(jù)組均為盾構(gòu)機在正常掘進(jìn)狀態(tài)下采集,本研究依據(jù)以下2類方法作為預(yù)處理原則:
(1) 停機狀態(tài)下的數(shù)據(jù)予以刪除,包括因為拼裝狀態(tài)、停機狀態(tài)、機械故障狀態(tài)和刀盤空轉(zhuǎn)狀態(tài)等造成的停機;
(2) 因掘進(jìn)過程中由于人為因素而導(dǎo)致的盾構(gòu)機液壓推進(jìn)系統(tǒng)參數(shù)的數(shù)據(jù)大幅改變也視為異常值刪除。
基于上述預(yù)處理原則,首先對原始數(shù)據(jù)中的異常值進(jìn)行了識別與處理,刪除了5種數(shù)據(jù)的異常值與空值。又因為本研究所獲取的原始數(shù)據(jù)采樣頻率為10 s,在該采樣頻率下,數(shù)據(jù)量過大,不能有效的進(jìn)行分析,因此本研究又采取了降采樣方法,將采樣頻率由10 s變至1 min,得到的挖掘速度數(shù)據(jù)清洗前后時序?qū)Ρ葓D如圖2所示??梢钥闯?,數(shù)據(jù)清洗后依然能保有數(shù)據(jù)清洗前的特征,并且數(shù)據(jù)量大幅度減小可以有效的提升分析速度。
圖2 掘進(jìn)速度數(shù)據(jù)清洗前后對比
基于上述清洗過后的數(shù)據(jù),首先通過皮爾森相關(guān)系數(shù)來判定液壓推進(jìn)系統(tǒng)參數(shù)的相關(guān)性[9],該系數(shù)可以定量地描述變量之間的關(guān)系。
皮爾森相關(guān)系數(shù)r的計算公式為:
(1)
式中,X,Y—— 擬要判定相關(guān)性的參數(shù)
n—— 數(shù)據(jù)組的數(shù)量
通過式(1)計算F,pA,pB,pC,pD,T,v,s之間的相關(guān)性,如表2所示。
r越接近1相關(guān)度越高,由表2可以看出,相同參數(shù)間的相關(guān)性系數(shù)為1,與液壓推進(jìn)系統(tǒng)pA相關(guān)度最高的數(shù)據(jù)為掘進(jìn)速度,與pB相關(guān)度最高的也是掘進(jìn)速度,而刀盤扭矩、掘進(jìn)速度與貫入度這3個參數(shù)之間相互的相關(guān)度都較高。
表2 盾構(gòu)機液壓推進(jìn)系統(tǒng)數(shù)據(jù)清洗后相關(guān)性分析
因此,基于相關(guān)性分析結(jié)果,本研究主要從與液壓力相關(guān)度較高的掘進(jìn)速度來進(jìn)行分析與預(yù)測。
自相關(guān)指一個信號與其不同時間點自身的互相關(guān),即信號在不同時間點下的相似度與2個時間之差的函數(shù)。因此,自相關(guān)可以用來找出并剔除掉本研究所用的數(shù)據(jù)在不同時間點下相似度高的數(shù)據(jù),可以有效的減少無用數(shù)據(jù)。自相關(guān)函數(shù)(Autocorrelation Function,ACF)反映了同一序列在不同時序的取值之間的相關(guān)性;偏相關(guān)函數(shù)(Partial Autocorrelation Function,PACF)是嚴(yán)格2個變量之間的相關(guān)性。 本研究基于確定ACF與PACF結(jié)果來確定選擇模型是自回歸模型(Auto-regresssive,AR)、移動平均模型(Moving Average, MA)還是混合模型(Auto-regresssive Moving Average,ARMA),選擇標(biāo)準(zhǔn)如表3所示。
表3 盾構(gòu)機液壓推進(jìn)系統(tǒng)模型判斷標(biāo)準(zhǔn)
掘進(jìn)速度的自相關(guān)與偏相關(guān)分析結(jié)果如圖3所示??梢钥闯?,ACF和PACF兩圖都是屬于拖尾,因此選擇ARMA模型更為適合本研究的盾構(gòu)機液壓推進(jìn)系統(tǒng)分析。
圖3 掘進(jìn)速度自相關(guān)與偏相關(guān)圖
ARIMA模型[10]的核心思想就是在ARMA模型建立之前,采用適當(dāng)階數(shù)的差分運算,對要進(jìn)行擬合和預(yù)測的時間序列進(jìn)行平穩(wěn)化處理,使得數(shù)據(jù)能夠符合ARMA 模型對時間序列的平穩(wěn)性要求,然后采用ARMA模型對時間序列進(jìn)行預(yù)測。
若時間序列當(dāng)前值沒有外界干擾量而僅由過去時刻序列值決定,則這種線性關(guān)系能夠用自回歸模型(AR)來描述:
xt=δ+φ1xt-1+…+φpxt-p+εt
(2)
式中,δ—— 模型的常數(shù)項
φp——p階回歸項系數(shù)
εt—— 序列殘差
xt—— 當(dāng)前時刻的序列值
ARMA中的移動平均模型數(shù)學(xué)表述為:
xt=ε+ε1+μ1εt-1…+μqεt-q
(3)
由AR模型和MA模型構(gòu)成的ARMA則為:
xt=φ1xt-1+…+φpxt-p+
δ+εt+μ1εt-1…+μqεt-q
(4)
而基于ARMA模型,做d階差分可得ARIMA模型:
yt=Δdxt=(1-L)dxt
(5)
因此可對yt建模得到:
yt=φ1yt-1+…+φpyt-p+
δ+εt+μ1εt-1…+μqεt-q
(6)
該模型的特征方程為:
Φ(L)Δdxt=δ+Θ(L)εt
(7)
最后,得到 ARIMA(p,d,q)模型[11]。
d取1時,針對預(yù)處理后的掘進(jìn)速度數(shù)據(jù)進(jìn)行的一階差分時序圖,如圖4所示。
圖4 掘進(jìn)速度一階差分時序圖
在獲得一階差分?jǐn)?shù)據(jù)后,接下來對一階差分前的原始數(shù)據(jù)與差分后數(shù)據(jù)做平穩(wěn)性檢驗(ADF檢驗)[12]。ADF檢驗就是判斷序列是否存在單位根,如果序列平穩(wěn),就不存在單位根,否則,就會存在單位根。
因此,ADF檢驗的H0假設(shè)就是存在單位根,如果得到的顯著性檢驗統(tǒng)計量小于3個置信度10%,5%,1%,則對應(yīng)有90%,95%,99%的把握來拒絕原假設(shè),分析結(jié)果如表4所示。
表4中的T統(tǒng)計量為ADF 測試結(jié)果。根據(jù)上述表格可以看出,原始序列與差分序列的3個置信度相同,而T統(tǒng)計量皆小于3個置信度,因此,序列拒絕原假設(shè),也即差分后序列平穩(wěn)。
表4 原始序列與差分序列ADF檢驗結(jié)果對比
接下來對數(shù)據(jù)組進(jìn)行白噪聲檢驗,所獲得的差分序列的白噪聲檢驗結(jié)果為:(array([14.3781688]), array([0.00014953])),其中array([0.00014953])表示p值遠(yuǎn)小于0.05,所以可以判斷所選擇的數(shù)據(jù)是穩(wěn)定的。
根據(jù)計算與自相關(guān)分析,選擇p值為1,q值為1。
根據(jù)貝葉斯定理有:
(8)
其中,P(y1,…,yn|Mj)為該模型的邊緣概率,假設(shè)在不知道任何數(shù)據(jù)的情況下各個模型是同樣合理的,則式中的P(Mj)為定值,因此,最大化后驗概率等價于最大化模型的邊緣概率,可得:
(9)
式中,Θj—— 模型Mj的參數(shù)向量
L—— 似然函數(shù)
gj(θj) ——θj的分布函數(shù)
使用貝葉斯方法來優(yōu)化模型時,不需要考慮參數(shù)的先驗概率,當(dāng)很多參數(shù)先驗無法求出時,比如本研究中的盾構(gòu)機液壓推進(jìn)系統(tǒng)參數(shù),可以使用貝葉斯因子比較2個模型的好壞,進(jìn)而達(dá)到優(yōu)化模型的目的。
K-means的核心思想為:把n個數(shù)據(jù)對象劃分為K個類別,并且使每一類別中的所有數(shù)據(jù)對象到該類的聚類中心點的平方和最小。RNN是一種特殊的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),其可以考慮前一時刻的輸入,而且具有對前面數(shù)據(jù)的記憶功能,該方法可以用于處理序列數(shù)據(jù)。本研究所用K-means與RNN預(yù)測算法流程如圖5所示。
圖5 基于K-means聚類的RNN預(yù)測算法流程[13]
一元線性回歸分析預(yù)測法,是根據(jù)自變量X和因變量Y的相關(guān)關(guān)系,建立X與Y的線性回歸方程進(jìn)行預(yù)測的方法。本研究選用一元線性回歸分析掘進(jìn)速度數(shù)據(jù),式(10)為一元線性回歸公式:
y=ω0+ωixi
(10)
該方法是引入自變量,將因變量與自變量作一元回歸,并選出與因變量相關(guān)度最為密切或者是檢驗最顯著的一元線性回歸方程,建立最終的線性回歸預(yù)測方程。
基于上述ARIMA模型,利用K-means方法,提取數(shù)據(jù)的前66%為訓(xùn)練集,后33%為測試集進(jìn)行訓(xùn)練,基于訓(xùn)練結(jié)果及一階差分結(jié)果進(jìn)行預(yù)測,圖6為對盾構(gòu)機液壓推進(jìn)系統(tǒng)掘進(jìn)速度進(jìn)行的預(yù)測結(jié)果,預(yù)測數(shù)據(jù)的時間為2020-10-03~05。在預(yù)測初期不能很好的預(yù)測結(jié)果,但是后期能逐步跟隨實際趨勢,但是預(yù)測效果不理想。
圖6 掘進(jìn)速度基于K-means預(yù)測結(jié)果
之后基于該模型利用線性回歸方法對數(shù)據(jù)進(jìn)行預(yù)測,預(yù)測結(jié)果如圖7所示,可以看出,該方法能很好的預(yù)測盾構(gòu)機液壓推進(jìn)系統(tǒng)數(shù)據(jù)的變化趨勢,而且能清楚的檢測出數(shù)據(jù)內(nèi)包含的異常值,所以相較于K-means預(yù)測方法,更能體現(xiàn)出對工程實際施工過程中的異常檢驗與趨勢預(yù)測,更加符合工程應(yīng)用。
圖7中圓點為異常情況, 該情況下預(yù)測結(jié)果與實際結(jié)果幅值相差較大,可以看出,整體的趨勢預(yù)測較為準(zhǔn)確,在工程上,對預(yù)測結(jié)果造成的影響因素有很多,比如巖石層的結(jié)構(gòu)、盾構(gòu)機的狀態(tài)等,所以很難獲得非常準(zhǔn)確的結(jié)果,但是基于本研究的方法,能獲得盾構(gòu)機液壓推進(jìn)系統(tǒng)參數(shù)的趨勢預(yù)測, 且幅值誤差相對較低。
圖7 掘進(jìn)速度基于線性回歸預(yù)測結(jié)果
(1) 盾構(gòu)機液壓推進(jìn)系統(tǒng)具有施工環(huán)境惡劣、安全性能要求高等特點。本研究基于ARIMA方法,建立了盾構(gòu)機液壓推進(jìn)系統(tǒng)的預(yù)測模型,基于相關(guān)性分析及平穩(wěn)性檢驗,獲得了被用來預(yù)測的有效數(shù)據(jù)組,之后對相關(guān)模型進(jìn)行搭建及模型優(yōu)化。
(2) 本研究分別利用基于K-means聚類的RNN預(yù)測方法及線性回歸方法對模型數(shù)據(jù)組進(jìn)行了預(yù)測,可以得到,基于K-means聚類的RNN預(yù)測方法對盾構(gòu)機推進(jìn)系統(tǒng)的ARIMA模型下的數(shù)據(jù)預(yù)測結(jié)果不理想,存在著較大的誤差,數(shù)據(jù)趨勢不能預(yù)測準(zhǔn)確;而基于ARIMA模型的線性回歸預(yù)測方法卻能很好的預(yù)測出數(shù)據(jù)的變化趨勢,并且能預(yù)測出數(shù)據(jù)中的異常值,即可能會引起故障的數(shù)據(jù)。