張 銳
(華設(shè)設(shè)計集團股份有限公司,江蘇 南京 210014)
在當(dāng)前工程勘察中,對于土層劃分和土的參數(shù)確定傳統(tǒng)上主要依賴于CPT、SPT 等原位測試及取樣試驗,基于標(biāo)貫擊數(shù)和錐尖阻力、側(cè)阻力等物理指標(biāo)劃分地層一直是國內(nèi)地質(zhì)勘察工作者最常用的方法,也是最主要的經(jīng)驗方法之一[1]。但是由于土的離散性以及收集的數(shù)據(jù)有限,很難對場地的分布有細(xì)致準(zhǔn)確的描述。且鉆孔與鉆孔之間的距離間隔很大,尤其在公路、隧道等線性工程中,考慮到成本等因素,鉆孔的間隔甚至達(dá)到了100 m 以上,數(shù)據(jù)存在很大的不確定性。對于鉆孔之間的地層情況難以準(zhǔn)確預(yù)測,鉆孔之間出現(xiàn)土的斷層、錯動影響[2],相鄰每個鉆孔測得的土層種類不一致等問題。因此,基于稀疏地層數(shù)據(jù)的插值擴充工作顯得格外重要。
香港城市大學(xué)WAND 等[3-5]基于美國某地靜力觸探實驗數(shù)據(jù)(錐尖阻力,側(cè)阻力)提出了一種基于貝葉斯壓縮感知(Bayesian Compressive Sampling,BCS)的鉆孔數(shù)據(jù)插值擴充方法。BCS 是傳統(tǒng)壓縮采樣(Compressive Sampling,CS)方法的概率擴展,其本質(zhì)是從信號的部分信息中重構(gòu)出一個信號的完整信息[6-7]。在巖土工程中,土層性質(zhì)隨深度而變化,因此土層性質(zhì)剖面可被視為信號進行分析。BCS 方法不僅能從有限的測量數(shù)據(jù)中合理地解釋土層性質(zhì)剖面,而且還提供了量化與解釋剖面相關(guān)的統(tǒng)計不確定性的實用工具,量化的統(tǒng)計不確定性為分析的土性質(zhì)剖面的準(zhǔn)確性和可靠性提供了一個衡量標(biāo)準(zhǔn)[8-9]。
在得到充分的勘察數(shù)據(jù)之后,對于地層的劃分一直是研究的熱點問題,劃分結(jié)果的準(zhǔn)確性關(guān)系到后期工程的安全性和可靠性。我國對土層劃分暫無統(tǒng)一的標(biāo)準(zhǔn),實際工程勘察中多采用SPT 標(biāo)貫實驗和取土鉆孔相結(jié)合的勘察方法,根據(jù)現(xiàn)場取出的實際土樣通過經(jīng)驗判斷,確定土層的劃分。劉松玉等[10]對我國SPT 技術(shù)做出了全面的分析,目前采用的《巖土工程勘察規(guī)范》《水利水電工程地質(zhì)勘察規(guī)范》和《公路工程地質(zhì)勘察規(guī)范》中采用的分類標(biāo)準(zhǔn)都不盡相同。隨著科技的不斷進步,關(guān)于地層的劃分工作已經(jīng)不僅僅局限于傳統(tǒng)的SPT 法、取土分析法等,近年來人工智能技術(shù)在工程勘察領(lǐng)域發(fā)展得十分迅速,SVM、聚類、神經(jīng)網(wǎng)絡(luò)等在國內(nèi)外地層劃分上也取得許多研究進展[11-13]。
本文基于蘇州某地塊的工程勘察數(shù)據(jù)進行實例計算分析,采用貝葉斯壓縮感知方法對貫入阻力數(shù)據(jù)進行二維插值擴充,得到整個勘察剖面的貫入阻力分布情況。隨后利用支持向量機(SVM)算法對擴充數(shù)據(jù)進行分類,得到整個地層剖面的劃分,從而實現(xiàn)基于少量鉆孔信息,即可得到較為準(zhǔn)確的地層分布情況,為工程勘察提供智能化技術(shù)支持。
貝葉斯壓縮感知是一種信號處理技術(shù),其最大優(yōu)勢是可將收集的稀疏信號進行插值擴展,實現(xiàn)原始數(shù)據(jù)的重構(gòu),廣泛應(yīng)用于各個領(lǐng)域。工程勘察可以認(rèn)為是對地層數(shù)據(jù)的稀疏取樣,貝葉斯壓縮感知可根據(jù)稀疏數(shù)據(jù)有效地重構(gòu)地層數(shù)據(jù)。例如地層剖面上的鉆孔測得的比貫入阻力可以用插值矩陣F來表示,F(xiàn)可以視為一個二維矩陣,維度大小為(Nx1×Nx2,可根據(jù)實際場地自行取值)。Nx1為深度方向長度,Nx2為水平方向長度,由于地層的信息為離散數(shù)據(jù),需要用到插值輔助函數(shù)等一系列方法,插值矩陣F的計算公式如下:
式(1)為貝葉斯壓縮感知的基本公式,式中各類參數(shù)的計算和構(gòu)造方法在下述小節(jié)將做出詳細(xì)介紹和推導(dǎo)。
式(1)中,Cx1(Nx1×Nx1)和Cx2(Nx2×Nx2)為離散余弦矩陣,AHMED 等[14]基于傅里葉變換法提出了離散余弦變化(DCT)公式,本研究對DCT 公式進行了展開,化簡為矩陣的形式,其數(shù)學(xué)公式較為復(fù)雜,但可利用Python代碼構(gòu)建Cx1和Cx2矩陣,具體見表1。
表1 離散余弦矩陣構(gòu)造
式(2)中,i表示Cx1的列,j表示Cx2的行,為了方便推導(dǎo)避免引起混淆,將二維索引i,j轉(zhuǎn)化為一維索引t。下標(biāo)t是通過以升序?qū)2D列中的所有元素進行編號來定義的,即將二維矩陣按列展開,變?yōu)樗饕龔?~Nx1×Nx2的一維數(shù)組。在同一列中,t隨著行數(shù)的增加而增加,例如則可以表示為
式中,Y為原始數(shù)據(jù)集(插值矩陣F的子矩陣),維度為與插值矩陣F的關(guān)系如式(4)所示:
A=為定位矩陣,反映了數(shù)據(jù)集Y作為插值矩陣F的子矩陣在F中的行列索引,可由單位矩陣輕松構(gòu)造。D是維度為(Nx1×Nx2,Nx1×Nx2)的對角矩陣,其對角線的值為αi,如式(5)所示:
式中,M=Nx1×Nx2,c,d為超參數(shù)取值,可以使用HUANG等[15]人提出的策略迭代法獲得c和d,一般取值為0.000 1,C=IM×M+AD-1AT,I是單位矩陣,其維度為(Nx1×Nx2,Nx1×Nx2)。
本文選用蘇州蕾娜斯地塊場地靜力觸探實驗數(shù)據(jù)進行貝葉斯插值。場地擬建主體建筑為地上三層,地下一層,框架結(jié)構(gòu)的多層古建及賓館。
如圖1 所示,選取該區(qū)域第2 剖面為研究場地,該場地剖面長度為113 m,靜力觸探孔編號7~12,共計6個,鉆孔水平間隔分別為23 m,22 m,25 m,23 m,20 m。該剖面在水平方向較為平整且鉆孔位于同一軸線上,計算誤差相對較小。
圖1 研究剖面示意圖
如圖2 所示,將鉆孔深度和對應(yīng)的比貫入阻力畫成二維圖像,每組鉆孔深度為30 m,鉆孔的比貫入阻力沿深度方向間隔0.5 m,比貫入阻力由于土層不同,大致分布在0~15 MPa 之內(nèi)(以7 號鉆孔為例,8~12 鉆孔同理)。
圖2 比貫入阻力原始數(shù)據(jù)
選取該剖面6 組鉆孔的比貫入阻力作為原始數(shù)據(jù)Y,沿深度方向維度為30/0.5=60,水平方向共計6 列數(shù)據(jù)維度為6,由此二維數(shù)組Y的維度為(30×6),即Mx1=30,Mx2=6。
確定完Y之后,結(jié)合場地信息預(yù)先定義場地參數(shù),hx1,hx2表示剖面場地的深度和水平長度,hx1=30 m、hx2=113 m;ηx1,ηx2表示深度和水平方向上的數(shù)據(jù)間隔,ηx1=0.5 m、ηx2=1 m;則插值矩陣F的維度大小為hx1/ηx1=60,hx2/ηx2=113。在貝葉斯插值擴充后,每個鉆孔沿深度方向的比貫入阻力有60 組數(shù)據(jù),水平方向場地113 m 的間距轉(zhuǎn)化為113 組矩陣的列向量,即插值矩陣F維度定義為(Nx1×Nx2=60×113)。Y作為插值矩陣的子集,6 列數(shù)據(jù)分別位于插值矩陣F的第0,23,45,70,93,112 列,后續(xù)將通過Y迭代計算,得到整個插值矩陣F的結(jié)果,從而實現(xiàn)數(shù)據(jù)擴充和預(yù)測未知區(qū)域比貫入阻力的目的。
由前述可知本研究剖面已經(jīng)轉(zhuǎn)化為插值矩陣,將通過6 組原始數(shù)據(jù)Y進行貝葉斯插值,將一維的鉆孔比貫入阻力數(shù)據(jù)進行擴充,通過迭代計算得到插值矩陣F,即可得到113 m 剖面上所有位置的土層比貫入阻力數(shù)據(jù),實現(xiàn)一維到二維的數(shù)據(jù)擴充。
離散余弦矩陣(DCT)取Nx1=60,Nx2=113,分別帶入表1 構(gòu)建離散余弦函數(shù)Cx1(60×60),Cx2(113×113),計算結(jié)果如圖3 所示,Cx1,Cx2分別表示沿深度和水平方向上的變換方陣。
圖3 離散余弦矩陣Cx1,Cx2 計算結(jié)果
圖4 插值后的比貫入阻力分布圖
由圖4可知,比貫入阻力在研究剖面上成帶狀分布,深度方向呈現(xiàn)波動變化的特征。在插值矩陣0~10行(實際深度0~20 m 處)比貫入阻力分布較為均勻,在0~3 MPa 之間;插值矩陣15~25 行(實際深度7.5~12.5 m 處)比貫入阻力分布在4~6 MPa 之間;在插值矩陣30 行(實際深度15 m 處)附近區(qū)域為比貫入阻力最大區(qū)域,尤其在0~5、40~50 列之間出現(xiàn)了比貫入阻力的最大值14.1 MPa。數(shù)據(jù)之間存在明顯的分區(qū)域特征,為后續(xù)的土層劃分工作提供了重要保障。
為了驗證插值矩陣F的準(zhǔn)確性,將地勘報告中的2 處未參與計算的鉆孔數(shù)據(jù)的插值預(yù)測結(jié)果與該處真實的地勘數(shù)據(jù)進行比對,如圖5 所示。
由圖5可知,預(yù)測的插值曲線與原始數(shù)據(jù)較為吻合,整體走勢也保持一致,在25~28 m 處個別點位略有偏差。這可能是由于鉆孔不完全在二維垂直剖面內(nèi),鉆孔不完全垂直于土層剖面,且土層的不確定性較高,插值后仍有可能出現(xiàn)小偏差的情況。從另一方面來說出現(xiàn)小部分點位偏差,可增強模型泛化能力,避免出現(xiàn)過擬合現(xiàn)象。
圖5 插值結(jié)果與原始數(shù)據(jù)對比圖
支持向量機SVM 是監(jiān)督學(xué)習(xí)中一種常見的分類算法,SVM 在各種實際問題中都表現(xiàn)非常優(yōu)秀。但是在工程勘察中,利用SVM 對地層進行劃分的研究目前在國內(nèi)外相對較少,本節(jié)將基于SVM 的強學(xué)習(xí)能力,結(jié)合周邊場地的地勘數(shù)據(jù),提出一種新的地層分類模型。
支持向量機的基本原理非常容易理解。如圖6 所示,這是一組兩種標(biāo)簽的數(shù)據(jù),兩種土層所包含的參數(shù)(本文采用的為比貫入阻力)分別由實心圓和空心圓代表。支持向量機的分類方法,是在這組分布中找出一個超平面(二維坐標(biāo)系為直線)作為決策邊界,使模型在數(shù)據(jù)上的分類誤差盡量接近于0,尤其是在未知數(shù)據(jù)集上的分類誤差(泛化誤差)盡量小,對兩種不同特征的數(shù)據(jù)進行有效的劃分。因此,支持向量分類器又叫作最大邊際分類器。
圖6 SVM 原理圖
為了更好地適應(yīng)本研究所在剖面地層的分布情況,做到具體問題具體分析,本研究搜集了部分周邊場地的比貫入阻力與深度的地勘數(shù)據(jù),以及對應(yīng)數(shù)據(jù)點的地層名稱,并繪制成散點圖,如圖7 所示。訓(xùn)練集數(shù)據(jù)的橫縱坐標(biāo)為比貫入阻力和深度,按照地層編號沿深度方向分布可分為7 類:填土、粘土、粉質(zhì)粘土、粉土與粉砂、粉質(zhì)粘土、粘土、粉質(zhì)粘土。
圖7 SVM 訓(xùn)練集數(shù)據(jù)圖
由圖7可知,該地塊土的類型主要分為7 類,在SVM 中,此數(shù)據(jù)集可看作7 分類的數(shù)據(jù)問題,找到6個超平面將數(shù)據(jù)進行劃分。劃分模型完成后,將第三節(jié)研究剖面計算得到的插值矩陣元素點帶入模型,進行逐點的預(yù)測并畫出地層剖面圖。
將場地周邊數(shù)據(jù)分為3 列向量,前兩列分別為每個數(shù)據(jù)點的深度、比貫入阻力,最后一列為該點對應(yīng)的土層類型;然后將土層類型實例化,即將填土、粘土、粉質(zhì)粘土、粉土與粉砂、粉質(zhì)粘土、粘土、粉質(zhì)粘土分別定義為數(shù)字1~7;最終將三列向量組合成矩陣形式作為訓(xùn)練集輸入SVM 模型進行計算,結(jié)果如圖8 所示。
圖8 SVM 分類結(jié)果圖
由圖8可知,本文用Python 將SVM 分類結(jié)果可視化,把16×35 的區(qū)域進行網(wǎng)格劃分,不同顏色的區(qū)域內(nèi)通過線性函數(shù)分割,分別代表不同的土層分類。分類結(jié)果準(zhǔn)確率為95.56%,區(qū)域中心數(shù)據(jù)分類基本無誤,但是由于數(shù)據(jù)量較大,且實測數(shù)據(jù)也可能出現(xiàn)誤差,在邊界處不可避免地出現(xiàn)數(shù)據(jù)交匯現(xiàn)象導(dǎo)致部分?jǐn)?shù)據(jù)分類錯誤。分類模型建立后,將第三節(jié)的插值矩陣中6 780個像素點帶入模型預(yù)測每一個像素點的分類,并畫出二維散點圖,如圖9 所示。
圖9 線性核函數(shù)預(yù)測結(jié)果圖
由圖9可知,將研究場地的標(biāo)貫擊數(shù)插值結(jié)果帶入分類模型后,6 780個數(shù)據(jù)點分別劃分到不同顏色的區(qū)域當(dāng)中,此時,每一個數(shù)據(jù)點都得到了相對應(yīng)的土層編號1~7,從而完成了對插值數(shù)據(jù)的預(yù)測。最終將預(yù)測得到的土層編號作為像素點的顏色,得到地層劃分剖面圖,如圖10 所示。
圖10 地層剖面劃分結(jié)果圖
由圖10可知,黑色虛線為地勘報告中所給出的地層劃分線,在0~5 行為填土(編號1)、5~10 行為粘土(編號2)以及49~60 行為粉質(zhì)粘土(編號7)分類效果非常準(zhǔn)確;在15~30 列紅色粉質(zhì)粘土(編號3)的下邊界、34~36 行粉色區(qū)域(編號5)的上邊界存在多個像素點分類錯誤,考慮到此處地層有起伏,且位于不同地層的交界處,數(shù)據(jù)在此交匯較多,出現(xiàn)分類誤差??傮w地層的走勢較為清晰。分類較為準(zhǔn)確,但土層分界處的分類情況與真實地層分布還存在一定的差距。6 780個像素點分類準(zhǔn)確的個數(shù)為6 448個,準(zhǔn)確率為95.10%。
本文以蘇州蕾娜斯地塊某場地勘察剖面為研究對象,通過對比貫入阻力數(shù)據(jù)進行貝葉斯插值,對整個剖面場地進行了地勘數(shù)據(jù)擴充。在插值結(jié)果的基礎(chǔ)上利用支持向量機模型對插值后的數(shù)據(jù)進行分類,得到最終的地層剖面圖。隨后與實際的地層劃分做出對比,計算了模型分類的準(zhǔn)確率,主要結(jié)論如下。
(1)貝葉斯插值源于信號重建原理,對于土層這種離散性大,不確定性高的研究對象非常合適。切合工程實際,只需少量數(shù)據(jù)即可最大程度反推地層信息,提高了勘察結(jié)果的準(zhǔn)確性。
(2)蘇州蕾娜斯地塊的比貫入阻力數(shù)據(jù)集有明顯的分塊特征,屬于線性可分?jǐn)?shù)據(jù),支持向量機SVM 在處理線性分類問題時較其他算法表現(xiàn)更加優(yōu)異,且加入了周邊場地的地勘數(shù)據(jù)作為先驗條件,大大加強了分類的準(zhǔn)確性。
(3)本文采用的數(shù)據(jù)集是比貫入阻力,所提出的方法不僅僅適用于比貫入阻力一個物理量,涉及地層的任意物理量,例如標(biāo)貫擊數(shù)、內(nèi)摩擦角等都可以進行插值擴充和地層劃分。所以本文提出的模型具有一定的泛化能力,能夠適應(yīng)各類工程勘察項目,具有很強的實用性。