劉 潔 谷劍英
(中水北方勘測(cè)設(shè)計(jì)研究有限責(zé)任公司,天津 300222)
水利工程常涉及長(zhǎng)距離引調(diào)水問題,需要埋設(shè)地下輸水管線以供后期使用。土壤中富含氧、水分、溶鹽和微生物等,輸水管線長(zhǎng)期埋置于地下會(huì)發(fā)生腐蝕破壞[1]。材料腐蝕是材料受環(huán)境介質(zhì)的化學(xué)、電化學(xué)和物理作用產(chǎn)生的損壞或者破壞現(xiàn)象,常發(fā)生于工程建筑、日常生活中。這不僅會(huì)造成材料損耗、工程成本增加,還可能導(dǎo)致重大事故發(fā)生。腐蝕防護(hù)事關(guān)國(guó)家安全、經(jīng)濟(jì)發(fā)展、民生民利、生態(tài)環(huán)境等多個(gè)方面[2]。腐蝕防護(hù)安全問題關(guān)系重大,建立、完善和發(fā)展土壤腐蝕防護(hù)體系具有重要的戰(zhàn)略意義、科學(xué)意義和現(xiàn)實(shí)意義[1,2]。
土壤對(duì)鋼結(jié)構(gòu)的腐蝕主要分為4類,依次為酸類腐蝕、細(xì)菌腐蝕、原電池腐蝕和雜散電流腐蝕[3]。為加強(qiáng)輸水管線的防護(hù),減少土壤對(duì)鋼結(jié)構(gòu)的腐蝕破壞,需要對(duì)土壤進(jìn)行腐蝕性測(cè)試,以綜合評(píng)價(jià)其腐蝕能力,因地制宜做好管線防護(hù)工作。常規(guī)測(cè)試參數(shù)有5個(gè),依次為土壤電阻率、氧化還原電位、pH值、質(zhì)量損失、極化電流密度[4]??茖W(xué)高效地評(píng)價(jià)土壤腐蝕能力具有重要的實(shí)際意義[5]。在以往的研究中,土壤的理化性質(zhì)常作為判斷土壤腐蝕性的標(biāo)準(zhǔn)。但單項(xiàng)指標(biāo)評(píng)價(jià)法片面、不具有代表性和說服力,綜合指標(biāo)評(píng)價(jià)法雖綜合性強(qiáng)、能較為全面地作出評(píng)價(jià),但數(shù)據(jù)多、耗時(shí)久、操作難度大[6]。土壤的影響因素多且復(fù)雜,其腐蝕性評(píng)價(jià)具有模糊性、隨機(jī)性和不確定性的特點(diǎn)。故而,引用機(jī)器學(xué)習(xí)模型理論,將多元統(tǒng)計(jì)評(píng)價(jià)方法應(yīng)用于土壤腐蝕的分析與評(píng)價(jià)工作中[7]。機(jī)器模型成本低、周期短、尺度廣、計(jì)算效率高,而多元統(tǒng)計(jì)評(píng)價(jià)方法能綜合處理多個(gè)變量并根據(jù)結(jié)果做出評(píng)價(jià),融合其優(yōu)勢(shì)并應(yīng)用于土壤腐蝕性評(píng)價(jià)領(lǐng)域,將是一項(xiàng)重大突破[6,7]。
本文采用因子分析和熵權(quán)法,構(gòu)建土壤腐蝕性評(píng)價(jià)模型,評(píng)價(jià)土壤對(duì)鋼結(jié)構(gòu)的腐蝕情況。經(jīng)數(shù)據(jù)集訓(xùn)練和測(cè)試證明該模型可行、有效,經(jīng)多個(gè)應(yīng)用實(shí)例驗(yàn)證其結(jié)果與該模型評(píng)價(jià)結(jié)果一致,證明了該評(píng)價(jià)方法對(duì)土壤腐蝕性評(píng)價(jià)的有效性。
因子分析法是以原始變量的相關(guān)性為出發(fā)點(diǎn),利用降維思想,通過探尋原始變量矩陣的內(nèi)部關(guān)系,將多變量簡(jiǎn)化為少數(shù)因子,進(jìn)而分析其內(nèi)在關(guān)聯(lián)[8,9]。其基本思想是:按照相關(guān)度的不同將原始變量進(jìn)行分類,類別內(nèi)部變量的相關(guān)性和變量聯(lián)系呈正相關(guān)關(guān)系,即:類別之間的變量相關(guān)度高,則聯(lián)系緊密;類別之間的變量相關(guān)度低,則聯(lián)系稀疏[10,11]。
土壤腐蝕性的因子分析法一般步驟[12,13]為:
(1)確定變量和搜集資料,構(gòu)建m×n的矩陣,m為樣本數(shù)量,n為原始變量數(shù)(常規(guī)測(cè)試中n=5);
(2)通過標(biāo)準(zhǔn)化式(2)~式(4),對(duì)原始數(shù)據(jù)進(jìn)行預(yù)處理,以消除各變量因量綱和數(shù)值差異對(duì)計(jì)算產(chǎn)生的影響:
其中,xij為原始數(shù)據(jù),zij為標(biāo)準(zhǔn)化數(shù)據(jù);
(3)因子分析要求變量具有連續(xù)性和相關(guān)性,故在分析數(shù)據(jù)之前,需要對(duì)數(shù)據(jù)進(jìn)行KMO檢驗(yàn)和Bartiett球度檢驗(yàn)。
通過計(jì)算KMO值,可知樣本是否適合采用因子分析法進(jìn)行評(píng)價(jià)。當(dāng)KMO<0.5時(shí),說明該樣本不適合采用因子分析法進(jìn)行綜合評(píng)價(jià);當(dāng)0.5
Bartiett球度檢驗(yàn)值若小于顯著性水平,說明變量間有相關(guān)性,可以進(jìn)行因子分析。
具體計(jì)算公式如下:
(4)計(jì)算相關(guān)系數(shù)矩陣,如式(6)所示:
其中,i=j時(shí),rij=1;i≠j時(shí),rij= rji;
(5)求解相關(guān)系數(shù)矩陣特征值和特征向量,并計(jì)算貢獻(xiàn)率,如式(7)所示:
設(shè)R的特征值依次為λ1,λ2,…,λn,且規(guī)定λ1≥λ2…λn≥0,則λi/(λ1+λ2+…+λn)是第i主成分的貢獻(xiàn)。方差貢獻(xiàn)率指的是第i因子對(duì)所有原始變量的信息提取程度。累積方差貢獻(xiàn)率是提取出的所有因子對(duì)原始變量總共提取的信息量,即(λ1+λ2+…+λi)/(λ1+λ2+…+ λn);
(6)確定公因子個(gè)數(shù)。提取幾個(gè)因子可根據(jù)以下幾點(diǎn)來確定:
1)初始特征值大于1的因子個(gè)數(shù);
2)累積方差解釋率達(dá)到一定水平(一般為60%)的因子個(gè)數(shù);
3)碎石圖中處于陡峭斜率所對(duì)應(yīng)的因子個(gè)數(shù);
(7)對(duì)因子載荷矩陣進(jìn)行旋轉(zhuǎn)處理
采取最常用的最大方差法進(jìn)行旋轉(zhuǎn)。旋轉(zhuǎn)處理后的因子載荷矩陣能對(duì)各原始變量更好地進(jìn)行分類。旋轉(zhuǎn)次數(shù)可以自己規(guī)定,也可以通過SPSS軟件進(jìn)行確定;
(8)計(jì)算因子得分
將公共因子當(dāng)作分析變量,計(jì)算其因子得分。
在信息論中,熵是對(duì)不確定性的一種度量。不確定性越大,熵就越大,包含的信息量越大;不確定性越小,熵就越小,包含的信息量就越小。利用熵權(quán)決策法來計(jì)算各評(píng)價(jià)指標(biāo)的權(quán)重,即是利用評(píng)價(jià)指標(biāo)的有效信息量來計(jì)算,有效信息量越大,權(quán)重就越大[14]。根據(jù)熵的特性,可以通過計(jì)算熵值來判斷一個(gè)事件的隨機(jī)性以及無序程度,也可以用熵值來判斷某個(gè)指標(biāo)的離散程度,指標(biāo)的離散程度越大,該指標(biāo)對(duì)綜合評(píng)價(jià)的影響(權(quán)重越大)。比如樣本數(shù)據(jù)在某指標(biāo)下取值都相等,則該指標(biāo)對(duì)總體評(píng)價(jià)的影響為0,權(quán)值為0。熵權(quán)法是一種客觀賦權(quán)法,因?yàn)樗鼉H依賴于數(shù)據(jù)本身的離散性。
(1)數(shù)據(jù)標(biāo)準(zhǔn)化處理,如式(8)所示:
(2)計(jì)算因子所占比例,如式(9)所示:
(3)計(jì)算各因子權(quán)重,如式(10)所示:
其中,dj是第j項(xiàng)指標(biāo)的信息效用值。
其中,ej是第j項(xiàng)因子的熵值。
(4)計(jì)算綜合得分,式(13)所示:
收集不同地區(qū)土壤腐蝕性參數(shù)數(shù)據(jù),總計(jì)樣本數(shù)m為100,原始變量數(shù)n為5(包括土壤pH值、氧化還原電位、土壤電阻率、極化電流密度和質(zhì)量損失)。
首先將不同量綱的訓(xùn)練數(shù)據(jù)集通過標(biāo)準(zhǔn)化公式進(jìn)行標(biāo)準(zhǔn)化處理消除數(shù)據(jù)自身對(duì)結(jié)果的不利影響。分析樣本變量數(shù)據(jù)間的相關(guān)關(guān)系是進(jìn)行因子分析的先行條件,若變量間的相關(guān)關(guān)系較差,則無法分析出公共因子。在SPSSPro軟件中,變量相關(guān)關(guān)系由KMO檢驗(yàn)和Bartiett球度檢驗(yàn)進(jìn)行評(píng)價(jià)。KMO檢驗(yàn)用于分析原始變量數(shù)據(jù)間的簡(jiǎn)單相關(guān)性和偏相關(guān)性的大小關(guān)系,Bartiett球度檢驗(yàn)用于檢驗(yàn)變量數(shù)據(jù)是否符合多元正態(tài)分布。
由表1可知,KMO統(tǒng)計(jì)量為0.619,Bartiett球度檢驗(yàn)的概率值小于0.05(顯著性水平),說明所分析的5個(gè)變量之間是存在相關(guān)性,符合因子分析的前提條件,可以進(jìn)行因子分析。
表1 KMO檢驗(yàn)和Bartlett檢驗(yàn)
由表2可知,前兩個(gè)因子的初始特征值均大于1,且累積方差解釋率為大于60%,說明這兩個(gè)因子能夠基本反映土壤對(duì)鋼結(jié)構(gòu)的腐蝕情況。結(jié)合碎石圖(如圖1所示)中處于陡峭斜率所對(duì)應(yīng)的因子個(gè)數(shù),可以確定選取前兩個(gè)因子進(jìn)行分析。
圖1 碎石圖
表2 方差分析
為了賦予因子載荷實(shí)際意義,采取最大方差法進(jìn)行因子旋轉(zhuǎn),旋轉(zhuǎn)后因子載荷系數(shù)如表3所示。因子旋轉(zhuǎn)前后,累計(jì)方差解釋率并未變化,但是各因子解釋原有變量的方差進(jìn)行了重新分配,其方差解釋率發(fā)生了變化。由表3可知,第1因子在質(zhì)量損失上有較大的載荷,體現(xiàn)出導(dǎo)電性質(zhì)。第2因子在氧化還原電位上有較大的載荷,體現(xiàn)出電化學(xué)性質(zhì)。
表3 旋轉(zhuǎn)后因子載荷系數(shù)
表4說明各個(gè)成分的所包含的因子得分系數(shù)(主成分載荷),用于計(jì)算出成分得分,得出主成分公式。計(jì)算得到各樣品對(duì)鋼結(jié)構(gòu)腐蝕能力的兩個(gè)因子得分,最后根據(jù)各因子解釋率得到最終的綜合得分。得分情況如圖2所示。
圖2 主因子得分情況
表4 成分矩陣
第一個(gè)公共因子與質(zhì)量損失、視電阻率和電阻率有較大相關(guān)性,它代表了土壤的物理性質(zhì),反映土壤介質(zhì)的導(dǎo)電能力。第二個(gè)公共因子與氧化還原電位和pH值有較大相關(guān)性,它代表了土壤的電化學(xué)性質(zhì)。
將通過因子分析法得到的兩個(gè)主因子帶入式(8)~式(12),計(jì)算出第1因子、第2因子的權(quán)重分別為 33.986%、66.014%。得分情況如圖3所示。
圖3 熵權(quán)法得分情況
選取海南、安徽、河北、天津等地區(qū)共計(jì)72個(gè)土樣,采用因子分析-熵權(quán)法模型綜合評(píng)價(jià)其對(duì)鋼結(jié)構(gòu)的腐蝕情況,將分析結(jié)果與GB50021-2001《巖土工程勘察規(guī)范》(2009年版)得到的腐蝕等級(jí)結(jié)果進(jìn)行對(duì)比,結(jié)果如表5所示。GB50021-2001《巖土工程勘察規(guī)范》(2009年版)將土壤腐蝕性等級(jí)分為微、弱、中、強(qiáng)4個(gè)等級(jí)。由表5可知,72個(gè)土樣中微腐蝕有13個(gè),弱腐蝕有10個(gè),中腐蝕有30個(gè),強(qiáng)腐蝕有19個(gè)。腐蝕性等級(jí)均未出現(xiàn)跨等級(jí)跳躍的情況??傮w上,因子分析-熵權(quán)法模型評(píng)價(jià)指標(biāo)得到的綜合評(píng)價(jià)結(jié)果與規(guī)范的評(píng)價(jià)結(jié)果基本一致。
表5 因子分析-熵權(quán)法模型土壤腐蝕性評(píng)價(jià)結(jié)果
(1)本文提供了一種系統(tǒng)、可靠的土壤對(duì)鋼結(jié)構(gòu)腐蝕性綜合評(píng)價(jià)方法,該方法通過因子分析法得到的影響土壤腐蝕性的關(guān)鍵因素F1和F2作為評(píng)價(jià)指標(biāo),再通過熵權(quán)法計(jì)算權(quán)重得到各土壤的得分情況,從而最終得到土壤腐蝕性評(píng)價(jià)結(jié)果;
(2)經(jīng)多個(gè)應(yīng)用實(shí)例驗(yàn)證其結(jié)果與該模型評(píng)價(jià)結(jié)果一致,說明該模型可推廣使用。同時(shí),該評(píng)價(jià)方法為土壤腐蝕性評(píng)價(jià)工作提供了一種具有借鑒意義的新思路。