王起才,鮑學(xué)英,曹興龍,張戎令
(蘭州交通大學(xué) 土木工程學(xué)院,甘肅 蘭州 730070)
基于主成分分析法的C50高性能混凝土配合比優(yōu)選研究
王起才,鮑學(xué)英,曹興龍,張戎令
(蘭州交通大學(xué) 土木工程學(xué)院,甘肅 蘭州 730070)
主成分分析法能夠在保證原始數(shù)據(jù)信息損失最小的情況下,以少數(shù)的綜合變量取代原有的多維變量,使數(shù)據(jù)結(jié)構(gòu)大為簡化。試驗(yàn)選取了能間接反映混凝土性能的15項(xiàng)主要指標(biāo),采用主成分分析法對這些間接指標(biāo)進(jìn)行相關(guān)的數(shù)值處理,得出了評價(jià)混凝土性能的數(shù)學(xué)模型。以蘭新二線第9標(biāo)段95組C50高性能混凝土樣本為基礎(chǔ),運(yùn)用該模型對C50高性能混凝土樣本的性能進(jìn)行了評價(jià),并按照該樣本的綜合性能進(jìn)行了排序,將評價(jià)結(jié)果與實(shí)際樣本進(jìn)行對比,結(jié)果表明,該模型的評價(jià)結(jié)果與C50高性能混凝土的實(shí)際性能符合得很好。
主成分分析法 混凝土配合比 評價(jià)模型
高性能混凝土不僅要求混凝土的拌合物具有大流動(dòng)性的施工性能,而且要求混凝土具有良好的力學(xué)性能和耐久性[1]。蘭新鐵路第二雙線第9標(biāo)段施工工期為3年,線路穿越新疆戈壁地區(qū),區(qū)段內(nèi)氣候環(huán)境具有干燥、大風(fēng)和大溫差特點(diǎn)[2],這種特殊的氣候環(huán)境,極易使高性能混凝土產(chǎn)生質(zhì)量問題。研究認(rèn)為能間接反映高性能混凝土性能的因素很多,這些因素對混凝土性能的影響或重或輕,如果能夠確定混凝土強(qiáng)度及其影響因素之間的數(shù)學(xué)關(guān)系,就可以在不了解材料內(nèi)部詳細(xì)機(jī)理的情況下,根據(jù)數(shù)學(xué)關(guān)系探索混凝土的最優(yōu)配合比,以尋求材料的最佳性能[3]。近年來,隨著多元統(tǒng)計(jì)方法的普及與應(yīng)用,主成分分析法在最大限度保留原有信息的基礎(chǔ)上,對高維變量系統(tǒng)進(jìn)行最佳的綜合與簡化,并且能夠客觀地確定各個(gè)指標(biāo)的權(quán)數(shù),避免了主觀隨意性[4]。通過對蘭新二線第9標(biāo)段梁體結(jié)構(gòu)C50混凝土的配合比試驗(yàn),利用主成分分析法,建立高性能混凝土綜合評價(jià)模型,并對混凝土性能進(jìn)行排序,對試驗(yàn)樣本進(jìn)行優(yōu)選,為 C50混凝土最佳配合比的設(shè)計(jì)提供了一定的理論依據(jù)。
主成分分析法(Principal Component Analysis,PCA)是將分散在一組變量上的信息,通過恰當(dāng)?shù)臄?shù)學(xué)變換,使新變量—主成分成為原變量的線性組合,并選取少數(shù)幾個(gè)在變差總信息量中比例較大的主成分來分析事物的一種探索性統(tǒng)計(jì)分析方法[5]。其目的主要有兩個(gè):一是用有限個(gè)不可觀察的潛在變量進(jìn)行解釋原變量的相關(guān)性,二是對變量或樣本進(jìn)行分類處理,用較少的指標(biāo)表達(dá)大部分信息量[6]。正是利用主成分分析法的上述優(yōu)點(diǎn),可把高性能混凝土比較分散的性能集中到幾個(gè)指標(biāo)上來,從而實(shí)現(xiàn)對高性能混凝土配合比的優(yōu)選。
假定有n個(gè)樣本,每個(gè)樣本共有p個(gè)變量,構(gòu)成一個(gè)n×p階的數(shù)據(jù)矩陣
將原變量指標(biāo)進(jìn)行降維處理后的新變量為 F1,F(xiàn)2,…,F(xiàn)m(m≤p),如式(2)所示,式中,xj=[x1jx2j…x]T。
新變量F1,F(xiàn)2,…,F(xiàn)m構(gòu)成的坐標(biāo)系是在原坐標(biāo)系經(jīng)平移和正交旋轉(zhuǎn)后得到的。稱F1,F(xiàn)2,…,F(xiàn)m張成的空間為m維主超平面。在主超平面上,第1主成分F1是x1,x2,…,xp的所有線形組合中方差最大者,F(xiàn)2是與F1不相關(guān)的x1,x2,…,xp的所有線形組合中方差最大者;Fm是與 F1,F(xiàn)2,…,F(xiàn)m-1都不相關(guān) x1,x2,…,xp的所有線形組合中方差最大者。因此,新變量指標(biāo)F1,F(xiàn)2,…,F(xiàn)m分別稱為原變量指標(biāo) x1,x2,…,xp的第1,第2,…,第m主成分。從以上分析可以看出,主成分分析的實(shí)質(zhì)就是確定原來變量 x1,x2,…,xp在諸主成分 F1,F(xiàn)2,…,F(xiàn)m上的載荷 lij(i=1,2,…,m;j=1,2,…,p)。
由主成分分析的基本原理和數(shù)學(xué)模型可以看出,其估計(jì)的任務(wù)是通過確定主成分的個(gè)數(shù),解釋主成分的實(shí)際意義和它的得分,從而可以從幾個(gè)或若干個(gè)備選方案里選擇出較優(yōu)化的方案。由于反映混凝土性能的量綱不一致,在進(jìn)行主成分分析之前可對其各指標(biāo)進(jìn)行標(biāo)準(zhǔn)化處理,統(tǒng)一為無量綱的數(shù)值。
第一步:對原始數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化變換
設(shè)有n個(gè)樣本,每個(gè)樣本觀測p項(xiàng)指標(biāo),得到原始數(shù)據(jù)資料,為了排除數(shù)量級和量綱不同帶來的影響,用式(3)先對原始數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理。
第二步:計(jì)算樣本相關(guān)系數(shù)矩陣為
其中,rij(i,j=1,2,…,p)為原變量 yi與 yj的相關(guān)系數(shù),rij=rji,其計(jì)算公式為
第三步:計(jì)算相關(guān)矩陣的特征值及其所對應(yīng)的特征向量
由R的特征方程:|R-λE|=0,可得p個(gè)非負(fù)特征值 λi(i=1,2,...,p),并將這些特征值按由大到小的順序排列:λ1≥λ2≥…≥λp≥0。
第四步:計(jì)算主成分貢獻(xiàn)率及累計(jì)貢獻(xiàn)率
主成分的貢獻(xiàn)率ηi和主成分Fi的累計(jì)貢獻(xiàn)率 ξF,i分別如式(7)和式(8)
累計(jì)貢獻(xiàn)率一般以其達(dá)到某一特定值時(shí)為準(zhǔn)(如85%),保留前m個(gè)主成分來確定混凝土性能。
第五步:計(jì)算主成分載荷lij
第六步:計(jì)算樣本的綜合得分。
由上述計(jì)算可得到樣本混凝土的綜合性能,即得到式(2)??蓮母鹘M比較分散的指標(biāo)中找出最優(yōu)化的組合。
首先對蘭新二線第9標(biāo)段C50混凝土試驗(yàn)樣本數(shù)據(jù)進(jìn)行簡單的刪減,保留其中能夠全面反映混凝土信息指標(biāo)的95組不同配合比的C50混凝土樣本,部分試驗(yàn)數(shù)據(jù)如表1所示。
表1 C50混凝土部分試驗(yàn)樣本
1)主成分分析法的適用性驗(yàn)證
由于試驗(yàn)樣本各性能的量綱不同,要對其進(jìn)行標(biāo)準(zhǔn)化,在得到標(biāo)準(zhǔn)化數(shù)據(jù)后利用SPSS軟件對表1中的數(shù)據(jù)進(jìn)行主成分分析。首先,確定一組數(shù)據(jù)是否適合做主成分分析,需要做 KMO取樣適合度檢驗(yàn)和Bartlett球形檢驗(yàn)。KMO取樣適合度檢驗(yàn)統(tǒng)計(jì)量是用于比較觀測變量間相關(guān)系數(shù)平方和和偏相關(guān)系數(shù)平方和指標(biāo)。偏相關(guān)系數(shù)絕對值越小,說明兩變量存在公共因子的可能性越大,說明可能適合做主成分分析。Bartlett球形檢驗(yàn)是一種檢驗(yàn)變量之間相關(guān)性程度的檢驗(yàn)方法,它以原有變量的相關(guān)系數(shù)矩陣為出發(fā)點(diǎn),檢驗(yàn)實(shí)際相關(guān)矩陣與假設(shè)單位陣之間的差異性。如果差異性顯著,則認(rèn)為變量間的相關(guān)性顯著,適合于做主成分分析。具體檢驗(yàn)結(jié)果如表2所示。
表2 KMO檢驗(yàn)
由表2中的Kaiser-Meyer-Olkin度量可知K值>0.6,因此證明對該組C50混凝土試驗(yàn)樣本進(jìn)行主成分分析是滿足要求的。Bartlett球形檢驗(yàn)的 Sig<0.05,說明可以做主成分分析。
2)主成分的特征值和貢獻(xiàn)率
對C50混凝土的15項(xiàng)指標(biāo)計(jì)算其特征值和累計(jì)貢獻(xiàn)率,如表3所示。
表3 特征值和累計(jì)貢獻(xiàn)率
根據(jù)表3可知前4個(gè)成分的方差累計(jì)貢獻(xiàn)率達(dá)80%,在15個(gè)混凝土指標(biāo)中前4個(gè)指標(biāo)的貢獻(xiàn)率最大,因此,15個(gè)混凝土指標(biāo)歸結(jié)為4個(gè)主成分,其碎石圖如圖1。
由碎石圖可知將15個(gè)指標(biāo)化為4個(gè)主成分是成立的。同時(shí),可以得到主成分的因子載荷圖,如圖2所示。由圖2可以發(fā)現(xiàn)隸屬于主成分F1的有指標(biāo)3 d強(qiáng)度,7 d強(qiáng)度,28 d強(qiáng)度,水泥,膠凝材料;隸屬于主成分F2的有粉煤灰,礦粉,細(xì)骨料,水,水膠比,56 d電通量,初始含氣量;隸屬于主成分F3的有粗骨料,減水劑;隸屬于主成分F4的有表觀密度。與專業(yè)知識(shí)基本吻合,綜合來看F1代表強(qiáng)度,F(xiàn)2代表水膠比,F(xiàn)3代表粗骨料,F(xiàn)4代表密實(shí)度。
圖1 指標(biāo)碎石圖
圖2 主成分的因子載荷圖
3)計(jì)算C50混凝土的綜合性能指標(biāo)
各成分的貢獻(xiàn)率由表4可得,并以其為依據(jù)作為權(quán)重因子的權(quán)重,可得到C50混凝土各指標(biāo)的綜合性能指標(biāo)。
表4 成分得分系數(shù)矩陣
各成分的貢獻(xiàn)率作為權(quán)重因子的權(quán)重,可得到C50混凝土各指標(biāo)的綜合性能指標(biāo)
根據(jù)所篩選出的反映C50高性能混凝土綜合性能的4個(gè)主成分,可以計(jì)算出主成分 F1,F(xiàn)2,F(xiàn)3,F(xiàn)4的權(quán)重,如表5所示,根據(jù)所測試的15項(xiàng)指標(biāo)得出C50混凝土性能綜合評價(jià)表達(dá)式為
表5 各主成分綜合權(quán)重
利用MATLAB工具,計(jì)算得到了每一個(gè)樣本的綜合評價(jià)結(jié)果,前10名排序結(jié)果如表6所示。由表可知樣本7的綜合質(zhì)量是最優(yōu)的,因此,可以考慮采用該樣本的配比為最佳配合比。
表6 前10名混凝土樣本評價(jià)結(jié)果
主成分分析法可把變量間的相關(guān)性消除,且根據(jù)降維的思想降低計(jì)算的工作量,把很多不同的變量集中到一個(gè)或幾個(gè)指標(biāo)上來,這樣就大大減少分析數(shù)據(jù)的工作量。綜合評價(jià)所得的權(quán)數(shù)是伴隨數(shù)學(xué)變換自動(dòng)生成的,對指標(biāo)的綜合評價(jià)具有一定的客觀性,可在一定程度上反映出各組分性能的高低[7-9]。論文在對蘭新二線第9標(biāo)段C50高性能混凝土95組試驗(yàn)樣本利用主成分分析法進(jìn)行評價(jià)后得到以下結(jié)論:①運(yùn)用主成分分析法可把混凝土的性能指標(biāo)之間的不同量綱統(tǒng)一轉(zhuǎn)化為無量綱的指標(biāo),通過對無量綱指標(biāo)的分析可有效地比較不同組別的各性能的高低,為綜合指標(biāo)性能的分析提供一種快捷的方法。②綜合應(yīng)用各種現(xiàn)代優(yōu)化算法,并合理選取學(xué)習(xí)樣本,能夠?qū)炷恋呐浜媳冗M(jìn)行定量的優(yōu)化設(shè)計(jì),從而大大減少試驗(yàn)量,在降低材料研制成本、縮短試驗(yàn)周期等方面,具有不可低估的應(yīng)用價(jià)值。
[1]朱文華.淺談鐵路高性能混凝土配合比設(shè)計(jì)體會(huì)[J].混凝土,2011(8):113-117.
[2]楊得山,王起才.蘭新二線高性能混凝土橋墩抗裂性試驗(yàn)研究[J].工程建設(shè)與設(shè)計(jì),2011(7):152-157.
[3]安寧.高性能混凝土配方優(yōu)化方法的研究[J].混凝土,2006(9):72-76.
[4]潘懷兵.基于主成分分析法的瀝青路面使用性能評價(jià)[J].重慶交通大學(xué)學(xué)報(bào),2010(12):888-892.
[5]余錦華,楊維權(quán).多元統(tǒng)計(jì)分析與應(yīng)用[M].廣州:中山大學(xué)出版社,2005.
[6]汪海東,曾志興.基于主成分分析法的高性能再生混凝土性能優(yōu)化設(shè)計(jì)[J].混凝土,2011(4):51-55.
[7]張純禹,李啟令.粉煤灰混凝土強(qiáng)度的優(yōu)化設(shè)計(jì)[J].鄭州大學(xué)學(xué)報(bào),2002(4):88-92.
[8]齊紅軍.鐵路客運(yùn)專線高性能混凝土配合比設(shè)計(jì)優(yōu)化[J].鐵道建筑,2012(7):134-136.
[9]朱星宇,陳勇強(qiáng).SPSS多元統(tǒng)計(jì)分析方法及應(yīng)用[M].北京:清華大學(xué)出版社,2011.
U422.5;U448.21+3
A
10.3969/j.issn.1003-1995.2013.04.47
1003-1995(2013)04-0152-04
2012-12-20;
2013-01-20
長江學(xué)者和創(chuàng)新團(tuán)隊(duì)發(fā)展計(jì)劃項(xiàng)目(IRT1139)
王起才(1962— ),男,河北晉州人,教授,博士。
(責(zé)任審編 王 紅)