曹雪娟,盧治琳,吳博文,黃 瑩,王 民
(1. 重慶交通大學(xué) 材料科學(xué)與工程學(xué)院,重慶 400074; 2. 重慶交通大學(xué) 土木工程學(xué)院,重慶 400074; 3. 重慶市智翔鋪道技術(shù)工程有限公司,重慶 400067)
目前,我國高速公路已經(jīng)從最初的大規(guī)模建設(shè)階段逐步過渡到瀝青路面的養(yǎng)護和管理階段??茖W(xué)合理地評價瀝青路面使用性能是制定養(yǎng)護計劃的基礎(chǔ)[1-3],因此,對瀝青路面使用性能進行準(zhǔn)確預(yù)測至關(guān)重要。
國內(nèi)外常用的瀝青路面使用性能預(yù)測模型主要分為概率型和確定型兩類。隨著計算機技術(shù)的發(fā)展,灰色預(yù)測模型、神經(jīng)網(wǎng)絡(luò)預(yù)測模型和組合預(yù)測模型逐漸成為研究焦點[4-6]?;疑A(yù)測模型可以通過較少的建模數(shù)據(jù)得到較高的預(yù)測精度,但對隨機因素變化較大的瀝青路面預(yù)測效果較差[7-9]。神經(jīng)網(wǎng)絡(luò)預(yù)測模型具有較強的信息處理和自學(xué)習(xí)能力,已成功應(yīng)用于道路工程領(lǐng)域[10-11],徑向基(radial basis function,RBF)因其可以逼近任意的非線性函數(shù)被廣泛應(yīng)用,但存在容易陷入局部最優(yōu)值的問題[12-13]。目前研究多采用組合方法對目標(biāo)進行預(yù)測,如主成分分析法(principal component analysis,PCA)和遺傳算法(genetic algorithm,GA)等,組合預(yù)測模型優(yōu)于單一數(shù)學(xué)模型分析的定性研究,預(yù)測結(jié)果與實際狀況更加吻合[14-17]。
筆者提出了一種基于RBF的瀝青路面使用性能組合預(yù)測模型——PCA-GA-RBF。將模型訓(xùn)練階段的計算誤差作為目標(biāo)函數(shù),引入PCA對路面使用性能影響因素進行降維處理;利用GA優(yōu)化RBF結(jié)構(gòu),為瀝青路面使用性能預(yù)測提供了可靠的依據(jù)。研究表明:組合預(yù)測模型PCA-GA-RBF結(jié)構(gòu)簡單、收斂速度快、預(yù)測精度高。
首先定義一個非線性映射,將瀝青路面使用性能影響數(shù)據(jù)集(路齡、年均氣溫、年均降雨量等)映射到高維特征空間中,然后在此特征空間中對路面使用性能進行線性回歸,最終達到預(yù)測路面使用性能的目的。步驟如下:
1)收集原始數(shù)據(jù)并進行預(yù)處理;
2)運用主成分分析法對建模數(shù)據(jù)進行降維處理,將計算結(jié)果作為模型的輸入變量;
3)運用遺傳算法進行全局尋優(yōu)計算,確定最優(yōu)模型參數(shù)λ、α;
4)以路面行駛質(zhì)量指數(shù)(IRQ)為模型輸出變量,建立神經(jīng)網(wǎng)絡(luò)訓(xùn)練模型;
5)對組合預(yù)測模型PCA-GA-RBF進行評估。
基于組合預(yù)測模型PCA-GA-RBF的瀝青路面使用性能算法流程如圖1。
圖1 組合預(yù)測模型PCA-GA-RBF算法流程
為了提高組合預(yù)測模型PCA-GA-RBF樣本數(shù)據(jù)的質(zhì)量,減少異常數(shù)據(jù)和缺失數(shù)據(jù)對回歸性能的干擾,同時加快RBF模型的訓(xùn)練速度,筆者對原始數(shù)據(jù)集做了如下預(yù)處理。
1.1.1 數(shù)據(jù)組成分析與優(yōu)化
筆者收集整理了四川省2014—2019年23條高速公路的路面施工建造、環(huán)境氣候、交通量和路面養(yǎng)護等4大模塊數(shù)據(jù),基于瀝青路面使用性能指標(biāo)體系,挖掘出15個對瀝青路面破損狀況有較大影響的因素,詳見表1。將整理的瀝青路面使用性能數(shù)據(jù)信息導(dǎo)入SQL Server平臺,建立數(shù)據(jù)庫,“上面層材料類型”“中面層材料類型”等材料類型數(shù)據(jù)在軟件中量化為0、1、……形式。
表1 瀝青路面使用性能影響因素
1.1.2 剔除異常數(shù)據(jù)
根據(jù)JTG 5210—2018《公路技術(shù)狀況評定標(biāo)準(zhǔn)》,路面性能指標(biāo)檢測得分在0~100之間,數(shù)值越大表明路面性能越好,超過上限100或低于下限0的數(shù)據(jù)可以明確劃分為異常值剔除。
1.1.3 缺失數(shù)據(jù)分析
缺失數(shù)據(jù)主要包括記錄的缺失和記錄中某個字段的缺失,筆者采用多重插補法(MI)對缺失數(shù)據(jù)進行處理,從包含缺失值的數(shù)據(jù)集中生成多組完整的數(shù)據(jù)集。
1.2.1 主成分分析法
在不減少原始數(shù)據(jù)所包含信息的前提下,為了能夠?qū)υ紨?shù)據(jù)進行降維處理,以使計算方差最優(yōu),筆者采用主成分分析法來選取影響瀝青路面使用性能的主成分因素。路齡、年均氣溫、年均降雨量等15個路面使用性能影響因素即為主成分分析中的主成分因素,基于Karhunen-Loeve變換原理求解特征方程,采用MATLAB提供的主成分分析函數(shù)princomp進行主成分分析,最終得到15個因素的主成分分析碎石圖(圖2),圖中僅展示了前10個主成分因素。
圖2 主成分分析
由圖2可見,F8主成分因素之后曲線斜率變化趨于平穩(wěn),并且F9與F10主成分因素之間的線段斜率近乎為0,說明F9、F10主成分因素所包含的原始數(shù)據(jù)信息非常少,分析時可不考慮。因此,筆者選取前8個主成分因素進行分析。
1.2.2 主成分分析法可靠性驗證
表2為主成分特征值的貢獻率比較結(jié)果。
表2 主成分特征值的貢獻率
由表2可知,8個主成分因素的綜合獻率超過85%,因此,選取這8個主成分因素進行分析較為合理,既保留了足夠多的原始信息,又實現(xiàn)了降維處理。
RBF的計算效率與性能由參數(shù)λ、α決定,筆者將遺傳算法的計算結(jié)果作為初始權(quán)值進行模型優(yōu)化。
1.3.1 染色體編碼
為了提高參數(shù)尋優(yōu)精確性,采用二進制編碼方式,避免后續(xù)選擇、交叉和變異過程中的編碼與解碼,最終構(gòu)建的RBF的拓撲解構(gòu)為8-48-1,從而,確定RBF中間隱藏層的神經(jīng)元個數(shù)為48。
1.3.2 適應(yīng)度函數(shù)的選擇
適應(yīng)度函數(shù)決定了模型的尋優(yōu)方向。針對RBF參數(shù)優(yōu)化問題,筆者選取均方差誤差函數(shù)M作為適應(yīng)度函數(shù),如式(1):
(1)
1.3.3 選擇、交叉和變異
采用輪盤賭的方式選擇新的種群,染色體被選擇的概率隨函數(shù)值的增大而增高,交叉和變異均依照系統(tǒng)設(shè)置概率進行操作。經(jīng)過RBF的反復(fù)迭代,最終尋找出基于全體樣本的最優(yōu)參數(shù)λ=0.58、α=0.997。遺傳算法優(yōu)化過程的相關(guān)參數(shù)設(shè)置如表3。
表3 遺傳算法優(yōu)化參數(shù)
1.4.1 確定輸入變量和輸出變量
將主成分分析所得的8個主成分因素作為組合預(yù)測模型的輸入變量,瀝青路面行駛質(zhì)量指數(shù)(IRQ)作為預(yù)測模型的輸出變量,共同構(gòu)成數(shù)據(jù)總量為5 000組的建模數(shù)據(jù)集。
1.4.2 選定訓(xùn)練樣本集與測試樣本集
為保證PCA-GA-RBF有較好的預(yù)測效果,避免計算過程出現(xiàn)過擬合的現(xiàn)象,將整體建模數(shù)據(jù)集劃分為訓(xùn)練集與測試集2類,訓(xùn)練集數(shù)據(jù)∶測試集數(shù)據(jù)為70∶30,即訓(xùn)練集3 500組數(shù)據(jù),測試集1 500組數(shù)據(jù)。
1.4.3 確定徑向基函數(shù)
采用高斯函數(shù)作為徑向基函數(shù)φ(x),以減少多變量輸入的復(fù)雜程度。
1.4.4 遺傳優(yōu)化算法對回歸參數(shù)尋優(yōu)
為了提高PCA-GA-RBF的預(yù)測精度,采用遺傳算法對高斯函數(shù)的中心向量Ci和寬度σi進行最優(yōu)參數(shù)選擇。
由于RBF的輸出層根據(jù)需求為單個預(yù)測值,權(quán)值向量為w=[w1,w2,…]T,故預(yù)測值表達式為
yi=wφ(x)
(2)
利用R語言編程平臺,建立組合預(yù)測模型PCA-GA-RBF。
1.5.1 PCA-GA-RBF與RBF對比
PCA-GA-RBF、RBF訓(xùn)練模型的訓(xùn)練過程如圖3。
圖3 PCA-GA-RBF、RBF訓(xùn)練過程
由圖3可見,與RBF相比,PCA-GA-RBF訓(xùn)練過程曲線斜率較大,迭代次數(shù)較少,計算速率更快。表明主成分分析可減少迭代次數(shù),實現(xiàn)對數(shù)據(jù)的降維處理,簡化了模型結(jié)構(gòu)。
1.5.2 PCA-GA-RBF預(yù)測精度檢驗
圖4為PCA-GA-RBF與RBF模型的預(yù)測結(jié)果。
圖4 PCA-GA-RBF、RBF預(yù)測結(jié)果
從圖4可以看出,圖4(b)中各個離散點的分布較密集,即離散程度較小,說明PCA-GA-RBF的預(yù)測精度較高,真實值與預(yù)測值之間的偏差波動較小,結(jié)果較可靠。
1.5.3 PCA-GA-RBF有效性與準(zhǔn)確性檢驗
采用與構(gòu)建組合預(yù)測模型PCA-GA-RBF相似的方法,構(gòu)建PCA-GA-BP模型,其中數(shù)據(jù)預(yù)處理和瀝青路面使用性能影響因素也采用主成分分析法。經(jīng)過試算驗證后,確定了PCA-GA-BP模型的最優(yōu)網(wǎng)絡(luò)結(jié)構(gòu),即第一層神經(jīng)元個數(shù)為6個、第二層神經(jīng)元個數(shù)為5個的網(wǎng)絡(luò)結(jié)構(gòu)。調(diào)用R語言平臺neuralnet函數(shù)構(gòu)建BP、PCA-GA-BP訓(xùn)練模型,兩者完成計算分別共進行了9 876、7 962次迭代。
表4為BP、PCA-GA-BP和RBF、PCA-GA-RBF預(yù)測模型擬合優(yōu)度R2與均方根誤差S的計算結(jié)果??梢?4個模型中,組合預(yù)測模型PCA-GA-RBF的R2最接近1,S最小,表明其預(yù)測結(jié)果有效且精度較高。
表4 4種神經(jīng)網(wǎng)絡(luò)預(yù)測模型評估結(jié)果
隨機選取了四川省2014—2019年10條高速公路共計2 280個IRQ記錄數(shù)據(jù),將建模數(shù)據(jù)集按照訓(xùn)練集數(shù)據(jù)∶測試集數(shù)據(jù)為70∶30進行劃分,即訓(xùn)練集1 596組數(shù)據(jù),測試集648組數(shù)據(jù)。
根據(jù)JTG H 20—2007《公路技術(shù)狀況評定標(biāo)準(zhǔn)》,路面平整度評價標(biāo)準(zhǔn)見表5,路面行駛質(zhì)量指數(shù)IRQ按式(3)計算:
(3)
式中:IIR為國際平整度;a0、a1為標(biāo)定系數(shù),a0=0.026,a1=0.650。
表5 路面平整度評價標(biāo)準(zhǔn)
瀝青路面使用性能真實值與PCA-GA-RB預(yù)測值如圖5??梢?預(yù)測曲線擬合優(yōu)度R2=0.850,各離散點分布相對密集,表明組合預(yù)測模型的泛化能力較強,誤差波動性較小。
圖5 PCA-GA-RBF預(yù)測結(jié)果
統(tǒng)計的2 280個IRQ記錄數(shù)據(jù)中,路面平整度實際等級為優(yōu)、良、中的IRQ數(shù)據(jù)個數(shù)見表6。同時,采用組合預(yù)測模型PCA-GA-RBF預(yù)測瀝青路面的IRQ,再根據(jù)表5得出路面平整度預(yù)測等級,預(yù)測等級分別為為優(yōu)、良、中的IRQ數(shù)據(jù)統(tǒng)計見表6。
表6 路面平整度實際等級和預(yù)測等級的IRQ數(shù)據(jù)統(tǒng)計
表6中,當(dāng)路面平整度預(yù)測等級和實際等級均分別為優(yōu)、良、中時,預(yù)測所用IRQ數(shù)據(jù)個數(shù)A*分別為525、27、17,路面平整度實際等級分別為優(yōu)、良、中時,IRQ實際數(shù)據(jù)個數(shù)B*分別為632、32、20,則PCA-GA-RBF對路面平整度實際等級為優(yōu)、良、中的預(yù)測準(zhǔn)確率Q=A*/B*,從而可以得到,PCA-GA-RBF對路面平整度實際等級為優(yōu)、良、中的預(yù)測準(zhǔn)確率分別為83.1%、84.3%、85.0%,可見預(yù)測的準(zhǔn)確率較高。
引入PCA和GA以優(yōu)化RBF模型,得到了瀝青路面使用性能組合預(yù)測模型PCA-GA-RBF;將PCA-GA-RBF應(yīng)用于路面行駛質(zhì)量的預(yù)測,并與實際路面行駛質(zhì)量指標(biāo)進行對比,驗證了PCA-GA-RBF的準(zhǔn)確性。研究得到以下主要結(jié)論:
1)在BP、PCA-GA-BP及RBF、PCA-GA-RBF等4個模型中,PCA-GA-RBF的擬合優(yōu)度R2最接近1,均方根誤差S最小,表明PCA-GA-RBF預(yù)測精度最高。
2)PCA-GA-RBF組合預(yù)測模型具有泛化力,可以選取單個評價指標(biāo)進行評價。