• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于隨機(jī)森林算法的路面狀況指數(shù)預(yù)測

      2021-11-11 01:33:24裴莉莉戶媛姣
      公路交通科技 2021年10期
      關(guān)鍵詞:路面神經(jīng)網(wǎng)絡(luò)森林

      余 婷,裴莉莉,李 偉,戶媛姣,楊 明

      (長安大學(xué) 信息工程學(xué)院,陜西 西安 710064)

      0 引言

      公路從正式開始運營后會受到各種交通工具的荷載及自然環(huán)境因素的干擾,其路面的使用性能將不斷衰弱,倘若無法及時進(jìn)行檢測與養(yǎng)護(hù),愈發(fā)嚴(yán)重的道路破損將使路面使用性能極速減弱[1]。為及時對破損路面采取相應(yīng)的養(yǎng)護(hù)措施,需要利用收集的路面使用性能數(shù)據(jù),研究并掌握路面使用性能[2]的衰變特點,以便公路管理部門作出最佳養(yǎng)護(hù)決策。而傳統(tǒng)的道路路況調(diào)查以人工調(diào)查為主[3],耗時長、效率低,在各種損壞情況和程度的判斷上很容易產(chǎn)生嚴(yán)重的主觀偏差,且各種損壞的判別界限具有模糊性,無法達(dá)到當(dāng)前公路養(yǎng)護(hù)管理要求。

      人工智能技術(shù)在近幾年強(qiáng)勢崛起,并且逐漸應(yīng)用于交通、醫(yī)療、國防等生產(chǎn)生活中[4]。2019年全國交通運輸工作會議的主旨就是以智慧交通為主導(dǎo),加大交通運輸與互聯(lián)網(wǎng)、大數(shù)據(jù)、人工智能等技術(shù)的深層次融合,使交通運輸決策更加科學(xué)化[5]。隨著對路面使用性能的深入研究,世界各國學(xué)者開始嘗試使用人工智能算法對路面使用性能進(jìn)行預(yù)測[6]。李波等[7]和張亮等[8]分別采用主成分分析法和灰色馬爾可夫模型對路面破損狀況進(jìn)行了預(yù)測。顏可珍等[9]建立了參數(shù)優(yōu)化的最小二乘支持向量機(jī)模型,能夠可靠地對路面性能作出評價。樊旭英等[10]在發(fā)現(xiàn)稀漿封層技術(shù)可有效減緩瀝青路面低溫病害發(fā)生的基礎(chǔ)上,對熵權(quán)-層次分析法進(jìn)行改進(jìn),建立了瀝青路面預(yù)養(yǎng)護(hù)評價模型。Sollazzo等[11]利用路面長期性能數(shù)據(jù)庫,采用人工神經(jīng)網(wǎng)絡(luò)模型來建立瀝青路面平整度與結(jié)構(gòu)性能之間的關(guān)系,發(fā)現(xiàn)人工神經(jīng)網(wǎng)絡(luò)優(yōu)于經(jīng)典的線性回歸方法。Abdelaziz等[12]從一般路面研究和特定路面研究收集原始和重疊柔性路面的數(shù)據(jù)建立了國際平整度指數(shù)(International Roughness Index,IRI)預(yù)測模型,同樣得出ANNs模型比回歸模型預(yù)測準(zhǔn)確度更好。Zhang等[13]基于權(quán)重分布理論討論了Pavement ME Design模型和改進(jìn)的灰色預(yù)測模型預(yù)測多年凍土區(qū)瀝青路面橫向裂縫的互補(bǔ)優(yōu)勢,并開發(fā)了考慮區(qū)域特征的組合預(yù)測模型。Li等[14]開發(fā)一種創(chuàng)新的基于模糊趨勢時間序列預(yù)測和粒子群優(yōu)化(PSO)技術(shù)的IRI預(yù)測模型,且該方法優(yōu)于多項式擬合、自回歸積分移動平均法。李海蓮等[15]通過研究傳統(tǒng)路面性能預(yù)測方法,利用改進(jìn)的螢火蟲算法加快支持向量機(jī)模型的尋優(yōu)過程,驗證表明該模型收斂速度更快,精度更高。

      以上研究表明,支持向量機(jī)、神經(jīng)網(wǎng)絡(luò)等機(jī)器學(xué)習(xí)方法已廣泛應(yīng)用于路面性能預(yù)測建模,且預(yù)測模型具有較高精度。本研究通過對加拿大安大略省某公路的路面特征和路面綜合狀況指標(biāo)等數(shù)據(jù)進(jìn)行調(diào)查分析研究,構(gòu)建隨機(jī)森林路面狀況指數(shù)(PCI)預(yù)測模型,再對所構(gòu)建的模型的擬合效果和預(yù)測精度進(jìn)行優(yōu)化和評價分析,最終得到具有較高效率、較高精度和較低誤差的預(yù)測模型來解決PCI的預(yù)測問題。

      1 數(shù)據(jù)獲取和數(shù)據(jù)預(yù)處理

      首先利用ARAN9000多功能檢測車獲取加拿大安大略省某公路檢測數(shù)據(jù),再在了解各項數(shù)據(jù)特征后對其進(jìn)行數(shù)據(jù)預(yù)處理,使得最后建立模型的預(yù)測效果更好。整體技術(shù)路線如圖1所示。

      1.1 基于ARAN9000的道路三維數(shù)據(jù)獲取

      路面自動化快速檢測技術(shù)從對路面平整度、車轍等單一性能指標(biāo)檢測逐漸發(fā)展到了模塊化的多功能路面綜合檢測。ARAN9000多功能道路檢測車是由加拿大Fugro-Roadware公司研發(fā)的用于在高速公路上即時收集公路信息資料并進(jìn)行數(shù)據(jù)處理的多功能檢測車,它把精確的硬件勘察系統(tǒng)和功能強(qiáng)大的軟件系統(tǒng)集成在一起,可實現(xiàn)對任何公路的數(shù)據(jù)采集計劃。硬件系統(tǒng)包括道路平整度測量系統(tǒng)、路面病害測量系統(tǒng)、車轍測量系統(tǒng)等。軟件系統(tǒng)包括Vision(一體化數(shù)據(jù)處理和分析軟件套件)、Ivision(基于網(wǎng)絡(luò)的應(yīng)用程序)、Surveyor(路產(chǎn)管理應(yīng)用軟件)等。

      圖1 路面破損狀況指數(shù)預(yù)測技術(shù)路線Fig.1 Technical route of PCI prediction

      通過ARAN9000多功能道路檢測車對加拿大安大略省21號公路進(jìn)行數(shù)據(jù)采集,獲取到該公路路面特征數(shù)據(jù)集,具體分類與示例見表1。

      1.2 數(shù)據(jù)預(yù)處理

      數(shù)據(jù)紛雜繁復(fù)且大部分會存在缺失值,甚至包含許多錯誤或虛假數(shù)據(jù),在數(shù)據(jù)分析前對數(shù)據(jù)進(jìn)行預(yù)處理,不僅可提升數(shù)據(jù)分析的質(zhì)量,而且可節(jié)省實際分析所用的時間。

      專業(yè)人員對原始數(shù)據(jù)進(jìn)行了分析,并采用方差選擇法去除了IDSession和Status等無關(guān)輔助特征,之后采用皮爾遜相關(guān)系數(shù)對余下特征因子進(jìn)行了相關(guān)性分析。變量X和變量Y的皮爾遜相關(guān)系數(shù)ρX,Y公式為:

      表1 數(shù)據(jù)集分類與示例Tab.1 Data set classification and examples

      (1)

      式中,cov(X,Y)為X與Y之間的協(xié)方差;σX為X的標(biāo)準(zhǔn)差;σY為Y的標(biāo)準(zhǔn)差。

      根據(jù)分析結(jié)果去除與預(yù)測目標(biāo)PCI相關(guān)性低的特征,最終得到包含路面特征在內(nèi)的3 000多組數(shù)據(jù)。

      此時數(shù)據(jù)中有大量的裂縫數(shù)據(jù)缺失,但由于每段路面不一定包含所有裂縫特征,因此和專業(yè)技術(shù)人員溝通并對比均值填充、拉格朗日插值等數(shù)據(jù)修復(fù)效果后,采用填零的方法修復(fù)缺失數(shù)據(jù)。其次發(fā)現(xiàn)預(yù)測目標(biāo)PCI有19行數(shù)據(jù)缺失,相對于整體數(shù)據(jù)量來說比例較小,所以選擇直接刪除。

      經(jīng)過特征篩選后,數(shù)據(jù)分布仍存在明顯的不平衡性,此現(xiàn)象可由圖2中原始特征變量數(shù)據(jù)的均值、方差看出,同時每個特征變量的極值之間差距較大。因此,為避免不同特征變量數(shù)據(jù)分布差異性導(dǎo)致的模型過擬合現(xiàn)象,必須對原始數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化操作。

      圖2 部分特征變量的描述性統(tǒng)計Fig.2 Descriptive statistics of some feature variables

      采用離差標(biāo)準(zhǔn)化方法把數(shù)據(jù)映射到0~1范圍之內(nèi),用式(2)轉(zhuǎn)換:

      (2)

      式中,x*為標(biāo)準(zhǔn)化后的值;x為數(shù)據(jù)原始值;min為最小值;max為最大值。

      經(jīng)歸一化處理后,無論是模型的收斂速度還是模型的預(yù)測速度都有了大幅度提升。

      2 基于機(jī)器學(xué)習(xí)的PCI預(yù)測

      2.1 隨機(jī)森林

      隨機(jī)森林(Random Forest,RF)[16]是bagging集成學(xué)習(xí)算法演變而來的基于決策樹的機(jī)器學(xué)習(xí)算法。用隨機(jī)方式構(gòu)建一個由多棵互相獨立決策樹組成的森林。通過對特征劃分結(jié)果的優(yōu)劣進(jìn)行不純性度量,并計算信息增益來選擇分裂特征。從根節(jié)點按照特征劃分條件和節(jié)點純度最小原則,向下分裂直到滿足規(guī)則時停止,最終的預(yù)測結(jié)果是對每棵決策樹結(jié)果的加權(quán)平均值?;驹硪妶D3。

      圖3 隨機(jī)森林算法基本原理Fig.3 Basic principle of random forest algorithm

      通常用信息熵[17]作為衡量數(shù)據(jù)集純度的一種指標(biāo)。設(shè)第k類數(shù)據(jù)占所有數(shù)據(jù)集X的比例為pk(k=1,2,…,n),則定義數(shù)據(jù)集X的信息熵為:

      (3)

      若H(X)的值越小,那么數(shù)據(jù)集X的混亂程度越低,純度越高。

      假設(shè)使用離散特征a來對數(shù)據(jù)集X進(jìn)行劃分,就會產(chǎn)生V個分類結(jié)果,其中第V個分類結(jié)果包含的所有數(shù)據(jù),記為XV。根據(jù)式(3)計算出XV的信息熵,再考慮到不同的分類結(jié)果所包含的數(shù)據(jù)量不同,因此給每個分類結(jié)果給予1個權(quán)重|XV|/|X|,表明數(shù)據(jù)量越多的分類結(jié)果作用越大,于是計算利用特征a對數(shù)據(jù)集X進(jìn)行分裂所獲得的信息增益:

      (4)

      通常來說,Gain(D,a)值越大,就說明利用特征a來進(jìn)行分裂后,數(shù)據(jù)集的復(fù)雜度減小得越多,分類的結(jié)果越明顯。

      隨機(jī)森林在有放回地從原始的數(shù)據(jù)集上隨機(jī)抽取m個子樣本的基礎(chǔ)上,在訓(xùn)練單個決策樹時,再隨機(jī)選取k個特征,并從這k個特征中選擇最優(yōu)特征來分裂節(jié)點,這使得隨機(jī)森林模型不會輕易過度學(xué)習(xí)訓(xùn)練集的特征,且降低了模型的方差。實現(xiàn)流程圖如圖4所示。

      圖4 隨機(jī)森林算法實現(xiàn)流程Fig.4 Implementation process of random forest algorithm

      2.2 其他模型

      2.2.1 多元線性回歸

      多元線性回歸算法是利用最小二乘法來擬合回歸方程,主要用于處理多變量間的關(guān)系,即建立因變量y與多個自變量x之間的統(tǒng)計關(guān)系。其數(shù)學(xué)模型為:

      y=β0+β1x1+β2x2+…+βpxp+ε,

      (5)

      式中,y為因變量;x為自變量;β為自變量x的系數(shù);p為自變量的個數(shù);ε為預(yù)測值與真實值之間的殘差。

      2.2.2 BP神經(jīng)網(wǎng)絡(luò)

      神經(jīng)網(wǎng)絡(luò)模型是一種分布式并行運算的模型[18-19]。輸入信號首先經(jīng)過加權(quán)到隱藏節(jié)點,再通過激活函數(shù),從隱藏節(jié)點輸出并經(jīng)過加權(quán)傳播到輸出層節(jié)點,最后輸出層處理得到輸出結(jié)果,結(jié)構(gòu)見圖5。

      圖5 多層前向神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)Fig.5 Structure of multilayer forward neural network

      (6)

      網(wǎng)絡(luò)訓(xùn)練要使J的值最小,其權(quán)值的訓(xùn)練算法可描述為:

      (7)

      式中,w(t)為t時刻的權(quán)值;η為學(xué)習(xí)率[21]。

      在進(jìn)行模型構(gòu)建時,首先需要確定BP神經(jīng)網(wǎng)絡(luò)模型的結(jié)構(gòu),其次根據(jù)BP算法進(jìn)行訓(xùn)練,具體流程如圖6所示。

      圖6 BP神經(jīng)網(wǎng)絡(luò)模型的流程Fig.6 Flowchart of BP neural network model

      3 模型預(yù)測結(jié)果與對比

      3.1 模型評判標(biāo)準(zhǔn)

      為了對模型的預(yù)測結(jié)果進(jìn)行定量分析與比較,采用復(fù)相關(guān)系數(shù)R2、均方根誤差(Root Mean Square Error,RMSE)和平均絕對誤差(Mean Absolute Error,MAE)作為評價模型性能的指標(biāo)。如果數(shù)據(jù)點大多分布在擬合回歸線附近,則表明模型預(yù)測精度較高,誤差相對較小。計算公式如下:

      (8)

      (9)

      (10)

      式中,x為變量的值(本研究指PCI);xi(i=1,2,…,n)為真實值;x′0為xi的平均值;xp為xi的預(yù)測值;n為測量值的總個數(shù)。

      3.2 模型預(yù)測結(jié)果

      3.2.1 多元線性回歸預(yù)測結(jié)果

      將路面檢測狀況和往年路面評價指標(biāo)作為自變量,PCI為因變量,得到表2所示的多元線性回歸性能結(jié)果??梢钥闯觯撃P偷木容^低,而誤差較大。

      表2 多元線性回歸性能結(jié)果Tab.2 Multiple linear regression performance result

      3.2.2 BP神經(jīng)網(wǎng)絡(luò)預(yù)測結(jié)果

      構(gòu)建神經(jīng)網(wǎng)絡(luò)模型首先選擇1層隱藏層,再根據(jù)預(yù)測精度高低,增加隱藏層層數(shù),從而提升預(yù)測精度,神經(jīng)網(wǎng)絡(luò)性能結(jié)果如表3所示。

      表3 BP神經(jīng)網(wǎng)絡(luò)性能結(jié)果Tab.3 BP neural network performance result

      從以上預(yù)測結(jié)果可以看出,當(dāng)只有1層隱藏層時,隱藏神經(jīng)元個數(shù)為14的R2為0.670,RMSE為4.542,MAE為3.035,此時預(yù)測結(jié)果最好。因此選擇在第1層隱藏層神經(jīng)元為14,并在此基礎(chǔ)上增加網(wǎng)絡(luò)層數(shù)來提高模型預(yù)測精度。

      第2層隱藏層設(shè)置神經(jīng)元個數(shù)5和10進(jìn)行對比分析。由表2可知,BP神經(jīng)網(wǎng)絡(luò)模型預(yù)測PCI的R2從0.669增加到0.711,預(yù)測結(jié)果得到顯著提升。

      3.2.3 隨機(jī)森林預(yù)測結(jié)果

      同樣選取27個路面特征作為輸入樣本,默認(rèn)參數(shù)設(shè)置如表4所示,采用隨機(jī)森林算法進(jìn)行訓(xùn)練,得到默認(rèn)參數(shù)的情況下隨機(jī)森林模型的預(yù)測結(jié)果,如表5所示。

      表4 隨機(jī)森林默認(rèn)參數(shù)值Tab.4 Random forest default parameter values

      表5 隨機(jī)森林模型的預(yù)測結(jié)果Tab.5 Evaluation result of random forest model

      為了使隨機(jī)森林模型能夠更準(zhǔn)確地預(yù)測PCI,采用5折交叉驗證結(jié)果調(diào)整隨機(jī)森林模型參數(shù),使隨機(jī)森林模型預(yù)測精度提升。5折交叉驗證的具體過程如圖7所示。

      圖7 五折交叉驗證Fig.7 Five-fold cross-validation

      在默認(rèn)參數(shù)情況下,采用網(wǎng)格搜索法固定其他參數(shù),依次調(diào)節(jié)任一參數(shù)在不同范圍內(nèi)的參數(shù)值,然后找到在該范圍內(nèi)的最優(yōu)值,以該值為中心逐步縮小調(diào)節(jié)范圍,直至逼近最終的最優(yōu)參數(shù)值。

      由表5可得,在默認(rèn)參數(shù)的情況下,隨機(jī)森林模型的R2為0.895,RMSE為2.710,MAE為1.958,預(yù)測效果較好,但仍存在一定誤差。而改進(jìn)后的模型擬合效果更好,并且R2也從0.895提升到0.898,誤差也相應(yīng)地減小。因此,改進(jìn)后的模型更適合本研究的數(shù)據(jù)預(yù)測,預(yù)測精度更高。

      在調(diào)參試驗中發(fā)現(xiàn),由于本研究數(shù)據(jù)集樣本量較小,調(diào)節(jié)節(jié)點分枝最小樣本數(shù)和葉子節(jié)點最少樣本數(shù)對模型性能影響較小。因此使用默認(rèn)值,即節(jié)點分枝最小樣本數(shù)為2,葉子節(jié)點最少樣本數(shù)為1。各參數(shù)值與對應(yīng)精度變化曲線如圖8所示,最優(yōu)參數(shù)設(shè)置如表6所示。

      圖8 各參數(shù)最優(yōu)值與對應(yīng)精度變化曲線Fig.8 Optimal parameter values and corresponding accuracy variation curves

      同時,由于輸入變量較多,無法通過簡單的統(tǒng)計分析確定應(yīng)修正或刪除的異常數(shù)據(jù),因此選擇在完成模型構(gòu)建并預(yù)測后,通過預(yù)測值與真實值的擬合效果確定異常值。由擬合效果知遠(yuǎn)離擬合直線的異常點僅有13個,相對于整體數(shù)據(jù)來說比例較小,所以選擇直接刪除這些異常值。最后使用去除異常值后的數(shù)據(jù)重新作為訓(xùn)練集對模型進(jìn)行循環(huán)訓(xùn)練,使之達(dá)到當(dāng)前模型訓(xùn)練最優(yōu)。

      3.3 結(jié)果對比與分析

      通過調(diào)整輸入?yún)?shù),選擇預(yù)測結(jié)果最優(yōu)的模型進(jìn)行結(jié)果輸出,4種模型對PCI預(yù)測的擬合效果如圖9所示,散點在直線周圍分布越緊湊,預(yù)測效果越好。相應(yīng)地,表7展示了4種模型預(yù)測結(jié)果與實際值之間的復(fù)相關(guān)系數(shù)、均方根誤差和平均絕對值誤差。由式(8)~(10)可知,復(fù)相關(guān)系數(shù)越接近于1,誤差越接近于0,預(yù)測性能越好。從圖9中可以看到,與PCI的真實值相比,基于傳統(tǒng)的多元線性回歸的預(yù)測結(jié)果性能最差,而基于BP神經(jīng)網(wǎng)絡(luò)模型的預(yù)測結(jié)果獲得了較大的提升。

      表6 隨機(jī)森林模型最優(yōu)參數(shù)值Tab.6 Optimal parameter values of random forest model

      表7 四種模型的性能結(jié)果Tab.7 Performance results of 4 models

      圖9 四種模型的擬合效果Fig.9 Fitting effects of 4 models

      然而圖9(b)中仍有部分?jǐn)?shù)據(jù)遠(yuǎn)離線性回歸直線,而圖9(c)中遠(yuǎn)離回歸線的異常點明顯減少。由于隨機(jī)森林模型對處理高維度數(shù)據(jù)(特征較多)和抗過擬合能力較優(yōu),使得該模型不僅獲得了較好的預(yù)測結(jié)果,而且訓(xùn)練速度提升了33 s。最后改進(jìn)后的隨機(jī)森林模型解決了圖9(c)中仍有部分?jǐn)?shù)據(jù)距回歸直線較遠(yuǎn)這一情況。

      由表7得,改進(jìn)的隨機(jī)森林模型的R2值為0.898,RMSE為2.483,MAE為1.805,訓(xùn)練時間縮短了2 s。由圖10也可看出,改進(jìn)后模型的隨機(jī)森林預(yù)測誤差整體較小,不僅優(yōu)于多元線性回歸和神經(jīng)網(wǎng)絡(luò)預(yù)測模型,而且更適于本研究的數(shù)據(jù)預(yù)測。

      圖10 四種模型的預(yù)測誤差Fig.10 Prediction errors of 4 models

      4 結(jié)論

      本研究通過對從ARAN9000多功能道路檢測車采集到的相關(guān)數(shù)據(jù)進(jìn)行數(shù)據(jù)處理與統(tǒng)計分析,選擇主要的路面特征和往年路面評價指標(biāo)作為輸入變量,路面狀況指數(shù)PCI作為輸出變量,構(gòu)建基于隨機(jī)森林、神經(jīng)網(wǎng)絡(luò)和多元線性回歸的PCI預(yù)測模型。對比結(jié)果表明,隨機(jī)森林模型預(yù)測PCI的精度最高,誤差最低,且訓(xùn)練速度提升了近33 s;其次采用去除離異項和交叉驗證對模型進(jìn)行優(yōu)化,得到R2為0.898,提高了0.003。改進(jìn)后的隨機(jī)森林模型能夠有效地對PCI進(jìn)行預(yù)測。

      本研究提出的隨機(jī)森林預(yù)測模型能夠有效解決路面狀況的預(yù)測問題,為養(yǎng)護(hù)決策的制訂提供科學(xué)的數(shù)據(jù)支持和理論依據(jù)。精確的預(yù)測結(jié)果可幫助公路養(yǎng)護(hù)管理部門及時采取養(yǎng)護(hù)措施,從而保證路面良好的使用性能,降低養(yǎng)護(hù)成本。

      猜你喜歡
      路面神經(jīng)網(wǎng)絡(luò)森林
      用藝術(shù)修補(bǔ)路面
      神經(jīng)網(wǎng)絡(luò)抑制無線通信干擾探究
      電子制作(2019年19期)2019-11-23 08:42:00
      哈Q森林
      哈Q森林
      哈Q森林
      基于神經(jīng)網(wǎng)絡(luò)的拉矯機(jī)控制模型建立
      哈Q森林
      復(fù)數(shù)神經(jīng)網(wǎng)絡(luò)在基于WiFi的室內(nèi)LBS應(yīng)用
      一款透水路面養(yǎng)護(hù)車
      專用汽車(2015年4期)2015-03-01 04:10:02
      BFRP連續(xù)配筋復(fù)合式路面配筋設(shè)計
      淮阳县| 白河县| 夏津县| 四子王旗| 湟中县| 滦南县| 凤台县| 鞍山市| 黄山市| 十堰市| 鄯善县| 合阳县| 饶平县| 盈江县| 嘉祥县| 乌拉特中旗| 铜梁县| 泰和县| 鄂州市| 潮安县| 黄石市| 定边县| 含山县| 通辽市| 保靖县| 姜堰市| 康乐县| 平南县| 宿州市| 阿拉善左旗| 临颍县| 竹山县| 大竹县| 河间市| 舒兰市| 长子县| 娄烦县| 资溪县| 阿克陶县| 肇庆市| 凭祥市|