王可心 包云軒 朱承瑛 陳 粲 袁成松1,
1 南京信息工程大學氣象災害預報預警與評估協(xié)同創(chuàng)新中心,南京 210044 2 中國氣象局交通氣象重點開放實驗室,南京 210009 3 南京信息工程大學應用氣象學院,南京 210044
提 要: 基于寧宿徐高速公路三個交通氣象站2015—2018年冬季逐10 min實時觀測資料,使用隨機森林回歸模型預報這三個站的未來1 h冬季路面溫度,分析了該模型在冬季路面溫度預報中的可行性和適用性。研究結果表明:隨機森林回歸法可以被用來預報高速公路冬季路面溫度,不同類型的交通氣象站點的特征輸入方案和參數(shù)調(diào)試標準存在差異;與簡單特征相比,引入的復合特征能更好地補充解釋交通氣象站所處的環(huán)境和氣象要素,且其對普通路面交通氣象站和靠近橋梁、水體的交通氣象站的區(qū)分度更高,故引入復合特征的隨機森林回歸模型可以被用來預報高速公路冬季路面溫度,且其在對普通路面交通氣象站和靠近水體、橋梁的交通氣象站的預報效果較好,而對服務區(qū)交通氣象站的預報效果略差;袋外誤差率的降低并不代表預報精度的提高;引入復合特征的隨機森林回歸模型不論在何種天氣狀況下,均可用于各不同類型交通氣象站冬季路面溫度的預報,雨雪天時的預報效果最佳,陰天其次,晴天略差。
路面低溫是瀝青路面收縮開裂的主要原因(馮蕾等,2017),也是路面結冰的先決條件(董天翔等,2018)。對于車流量巨大、車速較快的瀝青高速公路來說,無論路面開裂還是結冰,都極易引發(fā)交通事故(馬晶昊等,2017)。因此,準確預報路面低溫,既能提升氣象部門的業(yè)務技術和科研水平,也能提高道路養(yǎng)護部門的工作效率,更重要的是能提醒司機行車安全,保障人民的生命財產(chǎn)安全。
目前關于路面溫度預報的方法主要包括理論分析法和統(tǒng)計分析法兩大類(秦健和孫立軍,2005)。理論分析法基于能量平衡方程和熱傳導公式,建立數(shù)值預報模型,進而實現(xiàn)路面溫度的預報。該方法最先由Barber(1957)使用。此后,國內(nèi)外許多學者(劉熙明等,2004;牛生杰等,2011;呂晶晶等,2013;Crevier and Delage,2001;Kangas et al,2015;Meng,2018)在不同區(qū)域使用并改進了此方法,均獲得了較好的效果。雖然理論分析法能從本質(zhì)上揭露各種環(huán)境因素和氣象因素對路面溫度的影響,普適性較強,但是由于理論模型輸入的變量較多,許多變量尤其是熱學參數(shù)難以獲取,導致理論模型的精確性受到了約束(秦健和孫立軍,2005)。
基于數(shù)學公式的統(tǒng)計分析法,正好彌補了理論分析法精確性不高的缺點。它從純數(shù)學的角度揭示了環(huán)境因素和氣象因素與路面溫度場的表面關系,進而建立起路面溫度預報模型(秦健和孫立軍,2005)。該模型輸入變量多來自氣象資料和路面資料,易于獲取且變量數(shù)量較少,預報精度也較高,是路面溫度預報研究中不可或缺的方法。在早期路面溫度預報中,簡單的回歸統(tǒng)計模型使用較多,其中用的最多的是多元線性回歸模型(馬寧等,2015;曲曉黎等,2010;Diefenderfer et al,2015;田華等,2009;黃立葵等,2005;李蕊等,2011),此外也有學者用到了逐步線性回歸模型(Kr?manc et al,2013)、正弦函數(shù)模型(王琨和郝培文,2017)、自回歸求和移動平均(ARIMA)統(tǒng)計模型(湯筠筠和郭忠印,2018)等簡單統(tǒng)計模型。隨著大數(shù)據(jù)時代的到來,有學者開始將機器學習引入路面溫度預報。早期學者多選擇使用神經(jīng)網(wǎng)絡來預報路面溫度(王佳和郭春燕,2017;Xu et al,2017)。董天翔等(2018)首次引入支持向量機模型將路面溫度進行分類,實現(xiàn)了路面低溫預警,但該方法只能對路面溫度進行分類,不能預報具體的路面溫度數(shù)值。Liu et al(2018)開發(fā)了一個集成式的機器學習模型——ELM-RBF模型預報了北京機場高速公路路面溫度,并取得了較好的效果。機器學習方法種類繁多,國內(nèi)對其的使用起步較晚,故關于這方面的研究依然存在不足。
本文基于2015—2018年冬季江蘇省高速公路交通氣象監(jiān)測系統(tǒng)(AWMS)中新沂河站(M9414)、重崗山服務區(qū)站(M9357)和宿遷南站(M9412)的實時觀測資料,使用以Bagging方式集成的,以CART回歸樹為核心函數(shù)的隨機森林回歸模型,預報這三個交通氣象站點未來1 h的冬季路面溫度,以期為以后使用機器學習預報冬季高速公路路面溫度提供參考依據(jù)。
本研究選擇位于寧宿徐高速公路上的新沂河站(M9414)、重崗山服務區(qū)站(M9357)和宿遷南站(M9412)三個交通氣象站(圖1)為研究站。寧宿徐高速公路位于江蘇省西北部,沿線屬溫帶季風氣候,冬季氣溫在0℃上下波動,時有路面結冰發(fā)生。從江蘇省交通運輸廳近兩年發(fā)布的冬季全省高速路況來看,結冰期間,寧宿徐高速公路常被定性為特級管制路段。
圖1 交通氣象站地理位置分布示意圖
所選的這三個交通氣象站均位于寧宿徐高速宿遷市路段上,站點間距適中,既不會互相造成影響,又能保證其受到相同的氣候系統(tǒng)控制,使其具有相似的氣候大背景。但由于緯度和地理位置的不同導致其局地氣象因子和環(huán)境要素存在顯著的差異:新沂河站靠近橋梁,地勢開闊,四周以水體、植被為主,對應路段降溫散熱速度較快,局地氣象和環(huán)境要素相對簡單;重崗山服務區(qū)站靠近高速公路服務區(qū),車流量和人流量都較大,四周以建筑、路面和植被為主,可能存在“熱島效應”,其局地氣象和環(huán)境要素相對復雜;而宿遷南站則為普通的高速公路路面站點,局地氣象和環(huán)境要素復雜程度介于上述二者之間。
本研究基于上述三個交通氣象站的實時觀測資料進行建模。采用的數(shù)據(jù)資料均來自江蘇省高速公路交通氣象監(jiān)測系統(tǒng)(AWMS),其中包括了三個交通氣象站2015—2018年冬季(每年的12月至次年2月)逐10 min實時觀測資料,樣本資料足以滿足機器學習的訓練量。觀測要素包括能見度、氣溫、相對濕度、降水量、2 min平均風速、2 min平均風向、路面溫度、10 cm處路基溫度??紤]到交通氣象站周圍環(huán)境要素復雜,為保證數(shù)據(jù)的科學性和有效性,事先對所有數(shù)據(jù)做了包括閾值控制、時間序列訂正、異常值剔除等質(zhì)量控制。
1.2.1 隨機森林(RF)
隨機森林是利用自助式抽樣方法(bootstrap),有放回地從原始訓練集中隨機抽取樣本(周志華,2016),基于這些隨機抽取的樣本分別構建CRAT回歸樹。隨機森林樣本集的選取和輸入特征的選取都具有較強的隨機性,加上多棵決策樹的構建,使其能有效避免過擬合模型,是一種有監(jiān)督的集成式機器學習方法(劉揚和王維國,2020)。其建模思路(圖2)主要分為兩部分:
(1)從原始訓練集中有放回地隨機抽取數(shù)據(jù)組成多個樣本集S(S>1);
(2)使用CART函數(shù),對抽取的樣本集S建立對應的回歸樹模型。
其預測思路為:輸入的特征會接受隨機森林中每棵回歸樹模型的預測,進而得到S個預測值,這些預測值的平均值即為最終預測結果,其公式(Ao et al,2019)為:
(1)
式中:Y為預測結果,X為輸入的特征數(shù)據(jù)向量,S為回歸樹模型個數(shù),F(xiàn)S(X)為單個CRAT回歸樹模型,其公式(Breiman et al,1984;張松林,1987;李航,2012)為:
(2)
式中:Rt為以不同特征的最優(yōu)切分變量劃分后的單元域;I(X∈Rt)為邏輯值,若X∈Rt,則I(X∈Rt)=1,否則I(X∈Rt)=0;Ct為單元域Rt內(nèi)包含的所有輸出值的平均值,t為單元域標號。此式的本質(zhì)是先判斷輸入變量屬于哪個單元域,然后返回該單元域的預測值。
圖2 隨機森林回歸算法示意圖
由于隨機森林每建一棵樹,都使用隨機且有放回的抽樣方式進行采樣,故在每個回歸樹模型建成之后,都有約三分之一的樣本未參與到建模中,這部分樣本即為袋外樣本(OOB)(Rahman et al,2006)?;诖?,隨機森林的內(nèi)部估計不需要引進交叉驗證法和獨立測試集無偏估計法,使用袋外樣本估計即可進行隨機森林的內(nèi)部估計。
(3)
(4)
1.2.2 模型評估指標
使用平均絕對誤差(MAE)、均方根預測誤差(RMSE)(Chang,2014)以及預測值誤差絕對值在3℃以內(nèi)的預報準確率(Accuracy)(Liu et al,2018)這三個指標來評估模型的預報效果。這三個指標的計算公式分別為:
(5)
(6)
(7)
1.2.3 變量預處理
由于能見度與2 min平均風向與其他變量存在數(shù)量級差異,加上CART回歸樹既能處理連續(xù)變量也能處理離散變量,同時也為了簡化建模過程中的計算,加快模型運行速率,故對這兩個變量做了如下基本處理:對能見度取10為底的對數(shù)(沈大慶,2015);通過聯(lián)系研究區(qū)實際風向及其對地區(qū)水熱影響的情況,將2 min平均風向以整數(shù)形式作了離散化處理。
由于CART回歸樹在進行二叉樹分裂的過程中,總是遍歷所有特征的所有切分量,進而找到某一最優(yōu)切分特征的切分量進行分裂。而在這個過程中,模型并未考慮特征的自身變化和特征間的交互作用帶來的影響(李文娟等,2018)。所以,我們嘗試引入幾個復合特征來表征特征間的交互作用以及特征隨時間的變化情況,它們分別為:用來表征熱量傳輸方向的氣溫與10 cm路基溫度之間的差;用來表征降水在一段時間內(nèi)持續(xù)性影響的1 h累積降水量;分別用來表征溫度、相對濕度和10 cm路基溫度隨時間變化的1 h氣溫變化量、1 h相對濕度變化量和1 h的10 cm路基溫度變化量。
考慮到輸入的特征個數(shù)有限,加上當前對路面溫度的預報更趨向于短時臨近預報,故本研究主要以冬季未來1 h的路面溫度為預報研究對象。三個交通氣象站點2015—2017年的逐10 min冬季數(shù)據(jù)為建模用的測試集,2018年的逐10 min冬季數(shù)據(jù)為驗證集。
基于Bagging方式集成而來的隨機森林回歸法包含了大量參數(shù)。本研究的輸入特征較少,無需增加限制特征的參數(shù);訓練集樣本數(shù)量在硬件內(nèi)存可控范圍內(nèi),也無需增加限制樣本的參數(shù)。由此,回歸樹模型的個數(shù)(Ntree)是影響建模的關鍵參數(shù)。圖3是隨機森林回歸模型中,模型平均袋外誤差率與樹模型個數(shù)變化的關系圖,其中圖3a為以簡單特征建模時的調(diào)參結果,圖3b為引入了復合特征建模時的調(diào)參結果。
圖3 簡單特征(a)和復合特征(b)建模對平均袋外誤差率與回歸樹模型個數(shù)的關系(黑線為的趨勢線)
表1 不同參考值對應的樹模型個數(shù)
表2是基于表1的參數(shù)進行建模以后,計算得到的各模型評估指標結果。以期從宏觀角度比較不同特征輸入方案下預報模型的效果。
在相同的平均袋外誤差率參考標準下,引入了復合特征建模后的M9414交通氣象站預報模型的MAE和RMSE降幅均超過0.5℃,Accuracy增加了5.5%;M9412交通氣象站預報模型的MAE和RMSE降幅約為0.4℃,Accuracy增加了2.2%;M9357交通氣象站預報模型的MAE和RMSE降幅均小于0.3℃,Accuracy并未增加,反而還減少了約1%。從預報效果來看,M9412交通氣象站的簡單特征隨機森林預報模型預報效果最優(yōu),M9414交通氣象站其次,M9357交通氣象站最差。而引入復合特征以后,M9414交通氣象站的預報效果最好,M9412交通氣象站其次,M9357交通氣象站預報效果依然最差。
表2 基于隨機森林回歸模型預報三個交通氣象站未來1 h冬季路面溫度的評估結果
進一步繪制了個交通氣象站的路面溫度真實值和預測值對應的散點分布(圖4、圖5,圖中黑色實線為路面溫度真實值與預測值數(shù)值一樣的等值線),以期從微觀角度分析預報值的偏差情況。
從簡單特征隨機森林回歸模型的散點在等值線附近的分布(圖4)來看,M9412交通氣象站落于趨勢線上的點最多,0.0℃以下路面溫度段的點離散程度最小,0.0~15.0℃路面溫度段的點離散程度最大,其中存在少量離散程度超過3.0℃的點,等值線下部的點略多于上部的點,說明該段路面溫度預報值略低于真實值,而15.0℃以上路面溫度段的預報值明顯偏低,預報效果較其余溫度段差(圖4b);M9414交通氣象站落于等值線上的點略少于M9412交通氣象站,全路面溫度段的點離散情況表現(xiàn)為“中間大,兩頭小”,在等值線兩側的分布較均勻,離散程度超過3.0℃的點的數(shù)量較少(圖4c);M9357交通氣象站落于等值線上的點最少,全路面溫度段的點離散情況呈“S”型,5.0~7.0℃路面溫度段的點分布最均勻,5.0℃ 以下路面溫度段的點集中分布在等值線上方,預測值多偏大,7.0℃以上路面溫度段的點集中分布在等值線下方,預測值多偏小。全溫度段離散程度超過3.0℃的點的數(shù)量為三個交通氣象站中最多的(圖4a)。
圖4 M9357(a),M9412(b),M9414(c)三個交通氣象站簡單特征建模后的預測值與真實值對比(黑線為路面溫度真實值與預測值數(shù)值一樣的等值線)
從引入了復合特征的隨機森林回歸模型的散點在等值線附近的分布來看(圖5),同站點不同平均袋外誤差率下的點離散程度和分布情況差異并不大。與圖4相比,三個交通氣象站落于等值線上的點數(shù)量明顯增加,點的離散程度有所減小。M9412和M9414交通氣象站點在等值線兩側的分布更加均勻,預報值誤差顯著減小。而M9357交通氣象站的點由原先的“S”型離散分布變?yōu)橹本€式的離散分布,全溫度段的點多集中在等值線上方,預報值偏差方向基本一致,均偏大。
考慮到冬季路面溫度預報是冬季路面結冰預報的基礎,本研究根據(jù)表2、圖4和圖5的結果選擇出各站點的最佳預報方案,統(tǒng)計了這三個站點在最佳預報方案下0℃及以下路面溫度的分級預報準確率狀況。統(tǒng)計發(fā)現(xiàn),靠近服務區(qū)的交通氣象站0℃以下路面溫度預報誤差在絕對值1℃以內(nèi)的占74.6%,絕對值為1~2℃的占15.0%,絕對值為2~3℃的占3.8%;靠近橋梁和水體的交通氣象站0℃以下路面溫度預報誤差在絕對值1℃以內(nèi)的占93.7%,絕對值為1~2℃的占5.9%,絕對值為2~3℃的占0.2%;普通路面交通氣象站0℃以下路面溫度預報誤差在絕對值1℃以內(nèi)的占90.6%,絕對值為1~2℃的占8.6%,絕對值為2~3℃的占0.5%。可見,對三類交通氣象站0℃及以下的路面溫度預報結果的誤差多集中在絕對值1℃以內(nèi)。
結合宏觀和微觀兩方面的結果來看,隨機森林回歸方法可以被用來預報高速公路冬季路面溫度。簡單特征隨機森林回歸模型對普通路面交通氣象站的預報效果最好,對靠近水體和橋梁的交通氣象站預報效果次之,對服務區(qū)交通氣象站預報效果最差。而引入了復合特征的隨機森林回歸模型對靠近水體和橋梁的交通氣象站的預報效果最好,對普通路面交通氣象站的預報效果次之,對服務區(qū)交通氣象站的預報效果最差。
從2018年冬季數(shù)據(jù)中挑出24 h內(nèi)路面溫度出現(xiàn)小于0.0℃且無缺測的晴天(2018年12月27日20時至28日20時)、陰天(2018年12月26日20時至27日20時)和雨雪天(2019年1月5日20時至6日20時)各一個個例,目的是分析在不同天氣狀況下隨機森林回歸模型的預報效果。
2018年12月27日20時至28日20時有霜且出現(xiàn)結冰現(xiàn)象,白天日照時數(shù)達7.2 h,屬于晴朗天氣(圖6、表3)。由圖6可以發(fā)現(xiàn),三個交通氣象站的路面溫度變化規(guī)律基本相似,夜間路面溫度低于0.0℃,并持續(xù)降低,在08時左右達到最低值,白天路面溫度高于0.0℃,至14—15時達到最高值后又開始下降。
圖5 M9357(a,b),M9412(c,d)和M9414(e,f)三個交通氣象站引入復合特征建模后的預測值與真實值對比
就預報結果來看,使用簡單特征建模的隨機森林回歸模型在預報M9357交通氣象站的時候誤差較大,預報準確率不足65%,圖6a中可以看出,其預報結果的變化趨勢已遠遠偏離真實值變化趨勢。而其對M9412和M9414交通氣象站的預報效果明顯優(yōu)于M9357交通氣象站,甚至M9414交通氣象站的預報準確率達到100%。而從圖6b和6c中可以發(fā)現(xiàn),兩個交通氣象站的預報值在部分時段存在明顯的偏差,但偏差多在3℃以內(nèi)。結合圖表可知,引入了復合特征的隨機森林回歸模型極大程度地提高了三個交通氣象站路面溫度的預報效果。尤其是對M9357交通氣象站的預報,除08—16時的預報結果偏差較大,其余時間段吻合度均較高。此外,在對M9412和M9414交通氣象站進行預報時,引入了復合特征的隨機森林回歸模型也彌補了使用簡單特征建模的隨機森林回歸模型預報效果不理想的時段。
2018年12月26日20時至27日20時出現(xiàn)結冰現(xiàn)象,白天日照時數(shù)為0.0 h,屬于陰天天氣(圖7、表4)。由圖7可以發(fā)現(xiàn),三個交通氣象站凌晨至上午出現(xiàn)路面溫度低于0℃的現(xiàn)象,該現(xiàn)象在M9412和M9414交通氣象站的持續(xù)時間類似,而在M9357交通氣象站的持續(xù)時間較長,下午及夜間路面溫度都在0℃以上,且該時間段內(nèi)存在明顯的路面溫度峰值。
圖6 2018年12月27日20時至28日20時晴天M9357(a),M9412(b)和M9414(c)三個交通氣象站實測值與三類模型預測結果的對比
表3 2018年12月27日20時至28日20時晴天模型預測的評估結果
圖7 同圖6,但為2018年12月26日20時至27日20時陰天
表4 同表3,但為2018年12月26日20時至27日20時陰天
就預報結果來看,M9412和M9414交通氣象站的預報效果較好,三種預報模型預報的路面溫度與實際路面溫度變化趨勢相似,預報誤差較小,數(shù)值吻合度較高。而就M9357交通氣象站路面溫度預報結果來看,引入復合特征后的隨機森林模型預報效果顯著優(yōu)于使用簡單特征建模的隨機森林回歸模型,由圖7a可以發(fā)現(xiàn),引入復合特征后的隨機森林模型除在08—16時的預報值與真實值的吻合度均較高。
2019年1月4日晚至5日白天的持續(xù)性降水、降雪和雨夾雪一直延續(xù)到1月5日晚,故2019年1月5日20時至6日20時出現(xiàn)積雪和結冰現(xiàn)象。當日空氣相對濕度全天都高于85%,最高達到96%,屬于雨雪天氣(圖8、表5)。三個交通氣象站變化趨勢相似,夜間路面溫度在0℃上下波動,M9414交通氣象站波動程度最大,白天溫度高于0℃,且有明顯的路面溫度峰值。
就預報結果來看,使用簡單特征建模的隨機森林回歸模型對三個交通氣象站的預報值基本都偏高,但偏差絕對值均在3 ℃以內(nèi),就評估指標而言預報效果不差。而引入了復合特征后的隨機森林模型在一定程度上提高了預報精度,降低了偏差。但是從圖8可以看出,M9357交通氣象站的預報值普遍偏高,只在16—20時區(qū)間內(nèi)預報值與真實值高度吻合;M9412交通氣象站的預報值與真實值吻合度較高,僅在13—16時期間預報值偏高;M9414交通氣象站的預報值與真實值的吻合度略不及M9412交通氣象站,在02—10時預報值出現(xiàn)偏高現(xiàn)象。
圖8 同圖6,但為2019年1月5日20時至6日20時雨雪天
表5 同表3,但為2019年1月5日20時至6日20時雨雪天
統(tǒng)觀三類天氣狀況下的各交通氣象站的冬季路面溫度預報情況可以發(fā)現(xiàn),引入復合特征的隨機森林回歸模型不管在何種天氣狀況下,均可用于各不同類型交通氣象站冬季路面溫度的預報。但是,模型對雨雪天時路面溫度的預報效果最佳,陰天其次,晴天最差。
本研究建立的隨機森林預報模型的復雜度主要包括輸入特征和樹模型個數(shù)兩部分,而這兩部分與模型的調(diào)參過程息息相關。而從前文的分析中可以發(fā)現(xiàn),增加輸入特征本質(zhì)上是補充解釋交通氣象站周圍環(huán)境和氣象要素的影響,進而會增加隨機森林模型內(nèi)每棵CART回歸樹的復雜度,隨著每棵樹模型復雜度的增加,森林內(nèi)樹模型個數(shù)就會有所減少,進而使得隨機森林模型有所簡化,模型的平均袋外誤差率會有所降低。而在輸入特征不變的情況下,增加樹模型的個數(shù),即增加隨機森林模型的復雜度,模型的平均袋外誤差率也會有所降低。
從預報結果來看,由于普通路面交通氣象站和靠近橋梁和水體的交通氣象站周圍的氣象環(huán)境要素變化較靠近服務區(qū)的交通氣象站點來說相對簡單,故增加了復合特征以后的特征輸入方案能更好地識別這兩類交通氣象站,因此該模型在預報這兩個交通氣象站冬季路面溫度時的效果較好。與前兩類交通氣象站不同,由于服務區(qū)內(nèi)人員及商戶密集,有很多車輛停放,造成大量人為排放,加上水泥下墊面特性以及服務區(qū)散熱不良等,靠近服務區(qū)的交通氣象站除受到固有的氣象環(huán)境要素影響以外,還會受到服務區(qū)內(nèi)“熱島效應”的影響,而在本研究中給出的兩類特征輸入方案關于服務區(qū)交通氣象站“熱島效應”的描述性特征存在不足,已有的氣象因子無法準確解釋“熱島效應”的強弱程度對路面溫度造成的影響,導致其預報效果稍遜色于前兩類交通氣象站。而許多學者的研究也表明(Belk,1992;Chanman and Thornes,2005;Thornes et al,2005;Weller and Thornes,2001),路面溫度除了受氣象因子的影響外,還會受到地形、道路材料、交通特性等因素的影響。因此,還需引入更多可以表征和解釋站點周圍環(huán)境的變量來改善模型。
與目前的路面溫度預報研究結果相比,許多學者(馬寧等,2015;曲曉黎等,2010;Diefenderfer et al,2015;田華等,2009;黃立葵等,2005)選擇的多元線性回歸的預報準確率基本在85%左右(李蘭蘭等,2016;朱承瑛等,2009),Liu et al(2018)比較的ELM、ELM-RBF以及GBELM-RBF三類機器學習方法的預報準確率,只有最后一種的預報準確率達到80%以上。而從上文的預報結果中可以發(fā)現(xiàn),隨機森林對各交通氣象站點的預報準確率都高于其他統(tǒng)計方法,甚至在0℃及以下路面溫度的預報中預報誤差絕對值在1℃的預報準確率也高于部分統(tǒng)計方法??梢?,雖然隨機森林法在預報冬季路面溫度中仍存在不足之處,但其預報精度在當前的各類統(tǒng)計預報方法中表現(xiàn)不俗。
就不同天氣條件下的路面溫度及預報效果來看,三個交通氣象站的路面溫度的變化幅度均以雨雪天最小,陰天次之,晴天最大。而相同天氣狀況下,服務區(qū)交通氣象站的路面溫度日變化幅度小于靠近橋面交通氣象站的路面溫度日變化幅度,普通路面交通氣象站的路面溫度日變化幅度最大,這些與王婧等(2018)的結論基本一致。就預報結果而言,引入復合特征的預報模型優(yōu)于使用簡單特征的預報模型,且其對普通路面交通氣象站和靠近水體、橋梁的交通氣象站的預報效果較好,而對服務區(qū)交通氣象站的預報效果相對差一點。宏觀上基于評估指標而言,模型對雨雪天時路面溫度的預報效果最佳,陰天次之,晴天略差,但微觀上基于數(shù)值吻合度而言,陰天數(shù)值吻合度最高,晴天次之,雨雪天最差。
綜合調(diào)參和預報結果來看,袋外誤差率的提高并不代表預報精度的提高。如果增加的輸入特征可以較好地解釋交通氣象站附近的環(huán)境氣象要素,則選擇合適的袋外誤差率參考標準,即可達到較好的預報精度,若其對環(huán)境氣象要素的解釋存在較大不足,則還需要增加樹模型的個數(shù)才能有較高的預報精度。
本文根據(jù)江蘇省高速公路交通氣象監(jiān)測系統(tǒng)(AWMS)中寧宿徐高速公路上分別代表普通路面交通氣象站、靠近水體和橋梁的交通氣象站及服務區(qū)交通氣象站的宿遷南站、新沂河站和重崗山服務區(qū)站的實時觀測資料,使用隨機森林模型,預報了這三個交通氣象站點未來1 h的冬季路面溫度,并對不同特征輸入方案下的參數(shù)調(diào)試和不同天氣下的預報結果作了比較,得到如下結論:
(1)隨機森林回歸法可以用來預報高速公路冬季路面溫度,但它的特征輸入方案和參數(shù)調(diào)試方案因交通氣象站點類型的不同而存在差異。
(2)引入的復合特征能更好地補充解釋交通氣象站所處的環(huán)境和氣象要素,且其對路面交通氣象站和靠近橋梁和水體的交通氣象站的區(qū)分度更高,而對服務區(qū)交通氣象站的解釋存在不足??梢妼τ诜諈^(qū)交通氣象站來說,引入的復合特征缺乏代表性和對其環(huán)境、氣象要素的解釋性。
(3)袋外誤差率的提高并不代表預報精度的提高,準確、全面的輸入特征輔以恰當?shù)臉淠P蛡€數(shù)是模型預報精度的決定性因素。
(4)引入復合特征的隨機森林回歸模型不管在何種天氣狀況下,均可用于各不同類型交通氣象站冬季路面溫度的預報。它對普通路面交通氣象站和靠近橋梁、水體的交通氣象站預報效果優(yōu)于對服務區(qū)交通氣象站的預報效果。而對于同類型交通氣象站來說,雨雪天時的預報效果最佳,陰天其次,晴天最差。
需要指出的是,從預報結果來看,所選的隨機森林回歸模型可以被用來預報高速公路冬季路面溫度。但是,本研究使用的隨機森林模型僅使用了簡單的算術平均值作為輸出結果,而這樣的做法對于具有正負差異的路面溫度來說,顯然不是最優(yōu)的結果輸出方式。故在以后的研究中,我們將試圖引入集合預報的思想改進隨機森林算法,以提高預報精度。此外,隨機森林回歸預報模型在不同類型站點上適用性的評估,僅是根據(jù)研究中選定的輸入特征方案下得到的預報結果推論而來,其普適性還需要更多的同類型站點加以驗證比對。