• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      京津冀站點(diǎn)風(fēng)溫濕要素的機(jī)器學(xué)習(xí)訂正方法

      2022-07-14 10:44:18韓念霏陳明軒宋林燁曹偉華
      應(yīng)用氣象學(xué)報(bào) 2022年4期
      關(guān)鍵詞:報(bào)時(shí)方根季節(jié)

      韓念霏 楊 璐 陳明軒 宋林燁 曹偉華 韓 雷

      1)(中國(guó)海洋大學(xué), 青島 266100) 2)(北京城市氣象研究院, 北京 100089)

      引 言

      災(zāi)害性天氣對(duì)我國(guó)乃至全球社會(huì)經(jīng)濟(jì)發(fā)展和人民生活均有較大影響,因此天氣預(yù)報(bào)在日常出行、戶(hù)外體育賽事舉辦、防災(zāi)減災(zāi)、交通運(yùn)輸及農(nóng)業(yè)生產(chǎn)等方面作用越來(lái)越重要。數(shù)值天氣預(yù)報(bào)是根據(jù)大氣實(shí)際情況,在一定初值和邊值條件下,通過(guò)大型計(jì)算機(jī)進(jìn)行數(shù)值計(jì)算,求解描述天氣演變過(guò)程的流體力學(xué)和熱力學(xué)的方程組,預(yù)測(cè)未來(lái)一定時(shí)段大氣運(yùn)動(dòng)狀態(tài)和天氣現(xiàn)象的方法。雖然目前制作日常天氣預(yù)報(bào)的主要方法均來(lái)自于區(qū)域或全球尺度數(shù)值天氣預(yù)報(bào)模式,但模式初始場(chǎng)、動(dòng)力和物理過(guò)程的不確定性等因素,可能導(dǎo)致數(shù)值天氣預(yù)報(bào)與實(shí)況間存在較大偏差[1]。

      在海量數(shù)據(jù)背景下,人們開(kāi)始研究采用多種誤差訂正方法[2-6]實(shí)現(xiàn)對(duì)單一數(shù)值預(yù)報(bào)結(jié)果準(zhǔn)確率的進(jìn)一步提升,其中人工智能顯現(xiàn)出非常廣闊的應(yīng)用前景[7-8],越來(lái)越多的研究嘗試采用新方法對(duì)模式產(chǎn)品進(jìn)行誤差訂正,并取得理想結(jié)果。孫全德等[9]利用LASSO回歸、隨機(jī)森林(random forest,RF)和深度學(xué)習(xí)(deep learning,DL)3種機(jī)器學(xué)習(xí)算法,對(duì)歐洲中期天氣預(yù)報(bào)中心(European Centre for Medium-Range Weather Forecasts,ECMWF)的華北地區(qū)近地面10 m風(fēng)速預(yù)報(bào)進(jìn)行訂正,并與傳統(tǒng)的模式輸出統(tǒng)計(jì)(model output statistics,MOS)方法進(jìn)行對(duì)比,表現(xiàn)出機(jī)器學(xué)習(xí)方法在改善局地氣象精準(zhǔn)預(yù)報(bào)方面的潛力。Han等[10-11]不僅借助支持向量機(jī)(support vector machine,SVM)模型預(yù)測(cè)風(fēng)暴運(yùn)動(dòng)趨勢(shì)和風(fēng)暴增長(zhǎng),還在2021年采用深度學(xué)習(xí)模型CU-net對(duì)ECMWF全球數(shù)值預(yù)報(bào)系統(tǒng) (ECMWF-IFS)2 m溫度、2 m相對(duì)濕度、10 m風(fēng)的24~240 h預(yù)報(bào)進(jìn)行格點(diǎn)訂正,為數(shù)值天氣預(yù)報(bào)偏差訂正研究和業(yè)務(wù)應(yīng)用開(kāi)辟了新途徑。楊璐等[12]采用SVM建立雷暴大風(fēng)天氣識(shí)別模型,有效提高了雷暴大風(fēng)預(yù)警預(yù)報(bào)準(zhǔn)確率;譚江紅等[13]采用lightGBM機(jī)器學(xué)習(xí)方法建立模型對(duì)湖北89個(gè)氣象站的氣溫預(yù)報(bào)進(jìn)行訂正,準(zhǔn)確率較數(shù)值預(yù)報(bào)產(chǎn)品明顯提升,展現(xiàn)了lightGBM機(jī)器學(xué)習(xí)方法對(duì)于氣象要素預(yù)報(bào)的良好應(yīng)用前景。疏杏勝等[14]利用人工神經(jīng)網(wǎng)絡(luò)(artificial neural networks,ANN)、極限學(xué)習(xí)機(jī)(extreme learning machine,ELM)以及SVM模型對(duì)遼寧桓仁水庫(kù)流域未來(lái)1~3 d降雨進(jìn)行多模式集成預(yù)報(bào),結(jié)果表明:基于機(jī)器學(xué)習(xí)模型的多模式降雨集成預(yù)報(bào)方法可行且能夠提高短期預(yù)報(bào)降雨精度;Burke[15]在改善高分辨率的冰雹預(yù)報(bào)效果時(shí)采用RF方法,減小了模型偏差,冰雹預(yù)測(cè)準(zhǔn)確率更高。

      2016年Chen等[16]提出了XGBoost(eXtreme Gradient Boosting)方法,由于其優(yōu)良性能及在各領(lǐng)域出色表現(xiàn)而廣泛應(yīng)用。韓豐等[17]基于XGBoost方法提高了短時(shí)強(qiáng)降水事件的預(yù)報(bào)準(zhǔn)確率;毛開(kāi)銀等[18]在XGBoost方法的基礎(chǔ)上提出CD-XGBoost(clustering and double XGBoost)算法,對(duì)中國(guó)2552個(gè)氣象觀測(cè)站觀測(cè)數(shù)據(jù)與ECMWF數(shù)值模式逐3 h地面10 m風(fēng)速預(yù)報(bào)進(jìn)行站點(diǎn)訂正,取得較高準(zhǔn)確率;任萍等[19]采用XGBoost方法對(duì)北京地區(qū)快速更新循環(huán)數(shù)值系統(tǒng)的預(yù)報(bào)數(shù)據(jù)進(jìn)行訂正,有效減小了模式預(yù)報(bào)誤差;徐磊等[20]提出結(jié)合XGBoost方法和奇異譜分析法(SSA)的SSA-XGBoost預(yù)測(cè)模型,試驗(yàn)結(jié)果表明,該模型對(duì)降水變化趨勢(shì)預(yù)測(cè)具有指導(dǎo)意義。

      北京城市氣象研究院于2017年開(kāi)始研發(fā)建立睿圖模式體系中的快速集成與無(wú)縫隙融合預(yù)報(bào)子系統(tǒng)——睿圖-睿思系統(tǒng)(rapid-update multi-scale analysis and prediction system-rapid integration and seamless ensemble,RMAPS-RISE,簡(jiǎn)稱(chēng)RISE系統(tǒng)),該系統(tǒng)是一個(gè)多源氣象數(shù)據(jù)快速集成與融合預(yù)報(bào)系統(tǒng),可以實(shí)現(xiàn)逐10 min更新、覆蓋京津冀全域500 m、北京冬奧重點(diǎn)賽區(qū)100 m網(wǎng)格分辨率的風(fēng)場(chǎng)、溫度、降水等的實(shí)時(shí)預(yù)報(bào),并在數(shù)據(jù)融合、偏差訂正、氣候?qū)W訂正等方面開(kāi)展大量工作[21-25]。本文嘗試采用線性回歸方法、梯度提升回歸(gradient boosting regression tree, GBRT)方法、XGBoost方法以及堆疊集成學(xué)習(xí)方法(Stacking方法)與RISE系統(tǒng)預(yù)報(bào)的高時(shí)空分辨率氣象數(shù)據(jù)相結(jié)合,構(gòu)建加入地形特征以及多源氣象要素特征的誤差分析模型對(duì)RISE系統(tǒng)各起報(bào)時(shí)次的站點(diǎn)預(yù)報(bào)進(jìn)行逐小時(shí)間隔訂正,探索機(jī)器學(xué)習(xí)方法在高分辨率預(yù)報(bào)誤差訂正方面的作用和效果,為業(yè)務(wù)應(yīng)用提供參考。

      1 數(shù)據(jù)及模型構(gòu)建方法

      1.1 數(shù) 據(jù)

      1.1.1 數(shù)據(jù)簡(jiǎn)介

      本文采用2020年12月—2021年11月RISE系統(tǒng)提供的時(shí)間分辨率為10 min、水平分辨率為500 m的京津冀網(wǎng)格化快速更新預(yù)報(bào)產(chǎn)品(簡(jiǎn)稱(chēng)RISE產(chǎn)品)。觀測(cè)數(shù)據(jù)為同時(shí)段京津冀地區(qū)470個(gè)考核站的溫度、濕度、風(fēng)速、風(fēng)向4種氣象要素。RISE產(chǎn)品為網(wǎng)格數(shù)據(jù),而本研究針對(duì)470個(gè)考核站進(jìn)行訂正,因此為了與自動(dòng)氣象站觀測(cè)數(shù)據(jù)匹配,首先需要對(duì)格點(diǎn)數(shù)據(jù)采用歐氏距離插值法進(jìn)行處理,針對(duì)470個(gè)考核站每個(gè)站點(diǎn)的經(jīng)緯度坐標(biāo),同時(shí)遍歷所有格點(diǎn)的經(jīng)緯度坐標(biāo),通過(guò)歐式距離公式計(jì)算出每個(gè)站點(diǎn)與所有格點(diǎn)的距離,將最小距離的所對(duì)應(yīng)格點(diǎn)預(yù)報(bào)數(shù)據(jù)插值保存為站點(diǎn)數(shù)據(jù)。對(duì)風(fēng)場(chǎng)信息的預(yù)報(bào)與觀測(cè)進(jìn)行數(shù)據(jù)格式統(tǒng)一化后,以時(shí)間維度對(duì)所有時(shí)刻的自動(dòng)氣象站觀測(cè)數(shù)據(jù)和RISE站點(diǎn)預(yù)報(bào)疊加,制作三維數(shù)據(jù)集的同時(shí)完成觀測(cè)數(shù)據(jù)與預(yù)報(bào)在時(shí)間維度的對(duì)應(yīng),方便后續(xù)建模訓(xùn)練。

      1.1.2 數(shù)據(jù)集劃分

      由于RISE產(chǎn)品在不同季節(jié)、不同氣象要素誤差表現(xiàn)不同,因此將RISE產(chǎn)品按季節(jié)分為春(2021年3—5月)、夏(2021年6—8月)、秋(2021年9—11月)、冬(2020年12月—2021年2月)4個(gè)季節(jié)構(gòu)建樣本集。圖1為4個(gè)季節(jié)24個(gè)整點(diǎn)起報(bào)時(shí)次有效樣本量,不同季節(jié)可用樣本量均在20000以上,秋冬季樣本量多于春夏季。

      模型訓(xùn)練過(guò)程中,對(duì)數(shù)據(jù)集采用k折交叉驗(yàn)證[26]對(duì)各季節(jié)測(cè)試集進(jìn)行評(píng)估:將所有的數(shù)據(jù)集分成k份子集,進(jìn)行k輪測(cè)試過(guò)程,每次選取其中1份作為測(cè)試集,其余(k-1)份作為訓(xùn)練集訓(xùn)練模型,用保留的測(cè)試集計(jì)算預(yù)測(cè)誤差;重復(fù)訓(xùn)練過(guò)程直到k個(gè)子集均被作為測(cè)試集使用過(guò),計(jì)算k個(gè)模型的誤差平均值作為該模型評(píng)分。k折交叉驗(yàn)證是估計(jì)模型準(zhǔn)確性的可靠方法,本文對(duì)各模型進(jìn)行5折交叉驗(yàn)證評(píng)估可以提供更準(zhǔn)確的測(cè)試誤差估計(jì)值,減少單一異常值對(duì)結(jié)果影響。

      圖1 不同季節(jié)各起報(bào)時(shí)次有效樣本量Fig.1 Number of valid samples for each initial time in different seasons

      1.2 模型構(gòu)建

      考慮到RISE系統(tǒng)不同季節(jié)、不同起報(bào)時(shí)次誤差分布特征不同,本文采用誤差分析的建模思路針對(duì)RISE產(chǎn)品的4個(gè)季節(jié)以及24個(gè)整點(diǎn)起報(bào)時(shí)次(00:00—23:00,世界時(shí),下同)分別構(gòu)建樣本進(jìn)行訂正,起報(bào)時(shí)次是指開(kāi)始發(fā)出預(yù)報(bào)的時(shí)次,RISE產(chǎn)品中每個(gè)起報(bào)時(shí)次均對(duì)未來(lái)1~12 h的每個(gè)整點(diǎn)發(fā)出對(duì)應(yīng)12個(gè)時(shí)刻預(yù)報(bào)(也稱(chēng)為預(yù)報(bào)時(shí)效分別為1~12 h 預(yù)報(bào)),由于RISE系統(tǒng)前2 h預(yù)報(bào)準(zhǔn)確率已較高,因此本文分別對(duì)所有起報(bào)時(shí)次未來(lái)3~12 h預(yù)報(bào)進(jìn)行訂正,提高各起報(bào)時(shí)次預(yù)報(bào)準(zhǔn)確率。本建模方法訂正2 m溫度、2 m相對(duì)濕度、10 m風(fēng)速和10 m 風(fēng)向4種氣象要素,所有建模特征的提取均需要滾動(dòng)遍歷訓(xùn)練集所有相鄰前后兩日數(shù)據(jù)進(jìn)行誤差分析,對(duì)于各要素按照不同起報(bào)時(shí)次分別建模進(jìn)行訂正,模型特征與標(biāo)簽由以下幾部分構(gòu)成:①收集前一日所有不同起報(bào)時(shí)次對(duì)未來(lái)3~12 h的各氣象要素預(yù)報(bào),并與自動(dòng)氣象站對(duì)應(yīng)的觀測(cè)數(shù)據(jù)相減,計(jì)算前一日預(yù)報(bào)偏差作為特征;②收集當(dāng)日不同起報(bào)時(shí)次對(duì)未來(lái)3~12 h多種氣象要素的預(yù)報(bào)作為特征,這是由于多種氣象要素相互影響,將多要素預(yù)報(bào)作為特征能夠更全面學(xué)習(xí)天氣變化。如在溫度預(yù)報(bào)中,加入濕度和風(fēng)場(chǎng)信息預(yù)報(bào),其他要素亦然;③每個(gè)樣本對(duì)應(yīng)的站點(diǎn)高度特征;④標(biāo)簽為所訂正氣象要素預(yù)報(bào)對(duì)應(yīng)時(shí)間的自動(dòng)氣象站觀測(cè)數(shù)據(jù)。

      考慮到每個(gè)起報(bào)時(shí)次對(duì)未來(lái)3~12 h的預(yù)報(bào)誤差會(huì)隨著預(yù)報(bào)時(shí)效增加而出現(xiàn)不同的變化趨勢(shì),為了更好地對(duì)前一日預(yù)報(bào)誤差進(jìn)行學(xué)習(xí),本建模方法將每個(gè)起報(bào)時(shí)次的預(yù)報(bào)時(shí)效分為兩段單獨(dú)進(jìn)行訓(xùn)練,以達(dá)到更好的學(xué)習(xí)效果,第1段采用預(yù)報(bào)時(shí)效為3~6 h的所有樣本訓(xùn)練,第2段采用預(yù)報(bào)時(shí)效為7~12 h的所有樣本訓(xùn)練。

      2 機(jī)器學(xué)習(xí)方法

      2.1 線性回歸方法

      線性回歸方法是機(jī)器學(xué)習(xí)中屬于監(jiān)督學(xué)習(xí)的基礎(chǔ)且常用的方法之一。氣象要素預(yù)報(bào)受多個(gè)變量影響,因此選用多元線性回歸模型,根據(jù)不同建模方法尋找觀測(cè)數(shù)據(jù)與所選特征變量之間的線性關(guān)系。

      2.2 梯度提升回歸方法(GBRT方法)

      梯度提升回歸方法(GBRT方法)是機(jī)器學(xué)習(xí)Boosting算法家族中應(yīng)用較廣泛的樹(shù)型算法之一,是一種具有高預(yù)測(cè)精度和強(qiáng)可解釋性的機(jī)器學(xué)習(xí)方法。GBRT方法每次計(jì)算的目的是減少上一次計(jì)算的殘差(利用殘差學(xué)模型),為了消除殘差,在殘差減少的梯度方向上創(chuàng)建一個(gè)新的模型。GBRT方法可以看作M棵樹(shù)組成的加法模型。

      2.3 XGBoost方法

      XGBoost方法是一種開(kāi)源機(jī)器學(xué)習(xí)算法。XGBoost方法相比于GBRT方法將損失函數(shù)(預(yù)測(cè)值和真實(shí)值的誤差)變得更復(fù)雜,同時(shí)XGBoost方法針對(duì)過(guò)擬合這一關(guān)鍵問(wèn)題也進(jìn)行改善:在代價(jià)函數(shù)增加了正則化項(xiàng),不僅控制模型復(fù)雜度,還可以降低模型偏差,有效防止過(guò)擬合,得到學(xué)習(xí)能力極強(qiáng)的模型。除此之外,引入閾值限制深度優(yōu)化、葉節(jié)點(diǎn)分裂和樹(shù)形生長(zhǎng)過(guò)程。在XGBoost方法訓(xùn)練過(guò)程中,從第2棵樹(shù)開(kāi)始,每棵樹(shù)的目標(biāo)值設(shè)定為上一棵樹(shù)預(yù)測(cè)值與真實(shí)值的誤差,以不斷提高對(duì)錯(cuò)誤樣本的學(xué)習(xí)能力。同大部分機(jī)器學(xué)習(xí)模型一樣X(jué)GBoost方法的目標(biāo)函數(shù)可以用損失函數(shù)和正則項(xiàng)之和表示,對(duì)模型的準(zhǔn)確度和復(fù)雜度進(jìn)行控制和優(yōu)化。

      2.4 堆疊集成學(xué)習(xí)方法(Stacking方法)

      集成學(xué)習(xí)的思想1979年由Dasarathy等[27]提出,廣泛用于分類(lèi)和回歸任務(wù)。集成學(xué)習(xí)往往通過(guò)一些結(jié)合策略將多個(gè)學(xué)習(xí)器的結(jié)果進(jìn)行合成從而得到集成學(xué)習(xí)器的結(jié)果,相對(duì)于單一機(jī)器學(xué)習(xí)模型,該方法通過(guò)選取不同的結(jié)合策略對(duì)得到的多個(gè)學(xué)習(xí)器進(jìn)行組合得到最終結(jié)果,充分利用各個(gè)機(jī)器學(xué)習(xí)方法的優(yōu)勢(shì),提高泛化能力,避免單一學(xué)習(xí)器可能因誤選而導(dǎo)致預(yù)測(cè)效果不佳的情況。其中典型代表為一種異質(zhì)集成學(xué)習(xí)算法堆疊法(簡(jiǎn)稱(chēng)Stacking方法)[28],在Stacking方法中將個(gè)體學(xué)習(xí)器稱(chēng)為初級(jí)學(xué)習(xí)器,用于結(jié)合的學(xué)習(xí)器稱(chēng)為次學(xué)習(xí)器或元學(xué)習(xí)器,該方法首先從初始數(shù)據(jù)集訓(xùn)練出初級(jí)學(xué)習(xí)器,生成一個(gè)新的數(shù)據(jù)集用于訓(xùn)練次級(jí)學(xué)習(xí)器。近年人們嘗試將該方法應(yīng)用于各個(gè)領(lǐng)域,其預(yù)測(cè)結(jié)果相比單模型均展現(xiàn)出良好的學(xué)習(xí)能力[29-31]。

      本文將前3種機(jī)器學(xué)習(xí)方法(線性回歸方法、GBRT方法以及XGBoost方法)作為Stacking方法中的初級(jí)學(xué)習(xí)器,選用3種方法中泛化能力最強(qiáng)的模型作為元學(xué)習(xí)器,利用Stacking方法,通過(guò)對(duì)前3種單一訂正方法進(jìn)行有效集成和二次學(xué)習(xí)訂正,充分發(fā)揮各方法的優(yōu)勢(shì),訓(xùn)練過(guò)程如下:首先,將訓(xùn)練集按照初始建模選取的特征量F(x1,x2,…,xn),采用線性回歸方法、GBRT方法、XGBoost方法3種方法輸入特征標(biāo)簽進(jìn)行模型訓(xùn)練,并采用訓(xùn)練數(shù)據(jù)對(duì)應(yīng)輸入訓(xùn)練后的3個(gè)模型,得到3個(gè)模型的預(yù)報(bào)值tlr,tgb,txgb;其次,將得到的3個(gè)預(yù)報(bào)值加入到原始訓(xùn)練數(shù)據(jù)特征,構(gòu)建新的訓(xùn)練數(shù)據(jù)特征量F(tlr,tgb,txgb,x1,…,xn),將新的數(shù)據(jù)集采用3種方法中表現(xiàn)相對(duì)較好的方法作為元學(xué)習(xí)器再進(jìn)行一次訓(xùn)練,得到元學(xué)習(xí)器最終訓(xùn)練模型;最后,采用測(cè)試集重復(fù)以上步驟,得到初級(jí)學(xué)習(xí)器的預(yù)報(bào)值后,構(gòu)建新的測(cè)試數(shù)據(jù)特征量,并輸入元學(xué)習(xí)器的最終訓(xùn)練模型,得到最終預(yù)報(bào)并進(jìn)行對(duì)比分析。

      3 試驗(yàn)結(jié)果

      3.1 2 m溫度

      圖2為春季00:00,06:00,12:00,18:00 4個(gè)不同起報(bào)時(shí)次,采用上述4種方法對(duì)RISE系統(tǒng)的2 m溫度站點(diǎn)預(yù)報(bào)訂正前后均方根誤差對(duì)比。圖2中4條虛線分別對(duì)應(yīng)不同方法3~12 h預(yù)報(bào)時(shí)效均方根誤差平均值。由圖2可見(jiàn),不同起報(bào)時(shí)次的RISE溫度預(yù)報(bào)呈不同的誤差狀態(tài)。其他3個(gè)季節(jié)(圖略)同春季展示的情況相似,均在12:00起報(bào)的未來(lái)10~12 h(對(duì)應(yīng)北京時(shí)間為06:00—08:00)預(yù)報(bào)誤差最大。這是由于RISE系統(tǒng)所用背景場(chǎng)為中國(guó)氣象局北京快速更新循環(huán)數(shù)值預(yù)報(bào)系統(tǒng)(CMA-BJ)預(yù)報(bào)產(chǎn)品,該系統(tǒng)預(yù)報(bào)誤差有明顯的日變化特征,在早上和傍晚時(shí)段受太陽(yáng)輻射等影響導(dǎo)致誤差較大[32]。

      圖2 RISE系統(tǒng)春季2 m溫度預(yù)報(bào)訂正前后均方根誤差對(duì)比Fig.2 Comparison of 2 m temperature root mean square error of RISE in spring before and after correction

      續(xù)圖2

      表1為4種方法采用誤差分析建模后,對(duì)2 m溫度的季節(jié)訂正結(jié)果??梢钥吹?,經(jīng)過(guò)機(jī)器學(xué)習(xí)方法訂正后,4個(gè)季節(jié)的所有起報(bào)時(shí)次溫度預(yù)報(bào)誤差相比RISE產(chǎn)品誤差均明顯降低。其中,Stacking方法訂正效果在4個(gè)季節(jié)中均表現(xiàn)最佳,訂正后春、夏、秋、冬4個(gè)季節(jié)相對(duì)于RISE產(chǎn)品的均方根誤差分別降低35.4%,37.12%,40.25%和40.40%。單一方法訂正中,XGBoost方法表現(xiàn)最佳,均方根誤差降低20%~35%,其次為GBRT方法,線性回歸方法相對(duì)最低,但仍有明顯效果。

      表1 4種方法對(duì)2 m溫度預(yù)報(bào)的季節(jié)訂正結(jié)果Table 1 Corrected results for 2 m temperature based on four methods in each season

      3.2 2 m相對(duì)濕度

      由于RISE系統(tǒng)的溫度和相對(duì)濕度預(yù)報(bào)技術(shù)路線基本一致,因此文中僅給出基于誤差分析建模,采用4種方法對(duì)4個(gè)季節(jié)所有起報(bào)時(shí)次未來(lái)3~12 h的2 m相對(duì)濕度預(yù)報(bào)均方根誤差對(duì)比,其中4條虛線為對(duì)應(yīng)訂正方法的3~12 h預(yù)報(bào)時(shí)效均方根誤差的平均值(圖3),采用4種方法對(duì)4個(gè)季節(jié)2 m相對(duì)濕度的季節(jié)訂正結(jié)果見(jiàn)表2。由圖3可見(jiàn),4個(gè)季節(jié)所有起報(bào)時(shí)次對(duì)未來(lái)3~8 h的2 m相對(duì)濕度預(yù)報(bào)均方根誤差均隨著預(yù)報(bào)時(shí)效的增加而增大,達(dá)到最大后趨于平穩(wěn),訂正后的誤差變化規(guī)律與原始預(yù)報(bào)的變化規(guī)律保持一致,但幅度較小。同時(shí)可以看到,Stacking方法訂正結(jié)果優(yōu)勢(shì)最明顯,其次是XGBoost方法、GBRT方法、線性回歸方法。由表2可知Stacking方法在4個(gè)季節(jié)RISE產(chǎn)品2 m相對(duì)濕度預(yù)報(bào)訂正中,使均方根誤差降低35%~45%,改善效果明顯。

      圖3 RISE系統(tǒng)4個(gè)季節(jié)2 m相對(duì)濕度預(yù)報(bào)訂正前后均方根誤差對(duì)比Fig.3 Comparison of 2 m relative humidity root mean square error of RISE in four seasons before and after correction

      表2 4種方法對(duì)2 m相對(duì)濕度的季節(jié)訂正結(jié)果Table 2 Corrected results for 2 m relative humidity based on four methods in each season

      3.3 10 m風(fēng)速

      限于篇幅,圖4僅給出夏季和在00:00,06:00,12:00,18:00 4個(gè)起報(bào)時(shí)次采用4種機(jī)器學(xué)習(xí)方法對(duì)RISE 10 m風(fēng)速預(yù)報(bào)訂正前后的均方根誤差對(duì)比,其中4條虛線為對(duì)應(yīng)訂正方法的3~12 h預(yù)報(bào)時(shí)效均方根誤差平均值。表3給出4種機(jī)器學(xué)習(xí)方法采用誤差分析建模對(duì)10 m風(fēng)速的季節(jié)訂正結(jié)果。綜合對(duì)比圖4和表3可以看到,經(jīng)過(guò)4種機(jī)器學(xué)習(xí)方法訂正后不同起報(bào)時(shí)次、不同季節(jié)和不同預(yù)報(bào)時(shí)效的風(fēng)速預(yù)報(bào)誤差相比RISE系統(tǒng)預(yù)報(bào)誤差均明顯降低。4個(gè)季節(jié)中,秋冬季均方根誤差較大,為1.5~2 m·s-1,訂正后大部分預(yù)報(bào)時(shí)效均方根誤差低于1 m·s-1,Stacking方法訂正效果最佳,使均方根誤差分別減小47.44%和46.81%;春夏季RISE產(chǎn)品均方根誤差較小,不超過(guò)1.5 m·s-1,Stacking方法訂正后,均方根誤差分別降低32.17%和36.80%。

      圖4 RISE系統(tǒng)夏季10 m風(fēng)速預(yù)報(bào)訂正前后均方根誤差對(duì)比Fig.4 Comparison of 10 m wind speed root mean square error of RISE in summer before and after correction

      表3 4種方法對(duì)10 m風(fēng)速的季節(jié)訂正結(jié)果Table 3 Corrected results for 10 m wind speed based on four methods in each season

      3.4 10 m風(fēng)向

      參考中國(guó)氣象局對(duì)風(fēng)向的檢驗(yàn)標(biāo)準(zhǔn)《QXT 229—2014風(fēng)預(yù)報(bào)檢驗(yàn)方法》,對(duì)風(fēng)向進(jìn)行處理后采用平均絕對(duì)偏差對(duì)訂正結(jié)果進(jìn)行檢驗(yàn)。表4分別給出4種機(jī)器學(xué)習(xí)方法采用誤差分析建模對(duì)10 m風(fēng)向所有起報(bào)時(shí)次的季節(jié)訂正結(jié)果??梢钥吹?,線性回歸方法對(duì)于春季、夏季和冬季的風(fēng)向訂正效果不明顯,對(duì)于RISE產(chǎn)品平均絕對(duì)偏差僅降低10%左右,而Stacking方法對(duì)于這3個(gè)季節(jié)RISE產(chǎn)品平均絕對(duì)偏差分別降低16.95%,18.75%和23.89%。RISE系統(tǒng)預(yù)報(bào)秋季10 m風(fēng)向誤差最大,平均絕對(duì)偏差為88.56°,Stacking方法訂正后平均絕對(duì)偏差為64.88°,降低26.74%,在4個(gè)季節(jié)中訂正效果最明顯。對(duì)于RISE系統(tǒng)10 m風(fēng)向預(yù)報(bào)的訂正效果仍是Stacking方法最佳,XGBoost方法效果次之,GBRT方法與線性回歸方法較差,但4種方法對(duì)RISE系統(tǒng)10 m風(fēng)向預(yù)報(bào)均有提升效果。

      3.5 個(gè)例分析

      圖5和圖6分別給出2022年2月19日和3月4日兩次大風(fēng)天氣個(gè)例中北京延慶佛爺頂站00:00與09:00起報(bào)基于Stacking方法及RISE系統(tǒng)2 m溫度與10 m風(fēng)速預(yù)報(bào)對(duì)比。

      由圖5可以看到,RISE系統(tǒng)2月19日00:00起報(bào)對(duì)溫度的預(yù)報(bào)較實(shí)況偏低,09:00起報(bào)對(duì)溫度預(yù)報(bào)較實(shí)況偏高,而經(jīng)Stacking方法訂正后溫度始終與實(shí)況保持相同的變化趨勢(shì),且在數(shù)值上也更接近,有效改善了RISE系統(tǒng)的溫度預(yù)報(bào)結(jié)果。由10 m 風(fēng)速變化可知,RISE系統(tǒng)00:00起報(bào)風(fēng)速經(jīng)Stacking方法訂正后與實(shí)況變化趨勢(shì)一致,在9 h預(yù)報(bào)時(shí)效時(shí)風(fēng)速均出現(xiàn)增大的趨勢(shì),而RISE系統(tǒng)預(yù)報(bào)風(fēng)速逐漸減小;RISE系統(tǒng)09:00起報(bào)的風(fēng)速預(yù)報(bào)始終偏小,而經(jīng)Stacking方法訂正后的風(fēng)速與實(shí)況變化更吻合,表現(xiàn)出機(jī)器學(xué)習(xí)方法對(duì)于風(fēng)速預(yù)報(bào)有較為穩(wěn)定的正向訂正效果。

      由圖6可以看到,RISE系統(tǒng)3月4日00:00和09:00起報(bào)的溫度預(yù)報(bào)較實(shí)況整體偏低,未能準(zhǔn)確預(yù)報(bào)升溫趨勢(shì),而經(jīng)Stacking方法訂正后的溫度在大部分時(shí)效與實(shí)況更為接近。RISE系統(tǒng)00:00起報(bào)風(fēng)速存在明顯的減小趨勢(shì),而實(shí)況則為增大趨勢(shì),Stacking方法訂正后風(fēng)速也呈減小趨勢(shì),在數(shù)值上與實(shí)況更為接近。RISE系統(tǒng)08:00起報(bào)的風(fēng)速始終低于5 m·s-1,而實(shí)況為7~10 m·s-1,經(jīng)Stacking方法訂正后,風(fēng)速與實(shí)況更接近,因此Stacking方法對(duì)大風(fēng)天氣的變化敏感,對(duì)改善RISE系統(tǒng)預(yù)報(bào)有實(shí)際應(yīng)用價(jià)值。

      圖5 2022年2月19日2 m溫度(柱狀)與10 m風(fēng)速(折線)訂正對(duì)比Fig.5 Comparison of 2 m temperature(the bar) and 10 m wind speed(the line) on 19 Feb 2022

      圖6 如圖5,但為2022年3月4日訂正對(duì)比Fig.6 The same as in Fig.5,but for 4 Mar 2022

      4 結(jié)論與討論

      本文基于線性回歸方法、GBRT方法、XGBoost方法和Stacking方法4種機(jī)器學(xué)習(xí)訂正方法,采用氣象要素客觀預(yù)報(bào)誤差分析的建模思路,對(duì)北京城市氣象研究院研發(fā)的睿圖-睿思系統(tǒng)的風(fēng)溫濕要素預(yù)報(bào)產(chǎn)品開(kāi)展站點(diǎn)訂正研究,結(jié)論如下:

      1) 以RISE系統(tǒng)500 m分辨率格點(diǎn)預(yù)報(bào)為基礎(chǔ),插值得到站點(diǎn)預(yù)報(bào),并與自動(dòng)氣象站觀測(cè)數(shù)據(jù)匹配作為真實(shí)標(biāo)簽數(shù)據(jù),針對(duì)RISE系統(tǒng)每日24個(gè)起報(bào)時(shí)次對(duì)未來(lái)3~12 h的站點(diǎn)預(yù)報(bào),基于上述4種機(jī)器學(xué)習(xí)方法構(gòu)建預(yù)報(bào)誤差模型進(jìn)行訂正,可以更好地?cái)M合不同起報(bào)時(shí)次地面氣象要素的誤差特征,有效降低原始預(yù)報(bào)誤差。由于秋冬季的可用樣本量多于春夏季,因此整體上多種要素訂正試驗(yàn)效果為秋冬季好于春夏季。

      2) 基于Stacking方法,構(gòu)建適合于誤差分析模型的集成學(xué)習(xí)訂正模型,充分集成3種機(jī)器學(xué)習(xí)方法的優(yōu)勢(shì),結(jié)果表明:該方法對(duì)4個(gè)季節(jié)的風(fēng)溫濕要素預(yù)報(bào)效果改善最明顯?;诰€性回歸方法、GBRT方法和XGBoost方法3種機(jī)器學(xué)習(xí)方法構(gòu)建的預(yù)報(bào)誤差訂正模型中,相較RISE產(chǎn)品而言,均有較為明顯的正向提升效果,其中XGBoost方法效果最佳,其后依次是GBRT方法、線性回歸方法。

      總體上,機(jī)器學(xué)習(xí)方法可以有效減小RISE系統(tǒng)高分辨率氣象要素預(yù)報(bào)誤差,在客觀預(yù)報(bào)誤差訂正方面具有廣闊的應(yīng)用前景。在今后工作中,將從復(fù)雜地形角度出發(fā),將山區(qū)和平原地區(qū)不同類(lèi)型站點(diǎn)分類(lèi)建模進(jìn)行訂正試驗(yàn),提升復(fù)雜地形下的客觀預(yù)報(bào)誤差訂正效果;同時(shí)可以在保證當(dāng)前預(yù)報(bào)效果前提下,嘗試訓(xùn)練更長(zhǎng)預(yù)報(bào)時(shí)效的訂正模型。隨著預(yù)報(bào)系統(tǒng)產(chǎn)品不斷積累,可以嘗試增加訓(xùn)練樣本,進(jìn)一步提高機(jī)器學(xué)習(xí)模型訂正效果。

      猜你喜歡
      報(bào)時(shí)方根季節(jié)
      方根拓展探究
      我喜歡的季節(jié)7
      季節(jié)蠕變
      報(bào)時(shí)豬
      季節(jié)的變換
      報(bào)時(shí)貓
      喜劇世界(2017年10期)2017-12-05 20:11:40
      均方根嵌入式容積粒子PHD 多目標(biāo)跟蹤方法
      揭開(kāi)心算方根之謎
      花的季節(jié)
      數(shù)學(xué)魔術(shù)
      军事| 白水县| 普格县| 鄂尔多斯市| 旺苍县| 洪江市| 河南省| 故城县| 称多县| 马尔康县| 新沂市| 上栗县| 甘泉县| 泸州市| 玉环县| 铜鼓县| 长治县| 桓仁| 鲜城| 大石桥市| 玛纳斯县| 锡林郭勒盟| 赤水市| 长海县| 尚义县| 长丰县| 姚安县| 肇源县| 张家口市| 通化县| 郓城县| 阳西县| 盐池县| 额敏县| 安新县| 合肥市| 保德县| 敦煌市| 库伦旗| 青浦区| 正安县|