• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于機器學習的韶關(guān)地區(qū)短期日平均氣溫研究

      2022-12-06 07:23:06羅燁泓
      陜西氣象 2022年6期
      關(guān)鍵詞:平均氣溫實測值氣溫

      羅 威,羅燁泓,王 威

      (1.興寧市氣象局,廣東興寧 514500;2.韶關(guān)市氣象局,廣東韶關(guān) 512028;3.深圳市氣象局,廣東深圳 518000)

      自工業(yè)革命以來,人類活動所導致的大氣二氧化碳排放量劇增,更多的熱量被截留在大氣層內(nèi),致使地球氣溫增高。受此影響,全球平均表面溫度自工業(yè)革命以來表現(xiàn)出顯著的上升趨勢。全球變暖會引起冰雪融化、凍土消融、海平面上升、極端天氣頻發(fā)等,其嚴重威脅了全球自然生態(tài)系統(tǒng),乃至人類的生存[1-6]。為此,開展針對全球氣溫的精細化預報研究具有重要現(xiàn)實意義。

      近年來,監(jiān)督類機器學習(樹模型、支持向量機、神經(jīng)網(wǎng)絡(luò)等)和深度學習算法等各類機器學習算法已在氣象短臨[1]、中短期[2]乃至長期預報[3]等領(lǐng)域發(fā)揮了積極的重要作用,其在相關(guān)領(lǐng)域中的表現(xiàn)要顯著優(yōu)于統(tǒng)計和主觀經(jīng)驗等傳統(tǒng)方法。相較于其他方法而言,監(jiān)督類機器學習算法能夠更有效綜合應(yīng)用來自觀測、數(shù)值模式等多源數(shù)據(jù),據(jù)此可更有效地提取大氣的非線性演化特征,進而提升數(shù)值模式的天氣預報效果。然而,受地形、模式參數(shù)化方案等不確定性因素的共同影響,目前數(shù)值預報模式對氣溫的預報尚存在一定的偏差,尤其對于中小城市、偏遠以及具有復雜地形的地區(qū)而言,預報方法通常僅依賴于數(shù)值模式,且缺乏有效的補充與優(yōu)化方法。韶關(guān)地區(qū)地處南嶺山脈南麓,屬于亞熱帶季風氣候區(qū),夏無酷暑,冬無嚴寒,雨量充沛,日照溫和,氣候條件優(yōu)越,生態(tài)與旅游資源豐富,并且是廣東省重要的糧食蔬菜供應(yīng)地、農(nóng)業(yè)大市。因此,針對韶關(guān)地區(qū)等中小城市氣溫預報業(yè)務(wù)算法的開發(fā)對推動氣象業(yè)務(wù)的精細化預報具有重要意義。為此,僅利用1965—2017年韶關(guān)地區(qū)8個站點的日平均氣溫觀測資料,構(gòu)建了基于歷史數(shù)據(jù)驅(qū)動與機器學習方法的短期氣溫預報模型,以期為中小城市乃至偏遠地區(qū)的氣溫業(yè)務(wù)預報的改進提供參考,為當?shù)厣鷳B(tài)環(huán)境的改善、社會經(jīng)濟的發(fā)展提供科學決策依據(jù)。

      1 資料和方法

      1.1 資料介紹

      基于1965—2017年韶關(guān)地區(qū)8個臺站(南雄、曲江、樂昌、仁化、乳源、始興、翁源和新豐)的日平均氣溫,求取上述8個站點日平均氣溫的平均值。臺站的基本信息見表1。

      表1 韶關(guān)地區(qū)各個臺站基本信息

      1.2 方法介紹

      本文用于短期氣溫預報的算法分別有傳統(tǒng)回歸方法——逐步多元線性回歸法和機器學習方法——LightGBM(light gradient boosting machine)和BP-NN(back propagation neural network)。短期日平均氣溫預報的流程主要可概括如下:(1)將連續(xù)nd的日平均氣溫(T1,T2, ……,Tn)作為自變量,將第n+1,n+2,n+3天所分別對應(yīng)的日平均氣溫Tn+1,Tn+2,Tn+3作為因變量來構(gòu)建預報Tn+1,Tn+2,Tn+3的模型。(2)n是決定Tn+1,Tn+2,Tn+3預報精度的重要參數(shù),因此在1~365 d的范圍內(nèi)對n進行遍歷,最終確定了n=7時可使T8,T9,T10的預報效果達到最優(yōu)。即將過去連續(xù)7 d的日平均氣溫(T1,T2, ……,T7)作為自變量,以未來3 d日平均氣溫(T8,T9,T10)作為因變量,來構(gòu)建相應(yīng)的日平均氣溫預報模型。

      1.2.1 逐步多元線性回歸 逐步多元線性回歸[4]是基于最優(yōu)的自變量來構(gòu)建回歸模型,其較好地解決了傳統(tǒng)多元線性回歸法中所存在的共線性問題[5],從而有利于回歸模型獲得更加精確的計算效果。目前,多元逐步線性回歸法已被廣泛應(yīng)用于氣象領(lǐng)域,其詳細流程可詳見文獻[4]。

      1.2.2 LightGBM(light gradient boosting machine)算法 LightGBM[6]是微軟在2017年提出的基于GBDT的算法。相較于傳統(tǒng)樹模型而言,LightGBM預報精度更高、模型泛化性更強、計算效率更快,適用于大規(guī)模數(shù)據(jù)集的并行計算。LightGBM算法的原理參照文獻[6]。

      1.2.3 BP-NN(back propagation neural network)算法 BP-NN算法的原理參照文獻[7]。為避免權(quán)重參數(shù)過多而引起過擬合,本文的BP-NN僅5層,由1層輸入層、3層隱藏層、1層輸出層組成,其中隱藏層的特征維度為100。為了增強BP-NN的訓練/預報效果,采用如下優(yōu)化機制。(1)Kaiming初始化方案[8];(2)Relu激活層[9];(3)L2正則化方案[10],權(quán)重衰減系數(shù)為0.000 1;(4)Adam優(yōu)化算法;(5)余弦退火的學習率衰減策略:學習率隨訓練迭代次數(shù)的增大而呈現(xiàn)余弦的周期形態(tài)變化,變化的周期為100次迭代,學習率最大值為0.001,最小值為0.000 01;(6)均方誤差(mean square error, MSE)的損失函數(shù);(7)自變量與因變量均采用最大最小值歸一化。

      2 結(jié)果與分析

      2.1 Tn+1, Tn+2, Tn+3與T1~n之間的相關(guān)性

      表2為Tn+1,Tn+2,Tn+3與T1~n(n=7)之間的相關(guān)性,從表2可見,隨著自變量與因變量之間時間間隔的增大,其對應(yīng)的相關(guān)性逐漸降低,但總體仍十分顯著。因此,其顯著的相關(guān)性為以歷史日平均氣溫作為自變量來預報未來短期內(nèi)的日平均氣溫奠定了基礎(chǔ)。

      表2 未來日平均氣溫與歷史日平均氣溫之間的相關(guān)性

      2.2 三種短期日平均氣溫預報模型的構(gòu)建

      取1965—2014年的日平均氣溫作為逐步多元線性回歸法建模數(shù)據(jù)集,并作為LightGBM與BP-NN模型的訓練集,2015—2016年的作為兩種機器學習模型的驗證集,2017年的則作為上述三種模型適用性分析的測試集。其中訓練集用于訓練構(gòu)建上述三種模型,驗證集用于監(jiān)控機器學習模型的訓練情況。當LightGBM與BP-NN超過100次的訓練迭代而驗證集誤差不再下降時則停止訓練,以防過擬合。兩種模型均訓練迭代1 000次,訓練結(jié)束后保存驗證集誤差最低的模型。

      2.2.1 基于逐步多元線性回歸的模型 日平均氣溫之間顯著的相關(guān)性(表2)極易帶來共線性問題,進而導致普通線性回歸方法存在計算的不穩(wěn)定性問題。為此,本文采用了逐步線性回歸方法來構(gòu)建短期日平均氣溫預報模型。

      通常情況下,可認為方差膨脹因子≤10時不存在明顯的共線性[5]。據(jù)此,預報未來1~3 d短期日平均氣溫的多元逐步線性回歸方程如下。

      T8=0.656+0.967T7,

      (1)

      T9=1.024+0.757T7+0.192T2,

      (2)

      T10=1.551+0.645T7+0.278T3。

      (3)

      通過逐步多元線性回歸分析發(fā)現(xiàn),在滿足方差膨脹因子≤10的條件下,T8的自變量因子僅為T7,也表明T1~6與T7之間存在顯著的共線性;T9的自變量因子為T7和T2,其對應(yīng)的方差膨脹因子均為3.545;T10的自變量因子則為T7和T3,其對應(yīng)的方差膨脹因子均為3.876??梢姇r間間隔更久遠的氣溫反而可能是未來氣溫的重要影響因子。建模數(shù)據(jù)集的擬合結(jié)果表明,式(1)、式(2)和式(3)的計算值與實測值之間的擬合相關(guān)系數(shù)分別為0.97、0.93、0.90,擬合平均絕對誤差(mean absolute error, MAE)分別為1.32、2.04、2.42 ℃。

      2.2.2 基于LightGBM的模型 利用LightGBM算法計算的訓練集T8,T9,T10與實測值之間的擬合R分別為0.98、0.95、0.93,MAE則分別為1.09、1.68、2.00 ℃。

      2.2.3 基于BP-NN的模型 利用BP-NN算法計算的訓練集T8,T9,T10與實測值之間的擬合R分別為0.97、0.93、0.91,MAE分別為1.22、1.94、2.30 ℃。

      2.3 三種模型的適用性

      從2.2節(jié)針對三種短期日平均氣溫預報模型的建模結(jié)果可知,LightGBM的預報效果最優(yōu),BP-NN次之,逐步多元線性回歸最差。將上述三種算法應(yīng)用于2017年的測試集,就各自在短期日平均氣溫預報中的適用性展開系統(tǒng)分析。

      首先分別繪制了上述三種算法日平均氣溫預報值與實測值之間的時間序列圖(圖1)。從圖1可知,針對T8的預報效果而言,逐步多元線性回歸、LightGBM、BP-NN的預報值與實測值之間的R分別為0.97、0.98、0.97,MAE分別為1.25、1.17、1.22 ℃;T9的R分別為0.93、0.94、0.93,MAE則分別為1.88、1.76、1.87 ℃;T10的R分別為0.89、0.93、0.91,MAE則分別為2.22、1.96、2.12 ℃。可見三種算法在測試集上的預報效果與訓練集表現(xiàn)基本一致,具有優(yōu)良的泛化性,其中LightGBM的預報效果最優(yōu),BP-NN次之,逐步多元線性回歸最差。

      圖1 三種模型日平均氣溫預報值與實測值的時間序列(a 逐步多元線性回歸;b LightGBM;c BP-NN)

      在實際的氣溫預報業(yè)務(wù)中,當氣溫的預報誤差小于2 ℃時可認為預報正確。為此,分別統(tǒng)計了三種算法日平均氣溫預報值的準確率及其與實測值之間的MAE(表3)。從表3可知,就T8的預報結(jié)果而言,三者預報準確率可分別高達83.29%、84.38%、82.73%,MAE為1.25、1.17、2.22 ℃;就T9而言,三種模型的差異性明顯體現(xiàn),三者預報準確率分別為64.38%、69.86%、63.56%,MAE為1.88、1.76、1.87 ℃;就T10而言,三者預報準確率分別為56.44%、61.37%、59.18%,MAE為2.22、1.96、2.12 ℃。

      表3 三種模型日平均氣溫的預報結(jié)果評價指標

      綜上可見,相較于逐步多元線性回歸法和BP-NN而言,LightGBM不僅在相關(guān)系數(shù)以及精確度上更占優(yōu)勢,并且具有更高的預報正確率。尤其隨著預報時效的增大,LightGBM具有更優(yōu)的預報效果,而BP-NN與逐步線性回歸法的預報效果則均急劇下降,說明LightGBM具有最優(yōu)的預報穩(wěn)定性。推測樣本數(shù)量較少可能是三種模型預報效果存在顯著差異的最主要原因。傳統(tǒng)的機器學習模型,如LightGBM、Xgboost、Catboost等更適用于百萬級以下的樣本量。

      明確模型預報誤差的時間分布情況對于提高氣溫的預報精度具有重要意義。為此,繪制了三種模型日平均氣溫預報值與實測值之間絕對誤差(absolute error, AE)的時間序列圖(圖2)。從圖2可見,相同預報時效,三種模型所表現(xiàn)的AE波動形態(tài)基本一致。但總體而言,LightGBM的AE及其波動幅度最小,其預報未來3 d氣溫絕對誤差的標準差(standard deviation,STD)分別為1.09、1.53、1.65 ℃;BP-NN次之,STD分別為1.15、1.66、1.97 ℃;逐步線性回歸最大,STD則分別為1.23、1.73、2.00 ℃。此外,逐步多元線性回歸以及BP-NN的AE及其波動幅度均隨著預報時效的增大而顯著增大,但LightGBM則相對最為穩(wěn)定。另外從圖2不難看出,三種模型AE的大值區(qū)基本位于0~100日以及240~365日,即處于冬春季以及秋冬季。結(jié)合圖1可推測,該時期氣溫較大的波動性會加大機器學習模型的訓練難度,進而導致AE的總體偏大。

      圖2 三種模型針對未來1~3 d日平均氣溫預報的絕對誤差(AE)時間序列

      綜合上述分析可知,LightGBM和BP-NN機器學習方法在預報準確性,擬合效果(R)以及穩(wěn)定性(AE)方面均要優(yōu)于逐步多元線性回歸法。

      3 結(jié)論和討論

      (1)通過對過去1~365 d的日平均氣溫進行遍歷測試,確定將過去連續(xù)7 d的日平均氣溫分別作為逐步多元線性回歸、LightGBM以及BP-NN算法的自變量可最準確地預報出未來1~3 d的日平均氣溫,據(jù)此構(gòu)建了短期氣溫預報模型。該最優(yōu)自變量的確定方法是以結(jié)果為導向,其中所表征的科學背景仍有待進一步探索。

      (2)從預報準確率(絕對誤差小于2 ℃的天數(shù)占比),相關(guān)系數(shù)和絕對誤差來看,三種模型均能較準確地預報出未來1~3 d的短期日平均氣溫,其中LightGBM最優(yōu),BP-NN次之,逐步多元線性回歸最差。以LightGBM為代表的傳統(tǒng)機器學習模型適用于非圖像領(lǐng)域百萬級左右的數(shù)據(jù)集,而對于雷達回波外推以及空間降尺度等圖像領(lǐng)域, 則要以神經(jīng)網(wǎng)絡(luò)為代表的深度學習方法更為適用。

      (3)數(shù)據(jù)的質(zhì)量決定了預報效果的上限,而模型只是協(xié)助逼近該上限。因此,增加更多的觀測與模式預報資料,通過采用特征工程等方法,將有助于進一步提升算法的預報性能。

      猜你喜歡
      平均氣溫實測值氣溫
      氣溫的神奇“魔法”
      基于FY-3D和FY-4A的氣溫時空融合
      ±800kV直流輸電工程合成電場夏季實測值與預測值比對分析
      常用高溫軸承鋼的高溫硬度實測值與計算值的對比分析
      哈爾濱軸承(2020年1期)2020-11-03 09:16:22
      市售純牛奶和巴氏殺菌乳營養(yǎng)成分分析
      中國奶牛(2019年10期)2019-10-28 06:23:36
      烏蘭縣近38年氣溫變化特征分析
      一種基于實測值理論計算的導航臺電磁干擾分析方法
      電子制作(2018年23期)2018-12-26 01:01:22
      從全球氣候變暖大背景看萊州市30a氣溫變化
      1981—2010年拐子湖地區(qū)氣溫變化特征及趨勢分析
      近50年來全球背景下青藏高原氣候變化特征分析
      丁青县| 横峰县| 镇安县| 三亚市| 开封县| 武强县| 小金县| SHOW| 九江市| 张掖市| 抚宁县| 九江县| 化德县| 宜良县| 保亭| 浦江县| 自贡市| 巴塘县| 瑞丽市| 凤庆县| 垫江县| 保康县| 定西市| 汾阳市| 桦川县| 延津县| 柳州市| 日土县| 巧家县| 扶沟县| 当雄县| 团风县| 濮阳县| 麻城市| 萍乡市| 永吉县| 石家庄市| 巩义市| 阿拉善盟| 苗栗县| 白朗县|