• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      利用PCA-kNN方法改進(jìn)廣州市空氣質(zhì)量模式PM2.5預(yù)報

      2019-03-12 08:15:16王春林譚浩波鄧雪嬌
      熱帶氣象學(xué)報 2019年1期
      關(guān)鍵詞:平均偏差實(shí)況方根

      湯 靜,王春林,譚浩波,鄧雪嬌,鄧 濤

      (1.廣州市氣候與農(nóng)業(yè)氣象中心廣東廣州511430;2.廣東省生態(tài)氣象中心廣東廣州510640;3.中國氣象局廣州熱帶海洋氣象研究所/廣東省區(qū)域數(shù)值天氣預(yù)報重點(diǎn)實(shí)驗(yàn)室,廣東廣州510640)

      1 引 言

      廣州市位于珠江三角洲中心,近年快速的經(jīng)濟(jì)發(fā)展和城市化進(jìn)程導(dǎo)致細(xì)顆粒物(PM2.5)污染及其引起的大氣污染事件(如灰霾[1-3])日益受到政府和公眾的廣泛關(guān)注。政府制定污染減排應(yīng)對決策和公眾出行均對PM2.5的準(zhǔn)確預(yù)報提出日益迫切的需求。

      預(yù)報PM2.5的方法可分為三類:(1)統(tǒng)計方法。通?;跉v史觀測數(shù)據(jù)構(gòu)建自變量與因變量的統(tǒng)計模型用于預(yù)報[4-5],在觀測數(shù)據(jù)足夠的情況下比較容易擬合統(tǒng)計模型,但是統(tǒng)計方法難以預(yù)測長期和大范圍的空氣污染,無法預(yù)測污染物的成分或含量進(jìn)而為污染減排提供參考[6-8]。(2)動力方法?;诳諝赓|(zhì)量數(shù)值模式的動力預(yù)報能較為完整地反映氣象因素、源排放以相關(guān)物理化學(xué)過程的變化[8-10]。然而,由于排放源、初邊界條件、物理化學(xué)參數(shù)等存在較大不確定性,數(shù)值預(yù)報的準(zhǔn)確性還有待進(jìn)一步提升[8,11]。(3)統(tǒng)計與動力相結(jié)合的方法。空氣質(zhì)量模式的誤差主要由隨機(jī)誤差和系統(tǒng)性偏差構(gòu)成,基于空氣質(zhì)量模式的輸出和歷史觀測數(shù)據(jù),應(yīng)用統(tǒng)計方法訂正模式偏差,能有效降低系統(tǒng)性偏差[12-13]。偏差訂正過程并不會加深對模型缺陷或性能的了解,或者人為修正它們,但旨在根據(jù)空氣質(zhì)量模式或輸入數(shù)據(jù)的內(nèi)在特征消除潛在的偏差[12]。

      目前空氣質(zhì)量模式偏差訂正方法主要有:(1)線性回歸/模式輸出統(tǒng)計[14](Model Output Statistics,MOS)。Konovalov等[15]基于CHIMERE模式產(chǎn)品、GFS模式數(shù)據(jù)、PM10觀測數(shù)據(jù),利用線性回歸方法訂正模式PM10預(yù)報產(chǎn)品,訂正結(jié)果較模式產(chǎn)品均方根誤差降低45%,可決系數(shù) (Coefficient of determination)幾乎提高一倍。王開燕等[16]利用MOS方法對珠三角空氣質(zhì)量預(yù)報模式預(yù)報結(jié)果進(jìn)行訂正,降低了預(yù)報偏差。(2)滑動平均偏差訂正,即在一定的時間段內(nèi)計算模式與實(shí)況的偏差,在當(dāng)前預(yù)報上減去偏差得到訂正預(yù)報[13]。謝敏等[17]考慮CMAQ模式預(yù)報的濃度變化趨勢,采用預(yù)報日前一天的監(jiān)測數(shù)據(jù)訂正PM10預(yù)報,提高了24 h均值預(yù)報的準(zhǔn)確度。(3)乘數(shù)比例法。Borrego等[12]采用乘數(shù)比例和卡爾曼濾波兩種方法對BSC-DREAM8b模型PM2.5預(yù)報進(jìn)行訂正,訂正后的相關(guān)系數(shù)較原模型提高50%以上。(4)卡爾曼濾波。Kang等[18]采用實(shí)時卡爾曼濾波偏差訂正方法對NAM-CMAQ模式24 h時效PM2.5預(yù)報進(jìn)行訂正,降低了預(yù)報誤差、提高了相關(guān)系數(shù)。(5)組合方法。Djalalova等[13]利用歷史相似與卡爾曼濾波方法相結(jié)合對空氣質(zhì)量數(shù)值模式CMAQ PM2.5產(chǎn)品訂正后平均絕對誤差降低50%~75%,相關(guān)系數(shù)提高40%~60%。黃思等[19]利用多模式集合和多元線性回歸改進(jìn)北京PM10預(yù)報,提高了預(yù)報準(zhǔn)確率。Lyu等[20]根據(jù)模式偏差、模式預(yù)報及觀測數(shù)據(jù)的歷史數(shù)據(jù)提出一個偏差訂正框架進(jìn)行預(yù)報后處理,降低了空氣質(zhì)量模式CMAQ PM2.5預(yù)報的均方根誤差。上述不同訂正方法效果的差異可能與研究區(qū)域不同的自然、社會經(jīng)濟(jì)等條件有關(guān)[20],但都能改進(jìn)原模式的預(yù)報效果,反映了引入監(jiān)測數(shù)據(jù)對空氣質(zhì)量數(shù)值預(yù)報模式進(jìn)行訂正的可行性。相較于MOS等方法,機(jī)器學(xué)習(xí)算法處理海量數(shù)據(jù)更便捷、構(gòu)建模型更靈活、預(yù)報準(zhǔn)確性更高[21],但上述文獻(xiàn)中鮮有應(yīng)用[20]。

      本文基于空氣質(zhì)量模式(CMAQ)[11]PM2.5等污染物濃度預(yù)報、中尺度天氣模式(GRAPESMESO)[22]氣象要素預(yù)報及廣州市環(huán)境空氣質(zhì)量監(jiān)測國控點(diǎn)PM2.5實(shí)況數(shù)據(jù),提出應(yīng)用主成分分析方法(Principal Component Analysis,PCA)對數(shù)據(jù)進(jìn)行前處理,再結(jié)合機(jī)器學(xué)習(xí)算法k近鄰[23-24](k nearest neighbor,kNN)建立逐日滾動偏差訂正的方法(PCA-kNN),改進(jìn)廣州市PM2.5客觀預(yù)報能力,并驗(yàn)證利用機(jī)器學(xué)習(xí)算法訂正空氣質(zhì)量模式PM2.5預(yù)報的可行性。

      2 數(shù)據(jù)及方法

      2.1 數(shù) 據(jù)

      本文采用的中尺度天氣模式是我國自主研發(fā)的 GRAPES-MESO (Global and Regional Assimilation and Prediction Enhanced System-Meso-Scale)[22]模式。GRAPES-MESO采用三維變分同化方法,半隱式-半拉格朗日差分方案和全可壓/非靜力平衡動力框架,可自由組合的、優(yōu)化的物理過程參數(shù)化方案,是全球、區(qū)域一體化的同化與預(yù)報系統(tǒng)[22]??諝赓|(zhì)量模式采用中國氣象局廣州熱帶海洋氣象研究所搭建的華南區(qū)域空氣質(zhì)量數(shù)值預(yù)報模式系統(tǒng)[11],以GRAPES-MESO作為氣象場驅(qū)動CMAQ,采用高時空分辨率的三重嵌套模式域,分辨率分別為27 km、9 km、3 km,模擬采用三重單向嵌套網(wǎng)格,為泛珠三角區(qū)域、特別是區(qū)域重點(diǎn)城市提供 PM2.5、PM10、O3、NO2、SO2、CO等6種污染物濃度的0~96 h逐小時預(yù)報產(chǎn)品。

      本文用到2017年上半年廣州市11站的相關(guān)數(shù)據(jù)如下:(1)CMAQ模式20時(北京時間,下同)起報 1~72 h 逐時 PM2.5、PM10、O3、NO2、SO2、CO等污染物濃度預(yù)報數(shù)據(jù);(2)GRAPES-MESO模式20時起報1~72 h逐時氣溫、相對濕度、氣壓、降水、風(fēng)速、位勢高度、垂直速度(含地面、1 000 hPa、925 hPa、850 hPa、700 hPa、500 hPa 等層次)等氣象要素數(shù)據(jù);(3)逐時PM2.5濃度實(shí)況數(shù)據(jù)。

      2.2 方 法

      2.2.1 主成分分析

      主成分分析(PCA)最初是由Pearson(1901年)在非隨機(jī)變量的討論中介紹的,后來由Hotelling擴(kuò)展到隨機(jī)變量[25-27]。PCA的目的是將相關(guān)性較強(qiáng)的多維變量轉(zhuǎn)化為彼此不相關(guān)的新變量。PCA方法的優(yōu)點(diǎn)在于:(1)僅以方差衡量信息量,不受數(shù)據(jù)集以外的因素影響;(2)各主成分之間正交,可消除原始數(shù)據(jù)成分間相互影響的因素。在實(shí)際應(yīng)用中,經(jīng)過PCA處理后,前幾個主成分已經(jīng)包含了大部分原始變量的變異信息,選取累計貢獻(xiàn)率達(dá)到90%的主成分進(jìn)行分析,達(dá)到降維的目的。本文利用PCA方法對數(shù)據(jù)進(jìn)行前處理。

      2.2.2 k近鄰

      k近鄰(kNN)是一種常用的監(jiān)督學(xué)習(xí)算法[24]。kNN方法在水文學(xué)研究中得到廣泛應(yīng)用[28-29],后被Wu等[30]應(yīng)用到降尺度季節(jié)天氣預(yù)報上去。kNN的工作機(jī)制是:給定測試樣本,基于某種距離度量找出訓(xùn)練集中與其最靠近的k個訓(xùn)練樣本,然后基于這k個“鄰居”的信息來進(jìn)行預(yù)測[24]。在回歸任務(wù)中一般使用平均法,即將這k個樣本標(biāo)記的平均值作為預(yù)測結(jié)果,也可以基于距離遠(yuǎn)近進(jìn)行加權(quán)平均或加權(quán)投票,距離越近的樣本權(quán)重越大[24]。kNN算法的優(yōu)點(diǎn)是精度高、對異常值不敏感、無數(shù)據(jù)輸入假定,缺點(diǎn)是計算復(fù)雜度高、空間復(fù)雜度高[24]。

      kNN算法假定所有的實(shí)例對應(yīng)于n維歐氏空間An中的點(diǎn)。把任意實(shí)例x表示為特征向量:a1(x),a2(x),……,an(x),其中 ar(x)表示實(shí)例 x 的第 r個屬性值。那么兩個實(shí)例xi和xj之間的距離定義為 d(xi,xj),其中:

      2.2.3 評估指標(biāo)

      評估CMAQ模式PM2.5產(chǎn)品以及PCA-kNN方法訂正效果的指標(biāo)主要有相關(guān)系數(shù)(Correlation coefficient,r)、均方根誤差 (Root Mean Square Error,RMSE)和平均偏差(Mean Bias,MB)。計算公式分別如下:

      其中,N為樣本數(shù)量,Mi為預(yù)報值,Oi為觀測值。此外,根據(jù)《環(huán)境空氣質(zhì)量指數(shù)(AQI)技術(shù)規(guī)定(試行)》(HJ633-2012)[31]規(guī)定的PM2.5濃度限值,把PM2.5濃度分為六個等級,對不同等級分別計算TS評分[32]。

      其中,對于某個等級,NA是預(yù)報正確的次數(shù),NB是空報次數(shù),NC是漏報次數(shù)。

      2.2.4 PCA-kNN方法

      PCA-kNN方法流程如下:(1)樣本數(shù)據(jù)收集。例如起報日期為t,最佳歷史數(shù)據(jù)天數(shù)為d,則下載廣州市各站點(diǎn)t-d至t日CMAQ 20時起報的1~72h逐時污染物濃度預(yù)報數(shù)據(jù)、GRAPES-MESO 20時起報的1~72 h逐時氣象要素數(shù)據(jù)以及起報時間(t日20時)以前相應(yīng)時次的PM2.5觀測數(shù)據(jù)。(2)數(shù)據(jù)質(zhì)量控制。去掉所得數(shù)據(jù)里的缺測以及異常值。(3)標(biāo)準(zhǔn)化及PCA處理。以CMAQ和GRAPES-MESO模式預(yù)報數(shù)據(jù)為自變量,PM2.5觀測數(shù)據(jù)為因變量。根據(jù)應(yīng)用kNN等機(jī)器學(xué)習(xí)算法的需要,對自變量進(jìn)行標(biāo)準(zhǔn)化處理(即原數(shù)據(jù)減去其平均值,再除以標(biāo)準(zhǔn)偏差)。把標(biāo)準(zhǔn)化后的結(jié)果進(jìn)行PCA處理,選擇累計貢獻(xiàn)率達(dá)到90%的主成分。(4)將訓(xùn)練數(shù)據(jù)分成訓(xùn)練集、驗(yàn)證集、測試集。將t-d至t-1日的歷史數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)。將訓(xùn)練數(shù)據(jù)按時次隨機(jī)排列,選擇70%的數(shù)據(jù)作為訓(xùn)練集,20%的數(shù)據(jù)作為驗(yàn)證集,10%的數(shù)據(jù)作為測試集。(5)訓(xùn)練kNN模型,參數(shù)優(yōu)化。以自變量和因變量為輸入,訓(xùn)練kNN回歸模型。kNN回歸模型的主要參數(shù)是鄰近樣本個數(shù)即k值,采用交叉驗(yàn)證和網(wǎng)格搜索[33],選擇驗(yàn)證誤差和測試誤差最小的k值。(6)基于待訂正的模式產(chǎn)品得出訂正預(yù)報。將t日起報的模式數(shù)據(jù)作為輸入,以上述最佳的k值作為參數(shù)進(jìn)行kNN回歸預(yù)報,得到t日起報的訂正預(yù)報。

      PCA-kNN方法主要基于scikit-learn[33]實(shí)現(xiàn),scikit-learn是PYTHON語言環(huán)境下十分流行的開源機(jī)器學(xué)習(xí)算法庫,它集成了當(dāng)下最先進(jìn)的機(jī)器學(xué)習(xí)算法,并提供了易用、高效、統(tǒng)一的API接口。

      2.2.5 參數(shù)試驗(yàn)

      訂正方法的參數(shù)影響訂正效果及訓(xùn)練所耗費(fèi)的時間,本文通過參數(shù)試驗(yàn)來選擇PCA-kNN方法的參數(shù)方案(表1)。試驗(yàn)數(shù)據(jù)范圍及時間:廣州市2017年1月共31天。試驗(yàn)方案的區(qū)別主要是訓(xùn)練數(shù)據(jù)的來源、時效兩方面,例如CG72方案采用了1~72 h的歷史CMAQ和GRAPES-MESO全部預(yù)報要素作為自變量,相應(yīng)時次的PM2.5觀測實(shí)況作為因變量,訓(xùn)練PCA-kNN模型后基于待訂正的CMAQ和GRAPES-MESO預(yù)報(此時的模式產(chǎn)品無相應(yīng)時次PM2.5觀測實(shí)況)得到1~72 h訂正預(yù)報。相比CG72方案,G_multi在訓(xùn)練時分為3個部分,而且訓(xùn)練數(shù)據(jù)中去掉了CMAQ模式產(chǎn)品。

      試驗(yàn)過程:根據(jù)不同的試驗(yàn)方案獲取相應(yīng)歷史數(shù)據(jù)訓(xùn)練PCA-kNN模型,基于待訂正的模式預(yù)報產(chǎn)品利用PCA-kNN模型分別對各站點(diǎn)進(jìn)行1~72 h逐時訂正預(yù)報,分1~3天時效計算各站點(diǎn)逐日預(yù)報,求平均得到相應(yīng)時效的廣州市逐日預(yù)報。例如1月1日20時起報的廣州市第1天日平均PM2.5數(shù)據(jù)是由1月1日20時起報的11個站點(diǎn)的第1天預(yù)報求平均而得到。選取1~31天歷史數(shù)據(jù)進(jìn)行建模[8],計算相關(guān)系數(shù)、均方根誤差、平均偏差,綜合考慮上述指標(biāo)選擇最佳歷史天數(shù)。

      表1 PCA-kNN訓(xùn)練樣本參數(shù)試驗(yàn)設(shè)置

      以試驗(yàn)方案CG72為例,2017年1月不同歷史數(shù)據(jù)天數(shù)24 h訂正預(yù)報效果變化如圖1所示,相關(guān)系數(shù)、均方根誤差、平均偏差分別在0.60~0.74 μg/m3、21.9~27.2 μg/m3、-1.0~6.7 μg/m3之間。當(dāng)歷史數(shù)據(jù)天數(shù)為1時訂正預(yù)報與實(shí)況的相關(guān)系數(shù)最高(0.74),較試驗(yàn)平均值(0.64)提高約16%;均方根誤差最低(21.9 μg/m3),較試驗(yàn)平均值(24.8 μg/m3)降低約12%;平均偏差為-0.9 μg/m3,較試驗(yàn)平均值(2.8 μg/m3)更接近 0。因此,CG72方案24 h時效最佳歷史數(shù)據(jù)天數(shù)為1。同理,對不同方案試驗(yàn)結(jié)果選擇相關(guān)系數(shù)最大、均方根誤差最低、平均偏差接近0的歷史數(shù)據(jù)天數(shù)作為最佳參數(shù)得到表2所示結(jié)果。

      如表2所示,24 h時效,試驗(yàn)效果CG_multi>G_multi>CG72>G72>CMAQ;48 h 時效,試驗(yàn)效果G_multi> CG_multi>CG72≈G72>CMAQ;72 h 時效,試驗(yàn)效果 CG72≈G72>G_multi≈CG_multi>CMAQ。上述結(jié)果表明CMAQ在24 h時效內(nèi)對提高訂正效果的貢獻(xiàn)較大,之后逐漸降低。因此把基于CMAQ和GRAPES的24 h訂正結(jié)果與僅考慮GRAPES的48 h、72 h結(jié)果相結(jié)合,作為最終訂正預(yù)報以提高訂正效果,由此得出CG_hybrid方案,設(shè)置如下(表3)。

      表2 PCA-kNN訓(xùn)練樣本試驗(yàn)結(jié)果

      表3 PCA-kNN CG_hybrid參數(shù)方案設(shè)置

      3 效果評估

      3.1 整體評估

      采用CG_hybrid參數(shù)方案,對廣州市2017年上半年進(jìn)行PCA-kNN PM2.5訂正預(yù)報,把廣州市11個站作為整體進(jìn)行評估,表明PCA-kNN訂正方法能有效提高PM2.5日均值預(yù)報效果(表4)。與CMAQ PM2.5產(chǎn)品相比,第1~3天相關(guān)系數(shù)分別提高20%、15%、29%,均方根誤差分別降低17%、16%、20%,平均偏差更接近0。

      在TS評分方面,隨著PM2.5等級增加,PCA-kNN訂正和CMAQ的TS評分呈下降趨勢(圖 2)。PM2.5等級為一級時(PM2.5≤35 μg/m3),PCA-kNN訂正和CMAQ TS評分相差不大,在二級 (35 μg/m3< PM2.5≤75 μg/m3) 至 三 級(75 μg/m3<PM2.5≤115 μg/m3) 時各時效的 PCA-kNN訂正TS評分明顯高于CMAQ。在PM2.5等級為四級(115 μg/m3<PM2.5≤150 μg/m3)及以上時,兩者TS評分均為0,一方面實(shí)況在四級及以上的天數(shù)少,另一方面PCA-kNN訂正和CMAQ模式對PM2.5重污染過程的預(yù)報能力還有待加強(qiáng)。

      表4 廣州市2017年上半年CMAQ、PCA-kNN訂正PM2.5效果評估

      逐小時評估方面(圖 3),PCA-kNN訂正、CMAQ 1~72 h預(yù)報的相關(guān)系數(shù)分別在0.31~0.79與 0.25~0.55之間,平均偏差分別在-2.5~2.3 μg/m3與-15.3~3.6 μg/m3之間,均方根誤差分別在 16.4~28.1 μg/m3與 21.8~30.4 μg/m3之 間 。1~15 h的PCA-kNN訂正的相關(guān)系數(shù)較CMAQ提高明顯,15 h之后兩者相近,兩者的相關(guān)系數(shù)隨著時效的增長而降低。PCA-kNN訂正1~72 h時效的平均偏差較CMAQ接近0,1~17 h的均方根誤差較CMAQ降低明顯,17 h之后兩者相近。CMAQ均方根誤差呈一定的周期性,夜間高于白天,可能是由于模式對夜間邊界層氣象要素模擬能力有限[34]。

      3.2 分站點(diǎn)評估

      對廣州市11站分別進(jìn)行1~3天時效CMAQ預(yù)報、PCA-kNN訂正的PM2.5日均值預(yù)報效果評估,結(jié)果表明各時效的PCA-kNN訂正效果整體上優(yōu)于CMAQ預(yù)報(圖4)。

      以24 h時效為例,分析如下:(1)平均偏差方面:CMAQ 24 h預(yù)報平均偏差范圍在-6.7~1.9 μg/m3(圖5a),有9個站較實(shí)況偏低,表明CMAQ預(yù)報整體偏低,原因可能是GRAPES-MESO地面風(fēng)速模擬偏大[32,35],但2個站略有偏高,原因可能是CMAQ模式采用的平均源排放清單難以精細(xì)、客觀描述預(yù)報區(qū)域不同尺度污染源強(qiáng)度的時空變化[36],而城區(qū)排放面源對這2個站點(diǎn)實(shí)際排放源有所高估。PCA-kNN訂正平均偏差范圍在-4.2~2.9 μg/m3(圖5b),有6個站較實(shí)況偏低,5個站偏高。從PCA-kNN訂正與CMAQ預(yù)報平均偏差的絕對值之差來看(圖5c),PCA-kNN訂正的平均偏差較CMAQ以降低為主(更接近0)。(2)均方根誤差方面:CMAQ 24 h預(yù)報均方根誤差范圍在14.2~22.0 μg/m3(圖6a),PCA-kNN訂正均方根誤差范圍在12.8~16.8 μg/m3(圖6b),PCA-kNN訂正與CMAQ預(yù)報均方根誤差之差范圍在-6.4~2.2 μg/m3(圖6c),PCA-kNN訂正的均方根誤差較CMAQ以減小為主。(3)相關(guān)系數(shù)方面:CMAQ 24 h預(yù)報相關(guān)系數(shù)范圍在 0.54~0.69(圖 7a),PCA-kNN訂正相關(guān)系數(shù)范圍在0.61~0.79(圖7b),PCA-kNN訂正與CMAQ預(yù)報相關(guān)系數(shù)之差范圍在-0.07~0.24(圖7c),PCA-kNN訂正的相關(guān)系數(shù)較CMAQ以提高為主。Lyu等[20]在評估偏差訂正效果時發(fā)現(xiàn)并非所有地區(qū)的訂正結(jié)果都能優(yōu)于原模式,廣州市11站中有10站相對CMAQ預(yù)報有所改進(jìn)(圖4),僅1353A站的均方根誤差較CMAQ高出2.2 μg/m3,相關(guān)系數(shù)較CMAQ降低0.07,這可能與觀測資料的質(zhì)量有關(guān)。例如1353A站的PM2.5觀測數(shù)據(jù)有效性(有效樣本/總樣本)為98.4%,低于各站平均值(99.2%)。

      3.3 案例分析

      2017年上半年CMAQ預(yù)報、PCA-kNN訂正24 h的PM2.5日均值逐日偏差及相應(yīng)日期的地面平均風(fēng)速、降水量如圖8所示。統(tǒng)計2017年上半年中偏差絕對值大于10 μg/m3的天數(shù),CMAQ預(yù)報、PCA-kNN訂正分別為75、58天,兩者的偏差絕對值同時大于10 μg/m3的情況有29天(其中有17天平均風(fēng)速小于1.5 m/s,有16天降水為0 mm)。以2017年1月3—6日為例,廣州出現(xiàn)一次PM2.5污染過程(表5),其中1月5日PM2.5達(dá)到144.9 μg/m3。1月 5日 20時地面天氣圖(圖 9a)表明廣州受均壓場控制,等壓線稀疏,地面風(fēng)速小,無降水,500 hPa天氣圖(圖9b)表明廣州位于高壓后部,盛行下沉氣流,總體上大氣擴(kuò)散條件不利。從表5看到,整個污染過程中無降水,模式降水量預(yù)報正確;實(shí)際地面風(fēng)速在1.5 m/s以下,但模式預(yù)報風(fēng)速較實(shí)況偏高。CMAQ預(yù)報及PCA-kNN訂正結(jié)果在3—5日較PM2.5實(shí)況均偏小,但PCA-kNN訂正結(jié)果更接近實(shí)況;1月6日CMAQ預(yù)報較實(shí)況偏小,PCA-kNN訂正較實(shí)況偏大。CMAQ預(yù)報持續(xù)偏小原因之一可能是GRAPES-MESO模式的預(yù)報風(fēng)速較實(shí)際風(fēng)速偏大[32,35],而PCA-kNN訂正能基于歷史預(yù)報數(shù)據(jù)與實(shí)況修正CMAQ預(yù)報,從而在1月3—5日偏差相對CMAQ較小,但在1月6日污染過程趨于結(jié)束時,由于歷史數(shù)據(jù)PM2.5濃度高而導(dǎo)致1月6日的訂正預(yù)報偏高。

      表5 2017年1月3—6日廣州市PM2.5污染過程分析

      4 結(jié)論與討論

      基于空氣質(zhì)量模式(CMAQ)預(yù)報產(chǎn)品、中尺度天氣模式(GRAPES-MESO)預(yù)報產(chǎn)品和PM2.5觀測實(shí)況,提出了結(jié)合主成分分析和機(jī)器學(xué)習(xí)算法k近鄰的空氣質(zhì)量模式PM2.5預(yù)報逐日滾動訂正算法(PCA-kNN)。以廣州市11站作為整體評估PM2.5日均值預(yù)報效果,PCA-kNN訂正預(yù)報與CMAQ PM2.5產(chǎn)品相比,在第1~3天預(yù)報時效上相關(guān)系數(shù)分別提高20%、15%、29%,均方根誤差分別降低17%、16%、20%;對廣州市11站分站點(diǎn)評估表明,各時效的PCA-kNN訂正效果整體上優(yōu)于CMAQ預(yù)報。這與前人采用MOS訂正[16]等方法得到的結(jié)論一致。值得注意的是,隨著近年CMAQ模式參數(shù)、排放源數(shù)據(jù)和后處理技術(shù)的不斷改進(jìn)[11],基于常規(guī)統(tǒng)計方法的偏差訂正效果提升有限,本文提出的PCA-kNN可作為一種有效的手段改進(jìn)廣州市空氣質(zhì)量模式PM2.5預(yù)報,反映了應(yīng)用機(jī)器學(xué)習(xí)算法訂正空氣質(zhì)量模式PM2.5預(yù)報的可行性,對其他地區(qū)、其他污染物客觀預(yù)報研究具有借鑒意義。然而,相比文獻(xiàn)[12-13,15]中的訂正效果,從相關(guān)系數(shù)提升或均方根誤差降低比例來看,PCA-kNN方法在廣州市對CMAQ預(yù)報的訂正提升程度較小,其差異可能與研究區(qū)域不同的自然、社會經(jīng)濟(jì)等條件[20]以及被訂正模式的預(yù)報能力有關(guān)[8]。

      模式產(chǎn)品偏差訂正效果通常隨著預(yù)報時效增加而下降[8]??傮w來看,在1~72 h時效內(nèi),PCA-kNN訂正預(yù)報與實(shí)況的相關(guān)系數(shù)與CMAQ預(yù)報相比有所提高,均方根誤差有所減小。PCA-kNN訂正效果在1~24 h時效內(nèi)比較顯著,25 h之后逐漸降低,如何有效提升25 h以上預(yù)報能力值得進(jìn)一步探討。

      廣州市PM2.5污染過程個例分析表明,污染過程中PCA-kNN訂正較CMAQ預(yù)報更接近實(shí)況,能有效提高預(yù)報效果,但PCA-kNN訂正和CMAQ都沒有預(yù)報出此次過程的開始及結(jié)束,反映了訂正效果與模式自身預(yù)報能力有關(guān)[8,12]。另外,本文采用的PCA-kNN方法參數(shù)是基于廣州市2017年1月數(shù)據(jù)提出的,在更大時空范圍內(nèi)進(jìn)行偏差訂正的有效性需要進(jìn)一步研究。

      猜你喜歡
      平均偏差實(shí)況方根
      方根拓展探究
      河北地方性震級量規(guī)函數(shù)與方位角校正值研究1
      FY-3C/VIRR西北太平洋區(qū)域海表溫度精度評估?
      鄉(xiāng)村小學(xué)的愿望與現(xiàn)實(shí)——宜君鄉(xiāng)村教育實(shí)況
      天舟一號貨運(yùn)飛船發(fā)射實(shí)況掠影
      均方根嵌入式容積粒子PHD 多目標(biāo)跟蹤方法
      可愛潮咖們的獨(dú)門彩妝實(shí)況直播
      揭開心算方根之謎
      脛前動脈穿刺可行性及心肺流轉(zhuǎn)下脛前動脈與橈動脈壓力監(jiān)測的一致性研究
      數(shù)學(xué)魔術(shù)
      太仆寺旗| 名山县| 建平县| 贡山| 黑水县| 区。| 剑川县| 宜昌市| 泽州县| 南华县| 肥西县| 威信县| 政和县| 化州市| 龙井市| 苏尼特右旗| 潞城市| 南安市| 宜兰县| 磐石市| 曲麻莱县| 金门县| 雷州市| 太保市| 泾川县| 三穗县| 柳河县| 衢州市| 大足县| 永年县| 新蔡县| 安义县| 阳高县| 襄城县| 巴彦淖尔市| 兴城市| 晋州市| 浮梁县| 元氏县| 灌云县| 金寨县|