鄒思琳 任曉晨,2 王成功 韋駿
時間精度與空間信息對神經(jīng)網(wǎng)絡(luò)模型預(yù)報 PM2.5濃度的影響
鄒思琳1任曉晨1,2王成功1韋駿3,?
1.北京大學物理學院大氣與海洋科學系, 北京 100871; 2.96813部隊, 黃山 245000; 3.中山大學大氣科學學院, 廣州 519082; ?通信作者, E-mail: junwei@pku.edu.cn
以北京市為例, 利用 2015—2018 年空氣質(zhì)量監(jiān)測站臺資料, 通過 BP 神經(jīng)網(wǎng)絡(luò)、LSTM 網(wǎng)絡(luò)及 CNN-LSTM 混合模型等多種模型, 分析時間精度和空間信息對 PM2.5濃度預(yù)報的影響。結(jié)果表明, 神經(jīng)網(wǎng)絡(luò)模型的效果普遍比多元線性回歸模型好; 增加輸入數(shù)據(jù)的時間精度能顯著地提高 PM2.5濃度日均值預(yù)報的準確率; 當輸入數(shù)據(jù)的時間精度從一天提高到 6 小時后, LSTM 模型的平均絕對誤差從 27.39μg/m3降至 20.59μg/m3, 這種效果的提升在顯著變好和顯著變差的天氣情況下更明顯; 華北地區(qū) PM2.5濃度分布有明顯的時空特征, 第一空間模態(tài)為同增同減, 第二空間模態(tài)為南北反向; 北京市 PM2.5濃度與內(nèi)蒙古、河北及天津等地區(qū)前一天的 PM2.5相關(guān)。利用 CNN-LSTM 混合模型學習華北地區(qū) PM2.5的時空信息, 能進一步提高北京市 PM2.5濃度的預(yù)報水平, 使得誤差降低至 17.36 μg/m3。
神經(jīng)網(wǎng)絡(luò); PM2.5預(yù)報; 時間精度; 空間特征
空氣污染物組成復(fù)雜, 來源多樣, 其中細顆粒物(PM2.5)的危害尤為嚴重。這些細顆粒物體積小, 重量輕, 能在空氣中停留更長的時間, 通過呼吸道進入人體, 引發(fā)各種疾病[1?2]。PopeⅢ等[3]的研究表明, 長期環(huán)境中 PM2.5平均濃度每升高 10μg/m3, 會造成 4%~8%的心肺疾病死亡風險??諝庵羞^量的 PM2.5還會引發(fā)灰霾天氣, 降低大氣能見度, 影響人類的生產(chǎn)和生活。還有研究表明, PM2.5和灰霾天氣對天氣過程甚至全球氣候有重要影響[4?6]。因此, 研究 PM2.5的時空分布特征和預(yù)報方法具有重要意義, 并可為政府決策提供科學支持。
目前對 PM2.5的預(yù)報主要有統(tǒng)計模型、模式模擬(化學傳輸模型)和深度學習模型等方法。Fuller等[7]通過 NOx, PM2.5與 PM10的統(tǒng)計關(guān)系, 構(gòu)建預(yù)報倫敦污染物濃度的經(jīng)驗?zāi)P? 為其他城市和地區(qū)PM2.5的預(yù)報提供了思路。Baker 等[8]構(gòu)造一個非線性回歸模型來預(yù)報單來源的 PM2.5濃度。Sun 等[9]對隱馬爾可夫模型(HMM)進行優(yōu)化, 顯著地降低北加州 PM2.5濃度的誤報率。Saide 等[10]優(yōu)化 WRF-Chem模式, 提升預(yù)報城市 PM2.5濃度的穩(wěn)定性?;瘜W傳輸模型主要考慮化學物質(zhì)的來源和傳輸過程, 對PM2.5的預(yù)報不夠直接, 且計算過程復(fù)雜[11], 深度學習方法給 PM2.5預(yù)報帶來新的探索空間。Zhou 等[11]利用集合經(jīng)驗?zāi)B(tài)分解(ensemble empirical mode decomposition, EEMD)和廣義遞歸神經(jīng)網(wǎng)絡(luò)(general regression neural network, GRNN)的深度學習模型, 對西安 PM2.5做了較好的預(yù)報。Liu 等[12]利用自組織長短期記憶(long short-term memory, LSTM)網(wǎng)絡(luò), 探索 PM2.5預(yù)報的更多可能性。Huang 等[13]構(gòu)造一維卷積和 LSTM 的疊加模型, 利用 PM2.5濃度、風速和累計降水量來預(yù)報 PM2.5, 獲得比單一 LSTM模型更好的效果。
PM2.5的預(yù)報模型近年來不斷更新, 目前對PM2.5的預(yù)報能力還有很大的提升空間。尤其是新興的深度學習模型, 前人的研究集中在對神經(jīng)網(wǎng)絡(luò)模型的構(gòu)造和改進上, 忽略了 PM2.5在時間上的強自相關(guān)性以及局地排放和區(qū)域輸送的影響??紤]到PM2.5濃度變化的物理特征, 本文以北京市 PM2.5日均濃度預(yù)報為出發(fā)點, 從兩個方面對深度學習方法進行探究: 1)前期 PM2.5輸入數(shù)據(jù)的時間精度對PM2.5預(yù)報能力的影響; 2)空間 PM2.5濃度信息對單點預(yù)報能力的影響。通過多組常見神經(jīng)網(wǎng)絡(luò)模型的對比, 結(jié)合對物理機制的分析, 進一步開發(fā)深度學習在 PM2.5預(yù)報上的應(yīng)用潛力。
本文選取的空氣質(zhì)量數(shù)據(jù)為 2015 年 1 月 2 日至2018 年 12 月 21 日逐小時 PM2.5濃度數(shù)據(jù), 來自中國環(huán)境監(jiān)測總站的全國城市空氣質(zhì)量實時發(fā)布平臺(http://beijingair.sinaapp.com), 其中北京市 PM2.5濃度值來自該平臺中北京市 12 個觀測站的平均值。為了探究臨近區(qū)域的 PM2.5信息對北京市 PM2.5預(yù)報的作用, 選取該平臺華北地區(qū)(105°—125°E, 32°—43°N) 143 個空氣質(zhì)量測站的同時段逐小時 PM2.5數(shù)據(jù)。由于該區(qū)域測站空間分布不均, 部分站點存在較嚴重的缺測情況, 因此對 PM2.5數(shù)據(jù)進行克里金插值(original Kriging)格點化處理, 空間分辨率為 0.75°×0.75°。
多元線性回歸(multiple linear regression, MLR)方法用于研究一個因變量與多個自變量之間的關(guān)系, 能夠很好地解釋和預(yù)測因變量。本文選擇多元線性回歸作為不同模型對照的基準, 所有在神經(jīng)網(wǎng)絡(luò)中作為輸入的變量在其中表示為一個自變量。
雖然 PM2.5濃度與相對濕度和風速等氣象因素以及 SO2和 NOx等污染物濃度具有相關(guān)性, 但不是線性相關(guān)。因此, 具有較強非線性擬合能力的神經(jīng)網(wǎng)絡(luò)在PM2.5濃度預(yù)報上有更好的表現(xiàn)[11,13?14]。BP神經(jīng)網(wǎng)絡(luò)是基于誤差反向傳播算法(error back pro-pagation, BP)的多層感知器, 第一層為輸入層, 中間為隱含層, 最后是輸出層, 每一層的每個神經(jīng)元與下一層的所有神經(jīng)元連接, 形成全連接的網(wǎng)絡(luò)結(jié)構(gòu), 這種網(wǎng)絡(luò)也叫全連接神經(jīng)網(wǎng)絡(luò)(fully-connected neural networks, FC)。經(jīng)過各種參數(shù)調(diào)整和嘗試, 本文中的 BP 神經(jīng)網(wǎng)絡(luò)采用 3 個隱含層的全連接神經(jīng)網(wǎng)絡(luò), 其中第一層神經(jīng)元為 1000 個, 第二層神經(jīng)元為 500 個, 第三層神經(jīng)元為 20 個, 神經(jīng)網(wǎng)絡(luò)的激活函數(shù)為 ReLu 函數(shù)。
作為一個連續(xù)變化的時間序列, PM2.5序列中后一時刻的信息與前面時刻緊密相關(guān), 此時利用遞歸神經(jīng)網(wǎng)絡(luò)(RNN)就能將上一時刻的信息連接到當前時刻的學習過程中, 從而達到更好的擬合和預(yù)測效果。LSTM (long short-term memory)網(wǎng)絡(luò)是在傳統(tǒng)RNN 基礎(chǔ)上改進的深度學習網(wǎng)絡(luò), 由 Hochreiter 等[15]于 1997 年提出。它能夠連接更長時間間隔的信息, 常??梢赃_到比傳統(tǒng) RNN (如 Vanilla RNN)更好的效果。
本研究中 LSTM 模型采用雙層 LSTM 的結(jié)構(gòu), 第一層神經(jīng)元結(jié)點數(shù)為 1000, 第二層神經(jīng)元結(jié)點數(shù)為 500, 每層之后添加一個全連接層(FC 層), 其神經(jīng)元個數(shù)分別為 20 和 1。為了與 BP 神經(jīng)網(wǎng)絡(luò)進行比較, 激活函數(shù)和神經(jīng)元結(jié)點個數(shù)基本上與 BP 模型一致。
為了探究臨近區(qū)域信息對單點 PM2.5預(yù)報的影響, 本文構(gòu)造三維卷積與 LSTM 的混合預(yù)報模型。將區(qū)域 PM2.5的時間序列看做三維圖像, 首先利用卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network, CNN)提取信息, 然后將提取出的信息轉(zhuǎn)化為與時間對應(yīng)的向量, 再利用 LSTM 網(wǎng)絡(luò)進行單點 PM2.5預(yù)報。
模型結(jié)構(gòu)如圖 1 所示, 其中批標準化(batch normalization, BN)可以加速模型收斂, 池化(Max Pooling)層通過降采樣, 將固定區(qū)域內(nèi)的最大值提取出來代表該區(qū)域信息, 從而降低數(shù)據(jù)維度, 減少計算消耗, 參數(shù)設(shè)置如下。
卷積層: 卷積核大小為 3×3, 第一層三維卷積(Conv3D)的卷積核數(shù)目為 100, 第二層 Conv3D 的卷積核數(shù)目為 50, 第三層 Conv3D 的卷積核數(shù)目為 5。
池化層: 第一層 Max Pooling 的池化區(qū)域大小為 3×3×3, 第二層池化區(qū)域的大小為 2×3×3。
LSTM 層: 第一層 LSTM 的神經(jīng)元數(shù)目為 100, 第二層 LSTM 的神經(jīng)元數(shù)目為 50。
FC 層: 神經(jīng)元數(shù)目為 50。
激活函數(shù): sigmoid函數(shù)。
本文中所有神經(jīng)網(wǎng)絡(luò)模型均選擇 RMSPROP 作為優(yōu)化器, 初始學習率為 0.001, 迭代次數(shù)為 64, 批次大小為 32。
為了直觀地評價不同模型對 PM2.5濃度的擬合和預(yù)報能力, 選取絕對平均誤差(MAE)、均方根誤差(RMSE)、IA (index of agreement)和 MAPE (mean absolute percentage error)作為評價指標, 計算公式如下:
圖 2(a)是 2015—2018 年北京市 PM2.5濃度日變化序列??梢钥闯? PM2.5濃度夏季最低, 冬、春兩季較高, 與徐敬等[16]的研究結(jié)果一致。從圖 2(b)可以看出, PM2.5濃度日變化的自相關(guān)性較強, 即PM2.5濃度的日均值與前期 PM2.5濃度值密切相關(guān)。根據(jù)李梓銘等[17]的研究, 北京城區(qū) PM2.5濃度存在顯著的“星期效應(yīng)”, 即存在一周左右的顯著周期, 因此本文中 PM2.5的預(yù)報選用前 6 天的數(shù)據(jù)作為輸入數(shù)據(jù), 用于捕捉天氣尺度的 PM2.5濃度變化。后期的實驗結(jié)果表明, 使用前期 1~14 天不同的天數(shù)來預(yù)報 PM2.5, 得到的結(jié)果相差不大, MAE 大約相差2μg/m3。若僅使用前一天的日均值數(shù)據(jù), 則 PM2.5濃度的預(yù)報能力相對較差。本文的實驗結(jié)論在使用1~14 天不同天數(shù)預(yù)報的情況下都成立。
首先, 利用北京市 PM2.5濃度日均值數(shù)據(jù)進行不同模型間的橫向比較, 利用前 6 天的日均值數(shù)據(jù)預(yù)報第 7 天的 PM2.5日均值。模型中統(tǒng)一采用前 3年的數(shù)據(jù)(201501~201712)作為訓(xùn)練集, 最后一年的數(shù)據(jù)(201801~201812)作為測試集, 訓(xùn)練數(shù)據(jù)中的30%作為驗證集, 得到的結(jié)果如圖 3 所示。多元線性回歸得到的 MAE, RMSE 和 MAPE 值都較高, IA值較低, 體現(xiàn)出比神經(jīng)網(wǎng)絡(luò)模型更差的擬合和預(yù)報能力。LSTM 模型的表現(xiàn)相對更好。盡管 3 種模型的結(jié)果存在一定的差距, 但這種差距不明顯, 主要是由訓(xùn)練和測試數(shù)據(jù)集較小以及 PM2.5濃度日均值較強的自相關(guān)性引起的。
PM2.5濃度的變化存在多個周期疊加的現(xiàn)象, 提升輸入數(shù)據(jù)的精度不僅能反映更短周期的變化, 還能提供短時間內(nèi) PM2.5濃度變化的信息。為此, 將輸入數(shù)據(jù)由原來的 6 天 PM2.5濃度日均值更換為 6天的 6 小時 PM2.5濃度平均值, 依然預(yù)報第 7 天的PM2.5濃度日均值, 結(jié)果如圖 4 所示。與輸入數(shù)據(jù)為日均值的預(yù)報結(jié)果相比, 無論是多元線性回歸, BP神經(jīng)網(wǎng)絡(luò), 還是 LSTM 模型, 對 PM2.5濃度的預(yù)報準確率都明顯地提高。LSTM 模型明顯優(yōu)于其他兩個模型, 其 MAE 和 RMSE 值更低, 擬合能力更強。
為了分析高時間精度的數(shù)據(jù)是如何影響 PM2.5預(yù)報的, 我們對訓(xùn)練集中的 PM2.5濃度逐小時數(shù)據(jù)進行小波分析, 結(jié)果見圖 5??梢钥闯? PM2.5時間序列有 16 小時至 256 小時(10 天)的顯著周期。盡管日均值的數(shù)據(jù)能夠反映 48 小時以上周期的變化, 但不含 48 小時以下的周期, 尤其是 24 小時(日變化)及以下周期的信息, 而這些信息是 PM2.5濃度變化周期的重要部分。根據(jù)趙晨曦等[19]的研究, PM2.5濃度日變化呈雙峰式, 峰值相差約為 10 小時。因此, 提高時間精度能增加 PM2.5濃度的日變化信息, 對未來 PM2.5濃度日均值的預(yù)報有重要影響。我們的實驗結(jié)果表明, 如果輸入數(shù)據(jù)的時間精度從日平均提高到 12 小時平均, 就能夠顯著地提高原模型的預(yù)報能力。
除包含更多的 PM2.5濃度短周期信息外, 提高時間精度還能更好地捕捉前期 PM2.5濃度的顯著變化, 從而提升預(yù)報能力。為了進一步說明這個問題, 我們比較日均值 LSTM 模型和 6 小時平均值 LSTM模型對 PM2.5濃度當天相對于前一天增量的預(yù)報能力, 得到圖 6 的結(jié)果。無論是對顯著變好的天氣(增量小于?25μg/m3), 還是對顯著變壞的天氣(增量大于 25μg/m3), 日均值模型預(yù)報的增量都在?25~25μg/m3范圍內(nèi)波動, 即日均值模型往往只利用前一天的觀測值進行預(yù)報, 沒有捕捉到空氣質(zhì)量顯著變化的信息。6 小時平均值模型對顯著變好天氣和顯著變壞天氣的預(yù)報有明顯更好的效果, 當 PM2.5濃度明顯降低時, 預(yù)報值同樣顯著地降低; 當 PM2.5濃度明顯升高時, 預(yù)報值也有同樣的變化趨勢, 觀測增量?預(yù)報增量基本上沿=對角線分布。
為了更好地闡釋 6 小時平均值 LSTM 模型對變好天氣和變差天氣更強預(yù)報能力的現(xiàn)實意義, 根據(jù)中華人民共和國國家環(huán)境保護標準, 將本文測試集中 PM2.5濃度劃分為優(yōu)(0~35μg/m3)、良(36~75μg/m3)、輕度污染(76~115μg/m3)、中度污染(116~ 150μg/m3)和重度污染(150μg/m3以上) 5 個等級。圖 7 是 PM2.5濃度不同增量下各污染等級的占比情況, 可以看出, 增量25μg/m3時幾乎全部是優(yōu)良天氣, 增量>25μg/m3時大部分是污染天氣。對全部數(shù)據(jù)而言, 這兩者組成約 1/4 的優(yōu)良天氣和大部分污染天氣。6 小時平均值模型對這兩種情況有更好的預(yù)報能力, 說明該模型部分地提升了對優(yōu)良天氣的預(yù)報能力, 顯著地提升了對污染天氣的預(yù)報能力。鑒于公眾對污染天氣的關(guān)注, 該模型剛好滿足PM2.5濃度預(yù)報的現(xiàn)實需求。圖 8 對比不同 PM2.5濃度等級下日均值 LSTM 模型和 6 小時平均值 LSTM 模型的 MAE, 清晰地表明 6 小時平均值模型在優(yōu)、中度污染和重度污染這 3 個 PM2.5濃度等級下預(yù)報能力的提高。
為了研究空間 PM2.5濃度信息對單點 PM2.5濃度預(yù)報的影響, 選取華北地區(qū)為研究對象, 將站點濃度進行克里金插值后, 對訓(xùn)練集和驗證集(2015—2017 年數(shù)據(jù))在該區(qū)域進行經(jīng)驗正交函數(shù)(em-pirical orthogonal functions, EOF)分析, 結(jié)果見圖9??梢钥吹? 華北地區(qū) PM2.5濃度分布的主要模態(tài)為同增同減模態(tài), 其解釋方差為 50.2%。通過 PC1序列的變化可以看到 PM2.5濃度明顯的季節(jié)變化: 冬季一致增多, 夏季一致減少。PM2.5濃度的第二模態(tài)則是南北反向變化的模態(tài), 其解釋方差為 9%。從 PC2 序列中可以看到, PM2.5在冬季常常呈現(xiàn)北少南多的模態(tài), 但是這種南北反向分布沒有明顯的季節(jié)變化。姚雪峰等[20]發(fā)現(xiàn), 我國 PM2.5濃度時空分布的第一模態(tài)(同增同減模態(tài))主要受平均排放場和環(huán)流場以及大地形的影響, 而第二模態(tài)(南北反向分布模態(tài))主要與冷空氣活動影響, 與污染物輸送有關(guān)。
既然在空間上鄰近區(qū)域之間的 PM2.5濃度相互影響, 那么空間 PM2.5濃度信息對單點 PM2.5濃度預(yù)報有何影響呢?為解答這個疑問, 我們利用 CNN-LSTM 模型學習空間信息, 并進行單點預(yù)報。為了便于比較, 模型輸入為華北地區(qū)前 6 天每 6 小時PM2.5濃度平均值, 預(yù)報數(shù)據(jù)仍然是北京市 PM2.5濃度日均值。表 1 對比 6 小時平均值 LSTM 模型與 6小時平均值 CNN-LSTM 模型預(yù)報結(jié)果, 從可以看到, 前面表現(xiàn)最好的 6 小時平均值 LSTM 模型在各個指標上都差于 CNN-LSTM 模型, 說明提取空間PM2.5濃度信息對單站 PM2.5濃度的預(yù)報有明顯的改善作用。為了進一步比較 CNN-LSTM 模型與 LSTM模型的預(yù)報效果, 同樣對比各個 PM2.5濃度等級的MAE。從圖 10 可看出, 與 LSTM 模型相比, CNN-LSTM 模型顯著地提升了優(yōu)和重度污染 PM2.5濃度等級下的預(yù)報能力, 對其他天氣情況下的預(yù)報能力沒有提升。
那么, 增加空間 PM2.5濃度信息為何能提升優(yōu)和重度污染時的預(yù)報效果呢?為了理解 CNN-LSTM模型預(yù)報效果更好的物理機制, 選擇測試集中北京市 PM2.5濃度日均值分別為低(優(yōu))、中(良、輕度污染)、高(中度和重度污染)的時刻, 對應(yīng)每一個類別, 對它們做北京市 PM2.5濃度與周邊區(qū)域 PM2.5濃度的時間滯后相關(guān)性分析, 得到的結(jié)果如圖 11 所示。
表1 6 小時平均值 LSTM 模型與 CNN-LSTM 模型比較
當北京市 PM2.5濃度日均值較低時, 與前 6 小時北京西北部地區(qū)的 PM2.5濃度有相對強的相關(guān)性, 與前 12 小時更遠的西北地區(qū)有相關(guān)性, 說明此時PM2.5濃度的低值很可能是由北風造成。這種情況的典型例子是冬季冷空氣南下對北京市 PM2.5的清除過程[20]。研究表明, 包括 PM2.5在內(nèi)的污染物濃度與風速明顯負相關(guān)[19, 21?23], CNN-LSTM 模型可能就是捕捉到強北風天氣下 PM2.5濃度的空間變化過程, 從而提升對優(yōu)良天氣的預(yù)報能力。然而, 前 24小時的相關(guān)性在整個區(qū)域非常弱, 從側(cè)面驗證了提高時間精度可以捕捉更多的信息, 從而提高預(yù)報能力。
當北京市 PM2.5濃度日均值較高時, 與前 6 小時的天津地區(qū)及河北東北部地區(qū)(唐山等地)有強的相關(guān)性, 與前 12 小時和前 24 小時的天津地區(qū)及河北中南部地區(qū)(廊坊等地)有顯著的相關(guān)性。風場等氣象條件不僅影響大范圍內(nèi)的 PM2.5輸送, 還影響局地 PM2.5的累積和擴散[24]。因此, 上述空間相關(guān)性可能是由南風的 PM2.5輸送導(dǎo)致, 也可能是由天氣系統(tǒng)的移動導(dǎo)致, 如冬季弱冷空氣導(dǎo)致的污染物累積[20]。無論是哪種原因, 這種高度相關(guān)性能夠通過 CNN-LSTM 模型挖掘出來, 從而提升對重度污染天氣的預(yù)報能力。
對于北京市中等 PM2.5濃度的情況, 北京市與周邊地區(qū)的時間滯后相關(guān)性很差, 主要表現(xiàn)為顯著的自相關(guān)。這種情況下, 前期的空間信息不會給北京市 PM2.5濃度的預(yù)報帶來額外的影響, 因此 CNN-LSTM 模型對北京市中等 PM2.5濃度的預(yù)報效果并沒有更好。
本文利用深度學習方法, 分析提高輸入數(shù)據(jù)的時間精度和增加空間 PM2.5濃度信息對北京市 PM2.5濃度日均值預(yù)報的影響, 并對這種影響可能的物理機制進行初步的分析, 得到以下結(jié)論。
1)對北京市 PM2.5濃度日均值的預(yù)報, 神經(jīng)網(wǎng)絡(luò)模型普遍比多元線性回歸模型效果好, LSTM 模型表現(xiàn)最佳。
2)與輸入數(shù)據(jù)為 PM2.5濃度日均值相比, 采用PM2.5濃度 6 小時平均值作為輸入數(shù)據(jù)能顯著地提高 PM2.5濃度日均值預(yù)報水平。原因主要是高精度的時間數(shù)據(jù)包含 24 小時以下周期的信息, 使得模型能更好地學習臨近時刻 PM2.5的顯著增減變化, 從而提高對顯著變好和顯著變差天氣的預(yù)報能力。
3)華北地區(qū) PM2.5濃度的時空分布有明顯的特征: 第一模態(tài)為同增同減, 其時間序列體現(xiàn) PM2.5濃度冬高夏低的季節(jié)變化; 第二模態(tài)為南北反向。
4)利用華北地區(qū) PM2.5濃度信息作為輸入, 采用 CNN-LSTM 混合模型, 能夠提升北京市 PM2.5濃度日均值的預(yù)報水平, 且主要提高優(yōu)和重度污染PM2.5濃度等級下的預(yù)報效果。優(yōu)和重度污染 PM2.5濃度等級下, 北京市 PM2.5濃度與周邊地區(qū) PM2.5濃度有較強的時間滯后相關(guān)性, CNN-LSTM 模型可以通過提取這種相關(guān)特征來提升預(yù)報能力。
最后, 將本文結(jié)果與前人的工作進行對比。由于地區(qū)、數(shù)據(jù)和模型構(gòu)建等方面的不同, 對比結(jié)果僅作為參考。陳寧等[25]也考慮到空間因素對 PM2.5濃度預(yù)報的影響, 建立了北京市多基站協(xié)同訓(xùn)練的神經(jīng)網(wǎng)絡(luò)模型來預(yù)報 PM2.5濃度, 并加入交通和土地等信息, 模型最終的 MAE 為 28.309μg/m3。劉杰等[26]增加神經(jīng)網(wǎng)絡(luò)模型的輸入因子, 包括氣象要素、其他污染物濃度和周期因素, 模型最終的 MAE為 27.6μg/m3(BP)和 26.2μg/m3(支持向量機)。Zhou等[11]利用 EEMD-GRNN 模型預(yù)報西安 PM2.5濃度日均值的 MAE 為 19.80μg/m3。當然, 臨近預(yù)報(如逐小時預(yù)報)會有更好的結(jié)果, 如 Huang 等[13]用一維卷積與 LSTM 的混合模型來預(yù)報北京市逐小時PM2.5濃度的 MAE 為 14.63μg/m3。此外, 對污染物較少地區(qū)的 PM2.5濃度預(yù)報也會更加準確。本文CNN-LSTM 模型最終的 MAE 為 17.36μg/m3, 這在PM2.5濃度日均值預(yù)報中比較有競爭力。
總之, 本文提出的提高時間精度和增加空間信息的方法, 可以明顯地提高北京市 PM2.5濃度日均值的預(yù)報能力, 預(yù)報水平相對于前人也有一定程度的提升。本文僅利用幾個典型的統(tǒng)計和深度學習模型進行初步的探討, 在未來的研究中需要采用更合理的模型來提升PM2.5濃度的預(yù)報能力。
[1] He K, Yang F, Ma Y, et al. The characteristics of PM2.5in Beijing, China. Atmospheric Environment, 2001, 35(29): 4959?4970
[2] 楊新興, 馮麗華, 尉鵬. 大氣顆粒物 PM2.5 及其危害. 前沿科學, 2012, 6(1): 22?31
[3] Pope Ⅲ C A, Burnett R T, Thun M J, et al. Lung cancer, cardiopulmonary mortality, and long-term ex-posure to fine particulate air pollution. JAMA, 2002, 287(9): 1132?1141
[4] Sun Y, Zhuang G, Tang A, et al. Chemical character-istics of PM2.5and PM10in haze-fog episodes in Bei-jing. Environmental Science & Technology, 2006, 40 (10): 3148?3155
[5] World Health Organization. Air Pollution, Climate and Health [EB/OL]. (2016?02) [2019?03?24]. https:// www.who.int/sustainable-develoPMent/AirPollution_ Climate_Health_Factsheet.pdf
[6] Menon S, Hansen J, Nazarenko L, et al. Climate effects of black carbon aerosols in China and India. Science, 2002, 297: 2250?2253
[7] Fuller G W, Carslaw D C, Lodge H W. An empirical approach for the prediction of daily mean PM10con-centrations. Atmospheric Environment, 2002, 36(9): 1431?1441
[8] Baker K R, Foley K M. A nonlinear regression model estimating single source concentrations of primary and secondarily formed PM2.5. Atmospheric Environ-ment, 2011, 45(22): 3758?3767
[9] Sun W, Zhang H, Palazoglu A, et al. Prediction of 24-hour-average PM2.5concentrations using a hidden Markov model with different emission distributions in Northern California. Science of the Total Environment, 2013, 443: 93?103
[10] Saide P E, Carmichael G R, Spak S N, et al. Fore-casting urbanPM10and PM2.5pollution episodes in very stable nocturnal conditions and complex terrain using WRF-Chem CO tracer model. Atmospheric En-vironment, 2011, 45(16): 2769?2780
[11] Zhou Q, Jiang H, Wang J, et al. A hybrid model for PM2.5forecasting based on ensemble empirical mode decomposition and a general regression neural net-work. Science of the Total Environment, 2014, 496: 264?274
[12] Liu X, Liu Q, Zou Y, et al. A self-organizing LSTM-based approach to PM2.5forecast // International Con-ference on Cloud Computing and Security. Cham: Springer, 2018: 683?693
[13] Huang C J, Kuo P H. A deep CNN-LSTM model for particulate matter (PM2.5) forecasting in smart cities. Sensors, 2018, 18(7): doi: 10.3390/s18072220
[14] Chaloulakou A, Grivas G, Spyrellis N. Neural net-work and multiple regression models forPM10predic-tion in Athens: a comparative assessment. Journal of the Air & Waste Management Association, 2003, 53 (10): 1183?1190
[15] Hochreiter S, Schmidhuber J. Long short-term me-mory. Neural Computation, 1997, 9(8): 1735?1780
[16] 徐敬, 丁國安, 顏鵬, 等. 北京地區(qū) PM2.5的成分特征及來源分析. 應(yīng)用氣象學報, 2007, 18(5): 645?654
[17] 李梓銘, 孫兆彬, 邵勰, 等. 北京城區(qū) PM2.5不同時間尺度周期性研究. 中國環(huán)境科學, 2017, 37(2): 407?415
[18] Bartlett M S. On the theoretical specification and sampling properties of autocorrelated time-series. Supplement to the Journal of the Royal Statistical Society, 1946, 8(1): 27?41
[19] 趙晨曦, 王云琦, 王玉杰, 等. 北京地區(qū)冬春 PM2.5和 PM10污染水平時空分布及其與氣象條件的關(guān)系. 環(huán)境科學, 2014, 35(2): 418?427
[20] 姚雪峰, 葛寶珠, 鄭海濤, 等. 基于多元數(shù)據(jù)分析的我國 PM2.5濃度及其主控因子的時空分布特征研究. 氣候與環(huán)境研究, 2018, 23(5): 596?606
[21] Chen Y, Schleicher N, Fricker M, et al. Long-term variation of black carbon and PM2.5in Beijing, China with respect to meteorological conditions and govern-mental measures. Environmental Pollution, 2016, 212: 269?278
[22] Huang F, Li X, Wang C, et al. PM2.5spatiotemporal variations and the relationship with meteorological factors during 2013?2014 in Beijing, China. PloS One, 2015, 10(11): e0141642
[23] 張朝能, 王夢華, 胡振丹, 等. 昆明市 PM2.5濃度時空變化特征及其與氣象條件的關(guān)系. 云南大學學報(自然科學版), 2016, 38(1): 90?98
[24] Li X, Zhang Q, Zhang Y, et al. Source contributions of urban PM2.5in the Beijing-Tianjin-Hebei region: changes between 2006 and 2013 and relative impacts of emissions and meteorology. Atmospheric Environ-ment, 2015, 123: 229?239
[25] 陳寧, 毛善君, 李德龍, 等. 多基站協(xié)同訓(xùn)練神經(jīng)網(wǎng)絡(luò)的 PM2.5預(yù)測模型. 測繪科學, 2018, 43(7): 87? 93
[26] 劉杰, 楊鵬, 呂文生, 等. 基于氣象因素的 PM2.5質(zhì)量濃度預(yù)測模型. 山東大學學報(工學版), 2014, 45(6): 76?83
Impacts of Temporal Resolution and Spatial Information on Neural-Network-Based PM2.5Prediction Model
ZOU Silin1, REN Xiaochen1,2, WANG Chenggong1,WEI Jun3,?
1. Department of Atmospheric and Oceanic Sciences, School of Physics, Peking University, Beijing 100871; 2. 96813 PLA Troops, Huangshan 245000; 3. School of Atmospheric Sciences, Sun Yat-Sen University, Guangzhou 519082; ?Corresponding author, E-mail: junwei@pku.edu.cn
Taking Beijing as an example and using the data of air quality monitoring stations from 2015 to 2018, the impacts of temporal resolution and spatial information on the PM2.5concentration prediction were analyzed by a BP neural network, an LSTM network, and a CNN-LSTM hybrid model. The results show that neural network models are generally better than the multi-linear regression model. Increasing the temporal resolution of the input data can significantly improve the accuracy of the predicted daily average PM2.5concentration. When the temporal resolution of the input data increases from one day to 6 hours, the mean absolute error of the LSTM model reduces from 27.39 μg/m3to 20.59 μg/m3. This improvement is more obvious when the weather is significantly getting better or getting worse. The distribution of PM2.5concentration in North China has distinct spatial and temporal characteristics. The first spatial mode is a uniformly increasing or decreasing mode, and the second one is a north/south dipole mode. The analysis shows that the concentration of PM2.5in Beijing is related to the PM2.5in Inner Mongolia, Hebei, and Tianjin of the previous day. The CNN-LSTM hybrid model, trained with the spatial-temporal information of PM2.5in North China, can further improve the predictability of PM2.5in Beijing. It further reduces the mean absolute error to 17.36 μg/m3.
neural networks; PM2.5prediction; temporal resolution; spatial characteristics
10.13209/j.0479-8023.2020.012
國家自然科學基金(41476008)和廣西壯族自治區(qū)特聘專家專項經(jīng)費(2018B08)資助
2019?05?08;
2019?08?10