• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于長短期記憶神經(jīng)網(wǎng)絡(luò)模型的空氣質(zhì)量預(yù)測

      2020-03-27 12:18:26張冬雯趙琪許云峰劉濱
      河北科技大學(xué)學(xué)報 2020年1期
      關(guān)鍵詞:回歸模型多元線性回歸空氣質(zhì)量

      張冬雯 趙琪 許云峰 劉濱

      摘 要:隨著城市化和工業(yè)化的快速發(fā)展,空氣污染問題日益突出,空氣質(zhì)量預(yù)測顯得尤為重要。當(dāng)前一些有代表性的研究對空氣質(zhì)量進行實時監(jiān)測和預(yù)報,例如周廣強等采用數(shù)值預(yù)報的方法對中國東部地區(qū)的空氣質(zhì)量進行分析,但其實驗結(jié)果表明該方法難以預(yù)測非常重的污染;SANKAR等使用多元線性回歸對空氣質(zhì)量進行預(yù)測,但其實驗結(jié)果表明線性模型預(yù)測精度低、效率慢;PREZ等使用統(tǒng)計方法對空氣質(zhì)量進行預(yù)測,實驗結(jié)果證明統(tǒng)計方法的預(yù)測精度比較低;WANG等采用改進的BP神經(jīng)網(wǎng)絡(luò)建立了空氣質(zhì)量指數(shù)的預(yù)測模型,其實驗驗證了BP神經(jīng)網(wǎng)絡(luò)收斂速度慢、容易陷入局部最優(yōu)解的問題;YANG等利用相鄰網(wǎng)格的空氣質(zhì)量濃度效應(yīng),建立了基于隨機森林的PM2.5濃度預(yù)測模型,通過實驗過程證明網(wǎng)格劃分程序削弱了后續(xù)空氣質(zhì)量分析的質(zhì)量和效率。這些方法都難以從時間角度建模,其中預(yù)測精度低是比較重要的問題。因為預(yù)測精度低可能會導(dǎo)致空氣質(zhì)量預(yù)測結(jié)果出現(xiàn)較大的誤差。

      針對空氣質(zhì)量研究中預(yù)測精度低的問題,提出了基于長短期記憶單元(long short-term memory,LSTM)的神經(jīng)網(wǎng)絡(luò)模型。該模型使用MAPE,RMSE,R,IA和MAE等指標(biāo)來檢測LSTM神經(jīng)網(wǎng)絡(luò)與對比模型的預(yù)測性能。由于Delhi和Houston是空氣污染程度比較嚴(yán)重的城市,所以使用的實驗數(shù)據(jù)集來自Delhi的Punjabi Bagh監(jiān)測站2014—2016年的空氣質(zhì)量數(shù)據(jù)和Houston的Harris County監(jiān)測站2010—2016年的空氣質(zhì)量數(shù)據(jù)。

      LSTM神經(jīng)網(wǎng)絡(luò)與多元線性回歸和回歸模型(SVR)的比較結(jié)果表明,LSTM神經(jīng)網(wǎng)絡(luò)適應(yīng)多個變量或多輸入的時間序列預(yù)測問題,LSTM神經(jīng)網(wǎng)絡(luò)具有預(yù)測精度高、速度快和較強的魯棒性等優(yōu)點。

      關(guān)鍵詞:計算機神經(jīng)網(wǎng)絡(luò);空氣質(zhì)量;長短期記憶單元;深度學(xué)習(xí);多元線性回歸;回歸模型

      中圖分類號:TP389;O175.8 ? 文獻標(biāo)識碼:A ? doi:10.7535/hbkd.2020yx01008

      Abstract:With the rapid development of urbanization and industrialization, the problem of air pollution has become increas-ingly prominent, and air quality prediction is particularly important. Some representative studies currently monitor and forecast air quality in real time. For example, ZHOU Guangqiang et al. Used numerical prediction to analyze air quality in eastern China. However, experimental results show that this method is difficult to predict and is very important. SANKAR et al. Used multiple linear regression to predict air quality, but the experimental results showed that the linear model had low prediction accuracy and slow efficiency;PREZ et al. Used statistical methods to predict air quality, and the experimental results proved the prediction accuracy of the statistical method relatively low; WANG et al. Used an improved BP neural network to establish a prediction model for the air quality index, and their experiments verified that the BP neural network has a slow convergence rate and is prone to fall into the local optimal solution problem; YANG et al. Air quality concentration effect, a PM2.5 concentration prediction model based on random forests was established, and the empirical process proved that the meshing program weakened the quality and efficiency of subsequent air quality analysis; these methods are difficult to model from a time perspective, and the prediction accuracy is low is a more important issue. Because low prediction accuracy may lead to large errors in air quality prediction results.

      In this paper, a neural network model based on long -term memory (LSTM) is proposed to solve the problem of low prediction accuracy in air quality research.MAPE, RMSE, R, IA and MAE were used to test the predictive performance of LSTM neural network and the comparison model.Since Delhi and Houston are cities with high levels of air pollution, the experimental data sets used in this paper were from the air quality data of Punjabi Bagh monitoring station in Delhi from 2014 to 2016 and the air quality data of Harris County monitoring station in Houston from 2010 to 2016.

      RNN是一種非常強大的算法,可以對數(shù)據(jù)進行分類、聚類和預(yù)測,特別是時間序列和文本。RNN可以看作是一個在體系結(jié)構(gòu)中添加了循環(huán)的MLP網(wǎng)絡(luò)。在圖1中,可以看到有一個輸入層(包含x1,x2等節(jié)點)、一個隱藏層(包含h1,h2等節(jié)點)和一個輸出層(包含y1,y2等節(jié)點),這類似于MLP體系結(jié)構(gòu)。不同之處在于隱藏層的節(jié)點是相互連接的,在普通RNN中,節(jié)點按一個方向連接,這意味著h2依賴于h1,h3依賴于h2。隱藏層中的節(jié)點由隱藏層中的前一個節(jié)點決定[19]。

      RNN公式可表示為ht=σ(wxhxt+whhht-1+bh),(1)式中:wxh是輸入到隱層的矩陣參數(shù);whh是隱層到隱層的矩陣參數(shù); bh為隱層的偏置向量(bias)參數(shù);σ可以為Sigmoid,tanh或者ReLU函數(shù)。

      2.2 長短期記憶網(wǎng)絡(luò)(LSTM,long short-term memory)

      RNN神經(jīng)網(wǎng)絡(luò)在處理長時間序列時容易產(chǎn)生爆炸梯度[20]問題,其正確性往往較差。為了解決這一問題,LSTM首先被HOCHREITER等[21]引入,并成為一種成功的架構(gòu)。LSTM神經(jīng)網(wǎng)絡(luò)是RNN神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的一種變體,其主要思想是引入一種自適應(yīng)門控機制,其決定了LSTM單元保持先前狀態(tài)的程度,并記住當(dāng)前數(shù)據(jù)輸入的提取特征。

      3 實驗數(shù)據(jù)與度量標(biāo)準(zhǔn)

      3.1 數(shù)據(jù)的獲取

      實驗數(shù)據(jù)分別選取了Delhi的Punjabi Bagh監(jiān)測站自2014—2016年的空氣質(zhì)量數(shù)據(jù)和Houston的Harris County監(jiān)測站自2010—2016年的空氣質(zhì)量數(shù)據(jù)。數(shù)據(jù)分別來源于印度中央污染控制委員會(CPCB)[25](數(shù)據(jù)集鏈接:https://www3.epa.gov/airquality/cleanair.html)和美利堅合眾國環(huán)境保護局(EPA)[26](數(shù)據(jù)集鏈接:http://cpcb.nic.in/)。其中Delhi的空氣污染物包括NO2,CO,O3和PM10;Houston的空氣污染物包括NO2,CO,O3,PM10和SO2。印度和美國的空氣質(zhì)量(AQI)的規(guī)定標(biāo)準(zhǔn)[11]分別列于表2和表3;表4和表5分別給出Delhi和Houston的5條空氣質(zhì)量數(shù)據(jù)樣本。

      3.2 空氣質(zhì)量數(shù)據(jù)的相關(guān)系數(shù)

      本實驗使用統(tǒng)計學(xué)中的皮爾森相關(guān)系數(shù)(pearson correlation coefficient,又稱作PCCs或PPMCC,用R表示),分別在Houston和Delhi數(shù)據(jù)集上對AQI與各參數(shù)進行相關(guān)性分析,相關(guān)系數(shù)的絕對值越大,則表明X與Y相關(guān)度越高,如表6和表7所示。

      為評價各回歸模型的性能,選取了平均絕對誤差(MAE)、平均絕對百分誤差(MAPE)、相關(guān)系數(shù)(R)、均方根誤差(RMSE)和一致性(IA)等統(tǒng)計指標(biāo),各指標(biāo)皆由式(7)-式(12)給出。

      1)MSE(mean squared error,均方誤差)

      均方誤差是指參數(shù)的估計值與參數(shù)的真實值之差的平方的期望。MSE可以評價數(shù)據(jù)的變化程度,MSE越小,說明模型的擬合實驗數(shù)據(jù)能力越強。SMSE=1n∑nk=1(tk-yk)2 。(7) ?2) RMSE(root mean square error,均方根誤差)

      均方根誤差是用來衡量觀測值與真值之間的偏差。SRMSE=1n∑nk=1(tk-yk)2 。(8) ?3) MAE(mean absolute error,平均絕對誤差)

      平均絕對誤差能更好地反映預(yù)測值誤差的實際情況。SMAE=1n∑nk=1|tk-yk| 。(9) ?4) MAPE(mean absolute percentage error,平均絕對百分比誤差)

      平均絕對百分比誤差常用來衡量歷史誤差。SMAPE=1n∑nk=1(tk-yk)yk×100% 。(10) ?5) 相關(guān)系數(shù)(R)

      相關(guān)系數(shù)用來衡量2個變量之間線性相關(guān)關(guān)系。R=∑nk=1(tk-)(yk-)∑nk=1(tk-)2∑nk=1(yk-)2 。(11) ?6) IA(index of agreement,協(xié)議)SIA=1-∑nk=1(tk-yk)2∑nk=1(|tk-|+|yk-|)2 。(12) ?其中n為數(shù)據(jù)點個數(shù),yk為預(yù)測值,tk為觀測值,為觀測數(shù)據(jù)的平均值,為測試數(shù)據(jù)的平均值。SMAE,SMAPE,SRMSE的最小值和R,IA的最大值代表最佳模型。

      4 實驗和結(jié)果

      4.1 實驗設(shè)計

      基于LSTM神經(jīng)網(wǎng)絡(luò)對數(shù)據(jù)進行劃分:2014—2016年選出Delhi空氣質(zhì)量以460條數(shù)據(jù)為訓(xùn)練樣本,對49條數(shù)據(jù)樣本進行500輪;2010—2016年選出Houston以1 500條數(shù)據(jù)為訓(xùn)練樣本,對500條數(shù)據(jù)樣本進行500輪。其中實驗設(shè)置隱藏層數(shù)為2層,當(dāng)LSTM算法在Delhi和Houston數(shù)據(jù)集上分別選擇學(xué)習(xí)率lr=0.000 9,lr=0.000 6時,效果最佳,該實驗使用的Adam優(yōu)化算法。

      Delhi和Houston的空氣質(zhì)量預(yù)測的測試結(jié)果分別如圖3和圖4所示。

      4.2 不同預(yù)測模型的性能對比

      為了分析LSTM在空氣質(zhì)量預(yù)測的準(zhǔn)確性,在本節(jié)實驗中,將在Delhi和Houston的數(shù)據(jù)上使用LSTM算法和現(xiàn)有的一些方法進行對比,對比模型包括MLR(BGD),MLR(SGD),MLR(MBGD)和回歸模型(SVR)。

      本實驗使用SMAPE,SRMSE,R,IA和SMAE作為模型對比的度量標(biāo)準(zhǔn),表8和表9給出了Delhi和Houston兩市所有模型的調(diào)查績效指標(biāo)。從2個表中可以看出LSTM模型的SMAPE,SRMSE和SMAE的值遠(yuǎn)遠(yuǎn)低于對比模型的SMAPE,SRMSE和SMAE的值,表8中MAPE降低了1.07%,RMSE減少了1.43,MAE減少了1.45;表9中MAE減少了4.26,MAPE降低了3.97%,RMSE減少了4.5;實驗結(jié)果證明該方法是有效的。

      猜你喜歡
      回歸模型多元線性回歸空氣質(zhì)量
      “空氣質(zhì)量發(fā)布”APP上線
      農(nóng)村秸稈處理方式的影響因素
      東方教育(2016年9期)2017-01-17 00:43:44
      基于組合模型的卷煙市場需求預(yù)測研究
      基于多元線性回歸分析的冬季鳥類生境選擇研究
      國際旅游外匯收入影響因素分析
      我國上市商業(yè)銀行信貸資產(chǎn)證券化效應(yīng)實證研究
      時代金融(2016年29期)2016-12-05 15:41:07
      車內(nèi)空氣質(zhì)量標(biāo)準(zhǔn)進展
      汽車與安全(2016年5期)2016-12-01 05:22:14
      重視車內(nèi)空氣質(zhì)量工作 制造更環(huán)保、更清潔、更健康的汽車
      汽車與安全(2016年5期)2016-12-01 05:22:13
      云學(xué)習(xí)平臺大學(xué)生學(xué)業(yè)成績預(yù)測與干預(yù)研究
      電子商務(wù)影響因素的計量分析
      商(2016年28期)2016-10-27 20:23:05
      建始县| 蓝山县| 外汇| 凌云县| 山东| 绥宁县| 沙雅县| 西乌珠穆沁旗| 攀枝花市| 炉霍县| 凤山县| 惠东县| 丰原市| 奉化市| 张家口市| 海兴县| 荆门市| 宜州市| 宝应县| 西乌珠穆沁旗| 博乐市| 通州区| 来凤县| 马尔康县| 涪陵区| 竹北市| 中江县| 湘潭市| 崇文区| 韩城市| 庆云县| 平乡县| 东城区| 金平| 庆城县| 江北区| 隆安县| 宁波市| 乡宁县| 东源县| 黄浦区|