翟維
(西安航空學(xué)院,電子工程學(xué)院,陜西,西安 710077)
近年大氣環(huán)境污染嚴(yán)重,大氣環(huán)境污染會(huì)直接導(dǎo)致人們生活環(huán)境質(zhì)量下降,影響人體健康,同時(shí)會(huì)造成巨大的經(jīng)濟(jì)損失[1-3]。目前的大氣環(huán)境監(jiān)測數(shù)據(jù)主要是通過歷史監(jiān)測數(shù)據(jù),對未來大氣環(huán)境質(zhì)量的變化趨勢進(jìn)行預(yù)判,以便更有針對性地對人們生活生產(chǎn)活動(dòng)進(jìn)行指導(dǎo)[4-5],同時(shí)為政府相關(guān)決策和管理部門在相關(guān)制度制定過程中提供科學(xué)依據(jù)[6-8]。目前對大氣環(huán)境質(zhì)量預(yù)測的方法主要包括數(shù)值預(yù)測以及統(tǒng)計(jì)預(yù)測,統(tǒng)計(jì)預(yù)測以歷史數(shù)據(jù)統(tǒng)計(jì)分析為主,結(jié)合未來發(fā)展規(guī)劃。數(shù)值預(yù)測,主要是指利用數(shù)學(xué)模型進(jìn)行計(jì)算或仿真。根據(jù)經(jīng)典的劃分方法,數(shù)學(xué)方法可以分為以下3類:第一類是“梯度輸運(yùn)理論”,它假定湍流通量與平均梯度成正比;第二種是以泰勒統(tǒng)計(jì)理論為基礎(chǔ)的“湍流統(tǒng)計(jì)理論”;第三種是以量綱分析為基礎(chǔ)的“相似理論”。然而數(shù)值預(yù)測的模型精度低于統(tǒng)計(jì)預(yù)測[4],且適用范圍有一定的限制[9-10]。因此,本文采用數(shù)據(jù)易獲取且預(yù)測精度高的統(tǒng)計(jì)預(yù)測-多元線性回歸方程進(jìn)行大氣環(huán)境預(yù)測分析。
當(dāng)2個(gè)或以上自變量和因變量存在線性關(guān)系時(shí),即為多元線性回歸。其數(shù)學(xué)模型[11-12]如式(1):
y=a1+a2x1+a3x2+…+am+1xm+ε
(1)
其中,a1,a2,a3,…,am+1為回歸系數(shù),ε為隨機(jī)誤差。
回歸系數(shù)估計(jì)值采用式(2),
(2)
待多元線性回歸方程求出之后,需要對其進(jìn)行檢驗(yàn)以確定其精確度。常用的檢驗(yàn)方法包括相關(guān)系數(shù)檢驗(yàn)、F檢驗(yàn)和t檢驗(yàn)[13]。
(1)相關(guān)系數(shù)檢驗(yàn)
相關(guān)系數(shù)是用來衡量線性模型擬合程度的指標(biāo),數(shù)學(xué)表達(dá)式是回歸平方和占總平方和的比值,如式(3):
(3)
(2)F檢驗(yàn)
F檢驗(yàn)用來檢驗(yàn)線性模型中自變量和因變量之間的關(guān)系是否顯著,如式(4):
(4)
(3)t檢驗(yàn)
通過t檢驗(yàn)可以決定作為某一變量是否作為自變量保留在模型中,如式(5):
(5)
式(3)~式(5)中,SST表示因變量觀測值和均值的差異的偏差平方和,SSR是由自變量引起的偏差,即回歸平方和,SSE是實(shí)驗(yàn)誤差等引起的剩余平方和,其關(guān)系如式(6):
=SSR+SSE
(6)
根據(jù)GB 3095—2012標(biāo)準(zhǔn)對大氣環(huán)境質(zhì)量進(jìn)行評價(jià)。對PM2.5、PM10、CO、SO2、O3以及NO2共6項(xiàng)污染物指標(biāo)進(jìn)行監(jiān)控。例如在監(jiān)測現(xiàn)場,共有23 000個(gè)PM10質(zhì)量濃度數(shù)據(jù),其中20 000個(gè)用作訓(xùn)練數(shù)據(jù),3 000個(gè)用作測試數(shù)據(jù)。此外,溫度、濕度、風(fēng)速、風(fēng)向、氣壓等氣象條件會(huì)通過影響污染物在大氣環(huán)境中的擴(kuò)散而影響大氣環(huán)境質(zhì)量,如高濕度會(huì)加劇空氣污染程度。因此,本文收集6個(gè)空氣污染物指標(biāo)和5個(gè)相應(yīng)的氣象指標(biāo)。
(7)
將預(yù)處理過的數(shù)據(jù)構(gòu)造出多元線性回歸模型,并進(jìn)行相關(guān)系數(shù)檢驗(yàn)、F檢驗(yàn)和t檢驗(yàn)。之后將預(yù)測結(jié)果和測試數(shù)據(jù)進(jìn)行對比。
因變量是PM10,自變量是溫度、氣壓等5項(xiàng)氣象數(shù)據(jù),建模方法是全部輸入。
(1)相關(guān)系數(shù)檢驗(yàn)結(jié)果如表1所示,R2代表擬合效果,其值越大,說明擬合效果就越好。
表1 相關(guān)系數(shù)的檢驗(yàn)
(2)F檢驗(yàn)結(jié)果如表2所示。從表2可以看出,F(xiàn)檢驗(yàn)結(jié)果小于0.01。因此5項(xiàng)氣象指標(biāo)對PM10質(zhì)量濃度具有顯著的影響。
表2 顯著性檢驗(yàn)
(3)t檢驗(yàn)結(jié)果如表3所示。非標(biāo)準(zhǔn)化系數(shù)用于列出回歸方程。標(biāo)準(zhǔn)化系數(shù)用來表示自變量對因變量的影響程度;偏回歸系數(shù)用來判斷某一自變量對因變量的影響是否有統(tǒng)計(jì)意義,當(dāng)其小于0.05時(shí),具有顯著的統(tǒng)計(jì)意義;當(dāng)小于0.01時(shí),統(tǒng)計(jì)學(xué)意義非常顯著。
表3 t檢驗(yàn)結(jié)果
(4)預(yù)測模型線性回歸方程為:
y=-3.796×1-1.296×2+2.223×3-55.059×4-0.207×5+398.212
真實(shí)值和預(yù)測數(shù)據(jù)對比如圖1所示。
圖1 傳統(tǒng)多元線性回歸模型預(yù)測值與真實(shí)值的比較
考慮到污染物質(zhì)之間存在物理化學(xué)反應(yīng),同時(shí)季節(jié)因素對污染物也有重要的影響。因此,將其他污染物和季節(jié)因素一并納入多元方程進(jìn)行優(yōu)化。季節(jié)變量取值為:春季108.1 μg/m3,權(quán)重0.25;夏季97.8 μg/m3,權(quán)重0.2;秋季112.3 μg/m3,權(quán)重0.25;冬季121.9 μg/m3,權(quán)重0.3。
通過將自變量逐個(gè)引入回歸模型,進(jìn)行顯著性檢驗(yàn),直至所有顯著自變量均被引入回歸模型。逐步回歸模型結(jié)果如表4所示。
表4 逐步回歸模型
從表4可以看出,PM2.5對PM10的影響最大,而大氣污染物SO2、NO2、CO以及氣象因素風(fēng)向?qū)M10的影響可忽略,因此將這幾項(xiàng)指標(biāo)刪除后,得表5。
表5 相關(guān)系數(shù)的檢驗(yàn)
得回歸方程:
y=30.304×1+19.729×2-0.359×3+8.541×4+0.897×5+5.184×6+10.280×7-90.087
采用該模型,所得真實(shí)值與預(yù)測值如圖2所示。
圖2 最優(yōu)多元線性回歸模型預(yù)測值與真實(shí)值的比較
從圖2可以看出,優(yōu)化后的模型,擬合度達(dá)到0.828,比原始模型明顯提高,說明采用逐步線性回歸方式,將氣象因素以及其他污染物質(zhì)一并考慮之后,對PM10的預(yù)測將更加準(zhǔn)確。此外,從圖2也可以看出,短期的預(yù)測誤差最小。同時(shí),PM2.5、風(fēng)速、氣壓、濕度和季節(jié)對PM10質(zhì)量濃度有增強(qiáng)作用。PM2.5對PM10的影響最大,O3和溫度對PM10的影響有所減弱。2種預(yù)測模型效果對比如表6所示。
表6 2種模型預(yù)測結(jié)果的比較
本文分別采用原始多元線性回歸模型以及優(yōu)化后的模型,分別對大氣環(huán)境質(zhì)量進(jìn)行預(yù)測,得出如下結(jié)論。
(1)傳統(tǒng)多元線性回歸模型只能相對粗略地預(yù)測大氣環(huán)境質(zhì)量變化趨勢,而其改進(jìn)模型能夠相對準(zhǔn)確地對未來大氣污染物質(zhì)量濃度進(jìn)行預(yù)測。
(2)采用逐步線性回歸方式將氣象因素以及其他污染物質(zhì)一并考慮能夠更加準(zhǔn)確地對PM10進(jìn)行預(yù)測,且對短期內(nèi)的預(yù)測誤差最小。