李 棟,劉樹東,劉 榕
(天津城建大學(xué) 計算機與信息工程學(xué)院,天津 300384)
人們平時所說的霧霾,是兩種物質(zhì)的混合體,即霧和霾.霧是大量懸浮在空氣中的小水滴,屬于正常的自然現(xiàn)象.而霾的組成很豐富,其中最主要的組成部分是燃燒產(chǎn)生的二氧化硫,氮氧化物以及各種可吸入的顆粒物,其中可吸入的顆粒物對人體危害是最為嚴重的.可吸入顆粒物的大小約為10微米,它經(jīng)常堆積在人體的上呼吸道,會被鼻子內(nèi)的毛發(fā)攔截;而其他小一點的顆粒物,鼻毛無法阻擋,約5微米的小顆粒就可以進入呼吸道的深部;大氣中直徑小于2.5微米的細顆粒物,即PM2.5,會直接進入到人體的細支氣管并堆積在肺泡中,影響肺部的正常換氣功能,從而引發(fā)呼吸道的炎癥,并且可以攜帶大量病毒或者重金屬污染物和致癌物質(zhì),導(dǎo)致引發(fā)各種疾病,使人間接死亡[1].
隨著我國城鎮(zhèn)化節(jié)奏的加劇,空氣污染問題的解決迫在眉睫,尤其京津冀地區(qū)的大氣質(zhì)量令人堪憂.據(jù)統(tǒng)計2016年天津市全年重度污染天數(shù)達29天,輕度污染天數(shù)達全年的三分之一,PM2.5、PM10、NO2平均濃度均超過國家標(biāo)準(zhǔn)值.其中,PM2.5平均濃度為69 μg/m3,超標(biāo) 0.97倍;PM10平均濃度為 103 μg/m3,超標(biāo) 0.47倍.重污染天氣的形成與污染排放、地形等因素密切相關(guān).就天津市而言,這里人口密集,城市高層建筑集中,重工業(yè)發(fā)達,同時冬季能源消費量巨大,能源消費結(jié)構(gòu)不完善,分析該地區(qū)霧霾成因并對霧霾天氣的狀況做出相應(yīng)的對策顯得極為重要[2].近幾年來,國內(nèi)外學(xué)者對大氣環(huán)境質(zhì)量評價投入了很多的精力,提出了多種評價方法,取得了一系列的研究成果.
目前環(huán)境評價領(lǐng)域的很多研究者一直致力于尋找一種可靠性高、評價結(jié)果準(zhǔn)確的方法,但由于評價體系的復(fù)雜性,研究者仍在對已有的評價方法不斷地改進以提升性能,在實際應(yīng)用中各種方法與模型還需要進一步的驗證.為有效解決天津市空氣質(zhì)量問題,需要對空氣質(zhì)量環(huán)境做出科學(xué)的評價,并分析主要污染物以及實際影響空氣質(zhì)量的因素.據(jù)此,本文采用改進的主成分分析法對天津市空氣質(zhì)量指數(shù)AQI以及實際影響空氣質(zhì)量的六大監(jiān)測指標(biāo)PM2.5、PM10、NO2、CO2、CO、O3進行降維處理,去除之間的相關(guān)性給空氣質(zhì)量評價帶來的影響,保留了原始數(shù)據(jù)的全部信息,消除了各指標(biāo)量綱之間的差異,提高了分析的精度[3].
主成分分析法是把原來多個變量通過線性變化為少數(shù)幾個綜合變量的一種統(tǒng)計分析方法,將原來眾多的具有一定相關(guān)性的因子x1,x2,…,xp(比如p個指標(biāo)),通過降維處理成一組較少個數(shù)的綜合變量Zm來代替原始預(yù)測因子,大大減少分析過程中的計算工作量,并且消除了原始因子之間的相關(guān)性.
(1)數(shù)據(jù)標(biāo)準(zhǔn)化.為消除由于原始數(shù)據(jù)差異過大,量綱不同帶來的影響,對原變量進行標(biāo)準(zhǔn)化處理.假設(shè)有n組數(shù)據(jù),每組數(shù)據(jù)共有p個變量因子,這樣就構(gòu)成了一個n×p階的矩陣,即
通過公式(2)進行中心標(biāo)準(zhǔn)化處理生成標(biāo)準(zhǔn)矩陣Z,即
式中分別為第 j個因子的樣本均值和樣本標(biāo)準(zhǔn)差.
(2)建立相關(guān)系數(shù)矩陣,即
解樣本相關(guān)矩陣R的特征方程|R-λIp|得p個特征根 λ1,λ2,…,λp以及對應(yīng)的單位特征向量 αi.
(3)計算主成分貢獻率并確定主成分,即
式中:主成分的方差貢獻率αi用來反映原始變量因子包含信息量的大小,一般取累計貢獻率達80%~95%的特征值 λ1,λ2,…,λm所對應(yīng)的第一,第二,…,第 m個主成分,即F1,F(xiàn)2,…,F(xiàn)m中m的確定是通過方差累計貢獻率G(m)來確定,即
(4)計算主成分綜合得分.原變量因子xj在諸主成分Fi上的荷載lij反映各主成分與原因子之間相互關(guān)聯(lián)程度,即
計算樣本在m個主成分上的得分,即
計算綜合變量PCA,得
其中:綜合變量PCA是評價是否為霧霾天的主要依據(jù),即BP神經(jīng)網(wǎng)絡(luò)的輸入.
在實證問題研究中,為了全面、系統(tǒng)地分析問題,必須考慮眾多影響因素,在多元統(tǒng)計分析中也稱為變量.因為每個變量都在不同程度上反映了所研究問題的某些信息,并且指標(biāo)之間彼此有一定的相關(guān)性,因而所得的統(tǒng)計數(shù)據(jù)反映的信息在一定程度上有重疊.在用統(tǒng)計方法研究多變量問題時,變量太多會增加計算量和增加分析問題的復(fù)雜性,人們希望在進行定量分析的過程中,涉及的變量較少,得到的信息量較多.主成分分析正是適應(yīng)這一要求產(chǎn)生的,是解決這類問題的理想工具.
同樣,在科普效果評價過程中也存在著這樣的問題.科普效果是很難具體量化的,在實際評價工作中,通常會選用幾個有代表性的綜合指標(biāo),采用打分的方法來進行評估,故綜合指標(biāo)的選取是個重點和難點.如上所述,主成分分析法正是解決這一問題的理想工具.因為評價所涉及的眾多變量之間既然有一定的相關(guān)性,就必然存在著起支配作用的因素.根據(jù)這一點,通過對原始變量相關(guān)矩陣內(nèi)部結(jié)構(gòu)的關(guān)系研究,找出影響科普效果某一要素的幾個綜合指標(biāo),使綜合指標(biāo)為原來變量的線性擬合.這樣,綜合指標(biāo)不僅保留了原始變量的主要信息,且彼此間不相關(guān),又比原始變量具有某些更優(yōu)越的性質(zhì),就使研究者在研究復(fù)雜的科普效果評價問題時,通過對主分量的重點分析,達到對原始變量進行分析的目的.
傳統(tǒng)的主成分分析法就是將這p個指標(biāo)的問題轉(zhuǎn)化成p個指標(biāo)的線性組合問題,從而得到一些新的指標(biāo) F1,F(xiàn)2,F(xiàn)3,…,F(xiàn)m(m≤p),且保留主要信息量來反映原指標(biāo)的信息.由于選取主成分的同時,需要消除各個指標(biāo)之間的相關(guān)性,每個主成分的系數(shù)平方和為1,即
各主成分之間相互獨立,主成分的方差依次遞減,則重要性依次遞減[4].由此可知,原始數(shù)據(jù)不僅僅只包含各指標(biāo)間相互影響程度的信息,而且還包括各指標(biāo)離散程度的差異信息.由于傳統(tǒng)的主成分分析法為消除由于原始數(shù)據(jù)的量綱不同帶來的影響,對原指數(shù)據(jù)采用標(biāo)準(zhǔn)化處理,標(biāo)準(zhǔn)化處理后的各指標(biāo)之間的方差均等于1,進而也丟失了各指標(biāo)間的離散程度上的差異信息,提取后的主成分不能準(zhǔn)確地反映原始數(shù)據(jù)包含的全部信息.基于此,本文選擇均值化處理原始數(shù)據(jù),即通過公式(10)對原矩陣進行均值化處理,生成均值化矩陣Z′=(Zij)p×p.原變量通過均值化處理過程如下式
式中為第j個因子的樣本均值.然后計算均值化矩陣Z′的樣本協(xié)方差矩陣S=(Sij)p×p.樣本協(xié)方差處理過程如下式
式中為第i個因子的樣本均值.然后根據(jù)協(xié)方差矩陣進行主成分分析,可以得出,均值化處理后的數(shù)據(jù)不改變原指標(biāo)間的相關(guān)系數(shù),同時也沒有丟失各指標(biāo)間的離散程度差異對所選取的主成分的影響[5].
本文選取實際影響天津市空氣質(zhì)量的6種污染物細顆粒物(PM2.5)、可吸入顆粒物(PM10)、二氧化硫(SO2)、二氧化氮(NO2)、臭氧(O3)、一氧化碳(CO)日均濃度作為評價指標(biāo)[6].監(jiān)測數(shù)據(jù)樣本來源于2016年全年天津市天津環(huán)境保護局對6項指標(biāo)的實際監(jiān)測的日均濃度值,共365組數(shù)據(jù).各項指標(biāo)的部分監(jiān)測數(shù)據(jù)如表1所示.
表1 天津市霧霾因子監(jiān)測原始數(shù)據(jù) μg·m-3
按照2.2節(jié)中主成分分析的步驟,根據(jù)公式(10)計算協(xié)方差矩陣以及相關(guān)系數(shù)矩陣,分別得到由傳統(tǒng)主成分分析法以及均值化主成分分析法提取的各因子之間的相關(guān)系數(shù)矩陣,如表2、表3所示.
表2 傳統(tǒng)主成分分析法提取的相關(guān)系數(shù)矩陣
表3 均值化主成分分析法提取的相關(guān)系數(shù)矩陣
由表2、表3對比可知,各指標(biāo)之間具有相關(guān)性,且由均值化主成分分析法提取的各成分相關(guān)系數(shù)相關(guān)性更加明顯.由此可知,均值化主成分分析法不僅消除了原始數(shù)據(jù)量綱之間的差異并且保留了原始數(shù)據(jù)的全部信息,根據(jù)公式(4)計算相關(guān)系數(shù)矩陣的特征值、特征向量和累計貢獻率見表4[7].因子載荷矩陣見表5.
表4 解釋總方差
表5 因子載荷矩陣
從表4可以看出,前兩個主成分的貢獻率達86.274%,已經(jīng)大于85%,可以代表原始數(shù)據(jù)絕大部分的信息,所以可以確定主成分個數(shù)為2個[8].根據(jù)公式(6)、(7)可得出兩個主成分與各個變量之間的線性組合分別為
將各主成分得分與對應(yīng)的方差貢獻率加權(quán)得到的總和,即為綜合變量PCA,且
從表5可以看出,第一主成分F1與PM2.5、PM10、SO2、NO2、CO日均濃度值成正相關(guān),與O3成負相關(guān),其中與NO2日均濃度的相關(guān)系數(shù)達到0.924,呈高度相關(guān),所以第一主成分主要代表了 PM2.5、PM10、NO2、CO日均濃度的變化情況.第二主成分與SO2成正相關(guān),相關(guān)系數(shù)達0.739,與O3成負相關(guān),所以第二主成分代表了SO2與O3的變化情況.根據(jù)均值化主成分分析的結(jié)果可知,天津市空氣污染物主要為PM10、NO2,其次為PM2.5、SO2,屬于典型的煤煙型污染.其中,以汽車尾氣為主要來源的氮氧化物污染為影響天津市全年空氣質(zhì)量的主要污染物,而可吸入顆粒物的污染也是重要因素,這說明天津市空氣質(zhì)量污染源主要還是汽車尾氣、燃料油燃燒、燃煤、施工帶來的揚塵、運輸以及各類施工帶來的二次揚塵.同時由于天津市地處平原,能源結(jié)構(gòu)單一,市區(qū)內(nèi)高層建筑密集,阻礙空氣對流運動,導(dǎo)致存在靜風(fēng)現(xiàn)象和逆溫層,大量可吸入顆粒物以及細顆粒物懸浮在空中,不利于短時間擴散,從而使得空氣污染程度加重,出現(xiàn)霧霾天氣[9].同時,通過對天津市各項空氣質(zhì)量污染物的月變化趨勢分析可知,1月、11月、12月各項污染物的均值均高于其它月份,6—8月霧霾污染程度較輕,可吸入顆粒物日均濃度均小于其它月份,主要污染物為O3.這是因為冬季天氣寒冷,空氣相對干燥,采暖措施單一以及燃氣改造等道路施工等未進行有效的抑塵,出現(xiàn)大風(fēng)天氣的時候,加重了空氣污染程度.另外,隨著經(jīng)濟的發(fā)展,人們生活的普遍提高,私家車數(shù)量劇增,排放的汽車尾氣量逐漸增多也是導(dǎo)致空氣環(huán)境質(zhì)量下降的重要因素[10].
天津市的空氣污染主要表現(xiàn)為污染來源復(fù)雜,汽車尾氣污染、揚塵污染、煤煙型污染等多種污染并存的特點,同時不利的氣象條件以及城市高樓密集等多因素影響不利于污染擴散.隨著我國經(jīng)濟的全面發(fā)展,控制空氣環(huán)境污染是構(gòu)建和諧社會的重中之重,對于天津這樣一個經(jīng)濟相對發(fā)達的城市,空氣環(huán)境的改善將是一個緩慢且艱難的過程.現(xiàn)提出以下防治措施,以期對改善天津市空氣質(zhì)量起到一定作用.
(1)控煤.加快建設(shè)高污染燃料禁燃區(qū),改燃并網(wǎng)燃煤鍋爐,積極發(fā)展可以替代的清潔能源,改善能源結(jié)構(gòu)中煤的比重,大力發(fā)展可再生能源,嚴格控制市區(qū)內(nèi)煤煙排放.
(2)控車.加快老舊車淘汰,強化機動車污染治理,大力發(fā)展城市交通,城市交通的落后必然會導(dǎo)致私家車的劇增.
(3)控塵.建立健全的揚塵在線監(jiān)測系統(tǒng)和視頻監(jiān)控,嚴禁秸稈燃燒,嚴禁渣土污染,建立健全的空氣污染環(huán)境的法律法規(guī),加大執(zhí)法力度.
(4)控工業(yè)污染.實施重點工業(yè)企業(yè)脫硫、脫硝和揮發(fā)性有機物治理,推行燃氣鍋爐低氮燃燒改造,同時著力削減燃氣設(shè)施氮氧化物的排放.
(5)建立完善的霧霾監(jiān)測系統(tǒng).雖然陸續(xù)一些城市、機構(gòu)都建立了相應(yīng)的霧霾監(jiān)測系統(tǒng)以實現(xiàn)對霧霾的實時監(jiān)測,但從霧霾的嚴重程度引發(fā)的環(huán)境安全危機可以看出,環(huán)保機構(gòu)在監(jiān)測方面做的仍是不夠完善的.現(xiàn)在,隨著霧霾監(jiān)測逐漸走向系統(tǒng)化,國家也應(yīng)建立嚴格的規(guī)章制度,保障霧霾監(jiān)測系統(tǒng)市場化;并對污染源嚴格監(jiān)督控制,建立完善的霧霾監(jiān)測系統(tǒng),實現(xiàn)對霧霾的實時監(jiān)測,為政府有關(guān)部門防治霧霾提供有效的數(shù)據(jù)支撐.
本文利用均值化的主成分分析法對實際影響天津空氣質(zhì)量的六大污染因子進行特征提取,分析提取到的各主成分,得出天津市空氣污染主要來源于汽車尾氣、燃料油燃燒、燃煤、施工帶來的揚塵、運輸以及各類施工帶來的二次揚塵等.針對各類污染提出了一系列防治措施,希望能對改善天津市空氣質(zhì)量提供支持.
參考文獻:
[1]侯瓊煌,楊 航.基于三次指數(shù)平滑模型的霧霾天氣分析與預(yù)測[J].環(huán)境保護科學(xué),2014,38(6):73-77.
[2]孫永鵬.天津市環(huán)境空氣污染狀況及控制措施探析[J].科技論文與案例交流,2014,15(8):80-81.
[3]YU H L,WANG C H.Retrospective prediction of intraurban spatiotemporal distribution of PM2.5in Taipei[J].Atmospheric Environment,2010,44(25):3053-3065.
[4]VOUKANTSIS D,KARATZAS K,KUKKONEN J,et al.Intercomparison of air quality data using principal component analysis,and forecasting of PM10and PM2.5concentrations using artificial neural networks,in Thessaloniki and H elsinki[J].Science of the Total Environment,2011,409(7):1266-1276.
[5]苗亞男.基于卡爾曼濾波的ARIMA-GM霧霾預(yù)測及擴散消失模型研究[D].吉林:吉林大學(xué),2016.
[6]周松林,茆美琴,蘇建徽.基于主成分分析與人工神經(jīng)網(wǎng)絡(luò)的風(fēng)電功率預(yù)測[J].電網(wǎng)技術(shù),2011,35(9):128-132.
[7]ZHOU Binbin,DU Jun.Forecast of low visibility and fog from NCEP[J].Current Status and Efforts,Pure and Applied Geophysics,2011,169:895-909.
[8]VARDOULAKIS S,KASSOMENOS P.Sources and factors affecting PM10lecels in two European cities:implications for local air quality management[J].Atmospheric Environment,2008,42(17):3949-3963.
[9]丁 卉,劉永紅,曹生現(xiàn).基于模糊-灰色聚類方法的城市空氣質(zhì)量評價研究[J].環(huán)境科學(xué)與技術(shù),2013,36(S2):374-379.
[10]陳 輝,厲 青,楊一鵬.基于分形模型的城市空氣質(zhì)量評價方法研究[J].中國環(huán)境科學(xué),2012,32(5):954-960.